import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
import org.w3c.tidy.Tidy;
public class HtmlToXml
{
public void tranceTo(String path,String encoding,String savePath){
Tidy tidy = new Tidy();
tidy.setXmlOut(true);
tidy.setQuoteNbsp(false);
tidy.setQuoteMarks(false);
tidy.setQuoteAmpersand(false);
tidy.setInputEncoding(encoding);//Encoding为你的输入文件的编码方式
tidy.setOutputEncoding("UTF-8");//设置输出文件的编码方式
try
{
FileInputStream in = new FileInputStream(new File(path));
FileOutputStream out = new FileOutputStream(new File(savePath+"temp.xml"));
tidy.parse(in, out);
}
catch (IOException e)
{
e.printStackTrace();
}
}
}
分享到:
相关推荐
将Html页面转化为xml,将Html页面转化为xml,将Html页面转化为xml.
html转换成xml使用的tidy类库,很好用也很简单,
利用Jtidy工具, 将HTML转化成XML,这里给出简单的转换方法。
jtidy简单使用 java jtidy xml html
jsoup和jtidy 对html操作,将不规范的html转换为xhtml
JTidy 是HTML Tidy (一个饭HTML语法检查器和优雅的打印编排工具)的Java移植,除了本身具有的清除HTML文件难看或错误内容的功能外,还提供了一个DOM接口,......
JTidy是HTML Tidy(一个HTML语法检查器和优雅的打印编排工具)的Java移植,除了本身具有的清除HTML文件难看或错误内容的功能外,还提供了一个DOM接口,程序员可以将JTidy当作一个处理HTML文件的DOM解析器来使用。
JTidy的Jar包,用于清洗Html网页并可以将其转换为相应的Xml或是Xhtml文件。
java将HTML转换为标准的XML文件
(1) 研究将HTML数据转换为XML数据的方法 (2) 实现HTML数据到XML数据的转换 (3) 根据用的需求制定搜索规则 (4) 根据搜索规则搜索用户的感兴趣的信息 (5) 将搜索结果存储并应用
jtidy-r8-21122004.jar
jtidy-r7-20052011.104500-sources.jar
jtidy-r938.jar,需要调用的包,一些office的转换需要使用
jtidy-r8-20060801,新的
Jtidy API CHM JTidy 是 HTML Tidy 用Java语言实现的版本,提供了一个HTML的语法检查器和很好的打印功能。JTidy可以用来清除格式不好和不对的 HTML。...程序员可以将JTidy当作一个处理HTML文件的DOM解析器来使用。
xml 解释包 2jtidy-04aug2000r7-dev.zip
用来分析HTML文档
以下为文件列表。 2012/08/09 周四 01:55 35,901 ABExtDrawing.jar 2012/08/09 周四 01:55 191,079 ABExtDrawing.xml 2010/12/10 周五 13:06 207,480 ABFTP.jar 2010/12/10 周五 13:04 6,176 ABFTP.xml 2011/07/26 ...
1个目标文件,JNDI的使用例子,有源代码,可以下载参考,JNDI的使用,初始化Context,它是连接JNDI树的起始点,查找你要的对象,打印找到的对象,关闭Context…… ftp文件传输 2个目标文件,FTP的目标是:(1)提高...
1个目标文件,JNDI的使用例子,有源代码,可以下载参考,JNDI的使用,初始化Context,它是连接JNDI树的起始点,查找你要的对象,打印找到的对象,关闭Context…… ftp文件传输 2个目标文件,FTP的目标是:(1)提高...