- 浏览: 28152 次
- 性别:
- 来自: 广州
最新评论
-
Java小菜哈:
大哥,你有没有试过的,解析DOM数的时候还是个死循环。
java解析xml之一:使用SAX与DOM -
Sequencenet:
可以使用,开源精神发扬光大。
java获取网页主信息之五:测试 -
lahvey:
可以写一个浏览器了,利害
java获取网页主信息之一:html树操作 -
xo_tobacoo:
很想看看,可是干扰的字符太多,请清理下哦!
位操作技巧 -
sku:
好东东,谢谢博主无私奉献,真的太厉害。我一定要好好研究一下。
...
java获取网页主信息之五:测试
一.概要
用Java解析XML文档,最常用的有两种方法:使用基于事件的XML简单API(Simple API for XML)称为SAX和基于树和节点的文档对象模型(Document Object Module)称为DOM。Sun公司提供了Java API for XML Parsing(JAXP)接口来使用SAX和DOM,通过JAXP,我们可以使用任何与JAXP兼容的XML解析器。
JAXP接口包含了三个包:
(1)org.w3c.dom W3C推荐的用于XML标准规划文档对象模型的接口。
(2)org.xml.sax 用于对XML进行语法分析的事件驱动的XML简单API(SAX)
(3)javax.xml.parsers解析器工厂工具,程序员获得并配置特殊的特殊语法分析器。
二.实例
1.所需xml文件
Test.xml
- <?xml version="1.0" encoding="UTF-8"?>
- <books>
- <book email="zeh2007@126.com">
- <name>C++编程思想</name>
- <price>60.0</price>
- </book>
- </books>
students.xml
- <?xml version="1.0" encoding="gb2312"?>
- <?xml-stylesheet type="text/xsl" href="students.xsl"?>
- <students>
- <student sn="04378066">
- <name>ldz</name>
- <age>23</age>
- </student>
- <student sn="04378069">
- <name>zeh</name>
- <age>21</age>
- </student>
- </students>
2.将xml文件转化为dom:
- package domParser;
- import java.io.File;
- import java.io.IOException;
- import javax.xml.parsers.DocumentBuilder;
- import javax.xml.parsers.DocumentBuilderFactory;
- import javax.xml.parsers.ParserConfigurationException;
- import javax.xml.transform.Transformer;
- import javax.xml.transform.TransformerConfigurationException;
- import javax.xml.transform.TransformerException;
- import javax.xml.transform.TransformerFactory;
- import javax.xml.transform.dom.DOMSource;
- import javax.xml.transform.stream.StreamResult;
- //下面主要是org.xml.sax包的类
- import org.w3c.dom.Document;
- import org.w3c.dom.Element;
- import org.w3c.dom.Node;
- import org.w3c.dom.NodeList;
- import org.w3c.dom.Text;
- import org.xml.sax.SAXException;
- public class DOMConvert {
- public static void main(String[] args) {
- //DOM解析器的工厂实例
- DocumentBuilderFactory dbf=DocumentBuilderFactory.newInstance();
- try {
- //从DOM工厂获得DOM解析器
- DocumentBuilder db=dbf.newDocumentBuilder();
- //解析XML文档的输入流,得到一个Document
- Document doc=db.parse(new File("xmlFil/students.xml"));
- //建立一个XML节点
- Element eltStu=doc.createElement("student");
- Element eltName=doc.createElement("name");
- Element eltAge=doc.createElement("age");
- Text textName=doc.createTextNode("yyr");
- Text textAge=doc.createTextNode("22");
- eltName.appendChild(textName);
- eltAge.appendChild(textAge);
- eltStu.appendChild(eltName);
- eltStu.appendChild(eltAge);
- eltStu.setAttribute("sn","04378072");
- //将此节点插入根的孩子中
- Element root=doc.getDocumentElement();
- root.appendChild(eltStu);
- //获取stuent标签节点
- NodeList nl=root.getElementsByTagName("student");
- //删除第一个节点
- root.removeChild(nl.item(0));
- //获取第一个节点
- Element eltStuChg=(Element)nl.item(0);
- //获取age标签节点
- Node nodeAgeChg=eltStuChg.getElementsByTagName("age").item(0);
- nodeAgeChg.getFirstChild().setNodeValue("20");
- int len=nl.getLength();
- for(int i=0;i
- Element elt=(Element)nl.item(i);
- System.out.println("编号:" + elt.getAttribute("sn"));
- Node nodeName=elt.getElementsByTagName("name").item(0);
- Node nodeAge=elt.getElementsByTagName("age").item(0);
- String name=nodeName.getFirstChild().getNodeValue();
- String age=nodeAge.getFirstChild().getNodeValue();
- System.out.println("姓名:"+name);
- System.out.println("年龄:" + age);
- System.out.println("--------------------");
- }
- //实例化一个转换工厂
- TransformerFactory tff=TransformerFactory.newInstance();
- //获取一个转换实例
- Transformer tf=tff.newTransformer();
- //设置输出属性
- tf.setOutputProperty("encoding","gb2312");
- //根据Document对象新建一个DOM数据源
- DOMSource source=new DOMSource(doc);
- //定义输出流
- StreamResult result=new StreamResult(new File("convert.xml"));
- //从数据源转换至输出流
- tf.transform(source,result);
- }
- catch (ParserConfigurationException e) {
- e.printStackTrace();
- }
- catch (SAXException e) {
- e.printStackTrace();
- }
- catch (IOException e) {
- e.printStackTrace();
- }
- catch (TransformerConfigurationException e) {
- e.printStackTrace();
- }
- catch (TransformerException e) {
- e.printStackTrace();
- }
- }
- }
3.解析DOM树
- package domParser;
- import java.io.FileInputStream;
- import java.io.FileNotFoundException;
- import java.io.IOException;
- import java.io.InputStream;
- import javax.xml.parsers.DocumentBuilder;
- import javax.xml.parsers.DocumentBuilderFactory;
- import javax.xml.parsers.ParserConfigurationException;
- //下面主要是org.xml.sax包的类
- import org.w3c.dom.Document;
- import org.w3c.dom.Element;
- import org.w3c.dom.Node;
- import org.w3c.dom.NodeList;
- import org.xml.sax.SAXException;
- public class DomParser {
- public DomParser() {
- //DOM解析器的工厂实例
- DocumentBuilderFactory domfac=DocumentBuilderFactory.newInstance();
- try {
- //从DOM工厂获得DOM解析器
- DocumentBuilder dombuilder=domfac.newDocumentBuilder();
- //把要解析的XML文档转化为输入流
- InputStream is=new FileInputStream("Test.xml");
- //解析XML文档的输入流,得到一个Document
- Document doc=dombuilder.parse(is);
- //得到XML文档的根节点
- Element root=doc.getDocumentElement();
- //得到节点的子节点
- NodeList books=root.getChildNodes();
- if(books!=null) {
- for(int i=0;i
- Node book=books.item(i);
- if(book.getNodeType()==Node.ELEMENT_NODE) {
- //取得节点的属性值
- String email=book.getAttributes().getNamedItem("email").getNodeValue();
- System.out.println(email);
- //轮循子节点
- for(Node node=book.getFirstChild();node!=null;node=node.getNextSibling()) {
- if(node.getNodeType()==Node.ELEMENT_NODE) {
- if(node.getNodeName().equals("name")) {
- String name=node.getNodeValue();
- node.setNodeValue("Java编程思想");
- String name1=node.getFirstChild().getNodeValue();
- System.out.println(name);
- System.out.println(name1);
- }
- if(node.getNodeName().equals("price")) {
- String price=node.getFirstChild().getNodeValue();
- System.out.println(price);
- }
- }
- }
- }
- }
- }
- }
- catch (ParserConfigurationException e) {
- e.printStackTrace();
- }
- catch (FileNotFoundException e) {
- e.printStackTrace();
- }
- catch (SAXException e) {
- e.printStackTrace();
- }
- catch (IOException e) {
- e.printStackTrace();
- }
- }
- public static void main(String[] args)
- {
- new DomParser();
- }
- }
4.打印DOM树
- package domParser;
- import java.io.File;
- import java.io.IOException;
- import javax.xml.parsers.DocumentBuilder;
- import javax.xml.parsers.DocumentBuilderFactory;
- import javax.xml.parsers.ParserConfigurationException;
- //下面主要是org.xml.sax包的类
- import org.w3c.dom.*;
- import org.xml.sax.SAXException;
- public class DOMPrinter{
- //打印指定节点(节点名:节点值)
- public static void printNodeInfo(Node node){
- System.out.println(node.getNodeName()+" : "+node.getNodeValue());
- }
- //递归打印全部节点
- public static void printNode(Node node){
- short nodeType=node.getNodeType();
- //判断节点类型
- switch(nodeType){
- //前缀节点
- case Node.PROCESSING_INSTRUCTION_NODE:
- System.out.println("-----------PI start-----------");
- printNodeInfo(node);
- System.out.println("-----------PI end-----------");
- break;
- //元素节点
- case Node.ELEMENT_NODE:
- System.out.println("-----------Element start-----------");
- printNodeInfo(node);
- System.out.println("-----------Element end-----------");
- //打印节点属性值
- NamedNodeMap attrs=node.getAttributes();
- int attrNum=attrs.getLength();
- for(int i=0;i
- Node attr=attrs.item(i);
- System.out.println("-----------Attribute start-----------");
- printNodeInfo(attr);
- System.out.println("-----------Attribute end-----------");
- }
- break;
- //文本节点
- case Node.TEXT_NODE:
- System.out.println("-----------Text start-----------");
- printNodeInfo(node);
- System.out.println("-----------Text end-----------");
- break;
- default:
- break;
- }
- //递归打印节点信息
- Node child=node.getFirstChild();
- while(child!=null){
- printNode(child);
- child=child.getNextSibling();
- }
- }
- public static void main(String[] args){
- //DOM解析器的工厂实例
- DocumentBuilderFactory dbf=DocumentBuilderFactory.newInstance();
- try{
- //从DOM工厂获得DOM解析器
- DocumentBuilder db=dbf.newDocumentBuilder();
- //解析XML文档的输入流,得到一个Document
- Document doc=db.parse(new File("students.xml"));
- //打印节点
- printNode(doc);
- }
- catch (ParserConfigurationException e){
- e.printStackTrace();
- }
- catch (SAXException e){
- e.printStackTrace();
- }
- catch (IOException e){
- e.printStackTrace();
- }
- }
- }
发表评论
-
java获取网页主信息之五:测试
2007-09-01 22:29 23971.所需文件 param.txt:存放需要提取信息的网页路径 ... -
java获取网页主信息之四:抽取信息块
2007-09-01 22:24 2234从已经建立完成的html树中抽取主信息。 pac ... -
java获取网页主信息之三:html to tree
2007-09-01 22:22 2458对html文件进行扫描,将html元素抽象出来形成树。 ... -
java获取网页主信息之二:辅助操作
2007-09-01 22:19 17111.栈操作 package Source; ... -
java获取网页主信息之一:html树操作
2007-09-01 22:17 29541.节点操作 package ... -
java解析xml之三:使用domj4
2007-09-01 22:06 4210一.简介 DOM4J是dom4j.org出品的一个开源 ... -
java解析xml之二:使用JDOM
2007-09-01 21:49 1582一.简介 JDOM是一种解析XML的Java工具包。 ...
相关推荐
Java使用sax、dom、dom4j解析xml文档的代码,包含dom4j的jar包。
一个项目同时用dom解析和sax解析xml文件貌似会报错,项目框架建一直是用sax和dom4j解析xml文件的。当我用dom解析xml文件。导入包后就报错识别不了xml文件的编码格式。于是做了一个sax解析xml文件的实例
Java解析XML文件的DOM和SAX方式.doc
java 解析xml 方法 sax jdom dom stAX
java学习笔记——使用DOM解析XML和使用SAX解析XML
java操作xml,包括dom、sax解析
JAVA 解析XML和生成XML文档源码。比较全 1.DOM生成和解析XML文档 2.SAX生成和解析XML文档 3.DOM4J生成和解析XML文档 4.JDOM生成和解析XML
使用java语言对XML文档进行解析的示例,包括DOM,SAX方式,并包括使用jdom和jom4j框架进行XML解析或生成XML文档
Java解析XML汇总DOM_SAX_JDOM_DOM4j_XPath 实例
Java 解析XML性能分析Demo。包含了DOM解析,SAX解析, JDOM解析,DOM4J解析,JAXB解析例子。
Java解析XML的三种方式 Ø Android中,解析Xml数据的三种方式: Ø 1、DOM(org.w3c.dom) Ø “文档对象模型”方式,解析完的Xml将生成一个树状结构的对象。 Ø 2、SAX(org.xml.sax) Ø SimpleAPI for XML,以事件的...
JAVA常用的四种解析XML的示例,包括sax、dom、dom4j与jdom
Java 解析 xml 3种方法 sax JDom dom4j
java四种xml解析实例和jar包,包括dom,sax,dom4j,jdom等方式 java四种xml解析实例和jar包,包括dom,sax,dom4j,jdom等方式 是学习Java的xml解析的好例子,包括相应的dom4j.jar,jdom.jar等,自己整理的,物超所值啊,...
DOM 解析 基本操作 SAX 解析 基本操作 上学期XML的一个小作业,都是一些基本操作,刚学XML的同学们拿来玩玩
利用JSP直接读写XML文件,分别用DOM解析器和SAX解析器加以实现,非常适合初学者入门,作为一个了解jsp与XML的台阶
标准Dom、JDom(为Java提供的解析技术)、Dom4j(优化之后的解析技术)、SAX(大型xml解析的技术) 树模型:DOM、JDOM、Dom4j; 特点:算法丰富、操作比较简单;一次性读取所有内容到内存(不适于大型xml文件解析...
java解析XML四种方案: DOM 实现方法; DOM4J实现方法; JDOM实现方法; SAX实现方法;
包中包含art.xml以及解析这个文件的DomDemo.java和SaxDemo.java