`
sysu_zeh
  • 浏览: 28159 次
  • 性别: Icon_minigender_1
  • 来自: 广州
最近访客 更多访客>>
社区版块
存档分类
最新评论

java获取网页主信息之一:html树操作

阅读更多

1.节点操作

  1. package Source;   
  2.   
  3.   
  4. //html树节点类   
  5. public class Node   
  6. {   
  7.     //构造方法   
  8.     public Node()   
  9.     {   
  10.         content = "";   
  11.         hasContent = false;   
  12.         parent = null;   
  13.         isLeaf = true;   
  14.     }   
  15.        
  16.     //构造方法,初始化此节点的内容,标签,与其父辈节点   
  17.     public Node(String content, String tag, Node parent)   
  18.     {   
  19.         this.content = content;   
  20.         this.tag = tag;   
  21.         if(content.equalsIgnoreCase(""))   
  22.             hasContent = false;   
  23.         else  
  24.             hasContent = true;   
  25.         this.parent = parent;   
  26.         isLeaf = true;   
  27.     }   
  28.        
  29.     //添加节点内容   
  30.     public void addContent(String str)   
  31.     {   
  32.         content=content+str;   
  33.         if(content.equalsIgnoreCase("")) hasContent = false;   
  34.         else hasContent = true;   
  35.         return;   
  36.     }   
  37.        
  38.     //设置为叶子   
  39.     public void setLeaf(boolean is)   
  40.     {   
  41.         isLeaf = is;   
  42.     }   
  43.        
  44.     //设置为块   
  45.     public void setBlock(boolean is)   
  46.     {   
  47.         isBlock = is;   
  48.     }   
  49.   
  50.     public String toString()   
  51.     {   
  52.         return content;   
  53.     }   
  54.   
  55.     String content;   
  56.     String tag;   
  57.     boolean hasContent;   
  58.     boolean isLeaf;   
  59.     boolean isBlock;   
  60.     Node parent;   
  61. }  

2.树操作

  1. package Source;   
  2.   
  3. import java.util.LinkedList;   
  4.   
  5.   
  6. public class HTree   
  7. {   
  8.     //构造方法,初始化   
  9.     public HTree()   
  10.     {   
  11.         list = new LinkedList();   
  12.     }   
  13.        
  14.     //插入节点   
  15.     public void insert(Node node)   
  16.     {   
  17.         list.add(node);   
  18.     }   
  19.        
  20.        
  21.     //打印整棵树的节点的信息   
  22.     public void print()   
  23.     {   
  24.         int len = list.size();   
  25.         for(int i = len - 1; i >= 0; i--)   
  26.         {   
  27.             Node node = (Node)list.get(i);   
  28.             String str = node.content.trim();   
  29.             if(!str.equals("")) System.out.println(str);   
  30.         }   
  31.   
  32.     }   
  33.        
  34.     //打印块的信息   
  35.     public void print2()   
  36.     {   
  37.         int len = list.size();   
  38.         for(int i = len - 1; i >= 0; i--)   
  39.         {   
  40.             Node node = (Node)list.get(i);   
  41.             if(node.isBlock) System.out.println(node.content);   
  42.         }   
  43.   
  44.     }   
  45.        
  46.     //合并节点,将叶节点合并至其双亲   
  47.     public void merge()   
  48.     {   
  49.         int len = list.size();   
  50.         for(int i = len - 1; i >= 0; i--)   
  51.         {   
  52.             Node node = (Node)list.get(i);   
  53.             if(node.isLeaf)   
  54.             {   
  55.                 Node curr = node;   
  56.                 String str = curr.content;   
  57.                 while(curr != null)    
  58.                 {   
  59.                     Node next = curr.parent;   
  60.                     if(next != null)   
  61.                     {   
  62.                         if(next.hasContent)   
  63.                         {   
  64.                             next.addContent(str);   
  65.                             next.setLeaf(true);   
  66.                             node.setBlock(false);   
  67.                             break;   
  68.                         }   
  69.                         next.setLeaf(false);   
  70.                         curr = next;   
  71.                     }    
  72.                     else curr = null;   
  73.                 }   
  74.                 if(curr == null) node.setBlock(true);   
  75.             }   
  76.         }   
  77.   
  78.     }   
  79.        
  80.     //获取块信息   
  81.     public String[] getBlock()   
  82.     {   
  83.         int len = list.size();   
  84.         int num = 0;   
  85.         //获取非空节点的个数   
  86.         for(int i = len - 1; i >= 0; i--)   
  87.         {   
  88.             Node node = (Node)list.get(i);   
  89.             String str = node.content.trim();   
  90.             if(!str.equals("")) num++;   
  91.         }   
  92.   
  93.         String contBlock[] = new String[num];   
  94.         num = 0;   
  95.            
  96.         //返回信息   
  97.         for(int i = len - 1; i >= 0; i--)   
  98.         {   
  99.             Node node = (Node)list.get(i);   
  100.             String str = node.content.trim();   
  101.             if(!str.equals("")) contBlock[num++] = str;   
  102.         }   
  103.         return contBlock;   
  104.     }   
  105.   
  106.     private LinkedList list;   
  107. }  
分享到:
评论
2 楼 lahvey 2009-12-12  
可以写一个浏览器了,利害
1 楼 sku 2008-05-25  
-zeh,你的数据结构学的太好了吧,厉害,赞一个。

相关推荐

    java源码包---java 源码 大量 实例

    6个目标文件,EJB来模拟银行ATM机的流程及操作:获取系统属性,初始化JNDI,取得Home对象的引用,创建EJB对象,并将当前的计数器初始化,调用每一个EJB对象的count()方法,保证Bean正常被激活和钝化,EJB对象是用...

    JAVA上百实例源码以及开源项目

    6个目标文件,EJB来模拟银行ATM机的流程及操作:获取系统属性,初始化JNDI,取得Home对象的引用,创建EJB对象,并将当前的计数器初始化,调用每一个EJB对象的count()方法,保证Bean正常被激活和钝化,EJB对象是用...

    java源码包2

    6个目标文件,EJB来模拟银行ATM机的流程及操作:获取系统属性,初始化JNDI,取得Home对象的引用,创建EJB对象,并将当前的计数器初始化,调用每一个EJB对象的count()方法,保证Bean正常被激活和钝化,EJB对象是用...

    java源码包4

    6个目标文件,EJB来模拟银行ATM机的流程及操作:获取系统属性,初始化JNDI,取得Home对象的引用,创建EJB对象,并将当前的计数器初始化,调用每一个EJB对象的count()方法,保证Bean正常被激活和钝化,EJB对象是用...

    JAVA上百实例源码以及开源项目源代码

    6个目标文件,EJB来模拟银行ATM机的流程及操作:获取系统属性,初始化JNDI,取得Home对象的引用,创建EJB对象,并将当前的计数器初始化,调用每一个EJB对象的count()方法,保证Bean正常被激活和钝化,EJB对象是用...

    java源码包3

    6个目标文件,EJB来模拟银行ATM机的流程及操作:获取系统属性,初始化JNDI,取得Home对象的引用,创建EJB对象,并将当前的计数器初始化,调用每一个EJB对象的count()方法,保证Bean正常被激活和钝化,EJB对象是用...

    成百上千个Java 源码DEMO 4(1-4是独立压缩包)

    Calendar万年历 1个目标文件 EJB 模拟银行ATM流程及操作源代码 6个目标文件,EJB来模拟银行ATM机的流程及操作:获取系统属性,初始化JNDI,取得Home对象的引用,创建EJB对象,并将当前的计数器初始化,调用每一个...

    java开源包11

    jared是一个用来操作Windows注册表的 Java 类库,你可以用来对注册表信息进行读写。 GIF动画制作工具 GiftedMotion GiftedMotion是一个很小的,免费而且易于使用图像互换格式动画是能够设计一个有趣的动画了一系列...

    java开源包6

    jared是一个用来操作Windows注册表的 Java 类库,你可以用来对注册表信息进行读写。 GIF动画制作工具 GiftedMotion GiftedMotion是一个很小的,免费而且易于使用图像互换格式动画是能够设计一个有趣的动画了一系列...

    java开源包9

    jared是一个用来操作Windows注册表的 Java 类库,你可以用来对注册表信息进行读写。 GIF动画制作工具 GiftedMotion GiftedMotion是一个很小的,免费而且易于使用图像互换格式动画是能够设计一个有趣的动画了一系列...

    java开源包4

    jared是一个用来操作Windows注册表的 Java 类库,你可以用来对注册表信息进行读写。 GIF动画制作工具 GiftedMotion GiftedMotion是一个很小的,免费而且易于使用图像互换格式动画是能够设计一个有趣的动画了一系列...

    java开源包5

    jared是一个用来操作Windows注册表的 Java 类库,你可以用来对注册表信息进行读写。 GIF动画制作工具 GiftedMotion GiftedMotion是一个很小的,免费而且易于使用图像互换格式动画是能够设计一个有趣的动画了一系列...

    java开源包8

    jared是一个用来操作Windows注册表的 Java 类库,你可以用来对注册表信息进行读写。 GIF动画制作工具 GiftedMotion GiftedMotion是一个很小的,免费而且易于使用图像互换格式动画是能够设计一个有趣的动画了一系列...

    java开源包10

    jared是一个用来操作Windows注册表的 Java 类库,你可以用来对注册表信息进行读写。 GIF动画制作工具 GiftedMotion GiftedMotion是一个很小的,免费而且易于使用图像互换格式动画是能够设计一个有趣的动画了一系列...

    java开源包3

    jared是一个用来操作Windows注册表的 Java 类库,你可以用来对注册表信息进行读写。 GIF动画制作工具 GiftedMotion GiftedMotion是一个很小的,免费而且易于使用图像互换格式动画是能够设计一个有趣的动画了一系列...

    java开源包1

    jared是一个用来操作Windows注册表的 Java 类库,你可以用来对注册表信息进行读写。 GIF动画制作工具 GiftedMotion GiftedMotion是一个很小的,免费而且易于使用图像互换格式动画是能够设计一个有趣的动画了一系列...

    HttpClient以及获取页面内容应用

    2Java使用Url获取网页内容 2.1简介 项目的管理档t。 2.2应用 2.2.1获取网页内容 /** * 通过url获取网页内容, * 解决中文乱码问题 * @param httpUrl * @return */ public static String downloadPage...

    成百上千个Java 源码DEMO 3(1-4是独立压缩包)

    Calendar万年历 1个目标文件 EJB 模拟银行ATM流程及操作源代码 6个目标文件,EJB来模拟银行ATM机的流程及操作:获取系统属性,初始化JNDI,取得Home对象的引用,创建EJB对象,并将当前的计数器初始化,调用每一个...

    java开源包2

    jared是一个用来操作Windows注册表的 Java 类库,你可以用来对注册表信息进行读写。 GIF动画制作工具 GiftedMotion GiftedMotion是一个很小的,免费而且易于使用图像互换格式动画是能够设计一个有趣的动画了一系列...

Global site tag (gtag.js) - Google Analytics