`
sysu_zeh
  • 浏览: 28151 次
  • 性别: Icon_minigender_1
  • 来自: 广州
最近访客 更多访客>>
社区版块
存档分类
最新评论
文章列表
1.所需文件  param.txt:存放需要提取信息的网页路径  TestPage:存放需要提取信息的网页  Out.txt:输出的网页内容 2.测试程序 package test;       import java.io.*;    import Source.*;       //提取页面主要信息测试    public class ETest{           public static void main(String args[])        {            //输出文件 ...
从已经建立完成的html树中抽取主信息。 package Source;       public class ChooseBlock    {        //构造方法,设置允许错误率        public ChooseBlock(double th)        {            threshold = th;        }        //获取一棵html树中的内容        public String getContent(HTree tree)        ...
对html文件进行扫描,将html元素抽象出来形成树。 package Source;       import java.io.*;       public class HTML2Tree    {     //构造方法           public HTML2Tree()        {            tree = new HTree();            myStack = new Stack();        }      ...
1.栈操作 package Source;       import java.util.LinkedList;       //用List定义一个栈    public class Stack    {        //构造方法        public Stack()        {            list = new LinkedList();            isEmpty = true;        }        //入栈        ...
1.节点操作 package Source;          //html树节点类    public class Node    {        //构造方法        public Node()        {            content = "";            hasContent = fa ...
一.简介     DOM4J是dom4j.org出品的一个开源XML解析包。Dom4j是一个易用的、开源的库,用于XML,XPath和XSLT。它应用于Java平台,采用了Java集合框架并完全支持DOM,SAX和JAXP。DOM4J最大的特色是使用大量的接口,这也是它被认为比JDOM灵活的主要原因。 二.安装dom4j 1.下载dom4j:http://sourceforge.net/project/showfiles.php?group_id=16035 2.安装dom4j:将解压后的dom4j-full.jar文件放置到项目的类路径中去,也可以作为附加包添加到项目中。 三.实例 1.所需x ...
一.简介     JDOM是一种解析XML的Java工具包。 它由Breet Mclaughlin和Jason Hunter在2000年初作为一个开放源代码项目正式开始研发。DOM适合于当今流行的各种语言,包括Java,JavaScripte,VB,VBScript,Perl,C,C++等。它了为HTML和XML文档提供了一个可应用于不同平台的编程接口。 DOM的设计为了适用于不同的语言,它保留了不同语言中非常相似的API。但是它并不适合于Java编程者的习惯。而JDOM作为一种轻量级API被制定,它最核心的要求是以Java为中心,只适合于Java语言,它遵循DOM的接口主要规则,除去了DOM中 ...
一.概要   用Java解析XML文档,最常用的有两种方法:使用基于事件的XML简单API(Simple API for XML)称为SAX和基于树和节点的文档对象模型(Document Object Module)称为DOM。Sun公司提供了Java API for XML Parsing(JAXP)接口来使用SAX和DOM,通过JAXP,我们可以使用任何与JAXP兼容的XML解析器。      JAXP接口包含了三个包:      (1)org.w3c.dom W3C推荐的用于XML标准规划文档对象模型的接口。      (2)org.xml.sax  用于对XML进行语法分析的事件驱动的X ...

acm例程

以下是两份例程。第一份来自中山大学,第二份来自上海交通大学。

位操作技巧

检测一个无符号数是不为2^n-1(^为幂): x&(x+1) <o:p></o:p> 将最右侧0位改为1位: x | (x+1) <o:p></o:p> 二进制补码运算公式: -x = ~x + 1 = ~(x-1) ~x = -x-1 -(~x) = x+1 ~(-x) = x-1 x+y = x - ~y - 1 = (x|y)+(x&y) x-y = x + ~y + 1 = (x|~y)-(~x&y) x^y = (x|y)-(x&y) x|y = (x&~y)+y x&y ...
问题简介:     所谓八数码问题是指这样一种游戏:将分别标有数字1,2,3,…,8的八块正方形数码牌任意地放在一块3×3的数码盘上。放牌时要求不能重叠。于是,在3×3的数码盘上出现了一个空格。现在要求按照每次只能将与空格相邻的数码牌与空格交换的原则,将任意摆放的数码盘逐步摆成某种特殊的排列。如下图表示了一个具体的八数码问题求解。 问题分析:     首先,八数码问题包括一个初始状态(START) 和 目标状态(END),所谓解八数码问题就是在两个状态间寻找一系列可过渡状态(START->STATE1->STATE2->...->END)。这个状态是否存在就是我们要解决 ...
1. 矢量减法 设二维矢量 P = (x1,y1) ,Q = (x2,y2) 则矢量减法定义为: P - Q = ( x1 - x2 , y1 - y2 ) 显然有性质 P - Q = - ( Q - P ) 如不加说明,下面所有的点都看作矢量,两点的减法就是矢量相减; 2.矢量叉积 设矢量P = (x1,y1) ,Q = (x2,y2)则矢量叉积定义为:  P × Q = x1*y2 - x2*y1   得到的是一个标量 显然有性质 P × Q = - ( Q × P )   P × ( - Q ) = - ( P × Q )如不加说明,下面所有的点都看作矢量,点的乘法看作矢量叉积; 叉乘的重 ...
Global site tag (gtag.js) - Google Analytics