功能齐全的html页面标签解析工具,可以根据不同的Tag解析;
使用比较方便,下载后解压,我今天只研究了解析,所以只用到htmlparser.jar包。
例如我想解析出一段数据中的图片链接,代码如下:
String[] arg = { url };
		Parser parser;
		try {
			parser = new Parser(arg[0]);
			NodeClassFilter imageTagFilter = new NodeClassFilter(ImageTag.class);
			NodeList imgTagList = parser.parse(imageTagFilter);
			int imgTagSize = imgTagList.size();
			String[] imgTemp = new String[imgTagSize];
			for (int i = 0; i < imgTagSize; i++) {
				ImageTag imgTag = (ImageTag) imgTagList.elementAt(i);
				String src = imgTag.getAttribute(SRC);
				imgTemp[i] = src;
			}
			// this.setImgList(imgTemp);
		} catch (ParserException e) {
			e.printStackTrace();
		}

imageTagFilter 为设置的要解析的Tag
imgTagList 为符合条件的节点,包括节点中嵌套的子节点
评论
发表评论

您还没有登录,请登录后发表评论

ctrlaomao
搜索本博客
最近加入圈子
最新评论