Jsoup解析是按照字符串解析的,比如:
Document doc=Jsoup.parse(response1Str);
这句传入的response1Str就是一个String类型。因此你只需把本地html文件作为文本全读入为一个字符串,然后再用JSoup进一步解析就行了。
有关读入文件,变成字符串,我刚刚答过一个问题,你可参考一下:
http://zhidao.baidu.com/question/456256407982905445
剩下的代码,就是JSoup用类似CSS选择器的语法,取出你需要的元素,作进一步处理了。
例如:
Elements e2=doc.getElementsByTag("input");
for(Element e: e2) {
if(e.attr("name").equals("formhash")) {
formhashStr=e.attr("value");
break;
}
}
System.out.println("formhash="+formhash);
上面这个代码片段是取出具有name属性为formhash的标签,并打印此属性的value值。
建议去JSoup官网了解更详细的API及功能。
Jsoup解析是按照字符串解析的,比如:
Document doc=Jsoup.parse(response1Str);
传入的response1Str就是一个String类型。只需把本地html文件作为文本全读入为一个字符串,然后再用JSoup进一步解析就行了。