JAVA超级简单的爬虫实例讲解-eolink官网

JAVA超级简单的爬虫实例讲解

爬取整个页面的数据，并进行有效的提取信息，注释都有就不废话了：

public class Reptile {

public static void main(String[] args) {

String url1=""; //传入你所要爬取的页面地址

InputStream is=null; //创建输入流用于读取流

BufferedReader br=null; //包装流,加快读取速度

StringBuffer html=new StringBuffer(); //用来保存读取页面的数据.

String temp=""; //创建临时字符串用于保存每一次读的一行数据，然后html调用append方法写入temp;

try {

URL url2 = new URL(url1); //获取URL;

is = url2.openStream(); //打开流，准备开始读取数据;

br= new BufferedReader(new InputStreamReader(is)); //将流包装成字符流，调用br.readLine()可以提高读取效率，每次读取一行;

while ((temp = br.readLine()) != null) {//读取数据,调用br.readLine()方法每次读取一行数据,并赋值给temp,如果没数据则值==null,跳出循环;

html.append(temp); //将temp的值追加给html,这里注意的时String跟StringBuffere的区别前者不是可变的后者是可变的;

}

//System.out.println(html); //打印出爬取页面的全部代码;

if(is!=null) //接下来是关闭流,防止资源的浪费;

{

is.close();

is=null;

}

Document doc=jsoup.parse(html.toString()); //通过Jsoup解析页面,生成一个document对象;

Elements elements=doc.getElementsByClass("XX");//通过class的名字得到（即XX）,一个数组对象Elements里面有我们想要的数据,至于这个div的值呢你打开浏览器按下F12就知道了;

for (Element element:elements) {

System.out.println(element.text()); //打印出每一个节点的信息;你可以选择性的保留你想要的数据,一般都是获取个固定的索引;

}

} catch (MalformedURLException e) {

// TODO Auto-generated catch block

e.printStackTrace();

} catch (IOException e) {

// TODO Auto-generated catch block

pPDRfCVp e.printStackTrace();

}

上一张自己爬取的图片，并用fusioncharts生成报表(一般抓取的是int类型的数据的话，生成报表可以很直观)

Flask接口签名sign原理与实例代码浅析

285 2023-03-22

JAVA超级简单的爬虫实例讲解

Flask接口签名sign原理与实例代码浅析

java中的接口是类吗

vue项目接口域名动态的获取方法

推荐文章

接口调用是什么意思？几种常用接口调用方式

接口设计原则

8款在线 API 接口文档管理工具

api管理系统是什么？

什么是接口调试？接口调试的步骤有哪些？

api 接口管理系统有哪些？

接口测试有几种测试方法

API文档生成工具有哪些？

微服务和api网关区别

交换机配置步骤

最近发表

热评文章

在线接口文档管理工具推荐，支持在线测试，HTTP接口

开源的在线接口文档wiki工具Mindoc的介绍与使

如何优雅的进行接口设计？接口设计的六大原则是什么？

什么是API测试,api检测公司

遇到百度网址安全中心提醒您该页面可能存在钓鱼欺诈信息

软件接口设计怎么做？前后端分离软件接口设计思路

JAVA超级简单的爬虫实例讲解

微信扫一扫：分享

推荐文章

最近发表

热评文章