Java 从互联网上爬邮箱代码示例-eolink官网

Java 从互联网上爬邮箱代码示例

网页爬虫：其实就是一个程序用于在互联网中获取符合指定规则的数据。

package day05;

import java.io.BufferedReader;

import java.io.IOException;

import java.io.InputStreamReader;

import java.net.URL;

import java.util.ArrayList;

import java.util.List;

import java.util.regex.Matcher;

import java.util.regex.Pattern;

public class SpiderDemo {

public static void main(String[] args) throws IOException {

List list = getMailByWeb();

for (String mail : list) {

System.out.println(mail);

}

public static List getMailByWeb() throws IOException {

URL url = new URL("http://itheima.com/aboutt/1376.html");

BufferedReader input = new BufferedReader(new InputStreamReader(url.openStream()));

String regex = "\\w+@\\w+(\\.http://\\w+)+";

Pattern p = Pattern.compile(regex);

List list = new ArrayList();

String line = null;

while ((line = input.readLine()) != null) {

Matcher m = p.matcher(line);

while (m.find()) {

list.add(m.group());

}

return list;

}

总结

jsoup解析html方法，通常被人称之为爬虫技术。（个人认为可能是返回的数据，只有一小部分是我们需要的，造成了数据的冗余，和网络延迟）。

以上就是本文关于Java 从互联网上爬邮箱代码示例的全部内容，希望对大家有所帮助。感兴趣的朋友可以参阅：Java多线程ForkJoinPool实例详解、Java中map遍历方式的选择问题详解、关于Java企业级项目开发思想等，有什么问题可以随时留言，会及时回复大家。

Flask接口签名sign原理与实例代码浅析

374 2023-03-27

Java 从互联网上爬邮箱代码示例

Flask接口签名sign原理与实例代码浅析

vue项目接口域名动态的获取方法

zookeeper python接口实例详解

推荐文章

接口调用是什么意思？几种常用接口调用方式

接口设计原则

8款在线 API 接口文档管理工具

api管理系统是什么？

什么是接口调试？接口调试的步骤有哪些？

api 接口管理系统有哪些？

接口测试有几种测试方法

API文档生成工具有哪些？

微服务和api网关区别

交换机配置步骤

最近发表

热评文章

在线接口文档管理工具推荐，支持在线测试，HTTP接口

开源的在线接口文档wiki工具Mindoc的介绍与使

如何优雅的进行接口设计？接口设计的六大原则是什么？

什么是API测试,api检测公司

遇到百度网址安全中心提醒您该页面可能存在钓鱼欺诈信息

软件接口设计怎么做？前后端分离软件接口设计思路

Java 从互联网上爬邮箱代码示例

微信扫一扫：分享

推荐文章

最近发表

热评文章