Java使用正则表达式匹配获取链接地址的方法示例

网友投稿 475 2023-04-19


Java使用正则表达式匹配获取链接地址的方法示例

本文实例讲述了java使用正则表达式匹配获取链接地址的方法。分享给大家供大家参考,具体如下:

获取页面中字符串的url地址我们都会使用正则表达式来匹配获取了,下面我来给大家总结几个匹配获取链接地址示例。

1、正则表达式中Matcher中find()方法的应用。

2、String对象中的 replaceAll(String regex,String replacement) 方法的使用。通过这个方法去除了不必要的字符串,从而得到了需要的网址和链接文字

例1.超简单的

String content = "";

String pattern= "href="([^" rel="external nofollow" ]*)"";

Pattern p = Pattern.compile(pattern, 2 | Pattern.DOTALL);

Matcher m = p.matcher(content);

if(m.find()) {

System.out.println("url="+m.group(1));

}

例2.上面只能获取带有双“号的a标题中的url,下面我们加以改进可以获取任何状态下的a标题url

package com.gong.example;

import Java.util.regex.Matcher;

import java.util.regex.Pattern;

public class Simple {

public static void main(String[] args){

String input="jb51.net" +

dkhrDfiXNu"163.com " +

"yahoo.com";

String patternString = "\s*(?i)href\s*=\s*("([^"]*")|'[^']*'|([^'">\s]+))"; //href

Pattern pattern = Pattern.compile(patternString,

Pattern.CASE_INSENSITIVE);

Matcher matcher = pattern.matcher(input);

while (matcher.find()) {

String link=matcher.group();

System.out.println(link);

link=link.replaceAll("href\s*=\s*(['|"]*)", "");

System.out.println("--"+link);

link=link.replaceAll("['|"]", "");

System.out.println("---"+link);

}

}

}

例3.我们还可以利用它进行升级获取 获取网址和链接文字哦。

/*

功能说明:分析字符串s,提取s里面的超链接和链接文字

*/

import java.util.regex.Matcher;

import java.util.regex.Pattern;

public class RegTest

{

public static void main(String[] args)

{

//String s="

 空间 | 

String s="

企业推广 | 搜索风云榜 | 关于百度 | About Baidu

©2008 Baidu 使用百度前必读 京ICP证03xxxx号

String s="

企业推广 | 搜索风云榜 | 关于百度 | About Baidu

©2008 Baidu 使用百度前必读 京ICP证03xxxx号


版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:Java中四种线程池的使用示例详解
下一篇:深入浅出分析Java抽象类和接口【功能,定义,用法,区别】
相关文章

 发表评论

暂时没有评论,来抢沙发吧~