JAVA过滤标签实现将html内容转换为文本的方法示例

网友投稿 413 2023-05-01


JAVA过滤标签实现将html内容转换为文本的方法示例

本文实例讲述了java过滤标签实现将html内容转换为文本的方法。分享给大家供大家参考,具体如下:

/**

* 把html内容转为文本

* @param html 需要处理的html文本

* @param filterTags 需要保留的html标签样式

* @return

*/

public static String trimHtml2Txt(String html, String[] filterTags){

html = html.replaceAll("\\

html = html.replaceAll("\\", "");//去掉注释

html = html.replaceAll("\\<![\\s\\S]*?>", "");

html = html.replaceAll("\\(?i)", "");//去掉样式

html = html.replaceAll("\\<script[^>]*>[\\s\\S]*?(?i)", "");//去掉js

html = html.replaceAll("\\]+>[\\s\\S]*?]+>(?i)", "");//去掉word标签

html = html.replaceAll("\\[\\s\\S]*?(?i)", "");

html = html.replaceAll("\\]*>|

html = html.replaceAll("\\\r\n|\n|\r", " ");//去掉换行

html = html.replaceAll("\\
]*>(?i)", "\n\r");

List tags = new ArrayList();

List s_tags = new ArrayList();

List halfTag = Arrays.asList(new String[]{"img","table","thead","th","tr","td"});//

if(filterTags != null && filterTags.length > 0){

for (String tag : filterTags) {

tags.add("<"+tag+(halfTag.contains(tag)?"":">"));//开始标签

if(!"img".equals(tag)) tags.add(""+tag+">");//结束标签

s_tags.add("#REPLACETAG"+tag+(halfTag.contahttp://ins(tag)?"":"REPLACETAG#"));//尽量替换为复杂一点的标记,以免与显示文本混合,如:文本中包含#td、#table等

if(!"img".equals(tag)) s_tags.add("#REPLACETAG/"+tag+"REPLACETAG#");

}

}

html = StringUtils.replaceEach(html, tags.toArray(new String[tags.size()]), s_tags.toArray(new String[s_tags.size()]));

html = html.replaceAll("\\

html = html.replaceAll("\\<[^>]+>", "");

html = StringUtils.replaceEach(html,s_tags.toArray(new String[s_tags.size()]),tags.toArray(new String[tags.size()]));

html = html.replaceAll("\\ ", " ");

return html.trim();

}

PS:这里再为大家推荐一款功能类似的在线工具供大家参考使用:

在线html/js/css代码过滤工具

http://tools.jb51.net/code/htmlfilter

另外,关于正则操作,这里再为大家推荐两款相关在线工具:

javascript正则表http://达式在线测试工具:

http://tools.jb51.net/regex/javascript

正则表达式在线生成工具:

http://tools.jb51.net/regex/create_reg

更多关于java算法相关内容感兴趣的读者可查看本站专题:《Java数据结构与算法教程》、《Java字符与字符串操作技巧总结》、《Java操作DOM节点技巧总结》、《Java文件与目录操作技巧汇总》和《Java缓存操作技巧汇总》

希望本文所述对大家java程序设计有所帮助。


版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:Java中RSA加密解密的实现方法分析
下一篇:Java 跳出递归循环问题解决办法
相关文章

 发表评论

暂时没有评论,来抢沙发吧~