Python利用正则表达式提取var自定义变量的值(python的var函数)

网友投稿 523 2022-08-24


Python利用正则表达式提取var自定义变量的值(python的var函数)

目标解析HTML文件中的var自定义变量的值本文主要利用正则表达式提取页面中的var $render_datab 变量的值,$render_datab变量的值是一个json字符串。

目录

​​1、导入依赖包​​

​​2、读取HTML源文件内容 ​​

​​3、编写正表达式获取var自定义变量​​

​​4、验证结果是否符合预期​​

1、导入依赖包

import jsonimport reimport requests

2、读取HTML源文件内容

import requestshtml=requests.get('jsonimport rep = re.compile(r'var \$render_data = (.*)[\s\S]{7}{};', re.MULTILINE | re.DOTALL)dataStr= p.findall(html)[0]dataJson=json.loads(dataStr, strict=False)print(dataJson)

4、验证结果是否符合预期

[{'status': {'visible': {'type': 0, 'list_id': 0}, 'created_at': 'Mon Jul 18 20:19:37 +0800 2016', 'id': '3998685497264270', 'mid': '3998685497264270', 'can_edit': False, 'show_additional_indication': 0, 'text': '这些插画会让人大呼「美啊美啊!」 - 知乎日报 我想这些插画会让你大呼「美啊美啊!」 ', 'textLength': 63, 'source': 'iOS', 'favorited': False, 'pic_ids': [], 'pic_types': '', 'is_paid': False, 'mblog_vip_type': 0, 'user': {'id': 2039679457, 'screen_name': '一头鬼', 'profile_image_url': ''profile_url': ''statuses_count': 242, 'verified': False, 'verified_type': -1, 'close_blue_v': False, 'description': '', 'gender': 'm', 'mbtype': 0, 'urank': 10, 'mbrank': 0, 'follow_me': False, 'following': False, 'followers_count': 245, 'follow_count': 159, 'cover_image_phone': ''avatar_hd': ''like': False, 'like_me': False, 'badge': {'unread_pool': 1, 'unread_pool_ext': 1, 'dzwbqlx_2016': 1, 'user_name_certificate': 1}}, 'reposts_count': 0, 'comments_count': 0, 'attitudes_count': 0, 'pending_approval_count': 0, 'isLongText': False, 'reward_exhibition_type': 0, 'hide_flag': 0, 'mlevel': 0, 'darwin_tags': [], 'mblogtype': 0, 'more_info_type': 0, 'number_display_strategy': {'apply_scenario_flag': 3, 'display_text_min_number': 1000000, 'display_text': '100万+'}, 'content_auth': 0, 'pic_num': 0, 'alchemy_params': {'ug_red_envelope': False}, 'page_info': {'object_type': 2, 'type': 'webpage', 'page_pic': {'url': ''page_url': ''url_ori': ''page_title': '我想这些插画会让你大呼「美啊美啊!」', 'content1': 'John Bauer (1882-1918),瑞典插画家,主要为北欧传说童话作插画。许多瑞典小孩都是读着他插画的故事长大的。@Erik Daae 认认真真写答案,不知道会不会有人看到呢╮(╯▽╰)╭ 多图,但我保证一定会有让你大呼“美啊美啊!”的图。 他笔下的 Troll(北欧童话中的一种巨人怪物,经典的反派角色),并不是像一般反派一样面目狰狞的,反而是胖乎乎的挺可爱的。 从上面这幅图中,我们可以发现有着珍珠般的光辉的人类公主,与灰暗的背景和不那么美丽的 troll 形成了对比。美丽纯洁的人类女孩与狡猾的 troll,是许多瑞典童话的主要角色,也是 John Bauer 重点描绘的对象。'}, 'bid': 'DFpg9utLE', 'buttons': [{'type': 'follow', 'name': '关注', 'sub_type': 0, 'params': {'uid': 2039679457}}], 'status_title': '这些插画会让人大呼「美啊美啊', 'ok': 1, 'scheme': ''tipScheme': ''hotScheme': ''appScheme': ''callUinversalLink': False, 'callWeibo': False, 'hit': True, 'is_gray': 1, 'schemeOrigin': False, 'appLink': 'sinaweibo://detail?mblogid=3998685497264270&luicode=20000061&lfid=3998685497264270', 'xianzhi_scheme': 'xianzhi://mblogshow?mid=3998685497264270', 'third_scheme': 'sinaweibo://detail?mblogid=3998685497264270&luicode=20000061&lfid=3998685497264270', 'call': '1'}]


版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:python实现计算最少完美平方数给一个正整数 n, 请问最少多少个完全平方数(比如1, 4, 9 ... )的和等于 n。
下一篇:json.decoder.JSONDecodeError: Expecting ‘,‘ delimiter: line xx column xx (char xxx)
相关文章

 发表评论

暂时没有评论,来抢沙发吧~