java中的接口是类吗
379
2022-08-24
python_绘制词云(Python绘制词云图的心得体会)
python绘制词云
# 导入依赖模块import jsonimport requestsimport jiebaimport pandas as pdimport wordcloudimport numpy as npimport PIL.Image as imageimport matplotlib.pyplot as pltfrom pandas.io.json import json_normalize# 请求头headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.106 Safari/537.36'}# 评论地址url="循环爬取df = pd.DataFrame(None)i = 0while True:# format拼接url ret = requests.get(url.format(str(i*30)), headers=headers) text = ret.text result = json.loads(text) t = result['comments'].values() s = json_normalize(t) i += 1 if len(s) == 0 or i==3:# if len(s) == 0 : print("爬取结束") break else: df = df.append(s) print("第{}页爬取完毕".format(i)) # 评论去重df=df.drop_duplicates('commentId').reset_index(drop=True) df.head()# 评论分词word = [ y for x in df.content.tolist() for y in list(jieba.cut(x))]# 读取词云模板mask = np.array(image.open("D:/gua.jpg"))# 设置停用词stopword=[ '一个','这个','不是','就是','没有','什么','这么','这样', '这种','怎么','斜眼','微笑','喷水','大笑','跟帖','br']# 设置词云图层属性wd=wordcloud.WordCloud(font_path='C:/windows/fonts/simhei.ttf', stopwords=stopword, mask=mask, collocations=False)# 创建词云对象wd=wd.generate(",".join(word))# 将词云模板的颜色设置为输出词云的颜色image_colors = wordcloud.ImageColorGenerator(mask) # 从背景图建立颜色方案wd.recolor(color_func=image_colors)# 绘制词云plt.imshow(wd)# 隐藏坐标轴plt.axis('off')# 画图plt.show()
数据样式:
参考:https://mp.weixin.qq.com/s/nzY0HJXxCulRziBBdUn4Vg
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。
发表评论
暂时没有评论,来抢沙发吧~