python 利用百度API进行淘宝评论关键词提取（python编程）-eolink官网

python 利用百度API进行淘宝评论关键词提取（python编程）

目录1、创建相关新应用 2、获取Access Token 3、分析评论并进行观点抽取 4、运行结果

利用百度API自然语言处理技术中的评论观点抽取方面，对淘宝购物的评论进行分析，把关键词进行提取，方便买家快速了解该商品的相关特点，具体实现过程如下：

1、创建相关新应用

首先，需要登录百度AI平台，创建一个关于自然语言处理技术的应用（领取免费额度），获得AppID、API Key和Secret Key如下：

然后下载Python的SDK，然后可以通过阅读API的使用手册和自然语言处理技术的观点抽取相关案例：

2、获取Access Token

使用百度API时需要先获取Access Token，并且需要用到上一步获取的参数API Key和Secret Key，在百度给出的使用说明中，建议用POST的方式对URL进行请求来获取access_token，同时可以加入Header，该方式支持UTF-8编码，具体实现代码如下：

import json import time import requests from urllib.request import urlopen #定义获取token函数 def get_token(): req = Request(Token_url) req.add_header('Content-Type', 'application/json; charset=UTF-8') try: f = urlopen(req,timeout=5) result_str = f.read().decode('utf-8') except URLError as err: print(err) result = json.loads(result_str) #返回Access Token字符串 return result['access_token']

3、分析评论并进行观点抽取

在获取Access Token后就可以使用百度API对评论进行分析并抽取关键词。在使用说明中，调用API时需要输入参数text和type，其中text为需要分析的文本，而type分成了13各类别，具体取值说明如下：

因为本文分析的是淘宝购物评论文本数据，所以该参数取值选择了12。其次，返回格式需要指定输入为UTF-8编码，对于调用后返回的参数，本文用到了prop、adj和sentiment三个参数，解释如下：

具体实现代码如下：

def analysis_comment(host,comment): #定义分析类别（购物） data = json.dumps( { "text":comment, "type":12 }) request = Request(url=host,data=data.encode('utf-8')) request.add_header('Content-Type', 'application/json; charset=UTF-8') response = urlopen(request) content = response.read().decode('utf-8') rdata = json.loads(content) print("--------------------------------------------------------------") print("评论：") print(" " + comment) print("\n评论关键字：") #把积极、中性、消极关键词分类出来并打印 for item in rdata['items']: if item['sentiment'] == 2: print(u" 积极的评论关键词：" + item['prop'] + item['adj']) if item['sentiment'] == 1: print(u" 中性的评论关键词：" + item['prop'] + item['adj']) if item['sentiment'] == 0: print(u" 消极的评论关键词：" + item['prop'] + item['adj'])

4、运行结果

在对上述函数进行定义后，运行改代码，调用函数：

if __name__ == '__main__': #定义访问url（API Key和Secret Key换成自己的） Comment_url = "https://aip.baidubce.com/rpc/2.0/nlp/v2/comment_tag" Token_url = "https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=your_API_Key&client_secret=your_Secret_Key" A_t = get_token() host = Comment_url + "?charset=UTF-8&access_token="+A_t comment1 = {"text":"版型不错，颜色很好看，面料非常舒服而且厚度适中"} comment2 = {"text":"上身效果一般，做工也一般，会有点起球，没有想象中好"} comment3 = {"text":"设计做工一点都不好，袖子特别长，衣服比例设计非常差，性价比不高"} comment1 = comment1["text"] comment2 = comment2["text"] comment3 = comment3["text"] analysis_comment(host,comment1) analysis_comment(host,comment2) analysis_comment(host,comment3)

运行结果如下：

然而，从结果中可以看出，在第二句评论中，“一般”这个词应该定义为中性，而该模型将其定义为消极，说明该模型在一定程度上仍存在一些瑕疵，这也是后期需要改进的地方。

以上就是python 利用百度API进行淘宝评论关键词提取的详细内容，更多关于python 淘宝评论关键词提取的资料请关注其它相关文章！

管理接口平台，提高工作效率的关键解决方案

343 2022-06-07

python 利用百度API进行淘宝评论关键词提取（python编程）

多平台统一管理软件接口，如何实现多平台统一管理软件接口

多平台统一管理系统接口，提高效率与自动化的关键

管理接口平台，提高工作效率的关键解决方案

推荐文章

接口调用是什么意思？几种常用接口调用方式

接口设计原则

8款在线 API 接口文档管理工具

api管理系统是什么？

什么是接口调试？接口调试的步骤有哪些？

api 接口管理系统有哪些？

接口测试有几种测试方法

API文档生成工具有哪些？

微服务和api网关区别

交换机配置步骤

最近发表

热评文章

在线接口文档管理工具推荐，支持在线测试，HTTP接口

开源的在线接口文档wiki工具Mindoc的介绍与使

如何优雅的进行接口设计？接口设计的六大原则是什么？

什么是API测试,api检测公司

遇到百度网址安全中心提醒您该页面可能存在钓鱼欺诈信息

软件接口设计怎么做？前后端分离软件接口设计思路

python 利用百度API进行淘宝评论关键词提取（python编程）

微信扫一扫：分享

推荐文章

最近发表

热评文章