Python3 下实现腾讯人工智能API 调用-eolink官网

Python3 下实现腾讯人工智能API 调用

1、背景

a、鹅厂近期发布了自己的人工智能 api，包括身份证ocr、名片ocr、文本分析等一堆API，因为前期项目用到图形OCR，遂实现试用了一下，发现准确率还不错，放出来给大家共享一下。

b、基于python3，跟python2还是有些区别。

c、特别需要提到的就是签名生成这块，鹅厂的api说明里写的比较简单，一开始在sign的生成（class="data-table" data-id="t7a7e9d1-fhTDPNiO" data-transient-attributes="class" data-width="1162px" style="width: 100%; outline: none; border-collapse: collapse;">

参数名

参数值

app_id

10000

nonce_str

20e3408a79

text

腾讯开放平台

time_stamp

1493449657

2）身份证ocr接口有6个字段，拼接串为：

app_id=10000&time_stamp=1511839575&nonce_str=3oxitu0qf198bh24&image=%2F9j%2F4AA************QSkZJRgA9j%2F%2F2Q%3D%3D&card_type=0&sign=2ED0122CD44DCB1FD7BC9AE1D03D64D9

参数名称	是否必选	数据类型	数据约束	示例数据	描述
app_id	是	int	正整数	1000001	应用标识（AppId）
time_stamp	是	int	正整数	1493468759	请求时间戳（秒级）
nonce_str	是	string	非空且长度上限32字节	fa577ce340859f9fe	随机字符串
sign	是	string	非空且长度固定32字节	B250148B284956EC5218D4B0503E7F8A	签名信息，详见接口鉴权
image	是	string	原始图片的base64编码数据（解码后大小上限1MB，支持JPG、PNG、BMP格式）	...	待识别图片
card_type	是	int	整数	0/1	身份证图片类型，0-正面，1-反面

注意区别：不光光是参与计算的字段变化，各字段的排序也不一样。

3、实现代码

在github上上传了一下，-*- coding: utf-8 -*-'''create by : joshua zoucreate date : 2017.11.28Purpose: tecent ai api'''import requestsimport base64import hashlibimport timeimport randomimport os,string,globfrom PIL import Image from io import BytesIOfrom urllib.parse import urlencodefrom urllib import parseimport jsonclass MsgTencent(object): def __init__(self,AppID=None,AppKey=None): ''' 改成你自己的API账号、密码 ''' if not AppID: AppID = '1111111111' if not AppKey: AppKey = 'uuuuuuuuuu' self.app_id= AppID self.app_key= AppKey self.img_base64str=None def get_random_str(self): #随机生成16位字符串 rule = string.ascii_lowercase + string.digits str = random.sample(rule, 16) return "".join(str) def get_time_stamp(self): return str(int(time.time())) def __get_image_base64str__(self,image): if not isinstance(image,Image):return None outputBuffer = BytesIO() bg.save(outputBuffer, format='JPEG') imgbase64 = base64.b64encode(outputBuffer.getvalue()) return imgbase64 def __get_imgfile_base64str__(self,image): if not isinstance(image, str): return None if not os.path.isfile(image): return None with open(image,'rb') as fp: imgbase64 = base64.b64encode(fp.read()) return imgbase64 def get_img_base64str(self,image): if isinstance(image, str): self.img_base64str= self.__get_imgfile_base64str__(image) elif isinstance(image,Image): self.img_base64str= self.__get_imgfile_base64str__(image) return self.img_base64str.decode() # 组装字典，MD5加密方法 ''' ====================================== tencent获得参数对列表N（字典升级排序） ====================================== 1\依照算法第一步要求，对参数对进行排序，得到参数对列表N如下。参数名参数值 app_id 10000 nonce_str 20e3408a79 text 腾讯开放平台 time_stamp 1493449657 2\按URL键值拼接字符串T 依照算法第二步要求，将参数对列表N的参数对进行URL键值拼接，值使用URL编码，URL编码算法用大写字母，例如%E8，而不是小写%e8，得到字符串T如下： app_id=10000&nonce_str=20e3408a79&text=%E8%85%BE%E8%AE%AF%E5%BC%80%E6%94%BE%E5%B9%B3%E5%8F%B0&time_stamp=1493449657 3\拼接应用密钥，得到字符串S 依照算法第三步要求，将应用密钥拼接到字符串T的尾末，得到字符串S如下。 app_id=10000&nonce_str=20e3408a79&text=%E8%85%BE%E8%AE%AF%E5%BC%80%E6%94%BE%E5%B9%B3%E5%8F%B0&time_stamp=1493449657&app_key=a95eceb1ac8c24ee28b70f7dbba912bf 4\计算MD5摘要，得到签名字符串依照算法第四步要求，对字符串S进行MD5摘要计算得到签名字符串如。 e8f6f347d549fe514f0c9c452c95da9d 5\转化md5签名值大写对签名字符串所有字母进行大写转换，得到接口请求签名，结束算法。 E8F6F347D549FE514F0C9C452C95DA9D 6\最终请求数据在完成签名计算后，即可得到所有接口请求数据，进一步完成API的调用。 text 腾讯开放平台接口请求数据，UTF-8编码 app_id 10000 应用标识 time_stamp 1493449657 请求时间戳（秒级），用于防止请求重放 nonce_str 20e3408a79 请求随机字符串，用于保证签名不可预测 sign E8F6F347D549FE514F0C9C452C95DA9D 请求签名 ''' def gen_dict_md5(self,req_dict,app_key): if not isinstance(req_dict,dict) :return None if not isinstance(app_key,str) or not app_key:return None try: #方法，先对字典排序，排序之后，写app_key，再urlencode sort_dict= sorted(req_dict.items(), key=lambda item:item[0], reverse = False) sort_dict.append(('app_key',app_key)) sha = hashlib.md5() rawtext= urlencode(sort_dict).encode() sha.update(rawtext) md5text= sha.hexdigest().upper() #print(1) #字典可以在函数中改写 if md5text: req_dict['sign']=md5text return md5text except Exception as e: return None #生成字典 def gen_req_dict(self, req_dict,app_id=None, app_key=None,time_stamp=None, nonce_str=None): """用MD5算法生成安全签名""" if not req_dict.get('app_id'): if not app_id: app_id= self.app_id req_dict['app_id']= app_id #nonce_str 字典无值 if not req_dict.get('time_stamp'): if not time_stamp: time_stamp= self.get_time_stamp() req_dict['time_stamp']= time_stamp if not req_dict.get('nonce_str'): if not nonce_str: nonce_str= self.get_random_str() req_dict['nonce_str']= nonce_str #app_key 取系统参数。 if not app_key: app_key= self.app_key md5key= self.gen_dict_md5(req_dict, app_key) return md5key'''基本文本分析===========分词对文本进行智能分词识别，支持基础词与混排词粒度 text词性标注对文本进行分词，同时为每个分词标注正确的词性 text专有名词识别对文本进行专有名词的分词识别，找出文本中的专有名词 text同义词识别识别文本中存在同义词的分词，并返回相应的同义词 text计算机视觉--OCR识别====================通用OCR识别识别上传图像上面的字段信息 image身份证OCR识别识别身份证图像上面的详细身份信息 image,card_type(身份证，0-正面，1-反面)名片OCR识别识别名片图像上面的字段信息 image行驶证驾驶证OCR识别识别行驶证或驾驶证图像上面的字段信息 image,type(识别类型，0-行驶证识别，1-驾驶证识别)营业执照OCR识别识别营业执照上面的字段信息 image银行卡OCR识别识别银行卡上面的字段信息 image'''#改成你自己的API账号、密码APPID='1111111111'APPKEY='UUUUUUUUU'TencentAPI={ #基本文本分析API "nlp_wordseg": { 'APINAME':'分词', 'APIDESC': '对文本进行智能分词识别，支持基础词与混排词粒度', 'APIURL': ' 'APIPARA': 'text' }, "nlp_wordpos": { 'APINAME':'词性标注', 'APIDESC': '对文本进行分词，同时为每个分词标注正确的词性', 'APIURL': ' 'APIPARA': 'text' }, 'nlp_wordner': { 'APINAME':'专有名词识别', 'APIDESC': '对文本进行专有名词的分词识别，找出文本中的专有名词', 'APIURL': ' 'APIPARA': 'text' }, 'nlp_wordsyn': { 'APINAME':'同义词识别', 'APIDESC': '识别文本中存在同义词的分词，并返回相应的同义词', 'APIURL': ' 'APIPARA': 'text' }, #计算机视觉--OCR识别API "ocr_generalocr": { 'APINAME':'通用OCR识别', 'APIDESC': '识别上传图像上面的字段信息', 'APIURL': ' 'APIPARA': 'image' }, "ocr_idcardocr": { 'APINAME':'身份证OCR识别', 'APIDESC': '识别身份证图像上面的详细身份信息', 'APIURL': ' 'APIPARA': 'image,card_type' }, "ocr_bcocr": { 'APINAME':'名片OCR识别', 'APIDESC': '识别名片图像上面的字段信息', 'APIURL': ' 'APIPARA': 'image' }, "ocr_driverlicenseocr":{ 'APINAME':'行驶证驾驶证OCR识别', 'APIDESC': '识别行驶证或驾驶证图像上面的字段信息', 'APIURL': ' 'APIPARA': 'image,type' }, "ocr_bizlicenseocr":{ 'APINAME':'营业执照OCR识别', 'APIDESC': '识别营业执照上面的字段信息', 'APIURL': ' 'APIPARA': 'image' }, "ocr_creditcardocr":{ 'APINAME':'银行卡OCR识别', 'APIDESC': '识别银行卡上面的字段信息', 'APIURL': ' 'APIPARA': 'image' },}def ExecTecentAPI(*arg,**kwds): if kwds.get('Apiname'): apiname= kwds.pop('Apiname') url = TencentAPI[apiname]['APIURL'] name = TencentAPI[apiname]['APINAME'] desc= TencentAPI[apiname]['APIDESC'] para= TencentAPI[apiname]['APIPARA'] tx= MsgTencent(APPID,APPKEY) Req_Dict={} for key in para.split(','): value=None print (kwds) if kwds.get(key): value = kwds.pop(key) if key=='image': #图像获取base64 value= tx.get_img_base64str(value) if key=='text': #文本进行GBK编码 value= value.encode('gbk') Req_Dict[key]=value print (key,value,Req_Dict[key]) #生成请求包 sign= tx.gen_req_dict(req_dict=Req_Dict) resp = requests.post(url,data=Req_Dict,verify=False) print (name+'执行结果'+resp.text) return resp.text if __name__ == "__main__": #名片ocr file= r'名片.jpg' rest = ExecTecentAPI(Apiname='ocr_bcocr',image=file) #文本分析 rest = ExecTecentAPI(Apiname='nlp_wordseg',text='上帝保佑你')

标签：api

使用SpringBoot实现API接口

274 2022-11-06

Python3 下实现腾讯人工智能API 调用

java 单机接口限流处理方案

使用SpringBoot实现API接口

Python怎么调用GPT3.5接口

推荐文章

接口调用是什么意思？几种常用接口调用方式

接口设计原则

8款在线 API 接口文档管理工具

api管理系统是什么？

什么是接口调试？接口调试的步骤有哪些？

api 接口管理系统有哪些？

接口测试有几种测试方法

API文档生成工具有哪些？

微服务和api网关区别

交换机配置步骤

最近发表

热评文章

在线接口文档管理工具推荐，支持在线测试，HTTP接口

开源的在线接口文档wiki工具Mindoc的介绍与使

如何优雅的进行接口设计？接口设计的六大原则是什么？

什么是API测试,api检测公司

软件接口设计怎么做？前后端分离软件接口设计思路

接口管理平台推荐，几大接口管理平台总有一款适合你！

Python3 下实现 腾讯人工智能API 调用

推荐文章

最近发表

热评文章

Python3 下实现腾讯人工智能API 调用