Python3 下实现 腾讯人工智能API 调用

网友投稿 271 2022-11-06


Python3 下实现 腾讯人工智能API 调用

1、背景

a、鹅厂近期发布了自己的​​人工智能 api​​,包括身份证ocr、名片ocr、文本分析等一堆API,因为前期项目用到图形OCR,遂实现试用了一下,发现准确率还不错,放出来给大家共享一下。

b、基于python3,跟python2还是有些区别。

c、特别需要提到的就是签名生成这块,鹅厂的api说明里写的比较简单,一开始​​在sign的生成(class="data-table" data-id="t7a7e9d1-fhTDPNiO" data-transient-attributes="class" data-width="1162px" style="width: 100%; outline: none; border-collapse: collapse;">

参数名

参数值

app_id

10000

nonce_str

20e3408a79

text

腾讯开放平台

time_stamp

1493449657

2)身份证ocr接口有6个字段,拼接串为:

app_id=10000&time_stamp=1511839575&nonce_str=3oxitu0qf198bh24&image=%2F9j%2F4AA************QSkZJRgA9j%2F%2F2Q%3D%3D&card_type=0&sign=2ED0122CD44DCB1FD7BC9AE1D03D64D9

参数名称

是否必选

数据类型

数据约束

示例数据

描述

app_id


int

正整数

1000001

应用标识(AppId)

time_stamp


int

正整数

1493468759

请求时间戳(秒级)

nonce_str


string

非空且长度上限32字节

fa577ce340859f9fe

随机字符串

sign


string

非空且长度固定32字节

B250148B284956EC5218D4B0503E7F8A

签名信息,详见​​接口鉴权​

image


string

原始图片的base64编码数据(解码后大小上限1MB,支持JPG、PNG、BMP格式)

...

待识别图片

card_type


int

整数

0/1

身份证图片类型,0-正面,1-反面

注意区别:不光光是参与计算的字段变化,各字段的排序也不一样。

3、实现代码

在github上上传了一下,-*- coding: utf-8 -*-'''create by : joshua zoucreate date : 2017.11.28Purpose: tecent ai api'''import requestsimport base64import hashlibimport timeimport randomimport os,string,globfrom PIL import Image from io import BytesIOfrom urllib.parse import urlencodefrom urllib import parseimport jsonclass MsgTencent(object): def __init__(self,AppID=None,AppKey=None): ''' 改成你自己的API账号、密码 ''' if not AppID: AppID = '1111111111' if not AppKey: AppKey = 'uuuuuuuuuu' self.app_id= AppID self.app_key= AppKey self.img_base64str=None def get_random_str(self): #随机生成16位字符串 rule = string.ascii_lowercase + string.digits str = random.sample(rule, 16) return "".join(str) def get_time_stamp(self): return str(int(time.time())) def __get_image_base64str__(self,image): if not isinstance(image,Image):return None outputBuffer = BytesIO() bg.save(outputBuffer, format='JPEG') imgbase64 = base64.b64encode(outputBuffer.getvalue()) return imgbase64 def __get_imgfile_base64str__(self,image): if not isinstance(image, str): return None if not os.path.isfile(image): return None with open(image,'rb') as fp: imgbase64 = base64.b64encode(fp.read()) return imgbase64 def get_img_base64str(self,image): if isinstance(image, str): self.img_base64str= self.__get_imgfile_base64str__(image) elif isinstance(image,Image): self.img_base64str= self.__get_imgfile_base64str__(image) return self.img_base64str.decode() # 组装字典,MD5加密方法 ''' ====================================== tencent获得参数对列表N(字典升级排序) ====================================== 1\依照算法第一步要求,对参数对进行排序,得到参数对列表N如下。 参数名 参数值 app_id 10000 nonce_str 20e3408a79 text 腾讯开放平台 time_stamp 1493449657 2\按URL键值拼接字符串T 依照算法第二步要求,将参数对列表N的参数对进行URL键值拼接,值使用URL编码,URL编码算法用大写字母,例如%E8,而不是小写%e8,得到字符串T如下: app_id=10000&nonce_str=20e3408a79&text=%E8%85%BE%E8%AE%AF%E5%BC%80%E6%94%BE%E5%B9%B3%E5%8F%B0&time_stamp=1493449657 3\拼接应用密钥,得到字符串S 依照算法第三步要求,将应用密钥拼接到字符串T的尾末,得到字符串S如下。 app_id=10000&nonce_str=20e3408a79&text=%E8%85%BE%E8%AE%AF%E5%BC%80%E6%94%BE%E5%B9%B3%E5%8F%B0&time_stamp=1493449657&app_key=a95eceb1ac8c24ee28b70f7dbba912bf 4\计算MD5摘要,得到签名字符串 依照算法第四步要求,对字符串S进行MD5摘要计算得到签名字符串如。 e8f6f347d549fe514f0c9c452c95da9d 5\转化md5签名值大写 对签名字符串所有字母进行大写转换,得到接口请求签名,结束算法。 E8F6F347D549FE514F0C9C452C95DA9D 6\最终请求数据 在完成签名计算后,即可得到所有接口请求数据,进一步完成API的调用。 text 腾讯开放平台 接口请求数据,UTF-8编码 app_id 10000 应用标识 time_stamp 1493449657 请求时间戳(秒级),用于防止请求重放 nonce_str 20e3408a79 请求随机字符串,用于保证签名不可预测 sign E8F6F347D549FE514F0C9C452C95DA9D 请求签名 ''' def gen_dict_md5(self,req_dict,app_key): if not isinstance(req_dict,dict) :return None if not isinstance(app_key,str) or not app_key:return None try: #方法,先对字典排序,排序之后,写app_key,再urlencode sort_dict= sorted(req_dict.items(), key=lambda item:item[0], reverse = False) sort_dict.append(('app_key',app_key)) sha = hashlib.md5() rawtext= urlencode(sort_dict).encode() sha.update(rawtext) md5text= sha.hexdigest().upper() #print(1) #字典可以在函数中改写 if md5text: req_dict['sign']=md5text return md5text except Exception as e: return None #生成字典 def gen_req_dict(self, req_dict,app_id=None, app_key=None,time_stamp=None, nonce_str=None): """用MD5算法生成安全签名""" if not req_dict.get('app_id'): if not app_id: app_id= self.app_id req_dict['app_id']= app_id #nonce_str 字典无值 if not req_dict.get('time_stamp'): if not time_stamp: time_stamp= self.get_time_stamp() req_dict['time_stamp']= time_stamp if not req_dict.get('nonce_str'): if not nonce_str: nonce_str= self.get_random_str() req_dict['nonce_str']= nonce_str #app_key 取系统参数。 if not app_key: app_key= self.app_key md5key= self.gen_dict_md5(req_dict, app_key) return md5key'''基本文本分析===========分词 对文本进行智能分词识别,支持基础词与混排词粒度 text词性标注 对文本进行分词,同时为每个分词标注正确的词性 text专有名词识别 对文本进行专有名词的分词识别,找出文本中的专有名词 text同义词识别 识别文本中存在同义词的分词,并返回相应的同义词 text计算机视觉--OCR识别====================通用OCR识别 识别上传图像上面的字段信息 image身份证OCR识别 识别身份证图像上面的详细身份信息 image,card_type(身份证,0-正面,1-反面)名片OCR识别 识别名片图像上面的字段信息 image行驶证驾驶证OCR识别 识别行驶证或驾驶证图像上面的字段信息 image,type(识别类型,0-行驶证识别,1-驾驶证识别)营业执照OCR识别 识别营业执照上面的字段信息 image银行卡OCR识别 识别银行卡上面的字段信息 image'''#改成你自己的API账号、密码APPID='1111111111'APPKEY='UUUUUUUUU'TencentAPI={ #基本文本分析API "nlp_wordseg": { 'APINAME':'分词', 'APIDESC': '对文本进行智能分词识别,支持基础词与混排词粒度', 'APIURL': ' 'APIPARA': 'text' }, "nlp_wordpos": { 'APINAME':'词性标注', 'APIDESC': '对文本进行分词,同时为每个分词标注正确的词性', 'APIURL': ' 'APIPARA': 'text' }, 'nlp_wordner': { 'APINAME':'专有名词识别', 'APIDESC': '对文本进行专有名词的分词识别,找出文本中的专有名词', 'APIURL': ' 'APIPARA': 'text' }, 'nlp_wordsyn': { 'APINAME':'同义词识别', 'APIDESC': '识别文本中存在同义词的分词,并返回相应的同义词', 'APIURL': ' 'APIPARA': 'text' }, #计算机视觉--OCR识别API "ocr_generalocr": { 'APINAME':'通用OCR识别', 'APIDESC': '识别上传图像上面的字段信息', 'APIURL': ' 'APIPARA': 'image' }, "ocr_idcardocr": { 'APINAME':'身份证OCR识别', 'APIDESC': '识别身份证图像上面的详细身份信息', 'APIURL': ' 'APIPARA': 'image,card_type' }, "ocr_bcocr": { 'APINAME':'名片OCR识别', 'APIDESC': '识别名片图像上面的字段信息', 'APIURL': ' 'APIPARA': 'image' }, "ocr_driverlicenseocr":{ 'APINAME':'行驶证驾驶证OCR识别', 'APIDESC': '识别行驶证或驾驶证图像上面的字段信息', 'APIURL': ' 'APIPARA': 'image,type' }, "ocr_bizlicenseocr":{ 'APINAME':'营业执照OCR识别', 'APIDESC': '识别营业执照上面的字段信息', 'APIURL': ' 'APIPARA': 'image' }, "ocr_creditcardocr":{ 'APINAME':'银行卡OCR识别', 'APIDESC': '识别银行卡上面的字段信息', 'APIURL': ' 'APIPARA': 'image' },}def ExecTecentAPI(*arg,**kwds): if kwds.get('Apiname'): apiname= kwds.pop('Apiname') url = TencentAPI[apiname]['APIURL'] name = TencentAPI[apiname]['APINAME'] desc= TencentAPI[apiname]['APIDESC'] para= TencentAPI[apiname]['APIPARA'] tx= MsgTencent(APPID,APPKEY) Req_Dict={} for key in para.split(','): value=None print (kwds) if kwds.get(key): value = kwds.pop(key) if key=='image': #图像获取base64 value= tx.get_img_base64str(value) if key=='text': #文本进行GBK编码 value= value.encode('gbk') Req_Dict[key]=value print (key,value,Req_Dict[key]) #生成请求包 sign= tx.gen_req_dict(req_dict=Req_Dict) resp = requests.post(url,data=Req_Dict,verify=False) print (name+'执行结果'+resp.text) return resp.text if __name__ == "__main__": #名片ocr file= r'名片.jpg' rest = ExecTecentAPI(Apiname='ocr_bcocr',image=file) #文本分析 rest = ExecTecentAPI(Apiname='nlp_wordseg',text='上帝保佑你')


版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:人工智能深度学习Caffe框架介绍
下一篇:身份证查询系统API(身份证查询系统带姓名带照片)
相关文章

 发表评论

暂时没有评论,来抢沙发吧~