文字识别(OCR)调用教程
文字识别(OCR)调用接口:https://www.tulingyun.com/api/ocr
POST参数(json方式提交):
参数名称 |
类型 |
必选 |
描述 |
token |
String |
是 |
测试时统一使用"www.tulingyun.com" |
upfile_b64 |
String |
是 |
使用base64编码图片文件 |
return_text |
Int |
否 |
识别到多处文字时的拼接符号,0为不拼接,返回list,1为用空格拼接,2为换行拼接,默认为0,注意:此值为1或2时只返回纯识别文本,无位置信息 |
only_rec |
Int |
否 |
是否为单行文本,0为普通识别模式,1为单行文本识别,默认为0。注意:单行文本使用1时识别更准确,但要求请求图片必须为单行,否则无法识别。 |
返回结果分析:
参数名称 |
类型 |
描述 |
msg |
字符串 |
识别成功则返回"识别成功",否则返回识别失败原因 |
text |
字符串数组 |
所识别的文本数组 |
scores |
数组 |
所识别的文本数组置信度 |
position |
数组 |
所识别文字位置数组,8个数字代表的四个角的坐标,排序为x1,y1,x2,y2,x3,y3,x4,y4 |
status_code |
整数型 |
识别状态,正常为200000,其余为异常 |
status_message |
字符串 |
识别状态,正常为"success",否则为出错原因 |
tip |
字符串 |
保留参数 |
调用提交例子:{"token":"www.tulingyun.com","upfile_b64":"UklGRs...AA.."}
如调用失败则参考web测试接口调用:https://www.tulingyun.com/index.html
语音识别调用教程
离线语音识别调用接口:https://www.tulingyun.com/api/asr
POST参数(json方式提交):
参数名称 |
类型 |
必选 |
描述 |
token |
String |
是 |
测试时统一使用"www.tulingyun.com" |
punc |
Integer |
否 |
整数格式,0为不添加标点,1为添加标点,默认为0 |
itn |
Integer |
否 |
整数格式,0为不转换数字,1为转换数字,默认为0 |
hotwords |
String |
否 |
此处为热词,如不需要则留空即可,每个热词需要用|分隔,例如"语音识别|文字识别" |
upfile_b64 |
String |
是 |
使用base64编码音频文件 |
返回结果分析:
参数名称 |
类型 |
描述 |
result |
字符串 |
识别的内容 |
status_code |
整数型 |
识别状态,正常为200000,其余为异常 |
status_message |
字符串 |
识别状态,正常为"success",否则为出错原因 |
调用提交例子:{"token":"www.tulingyun.com","punc":0,"hotwords":"语音识别|文字识别|流式识别","upfile_b64":"UklGRs...AA.."}
如调用失败则参考web测试接口调用:https://www.tulingyun.com/yuyin.html
实时语音识别调用教程
实时语音识别调用接口:wss://www.tulingyun.com/api/asr_streaming
websocket参数(json方式提交):
参数名称 |
类型 |
必选 |
描述 |
token |
String |
是 |
测试时统一使用"www.tulingyun.com" |
punc |
Integer |
否 |
整数格式,0为不添加标点,1为添加标点,默认为0 |
itn |
Integer |
否 |
整数格式,0为不转换数字,1为转换数字,默认为0 |
hotwords |
String |
否 |
此处为热词,如不需要则留空即可,每个热词需要用|分隔,例如"语音识别|文字识别" |
wav |
String |
是 |
使用base64编码音频文件 |
返回结果分析:
参数名称 |
类型 |
描述 |
msg |
字符串 |
识别成功则返回"识别成功",否则返回识别失败原因 |
mode |
字符串 |
返回当前模式:online和offline,online实时显示当前结果,offline为一句话结束后修正识别结果 |
online |
字符串 |
实时识别结果 |
offline |
字符串 |
上一句话修正结果 |
offline_isnew |
布尔型 |
是否第一次返回上一句话修正结果 |
offline_id |
整数型 |
修正结果id,用于区分,每出现一次新的offline修正结果,id值加1 |
调用提交例子:{"token":"www.tulingyun.com","punc":0,"hotwords":"语音识别|文字识别|流式识别","wav":"UklGRs...AA.."}
如调用失败则参考web测试接口调用:https://www.tulingyun.com/yuyin.html