图灵云-使用文档

文字识别(OCR)调用教程


文字识别(OCR)调用接口:https://www.tulingyun.com/api/ocr
POST参数(json方式提交):
参数名称 类型 必选 描述
token String 测试时统一使用"www.tulingyun.com"
upfile_b64 String 使用base64编码图片文件
return_text Int 识别到多处文字时的拼接符号,0为不拼接,返回list,1为用空格拼接,2为换行拼接,默认为0,注意:此值为1或2时只返回纯识别文本,无位置信息
only_rec Int 是否为单行文本,0为普通识别模式,1为单行文本识别,默认为0。注意:单行文本使用1时识别更准确,但要求请求图片必须为单行,否则无法识别。
返回结果分析:
参数名称 类型 描述
msg 字符串 识别成功则返回"识别成功",否则返回识别失败原因
text 字符串数组 所识别的文本数组
scores 数组 所识别的文本数组置信度
position 数组 所识别文字位置数组,8个数字代表的四个角的坐标,排序为x1,y1,x2,y2,x3,y3,x4,y4
status_code 整数型 识别状态,正常为200000,其余为异常
status_message 字符串 识别状态,正常为"success",否则为出错原因
tip 字符串 保留参数
调用提交例子:{"token":"www.tulingyun.com","upfile_b64":"UklGRs...AA.."}
如调用失败则参考web测试接口调用:https://www.tulingyun.com/index.html

语音识别调用教程


离线语音识别调用接口:https://www.tulingyun.com/api/asr
POST参数(json方式提交):
参数名称 类型 必选 描述
token String 测试时统一使用"www.tulingyun.com"
punc Integer 整数格式,0为不添加标点,1为添加标点,默认为0
itn Integer 整数格式,0为不转换数字,1为转换数字,默认为0
hotwords String 此处为热词,如不需要则留空即可,每个热词需要用|分隔,例如"语音识别|文字识别"
upfile_b64 String 使用base64编码音频文件
返回结果分析:
参数名称 类型 描述
result 字符串 识别的内容
status_code 整数型 识别状态,正常为200000,其余为异常
status_message 字符串 识别状态,正常为"success",否则为出错原因
调用提交例子:{"token":"www.tulingyun.com","punc":0,"hotwords":"语音识别|文字识别|流式识别","upfile_b64":"UklGRs...AA.."}
如调用失败则参考web测试接口调用:https://www.tulingyun.com/yuyin.html

实时语音识别调用教程


实时语音识别调用接口:wss://www.tulingyun.com/api/asr_streaming
websocket参数(json方式提交):
参数名称 类型 必选 描述
token String 测试时统一使用"www.tulingyun.com"
punc Integer 整数格式,0为不添加标点,1为添加标点,默认为0
itn Integer 整数格式,0为不转换数字,1为转换数字,默认为0
hotwords String 此处为热词,如不需要则留空即可,每个热词需要用|分隔,例如"语音识别|文字识别"
wav String 使用base64编码音频文件
返回结果分析:
参数名称 类型 描述
msg 字符串 识别成功则返回"识别成功",否则返回识别失败原因
mode 字符串 返回当前模式:online和offline,online实时显示当前结果,offline为一句话结束后修正识别结果
online 字符串 实时识别结果
offline 字符串 上一句话修正结果
offline_isnew 布尔型 是否第一次返回上一句话修正结果
offline_id 整数型 修正结果id,用于区分,每出现一次新的offline修正结果,id值加1
调用提交例子:{"token":"www.tulingyun.com","punc":0,"hotwords":"语音识别|文字识别|流式识别","wav":"UklGRs...AA.."}
如调用失败则参考web测试接口调用:https://www.tulingyun.com/yuyin.html