能力介绍
采用行业领先的深度学习算法,为开发者提供行业领先的语音识别服务,广泛应用于客服中心、呼叫中心智能客服系统、智能电视等场景中。
技术特色
超高识别率
普通话识别准确率高达98%,对特定词汇进行优化,可进一步提升语音识别率
识别速度快
采用实时识别方式,实现语音数据的传输和识别的同步,实时率可达0.3以下
多语言支持
已支持普通话、英语、粤语、维吾尔语、客家话等多种语言,具备很强的口音普适性
云+端识别
可以根据当前网络状况及指令的类型,自动判断使用本地还是云端引擎进行识别
接入方式灵活
支持HTTP、Socket、WebService以及MRCP等多种接口,满足不同需求
多种场景定制
可自由定制垂直领域的语音识别模型,识别效果更精确
应用场景
语音输入法
直接用语音的方式输入,让输入法更加便捷
语音搜索
搜索内容直接以语音的方式输入,让搜索更加高效
会议记录
将会议音频转换为文字,方便后期的文字处理和内容存档
呼叫中心
将电话语音数据转写成文本,方便进行检索、质检及数据分析
实时庭审记录
实时将法院庭审现场语音转写为文字,及时生成庭审记录
医疗病历录入
让医生可以直接通过说话将语音转为文字录入到病历系统中
录音笔记转写
将语音笔记、采访录音等直接转为文字,方便信息电子化
地图导航
直接利用语音即可实现对目的地的检索及导航