SDK下载

最新通用SDK版本为5.2.8, 之前的版本暂不兼。如需定制SDK,请联系我们

名称 能力介绍 版本介绍 文档 更新日期 文件下载
语音合成 语音合成(TTS),将文本转化成语音,让机器像人类一样能说会道。 优化TTS Player,提升云端访问速度。 文档 2017/12/29
12.0M
md5:e5c5f0bc9e50f3c63ea81e97e82d83bb
61.0M
md5:ebfcc5122a02a40c6f56cdd9db731a58
9.55M
md5:3ede45778922c8ab442bab50b8e47078
7.23M
md5:7cef87fe825265fd5a75df4ad8d2aff2
语音识别 语音识别(ASR),将语音识别成文字,让机器轻松听懂人类的语言。 增加本地语音意图理解(asr.local.dialog)、云端本地双路识别功能,优化ASR Recorder,提升云端访问速度。 文档 2017/12/29
20.1M
md5:9afb49012544ff7131f69b38261d59bd
227M
md5:33f027e65671e9e55a40b92514bb42c4
11.3M
md5:a8a1aac5f63d9407f7880955fd4a9b48
8.72M
md5:66fa8776f181f567115a8fad289855de
语音唤醒 语音唤醒,实现特定语音指令唤醒,支持唤醒词个性化定制。 Android平台新增本地语音唤醒能力(asr.local.wake)。 文档 2017/10/12
43.1M
md5:0dc22504b4c4d9a5e54c2d572254c825
文字识别 文字识别(光学字符识别,简称OCR),将图片中的文字转化成电子文本。 采用最新灵云OCR识别引擎,支持二代身份证、增值税发票、行驶证、驾驶证、中国护照、营业执照、旅行证件(包括二代身份证、中国护照、双程证、回乡证、台胞证、大陆证等,对应一个模板,引擎自动分类识别)识别。 文档 2017/12/29
55.3M
md5:f7949a149a90926a9125a3f573a52663
399M
md5:d71ac1d989d226670f28d934f35f7a8e
131M
md5:a1cee218c62b30d4500f8a49bdd1489d
144M
md5:db84515c927eacc4aa0f0e7dc7bccf8f

注:新上线UI控件(android),实现拍照器功能,支持身份证、银行卡本地识别, 前往下载

手写识别 手写识别(HWR),将手写字迹转化成文本。 支持识别 93 种语言,支持识别句子或者单词,包含笔形、词联想等扩展功能。支持行写、叠写。 文档 2017/12/29
13.6M
md5:8911b4fa6021c063e85e711201414ea3
54.4M
md5:3ea00d0ee7782a69793b2775263d062c
26.0M
md5:6f0d3beadf4bffd5a002e9455cb84ef7
21.0M
md5:e3b8f492f67a8c48ed1d4f5d9beefe01
语义理解 语义理解(NLU),将人类语言进行意图解析。 优化核心引擎,提升云端访问速度。 文档 2017/12/29
5.54M
md5:fcb60ce0d1448ae6ec1b95a6ddff4f63
52.2M
md5:cc1854a4239652af60d863aa12cd19db
5.11M
md5:ac847db7874a6bcf7866a9f6d0356044
4.69M
md5:6b094f3243088ddccb5c7ef45a69fd6a
机器翻译 机器翻译(MT),支持中英互译、维汉互译。 支持中英互译、维汉互译。 文档 2017/12/29
5.46M
md5:151905465184c5813b4113b972efae80
32.5M
md5:20cb72d71eb767908221c2376c55abfe
4.93M
md5:36b3593c837c533bae2dd8bc7e6df557
4.52M
md5:9cb8806eecb6254c319b676b7621cb13
键盘输入 键盘输入(KB),输入法核心功能。 支持多国语言键盘输入,支持联想和容错。 文档 2017/12/29
6.36M
md5:9164452814570c9db58e298e6b9e7271
36.3M
md5:bd754b31d5c786e58a7f37cccb5508fe
7.74M
md5:261e7a2577a6167c6906356af3ae3b97
4.23M
md5:f1d05f8ed54d795aa17a55a59c86f827
声纹识别 声纹识别(VPR),通过声纹特征,进行身份鉴别。 支持声纹一对一验证和一对多搜索。 文档 2017/12/29
4.65M
md5:ce5fa7bd5dc903b0cc3c8692a6f515b1
92.8M
md5:d624dbe33df9be50acbf8db43090ff55
155.08M
md5:b4dd2763bbedbf355f58101d633057f1
154.61M
md5:cda48d209978e98fc4c0c7f08d8adeee
人脸识别 人脸识别(AFR),通过人脸面部特征,进行身份鉴别。 支持人脸一对一验证和一对多搜索。 文档 2017/12/29
6M
md5:6832662f3277c061f57199d74ac1a7d8
216M
md5:daeac8a2aa66b8ecf259c8edd91cabb6
113M
md5:41a61062735010608183519d6cf63350
113M
md5:6062a3b9acd3ec6a7a49e2be52181283

拓展控件

灵云UI控件

控件列表 能力介绍 更新日期 版本 控件下载
文字识别
基于灵云OCR 5.2.8 SDK,实现OCR识别拍照器功能,集成调用简单方便,支持身份证、银行卡本地识别
2017-12-29
5.2.8
下载
50.6M
下载
364M
手写识别
支持识别 93 种语言,支持识别句子或者单词,包含了笔形、词联想等扩展功能。支持行写、叠写
2015-12-18
5.1.0
下载
3.59M
语音识别
让机器听的懂说话。语音识别成文本的过程。支持多语种,识别率达到96% 2018-01-19 5.2.8
下载
30.3M
下载
161.86M
语音合成
2017-12-29 5.2.8
下载
9.79M
下载
54.6M

灵云智能空间

应用名称 应用介绍 更新日期 版本 智能空间下载
灵云智能空间
开发者/开发商可通过调用灵云智能空间提供的API函数,将灵云智能人机交互能力集成到第三方APP;灵云智能空间同时提供独立的应用程序界面,以便于调试灵云能力的参数设定并体验相应灵云能力的效果。目前版本只推出了TTS、ASR和HWR能力,其他能力陆续推出。
2015-07-27
V1.0.0
下载
5.86M
下载
敬请期待
灵云智能空间SDK
灵云智能空间SDK
2015-07-27
V1.0.0
下载
2.79M
下载
敬请期待

小提示:使用灵云智能空间调用能力,无点数限制

小提示:使用灵云UI控件调用能力,能力消耗点数为原来的一半

SDK名称 能力介绍 版本 版本介绍 更新日期 文件下载
麦克风阵列 麦克风阵列(SMA),实现远场拾音降噪,助力智能终端远场语音交互 8.2.0 适配XMOS(windows)平台,支持6麦克风阵列布局,实现回声消除、语音唤醒、声源定向、语音降噪、语音增强 2017/9/28
下载
40.4M
md5:4e5992e842eeec39874994b922d3ddd2
适配君正X1000(mips Linux)平台,支持2/4麦克风阵列布局,实现回声消除、语音唤醒、声源定向、语音降噪、语音增强 2017/9/28
下载
6.53M
md5:d646cc672bece634fa41775db166918b
适配瑞芯微RK3228H/RK3229(Android)平台,支持4麦克风(RK3228H)/6麦克风(RK3229)阵列布局,实现回声消除、语音唤醒、声源定向、语音降噪、语音增强/RK3229(Android)平台,支持4支持6麦克风阵列布局,实现回声消除、语音唤醒、声源定向、语音降噪、语音增强 2017/9/28
下载
19.5M
md5:ab361794f807128e3d02aede4e9ab512
灵云种子 灵云种子(AISeed),集成语音识别、语义理解、语音合成,支持智能终端语音交互 3.6 支持双工对话(打断功能),简化语音识别、语音合成、语义理解调用逻辑,支持客服云调用 2017/5/11
下载
66.0M
md5:1fdaa0ef169b8961ae98bbccf6bb8756