捷通灵云实现远场语音识别 服务智能家居

2015-10-12 18:46:15

        灵云科技10日消息:捷通华声面向智能车载、智能家电、智能家居、机器人等领域专门开发的全方位解决方案——灵云种子近期将全面升级,灵云种子将采用灵云远场语音识别技术能力,从根本上改变目前市场上因各式问题导致的仅能近距离交互的方式,为智能语音技术应用于智能车载、智能家电、智能家居、机器人等灵云奠定坚实的基础。

        灵云种子自2015年初发布以来,得到了智能硬件、车载、机器人等多个领域的一致好评,特别是在机器人领域,解决了之前存在的种种人机交互困难的问题,使设备脱离了机械控制,真正让机器人实现了“能说会听、能思考、会判断”。

        很长一段时间以来,科大讯飞、NUANCE等语音技术公司都在努力开拓智能硬件市场,但智能硬件产品在很多场景下因语音交互体验不如人意而不能满足市场的需求,究其原因主要是受限于背景噪音、其他声音干扰、回声、混响等多重复杂因素,进而导致的识别距离近、识别率低等明显痛点,在这些问题没有解决之前,智能硬件语音交互方面将一直是一个短板。鉴于此,灵云推出远场语音识别技术,将极大推进语音识别技术在真实生活场景中的应用。

        远场语音识别技术的核心有两点,一是语音前端处理:利用麦克风阵列、回声消除等技术将目标说话人的声音增强,并抑制/消除周围无用的声音(噪声+回声);二是语音识别引擎针对麦克风阵列处理后的数据进行专门优化,以使远场识别效果达到最优。

        灵云种子此次推出的远场语音识别技术,集成了全新的麦克风阵列方案,并利用麦克风阵列的空域滤波特性——在目标说话人方向形成拾音波束,抑制波束之外的噪声和反射声,其降噪和去混响效果均为国内领先水平。

        可以想象,基于灵云远场语音识别的远距离、高识别率支撑,现在用户在以家庭为单位的活动范围内,几乎可以通过语音轻松操控家里的一切智能硬件设备,推而广之,搭载远场识别的智能硬件产品将无限扩大适用范围和应用场景。目前的方案主要根据算法不同,可分为适用于电视机、空调、机器人等的加性麦克风阵列和适用于采访话筒、录音笔等的差分麦克风阵列。

 

灵云种子  智能终端交互一站式解决方案

        2015年以来,国内各种智能硬件产品在争论中不断涌现,尤其是苹果公司apple watch的发布,几乎是给原本叫好不叫座的智能硬件市场打了一剂强心针,智能硬件厂商更是如雨后春笋般冒芽而出。尽管智能硬件以及机器人市场被炒得火热,但怎么定义智能,并真正体现智能依然为产业界,也是媒体争论的热点,传统人机交互方式带来的局促感也越来越显著,甚至成为其“叫好不叫座”的核心因素之一。过去,鲜有一套完整的方案能够全面满足各类智能硬件的智能交互需求。

        在此背景之下,捷通华声依托灵云平台(hcicloud.com),强化灵云全方位人工智能技术的融合,向企业级开发商特别推出了一整套智能终端交互组件—灵云种子,包括灵云语音识别、语音合成、语义理解、声纹识别、人脸识别、指纹识别等多种人工智能交互能力,并提供简单易用的开发接口,供各类智能终端进行集成调用,实现人与终端设备多种方式的自由沟通和控制。包括智能语音交互、智能语音导航、智能语音控制、声纹解锁、手写输入、智能图像识别、安全身份认证等多种人机交互功能,满足了包括机器人、智能车载、智能家电、智能家居及可穿戴式设备等各个行业的对人工智能技术的应用的大量且多方位的需求。

        目前,捷通华声“灵云种子”已经升级到3.0版,新版灵云种子新增云端和本地同时识别,并从结果中择优的功能,提高了语音识别的准确率和识别速度。优化了意图理解的32个领域。可广泛应用在以下场景中:

  • 语音检索:支持包括路况导航类、家居菜单智能导航类、周边服务类、生活服务类、娱乐类等多种语音检索服务;
  • 消息提醒:人性化定制推送类别:来电提醒、短信提醒、应用提醒,并可将设置在云端;
  • 通讯娱乐:支持短信发送,电话通讯,多媒体播放,手机操控;
  • 健康服务:支持传感器,提供传感器数据分析,为用户提供健康图表,并结合云端服务提供定制健康指导等现有及正在研发的能力;
  • 云平台:基于灵云平台,提供多设备数据同步,私人信息云存储,智能推荐;
  • 智能支付:结合智能终端特点,提供更便捷、更多样的智能支付方式。
  • 虚拟现实扩展:将AR技术与LBS技术整合,为用户提供包括周边景点商圈实景展示,路线提示,为O2O服务提供优秀体验;

        这些方案类似于一个开发模版,灵云(hcicloud.com)平台将这些特定领域和场景的智能交互方案经过设计和优化后,打造出一体化的全智能人机交互解决方案——“灵云种子”。直接应用“灵云种子”配置的技术服务和内容服务,即可满足各种智能硬件的智能化需求。

        据捷通华声灵云产品研发部门人员介绍:灵云最新远场语音识别技术由清华灵云人工智能研究中心承担了主要研发工作,而灵云种子更主要的作用是在产业中起到示范与引导作用,期望伴随灵云种子在各行各业智能硬件中的不断“生根发芽”,伴随智能硬件走进大众生活,无数大众将真实感受全智能时代的无限魅力!

        捷通华声灵云平台已面向产业全面开放,在中国华南地区,尤其广州、深圳地区经济发达、创新力强,在机器人、智能车载、智能家电、智能家居、穿戴式设备拥有独特优势。为了向华南地区广大客户提供更加直接的支持与帮助,捷通华声在2015年初成立了深圳捷通华声分公司,旨在依托灵云平台,利用灵云平台智能语音、智能图像、语义理解等全方位人工智能技术能力和丰富完善的智能终端交互解决方案,与华南地区硬件厂商加强合作关系,发挥华南地区智能终端设备研发和生产的优势,以推动智能终端产业长足的进步,携手智能硬件厂商互惠共赢。

        伴随人工智能产业在世界范围内的高速发展,捷通华声坚持“灵云科技 源自清华”的发展战略,依托清华大学科研力量相继创建清华灵云人工智能研究中心、清华海峡研究院人工智能研究中心。捷通华声将以清华大学人工智能科技力量为依托,不断提升人工智能各项能力,努力提升用户体验,更加专注人工智能技术研究与产业化应用,与合作伙伴精诚合作,共同创建良好的人工智能产业生态,共同推动中国人工智能产业的发展进步,为中国人工智能产业的发展做出应有的贡献!

        灵云平台更多信息请访问:www.hcicloud.com

        灵云智能办公平台更多信息请访问:aioffice.hcicloud.com

        了解灵云产品与捷通华声,请问询灵云客服机器人:010-82826886--8898

关注捷通华声微信公众号,了解更多资讯