灵云语音合成:追求极致真实,高度自然的语音合成效果

2020-01-20 13:58:52

近日,捷通华声推出搭载最新引擎的灵云语音合成技术,声线细腻、情感丰富、语速真实。得益于核心引擎的深度学习化与高音质声码器,最新灵云语音合成技术的合成效果得到全面提升。

 

 

新版灵云语音合成技术采用一体化智能文本分析算法,结合统计和规则等处理手段,让文本处理前端拥有强大的分词、多音字、韵律环境预测能力,使合成的语音听起来更加符合人类发音习惯和说话节奏。它还具备自动识别和处理日期时间、数值金额、电话号码等文本的能力,使得数字发音更自然,“年月日元”、“百分之”、“点”等分词朗读时的发音也更加顺畅。
 

升级后的语音合成技术在各项指标上都达到了历史新高。测评人员给出的MOS值达4.5分,属行业领先。

注:MOS(Mean Opinion Score),平均主观意见分。在国际标准中,统一使用MOS值来评价系统接收到的话音质量。(满分5分)

合成速度方面,灵云语音合成技术同样毫不逊色。从实际体验来说,用户几乎感受不到任何等待时间,语音合成从点击“播放”开始即刻完成。

为了在各个专业领域都能够有良好稳定的语音合成表现,满足不同行业的特殊需求,灵云语音合成针对特定词汇和语句进行个性化定制,通过用户词表、定制录音以及调整判断规则等方法,提高读音、读法和韵律的准确性。经过十多年不同行业的实践经验,捷通华声积累了大量的专业领域词库、预选音库,可为金融证券、天气预报、体育赛事、公交汽运、航空、税务、POI、排队叫号等众多领域提供更专业的语音合成播报,客户能够快速、轻松定制与自己产品属性、形象相匹配的声音,为产品赋能。

 

为满足各种应用场景对语音合成的需求,捷通华声推出了完善的语音合成产品体系:

 

 

 

a.由灵云公有云平台提供灵云语音合成能力

针对手机app、智能手表、智能机器人等产品,开发者可通过从云端调用能力的方式,搭建轻量化终端。

 

b.基于windows系统的灵云语音合成软件

车站、医院、广播站的语音播报,可以直接使用安装在电脑上的灵云语音合成软件,一键播放。

 

c.私有化部署的灵云语音合成能力平台

在客服中心、呼叫中心等场景,用电话机器人来服务海量用户,需要高并发的语音合成能力。捷通华声提供可私有云部署的语音合成能力平台,与客户IVR系统对接,提供稳定高效的语音合成服务。

 

灵云语音合成技术拥有包含多国语种的音库,持普通话、英语、维语、粤语等20多个语种的语言合成,配合捷通华声的语音识别和机器翻译技术,能够实现多国语音面对面翻译。

 

音色方面,除了提供男声、女声、童声等基础音色库外,还有更多个性化、饱含情感的音色,包括柔美动听、干净利落、甜美可爱、纯真自然、成熟稳重、热情洋溢、措辞严厉等等,可为各种应用场景提供合适的声音,全面满足企业个性化需求。例如,银行的智能客服需要温柔动听的声音,从而给客户良好的服务体验,而金融行业的欠款催收场景,则需要选择相对严厉的声音,起到警示和催促的作用。

 

自从2001年在国内率先推出面向市场的语音合成技术以来,捷通华声已广泛服务金融、电信、能源、交通、教育、司法、公安、医疗、互联网等各领域,并出口美国、法国、西班牙、日本、韩国、新加坡等国家。捷通华声愿携手更多产业伙伴,为软件开发商、系统集成商、解决方案供应商等合作伙伴提供优质的产品和全面的技术支持,让更多的企业及个人享受到智能语音合成为生活带来的便利体验。

关注捷通华声微信公众号,了解更多资讯