捷通华声灵云语音识别重大突破 中文语音识别行业领先

[摘要] 近期,捷通华声应用最新算法,推出全新一代灵云语音识别核心引擎,识别率实现跨越式提升。目前,新一代语音识别技术已上线灵云平台(AIclou
https://mmbiz.qpic.cn/mmbiz_jpg/bVeXStO2mWoz0GOwPicvBkCQM0fxMyd4WyKzXrlObSuZ1ScdkxsuyPNSTbXicBaZr6rUVrT6rWkibwE48HGPCE5wQ/640?wx_fmt=jpeg

近期,捷通华声应用最新算法,推出全新一代灵云语音识别核心引擎,识别率实现跨越式提升。目前,新一代语音识别技术已上线灵云平台(AIcloud.com),供开发者调用,并面向政企客户推出包含8k、16k版本的全新灵云语音识别能力平台。

视频地址:https://v.qq.com/iframe/preview.html?vid=b0776m4ni8j

新一代灵云语音识别演示(建议全屏观看)

此次灵云语音识别技术的升级,是捷通华声在CTC算法的基础上,对建模单元粗粒度、模型训练方法、解码帧率进行创新优化。有效提升了语音识别引擎的执行效率、鲁棒性,增强了口音、语速适配能力,大幅提升了多人对讲、远场讲话等场景中的语音识别率。

调用云端语音识别服务 就上灵云平台

新一代灵云语音识别技术已上线灵云平台,开发者可以去灵云开发者社区(aicloud.com/dev/)申请调用。

https://mmbiz.qpic.cn/mmbiz_jpg/bVeXStO2mWoz0GOwPicvBkCQM0fxMyd4WqcTm0SaEP2rvjV9nUCeibicHJS9mKVsg2WlmtRLbxWZYWwwtvCjTdD0A/640?wx_fmt=jpeg

开发者将灵云语音识别SDK集成到ISO、JAVA、安卓、Windows等软件应用中后,填写申请到的灵云平台语音识别服务地址、授权信息,便可免费调用灵云平台的语音识别服务。

目前,灵云平台上的语音识别技术已服务包括打车软件、输入法、翻译APP、手机银行客户端等各类数十万应用,覆盖数亿终端用户。

灵云ASR能力平台 为政企单位提供私有、专业的语音识别能力

在提供公有云ASR能力的同时,捷通华声一直在为Callcenter、会议、公安等场景提供私有化的语音识别能力。

其中,在Callcenter 电话信道8K语音识别场景,捷通华声已服务众多大型银行客服中心、客服BPO中心,将海量语音实时转写为文字,为智能质检、智能客服、智能外呼、数据分析等提供私有云的语音识别能力。

在会议、司法、医疗等16k语音识别场景,捷通华声积累了大量声学、语言数据,分别推出了会议、审讯、医疗各科室等行业版的语音识别能力平台,为政企客户提供专业、私有、更安全的语音识别能力。

十多年来,捷通华声始终坚持核心技术自主研发。随着此次灵云语音识别技术的跨越式提升,捷通华声将为公有云开发者、政企客户提供识别率更高、更优质的语音识别能力与服务。




免责声明:

本站系本网编辑转载,会尽可能注明出处,但不排除无法注明来源的情况,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本网联系, 来信: liujun@soft6.com 我们将在收到邮件后第一时间删除内容!

[声明]本站文章版权归原作者所有,内容为作者个人观点,不代表本网站的观点和对其真实性负责,本站拥有对此声明的最终解释权。