中国语音产业联盟发布《中国智能语音产业发展报告,2021

- 编辑:admin - 点击数:766

中国语音产业联盟发布《中国智能语音产业发展报告,2021

报告强调,科大讯飞等语音领域的领军企业具有广泛的布局和强大的市场占有率。这些企业通过打造技术能力开放平台,构建开源生态,引领行业的技术创新和应用开发。以科大讯飞开放平台为例,它已经开放了545项产品及能力,吸引了超过380.5万开发者团队,开发出超过159.5万个应用。这一开放平台已经从龙头+开发者的“二维”生态升级到龙头+行业龙头+开发者的“三维”生态,并联合行业龙头搭建基线系统,让更多开发者参与到数字经济浪潮中。

在语音识别技术方面,视听融合的多模态交互技术成为技术演进的主要方向。科大讯飞的多模语音增强技术融合了语音与视觉的多模感知,使得在噪音较大的场景下的语音交互能够跨越实用门槛,已经在车载、会议、地铁购票和医疗挂号等场景中得到应用。

另外,针对低资源语音识别的难题,海天瑞声和科大讯飞分别从语音数据和算法层面推动了技术的进步。

中国语音产业联盟发布《中国智能语音产业发展报告,2021

在语音合成方面,随着电商直播等行业的繁荣,语音合成技术也表现出拟人化、口语化的发展趋势。科大讯飞的多风格多情感语音合成系统SMART-TTS可以提供11种强度可调的情感合成能力。火山语音的超自然对话语音合成和META的语音对语音翻译(speech-to-speech translation, S2ST)则通过在训练中添加副语言数据,让语音交互更加自然和个性化。

对于如何推动智能语音技术的持续突破,科大讯飞总裁吴晓如在会上提出,未来的语音交互系统不仅要“能听会说”,还要深度理解人的信息。

展望智能语音产业未来的发展,报告指出,在后竞争时代,我们需要关注新增的不确定性因素,包括:核心关键技术能力的提升,开源生态的培育需要加大投入,重点应用场景的落地需要提速,以及传统行业的开放场景动能的不足等。