85

阿里技术团队开源语音识别模型 DFSMN

 5 years ago
source link: http://www.10tiao.com/html/299/201806/2650697128/1.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

阿里巴巴智能实验室开源了语音识别模型DFSMN,  在多个大词汇量连续语音识别任务包括英文和中文上验证了DFSMN的性能。在目前流行的2千小时英文FSH任务上,DFSMN模型相比于BLSTM模型可以获得1.5%的性能优势且模型参数量更少。在2万小时的中文数据库上,LFR-DFSMN相比于LFR-LCBLSTM可以获得超过20%的相对性能提升。18年举行的云栖大会武汉峰会上,装有DFSMN语音识别模型的“AI收银员”在与真人店员的PK中,在嘈杂环境下准确识别了用户的语音点单,在短短49秒内点了34杯咖啡。识别模型DFSMN的开源对全球学术界和AI技术应用将有积极的影响。

开源派号外

[开源派]开通微信沟通群组啦:欢迎加入!



微信订阅号:开源派 (opensourcepie)

↓点击阅读原文,查看下载链接 


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK