78

搜狗推出“唇语识别”技术 垂直场景下达到90%准确率

 6 years ago
source link: http://tech.ifeng.com/a/20171214/44804589_0.shtml?amp%3Butm_medium=referral
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

搜狗推出“唇语识别”技术 垂直场景下达到90%准确率

2017年12月14日 15:51:01 来源:凤凰科技 作者:二维马

7a92c1d7c5c1514_size16_w522_h300.jpg

凤凰科技讯(作者/二维马)12月14日消息,搜狗今日推出了一种人机交互新技术“唇语识别”,通过机器视觉识别说话人唇部动作,来解读说话者所说的内容。

搜狗官方表示,通过复杂端到端深度神经网络技术进行中文唇语序列建模,经过数千小时的真实唇语数据训练,终于取得了唇语识别效果。在非特定人开放口语测试集上,该系统达到60%以上的准确率,超过google发布的英文唇语系统50%以上的准确率,在垂直场景如车载、智能家居等场景下甚至已经达到90%的准确率。

作为人机交互的形式之一,未来唇语识别技术可以辅助语音交互及图像识别,在日常生活、安防、公益等各个领域实现广泛应用。比如在车载场景下,周围噪音过大时会对语音指令产生干扰,通过唇语识别技术则可以规避干扰,保证人车交互的准确性和稳定性,日常不便发声的公共场所也可以保证说话内容的私密性;在安防领域,由于目前多数监控只有摄像头没有麦克风,往往只能看清嘴型却不知道在说什么,给案情分析带来很多难题,而唇语识别技术可以帮助公安人员获取重要的讲话信息,为公共安全提供有效支持。除此之外,唇语识别技术还能发挥巨大的公益价值,帮助先天性听障人群或老年人,让他们更好地理解和表达自己。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK