本篇文章653字,读完约2分钟
我相信很多足球迷都会记得,法国在2006年世界杯决赛中对阵意大利,齐祖在头顶攻击马特拉齐。因为这位“顶级”齐达内被罚了一张红牌,意大利轻松获得了冠军。然而,外界发现了背后的真相:马特拉齐问候了齐达内的女性亲属。
当时,外界只看到马特拉齐趴在齐达内的头上,却不知道马特拉齐辱骂了齐达内。东英吉利大学的计算机科学家海伦·贝尔说:“如果当时有唇读,齐达内的行为就有辩护的余地,也许他就不会被罚红牌。”"世界杯的历史将被改写。"
贝尔和她的同事们设计了一种新的唇读算法,这种算法可以提高计算机识别自然语言的能力,比如P、B、M以及其他类似嘴唇的声音。研究人员在上海的icassp上展示了他们的结果。
当然,能够可靠唇读的机器的使用场景不限于体育裁判。机器唇读还可以用来分析汽车或飞机的事故视频,协助聋哑人交流等。
唇读,也称为视觉语音识别,可以先识别嘴唇,然后将它们转换成文字。今天,唇读的最大挑战是可以实现10到14种发音口型,音素可以达到50度——圆唇而不是圆唇。即使是发音时的舌头水平也会引起口型的变化,同样的音位也会引起各种口型的变化。
贝尔和哈维的算法可以准确地识别出与嘴形相对应的特定音素。该算法经过了两个训练步骤:首先,机器学习匹配发音口型对应的音素;第二,重复嘴巴形成的概念。这些训练算法的发音材料来自12名读者(7名男性和5名女性)的音频视频,其中包含200个句子。
据贝尔称,初始算法的准确率为25%,结果每隔一段时间就可以提高一次。据说现在运动员们都捂着嘴在说话...
图片来源:ieee
标题:如果有这项技术 齐达内就不会被罚下场
地址:http://www.j4f2.com/ydbxw/10144.html