唇动识别,让ai更精准地听懂内容

嘈杂的环境里,会议、出国旅行还有逛展会时,普通的语音识别技术往往会“翻车”,让人感到头疼。这一难题现在有了新的解决方案,就是通过把AI的视力和听力结合起来,来解读嘴唇的动作,这就是唇动识别。这个技术用微型摄像头捕捉说话人的唇部运动,再给骨传导麦克风收集声音,把这两部分信息融合起来分析。就像于梅君介绍的那样,这项技术能够给人们提供更准确的翻译体验。哪怕周围环境再嘈杂,AI也能更精准地听懂内容。给实测结果看,搭载唇动识别的AI翻译眼镜在嘈杂环境下,准确率可以提升50%以上,帮我们减少了很多“听不懂”的尴尬时刻。除此之外,唇动识别还有一个有趣的应用,那就是在安静场合并实现无声交流。就算声音很小几乎听不见,AI也能通过观察唇形来判断内容,在图书馆和会议室这些地方就特别方便了。这一切都是因为AI结合了“画面和声音”,让它更懂得如何理解人类的交流方式了。