趣文网,分享全网好句子、好文章!

阿里和浙大等团队开发LIBS—唇语解读模型 中英双语实时复述!

时间:2023-06-28 03:08:01

相关推荐

阿里和浙大等团队开发LIBS—唇语解读模型 中英双语实时复述!

近年来,随着深度学习和大数据应用的发展,AI读唇的研究也取得了前所未有的进步。AI读唇可用于帮助深受听力障碍困扰的患者,改善嘈杂环境中的语音识别等,具有巨大的潜力。

最近,阿里巴巴、浙江大学和斯蒂文斯理工学院的研究人员联合开发了一个算法——LIBS(Lip by Speech),该算法的准确度达到了行业领先水平。训练辅助数据除了LRS2数据库以外(包含45,000条来自BBC的句子音频),还有最大的普通话唇语语料库CMLR(包含100000条以上的自然语言句子、20000条以上的词组和30000个以上的汉字),能够实现实时中英复述。

原本人类本身读唇都已经比较困难,而机器读唇就更困难了,因为它需要从视频中提取足够多的信息。目前,大多数机器学习系统只能对单词进行分类,而不能进行句子序列预测。

根据LIBS的团队介绍,这个算法在两个基准上管理着业界领先的准确性,分别比基准的字符准确率高7.66%和2.75%。它甚至可以帮助有听力障碍的人观看没有字幕的视频。

简单地理解,就是LIBS采用了一种新的过滤策略,从语音识别器中提取特征,然后采用基于交叉模式对齐的方法提取视频中的帧级知识,以实现准确的唇形识别。

LIBS研究团队还发现,该模型在使用短句进行预训练的效果并不理想,因为解码器很难从少于14个字母的句子中提取有效信息。LIBS团队还表示,他们希望在未来的工作中,可以将该框架应用到其他场景中,比如手语系统。

LIBS通过红色区域分析唇语

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。
显示评论内容(1)
  1. 宠物人2023-10-16 06:18宠物人[上海市网友]203.9.57.126
    这个模型太厉害了,可以帮助听障人士更方便地进行交流,科技改变生活!
    顶10踩0
相关阅读
浙大教授郑强:英语耗费了中国青年宝贵的时间!说实话 我不赞同

浙大教授郑强:英语耗费了中国青年宝贵的时间!说实话 我不赞同

英语耗费了我们许多中国青年宝贵的时光,像日本,英语水平也不怎么样,但是人家的学者60年没出国,照样获得诺贝尔奖

2023-08-02

学霸扎堆来这吃面!50岁老板是校友 边递蘸料边和女博士谈论文!

学霸扎堆来这吃面!50岁老板是校友 边递蘸料边和女博士谈论文!

这家面店开在浙大玉泉校区边上快10年了。店招牌上刘姥姥几个字早褪了色。有的学生吃着面毕业,工作了还开车来吃。还有男生带女朋友来吃的,呐,这是我读

2023-11-16

文学翻译名家齐聚浙大热聊 人工智能会抢他们的饭碗吗?

文学翻译名家齐聚浙大热聊 人工智能会抢他们的饭碗吗?

前天,浙江大学中华译学馆特邀毕飞宇、林少华、马爱农等国内十余名著名作家与文学翻译家作客文学翻译名家高峰论坛

2023-12-24

浙江大学中国现当代文学 总分426 专业课283分学姐经验分享

浙江大学中国现当代文学 总分426 专业课283分学姐经验分享

从看到初试成绩的自得因而没有用心准备复试,到复试状况百出险些翻车,自己清醒了不少,失败是最能给人成长的,这一段时间来自己身上的种种有很多可供参

2023-11-13