DeepMind最近做了个新软件它能读懂唇语

发布时间: 2016-11-10 08:55| 发布者: test| 查看: 12153| 评论: 0

摘要: 【AI世代编者按】专业唇语阅读者识别唇语的准确率只有20%到60%。人类在日常说话过程中嘴唇的微小移动很难被可靠地解读，尤其是在有一定距离，或画面不清晰的情况下。不过，唇语并不只是美剧《海军罪案调查科》中的噱 ...

DeepMind近来做了个新硬件它能读懂唇语

【AI世代编者案】专业唇语浏览者辨认唇语的精确率只要20%到60%。人类正在一样平常语言过程当中嘴唇的细小挪动很易被牢靠天解读，特别是正在有必然间隔，或绘里没有明晰的状况下。不外，唇语其实不只是好剧《水师功案查询拜访科》中的噱头，对环球的得聪者来讲，那是一项有效的东西。假如能牢靠天解读，那末将给数百万人带去协助。

牛津年夜教的最新研讨形貌了一种名为LipNet的野生智能体系。经由过程“寓目”人类语言的视频，和输进响应笔墨，那一硬件对唇语的解读精确率下达93.4%。那项研讨获得了谷歌(微专)旗下DeepMind的赞助。

此前最好的唇语解读东西只能完成逐一单词的解读，精确率只要79.6%。牛津年夜教研讨员暗示，新体系得到胜利的枢纽正在于经由过程差别方法来考虑那一成绩。那一体系没有再操纵可视元素，即语言者嘴型的变革来锻炼野生智能，而是每次皆处置一全部句子。那使得野生智能能够教会单词对应于甚么样的嘴型变革。

为了锻炼那一体系，研讨员背野生智能展现了2.9万条带笔墨标签的视频，每段视频少度为3秒。而为了察看专业唇语浏览者做得怎样，该团队借约请了“牛津门生残徐人社团”的3名成员，用300条随机视频来停止相似的测试。那些专家的均匀毛病率为47.7%，而野生智能的毛病率只要6.6%。

虽然那一项目获得了胜利，但也表露出了今世野生智能研讨的范围。正在指点野生智能怎样浏览唇语的过程当中，牛津年夜教团队利用了颠末设想的视频。视频中的一切人物皆里背火线，光芒亮堂，道出尺度构造的语句。

视频中的典范语句时少为3秒钟，比方：“Place blue in m 1 soon。”那此中包罗号令、色彩、介词、字母、数字，和副词。一切语句皆接纳如许的形式。因而，野生智能的超下精确率只是正在一种极度状况下获得的。假如请求野生智能从随机的YouTube视频中浏览唇语，那末成果能够很禁绝确。

有其他研讨职员指出，操纵这类特别视频来锻炼其实不契合实在天下场景。不外，论文做者北多·德弗雷塔斯（Nando de Freitas）为本人的功效停止了辩解。他指出，该团队曾测验考试过其他视频，但那些视频带去了太多“乐音”。那些视频各没有不异，因而野生智能没法获得故意义的结论。那也意味着，完善的数据散能够其实不存正在。德弗雷塔斯以为，思索到那一野生智能的精确率，终极状况怎样将与决于使命自己。

OpenAI的杰克·克推克（Jack Clark）暗示，假如期望正在理想天下中获得使用，那末那一野生智能借需求三圆里的劣化：人们正在理想天下场景中大批的语言视频；让野生智能能够从多个差别角度来浏览唇语；和让野生智能可猜测的短语范例更多样化。

克推克暗示：“那项手艺具有不言而喻的使用，但那看起去仿佛其实不能够。”假如野生智能能够教会浏览唇语，那末将合用于多种场景。此类体系能够被用于协助听力停滞人士理解四周发作的对话，或是让其别人工智能更好天分辨视频中的声音，天生精确的字幕。（编译/陈桦）

出色视频保举

主动播铺开闭 主动播放

好国斯坦祸教霸掀秘，十年后的脚机居然少如许？

正正在减载...

< >

保举：存眷“AI世代”微旌旗灯号（tencentAI），复兴“麦肯锡”可得到《2030年出止市场会怎样？》；复兴“创业陈述”，可得到好国《AI创业指北》；复兴“斯坦祸”，可得到《2030年的野生智能取糊口》。复兴“利剑宫”，可得到利剑宫《好国AI计谋陈述》。

DeepMind近来做了个新硬件它能读懂唇语

1、转载或引用本网站内容须注明原网址，并标明本网站网址(https://www.wnceo.com)。

2、本网站部分投稿来源于“网友”，文章内容请反复甄别。若涉及侵权请移步网站底部问题反馈进行反映。

3、对于不当转载或引用本网站内容而引起的民事纷争、行政处理或其他损失，本网站不承担责任。

4、对不遵守本声明或其他违法、恶意使用本网站内容者，本网站保留追究其法律责任的权利。

收藏分享邀请

test

0
粉丝
12153
阅读
0
回复

作者其他文章

关注世界总裁网

扫描关注,了解最新资讯

实时了解财经信息

掌握市场风云动态

助力商场共赢至胜

改变你所看到的世界

资讯幻灯片

热门资讯

06-05

liushaolong321

同心致远启新程创新赋能立潮头

2026年5月31日，福州福耀科技大学佩伯酒店群贤毕至、星光熠熠。“2026华夏企业家论坛
03-24

wangjing

陶哲轩：AI 辅助数学证明如同汽车冲击城市

据 The-decoder 报道，数学家陶哲轩将人工智能与形式化方法对数学研究实践的影响，比
03-24

wangjing

黄仁勋补贴人才价值底薪50%算力，英伟达终

黄仁勋补贴人才价值底薪50%算力，英伟达终极形态指挥数十万AIIT之家2026年03月21日 14
03-24

wangjing

马化腾首谈“养虾”：可将AI落地到丰富场景

观点网讯：3月18日，腾讯董事会主席兼首席执行官马化腾在腾讯控股2025年业绩沟通会上
03-24

wangjing

OpenClaw引领智能体浪潮：四巨头“龙虾”生

2026年，OpenClaw让AI第一次真正具备了“动手能力”——它不再停留在对话层面，而是能
03-24

wangjing

优必选CEO周剑：机器人首先替代的是一些招

3 月 24 日消息，据第一财经今日报道，优必选创始人、董事会主席兼 CEO 周剑在 3 月的
03-24

wangjing

高盛评Meta裁员、压开支、推迟模型发布：这

面对外界对meta裁员、削减Reality Labs投入及推迟基础模型发布的广泛担忧，高盛给出不
03-24

wangjing

AI大神卡帕西自曝：玩龙虾玩出“AI精神病”

编译 |陈骏达编辑 |李水青智东西3月23日报道，在上周六发布的播客中，OpenAI联合创始
03-24

wangjing

首个开放服务能力的音乐平台：网易云音乐官

3 月 23 日消息，网易云音乐官方今日宣布全面接入 OpenClaw，成为业内首个向 AI Agent
03-24

wangjing

2026人形机器人半程马拉松官宣：超300台机

今日，2026北京亦庄半程马拉松暨人形机器人半程马拉松赛事相关信息正式发布，比赛将于