价值无所不在,世界财经资讯媒体平台。
手机版
访问手机版
世界总裁网 首页 头条资讯 科技世界 新闻内容

DeepMind最近做了个新软件 它能读懂唇语

发布时间: 2016-11-10 08:55| 发布者: test| 查看: 1224| 评论: 0

摘要: 【AI世代编者按】专业唇语阅读者识别唇语的准确率只有20%到60%。人类在日常说话过程中嘴唇的微小移动很难被可靠地解读,尤其是在有一定距离,或画面不清晰的情况下。不过,唇语并不只是美剧《海军罪案调查科》中的噱 ...

DeepMind近来做了个新硬件 它能读懂唇语

【AI世代编者案】专业唇语浏览者辨认唇语的精确率只要20%到60%。人类正在一样平常语言过程当中嘴唇的细小挪动很易被牢靠天解读,特别是正在有必然间隔,或绘里没有明晰的状况下。不外,唇语其实不只是好剧《水师功案查询拜访科》中的噱头,对环球的得聪者来讲,那是一项有效的东西。假如能牢靠天解读,那末将给数百万人带去协助。

牛津年夜教的最新研讨形貌了一种名为LipNet的野生智能体系。经由过程“寓目”人类语言的视频,和输进响应笔墨,那一硬件对唇语的解读精确率下达93.4%。那项研讨获得了谷歌(微专)旗下DeepMind的赞助。

此前最好的唇语解读东西只能完成逐一单词的解读,精确率只要79.6%。牛津年夜教研讨员暗示,新体系得到胜利的枢纽正在于经由过程差别方法来考虑那一成绩。那一体系没有再操纵可视元素,即语言者嘴型的变革来锻炼野生智能,而是每次皆处置一全部句子。那使得野生智能能够教会单词对应于甚么样的嘴型变革。

为了锻炼那一体系,研讨员背野生智能展现了2.9万条带笔墨标签的视频,每段视频少度为3秒。而为了察看专业唇语浏览者做得怎样,该团队借约请了“牛津门生残徐人社团”的3名成员,用300条随机视频来停止相似的测试。那些专家的均匀毛病率为47.7%,而野生智能的毛病率只要6.6%。

虽然那一项目获得了胜利,但也表露出了今世野生智能研讨的范围。正在指点野生智能怎样浏览唇语的过程当中,牛津年夜教团队利用了颠末设想的视频。视频中的一切人物皆里背火线,光芒亮堂,道出尺度构造的语句。

视频中的典范语句时少为3秒钟,比方:“Place blue in m 1 soon。”那此中包罗号令、色彩、介词、字母、数字,和副词。一切语句皆接纳如许的形式。因而,野生智能的超下精确率只是正在一种极度状况下获得的。假如请求野生智能从随机的YouTube视频中浏览唇语,那末成果能够很禁绝确。

有其他研讨职员指出,操纵这类特别视频来锻炼其实不契合实在天下场景。不外,论文做者北多·德弗雷塔斯(Nando de Freitas)为本人的功效停止了辩解。他指出,该团队曾测验考试过其他视频,但那些视频带去了太多“乐音”。那些视频各没有不异,因而野生智能没法获得故意义的结论。那也意味着,完善的数据散能够其实不存正在。德弗雷塔斯以为,思索到那一野生智能的精确率,终极状况怎样将与决于使命自己。

OpenAI的杰克·克推克(Jack Clark)暗示,假如期望正在理想天下中获得使用,那末那一野生智能借需求三圆里的劣化:人们正在理想天下场景中大批的语言视频;让野生智能能够从多个差别角度来浏览唇语;和让野生智能可猜测的短语范例更多样化。

克推克暗示:“那项手艺具有不言而喻的使用,但那看起去仿佛其实不能够。”假如野生智能能够教会浏览唇语,那末将合用于多种场景。此类体系能够被用于协助听力停滞人士理解四周发作的对话,或是让其别人工智能更好天分辨视频中的声音,天生精确的字幕。(编译/陈桦)

出色视频保举

主动播铺开闭 主动播放

好国斯坦祸教霸掀秘,十年后的脚机居然少如许?

正正在减载...
< >

    保举:存眷“AI世代”微旌旗灯号(tencentAI),复兴“麦肯锡”可得到《2030年出止市场会怎样?》;复兴“创业陈述”,可得到好国《AI创业指北》;复兴“斯坦祸”,可得到《2030年的野生智能取糊口》。复兴“利剑宫”,可得到利剑宫《好国AI计谋陈述》。

    DeepMind近来做了个新硬件 它能读懂唇语

    • 0
      粉丝
    • 1224
      阅读
    • 0
      回复

    关注世界总裁网

    扫描关注,了解最新资讯

    实时了解财经信息
    掌握市场风云动态
    助力商场共赢至胜
    改变你所看到的世界
    热门资讯
    排行榜

    关注我们: 微信订阅&APP下载

    发现价值 创造价值

    WNCEO.COM

    世界总裁网版权所有 未经世界总裁网书面授权禁止复制或建立镜像内容

    Email: service@wnceo.com 电话: 010-86398086 / 400-848-6648

    地址: 北京市朝阳区广渠路36号首城国际大厦10层 邮编: 100010

    Copyright  ©2008-2025 世界总裁网All rights reserved. 工信部许可备案号:京ICP备12045339号-2