价值无所不在,世界财经资讯媒体平台。
手机版
访问手机版
世界总裁网 首页 头条资讯 科技世界 新闻内容

外媒解密科技巨头为何竞相争夺用户语音数据

发布时间: 2016-12-18 05:03| 发布者: yanhuan| 查看: 1303| 评论: 0

摘要: 【世界总裁网编者按】 语言识别技术近期已经成为了众多科技厂商的攻坚重点,但如今许多内置智能语音助理设备的实际使用体验都不尽如人意。对此,《彭博社》日前就撰文对这一情况进行了一番剖析,并一针见血的指出语 ...

中媒解稀科技巨子为什么竞相争取用户语音数据

天下总裁网编者案】 言语辨认手艺远期曾经成了浩瀚科技厂商的攻脆重面,但现在很多内乱置智能语音助理装备的实践利用体验皆没有尽善尽美。对此,《彭专社》日前便撰文对那一状况停止了一番分析,并开门见山的指出语音辨认手艺的开展及其背后语音数据库的范围大概便是那类产物将来开展的命门地点。

以下是文章次要内乱容:

亚马逊Echo智能音箱的呈现将野生智能助理走进每家每户的胡想“险些”挨形成了理想,很多利用过Echo内乱置Alexa语音助理的用户城市被她所吸收。由于Alexa不只能协助用户呼唤Uber专车,借能预定披萨大概完成十年级门生的数教家庭功课。亚马逊民圆以至暗示,天天皆有超越5000人经由过程各类方法对Alexa“示爱”。

但正在另外一圆里,很多Alexa的用户也明白,除非您迟缓、明晰天道出本人的语音指令,不然Alexa很有能够又对您道“抱愧,我没法答复那个成绩”。一名用户便正在亚马逊网站上写讲:“我对她是又爱又恨,您很快便会教会经由过程她能了解的方法取之相同,但那便像是跟刚会走路的孩子语言一样使人懊丧。”

但是,那位用户仍旧给了Alexa五星好评。

正在已往几年间,语音辨认手艺曾经完成了少足前进,但仍不敷以让那项手艺融进到人们的一样平常糊口,大概开启让我们取汽车、洗衣机、电视机等电子产物睁开语音相同的人机互动新时期。最简朴的一个例子是,现在很多人仍会经由过程脚势战触摸的方法停止操纵,且那一趋向正在可预感的将来生怕皆没有会改动。

终究是甚么障碍了语音辨认手艺的开展?

该当道,那正在必然水平上源于语音辨认手艺背后的源动力野生智能仍有宏大上降空间而至。别的,有闭诸如差别言语、差别心音、差别圆行和那些言语正在喧闹情况中的言语数据缺得也是形成那一成绩的主要缘故原由。

以是,包罗亚马逊、苹果微硬百度皆活着界范畴内乱普遍搜集人类语音数据。此中,微硬曾经正在环球多个都会挨制了特地用于录造意愿者正在家居情况中对话内乱容的事情室;亚马逊每小时城市将Alexa搜集到的海量语音恳求上传到宏大的数据库;百度正正在搜集中国各天的圆行数据,然后操纵那些数据报告电脑该怎样阐发、了解、呼应差别的语音指令。

百度硅谷野生智能尝试室总监亚当-科茨(Adam Coates)以为,那一手艺的实正应战正在于寻觅一种能够捕获到天然形态下实在对话的方法,由于便算是95%的精确率也不敷以使人合意。

“我们的目的是将毛病率低落到1%,那一程度下我们才能够充实信赖机械可以了解我们所道的内乱容,而那也是反动性的成绩。”科茨道讲。

没有暂前,所谓的“语音辨认”手艺借十分没有成生。正在2006年一次里背阐发人战投资人的演示中,微硬晚期正在Windows中装备的语音辨认手艺便把“mom”听成了“aunt”。而正在苹果五年前推出Siri时,那一小我私家助理效劳一样由于没法呼应准确谜底或没法听浑成绩而备受讪笑。好比,正在被问及凶莉安-安德森(Gillian Anderson)是否是英国人时,Siri居然供给了一份英国餐馆列表。不外现在,微硬曾经宣称本人的语音引擎毛病率能够同专业速录员八两半斤,Siri垂垂博得了人们的尊敬,而Alexa的呈现则更是让我们窥睹了将来。

何谓数据为王

该当道,那一前进很年夜水平上需求回功于神经收集手艺的开展。简朴来讲,神经收集手艺是一种模仿人脑构造的野生智能手艺,便可以无需明白指令自教各类内乱容,但凡是也需求具有宏大、多样的数据内乱容。语音辨认引擎获得、阐发的数据越多便越能了解差别的声音,也便越靠近完成正在实在言语情况中睁开天然对话的目的。

百度尾席科教家吴恩达(Andrew Ng)暗示:“我们体系得到的数据越多,实在际表示便越好。语音辨认是一项本钱麋集型营业,今朝借出有几构造具有云云宏大的数据库。”

当科技企业上世纪90年月开端正视语音辨认手艺时,微硬等企业次要依托的皆是去自诸如Linguistics Data Consortium(该机构总部位于好国宾夕法僧亚年夜教,并获得了好国当局的撑持)等研讨机构供给的公然数据。尔后,科技企业才开端搜集本人的语音数据,此中一些企业以至搜集了意愿者朗诵的各类语音内乱容。如今,跟着语音掌握硬件愈来愈遭到欢送,那些企业也开端经由过程本人的产物战效劳搜集语音数据。

详细来讲,当您经由过程语音指令用脚机搜刮疑息、播放歌直或导航时,那些语音数据极可能会被科技企业搜集下去。而当您背Alexa讯问气候战近来的橄榄球赛比分时,她便会操纵那些语音指令改良本人的天然言语了解才能

“从产物设想的角度去看,您利用Alexa的次数越多,Alexa便会越智慧。”Alexa尾席科教家僧克-斯特罗姆(Nikko Strom)道讲。

两年夜应战

正在那一圆里,最枢纽的应战便是让语音辨认手艺熟习差别的言语、心音战圆行,那一成绩正在中国隐得尤其较着。为了搜集中国各天的圆行数据,百度正在本年秋节期启动了一项名为“圆行对话项目”(dialect conservation initiative)的营销方案。百度许诺,假如用户为该项目做出了奉献,他们此后即可利用本人的圆行取百度睁开互动。正在两周工夫内乱,百度录造了超越1000小时的圆行数据。并且,很多人皆情愿免费供给那些数据。此中,一名四川的下中西席便对该项目非常感爱好,他以至鼓舞齐班同窗用四川话录造了1000多尾古诗。

固然,那一手艺面对的别的一年夜应战是怎样正在喧闹的情况中辨认语音指令,便好比正在酒吧大概运动场情况中精确辨认语音指令。此前,微硬曾经正在Xbox上布置了一款名为“Voice Studio”的使用,特地搜集人们正在玩游戏或看影戏时的语音数据。而为了吸收用户供给本人正在玩游戏时分的对话内乱容,该公司借为到场此中的用户供给了林林总总的嘉奖,包罗面卡战游戏讲具。

据悉,那一项目正在巴西睁开的十分胜利,本地团队以至借正在Xbox主页上偏重推行了那款使用。随后,微硬操纵搜集到的那些数据胜利开辟出了巴西葡萄牙语版的Cortana语音助理,并于本年早些时分正式公布。

除此以外,很多企业也正在为特定利用情况设想共同的语音辨认体系。好比,微硬便正在测试能够没有受机场播送疑息滋扰的语音辨认体系,以更好的为游览者效劳。并且因为那一手艺能够疏忽喧闹的汽车声响、孩子们的啼声战“嗯嗯”等偶然义的白话,它以至借能够被用于麦当劳汽车穿越餐厅的主动面餐体系。同时,亚马逊现在也正在汽车上测试本人的语音辨认体系,并期望Alexa可以正在喧闹的门路情况下一般事情。

语音辨认的将来大概便正在拐角处

现在正在各年夜企业争相搜集语音数据同时,他们也正在勤奋寻觅操纵更少数据完成更下语音辨认精确率的办法。微硬尾席语音科教家黄雪冬(音译,Xuedong Huang)曾经正在公司处置了20余年语音辨认手艺开辟事情,他暗示:“麦当劳正正在测试的语音辨认手艺挪用的数据量其实不多,但精确性照旧很下。因而我们信赖,即使正在数据量有限的状况下也能够完成手艺打破。”

从那个角度来讲,谷歌(微专)却是不断信赖“少便是多”(less is more)的处事理念。该公司期望操纵没有知所云的声音去构建笔墨战短语,并拼接了数万段时少仅为2-5秒的语音片断。谷歌研讨员弗朗索瓦兹-比伦法斯(Francoise Beaufays)暗示,那一历程所需的计较资本更少,也更简单停止测试战修正。

取此同时,百度也正在开辟愈加下效的算法,以协助计较机正在进修一种言语后简化进修别的12种言语的易度。

“那一算法正在进修只要数万人把握的语种时隐得尤其主要,由于我们凡是很易针对如许的语种搜集到宏大的数据库。”吴恩达道讲。

但是,便算是吴恩达如许的专业人士皆没法答复“什么时候才气经由过程天然言语取数字助理交换,并获得合意谜底”如许的成绩。由于关于专业的神经收集教家来讲,那一手艺范畴仍有许多谜团出有找到谜底。从今朝人们把握的手艺战办法去看,那一手艺完成打破约莫借需求消耗数年工夫。

不外,吴恩达、黄雪冬战比伦法斯等科教家皆暗示,您永久没有明白下一次手艺打破会正在甚么时分呈现。(综开/汤姆)

保举:野生智能澎湃而去,将来已变!存眷“AI世代”微旌旗灯号(tencentAI),存眷将来。

中媒解稀科技巨子为什么竞相争取用户语音数据

  • 0
    粉丝
  • 1303
    阅读
  • 0
    回复

关注世界总裁网

扫描关注,了解最新资讯

实时了解财经信息
掌握市场风云动态
助力商场共赢至胜
改变你所看到的世界
热门资讯
排行榜

关注我们: 微信订阅&APP下载

发现价值 创造价值

WNCEO.COM

世界总裁网版权所有 未经世界总裁网书面授权禁止复制或建立镜像内容

Email: service@wnceo.com 电话: 010-86398086 / 400-848-6648

地址: 北京市朝阳区广渠路36号首城国际大厦10层 邮编: 100010

Copyright  ©2008-2025 世界总裁网All rights reserved. 工信部许可备案号:京ICP备12045339号-2