价值无处不在,世界财经资讯媒体平台。
手机版
访问手机版
世界总裁网 首页 人工智能 新闻内容

亚马逊开发出有史以来最大的文本转语音模型,展现“涌现能力”

发布时间: 2024-2-18 14:57| 发布者: wangjing| 查看: 9072| 评论: 0

摘要: IT之家 2 月 18 日消息,亚马逊人工智能研究团队宣布开发了一个据称是史上最大的文本转语音模型,该模型拥有最多的参数,并使用了最大的训练数据集。研究人员已经在 arXiv 预印本服务器上发表了一篇论文,详细描述了 ...
 IT之家 2 月 18 日动静,亚马逊野生智能研讨团队颁布发表开辟了一个据称是史上最年夜的文本转语音模子,该模子具有最多的参数,并利用了最年夜的锻炼数据散。研讨职员曾经正在 arXiv 预印本效劳器上揭晓了一篇论文,具体形貌了模子的开辟战锻炼历程。

比年去,像 ChatGPT 如许的“年夜型言语模子”凭仗其智能答复成绩战天生初级文本的才能而备受存眷。但是,野生智能也正在逐渐融进其他支流使用范畴。正在那个新项目中,研讨职员测验考试经由过程增长参数数目战扩大锻炼数据散去提拔文本转语音使用的才能。

据IT之家理解,那个名为“可扩大流式文本转语音模子”(BASE TTS)的新模子具有 9.8 亿个参数,并利用 10 万小时的灌音(去自大众网站)停止锻炼,此中年夜部门为英语语音。研讨职员借背模子供给了其他言语的单词战短语示例,使其可以准确收音一些常睹的表达,比方“au contraire” 战 “adios, amigo”。

亚马逊团队借测试了利用较小数据散的模子,期望能从中发明野生智能范畴所道的“出现才能”。这类才能是指野生智能使用,不管是年夜型言语模子仍是文本转语音模子,忽然打破到更下智能程度的征象。他们发明,关于文本转语音使用而行,这类奔腾发作正在参数目到达 1.5 亿的中型数据散上。

研讨职员借指出,这类奔腾触及一系列言语属性,比方利用复开名词、表达感情、利用中语词、使用语音教战标面标记和准确夸大句子中的枢纽词等才能。

研讨团队暗示,出于对潜伏滥用风险的担心,BASE TTS 将没有会背公家开放,他们方案将其做为进修使用,并希冀将教到的常识使用于改进文本转语音使用的团体音量。

  • 0
    粉丝
  • 9072
    阅读
  • 0
    回复

关注世界总裁网

扫描关注,了解最新资讯

实时了解财经信息
掌握市场风云动态
助力商场共赢至胜
改变你所看到的世界
热门资讯
排行榜

关注我们: 微信订阅&APP下载

发现价值 创造价值

WNCEO.COM

世界总裁网版权所有 未经世界总裁网书面授权禁止复制或建立镜像内容

Email: service@wnceo.com 电话: 010-86398086 / 400-848-6648

地址: 北京市朝阳区广渠路36号首城国际大厦10层 邮编: 100010

Copyright  ©2008-2025 世界总裁网All rights reserved. 工信部许可备案号:京ICP备12045339号-2