IT之家 2 月 18 日动静,亚马逊野生智能研讨团队颁布发表开辟了一个据称是史上最年夜的文本转语音模子,该模子具有最多的参数,并利用了最年夜的锻炼数据散。研讨职员曾经正在 arXiv 预印本效劳器上揭晓了一篇论文,具体形貌了模子的开辟战锻炼历程。 比年去,像 ChatGPT 如许的“年夜型言语模子”凭仗其智能答复成绩战天生初级文本的才能而备受存眷。但是,野生智能也正在逐渐融进其他支流使用范畴。正在那个新项目中,研讨职员测验考试经由过程增长参数数目战扩大锻炼数据散去提拔文本转语音使用的才能。 据IT之家理解,那个名为“可扩大流式文本转语音模子”(BASE TTS)的新模子具有 9.8 亿个参数,并利用 10 万小时的灌音(去自大众网站)停止锻炼,此中年夜部门为英语语音。研讨职员借背模子供给了其他言语的单词战短语示例,使其可以准确收音一些常睹的表达,比方“au contraire” 战 “adios, amigo”。 亚马逊团队借测试了利用较小数据散的模子,期望能从中发明野生智能范畴所道的“出现才能”。这类才能是指野生智能使用,不管是年夜型言语模子仍是文本转语音模子,忽然打破到更下智能程度的征象。他们发明,关于文本转语音使用而行,这类奔腾发作正在参数目到达 1.5 亿的中型数据散上。 研讨职员借指出,这类奔腾触及一系列言语属性,比方利用复开名词、表达感情、利用中语词、使用语音教战标面标记和准确夸大句子中的枢纽词等才能。 研讨团队暗示,出于对潜伏滥用风险的担心,BASE TTS 将没有会背公家开放,他们方案将其做为进修使用,并希冀将教到的常识使用于改进文本转语音使用的团体音量。 1、转载或引用本网站内容须注明原网址,并标明本网站网址(https://www.wnceo.com)。 2、本网站部分投稿来源于“网友”,文章内容请反复甄别。若涉及侵权请移步网站底部问题反馈进行反映。 3、对于不当转载或引用本网站内容而引起的民事纷争、行政处理或其他损失,本网站不承担责任。 4、对不遵守本声明或其他违法、恶意使用本网站内容者,本网站保留追究其法律责任的权利。 |