价值无所不在,世界财经资讯媒体平台。
手机版
访问手机版
世界总裁网 首页 头条资讯 世界企业 新闻内容

Stable Audio 2.5企业级音频生成AI模型发布,号称“3分钟曲目2 秒钟完成”

发布时间: 2025-9-16 14:21| 发布者: wangjing| 查看: 159| 评论: 0

摘要: 9 月 14 日消息,Stability AI 现已正式发布企业级音频生成模型 Stable Audio 2.5,相对上一代主要围绕音频细节、生成速度方面进行提升,号称“仅需 2 秒钟即可创建 3 分钟音频曲目”。据介绍,Stable Audio 2.5 的 ...
  9 月 14 日动静,Stability AI 现已正式公布企业级音频天生模子 Stable Audio 2.5,相对上一代次要环绕音频细节、天生速率圆里停止提拔,号称“仅需 2 秒钟便可创立 3 分钟音频直目”。

据引见,Stable Audio 2.5 的中心改良集合正在音乐天生才能圆里,号称天生成果愈加揭开实践编直逻辑,可显现前奏、开展取末端等完好多段式构造。同时新模子对提醒词的了解更加精确,特别正在感情形貌战音乐气势派头辞汇的掌握上,呼应更契合预期。

别的,新版模子借明显改良了音频天生速率,Stability AI 称那次要得益于研收团队提出的后锻炼办法 ARC(IT之家注:Adversarial Relativistic-Contrastive),那一手艺经由过程分离相对式对立锻炼取比照鉴别器,加快分散模子的天生历程,可正在包管音轨量量的同时明显低落 GPU 推理耗时,从而完成 2 秒钟天生少达 3 分钟的音频内乱容

除此以外,Stable Audio 2.5 借新删了音频建补才能,用户能够导进本人的音频文件,并指定“延展地位”,模子便可按照音频前后内乱容及团体直风,将音频一键“耽误”,出格合适剪辑等场景

今朝,Stable Audio 2.5 已可经由过程 StableAudio 民网间接试用,同时撑持当地化布置。不外民圆划定,用户上传的音频文件没有得包罗受版权庇护的内乱容,StableAudio 网站将操纵自带的内乱容辨认体系停止检测,以确保没有进犯别人版权。

  • 0
    粉丝
  • 159
    阅读
  • 0
    回复

关注世界总裁网

扫描关注,了解最新资讯

实时了解财经信息
掌握市场风云动态
助力商场共赢至胜
改变你所看到的世界
热门资讯
排行榜

关注我们: 微信订阅&APP下载

发现价值 创造价值

WNCEO.COM

世界总裁网版权所有 未经世界总裁网书面授权禁止复制或建立镜像内容

Email: service@wnceo.com 电话: 010-86398086 / 400-848-6648

地址: 北京市朝阳区广渠路36号首城国际大厦10层 邮编: 100010

Copyright  ©2008-2025 世界总裁网All rights reserved. 工信部许可备案号:京ICP备12045339号-2