价值无处不在,世界财经资讯媒体平台。
手机版
访问手机版
世界总裁网 首页 头条资讯 科技世界 新闻内容

英伟达推全新视觉语音模型NVEagle,可以看图聊天

发布时间: 2024-9-12 23:03| 发布者: wangjing| 查看: 80370| 评论: 0

摘要: 据英伟达官方消息,英伟达联合 Georgia Tech、UMD 和 HKPU 的研究团队推出了全新的视觉语言模型 ——NVEagle。据悉,NVEagle 能够理解复杂的现实场景,通过视觉输入进行更好的解读和回应。它的设计核心在于将图像转 ...
 据英伟达民圆动静,英伟达结合 Georgia Tech、UMD 战 HKPU 的研讨团队推出了齐新的视觉言语模子 ——NVEagle。

据悉,NVEagle 可以了解庞大的理想场景,经由过程视觉输进停止更好的解读战回应。它的设想中心正在于将图象转化为视觉标识表记标帜,再取文本嵌进相分离,进而提拔了对视觉疑息的了解。NVEagle包罗了三个版本:Eagle-X5-7B、Eagle-X5-13B 和 Eagle-X5-13B-Chat。此中,7B 战13B 版本次要用于普通的视觉言语使命,而13B-Chat 版本则特地针对对话式 AI 停止了微调,可以更好天停止基于视觉输进的互动。

NVEagle 的一个明面正在于接纳了混淆专家(MoE)机造,可以按照差别使命静态挑选最适宜的视觉编码器,那极年夜提拔了对庞大视觉疑息的处置才能。该模子已正在 Hugging Face 上公布,便利研讨职员战开辟者利用。

  • 0
    粉丝
  • 80370
    阅读
  • 0
    回复

关注世界总裁网

扫描关注,了解最新资讯

实时了解财经信息
掌握市场风云动态
助力商场共赢至胜
改变你所看到的世界
热门资讯
排行榜

关注我们: 微信订阅&APP下载

发现价值 创造价值

WNCEO.COM

世界总裁网版权所有 未经世界总裁网书面授权禁止复制或建立镜像内容

Email: service@wnceo.com 电话: 010-86398086 / 400-848-6648

地址: 北京市朝阳区广渠路36号首城国际大厦10层 邮编: 100010

Copyright  ©2008-2025 世界总裁网All rights reserved. 工信部许可备案号:京ICP备12045339号-2