据英伟达民圆动静,英伟达结合 Georgia Tech、UMD 战 HKPU 的研讨团队推出了齐新的视觉言语模子 ——NVEagle。 据悉,NVEagle 可以了解庞大的理想场景,经由过程视觉输进停止更好的解读战回应。它的设想中心正在于将图象转化为视觉标识表记标帜,再取文本嵌进相分离,进而提拔了对视觉疑息的了解。NVEagle包罗了三个版本:Eagle-X5-7B、Eagle-X5-13B 和 Eagle-X5-13B-Chat。此中,7B 战13B 版本次要用于普通的视觉言语使命,而13B-Chat 版本则特地针对对话式 AI 停止了微调,可以更好天停止基于视觉输进的互动。 NVEagle 的一个明面正在于接纳了混淆专家(MoE)机造,可以按照差别使命静态挑选最适宜的视觉编码器,那极年夜提拔了对庞大视觉疑息的处置才能。该模子已正在 Hugging Face 上公布,便利研讨职员战开辟者利用。 1、转载或引用本网站内容须注明原网址,并标明本网站网址(https://www.wnceo.com)。 2、本网站部分投稿来源于“网友”,文章内容请反复甄别。若涉及侵权请移步网站底部问题反馈进行反映。 3、对于不当转载或引用本网站内容而引起的民事纷争、行政处理或其他损失,本网站不承担责任。 4、对不遵守本声明或其他违法、恶意使用本网站内容者,本网站保留追究其法律责任的权利。 |