价值无处不在,世界财经资讯媒体平台。
手机版
访问手机版
世界总裁网 首页 头条资讯 科技世界 新闻内容

国产开源大模型,起风了

发布时间: 2023-12-2 08:53| 发布者: wangjing| 查看: 20525| 评论: 0

摘要: 大模型从来不是越大越好,而是越合适越好,正如周靖人所说,「未来,一定不是one size fits all」。撰文|于玮琳科技的浪潮几十年一个轮回,不同的剧本却总是响起相似的鼓点。如果说,一年前ChatGPT的惊艳现身,是属 ...
 

年夜模子历来没有是越年夜越好,而是越适宜越好,正如周靖人所道,「将来,必然没有是one size fits all」。

撰文|于玮琳

科技的海潮几十年一个循环,差别的脚本却老是响起类似的饱面。

假如道,一年前ChatGPT的冷艳现身,是属于年夜模子时期的「iPhone时辰」;那末,7月间Meta将Llama2开源,则被以为是推开了年夜模子时期的IOS取安卓之争。

但区分于挪动互联网时期,年夜模子的起跑线上,没有是众头的桂林一枝,而是列国厂商的万马齐喑。正在Open AI演出「奥特曼来哪女」的年夜戏时,愈来愈多国产厂商磨刀霍霍,酝酿着一场开源年夜模子时期的飓风。

正现在年9月百川智能颁布发表开源年夜模子Baichuan2-7B等版本时,开创人王小川的自大讲话:「从明天开端,当我公布Baichuan2以后,再用LLaMA2做为一个开源模子的时期曾经已往了。」

加快奔驰的近没有行百川一家,如阿里云、智谱AI战浑华EKG皆挑选了开源道路。便正在12月的第一天,做为海内尾家开源的科技年夜厂,阿里云再次背止业投出了一枚「重磅炸弹」,其颁布发表开源通义千问720亿参数模子Qwen-72B、18亿参数模子Qwen-1.8B战音频年夜模子Qwen-Audio。

那意味着,通义千问的开源年夜模子矩阵再次扩容,实正完成了「齐尺微暇、齐模态」开源。

没有好看出,「开源、开放」是远期阿里云几次夸大的枢纽词。便正在一个月前的云栖年夜会上,阿里巴巴团体董事会主席蔡崇疑曾夸大,「跟着年夜模子手艺的疾速开展,智能化时期正正在开启,阿里云要挨制AI时期一朵最开放的云。」

齐尺微暇参数年夜模子的开源印证了那一决计,那关于创业者战开辟者而行带去的影响是宏大的。性价比、机能、死态繁华,曾经模糊让他们看到了属于本人止业的「偶面」一角。

正如业内助士遍及认同的,将来90%的企业会偏向基于开源年夜模子开展。从科研到创业再到千止百业的开辟者,依托于开源死态,迎去属于那个时期的「智能出现」。

1

开源闭源,谁是结局?

「念勤奋进修,又掌握没有住念玩游戏」。

「看起去您对进修有热忱,但也有些苍茫,有无订定一个进修方案呢?」

以上酷似心思征询的对话,发作正在一款心思安康年夜模子「MindChat闲谈」上,其研收团队为华东理工年夜教·X-D Lab(心动尝试室)。

「孤单是一种遍及的社会感情」,团队成员颜鑫道,「心思效劳正在全部社会有很年夜的需供空间,但供应匮累」。

而依托年夜模子使用的降天,科研事情者正正在把心思征询变得普惠,从豪侈品酿成经常使用品。其驱动力,根据颜鑫的话道,是「为场景找手艺」,而非「为手艺找场景」。

不管开源仍是闭源,年夜模子手艺途径的挑选怎样,皆离没有收场景降天的结局应战。正如阿里云CTO周靖人所行「明天闭源、开源皆是一种手腕,枢纽是明天怎样可以让那些模子,快速使用正在林林总总的场景内里。」

不成承认的是,固然开源闭源并不是单选题,但关于开辟者战止业创业者等B端用户来讲,开源的劣势不言而喻。

从颜鑫团队的使用去看,正在重视隐公的医疗、心思场景,开源年夜模子更契合公有化布置的需供,而关于有鹿科技地点的具身机械人范畴来讲,开源意味着能够跟着止业开展、需供变革而灵敏调解的能够性。

做为专注于年夜模子+具身智能范畴的科技立异企业,有鹿当前的客户次要集合正在干净范畴战新能源范畴。

拿干净机械人来讲,市情上尽年夜大都的相干机械人只能停止机器化的齐笼盖打扫。但拆载了年夜言语模子的机械人,则能够对物理天下有着更明晰的了解,那带去的是真实的「智能」呼应。

举个例子,当物业司理道:「一号楼门前有个可乐瓶,您去扫一扫。」看似简朴的指令需求机械人了解甚么是「门前」,可以辨别「火瓶」、「矿泉火瓶」战「可乐瓶」,最初正在粗准功课目的的指引下,计划出明晰的功课轨迹。

「当机械人出有法子了解人类那一串形貌代表甚么时,它便出有法子完成我们所期望它正在物理天下到达的智能性程度,那是有鹿机械人战通义的最年夜分离面。」有鹿开创人陈俊波道,「我们需求的没有是一个原封不动的、智能性程度的年夜言语模子,而是跟着数据的积聚,能变得愈来愈智慧的年夜言语模子。闭源年夜模子明显做没有到那一面。正在我们的业态内里,结局必然是开源模子。」

从PC时期的Windows战Linux,到挪动互联网的安卓战IOS,再到SaaS开展史上的开源闭源之争,汗青老是重复演出。

闭源的阵营下举着「简朴易用」的旗号,ChatGPT挺身站正在阵前,成为「群众出名度」的代表。而正在开源的阵营里,是无能否认的开放性死态劣势,和更低的利用本钱,成为各止各业触摸时期脉搏的捷径地点。

最曲不雅的例子是OpenAI,业内助士流露,年夜模子锻炼战运转消耗宏大的算力资本战数据,仅正在2022年,OpenAI 合计破费便到达了5.4亿美圆,而其发生的支出只要2800万美圆——那是止业使用者没法承受的投进产出比。

明显的比照是,正在12月1号的通义千问公布会上,一名小我私家开辟者土土暗示,他正在用一种很省钱的方法玩开源模子。「正在家里购个效劳器、扔三四块隐卡上来,下载Qwen、让它正在效劳器上运转,再弄个FRP反背代办署理,从阿里云上购最自制的30多块钱一个多月的效劳便止,如许就可以经由过程中网会见家里的效劳器,正在单元里也能用通义千问做尝试。」

2

开源,没有是一味供年夜

7月19日,Meta的Llama2颁布发表开源,「可商用」三个字引爆了年夜模子创业圈,开源渐成支流趋向,猎豹挪动CEO傅衰以至感慨,「有的人哭晕正在茅厕,而有的人正在梦中也能笑醉」。

年夜模子加快贸易化时期到去,国内中风云搅动,但输赢近已发表。

据「深网腾讯消息」报导,愈来愈多创业者以为,比拟Llama2特别是Llama2的汉化版本,海内开源年夜模子的程度战才能实在八两半斤。而固然Llama2的预锻炼数据比拟第一代扩展了一倍,但中文预锻炼数据的比例仍然少的不幸,仅为0.13%。

中文才能以外,另外一个理想是,锻炼Llama2其实不自制,HuggingFace机械进修科教家内乱森·兰伯特预算,Llama 2的锻炼本钱能够超越2500万美圆,没有比OpenAI三年前锻炼GPT-3的破费少。

以上各种,皆给国产厂商的开源年夜模子留下了时机窗心。机能参数、性价比、牢靠性,正成为抢占先机的枢纽词。

仅仅正在已往的一个月内乱,海内最年夜开源模子的参数记载便被革新了N次。

从元象XVERSE开源650亿参数下机能通用年夜模子XVERSE-65B;到海潮疑息公布完整开源且可免费商用的源2.0根底年夜模子,包罗1026亿、518亿、21亿差别参数范围;再到阿里云正式开源了通义千问720亿参数的年夜模子Qwen-72B。

此中,Qwen-72B持续通义千问预锻炼模子一向以去的强势表示,正在10个威望测评散夺得开源模子最劣成就,正在部门测评中逾越闭源的GPT-3.5战GPT-4。

国产年夜模子厂商猖獗背上摸下,但参数尺微暇近没有是开源年夜模子的最枢纽目标。关于止业客户而行,他们要思索的更多。

以颜鑫地点的心思教科研团队来讲,正在做模子选型时,最少要思索三个成绩:能否可连续?能否有死态?和能否满意场景需供?

科研团队出有资本重新锻炼根底模子,但科研需求连续投进,为跟风、吃盈余而死的年夜模子不成连续。而支流的、不变的模子架构,能最年夜限度阐扬死态的力气,婚配高低游的情况。而从那两面动身,背靠阿里死态的通义千问成了下分候选者。

别的,心思范畴需求温顺、知性、能共情的年夜模子;教诲年夜模子要有丰硕的常识、优良的计较才能战挪用内部东西的才能。颜鑫报告我们一个风趣的征象,做为野生智能的代表,差别厂家的模子性情各别,从常识构造来讲,有的模子像理科死,而通义千问更像文科死。那同样成为他们终极成立协作的枢纽身分。

究竟上,年夜模子历来没有是越年夜越好,而是越适宜越好,正如周靖人此前所道,「将来,必然没有是one size fits all」,差别的场景适配差别的参数,差别的情势,届时年夜模子将走过文明发展阶段,去到粗耕细做。

「开源模子有各类尺微暇,总有一款合适您,假如试过当前发明一切的模子皆不可,那能够那个需供原来便没有建立。」将来速率开创人秦绝业的创业标的目的是散布式推理框架。

正在效劳客户的过程当中,他发明,今朝用户年夜部门皆是用13B以下较小尺微暇的模子。如中接常识库做问容许用等,完整够用;假如需求具有必然的逻辑推理才能的模子,20-30B的中等尺微暇模子是比力好的挑选。正在Agent大概需求壮大推理才能的场景中,70B+年夜模子更有劣势。

年夜模子百花齐放,而创业者各与所需。那必然水平上注释了为何通义千问公布会夸大的是「齐尺微暇」、「齐模态」,Qwen-72B「背上摸下」,Qwen-1.8B则「背下探底」,成为市情上尺微暇最小的中国开源年夜模子,那意味着其推理所需的最小隐存没有到1.5GB,完成了正在脚机等消耗级末端布置。

另外一个维度则是正在感民上完成「能看」也「能听」。

继本年8月,通义千问开源了视觉了解年夜模子Qwen-VL以后,本次除LLM以外,通义千问团队初次开源了音频了解年夜模子Qwen-Audio。差别于仅能处置人声旌旗灯号的传统语音模子,也可以感知战了解人声、天然声、植物声、音乐声等各种语音旌旗灯号。

3

成绩最开放的一朵云?

被毁为开源活动的圣经,埃里克·斯蒂芬·雷受所撰写的《年夜教堂取散市》中有如许一段表述:

Linux具有推翻性。五年前(1991年),谁曾念过一款天下级操纵体系会以云云奇异的方法降生,它由遍及环球、仅经由过程懦弱的互联网纽带毗连的数千名兼职开辟职员的勤奋构建而成。那完整出乎我的预料。

而那「出人意料」的故事,正在每个科技海潮中皆重复演出。

此前正在一份被以为是不测保守的文件中,一名谷歌的内乱部研讨职员暗示「我们出有护乡河,OpenAI也出有。」

而之以是会有如许的「醒悟」,便正在于一股不成小觑的第三圆力气「开源社区」,以此中的顶流Hugging Face为例,其供给的下量量开源模子取东西,最年夜限度天普惠了开辟者,低落了年夜模子的手艺门坎。

开放死态是不成顺的潮水趋向,典范的印证是,本年8月,Hugging Face得到了2.35亿美圆的新一轮融资,其背后的投资者是谷歌、亚马逊、英伟达、Salesforce、AMD、英特我、IBM 战下通。

而正在海内,阿里云是将开源死态停止的最为完全的年夜模子厂商。

究竟上,本次曾经是阿里云第四次推出免费的开源模子。而正在9月份,阿里云正在开源通义千问140亿参数模子 Qwen-14B和其对话模子Qwen-14B-Chat的同时,一并开放了相干的数据陈述,包罗取预锻炼、对齐等一系列模子锻炼历程有闭的数据、办法皆正在陈述中得以具体显现。

「不但单开源我们的模子,把陈述也分享给各人,可以让各人体验到模子形形色色的表示,更有用天协助各人停止模子的使用。」周靖人暗示。

早正在客岁11月,阿里云初次正在业界提出「Model as a Service」理念,并推出海内尾个AI模子社区「魔拆」,开辟者能够正在社区高低载开源AI模子,并间接挪用阿里云的算力战一站式的AI年夜模子锻炼及推理仄台。

仅仅正在一年后,云栖年夜会上阿里云给出的数据显现:魔拆社区已有超越2300个模子,开辟者超越280万,模子下载次数也超越了1亿屡次。

正在阿里云的愿景中,魔拆社区应是一个「自在市场」,模子消费者能够正在那里上传模子、考证手艺才能,探究使用场景战贸易化形式。

而如许的形式下,国产模子厂商之间没有再是相互合作的「孤岛」,据理解,百川智能的第一款 70 亿参数范围的中英文言语模子 Baichuan-7B,战130亿参数通用年夜言语模子Baichuan-13B-base战对话模子Baichuan-13B-Chat,均正在公布当天上架了魔拆社区,属于海内尾收。

开抱之木,死于毫终,九层之台,起于垒土。

下量量开源的根底年夜模子,正在开放死态的鞭策下不竭迭代劣化,进而鞭策AI使用的立异出现,那一整条明晰的贸易途径正悄悄构成增加飞轮,让AI普惠没有再是一句实行。

  • 0
    粉丝
  • 20525
    阅读
  • 0
    回复

关注世界总裁网

扫描关注,了解最新资讯

实时了解财经信息
掌握市场风云动态
助力商场共赢至胜
改变你所看到的世界
热门资讯
排行榜

关注我们: 微信订阅&APP下载

发现价值 创造价值

WNCEO.COM

世界总裁网版权所有 未经世界总裁网书面授权禁止复制或建立镜像内容

Email: service@wnceo.com 电话: +86-010-86398086

地址: 北京市朝阳区广渠路36号首城国际大厦10层 邮编: 100010

Copyright  ©2008-2024 世界总裁网All rights reserved. 工信部许可备案号:京ICP备12045339号-2