神马影视神马影视

AI“源神”启动!影响多大?

AI“源神”启动!影响多大?

开源还是(shì)闭源?这是属于大模型的时代之问。

今年年初,埃(āi)隆(lóng)·马斯克(kè)在对(duì)OpenAI及其CEO萨姆·奥特曼提起诉讼时,就对OpenAI逐渐不公开其模型研究相关细节的行为大加谴责。“时至(zhì)今日,OpenAI公(gōng)司网站还宣称,它的宗旨是确保通用人(rén)工智能造福全(quán)人类。然而,在现实中,OpenAI已(yǐ)经转变为科技(jì)巨头(tóu)微软(ruǎn)事(shì)实上的闭源子公司(sī)。”这 位曾经(jīng)的OpenAI联合创始(shǐ)人如(rú)此(cǐ)表(biǎo)示。

OpenAI不够“Open”,Meta却“Open”了(le)自己最新的开源(yuán)人工(gōng)智能模型。

4月18日(rì),Meta 发(fā)布了其最 新(xīn)版本的开源大模型 Llama 3,引起开源AI社区的一阵欢呼。巧合(hé)的(de)是,Llama 3发布(bù)当天正好是AI领域顶尖(jiān)学者、AI开源倡导者吴恩达的生日。“(Llama 3是)至今为止最好(hǎo)的礼物,谢感谢Meta!”他说。

行至2024,开(kāi)闭源之争日渐白热化(huà)。闭(bì)源阵营以目(mù)前最(zuì)强的OpenAI为代表,开源阵营Meta的LLaMa、Mistral和(hé)Google等也(yě)在不(bù)断迭(dié)代(dài)。闭源(yuán)阵营坚持对Scali沪股通上一交易日加仓163只科创板股ng Law的信仰 ,押注在(zài)更(gèng)强(qiáng)通用模(mó)型的(de)打造上(shàng);开源阵营模型能力不断提升,并且强调以更(gèng)垂直的(de)性(xìng)能、更灵活的配(pèi)置来推动大模型(xíng)商业化落地。

关于应(yīng)该选择模型开源还是闭源讨论经 久不息。

对于(yú)局内人,这一选择 这不仅决(jué)定了他们将如何点亮AI“科技树”,更将影响他们的商业路线选择。换 言之,这很有(yǒu)可能是这个残酷竞争市场下的生存问题。

两个版本,多重惊喜

Meta此次发布的Llame 3包括8B和70B的预训练和指令微调版本。

据Meta官网信息,Llama 3 模型将数(shù)据(jù)和规模提升到新的(de)高度。它在两个定制24K GPU集群上基(jī)于超(chāo)过 15T 的数据进行了训练沪股通上一交易日加仓163只科创板股——训 练(liàn)数(shù)据(jù)集是Llame 2使用量的7倍(bèi)有余。它支持 8K 上下 文长度,是 Llama 2 容量的两倍。

除了(le) Llama 3,Meta 还发布(bù)了(le)新(xīn)的信任和安全工具,包括Llama Guard 2、Code Shield和 CyberSec Eval 2。

据悉,Llama 3 即将在AWS(Amazon web service)、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、 Microsoft Azure等(děng)主(zhǔ)要云提供(gōng)商(shāng)、模型 API 提供商(shāng)平台上线,Llama还得到AMD、AWS、戴尔、英特尔、NVIDIA和(hé)高通提供的硬(yìng)件平台的支持。

在官网上,Meta还放出了Llama3两个版本与谷歌Gemma、谷歌Gemini、Mistral、Anthropic的Claude 3等竞争对手的参数(shù)对比。据Meta官网,Llame3在MMLU(学科知识理解)、GPQA(一般问题)、HumanEval(代码能力)、GSM—8K(数学能力)、MATH(比较难(nán)的数学(xué)问题)5个评测集上均表(biǎo)现良好。

值得注意的是,Llama3的(de)代(dài)码能力非常优秀。在AI领域公众号“数字(zì)生命卡兹克”主理人卡兹克(kè)分享的(de)用户实测中,Llama3—8B能够给出国际(jì)象棋中经(jīng)典皇后问题的解题代码(mǎ)。而其前(qián)代版本Llama2需要(yào)专门的代码模型才能实现(xiàn)。

市场的反应(yīng)速度很快。18日(rì)当天,Meta股价逆势收涨1.54%。次日,百度智能云(yún)千帆(fān)大模型(xíng)平台开放(fàng)邀约测试,提供针对Llama 3的训练推理方(fāng)案,帮助开发者训练专属 大模型。

8B和70B 两个型(xíng)号的模型,仅仅标志着 Llama 3 系列的开端,Meta AI首席科学家杨立昆在其社交媒体透(tòu)露,在接下来的几个月,还会有(yǒu)更多版本(běn)陆续发布。

英伟达(dá)高级(jí)科学家Jim Fan认为之后可能会发布的(de)Llama 3-400B以上的版本(běn)将成为(wèi)某种(zhǒng)“分水岭”,开源社区将(jiāng)能用上GPT-4级(jí)别的模型。

不(bù)下牌桌,各显神通

上一轮元宇宙竞(jìng)争中被认为(wèi)可能跌进坑里的Meta,在人工智能(néng)的牌桌上打出(chū)了Llama系列这把好牌(pái)。要讨论Llama3带来的行业震荡(dàng),首先要明白,什么是大模型领域的 开源(yuán)?

大模型领域的开源通常意味着模型的架构、训 练代码和预训练权重等(děng)都被公开,允许研(yán)究(jiū)人(rén)员和开发者自由地访问和使用。

不过(guò),开源的程度因模(mó)型而异。“有(yǒu)些可能只提供有限的访问(wèn)权限或(huò)部分代码。”郭涛指出,判断大模型是否真正开源(yuán)的基准可能包括:代码和数据的可访问性、使(shǐ)用(yòng)许可的宽松程度、社区(qū)支持的活跃度以及对改(gǎi)进(jìn)和新应用的开放性。

放眼AI界(jiè),两条路径上(shàng)都各有(yǒu)“头号玩家”分布。闭源自不必(bì)说,海外(wài)有OpenAI旗下的ChatGPT,国内是百度的文心一(yī)言以及风头(tóu)正劲 的月之暗面(miàn)Kimi。

而开源(yuán)方面,除了Llama系列,目前应用较广的(de)开源大模型还(hái)包括非营利组织LAION推出的OpenFlamingo、Databricks的Dolly,以及MosaicML的MPT等。国内则包括,阿里巴巴的通义(yì)千(qiān)问,智(zhì)谱的(de)ChatGLM-4、百川智能的baichuan-7B中(zhōng)英文大模型、北京(jīng)智源悟(wù)道3.0大(dà)模型系列和面壁智能的CPM-Bee 10B中文基座大模型等。

形成这(zhè)样的分(fēn)化(huà),很多时候(hòu)是受技术进步和商业模式迭代等的多重影响。

天使投资 人(rén)、资深人工智能专(zhuān)家郭涛认为,从技术角度来看,开源可以促进学术界的研究和创新,而闭源则有助于在一定时间内保持技术领先优势。

从商业角度(dù)来看,开源可以吸引开(kāi)发者(zhě)社区的贡(gòng)献,促(cù)进技术的快速迭代(dài)和应用的广泛传播,但可能会(huì)影响到公(gōng)司的盈利模式。闭源则可 以保护知识(shí)产权,为公司创造(zào)直接的收入来源(yuán),但可能会限制技术的普(pǔ)及和生态(tài)的建(jiàn)设。

事实上,在Llama3发布之 前,中文互(hù)联网刚刚经历(lì)了一(yī)轮开闭源 论战。

据(jù)媒(méi)体报道,百度(dù)CEO李彦宏近日表态,认为大模型开(kāi)源意义不大,闭源模型性能会不断提(tí)升。“有了文心大模型(xíng)4.0,我们可以根据需要兼顾效果、响(xiǎng)应速(sù)度、推理成本等(děng)各种考虑,裁剪出适合(hé)各种场景的更(gèng)小尺寸模型,且支(zhī)持精调和post pretrain。通过降维裁剪(jiǎn)出的模型,比直接拿开源调出来的模型(xíng),同等尺寸下效果更好,同等效果下成(chéng)本明显(xiǎn)更低。”

李彦宏(hóng)一直是闭源路线的(de)忠实拥趸,理由包括(kuò)但不限于认可闭源商业模式可以更(gèng)好地(dì)聚(jù)集(jí)人力和财力等。

而 其反对者(zhě)——360创(chuàng)始人周鸿祎言简意赅,“一句话,今天没有开源就没有 Linux,没有 Linux 就 没(méi)有互联网。”

“源神”启动,影响几何?

“Llama 3的发布会带来市场格局的改变(biàn)。”郭(guō)涛在接受21记者采访时指(zhǐ)出,其优(yōu)异表现可能吸引更多的用户和投资者,从而增加其市场份额。

官网显示,Llama 3将有条件地开源给商业使用(月活用户超过7亿需要单独申请)。“不过这基(jī)本等于完全(quán)免费商用了。”卡兹克(kè)表示。

此前,投资人朱啸虎曾经就人工智能市场相关话题接受腾讯新闻采访。当被问及2023年大模型发展的关键节(jié)点时,他给出的回答(dá)正是(shì)Llama上线(xiàn)。这让中国(guó)在应用(yòng)层面创新有了(le)基础,降低了商(shāng)业化门槛。

当然,朱啸虎提(tí)到的变现是(shì)指开源(yuán)生态内的(de)用(yòng)户。对于开源大模型(xíng)发(fā)布者的能否盈利,或者能等来盈(yíng)利机会,很多(duō)时候并没有确定的答案。

闭源(yuán)大模型通常通过授权使用、订阅(yuè)服(fú)务或者直接(jiē)销售产品来盈利。其中的代表便是AI领域的领跑者OpenAI,虽然其一直有(yǒu)推(tuī)进开源项目的动作,但其(qí)处在核(hé)心地位(wèi)的(de)ChatGPT却一直(zhí)采取收(shōu)取API许可费的方式(shì)向其他公(gōng)司提供服务。在API服务过程,其他公司不会接(jiē)触到ChatGPT模型的细节和源代码,仅(jǐn)仅通过API接(jiē)口进行调(diào)用。

创(chuàng)业者(zhě)服务平台GoDaddy对全美1003家小型企业的调查(chá)数据显(xiǎn)示,ChatGPT以70%的应用率成为美 国小型企业应用最多的生成式AI产品,这说明OpenAI选择的闭源模式(shì)的商业化之路在一定程度已(yǐ)经跑通(tōng)。

开源模型如何寻求(qiú)生存和发展(zhǎn)的机(jī)会(huì)?

首先是以开放的生态吸引用户(hù)。国盛(shèng)证券研报就指出,开源(yuán)大模型借助更大标识符训(xùn)练(liàn)数据集、DeepSpeed、RLHF等方式,实现低训练成(chéng)本和高性能,超大模型以下大模型的壁垒正在消(xiāo)失。

“在拥有用户后,开源大模(mó)型通常(cháng)通过提 供增值服(fú)务、定制开发、技术支持等方式来实现(xiàn)盈(yíng)利”。郭(guō)涛(tāo)指出(chū),公司(sī)可以在开源(yuán)模型的基础上提供专业的训练服务或者定 制化的应(yīng)用解决方案。

对于Meta甚(shèn)至众多开源者而言,开源的(de)野心不仅是短期(qī)的商(shāng)业变现(xiàn),其更想引领规则设(shè)计以及(jí)搭建(jiàn)生态。有业内专家分析,开源后壁垒并没有那么容易破除,高质量、标注过的训练数据集尤其是专(zhuān)业模型的壁垒。

星(xīng)纪魅族(zú)集团数据合(hé)规执行总监(jiān)朱玲凤表示(shì),目前有些开(kāi)源(yuán)AI由头部公司主导,“越多人使用,就越能(néng)强化网格效应,而且不是真正的开放 ,后续需 要使(shǐ)用它们的配套工具、配套服务(wù)。头部公司还可能利用监管豁免的方式,获得寻租(zū)空间。”换言(yán)之,以开源(yuán)为噱头的巨头游戏,可能会进一(yī)步强化(huà)大公司的(de)垄断地位,反而不利(lì)于产业竞(jìng)争。

据报道,去(qù)年4月,在扎克伯格与分(fēn)析师的一次电话会议中(zhōng),他就谈到 ,如果行业能够在(zài)Meta使用的基础工具(jù)上达成标准化,那么meta就能从其他人的改进中受益。同年5月,谷歌内(nèi)部泄(xiè)露(lù)的文件《我们没有护城河,OpenAI也没(méi)有》在SemiAnalysis网站 上传播,其(qí)中(zhōng)的观点 包(bāo)括,比(bǐ)起(qǐ)开源社区需要谷歌,谷歌更(gèng)需要开(kāi)源社(shè)区等等。文章作者(zhě)指出,不同开源模型所组成的生态系统(tǒng)永远是OpenAI的潜(qián)在竞(jìng)争对手,与(yǔ)开源AI竞争的结果必(bì)然是(shì)失败。

Meta落子,战局生变。大模型的路线之争会不(bù)会迎来真正的胜利者?

“开沪股通上一交易日加仓163只科创板股(kāi)源与闭源大(dà)模型 之间不太可(kě)能分出绝对的输赢(yíng),因为(wèi)它们各自适合不同的应用和(hé)场景。”郭涛认为,开源(yuán)大模型(xíng)更适(shì)合那些需要快速创新和大 规模协作的项目,而闭源大模型可能(néng)更适合那些对性能和安全性有极高要求的商业应用。

未经允许不得转载:神马影视 沪股通上一交易日加仓163只科创板股

评论

5+2=