AI“源神”启动！影响多大？

开源还是(shì)闭源？这是属于大模型的时代之问。

今年年初，埃(āi)隆(lóng)·马斯克(kè)在对(duì)OpenAI及其CEO萨姆·奥特曼提起诉讼时，就对OpenAI逐渐不公开其模型研究相关细节的行为大加谴责。“时至(zhì)今日，OpenAI公(gōng)司网站还宣称，它的宗旨是确保通用人(rén)工智能造福全(quán)人类。然而，在现实中，OpenAI已(yǐ)经转变为科技(jì)巨头(tóu)微软(ruǎn)事(shì)实上的闭源子公司(sī)。”这位曾经(jīng)的OpenAI联合创始(shǐ)人如(rú)此(cǐ)表(biǎo)示。

OpenAI不够“Open”，Meta却“Open”了(le)自己最新的开源(yuán)人工(gōng)智能模型。

4月18日(rì)，Meta 发(fā)布了其最新(xīn)版本的开源大模型 Llama 3，引起开源AI社区的一阵欢呼。巧合(hé)的(de)是，Llama 3发布(bù)当天正好是AI领域顶尖(jiān)学者、AI开源倡导者吴恩达的生日。“（Llama 3是）至今为止最好(hǎo)的礼物，谢感谢Meta！”他说。

行至2024，开(kāi)闭源之争日渐白热化(huà)。闭(bì)源阵营以目(mù)前最(zuì)强的OpenAI为代表，开源阵营Meta的LLaMa、Mistral和(hé)Google等也(yě)在不(bù)断迭(dié)代(dài)。闭源(yuán)阵营坚持对Scali沪股通上一交易日加仓163只科创板股ng Law的信仰，押注在(zài)更(gèng)强(qiáng)通用模(mó)型的(de)打造上(shàng)；开源阵营模型能力不断提升，并且强调以更(gèng)垂直的(de)性(xìng)能、更灵活的配(pèi)置来推动大模型(xíng)商业化落地。

关于应(yīng)该选择模型开源还是闭源讨论经久不息。

对于(yú)局内人，这一选择这不仅决(jué)定了他们将如何点亮AI“科技树”，更将影响他们的商业路线选择。换言之，这很有(yǒu)可能是这个残酷竞争市场下的生存问题。

两个版本，多重惊喜

Meta此次发布的Llame 3包括8B和70B的预训练和指令微调版本。

据Meta官网信息，Llama 3 模型将数(shù)据(jù)和规模提升到新的(de)高度。它在两个定制24K GPU集群上基(jī)于超(chāo)过 15T 的数据进行了训练沪股通上一交易日加仓163只科创板股——训练(liàn)数(shù)据(jù)集是Llame 2使用量的7倍(bèi)有余。它支持 8K 上下文长度，是 Llama 2 容量的两倍。

除了(le) Llama 3，Meta 还发布(bù)了(le)新(xīn)的信任和安全工具，包括Llama Guard 2、Code Shield和 CyberSec Eval 2。

据悉，Llama 3 即将在AWS（Amazon web service）、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、 Microsoft Azure等(děng)主(zhǔ)要云提供(gōng)商(shāng)、模型 API 提供商(shāng)平台上线，Llama还得到AMD、AWS、戴尔、英特尔、NVIDIA和(hé)高通提供的硬(yìng)件平台的支持。

在官网上，Meta还放出了Llama3两个版本与谷歌Gemma、谷歌Gemini、Mistral、Anthropic的Claude 3等竞争对手的参数(shù)对比。据Meta官网，Llame3在MMLU（学科知识理解）、GPQA（一般问题）、HumanEval（代码能力）、GSM—8K（数学能力）、MATH（比较难(nán)的数学(xué)问题）5个评测集上均表(biǎo)现良好。

值得注意的是，Llama3的(de)代(dài)码能力非常优秀。在AI领域公众号“数字(zì)生命卡兹克”主理人卡兹克(kè)分享的(de)用户实测中，Llama3—8B能够给出国际(jì)象棋中经(jīng)典皇后问题的解题代码(mǎ)。而其前(qián)代版本Llama2需要(yào)专门的代码模型才能实现(xiàn)。

市场的反应(yīng)速度很快。18日(rì)当天，Meta股价逆势收涨1.54%。次日，百度智能云(yún)千帆(fān)大模型(xíng)平台开放(fàng)邀约测试，提供针对Llama 3的训练推理方(fāng)案，帮助开发者训练专属大模型。

8B和70B 两个型(xíng)号的模型，仅仅标志着 Llama 3 系列的开端，Meta AI首席科学家杨立昆在其社交媒体透(tòu)露，在接下来的几个月，还会有(yǒu)更多版本(běn)陆续发布。

英伟达(dá)高级(jí)科学家Jim Fan认为之后可能会发布的(de)Llama 3-400B以上的版本(běn)将成为(wèi)某种(zhǒng)“分水岭”，开源社区将(jiāng)能用上GPT-4级(jí)别的模型。

不(bù)下牌桌，各显神通

上一轮元宇宙竞(jìng)争中被认为(wèi)可能跌进坑里的Meta，在人工智能(néng)的牌桌上打出(chū)了Llama系列这把好牌(pái)。要讨论Llama3带来的行业震荡(dàng)，首先要明白，什么是大模型领域的开源(yuán)？

大模型领域的开源通常意味着模型的架构、训练代码和预训练权重等(děng)都被公开，允许研(yán)究(jiū)人(rén)员和开发者自由地访问和使用。

不过(guò)，开源的程度因模(mó)型而异。“有(yǒu)些可能只提供有限的访问(wèn)权限或(huò)部分代码。”郭涛指出，判断大模型是否真正开源(yuán)的基准可能包括：代码和数据的可访问性、使(shǐ)用(yòng)许可的宽松程度、社区(qū)支持的活跃度以及对改(gǎi)进(jìn)和新应用的开放性。

放眼AI界(jiè)，两条路径上(shàng)都各有(yǒu)“头号玩家”分布。闭源自不必(bì)说，海外(wài)有OpenAI旗下的ChatGPT，国内是百度的文心一(yī)言以及风头(tóu)正劲的月之暗面(miàn)Kimi。

而开源(yuán)方面，除了Llama系列，目前应用较广的(de)开源大模型还(hái)包括非营利组织LAION推出的OpenFlamingo、Databricks的Dolly，以及MosaicML的MPT等。国内则包括，阿里巴巴的通义(yì)千(qiān)问，智(zhì)谱的(de)ChatGLM-4、百川智能的baichuan-7B中(zhōng)英文大模型、北京(jīng)智源悟(wù)道3.0大(dà)模型系列和面壁智能的CPM-Bee 10B中文基座大模型等。

形成这(zhè)样的分(fēn)化(huà)，很多时候(hòu)是受技术进步和商业模式迭代等的多重影响。

天使投资人(rén)、资深人工智能专(zhuān)家郭涛认为，从技术角度来看，开源可以促进学术界的研究和创新，而闭源则有助于在一定时间内保持技术领先优势。

从商业角度(dù)来看，开源可以吸引开(kāi)发者(zhě)社区的贡(gòng)献，促(cù)进技术的快速迭代(dài)和应用的广泛传播，但可能会(huì)影响到公(gōng)司的盈利模式。闭源则可以保护知识(shí)产权，为公司创造(zào)直接的收入来源(yuán)，但可能会限制技术的普(pǔ)及和生态(tài)的建(jiàn)设。

事实上，在Llama3发布之前，中文互(hù)联网刚刚经历(lì)了一(yī)轮开闭源论战。

据(jù)媒(méi)体报道，百度(dù)CEO李彦宏近日表态，认为大模型开(kāi)源意义不大，闭源模型性能会不断提(tí)升。“有了文心大模型(xíng)4.0，我们可以根据需要兼顾效果、响(xiǎng)应速(sù)度、推理成本等(děng)各种考虑，裁剪出适合(hé)各种场景的更(gèng)小尺寸模型，且支(zhī)持精调和post pretrain。通过降维裁剪(jiǎn)出的模型，比直接拿开源调出来的模型(xíng)，同等尺寸下效果更好，同等效果下成(chéng)本明显(xiǎn)更低。”

李彦宏(hóng)一直是闭源路线的(de)忠实拥趸，理由包括(kuò)但不限于认可闭源商业模式可以更(gèng)好地(dì)聚(jù)集(jí)人力和财力等。

而其反对者(zhě)——360创(chuàng)始人周鸿祎言简意赅，“一句话，今天没有开源就没有 Linux，没有 Linux 就没(méi)有互联网。”

“源神”启动，影响几何？

“Llama 3的发布会带来市场格局的改变(biàn)。”郭(guō)涛在接受21记者采访时指(zhǐ)出，其优(yōu)异表现可能吸引更多的用户和投资者，从而增加其市场份额。

官网显示，Llama 3将有条件地开源给商业使用（月活用户超过7亿需要单独申请）。“不过这基(jī)本等于完全(quán)免费商用了。”卡兹克(kè)表示。

此前，投资人朱啸虎曾经就人工智能市场相关话题接受腾讯新闻采访。当被问及2023年大模型发展的关键节(jié)点时，他给出的回答(dá)正是(shì)Llama上线(xiàn)。这让中国(guó)在应用(yòng)层面创新有了(le)基础，降低了商(shāng)业化门槛。

当然，朱啸虎提(tí)到的变现是(shì)指开源(yuán)生态内的(de)用(yòng)户。对于开源大模型(xíng)发(fā)布者的能否盈利，或者能等来盈(yíng)利机会，很多(duō)时候并没有确定的答案。

闭源(yuán)大模型通常通过授权使用、订阅(yuè)服(fú)务或者直接(jiē)销售产品来盈利。其中的代表便是AI领域的领跑者OpenAI，虽然其一直有(yǒu)推(tuī)进开源项目的动作，但其(qí)处在核(hé)心地位(wèi)的(de)ChatGPT却一直(zhí)采取收(shōu)取API许可费的方式(shì)向其他公(gōng)司提供服务。在API服务过程，其他公司不会接(jiē)触到ChatGPT模型的细节和源代码，仅(jǐn)仅通过API接(jiē)口进行调(diào)用。

创(chuàng)业者(zhě)服务平台GoDaddy对全美1003家小型企业的调查(chá)数据显(xiǎn)示，ChatGPT以70%的应用率成为美国小型企业应用最多的生成式AI产品，这说明OpenAI选择的闭源模式(shì)的商业化之路在一定程度已(yǐ)经跑通(tōng)。

开源模型如何寻求(qiú)生存和发展(zhǎn)的机(jī)会(huì)？

首先是以开放的生态吸引用户(hù)。国盛(shèng)证券研报就指出，开源(yuán)大模型借助更大标识符训(xùn)练(liàn)数据集、DeepSpeed、RLHF等方式，实现低训练成(chéng)本和高性能，超大模型以下大模型的壁垒正在消(xiāo)失。

“在拥有用户后，开源大模(mó)型通常(cháng)通过提供增值服(fú)务、定制开发、技术支持等方式来实现(xiàn)盈(yíng)利”。郭(guō)涛(tāo)指出(chū)，公司(sī)可以在开源(yuán)模型的基础上提供专业的训练服务或者定制化的应(yīng)用解决方案。

对于Meta甚(shèn)至众多开源者而言，开源的(de)野心不仅是短期(qī)的商(shāng)业变现(xiàn)，其更想引领规则设(shè)计以及(jí)搭建(jiàn)生态。有业内专家分析，开源后壁垒并没有那么容易破除，高质量、标注过的训练数据集尤其是专(zhuān)业模型的壁垒。

星(xīng)纪魅族(zú)集团数据合(hé)规执行总监(jiān)朱玲凤表示(shì)，目前有些开(kāi)源(yuán)AI由头部公司主导，“越多人使用，就越能(néng)强化网格效应，而且不是真正的开放，后续需要使(shǐ)用它们的配套工具、配套服务(wù)。头部公司还可能利用监管豁免的方式，获得寻租(zū)空间。”换言(yán)之，以开源(yuán)为噱头的巨头游戏，可能会进一(yī)步强化(huà)大公司的(de)垄断地位，反而不利(lì)于产业竞(jìng)争。

据报道，去(qù)年4月，在扎克伯格与分(fēn)析师的一次电话会议中(zhōng)，他就谈到，如果行业能够在(zài)Meta使用的基础工具(jù)上达成标准化，那么meta就能从其他人的改进中受益。同年5月，谷歌内(nèi)部泄(xiè)露(lù)的文件《我们没有护城河，OpenAI也没(méi)有》在SemiAnalysis网站上传播，其(qí)中(zhōng)的观点包(bāo)括，比(bǐ)起(qǐ)开源社区需要谷歌，谷歌更(gèng)需要开(kāi)源社(shè)区等等。文章作者(zhě)指出，不同开源模型所组成的生态系统(tǒng)永远是OpenAI的潜(qián)在竞(jìng)争对手，与(yǔ)开源AI竞争的结果必(bì)然是(shì)失败。

Meta落子，战局生变。大模型的路线之争会不(bù)会迎来真正的胜利者？

“开沪股通上一交易日加仓163只科创板股(kāi)源与闭源大(dà)模型之间不太可(kě)能分出绝对的输赢(yíng)，因为(wèi)它们各自适合不同的应用和(hé)场景。”郭涛认为，开源(yuán)大模型(xíng)更适(shì)合那些需要快速创新和大规模协作的项目，而闭源大模型可能(néng)更适合那些对性能和安全性有极高要求的商业应用。

未经允许不得转载：神马影视沪股通上一交易日加仓163只科创板股