OpenAI向左,Meta往右
OpenAI向左,Meta往右
图片来源 @视觉中国
文 | 定焦,作者 | 黎明,编辑 | 魏佳
OpenAI 正变得越来越封闭,但它的对手 Meta(前 Facebook),却通过开源赢得不少赞誉。
1 月 18 日,马克 · 扎克伯格宣布,Meta 正在计划构建自己的 AGI(通用人工智能),将在绝大多数领域中都达到或超越人类智能水平。同时他强调,保证会向大众开放这一技术,以便人人都能从中获益。
与 OpenAI 拒绝 Open 他们的算法、路线、论文相反,Meta 选择 Open 到底。此前震惊业内的大模型 LLaMA,大获好评的 LLaMA 2,以及正在研发的 LLaMA 3,都是开源的。它们成为很多 AI 公司研究、学习甚至抄袭的对象。
通过开源这一手段,Meta 在某种程度上打破了大模型的垄断,成为 OpenAI 和谷歌双雄相争之外的第三股力量。一些人将扎克伯格视为大模型时代的英雄,有人在扎克伯格的帖子下留言,建议 Meta 更名为 OpenAI,OpenAI 更名为 CloseAI。
事实上,Meta 过去开源了它研发的几乎所有基础设施,比如用于 Web 和 APP 开发框架的 React,以及机器学习框架 PyTorch,而 ChatGPT 就是基于 PyTorch 开发的,OpenAI 也运行在 PyTorch 上。按照 Meta 首席科学家杨立昆的话说,除谷歌外,全世界都运行在 PyTorch 上,因为谷歌有自己的系统。
只是,这些东西在过去都被 Meta 的负面新闻掩盖了——干预选举进程、提供虚假信息、危害青少年健康,在硅谷,骂 Facebook 曾是一种 " 政治正确 ", 人们认为这是一家价值观败坏的公司。
如今风评大变,Meta 一时仿佛成了整个 AI 圈的希望,它的股价在 2023 年上涨了 160%,在美国前五大科技巨头中涨幅仅次于英伟达,最近重返万亿美元市值,股价创新高。而曾以挑战者姿态崛起的 OpenAI,前不久刚经历了一场宫斗,散发出越来越浓的铜臭味。
OpenAI 向左,Meta 往右,两家原本没有太多交集的公司,正走出截然不同的路。
OpenAI,走向封闭
在讨论这两家公司的境况之前,我们先把时间拉回到十年前。
2013 年,有一家叫 DeepMind 的 AI 公司,同时引起了谷歌和 Facebook(当时还没更名为 Meta)的注意。
当时这家公司刚崭露头角,嗅觉敏锐的谷歌和 Facebook 都想收购它。最终,谷歌在竞购中胜出,2014 年 1 月将 DeepMind 收入囊中。三年后,DeepMind 开发的 AI 机器人 AlphaGo,以 4:1 击败了韩国围棋冠军李世石,一举成名。
谷歌收购 DeepMind 时,有两个人心里很不是滋味。一个是扎克伯格,他当时已经意识到 AI 的巨大前景;另一个是马斯克,他不想 AI 被谷歌这样的大公司控制。
于是,扎克伯格决定自己做,他花重金从纽约大学请来了计算机科学领域的权威人物杨立昆,启动 FAIR 项目,在 Facebook 成立了 AI 实验室。马斯克则和奥尔特曼成立了 OpenAI,用来对抗谷歌。
从当时的情形来看,扎克伯格是为了自己的公司,马斯克是为了全人类。马斯克认为,由大公司控制的少量 AI 系统很不安全,唯一的办法是让尽可能多的人都拥有 AI。所以 OpenAI 一开始就定位开源,是一个非营利性的机构。
马斯克当时说:" 我们希望有一种类似于 Linux 版本的 AI,不受任何个人或公司的控制。"
一个为私,一个为公,两家公司一开始就选了不同的路。
马斯克提到的 Linux,是一款免费开源的操作系统。在互联网早期,计算机刚开始普及时,可用的操作系统不多,要么源代码被软件厂商严格保密,要么收取很高昂的费用。一个欧洲大学生开发出 Linux 操作系统的雏形,然后免费对外公开了自己的代码。
由于开源,全球程序员都加入进来改进代码,最终创造了 Linux 操作系统,且使用完全免费。这大大加速了计算机的普及。我们今天熟知的安卓系统,就是基于 Linux 内核,全球大部分手机都跑在这个系统上。
马斯克的想法很简单,AI 时代也需要有这样一个开源开放的操作系统,市场不能让巨头独占。
OpenAI 的启动资金来源于一批科技大佬捐赠,它一开始的确是按开源的路径走的,2019 年发布的 GPT-2,就是一个开源大模型,当年还有人用 GPT-2 为《权利的游戏》改写剧本结尾。
但也是在 GPT-2 发布之后,OpenAI 逐渐走向封闭。它随后成立营利性子公司,接受了微软的数十亿美元投资。
在那之后,2020 年发布的 GPT-3,2022 年升级的 GPT-3.5,以及 2023 年 3 月发布的 GPT-4,都是闭源模型,一开始 OpenAI 还公布论文,到后来连模型具体参数都不再公布。
而从整个大模型行业的竞争格局来看,"OpenAI- 微软 ""DeepMind- 谷歌 " 的双巨头组合格局正式形成。
马斯克对此非常不满。他说,OpenAI 设立时是一家开源公司,现在变成了一个闭源、受微软控制的逐利公司。这根本不是他想要的。
这期间 Meta 没闲着。除了折腾元宇宙,Meta 的 AI 团队一直在研究大语言模型,并发布了一些开源项目。大家各做各的,互不干涉。
在 OpenAI 发布 ChatGPT 的几周前,Meta 发布了一个类似的聊天机器人 Galactica,专门用于撰写科学论文。谁知道这个产品不仅没引起轰动,还招来一片骂声,网友痛斥它会破坏科学出版。以至于 Meta 的人取消了演示,觉都睡不着。
当时人们关心的是 Meta 的元宇宙项目是不是快凉了,裁员裁到哪了,没人关心它的 AI 做得咋样。至于 OpenAI,大家觉得它代表新势力,对它更加包容。
按照杨立昆的说法,两周后 ChatGPT 问世,被视为救世主降临。随后的很长时间里,OpenAI 都是全球科技界的当红炸子鸡,登上神坛夺走了所有目光。人们津津乐道于,OpenAI 是如何冲破谷歌的封锁,对巨头形成压制。
在崇尚个人英雄主义的美国,创业新秀挑战旧势力的剧本,向来充满话题性。于是大模型头部选手的竞争,变成了 OpenAI 和谷歌的双雄争霸。
但一向好强的扎克伯格不会袖手旁观。Meta 秘密研发的 LLaMA 大模型,已经箭在弦上。
Meta 才是全村的希望?
2023 年 2 月,ChatGPT 发布之后 3 个月,LLaMA 的第一个版本开源,一开始这个模型只能用作研究。7 月,升级之后的 LLaMA 2 支持免费商用。Meta 把模型训练数据、训练方法、数据标注等大量细节都公布了,起始代码全部开源。
LLaMA 2 性能非常突出,超过了所有的开源大模型。有人发现,其最大参数的版本比 GPT-3 参数量小,但效果更好。
曾经跟着马斯克从 OpenAI 跳到特斯拉,后来又被 OpenAI 挖回去的科学家 Andrej Karpathy,将 LLaMA 2 的发布视为人工智能和大模型发展过程中的重要一天,因为这 " 是任何人都可以拿到模型权重的最强大语言模型。"
一时间,整个 AI 圈对 Meta 刮目相看。当一批巨头公司掀起大模型军备竞赛,试图通过技术封闭实现市场垄断时,Meta 用 LLaMA 撕开了一条口子。OpenAI 没做的事,Meta 做到了。
英诺天使基金合伙人王晟戏称杨立昆为 "Klaus LeCun"( 杨立昆英文名为 Yann LeCun,Klaus Fuchs 在二战期间向苏联提供了曼哈顿计划的信息)。王晟开玩笑:" 不能只让美国拥有原子弹。"
王晟发现,ChatGPT 出现之后,科技圈对大模型热情且迷茫。投资人中很多是看热闹," 因为第一看不懂,第二不敢投,第三投不到。一个新的技术范式出现,没人知道它的能力边界在哪里。"
王晟对「定焦」说,LLaMA 开源对行业影响很大。"Meta 过去这些年积累的大模型技术,本来都是不传之秘,结果一开源,迅速把很多认知拉平了。"
之前,国内团队研发大模型,只能从零到一不断试错,一旦有个点被卡住了,即便从技术角度来说并不是太难,但靠自己可能也需要花一两年时间才能解决,需要亲自踩很多坑。现在 Meta 直接把它的经验和数据拿出来,在思路和方法上给了行业非常重要的指引。
"在这个过程中大家学习了很多。假如没有 LLAMA 开源,国内大模型今天的水平可能会差很多,我们会大幅度被人甩下。" 王晟说。
这也是为什么国内一下子突然涌现出 200 多个大模型。王小川的百川智能在公司成立仅两个月就发布了一款大模型,其实就是借鉴了 LLaMA。李开复的零一万物推出的大模型,也是使用 LLaMA 的开源模型架构。
LLaMA 开源对 OpenAI 最直观的影响,是有一堆中国公司跳出来 " 吊打 "GPT。在他们的口径中,已经在多项指标上超过了 GPT 模型,虽然很多榜单都是刷出来的。
更深层次的影响在于,大模型开源社区的力量快速壮大,全球的程序员都能为开源做贡献。他们开发出各种开源数据集,迭代出更多新模型,缩小与闭源大模型的差距。所以谷歌的工程师说,谷歌没有护城河,OpenAI 也没有。
Meta 在科技圈的形象变得高大起来。回顾 Meta 的发展,其实它一直都有开源的传统。
早在 2016 年,Meta 团队就开发并开源了深度学习框架 PyTorch,它和谷歌的 TensorFlow 成为深度学习领域的两大主流框架。
跟 OpenAI 现在才开始秘密推进芯片制造项目不同,Meta 在三年前就设计了自研 AI 推理芯片,并采用了开源架构。
在语言翻译方面它推出了很多开源模型,两年前发布的 NLLB 模型是维基百科的翻译供应商之一,2023 年发布的 SeamlessM4T 可以翻译近百种语言,同时它还发布了全球最大的开放多模态翻译数据集。
有研究人员经过对比认为,Meta 更倾向于信任、问责制以及通过开源实现人工智能的民主化。
反观 OpenAI,它依然在技术上保持领先,但拒绝开放。
" 没人知道 OpenAI 进展到什么程度了,包括它正在研发的 GPT-5,是不是继续用的 transformer 都是未知数。现在大家都跟着 GPT-3.5 的技术路线在跑,假设它悄悄变换了方向,那大家就掉坑里了。因为没人知道正确路线是什么。" 一位 AI 公司的创始人说。
同时它试图阻挡竞争对手,以保持自己的先发优势。
字节跳动在 2023 年 12 月被 OpenAI 停用账户,因为它在调用 OpenAI 的 API 开发自身大语言模型的时候,违反了 OpenAI 的服务条款。有悖商业伦理的行为肯定是不对的,但外界由此关注到 OpenAI 的商业条款,它禁止客户使用 GPT 输出的内容开发任何可能会给 OpenAI 带来竞争的 AI 模型。
值得注意的是,微软也有类似条款。它们将商业上的竞争优势看得很重要。
人工智能公司开放传神(OpenCSG)创始人、CEO 陈冉认为,开源的市场空间远比闭源大,但未来一定是开源和闭源两条路同时走,"OpenAI 开源不开源其实不重要了。"
开源闭源,谁对谁错?
究竟是 OpenAI 被利益蒙蔽了双眼,还是 Meta 大公无私要为全人类做贡献?
或许,它们在本质上并无不同。OpenAI 既没有那么自私,Meta 也不像网友鼓吹的那样高尚,区别只在于路线和策略。
若论对整个 AI 行业的贡献,OpenAI 毫无疑问是最大的。毕竟,这一轮 AI 浪潮是由 ChatGPT 掀起的。它点燃了一把火,加速了大模型的普及。事实上,前两年大模型开源社区基本是围着 GPT-3 在转。
OpenAI 不像谷歌、Meta 那些巨头拥有雄厚的资金积累,早年大佬捐赠的资金早花得差不多了,没钱是做不了研发的,总不能用爱发电。所以 OpenAI 抱了微软的大腿,奥尔特曼想尽办法为 OpenAI 赚钱。
陈冉认为,OpenAI 的成功其实是商业模式的成功,本质是投资人看到了巨大的商业价值和盈利模式。开源与闭源之间的竞争方向一定是挣钱模式的创新竞争。
Meta 将技术开源,也不是只为他人做嫁衣。开源是一种策略,能吸引更多开发人员免费帮它迭代技术、修复漏洞,正所谓众人拾柴火焰高,但最核心的技术还是掌握在 Meta 手里,该打击对手的时候它不会手软。就像谷歌,它旗下的安卓是开源系统,但国内手机厂商做自己的系统还是会有很多限制。
而在大模型火起来之前,Meta 掉进了元宇宙的深坑里无法自拔,砸钱、亏损、裁员,看不到任何希望。大模型是那根救命稻草,ChatGPT 则是照亮前路的那束光。
再往深了看,闭源的 OpenAI 和开源的 Meta,从根本上对 AI 的价值判断有分歧。
如果将 AI 比作未来世界的核武器,OpenAI 认为它很危险,得谨慎,不能滥用。Meta 则认为,核武器不能只掌握在少数几个玩家手里,应该开放研究。
关于 AI 的利弊之辩,是科技圈的一个老话题。马斯克就相信 "AI 危险论 ",他担心有一天机器的智力、意识都超过了人类,可能会取代人类,摧毁人类文明。所以他当年牵头成立 OpenAI,只是后来 OpenAI 没按他设想的路径走。
基于 " 防止 AI 取代人类 " 的愿景,行业里又延伸出两大派别。一派认为大量独立的 AI 系统比由大公司控制的少量 AI 系统更安全,AI 的研究应该开源开放;另一派认为应该封闭研究,这可以减轻安全风险,防止不法分子滥用获得的代码。
OpenAI 属于后者。支持它的人认为开源策略加大了风险,比如伦敦一家 AI 公司的 CEO 就认为,Meta 是最不负责任的人工智能参与者,他问:" 我们应该令核武器的设计透明化吗?"
Meta 将开源视为最优策略,杨立昆就认为,机器最终会比人类更聪明,人类无法阻止坏人获取它,AI 必须是开源的,只有让更多人参与其中,最终开发出的系统才会更安全。他认为马斯克的 AI 威胁论就是科幻小说看多了。
杨立昆曾经的合作伙伴,跟他一块获得图灵奖的杰弗里 · 辛顿,则持有不同观点,认为 AI 将对人类构成严重威胁。他的思想也许对他的学生伊利亚造成了影响。伊利亚是 OpenAI 的联合创始人兼首席科学家,几乎决定了 OpenAI 的技术路线,他也是 OpenAI 宫斗事件中开除奥尔特曼的关键人物。伊利亚一直致力于追求安全可靠的 AGI。业内普遍认为,商业化和 AGI 的路线之争,引发了那场冲突。
所以,OpenAI 和 Meta 有不同的信念。OpenAI 将 AGI 视为终极目标,并且相信自己将会第一个实现它;Meta 将开放平台视为最好的路径,试图制定开源标准。当然,它们都希望在这个过程里拿到应得的商业利益。
往长远看,AI 的发展是螺旋式上升的,开源也好,闭源也罢,都将为其注入动能。究竟谁是真的在为全人类的未来操心,只有等待时间检验了。