来源:字母榜
OpenAI的12天马拉松直播活动结束了,但是这个“马拉松”有点名不副实。
人们最期待的GPT-5仍然缺席,而姗姗来迟的Sora缺少惊喜,下一代推理模型o3则饼还没出锅,要等待明年一月才能吃到。
与此同时,外界的压力却接踵而至:谷歌趁着OpenAI的马拉松活动,举起狙击枪,发射出一发又一发精准命中的子弹。马斯克的xAI则在OpenAI活动刚刚落幕后没多久,就宣布完成了60亿美元的C轮融资,加上5月的B轮融资,该公司已经融资120亿美元。
这本是OpenAI一个在轻松欢快的氛围中结束2024年的营销机会,但却和外部的夹击形成了映照,完美勾勒出了OpenAI这一年的遭遇。
在这一年,OpenAI依然优秀,但也许已经从神坛退回人间。而2025年,注定会有更多挑战。
在年底,在圣诞前,一口气进行连续12天的直播,一系列新产品与功能砸来!
以上,是OpenAI年底直播活动开始前的观感。但实际上却是:12天的直播并不连续,周末休息;直播的日子里,时长并不长,有时候只有十分钟。
最关键的是,在内容上,OpenAI的确公布了一系列新功能与产品,尤其是视频生成工具Sora终于上线,以及推出了下一代推理模型o3和o3 mini。
但是,外界最为期待的GPT-5却依然缺席。
而就在12天直播活动正式结束之后,《华尔街日报》爆料,GPT-5(代号Orion)开发进程缓慢,没有达到预期效果。
具体来说,这篇报道称Orion项目已经开发了18个月,至少进行了两次大型训练,每次都需要数月的时间来处理大量数据,以让Orion更聪明。但相关人士表示,每次训练都会出现新的问题。
即便是以Orion的最优表现来看,其表现虽然优于OpenAI的现有模型,但是结合成本来看就有些不值得了——根据《华尔街日报》的估算,六个月的训练仅仅计算成本就可能高达5亿美元。
当然了,这样的情况也让OpenAI的最大金主微软“率先失望”。微软原本的期待是Orion能在2024年中期就看到新模型。
回望2022年11月底ChatGPT刚刚问世,次年3月GPT-4就推出,依旧是碾压式的存在。不久之后,2023年年中,GPT-5项目的开发就已经启动,也是从那时候起,外界都在期待GPT-5的推出。
期待越大,失望越大,GPT-5推出受阻,也成为外界眼中OpenAI转变的一个显眼的标志。
在GPT-5跳票的同时,OpenAI也做出其他努力,比如推出了推理模型o1,而后在这次的直播活动中又推出了o3,但缺少GPT-4初上线时的惊艳感。
而在ChatGPT背后的模型更迭之外,OpenAI的Sora从年初官宣,到年末直播活动期间才终于推出。一年的时间在蓬勃的AI行业属实是有些漫长,“友商”早已纷纷布局,Sora也不再“居高临下”。
2024年成为了OpenAI形象转变的关键一年。不能说OpenAI不再优秀,但至少是从神坛跌落了人间,那种“碾压式”的优势似乎已经不再。
“友商”奋起,让OpenAI“遥遥领先”的难度越来越大。
仅就这次直播活动来说,OpenAI最受关注的o3模型和Sora都遭到了阻击。而其中最有力的竞争者,正是曾经因为在AI浪潮中动作缓慢备受争议的谷歌。
12月9日,直播活动的第三天,OpenAI终于宣布正式推出Sora,每月付费200美元的ChatGPT Pro用户可以享用。
和年初Sora被官宣时所引发的高关注不同,这次Sora就像掉进湖中的小石子,并未掀起太大波澜。最长20秒、最高画质1080p的表现,吸引力实在有限。毕竟最大竞对Runway以及国内的可灵、海螺AI都已经推出多时,定价还没有那么贵。
12月17日,谷歌又来“落井下石”,突然推出Veo2。而Veo2目前最高可以创建8秒、720p的视频,承诺未来可以达到2分钟以上、4K分辨率。CEO皮查伊(Sundar Pichai)在社媒打广告的时候专门强调Veo2“对现实世界的物理与运动有更好的理解”,是在讽刺谁尽在不言中。
这下,风头彻底被夺走,Sora推出后用户的讨论并不热烈,很多评测还会指出其仍然存在年初演示中的生物运动变形、手部不自然、文字乱码的情况。而Veo倒是引来不少赞美声,尤其是连贯的生物运动、自然丰富的人物表情以及画面稳定的长摇镜头。
在压力之下,随着直播活动落幕,OpenAI宣布在圣诞假期期间,将为所有订阅用户提供无限制的Sora访问权限。
谷歌的阻击不仅限于此。
在OpenAI“12天马拉松”直播活动的倒数第二天,12月20日,谷歌宣布推出Gemini 2.0 Flash Thinking。这是一个多模态推理模型,通过思维链过程可视化,以AI思维的透明度和快速解题为亮点。
熟悉OpenAI产品的朋友应该不难看出,谷歌这个新模型瞄准的正是OpenAI的推理模型o1。
根据独立基准测试网站lmarena.ai的初步评估结果,Gemini 2.0 Flash Thinking整体成绩超越o1预览版,总分排名第一。
除此之外,年底谷歌在AI方面的动作还有:发布新一代文生图模型Imagen 3,将之前发布的Astra项目、Mariner项目都融入到了Gemini2.0当中。
自从GPT-4推出之后,谷歌不断进行内部重组,集中AI火力。去年4月,谷歌将谷歌大脑和DeepMind合并为“谷歌DeepMind”,由DeepMind联合创始人哈萨比斯(Demis Hassabis)负责。今年8月,谷歌又将Character.AI的创始人沙泽尔(Noam Shazeer)及其“一小部分同事”吸纳进谷歌DeepMind。
如今的谷歌已经一扫去年初“不赶趟”的尴尬,成为OpenAI最大的竞争者之一。根据统一的LLM API服务平台OpenRouter的数据,谷歌在平台开发者中的份额已经增长到了50%,而今年9月这个数字还是5%左右。
谷歌只是其中一个奋起的“友商”,最具代表性的还有OpenAI“叛军”起家的Anthropic,在这一年发布了Claude 3.5,背后是亚马逊的力挺。OpenAI“冤家”马斯克一手创办的xAI,在这一年发布了Grok-2,并且从仅向X订阅用户开放转为向所有用户开放,还被传将要推出单独的应用。以及巨头Meta,在这一年继续稳固“开源AI”的战略,不断加码超算部署。
门罗风投Menlo Ventures对600名美国企业的IT决策者进行了调查,公布了2024年的调研结果:今年企业在生成式人工智能上的支出飙升了500%,从2023年的23亿美元增加到138亿美元。
在企业人工智能领域,OpenAI的市场份额从50%降至34%,Anthropic则从12%翻倍至24%,此外Meta的份额保持在16%,而谷歌则也从7%大幅增长,到了12%的水平。
2024年,OpenAI的竞争者愈发强壮,愈发尖牙利齿,让OpenAI被层层包围。
光说产品上的竞争不足见OpenAI处境的全貌。
AI行业的竞争并非静态。在OpenAI产品乏力的表征之下,是公司激烈的结构转型和人员动荡。
就在OpenAI直播活动期间,又有一位关键人物离开,即亚力克·拉里福德(Alec Radford)。
他在OpenAI已经效力8年之久。他将Transformer架构与海量数据相结合的想法彻底改变了OpenAI的研究,直接促成了后来GPT模型的成功。
实际上,整个2024年,OpenAI人员动荡,至少有9位高管离职。最能说明“动荡”的有三点:
第一,OpenAI初创团队的11人已经锐减到了如今的2人。第二,前首席科学家苏茨克维(Ilya Sutskever)和前首席技术官穆拉蒂(Mira Murati)离开。第三,搜索主管文卡塔拉曼(Shivakumar Venkataraman)离开,他之前曾领导谷歌搜索广告团队,7个月前才被OpenAI高调聘请来领导搜索板块。
元老纷纷跳船,新吸纳的关键人物也光速离开,可见OpenAI的动荡程度。而离开OpenAI的厉害角色,除了少部分创业之外,大多都被“友商”吸纳。
这波AI浪潮被掀起之初,人才抢夺就已经上演。OpenAI左手“情怀与理想”,右手高薪,成为有抱负的研究人员向往的“圣地”。然而如今OpenAI的魔力是否还能持续要打一个问号。
OpenAI接下来的一个重要转变是成为一家真正的盈利性公司,摆脱非营利董事会的“掌控”。这件事在去年还只是传言,今年已经被OpenAI摆在了台面上。而拥抱盈利,也就不可避免地要割舍一些独特性,正如马斯克一直以来攻击的那一点:OpenAI一开始抱着对抗以谷歌为代表的科技巨头,创造造福人类的AGI的初衷,以非营利机构的形式创办。
重组的过程,实际上就是对公司优先级与首要目标的重新调整,而这个过程不可避免地会与“元老”产生摩擦。
高薪也未必能长存。
OpenAI本身还没有稳定的造血能力。今年,OpenAI完成66亿美元融资,根据公司披露的财务文件,预计到2029年才会盈利,届时收入将达到1000亿美元。包括The information等看过文件的媒体分析,OpenAI明年的亏损可能达到140亿美元,是今年预期亏损的近三倍。
至于最大的“金主”微软,与OpenAI的关系也愈发微妙。就在当地时间12月24日,路透社援引知情人士称,微软正在为Copilot摆脱对OpenAI的依赖而努力,除了训练自己的小型模型之外,还在积极定制其他第三方模型。有媒体干脆将其总结为:微软希望和OpenAI建立“开放关系”。
另一边,OpenAI的高薪策略也被马斯克盯上,加以攻击。
11月时,马斯克针对OpenAI的诉讼升级,这次不仅新增被告成员,还提交了新的证据。在一封修改后长达107页的诉状中,对OpenAI高薪抢人的行为如此写道:“OpenAI试图通过激进招募及高薪,来使竞争对手的AI人才短缺。并且,OpenAI计划在1500名员工身上花费15亿美元。”
马斯克重拾对OpenAI的诉讼这件事本身也值得玩味,该诉讼最早发生于今年3月,随后撤诉。几个月后,马斯克又在联邦法院重新提起诉讼。今年11月中旬,投诉范围进一步扩大。
与此同时,马斯克本人及其手中的xAI都在高歌猛进。他自己成为美国总统大选的最大获益人之一,成为特朗普的“亲信”,将在特朗普上任后主管一个全新的“效率部门”。
12月24日,xAI官宣完成了60亿美元C轮融资,并公布了投资阵容,英伟达、AMD、摩根士丹利、红杉资本等都在其中。加上今年5月的60亿美元B轮融资,xAI的总融资金额已经超过了120亿美元。根据CNBC报道,xAI的目标估值为500亿美元。
如果说去年OpenAI CEO奥特曼还可以一笑了之,在马斯克的进攻面前保持优雅,那在2024年,这份优雅已经不再。
今年融资时,奥特曼曾试图和投资者达成封闭协议,敦促投资者不要投资OpenAI的竞争对手。
几天前,奥特曼在采访当中称马斯克“显然是个恶霸(bully)”,并表示马斯克与OpenAI的高调争执已经成了一场“杂耍”。在公开场合如此直言不讳地“攻击”马斯克其人,对奥特曼来说实属罕见。
在年底,趁着圣诞节的由头,做一场直播马拉松活动,OpenAI也许本期望可以在相对轻松的气氛中结束2024年,并将外界的关注点重新拉回到产品本身。
但竞争对手夹击、前路挑战高筑,这样的努力似乎并没有达到预期。人们反而看到了OpenAI的压力,看到了一个充满挑战的2025年正在向OpenAI轰鸣而来。