Grok3,马斯克口中“最聪明的AI”来了!2月18日中午12时许,马斯克(ElonMusk)的AI公司xAI研发的新一代AI基座大模型Grok3正式发布。耗费了20万张GPU的Grok3显示,“卷算力”目前仍是核心。
Grok3的三个亮点
据马斯克团队介绍,Grok3模型和Grok3mini(Reasoning,精简版)在数学推理、科学逻辑推理和代码写作等能力表现方面超越了所有主流模型,包括GPT-4o、、DeepSeek-V3和Gemini-2Pro等。
同时,具备推理能力的Grok-3ReasoningBeta和Grok-3miniReasoning则是超越了类似的推理模型,包括DeepSeek-R1和OpenAI的o3mini等。
模型推理能力
融入智能体功能
快思慢想研究院院长、原商汤智能产业研究院创始院长田丰在接受澎湃科技采访时表示,从发布会上的内容看,Grok3有三个亮点:一是通过缩放定律ScalingLaw显著提升模型性能,二是数学与编程等逻辑推理能力大幅增强,三是融入智能体产品化设计。
澎湃科技注意到,曾担任OpenAI创始团队、斯坦福博士,训练大型深度神经网络的工程师AndrejKarpathy,分享了其用户体验。
Andrej称,在今天早上大约使用了两个小时的过程中,他感受到,Grok3加上深度思考(Thinking)模式的能力略好于DeepSeek-R1和。这是相当令人难以相信的,不过,现在模型给出的答案是随机的,每次可能会给出略有不同的答案,现在还处于早期阶段,在接下来的时间,还需要更多的评估。
模型将进入“神仙打架”
“不过这场大语言模型(LLM)模型领域的竞赛令人非常兴奋!”Andrej说。
伴随人工智能快速迭代,模型的领先优势的“保质期”越来越短,此前有业内人士向澎湃科技表示,“不超过100天,就会有新的模型出现,并超越。”
田丰也表示,接下来将进入神仙打架阶段,“Grok3‘PK’DeepSeekV3,马上就会有人来‘PK’Grok3,也许是”。根据此前OpenAI对外公布的信息,的发布日期已经列入日程。
另有观点认为,目前的大模型行业,训练还未卷完,范式已经统一。
目前Grok3并未开放给普通用户使用,实际推理效果还要使用产品后看,目前看起来基准测试是达到GPT-o1水平的模型,但还不确定实际效果,推理能力的最佳呈现是数学和代码。马斯克在这次直播中主要展现了Grok3的数学计算和代码的能力。
卷算力目前是核心
值得一提的是,在DeepSeek开启了低成本训练模型的风潮后,Grok3却是花了重金。Groks3短时间内反超之前的SOTA模型(state-of-the-artmodel指在该项研究任务中,目前最好/最先进的模型),说明“卷算力”目前仍是核心。
在此次发布会上,马斯克透露,Grok3的计算能力是Grok2的10倍以上,Grok3训练过程累计消耗20万张英伟达GPU,计算资源的显著提升帮助Grok3能更高效地处理大型数据集,缩短了模型训练时间也提高了准确性。有分析称,Grok3算力消耗是DeepseekV3的263倍。
据xAI团队透露,Grok2模型使用了2400亿参数规模,性能媲美GPT-4,为了训练Grok3,xAI团队也将数据中心容量翻倍。
马斯克团队在发布会上表示,“早在去年4月,马斯克就决定创建我们自己的数据中心。我们大约在四个月内建立了数据中心,并花了122天时间,让10万个GPU启动并运行,这是一项艰巨的工作。我们相信这是同类中最大的全连接的H100集群。但我们并没有止步于此。”
“我们每天都在不断改进模型。”马斯克称,目前,Grok3测试版现已面向马斯克的社交媒体平台XPremium用户推出。
田丰认为,Grok3采用的还是“大力出奇迹”的模式,因其使用了20万块英伟达GPU卡训练而成,是典型的“又好又贵”。从数据来看,Grok3的推理能力远远超过前一代的Grok2模型。“xAI基础设施的建设能力全球领先,相比于10万块卡用了120多天,最新拓展至20万块GPU集群只用了92天完成施工搭建,且利用率应该很高,值得中国算力供应链借鉴。”田丰补充说。
商业化布局更进一步
与DeepSeek相比,Grok3最大的短板在于它并非开源模型,且需要付费。针对是否开源的问题,马斯克也在直播中回应,Grok3并未开源,但“按照惯例,我们会在新模型发布时,将上一代模型进行开源。因此,可以预见的是,在几个月后,Grok-3也将迎来其开源时刻。”
此次推出的Grok3测试版本已面向社交平台X上的付费用户开放,此外,xAI还推出了更高阶的SuperGrok订阅服务。
“发布会只提到X用户能选择付费版的Grok3与SuperGrok服务,但没有提toB企业客户如何使用目前闭源的Grok3大模型,相信今年马斯克会发布美国政企客户使用Grok的价格,因为发布会展示了游戏创意、航天科研等产业场景。”田丰预测。
单从xAI的资本投入角度,也确实存在进一步扩大商业化的需求。成立于2023年的xAI,日前正加速其资本布局,在2024年的11月,xAI告知投资者,该公司在最新一轮融资中筹集了50亿美元,估值达到500亿美元。2024年12月24日,xAI在其官网宣布已完成60亿美元(约合人民币438亿元)C轮融资,目前xAI公司的市值已超过400亿美元。据美国媒体报道,xAI正寻求新一轮约100亿美元的融资,此轮融资将使公司估值达到约750亿美元。