Grok3正式发布,比肩 Gemini、DeepSeek 和 ChatGPT

2月18日,Grok3(Beta版)正式发布,并面向X的PremiumPlus订阅用户率先开放,同时推出了每月30美元或每年300美元的SuperGrok单独订阅服务,订阅用户可解锁深度搜索等先进功能,而语音交互功能将在约一周后上线。

Grok3 (测试版) 现已发布!X Premium Plus 订阅用户可优先体验,也可单独订阅 (每月30美元或每年300美元) 以解锁高级功能,例如深度搜索。语音功能将在一周内上线。

Grok3 和 Grok3mini 在多项性能测试中超越或与 Gemini、DeepSeek 和 ChatGPT 等竞争对手不相上下。测试结果显示,在数学、科学逻辑和代码编写方面,Grok3 和 Grok3mini 优于 DeepSeekV3、GPT-4o、Gemini 2 Pro 和 Claude 3.5 Sonnet,Grok3 的性能比 DeepSeekV3 提升了 27%-43%。在推理能力测试中,Grok3 的表现也优于 DeepSeekR1 (提升 16%-22%)。

Grok3 强大的思维链推理能力使其能够出色完成复杂任务。例如,它成功编写并实现了飞船从地球发射、登陆火星再返回地球的 3D 动画,并在 114 秒内解决了开普勒定律。它甚至还能融合俄罗斯方块和宝石迷阵的规则创造新游戏。未来,Grok3 可广泛应用于医疗诊断、法律分析等需要复杂推理的领域。

Grok3 的训练成本预计是 DeepSeekV3 的数倍甚至数百倍。它使用了拥有 20 万个 H100 GPU 的 Colossus 超级计算机进行训练,总训练时间达 2 亿 GPU 小时。按照每 GPU 小时 1-3 美元的租赁价格计算,Grok3 的训练成本可能高达数亿美元,而 DeepSeekV3 的训练成本仅为 557.6 万美元。虽然 Grok3 证明了大模型的持续进步,但也表明算法层面仍有很大的提升空间。