Grok3正式发布,比肩 Gemini、DeepSeek 和 ChatGPT
2月18日,Grok3(Beta版)正式发布,并面向X的PremiumPlus订阅用户率先开放,同时推出了每月30美元或每年300美元的SuperGrok单独订阅服务,订阅用户可解锁深度搜索等先进功能,而语音交互功能将在约一周后上线。
Grok3 (测试版) 现已发布!X Premium Plus 订阅用户可优先体验,也可单独订阅 (每月30美元或每年300美元) 以解锁高级功能,例如深度搜索。语音功能将在一周内上线。
Grok3 和 Grok3mini 在多项性能测试中超越或与 Gemini、DeepSeek 和 ChatGPT 等竞争对手不相上下。测试结果显示,在数学、科学逻辑和代码编写方面,Grok3 和 Grok3mini 优于 DeepSeekV3、GPT-4o、Gemini 2 Pro 和 Claude 3.5 Sonnet,Grok3 的性能比 DeepSeekV3 提升了 27%-43%。在推理能力测试中,Grok3 的表现也优于 DeepSeekR1 (提升 16%-22%)。
Grok3 强大的思维链推理能力使其能够出色完成复杂任务。例如,它成功编写并实现了飞船从地球发射、登陆火星再返回地球的 3D 动画,并在 114 秒内解决了开普勒定律。它甚至还能融合俄罗斯方块和宝石迷阵的规则创造新游戏。未来,Grok3 可广泛应用于医疗诊断、法律分析等需要复杂推理的领域。
Grok3 的训练成本预计是 DeepSeekV3 的数倍甚至数百倍。它使用了拥有 20 万个 H100 GPU 的 Colossus 超级计算机进行训练,总训练时间达 2 亿 GPU 小时。按照每 GPU 小时 1-3 美元的租赁价格计算,Grok3 的训练成本可能高达数亿美元,而 DeepSeekV3 的训练成本仅为 557.6 万美元。虽然 Grok3 证明了大模型的持续进步,但也表明算法层面仍有很大的提升空间。
创建: 2025-02-21 复制本文链接
免责声明:本站所发布的所有文章、资讯、评论等内容,仅供网友学习交流和参考,不代表本站的立场和观点,不构成任何投资、交易、法律或其他建议。用户需自行承担因参考本站内容而产生的任何风险和责任。文章内容可能来源于网络或第三方渠道,如有任何侵犯您权益的内容,请发送相关诉求到邮件到(bruce#fanghui.tech),我们将尽快核实并删除相关内容。