GPT-5.4重磅发布:电脑操控和跨领域能力大幅升级,开启智能新篇章

近日,OpenAI 正式发布其最新人工智能模型 GPT-5.4,这一版本被定位为专业工作场景的旗舰模型,同时推出了更适合复杂任务的 GPT-5.4 Pro 版本。本次升级为 AI 技术注入了全新动力,多项能力提升对各领域用户而言意义非凡。

GPT-5.4 的核心亮点 🔍

作为 OpenAI 的创新之作,GPT-5.4 带来了多项革命性变化:

  • 首创"电脑操控"功能: GPT-5.4 是首个原生支持电脑操作的通用模型,可以通过截图、点击鼠标和敲击键盘,完成从网页浏览到应用操作的多任务操作。在 OSWorld-Verified 桌面操控测试中,GPT-5.4 的成功率达到 75%,超过人类平均水平,领先前代 GPT-5.2 的47.3%成功率。
  • 知识工作能力大幅提升: 在涵盖 44 种职业的 GDPval 基准测试中,GPT-5.4 与行业专业人士打平或胜出的比例达到 83%,而前代版本为 70.9%。这一表现对专业内容制作、数据分析和财务建模等领域都带来极大助力。
  • 编程与开发更高效: GPT-5.4 整合了 GPT-5.3-Codex 的专属编程能力,并显著降低了生成延迟。在 SWE-Bench Pro 测试中,得分达到 57.7%,保持与 GPT-5.3-Codex 的高水准表现,同时提升任务响应速度。

新功能工具搜索和任务计划 🛠️

GPT-5.4 引入了 "工具搜索" 功能,这是解决使用外部工具时 token 消耗过高问题的创新方案。区别于以往的整体载入方式,该功能支持按需查找外部工具,将 token 消耗减少了 47%。从成本角度看,这为依赖 MCP 工具的开发者节省了大量预算。

此外,GPT-5.4 在 ChatGPT Plus 中推出了 "GPT-5.4 Thinking" 功能,支持用户在模型生成过程中动态介入调整生成计划,不再需要等待任务完成后重新开始。这一增强交互功能,对创意工作者而言无疑是福音。

实用场景广阔 🚀

从发布信息可见,GPT-5.4 主要面向以下专业场景:

  1. 知识型工作: 无论是市场报告撰写还是复杂财务建模,GPT-5.4 都展现了优于人类的稳定表现。
  2. 软件开发: 通过整合 Codex 的代码生成能力,新模型可协助开发者快速编写、优化程序代码。
  3. 电脑界面操作: 从操作办公软件到远程桌面支持,GPT-5.4 开启了 AI 应用于日常工作场景的新可能。

费用调整与未来计划 💰

API 定价方面,GPT-5.4 输入成本从 GPT-5.2 的每百万 token 1.75 美元涨至 2.50 美元,输出价格从 14 美元涨至 15 美元。虽然定价有所提高,但结合其能力提升,对于需要处理大量专业任务的用户仍具有很高的性价比。

GPT-5.4 于发布日向 ChatGPT Plus、Team 和 Pro 用户开放,并成为默认推理模型。GPT-5.2 Thinking 将在 2026 年 6 月 5 日正式退役。

总结 🌟

GPT模型升级 一直推动着智能技术的前进,而 GPT-5.4 不仅增强了基础性能,还将技术应用拓展到了全新领域。无论是为专业开发者、知识工作者,还是企业解决复杂场景任务,GPT-5.4 都带来了令人期待的未来。

如果你正在寻找更先进、更高效的 AI 解决方案,不妨尝试搭载 GPT-5.4 的应用,它或许能在更多方面助你一臂之力!

文章评论

登录后才能发布评论哦
立即登录/注册
消息提醒
Hello, world! This is a toast message.