DeepMind首席执行官揭秘:世界模型是通往AGI的关键钥匙

谷歌DeepMind在人工智能领域的动作频频,在Gemini 3 Pro和Nano Banana Pro相继亮相后,AI领域的热度持续攀升。然而,DeepMind首席执行官兼联合创始人Demis Hassabis(戴密斯·哈萨比斯)近期的一次采访中,透露了他们目前投入最多精力的研究方向——世界模型。他明确指出,世界模型是实现通用人工智能(AGI)的关键组成部分。

世界模型:通往AGI的必经之路

Demis Hassabis强调,他目前将大量精力投入到世界模型的研究中。他认为,虽然Gemini等大模型取得了巨大成功,但要迈向AGI,必须依靠更深层次的理解和模拟能力。世界模型,正是提供这种能力的核心。

这种模型的核心思想是让AI系统能够理解和预测物理世界的运行规律。哈萨比斯以SIMA 2为例,称之为“在Genie思维中玩的SIMA”,表明了世界模型与现有AI技术(如基于Gemini技术的智能体)的深度融合与扩展。

  • 内部应用广泛: 谷歌内部已开始利用世界模型来训练其他AI智能体和机器人,为复杂的现实操作提供模拟环境。
  • 外部潜力巨大: 世界模型不仅服务于内部研究,未来也将催生出色的外部应用场景,重塑人机交互和自动化领域。

Genie 3:世界模型的“代表作”

在世界模型的探索中,Genie系列模型是DeepMind的“试验田”和“代表作”。Genie从最初的2D环境模拟,快速迭代升级到能够实时生成交互式3D环境的Genie 3。

Genie 3的能力令人瞩目。用户只需通过简单的指令,Genie 3就能在720p分辨率下创造一个动态、可供探索的3D虚拟世界。更重要的是,它能保持长达一分钟的场景连贯性和记忆一致性,这对于需要长时间、稳定交互的AI应用至关重要。

通过学习 虚拟世界 的运行规则,Genie 3能为AI智能体提供高度仿真的训练场景,这极大地加速了机器人在复杂环境中的学习和适应能力。

何时迎来“ChatGPT时刻”?

当被问及世界模型是否会像ChatGPT那样迎来爆发性增长时,哈萨比斯给出了肯定的答案。但他同时也指出了当前面临的两大瓶颈,只有突破这些限制,世界模型才能真正迎来“ChatGPT时刻”。

突破瓶颈的关键在于:

  1. 降低推理/服务成本: 当前运行复杂世界模型所需的高昂计算资源是制约其大规模普及的主要因素。
  2. 实现长时间一致性: 模型需要确保在长时间的模拟和交互过程中,保持高度的物理和逻辑一致性,不能出现“失真”或“崩溃”。

世界模型对AI发展的意义

世界模型的突破,意味着AI系统将不再仅仅停留在“识别”和“生成”层面,而是开始具备“理解”和“预测”世界的能力。这对于提升 AI智能体 的自主性和解决复杂问题的能力至关重要。

哈萨比斯对 DeepMind 在这一领域的投入充满信心。他相信,通过世界模型,AI将能够更高效地学习和适应现实环境,无论是用于机器人控制,还是自动驾驶系统,都将带来质的飞跃。这不仅是技术上的进步,更是迈向更高级别 AGI 的关键一步。我们有理由期待,在攻克成本和一致性难题后,世界模型将为我们展现出前所未有的AI应用前景。

文章评论

登录后才能发布评论哦
立即登录/注册
消息提醒
Hello, world! This is a toast message.