林俊旸离职后首度发声:从推理模型到智能体时代的深刻复盘
近日,阿里千问原负责人林俊旸在离职后首次发文分享了其对人工智能未来发展的深层思考。从推理模型到智能体思维,他归纳了过去两年的行业研究与趋势,并指出AI未来迈向智能体时代所需的关键转变。
千问的尝试与教训
林俊旸在文章中提到千问团队曾实施的一项探索——将“thinking”和“instruct”两种模式整合为一个模型。尤其以Qwen3为例,这是混合思维模式的公开尝试之一。然而,这种整合在实际应用中却带来了弊端:一方面,“thinking”变得过于复杂、拖沓,失去了效率;另一方面,“instruct”则显得不够果断且可靠,同时还伴随着更高的成本。
林俊旸认为,这些经验教训意义重大,因为它揭示了在推理与操作之间寻求平衡的难度。
推理模型已完成首阶段使命
林俊旸总结了语言推理模型领域过去两年的突破。他提到OpenAI的o1和DeepSeek-R1为行业确立了重要的实践路径,通过强化学习推动语言模型具备推理能力。这种强化学习的关键在于提供确定性强、可规模化的反馈信号,并在实验之外实现了推理的实践和推广。
他指出,这个阶段的重点已完成,接下来的发展方向在于用强化的智能体概念替代传统的推理思维。
从推理思维到智能体思维
林俊旸提出的“Agentic Thinking”(智能体式思维)是未来人工智能发展的核心。他总结了智能体与传统推理模型的显著区别:
- 动态决策能力:智能体需要判断何时停止思考并投入行动,这种能力比简单的答案输出更加复杂。
- 容错性与反馈:智能体能够在不完美的环境反馈中调整,而不是完全推倒重来。
- 多轮交互连贯性:在复杂任务中,智能体需要跨越多轮对话和多次操作维持任务连贯。
- 动态规划:选择工具、调用顺序等操作更偏向规划,而非简单的函数调用。
他用一句话总结这一转变的核心理念:“从想更久到为了行动而想。”
未来AI发展趋势:训练智能体
林俊旸进一步指出,未来的竞争并不单单来自更优秀的模型,而是来自更复杂的环境设计、更强的技术工程能力,以及多个智能体的高效编排。他认为,人工智能的进化路径将从传统的模型训练转向智能体训练,最终走向整个系统的训练。
他还特别提到,OpenAI的o1验证了“思考能力”可以成为一种独立训练并开放给用户的能力,而DeepSeek-R1则展示了这一能力如何落地与规模化。行业需要更宽广的视野,从单纯的推理模式迈向以智能体为中心的动态规划和交互设计。
总结与展望
作为人工智能领域的重要实践者与推动者,林俊旸的这次发声不仅复盘了千问团队的经验得失,也为行业提供了面向未来的深刻洞见。在他看来,从推理模型到智能体思维的升级将开启人工智能的下一个黄金时代。无论是开发者还是研究者,都需要跳出算法本身,去搭建更真实、更连贯的人工智能系统。
创建: 2026-03-27
登录后才能发布评论哦
立即登录/注册