阿里千问大模型团队重组,核心负责人变动:郁博文转投字节跳动

近日,原阿里通义实验室 Qwen 大模型后训练负责人郁博文辞职加盟字节跳动,引发业内广泛关注。这一人事变动不仅将对字节跳动的布局起到重要推动作用,也促使阿里对其 千问大模型 团队进行了全面调整。

郁博文为何选择加入字节跳动?

郁博文为中科院博士,并于 2022 年以“阿里星”身份加入达摩院,长期专注于大模型的对齐优化、指令微调以及用户体验提升,尤其在后训练环节积累了丰富经验。此次加入字节跳动 Seed 团队,将负责视觉模型与多模态交互的后训练工作。多模态交互是人工智能领域的重要研究方向,郁博文的加入预计将助推字节在此领域的技术沉淀与实用化进程。

阿里对千问大模型的改革与调整

郁博文离职后,阿里迅速对通义实验室和千问团队进行管理重组。据 3 月 9 日媒体报道,这次调整主要集中在以下两方面:

  • 团队代管安排:阿里云 CTO 周靖人暂时代管通义实验室的整体团队。在任期间,他将深入了解 Qwen 大模型 所需的资源,全面提升团队间协作效率。
  • 职责整合:千问模型预训练的负责人刘大一恒,同时接管后训练与 Coding 团队,全面负责后续的技术迭代工作,以确保大模型的用户体验质量与创新。

深度学习团队变动的行业影响

阿里千问大模型的发展备受行业期待,此次调整显然意义重大:

  1. 周靖人的管理风格:作为阿里云 CTO,他对综合技术开发和团队资源协调拥有丰富经验,代管千问团队或将提升 通义实验室 在技术积累上的效率。
  2. 刘大一恒的双重职责:将预训练与后训练整合,统一管理,可减少部门间沟通的冗余,加快千问模型从研发到商业化的迭代速度。

未来的可能趋势

此次变动不仅体现了人工智能领域的激烈竞争,也展现了企业内部灵活调整机制的必要性。郁博文的加入将进一步增强字节跳动在视觉模型多模态交互领域的实力,而阿里通过团队重组,显然在为大模型的快速迭代铺路。未来,不论是 Qwen 还是 Seed,人工智能技术与应用的竞争都将更加激烈。

阿里与字节的这场“竞速赛”无疑会推动全行业的创新步伐。接下来,让我们拭目以待两大巨头在技术和应用落地上的持续较量。

文章评论

登录后才能发布评论哦
立即登录/注册
消息提醒
Hello, world! This is a toast message.