
【林俊旸卸任千问负责人,未来他会去哪?】阿里千问大模型负责人林俊旸自宣卸任,看到这个新闻,突然有种感概,难道从此之后好用的Qwen开源大模型要没落了吗?
就在3月4日的凌晨,Qwen团队的负责人林俊旸在 X 上发文:“me stepping down. bye my beloved qwen”,宣布卸任千问负责人,但没有解释原因。
这个事件,导致整个 AI 圈瞬间炸了。因为很多人都知道——林俊旸几乎就是 Qwen 的技术负责人。从模型发布、benchmark、技术报告到社区互动,过去几年 Qwen 的几乎所有公开活动,都是他在对外发声。
当他在X上说出那句“bye my beloved qwen”,不像是在告别一份工作,而更像是和一件自己参与塑造的作品说再见。
过去几年,Qwen 能在开源社区获得那么多开发者的认可,很大程度上也正是因为这种气质。它不是只做最大的模型、最炫的 benchmark,而是坚持把模型做成完整的尺寸体系,从几百亿参数到不到 1B 的小模型都认真打磨,让普通开发者也能跑起来。直接养活了成千上百的小公司。让我们这些普通程序员也能够用上好的开源大模型
所以当他说出那句告别时,很多人感到惋惜,在现在这个浮躁的时代,那种纯粹把技术做到极致的工程师气质,本身就越来越稀缺了。
一个 32 岁的 P10
林俊旸是谁?他毕业于北京大学计算机,硕士阶段在北京大学外国语学院完成。其研究领域涵盖自然语言处理与多模态表示学习,在NeurIPS、ICML、ACL等顶级会议发表多篇论文。
他同时也是阿里历史上最年轻的 P10 技术负责人。这在 AI 行业,这其实是一个非常罕见的轨迹。
他不是海归博士,也不是传统的学术明星路线,真正算得上是在本土成长起来的 AI 技术领袖。
而且他得经历基本是和Qwen一起成长得。很多人可能不知道,Qwen 的历史其实并不长。
在2020年Qwen 项目正式立项,同时他在2022年升任技术负责人,并且一直主导 Qwen 系列全面开源从 Beta 版本开始,到现在的 Qwen2 / Qwen3 系列,短短几年时间,Qwen 已经成为全球最活跃的开源模型体系之一。
从官方数据就可以看到,Qwen在开源界取得了很好得成绩。其中
HuggingFace 下载量 超过 6 亿
衍生模型 超过 17 万
覆盖语言、视觉、音频、代码、数学、Agent 等多模态能力
很多开发者如果想要用大模型,第一时间就会想到是 Qwen,尤其是创业公司和独立开发者。
因为 Qwen 做了一件很多人不愿意做的事情:坚持全尺寸模型。从 0.xB 的小模型到上百 B 的大模型,Qwen 几乎把整个参数区间都完整地铺了一遍。
在大模型竞争最激烈的那几年,几乎所有团队都在拼同一件事:谁的模型更大,谁的 benchmark 更高。因为这些指标最容易形成技术影响力。但是想象也知道,像我们这种普通开发者的硬件天花板可能只是一张 3080或者一台普通云服务器。如果一个模型只有超大版本,那它再强,对很多人来说也只是一个“看得见但用不了”的东西。
而 Qwen 选择了一条完全不同的路线。它不仅做大模型,还会把同样的能力往下压缩,做出了各种各样尺寸的模型给我们普通开发者使用。这些模型未必会出现在最耀眼的 benchmark 排行里,但却可以真正跑在我们每一个人的电脑上。
这也是为什么很多开发者第一次接触大模型时,很自然就会选择 Qwen。在开源世界里,有一种很朴素的评价标准:不是谁做出了最强的工具,而是谁让最多的人能够使用这个工具。
从这个角度来看,Qwen 坚持全尺寸模型这件事,本质上是在做一件很纯粹的事情:把顶级 AI 的门槛不断往下拉。百亿模型代表的是技术的上限,而那些不到 1B 的小模型,代表的则是技术真正被普及的可能。
离职背后的原因:组织结构与技术理念的分歧
从目前披露的信息来看,林俊旸离开的一个重要背景,很可能与 通义实验室近期的组织结构调整有关。
过去几年,Qwen 团队一直采用的是一种 垂直整合(vertical integration)的研发结构。也就是说,一个核心团队同时负责模型研发链条中的多个关键环节,包括:
预训练(Pre-training)
后训练(Post-training)
多模态能力
训练与推理基础设施(Infra)
这种模式的优势在于,研发链条非常紧密。预训练、后训练、系统优化和模型能力之间可以快速联动,团队内部的沟通成本也更低。
但近期通义实验室计划进行组织调整,将原本垂直整合的结构,拆分为 水平分工(horizontal specialization) 的模式。例如:
独立的预训练团队
独立的后训练团队
文本模型团队
多模态团队
这些团队依然隶属于通义实验室,但彼此之间的职责更加清晰、边界更加明确。
这就意味着,原本由林俊旸直接统筹的一整条模型研发链条,被拆分成多个独立团队。
从管理层面来看,他所负责的范围自然会缩小。
而从林俊旸过去公开表达的一些观点来看,他其实更倾向于另一种研发思路——
预训练、后训练以及基础设施团队应该保持高度整合。
在他看来,大模型研发是一项高度耦合的工程,如果拆分得过于细致,可能会增加沟通成本,降低整体迭代效率。
当组织结构的设计理念,与技术负责人的判断出现差异时,分歧也就难以避免。
写在最后
林俊旸目前尚未透露下一步的去向,阿里方面也还没有对 Qwen 团队未来的组织安排作出公开回应。
不过,从他今天在朋友圈的一段话来看,整体基调仍然是积极和克制的。他写道:
“qwen 的兄弟们,按照原来安排继续干,没问题的。”
这样说明,Qwen 的技术节奏不会因为个人离开而被打断。
从产品层面来看,Qwen 的研发管线依然在正常推进。 Qwen3.5 系列刚刚完成开源发布,而千问 App 的用户规模也仍在持续增长。过去几年里,林俊旸和团队一起打下的技术基础,包括模型架构、训练流程以及完整的尺寸体系,都已经形成了一套稳定的技术底盘。
换句话说,阿里在大模型方向仍然在持续补充顶级研究力量。
当然,从情感层面来说,阿里失去林俊旸无疑是一件令人遗憾的事情。 但在大模型技术仍处于快速迭代阶段的今天,任何团队过去取得的成绩,都无法保证未来的领先。对一家大型科技公司而言,技术路线、组织结构和商业目标之间始终需要不断调整和平衡。
对于全球开源社区的开发者来说,他们不舍的其实不仅仅是一位技术负责人。
更多的是一个 可以直接交流、能够代表团队发声的人。在过去几年里,林俊旸通过技术报告、模型发布和社区互动,让很多开发者第一次感觉到,大模型团队并不是遥远的实验室,而是一个可以对话、可以参与的开放社区。
在 AI 竞争越来越激烈的今天,这种建立在 专业能力与真诚沟通之上的人格化信任,其实是一种非常稀缺的资产。
但这种资产并不会完全依赖某一个人。 作为最早、也是最坚定走在开源路线上的大模型体系之一,Qwen 已经与全球开发者社区形成了深度绑定。开源精神、工程文化以及开发者生态,都是多年积累形成的。
因此可靠配资开户最新,即便个人离开,这种文化本身也不会在一夜之间改变。


博星优配提示:文章来自网络,不代表本站观点。