文|新熔财经
作者|每文
2022年7月的一个夜晚,姚顺雨第一次将大模型接口与手写的Wikipedia API连接,实现了基于网页的多轮问答。他描述那一刻的感受“就像微弱的电灯突然亮了一样”。彼时,他是OpenAI的一名研究员,亲眼见证了GPT系列从“话都说不利索”到初现智慧曙光的全过程。
四年后,2026年6月5日,当28岁的姚顺雨以腾讯首席AI科学家的身份首次公开亮相时,他需要点亮的,是另一盏灯——一盏被外界认为可能有些“电力不足”的巨轮之灯。
外界对腾讯AI的质疑从未停止:大模型发布晚,声势不如友商,内部赛马消耗,To B业务增长乏力……在AI这场军备竞赛中,那个曾经习惯了“后发制人”的腾讯,似乎动作慢了。尤其是在字节跳动等对手以“大力出奇迹”的姿态席卷AI应用层的当下,腾讯的“姗姗来迟”显得尤为刺眼。
然而,这次姚顺雨和汤道生试图为腾讯AI,甚至为中国AI产业的下半场重新定义那个最核心的问题:当方法不再是秘密,我们到底该为什么而战?
腾讯,丢出了一份关于如何在中国这片土地上,长期、务实、甚至有些“笨拙”地构建AGI组织的宣言。
当“万能锤子”在手,去哪里找钉子?
姚顺雨用了一个极其形象的比喻来描述AI行业的现状,“有了预训练和后训练之后,我们像有了一个万能锤子,可以砸任何钉子。反而更困难的是,怎么寻找好的问题去解决。”
这就是他著名的“AI下半场”理论核心。
上半场,大家为“锤子”的尺寸、重量、材质疯狂内卷,体现在行业里就是无止境的“刷榜竞赛”。各大模型在MMLU、GSM8K等榜单上你追我赶,分数小数点后几位的提升都能被包装成一次“史诗级突破”。这是一种“方法驱动”的集体焦虑,仿佛赢下榜单,就赢下了一切。
腾讯选择在这个时候,由姚顺雨这个天才少年来泼一盆冷水,是深思熟虑的。他直言行业存在“刷榜焦虑”,并主张构建基于真实产品反馈的评估体系。这是一种“平台型思维”的必然转向。
腾讯有什么?有微信、QQ、企业微信、腾讯云,有超过20年积累的、覆盖社交、支付、办公、娱乐的多元场景数据。这些场景,就是最真实、最复杂、也最有价值的“钉子库”。
姚顺雨举了一个例子:腾讯的WorkBuddy企业智能体在落地时发现,高达35%的用户需求涉及多轮模糊交互。这些需求模棱两可、前后关联、意图隐晦,是任何标准测试集都无法暴露的真实世界的复杂性。刷榜刷到满分的大模型,在这种场景下可能表现得像个智障。
所以,腾讯的战略转向,要从“方法中心主义”到“问题中心主义”,不再单纯追求打造一个最强的锤子,而是要利用自己的场景帝国,去发现那些隐藏在企业流程、社交互动、内容创作深处的“真钉子”。
姚顺雨说“寻找好问题”更难,是因为这需要深入产业的毛细血管,需要放下身段去理解那些琐碎的、不性感的、却真实存在的痛点。这才是腾讯这家“连接器”公司,在AI时代本该有的最大护城河。
腾讯终于意识到,与其在别人的赛道上卷参数,不如回到自己的主场重新定义比赛规则。
砍掉30%数据、Taste驱动与“反魔法”叙事
姚顺雨的坦诚,是这场发布会上最锋利的武器。当被问及混元3(HY3 Preview)的关键改进时,他没有大谈神秘的算法突破,反而说:“其实没有什么秘密。今天做大模型从某种程度来说是比较琐碎的事情,我们应该把基础设施做好,把数据做好,算法的部分反而比较简单。”
这番话几乎是对行业浮夸风气的公开处刑。他用三句话总结了混元3的核心:重建预训练基础设施、全面升级数据和评测体系、以及基于品味(Taste)的决策。尤其是那句“砍掉30%低效训练数据提升质量”,实用主义味道拉满。
在大模型训练成本高昂的今天,大多数玩家都在拼命堆数据量,追求我有你没有的规模感。腾讯却反其道而行之,做减法。这意味着他们对自己的数据分类体系和质量评估有了极高的自信,也意味着他们愿意为有效性放弃虚荣指标。这种决策正是姚顺雨所说的“Taste driven”(品味驱动)——它没有清晰的公式,是基于对技术本质的理解、对产品需求的预判,以及一种长期主义的定力。
更有趣的是他对性价比的论述:“性能是性价比的前提。很多人发现用强模型比用差模型更省钱,因为更快把事情做对。”这个观点,直接将行业对“小而美”模型的过度追捧拉回了地面。
在一些厂商在宣传用小模型在特定任务上媲美大模型时,腾讯并不给面子,直接抛出自己的观点,泛化性和鲁棒性才是核心。用一个在某些任务上聪明、在另一些任务上犯傻的模型,最终的综合成本(包括纠错、人工干预、机会成本)可能更高。混元3采用的295B参数混合专家架构,推理效率提升40%,上线两周调用量增长10倍,就是这一理念的绝佳注脚:用最先进的技术架构,解决最实际的问题,追求全局最优,而非局部炫技。
“信任”取代“赛马”
腾讯AI战略调整最深层的部分,或许不在技术,而在组织。姚顺雨毫不避讳地指出,他们打破了内部赛马机制,派出核心算法团队支援元宝等产品线,建立跨部门信任。
“赛马”曾是腾讯产品文化的代名词,微信正是赛马的产物。但在需要重投入、长周期、高度协同的大模型时代,赛马机制带来的内部消耗、资源浪费和目标冲突,已成为致命短板。你能想象让几个团队同时研发原子弹吗?那是灾难。
腾讯此次变革,本质上是将AI研发从“游击队模式”转为“集团军作战”。派出核心算法团队直接嵌入产品线,不仅仅是技术支持,更是一种组织信任的重塑。这背后的逻辑是姚顺雨所倡导的“模型与产品协同设计(Co-Design)”新范式。工程师不再闭门造车,而是亲临战场,听见炮火,直接从产品反馈中获取数据,反哺模型迭代。
目前80%的元宝用户已迁移至新模型,形成了一个“产品数据回流反哺模型迭代”的闭环。这是一个极其健康的生态雏形。它比单纯的“用模型赋能产品”更进一步,是双向赋能。模型是产品的大脑,产品是模型的感官和手脚,两者在数据和场景的血液流动中共同进化。
这或许才是姚顺雨选择腾讯的第一大原因——文化。
他说腾讯是一个基于信任(trust),而不是基于指标(metric)去运转的公司,“大家都非常诚实……这种坦诚、低自我(low ego)、务实的文化,以及对长期主义的坚持,对于长期做一个AI组织来说至关重要。”当一个28岁的科学家,将“诚实”和“低自我”视为构建一个长期AI组织的基石时,我们或许能窥见腾讯这家公司骨子里被互联网快节奏掩盖的一些特质。它们正在这次AI转型中被重新激活。
诗和远方
与其问腾讯是不是慢了,不如问它是否终于想清楚了。姚顺雨和腾讯AI的这次亮相,没有给出颠覆世界的“银弹”,却展示了一个巨人在转身时难得的“诚实”与“务实”。
姚顺雨为腾讯AI的长期布局画了一个“AGI均衡三角”:扎实的基础技术、能够创造价值的产品,以及前沿探索的精神。
前两点,是腾讯正在用“混元3”和“组织变革”去落地的当下。而第三点——前沿探索,则关乎未来。汤道生透露了一个关键数字:腾讯云日均token消耗量已达5万亿,但算力缺口仍达40%。这揭示了AI竞争的残酷,需求爆炸,供给不足,这是一个甜蜜的烦恼,也是中国AI企业面临的基础设施大考。
姚顺雨说:“Coding Agent只是刚刚开始,多模态、具身智能,很多很多新的事情都是刚刚在发生。”他认为未来会变得更多元,而不是更单一,“我不认为ChatGPT和Claude Code会是唯一的超级应用,那是一个非常灰暗的世界。”
这是一个极具想象力的判断。
他将今天的AI时代比作70年代PC刚刚产生的时期,言下之意,真正的“iPhone时刻”远未到来。这恰恰解释了腾讯为何敢“慢”。在一个马拉松式的赛道中,起跑时的领先并不决定终局,关键是不下牌桌,并确保自己跑在正确的方向上。
腾讯的“均衡三角”战略,就是希望构建一个能自我造血、又能仰望星空的稳定结构。用商业产品的现金流滋养前沿探索,用前沿探索的想象力指引商业产品的进化方向。这是一套极其理性的顶层设计,它承认了投入的长期性,也规避了实验室成果无法落地,商业产品缺乏后劲的陷阱。
结语
在中美AI角力最终落地为企业创新能力的今天,中国需要的不仅是能快速推出杀手级应用的公司,更需要像腾讯这样,拥有海量场景、多元生态和资本实力,并愿意沉下心来构建长期AI组织的“产业底座”型玩家。
它的后发,或许正是因为看清了牌桌上的虚妄,选择了一条更慢、更重,但也可能更远的道路。
姚顺雨说,最重要的事情是“能不能诚实面对自己,能不能Be Real”。当这家曾经最擅长“后发先至”的互联网巨头,决定在AI时代做一次“老实人”,故事的下半场,才刚刚开始。
*本文图片均来源于网络