Skip to content
汤道生 × 姚顺雨对谈实录:AI 下半场,腾讯如何赢得这场长跑?

汤道生 × 姚顺雨对谈实录:AI 下半场,腾讯如何赢得这场长跑?

June 8, 2026

组织形态

腾讯集团副总裁汤道生与腾讯混元大模型负责人姚顺雨,围绕 AI“下半场”、模型与产品协同设计(Co-design)以及智能体(Agent)的未来展开了一场深度对话。这场对谈不只是技术层面的探讨,更是一次关于组织文化、产品哲学与长期主义的深刻碰撞。


🎯 什么是 AI 的“下半场”?

姚顺雨在加入腾讯之前,就已提出了“AI 下半场”这一概念。他坦言,这个词近来有被滥用的趋势,因此有必要重新厘清其本质含义。

下半场的核心转变:从“找方法”到“找问题”。

在过去几十年的 AI 发展中,研究者的主要精力集中在如何解决问题、寻找更好的方法论​。例如,AlphaGo 解决围棋问题,专用翻译模型解决翻译问题——方法与问题一一对应,彼此割裂。

但随着预训练与后训练范式的成熟,AI 拥有了一把“万能锤子”。方法论不再稀缺,反而是寻找值得解决的好问题变得愈发困难。这,就是 AI 下半场的本质。

“方法论已经非常成熟,寻找问题变得更加困难。” —— 姚顺雨

姚顺雨选择加入腾讯,正是因为这里有海量真实的业务场景和产品矩阵,能够提供源源不断的“好问题”。此外,他特别强调了 Context(上下文) 的战略价值:

  • 模型越来越擅长将复杂输入转化为精准输出
  • 竞争壁垒的核心在于你是否拥有那个最原始的输入
  • 你是否了解用户在做什么、企业有哪些深层信息

腾讯在这一维度上具有天然优势。


🏗️ 构建均衡的 AI 组织:三角形结构

姚顺雨认为,要在 AI 下半场取胜,必须构建一个均衡发展的三角形组织​,三个顶点分别是:

维度核心任务关键要素
Foundation(基础)做好预训练与后训练充足资源 + 正确的做事方式
Product(产品)让技术真正为人与社会创造价值产品 sense + 精英人才
Frontier(前沿探索)探索新研究范式与新机会想象力 + 探索精神
“我们要在中国建立一个长期的、基于 AGI 的组织。” —— 姚顺雨

他同时坦言,中国目前在 Frontier exploration(前沿探索) 方面做得还不够,这是未来需要重点补强的方向。


🤝 产品与模型的深度 Co-design

汤道生提出了一个在内部会议中频繁出现的关键词 —— Co-design(协同设计)​。如何让产品与模型紧密结合,是混元团队面临的核心命题。

💬 姚顺雨的三点心法

第一:模型本身要做得足够 Solid

预训练是产品无关(Product Agnostic)的工作,其最大价值在于可泛化的学习​——它的进步能持续惠及所有下游任务。

后训练的关键则在于建立正确的 Eval(评估体系)​。姚顺雨直言,中国业界有一个不好的倾向——​过度追求刷榜​。真正有价值的 Eval,应该基于真实的产品场景和用户需求构建,而非仅仅优化榜单数据。

第二:建立产品方与模型方的深度互信

Co-design 最难的部分不是技术,而是信任的建立​。姚顺雨分享了一个关键案例:在混元自身预训练尚未完成时,团队毅然派出后训练最强的骨干力量,帮助元宝先把后训练做好。

“很多同学当时不理解,但现在看来,这些努力都 pay off 了。” —— 姚顺雨

这一举动让产品团队切实感受到:模型团队是真正在为产品着想。这种信任,成为后续深度合作的基石。

第三:理解 LLM 时代的泛化性

在 LLM 之前,做翻译就准备翻译数据,做围棋就准备围棋数据,泾渭分明。但今天,即使只想做一个 Coding Agent​,也需要:

  • 强大的聊天能力
  • 精准的搜索能力
  • 严格的指令遵循能力
  • 深度的推理能力

这意味着,腾讯多元产品矩阵(元宝、混元、WorkBuddy 等)所提供的不同类型数据可以相互泛化​,形成一个网络化的数据体系,其价值将随时间指数级放大。

📊 真实场景反馈 vs. 标准 Benchmark

汤道生补充道,真实世界数据能带来榜单无法覆盖的三大价值:

  1. 发现底线问题​:用户的真实 Prompt 往往模糊、多轮,而 Benchmark 题目通常精确、单轮,两者存在显著分布差异
  2. 理解真实 Prompt 分布​:现实中用户提问简短、追问不断,这能启发更贴近实际的训练方式
  3. 激发新研究方向​:例如元宝的反馈推动了团队在 Context Learning 方向的深入探索

💡 做产品的第一性原理:穿越时代的不变之道

当姚顺雨反问汤道生“做产品的第一性原理是什么”时,汤道生给出了他跨越 PC 互联网、移动互联网、产业互联网到 AI 时代的核心答案:

“最终还是要回到用户有什么需求,我怎么去解决他的痛点,怎么给用户或客户创造价值。” —— 汤道生

不变的是:​ 以用户需求为核心,倾听用户声音。

变化的是:​ 产品交互范式与研发流程。

🔄 AI 时代产品研发的四大变革

维度非 AI 时代AI 时代
交互方式菜单/界面选择(“预制菜”)自然语言/语音开放式交互
开发流程瀑布式,规格清晰实验驱动,快速迭代
工程师角色大量时间写代码更多时间做架构设计,代码交给 AI
测试方式后置测试测试前置​,Eval 先行

汤道生强调,AI 时代要求产品团队 “测试左移” —— 在设计阶段就想清楚评测标准、Alignment 目标和用户期望的风格,而非等到开发完成后再测试。


🤖 智能体(Agent)的演进与未来

作为 ReAct1 架构的提出者,姚顺雨的博士论文早在 2019 年就预言了今天的 Agent 时代。

📜 一个预言者的自我回顾

姚顺雨的博士论文标题是: 《Language Agent: From Next Token Prediction to Digital Automation》​。

彼时 GPT-2 刚刚问世,生成的文字尚且磕磕绊绊。但姚顺雨已经笃信: “Next Token Prediction 是个极简且通用的事情,有一天它的潜力不仅在于预测下一个词,而是把这个世界上所有的事情全部自动化。”

2022 年 7 月的某个夜晚,他将 PaLM 的 API 与手写的 Wikipedia API 连接在一起,实现了 LLM 与真实互联网的首次多轮交互​。

“就像那根微弱的灯丝突然亮了。我感觉这个东西,可能在 5 年或 10 年内会改变这个世界。但实际上,比我想象中还要快。” —— 姚顺雨

他博士论文结尾列出的四大 Future Direction,如今正一一成真:

  1. Train models for agent
  2. Safe and robust deployment
  3. Scientific discovery
  4. Help human

🚀 混元在 Agent 方向的差异化策略

姚顺雨认为,Coding Agent 今天就像预训练一样,是必须做好的基础能力​——因为它具备图灵完备性:当模型能控制文件系统、拥有容器时,它就是一个完整的自动化系统。

混元的差异化做法体现在三点:

  1. 强调体系全面化​:不会只做 Coding 数据,因为泛化性是大模型的核心价值
  2. 重视线上回流​:充分利用产品端的真实数据反哺模型训练
  3. 保持探索性​:在技术演进、产品眼界和范式创新上保持想象力

💰 关于 Token 效率与性价比

面对用户日益增长的“Token 焦虑”,姚顺雨给出了清醒的判断:

性价比的第一要素不是模型架构,而是性能(Performance)本身。 —— 姚顺雨

很多用户最终发现,使用性能更强的大模型反而更省钱——因为它能一次把问题做对,节省了人力和反复调用的成本。

真正的性价比公式:​高 Robustness(简单任务一次做对)>炫技式长尾能力提升​。


🏃 组织进化:小团队敏捷制胜

汤道生在梳理 WorkBuddy 的组织架构时,发现了与传统产品团队截然不同的形态:

  • 极度扁平化​:3-5 人小团队围绕特定领域攻坚
  • 实验驱动​:大量实验,容忍失败,从试错中提炼真知
  • 角色融合​:工程师越来越像“有想法的 Leader”,驱动多个 Coding Agent 完成研发任务
  • AI 基础设施支撑​:为小团队提供快速实验的能力土壤
“今天每个工程师都更像产品经理,他需要理解用户需求,然后驱动 AI 去实现。” —— 汤道生

🌟 长跑中的腾讯:务实、诚实、长期主义

对谈的最后,两人回归到最根本的问题:​AI 下半场,腾讯凭什么?

两个关键判断:

判断一:AI 是长期游戏,不是短期游戏。

姚顺雨直言,他不认为 ChatGPT 和 Claude Code 会是唯一的 Super App。今天的 AI 就像 70 年代 PC 刚刚诞生——还有无数机会尚未被发现,下半场才刚刚开始。

判断二:AI 的未来是多元的,不是线性的。

虽然过去几年有一条清晰的主线(预训练→后训练→RL→Agent),但多模态、具身智能等新方向正在涌现。未来的竞争将是多维度、多赛道的​。

腾讯的核心竞争力:

  • 丰富的 Context 生态​:多年积累的多元产品场景,为模型提供无可替代的真实上下文
  • 务实诚实的文化​:知道哪里做得好、哪里做得不好,敢于直面问题
  • 长期主义​:基于信任而非指标运营,这对于构建长期 AI 组织至关重要
“能不能诚实地面对自己,能不能 be real,能不能看到 feedback 就去改变,能不能保持耐心——这些才是下半场更重要的事情。” —— 姚顺雨

📚 核心术语速查

术语释义
预训练 / 后训练AI 构建的两阶段:预训练建立通用知识基础,后训练通过指令微调与人类反馈对齐特定需求
智能体 Agent能自主调用工具、执行复杂任务的 AI 实体,是通往数字与物理世界自动化的关键路径
Benchmark 基准测试衡量模型能力的标准化考题,有参考价值但容易饱和,需结合真实业务数据补充
泛化性 Generalization模型将学到的能力迁移到不同领域的能力,是 LLM 时代最核心的竞争力之一
Co-design 协同设计模型团队与产品团队深度协作,通过互信、换位思考和数据回流实现相互成就
Context 上下文AI 时代的核心竞争壁垒,决定模型能否精准理解用户真实意图与场景需求
Last updated on