汤道生 × 姚顺雨对谈实录：AI 下半场，腾讯如何赢得这场长跑？

June 8, 2026

组织形态

腾讯集团副总裁汤道生与腾讯混元大模型负责人姚顺雨，围绕 AI“下半场”、模型与产品协同设计（Co-design）以及智能体（Agent）的未来展开了一场深度对话。这场对谈不只是技术层面的探讨，更是一次关于组织文化、产品哲学与长期主义的深刻碰撞。

🎯 什么是 AI 的“下半场”？

姚顺雨在加入腾讯之前，就已提出了“AI 下半场”这一概念。他坦言，这个词近来有被滥用的趋势，因此有必要重新厘清其本质含义。

下半场的核心转变：从“找方法”到“找问题”。

在过去几十年的 AI 发展中，研究者的主要精力集中在如何解决问题、寻找更好的方法论。例如，AlphaGo 解决围棋问题，专用翻译模型解决翻译问题——方法与问题一一对应，彼此割裂。

但随着预训练与后训练范式的成熟，AI 拥有了一把“万能锤子”。方法论不再稀缺，反而是寻找值得解决的好问题变得愈发困难。这，就是 AI 下半场的本质。

“方法论已经非常成熟，寻找问题变得更加困难。” —— 姚顺雨

姚顺雨选择加入腾讯，正是因为这里有海量真实的业务场景和产品矩阵，能够提供源源不断的“好问题”。此外，他特别强调了 Context（上下文） 的战略价值：

模型越来越擅长将复杂输入转化为精准输出
竞争壁垒的核心在于你是否拥有那个最原始的输入
你是否了解用户在做什么、企业有哪些深层信息

腾讯在这一维度上具有天然优势。

🏗️ 构建均衡的 AI 组织：三角形结构

姚顺雨认为，要在 AI 下半场取胜，必须构建一个均衡发展的三角形组织，三个顶点分别是：

维度	核心任务	关键要素
Foundation（基础）	做好预训练与后训练	充足资源 + 正确的做事方式
Product（产品）	让技术真正为人与社会创造价值	产品 sense + 精英人才
Frontier（前沿探索）	探索新研究范式与新机会	想象力 + 探索精神

“我们要在中国建立一个长期的、基于 AGI 的组织。” —— 姚顺雨

他同时坦言，中国目前在 Frontier exploration（前沿探索） 方面做得还不够，这是未来需要重点补强的方向。

🤝 产品与模型的深度 Co-design

汤道生提出了一个在内部会议中频繁出现的关键词 —— Co-design（协同设计）。如何让产品与模型紧密结合，是混元团队面临的核心命题。

💬 姚顺雨的三点心法

第一：模型本身要做得足够 Solid

预训练是产品无关（Product Agnostic）的工作，其最大价值在于可泛化的学习——它的进步能持续惠及所有下游任务。

后训练的关键则在于建立正确的 Eval（评估体系）。姚顺雨直言，中国业界有一个不好的倾向——过度追求刷榜。真正有价值的 Eval，应该基于真实的产品场景和用户需求构建，而非仅仅优化榜单数据。

第二：建立产品方与模型方的深度互信

Co-design 最难的部分不是技术，而是信任的建立。姚顺雨分享了一个关键案例：在混元自身预训练尚未完成时，团队毅然派出后训练最强的骨干力量，帮助元宝先把后训练做好。

“很多同学当时不理解，但现在看来，这些努力都 pay off 了。” —— 姚顺雨

这一举动让产品团队切实感受到：模型团队是真正在为产品着想。这种信任，成为后续深度合作的基石。

第三：理解 LLM 时代的泛化性

在 LLM 之前，做翻译就准备翻译数据，做围棋就准备围棋数据，泾渭分明。但今天，即使只想做一个 Coding Agent，也需要：

强大的聊天能力
精准的搜索能力
严格的指令遵循能力
深度的推理能力

这意味着，腾讯多元产品矩阵（元宝、混元、WorkBuddy 等）所提供的不同类型数据可以相互泛化，形成一个网络化的数据体系，其价值将随时间指数级放大。

📊 真实场景反馈 vs. 标准 Benchmark

汤道生补充道，真实世界数据能带来榜单无法覆盖的三大价值：

发现底线问题：用户的真实 Prompt 往往模糊、多轮，而 Benchmark 题目通常精确、单轮，两者存在显著分布差异
理解真实 Prompt 分布：现实中用户提问简短、追问不断，这能启发更贴近实际的训练方式
激发新研究方向：例如元宝的反馈推动了团队在 Context Learning 方向的深入探索

💡 做产品的第一性原理：穿越时代的不变之道

当姚顺雨反问汤道生“做产品的第一性原理是什么”时，汤道生给出了他跨越 PC 互联网、移动互联网、产业互联网到 AI 时代的核心答案：

“最终还是要回到用户有什么需求，我怎么去解决他的痛点，怎么给用户或客户创造价值。” —— 汤道生

不变的是： 以用户需求为核心，倾听用户声音。

变化的是： 产品交互范式与研发流程。

🔄 AI 时代产品研发的四大变革

维度	非 AI 时代	AI 时代
交互方式	菜单/界面选择（“预制菜”）	自然语言/语音开放式交互
开发流程	瀑布式，规格清晰	实验驱动，快速迭代
工程师角色	大量时间写代码	更多时间做架构设计，代码交给 AI
测试方式	后置测试	测试前置，Eval 先行

汤道生强调，AI 时代要求产品团队 “测试左移” —— 在设计阶段就想清楚评测标准、Alignment 目标和用户期望的风格，而非等到开发完成后再测试。

🤖 智能体（Agent）的演进与未来

作为 ReAct¹ 架构的提出者，姚顺雨的博士论文早在 2019 年就预言了今天的 Agent 时代。

📜 一个预言者的自我回顾

姚顺雨的博士论文标题是： 《Language Agent: From Next Token Prediction to Digital Automation》。

彼时 GPT-2 刚刚问世，生成的文字尚且磕磕绊绊。但姚顺雨已经笃信： “Next Token Prediction 是个极简且通用的事情，有一天它的潜力不仅在于预测下一个词，而是把这个世界上所有的事情全部自动化。”

2022 年 7 月的某个夜晚，他将 PaLM 的 API 与手写的 Wikipedia API 连接在一起，实现了 LLM 与真实互联网的首次多轮交互。

“就像那根微弱的灯丝突然亮了。我感觉这个东西，可能在 5 年或 10 年内会改变这个世界。但实际上，比我想象中还要快。” —— 姚顺雨

他博士论文结尾列出的四大 Future Direction，如今正一一成真：

Train models for agent
Safe and robust deployment
Scientific discovery
Help human

🚀 混元在 Agent 方向的差异化策略

姚顺雨认为，Coding Agent 今天就像预训练一样，是必须做好的基础能力——因为它具备图灵完备性：当模型能控制文件系统、拥有容器时，它就是一个完整的自动化系统。

混元的差异化做法体现在三点：

强调体系全面化：不会只做 Coding 数据，因为泛化性是大模型的核心价值
重视线上回流：充分利用产品端的真实数据反哺模型训练
保持探索性：在技术演进、产品眼界和范式创新上保持想象力

💰 关于 Token 效率与性价比

面对用户日益增长的“Token 焦虑”，姚顺雨给出了清醒的判断：

性价比的第一要素不是模型架构，而是性能（Performance）本身。 —— 姚顺雨

很多用户最终发现，使用性能更强的大模型反而更省钱——因为它能一次把问题做对，节省了人力和反复调用的成本。

真正的性价比公式：高 Robustness（简单任务一次做对）> 炫技式长尾能力提升。

🏃 组织进化：小团队敏捷制胜

汤道生在梳理 WorkBuddy 的组织架构时，发现了与传统产品团队截然不同的形态：

极度扁平化：3-5 人小团队围绕特定领域攻坚
实验驱动：大量实验，容忍失败，从试错中提炼真知
角色融合：工程师越来越像“有想法的 Leader”，驱动多个 Coding Agent 完成研发任务
AI 基础设施支撑：为小团队提供快速实验的能力土壤

“今天每个工程师都更像产品经理，他需要理解用户需求，然后驱动 AI 去实现。” —— 汤道生

🌟 长跑中的腾讯：务实、诚实、长期主义

对谈的最后，两人回归到最根本的问题：AI 下半场，腾讯凭什么？

两个关键判断：

判断一：AI 是长期游戏，不是短期游戏。

姚顺雨直言，他不认为 ChatGPT 和 Claude Code 会是唯一的 Super App。今天的 AI 就像 70 年代 PC 刚刚诞生——还有无数机会尚未被发现，下半场才刚刚开始。

判断二：AI 的未来是多元的，不是线性的。

虽然过去几年有一条清晰的主线（预训练→后训练→RL→Agent），但多模态、具身智能等新方向正在涌现。未来的竞争将是多维度、多赛道的。

腾讯的核心竞争力：

丰富的 Context 生态：多年积累的多元产品场景，为模型提供无可替代的真实上下文
务实诚实的文化：知道哪里做得好、哪里做得不好，敢于直面问题
长期主义：基于信任而非指标运营，这对于构建长期 AI 组织至关重要

“能不能诚实地面对自己，能不能 be real，能不能看到 feedback 就去改变，能不能保持耐心——这些才是下半场更重要的事情。” —— 姚顺雨

📚 核心术语速查

术语	释义
预训练 / 后训练	AI 构建的两阶段：预训练建立通用知识基础，后训练通过指令微调与人类反馈对齐特定需求
智能体 Agent	能自主调用工具、执行复杂任务的 AI 实体，是通往数字与物理世界自动化的关键路径
Benchmark 基准测试	衡量模型能力的标准化考题，有参考价值但容易饱和，需结合真实业务数据补充
泛化性 Generalization	模型将学到的能力迁移到不同领域的能力，是 LLM 时代最核心的竞争力之一
Co-design 协同设计	模型团队与产品团队深度协作，通过互信、换位思考和数据回流实现相互成就
Context 上下文	AI 时代的核心竞争壁垒，决定模型能否精准理解用户真实意图与场景需求

↩︎

Last updated on June 8, 2026

从象牙塔到千家万户 “大众学术”正在改写知识生产规则挑战2026年高考数学压轴大题