汤道生 × 姚顺雨对谈实录:AI 下半场,腾讯如何赢得这场长跑?

腾讯集团副总裁汤道生与腾讯混元大模型负责人姚顺雨,围绕 AI“下半场”、模型与产品协同设计(Co-design)以及智能体(Agent)的未来展开了一场深度对话。这场对谈不只是技术层面的探讨,更是一次关于组织文化、产品哲学与长期主义的深刻碰撞。
🎯 什么是 AI 的“下半场”?
姚顺雨在加入腾讯之前,就已提出了“AI 下半场”这一概念。他坦言,这个词近来有被滥用的趋势,因此有必要重新厘清其本质含义。
下半场的核心转变:从“找方法”到“找问题”。
在过去几十年的 AI 发展中,研究者的主要精力集中在如何解决问题、寻找更好的方法论。例如,AlphaGo 解决围棋问题,专用翻译模型解决翻译问题——方法与问题一一对应,彼此割裂。
但随着预训练与后训练范式的成熟,AI 拥有了一把“万能锤子”。方法论不再稀缺,反而是寻找值得解决的好问题变得愈发困难。这,就是 AI 下半场的本质。
姚顺雨选择加入腾讯,正是因为这里有海量真实的业务场景和产品矩阵,能够提供源源不断的“好问题”。此外,他特别强调了 Context(上下文) 的战略价值:
- 模型越来越擅长将复杂输入转化为精准输出
- 竞争壁垒的核心在于你是否拥有那个最原始的输入
- 你是否了解用户在做什么、企业有哪些深层信息
腾讯在这一维度上具有天然优势。
🏗️ 构建均衡的 AI 组织:三角形结构
姚顺雨认为,要在 AI 下半场取胜,必须构建一个均衡发展的三角形组织,三个顶点分别是:
| 维度 | 核心任务 | 关键要素 |
|---|---|---|
| Foundation(基础) | 做好预训练与后训练 | 充足资源 + 正确的做事方式 |
| Product(产品) | 让技术真正为人与社会创造价值 | 产品 sense + 精英人才 |
| Frontier(前沿探索) | 探索新研究范式与新机会 | 想象力 + 探索精神 |
他同时坦言,中国目前在 Frontier exploration(前沿探索) 方面做得还不够,这是未来需要重点补强的方向。
🤝 产品与模型的深度 Co-design
汤道生提出了一个在内部会议中频繁出现的关键词 —— Co-design(协同设计)。如何让产品与模型紧密结合,是混元团队面临的核心命题。
💬 姚顺雨的三点心法
第一:模型本身要做得足够 Solid
预训练是产品无关(Product Agnostic)的工作,其最大价值在于可泛化的学习——它的进步能持续惠及所有下游任务。
后训练的关键则在于建立正确的 Eval(评估体系)。姚顺雨直言,中国业界有一个不好的倾向——过度追求刷榜。真正有价值的 Eval,应该基于真实的产品场景和用户需求构建,而非仅仅优化榜单数据。
第二:建立产品方与模型方的深度互信
Co-design 最难的部分不是技术,而是信任的建立。姚顺雨分享了一个关键案例:在混元自身预训练尚未完成时,团队毅然派出后训练最强的骨干力量,帮助元宝先把后训练做好。
这一举动让产品团队切实感受到:模型团队是真正在为产品着想。这种信任,成为后续深度合作的基石。
第三:理解 LLM 时代的泛化性
在 LLM 之前,做翻译就准备翻译数据,做围棋就准备围棋数据,泾渭分明。但今天,即使只想做一个 Coding Agent,也需要:
- 强大的聊天能力
- 精准的搜索能力
- 严格的指令遵循能力
- 深度的推理能力
这意味着,腾讯多元产品矩阵(元宝、混元、WorkBuddy 等)所提供的不同类型数据可以相互泛化,形成一个网络化的数据体系,其价值将随时间指数级放大。
📊 真实场景反馈 vs. 标准 Benchmark
汤道生补充道,真实世界数据能带来榜单无法覆盖的三大价值:
- 发现底线问题:用户的真实 Prompt 往往模糊、多轮,而 Benchmark 题目通常精确、单轮,两者存在显著分布差异
- 理解真实 Prompt 分布:现实中用户提问简短、追问不断,这能启发更贴近实际的训练方式
- 激发新研究方向:例如元宝的反馈推动了团队在 Context Learning 方向的深入探索
💡 做产品的第一性原理:穿越时代的不变之道
当姚顺雨反问汤道生“做产品的第一性原理是什么”时,汤道生给出了他跨越 PC 互联网、移动互联网、产业互联网到 AI 时代的核心答案:
不变的是: 以用户需求为核心,倾听用户声音。
变化的是: 产品交互范式与研发流程。
🔄 AI 时代产品研发的四大变革
| 维度 | 非 AI 时代 | AI 时代 |
|---|---|---|
| 交互方式 | 菜单/界面选择(“预制菜”) | 自然语言/语音开放式交互 |
| 开发流程 | 瀑布式,规格清晰 | 实验驱动,快速迭代 |
| 工程师角色 | 大量时间写代码 | 更多时间做架构设计,代码交给 AI |
| 测试方式 | 后置测试 | 测试前置,Eval 先行 |
汤道生强调,AI 时代要求产品团队 “测试左移” —— 在设计阶段就想清楚评测标准、Alignment 目标和用户期望的风格,而非等到开发完成后再测试。
🤖 智能体(Agent)的演进与未来
作为 ReAct1 架构的提出者,姚顺雨的博士论文早在 2019 年就预言了今天的 Agent 时代。
📜 一个预言者的自我回顾
姚顺雨的博士论文标题是: 《Language Agent: From Next Token Prediction to Digital Automation》。
彼时 GPT-2 刚刚问世,生成的文字尚且磕磕绊绊。但姚顺雨已经笃信: “Next Token Prediction 是个极简且通用的事情,有一天它的潜力不仅在于预测下一个词,而是把这个世界上所有的事情全部自动化。”
2022 年 7 月的某个夜晚,他将 PaLM 的 API 与手写的 Wikipedia API 连接在一起,实现了 LLM 与真实互联网的首次多轮交互。
他博士论文结尾列出的四大 Future Direction,如今正一一成真:
- Train models for agent
- Safe and robust deployment
- Scientific discovery
- Help human
🚀 混元在 Agent 方向的差异化策略
姚顺雨认为,Coding Agent 今天就像预训练一样,是必须做好的基础能力——因为它具备图灵完备性:当模型能控制文件系统、拥有容器时,它就是一个完整的自动化系统。
混元的差异化做法体现在三点:
- 强调体系全面化:不会只做 Coding 数据,因为泛化性是大模型的核心价值
- 重视线上回流:充分利用产品端的真实数据反哺模型训练
- 保持探索性:在技术演进、产品眼界和范式创新上保持想象力
💰 关于 Token 效率与性价比
面对用户日益增长的“Token 焦虑”,姚顺雨给出了清醒的判断:
很多用户最终发现,使用性能更强的大模型反而更省钱——因为它能一次把问题做对,节省了人力和反复调用的成本。
真正的性价比公式:高 Robustness(简单任务一次做对)> 炫技式长尾能力提升。
🏃 组织进化:小团队敏捷制胜
汤道生在梳理 WorkBuddy 的组织架构时,发现了与传统产品团队截然不同的形态:
- 极度扁平化:3-5 人小团队围绕特定领域攻坚
- 实验驱动:大量实验,容忍失败,从试错中提炼真知
- 角色融合:工程师越来越像“有想法的 Leader”,驱动多个 Coding Agent 完成研发任务
- AI 基础设施支撑:为小团队提供快速实验的能力土壤
🌟 长跑中的腾讯:务实、诚实、长期主义
对谈的最后,两人回归到最根本的问题:AI 下半场,腾讯凭什么?
两个关键判断:
判断一:AI 是长期游戏,不是短期游戏。
姚顺雨直言,他不认为 ChatGPT 和 Claude Code 会是唯一的 Super App。今天的 AI 就像 70 年代 PC 刚刚诞生——还有无数机会尚未被发现,下半场才刚刚开始。
判断二:AI 的未来是多元的,不是线性的。
虽然过去几年有一条清晰的主线(预训练→后训练→RL→Agent),但多模态、具身智能等新方向正在涌现。未来的竞争将是多维度、多赛道的。
腾讯的核心竞争力:
- 丰富的 Context 生态:多年积累的多元产品场景,为模型提供无可替代的真实上下文
- 务实诚实的文化:知道哪里做得好、哪里做得不好,敢于直面问题
- 长期主义:基于信任而非指标运营,这对于构建长期 AI 组织至关重要
📚 核心术语速查
| 术语 | 释义 |
|---|---|
| 预训练 / 后训练 | AI 构建的两阶段:预训练建立通用知识基础,后训练通过指令微调与人类反馈对齐特定需求 |
| 智能体 Agent | 能自主调用工具、执行复杂任务的 AI 实体,是通往数字与物理世界自动化的关键路径 |
| Benchmark 基准测试 | 衡量模型能力的标准化考题,有参考价值但容易饱和,需结合真实业务数据补充 |
| 泛化性 Generalization | 模型将学到的能力迁移到不同领域的能力,是 LLM 时代最核心的竞争力之一 |
| Co-design 协同设计 | 模型团队与产品团队深度协作,通过互信、换位思考和数据回流实现相互成就 |
| Context 上下文 | AI 时代的核心竞争壁垒,决定模型能否精准理解用户真实意图与场景需求 |