豆包小程序 Agent
负责 APP 内自然语言触发小程序的小程序Agent的模型训练与链路,以「提 LT」为北极星指标。 从 0 到 1 定义地图与缴费两个场景的到端理想态,定义模型行为,对模型badcase分析,指明模型优化方向;搭起 MCP 与到端评测体系, 支持合版模型综合调用工具能力。
AI STRATEGY PRODUCT · 2027 fall
王策 / 字节跳动 · 豆包-商业化-大模型策略产品。定义模型策略、Agent 的到端理想态,指引模型训练和优化;搭建自动评测体系,把模型能力转化为可量化的产品结果。
2025 → 2026 · 5 entries · full résumé ↓
负责 APP 内自然语言触发小程序的小程序Agent的模型训练与链路,以「提 LT」为北极星指标。 从 0 到 1 定义地图与缴费两个场景的到端理想态,定义模型行为,对模型badcase分析,指明模型优化方向;搭起 MCP 与到端评测体系, 支持合版模型综合调用工具能力。
非 GUI 跨网页综合任务智能体。元 Skill 探索任务 SOP 的 API 调用链, 派生 Skill 自动执行,API 资产持续积累。
Orchestrator Agent 综合调用 subAgent 与 tools,基于多轮 tool call 闭环后生成报告。上线后稳定泛化场景数翻倍。
Agentic RAG + 动态 System Prompt,结合 Cursor 逆向工程结论, 设计多轮上下文压缩策略,让 Agent 稳健跨表数据下钻。
评价指标覆盖 MCP、RAG、Agent 等模块,支持自配置大模型测评。
prompt + 多级标签 + 图片制定标准训练集,对意图识别模型 SFT。
2025 · 04 · 类 Manus 垂类智能体落地机会研究
从「可落地性」与「对 B 端价值」两轴出发,把候选场景画在 2×2 矩阵里—— 右上是短期最该打的,左下是 AI 现阶段不该接的。 配上「任务复杂度」维度,可以快速判断一个 Agent 想法是真正可做,还是只是看着性感。
完整报告 / 数据集见 作品集-AI/Manus类超级智能体落地机会探究.pdf ,共梳理 21 个候选场景。
Things I do when no one is shipping metrics.
R&B 为主,流行为辅、林俊杰 10 年老粉! 致力于修炼 Vocal、声乐技术多多交流!
多次线下 live 表演,朝阳 The Box「壹仟个现场」演出在央视频平台播出。
足球 · 最爱梅西!
LOL 钻石 · 主打上单 / 辅助。
用 Claude Code 写自己的小工具,这里 有几个 demo。
一起聊聊模型训练、Agent 评测、Agent Harness、垂类智能体、AI 商业化路径,或者合作一个有意思的 side project