QCon上海2025小红书AI Coding实践:PRD到代码直出的探索
分享分为四个环节:AI Coding 在客户端领域的发展阶段与现状、客户端AI Coding的关键解法、实际业务场景与需求分析、总结与展望。
AI Coding 发展史和现状
Section titled “AI Coding 发展史和现状”自2017年Google提出Transformer后,AI在各领域实现突破。2023年起,大语言模型商业化加速,年增速达30倍以上。AI Coding 领域是发展最快的学科之一,因为反馈机制明确(“对就是对,错就是错”)。
AI Coding 发展的五个阶段(人机协作视角)
Section titled “AI Coding 发展的五个阶段(人机协作视角)”| 阶段 | 描述 | 人机角色 | 典型能力 |
|---|---|---|---|
| L1 | 人类主导,Agent实时辅助 | 人主导,AI辅助 | 代码提示(如GitHub Copilot) |
| L2 | 人类布置任务,Agent生成代码 | 人布置单一任务 | 单一任务代码生成 |
| L3 | 人类设定范围,Agent推进多环节流程 | 人设定范围,AI推进流程 | 生成方案 + 生成代码 |
| L4 | 人类输入PRD,Agent端到端交付 | 人输入PRD,AI端到端交付 | 需求解析 + 架构设计 + 编码 |
| L5 | 人定义目标,多Agent分工协作 | 人定义目标,多AI协作 | 多Agent模拟完整软件团队 |
L4阶段前端领域已有产品(如”Lovable”)。
客户端AI Coding的独特困境
Section titled “客户端AI Coding的独特困境”从技术栈视角看客户端
Section titled “从技术栈视角看客户端”- 技术栈碎片化:前端标准化高(HTML/CSS/JS)、框架集中(React/Vue);客户端平台碎片化(iOS/Android API版本差异)、框架分散(SwiftUI、UIKit、Jetpack Compose等)
- 构建与调试:客户端编译耗时、真机调试必要,反馈循环慢
- 开发模式:前端热重载实时反馈;客户端生命周期复杂,架构模式多样(MVVM、VIPER等)
从AI模型视角看客户端
Section titled “从AI模型视角看客户端”- 构建与调试复杂:编译时间长、真机调试必要,反馈循环缓慢
- 训练数据稀缺:高质量客户端代码多在企业内部未开源,公开数据规模小
- 代码模式多样:架构演进复杂(如Android从Activity到MVVM+Compose),上下文理解成本高
“前端开发像是在标准化、开放的乐高环境中工作;客户端则像是在碎片化、半封闭的复杂系统中进行精密工程。“
客户端AI Coding的关键解法
Section titled “客户端AI Coding的关键解法”Mobile-SWE-bench
Section titled “Mobile-SWE-bench”科学评测体系的建立:从SWE-bench到Mobile-SWE-bench
- SWE-bench:由普林斯顿与芝加哥大学推出,基于真实GitHub Issue,要求AI生成PR来修复问题,以单元测试通过率为评测标准
- 局限性:侧重于Bug修复而非功能实现,项目多集中后端,缺少移动端特有考量(如UI还原、多模态输入)
- 移动端评测 Mobile-SWE-bench:针对移动端的特殊需求建立评测体系
热门Coding Agents表现如何
Section titled “热门Coding Agents表现如何”把整个需求的测评级分成三类,可以看到哪怕是业界比较火的一些模型放在测试集中表现也一般,30%已经算是很高了。
为什么这些 Code Agent 都表现不佳?主要因为客户端开发的复杂性和上下文需求远超当前通用Agent的能力范围。
PRD的拆解与微调:将需求转化为结构化任务
Section titled “PRD的拆解与微调:将需求转化为结构化任务”PRD(产品需求文档)是核心上下文,但当前PRD质量参差不齐,AI难以聚焦。
在AI Coding实践中,PRD的角色发生了根本性的转变:
- 从”给人看”到”给AI看”:传统PRD是写给开发、测试、设计等团队成员看的;在AI Coding实践中,PRD是直接输入给AI智能体或大语言模型的”高级指令”
- 成为AI的”蓝图”:AI会分析、理解PRD中的需求,基于对需求的理解,AI可以自动或半自动地执行后续开发任务
- 对PRD质量的要求更高:必须更加清晰、无歧义、结构化。AI无法像人类一样通过模糊的上下文或沟通来”猜”出真实意图
UI高还原度出码:从设计稿到代码的准确转换
Section titled “UI高还原度出码:从设计稿到代码的准确转换”UI高还原度出码是客户端AI Coding的核心挑战之一。需要确保AI生成的代码能够准确还原设计稿的视觉效果和交互逻辑。
UI组件召回:避免重复造轮子,提升代码采纳率
Section titled “UI组件召回:避免重复造轮子,提升代码采纳率”组件召回闭环迭代是关键。通过智能召回企业内部已有的组件,避免AI重复生成已有组件,提升代码采纳率和一致性。
一个实际的业务场景:用户登录页面,包含手机号输入框、密码框、登录按钮、忘记密码链接及成功/失败反馈。
流程:PRD → 控件识别(手机号输入框、密码框、登录按钮、忘记密码链接)→ 逻辑聚合(登录成功Toast、失败弹窗)→ 结合企业组件库与设计规范生成代码
端到端提升:定制化Code Agent在Easy/Medium/Hard需求集上,比通用Agent(如GPT-5、Claude)提升约10%。
客户端实现PRD到代码的完全直出目前尚不可能,但可通过”评测驱动子能力提升”路径逐步推进。应关注四个关键课题:
- 如何构建科学的端到端评测体系?
- PRD该如何拆解、拆解到什么粒度?
- 如何保证UI高还原度出码?
- 如何实现组件的智能召回与闭环迭代?
- 生产级评测集:积累真实PRD、Figma、Commit、测试用例等数据
- 流动闭环的企业知识库:融入自动化流程,实现数据自收集与模型自进化
- 全周期覆盖:从编码扩展至测试、CR、Bug修复、发布全流程
- 跨平台垂类Agent融合:实现跨系统复杂任务的端到端闭环
AI Coding 核心价值
Section titled “AI Coding 核心价值”- AI Coding不是完全替代开发者,而是作为”副驾驶”提升效率、规范流程
- 客户端AI落地的关键在于:高质量数据、领域适配、工程化闭环
- 长期来看,AI将重新定义软件生产流程,推动研发模式向智能化、自动化演进