Skip to content

QCon上海2025小红书AI Coding实践:PRD到代码直出的探索

分享分为四个环节:AI Coding 在客户端领域的发展阶段与现状、客户端AI Coding的关键解法、实际业务场景与需求分析、总结与展望。

自2017年Google提出Transformer后,AI在各领域实现突破。2023年起,大语言模型商业化加速,年增速达30倍以上。AI Coding 领域是发展最快的学科之一,因为反馈机制明确(“对就是对,错就是错”)。

AI Coding 发展的五个阶段(人机协作视角)

Section titled “AI Coding 发展的五个阶段(人机协作视角)”
阶段描述人机角色典型能力
L1人类主导,Agent实时辅助人主导,AI辅助代码提示(如GitHub Copilot)
L2人类布置任务,Agent生成代码人布置单一任务单一任务代码生成
L3人类设定范围,Agent推进多环节流程人设定范围,AI推进流程生成方案 + 生成代码
L4人类输入PRD,Agent端到端交付人输入PRD,AI端到端交付需求解析 + 架构设计 + 编码
L5人定义目标,多Agent分工协作人定义目标,多AI协作多Agent模拟完整软件团队

L4阶段前端领域已有产品(如”Lovable”)。

  • 技术栈碎片化:前端标准化高(HTML/CSS/JS)、框架集中(React/Vue);客户端平台碎片化(iOS/Android API版本差异)、框架分散(SwiftUI、UIKit、Jetpack Compose等)
  • 构建与调试:客户端编译耗时、真机调试必要,反馈循环慢
  • 开发模式:前端热重载实时反馈;客户端生命周期复杂,架构模式多样(MVVM、VIPER等)
  • 构建与调试复杂:编译时间长、真机调试必要,反馈循环缓慢
  • 训练数据稀缺:高质量客户端代码多在企业内部未开源,公开数据规模小
  • 代码模式多样:架构演进复杂(如Android从Activity到MVVM+Compose),上下文理解成本高

“前端开发像是在标准化、开放的乐高环境中工作;客户端则像是在碎片化、半封闭的复杂系统中进行精密工程。“

科学评测体系的建立:从SWE-bench到Mobile-SWE-bench

  • SWE-bench:由普林斯顿与芝加哥大学推出,基于真实GitHub Issue,要求AI生成PR来修复问题,以单元测试通过率为评测标准
  • 局限性:侧重于Bug修复而非功能实现,项目多集中后端,缺少移动端特有考量(如UI还原、多模态输入)
  • 移动端评测 Mobile-SWE-bench:针对移动端的特殊需求建立评测体系

把整个需求的测评级分成三类,可以看到哪怕是业界比较火的一些模型放在测试集中表现也一般,30%已经算是很高了。

为什么这些 Code Agent 都表现不佳?主要因为客户端开发的复杂性和上下文需求远超当前通用Agent的能力范围。

PRD的拆解与微调:将需求转化为结构化任务

Section titled “PRD的拆解与微调:将需求转化为结构化任务”

PRD(产品需求文档)是核心上下文,但当前PRD质量参差不齐,AI难以聚焦。

在AI Coding实践中,PRD的角色发生了根本性的转变:

  • 从”给人看”到”给AI看”:传统PRD是写给开发、测试、设计等团队成员看的;在AI Coding实践中,PRD是直接输入给AI智能体或大语言模型的”高级指令”
  • 成为AI的”蓝图”:AI会分析、理解PRD中的需求,基于对需求的理解,AI可以自动或半自动地执行后续开发任务
  • 对PRD质量的要求更高:必须更加清晰、无歧义、结构化。AI无法像人类一样通过模糊的上下文或沟通来”猜”出真实意图

UI高还原度出码:从设计稿到代码的准确转换

Section titled “UI高还原度出码:从设计稿到代码的准确转换”

UI高还原度出码是客户端AI Coding的核心挑战之一。需要确保AI生成的代码能够准确还原设计稿的视觉效果和交互逻辑。

UI组件召回:避免重复造轮子,提升代码采纳率

Section titled “UI组件召回:避免重复造轮子,提升代码采纳率”

组件召回闭环迭代是关键。通过智能召回企业内部已有的组件,避免AI重复生成已有组件,提升代码采纳率和一致性。

一个实际的业务场景:用户登录页面,包含手机号输入框、密码框、登录按钮、忘记密码链接及成功/失败反馈。

流程:PRD → 控件识别(手机号输入框、密码框、登录按钮、忘记密码链接)→ 逻辑聚合(登录成功Toast、失败弹窗)→ 结合企业组件库与设计规范生成代码

端到端提升:定制化Code Agent在Easy/Medium/Hard需求集上,比通用Agent(如GPT-5、Claude)提升约10%。

客户端实现PRD到代码的完全直出目前尚不可能,但可通过”评测驱动子能力提升”路径逐步推进。应关注四个关键课题:

  1. 如何构建科学的端到端评测体系?
  2. PRD该如何拆解、拆解到什么粒度?
  3. 如何保证UI高还原度出码?
  4. 如何实现组件的智能召回与闭环迭代?
  • 生产级评测集:积累真实PRD、Figma、Commit、测试用例等数据
  • 流动闭环的企业知识库:融入自动化流程,实现数据自收集与模型自进化
  • 全周期覆盖:从编码扩展至测试、CR、Bug修复、发布全流程
  • 跨平台垂类Agent融合:实现跨系统复杂任务的端到端闭环
  • AI Coding不是完全替代开发者,而是作为”副驾驶”提升效率、规范流程
  • 客户端AI落地的关键在于:高质量数据、领域适配、工程化闭环
  • 长期来看,AI将重新定义软件生产流程,推动研发模式向智能化、自动化演进