时间线整理
时间线整理:
一个关键的进展是 Meta(原Facebook)的研究人员在2023年初(论文发布于arXiv的时间为2023年2月)发表的 Toolformer 模型。这篇题为 《Toolformer: Language Models Can Teach Themselves to Use Tools》 的论文证明了语言模型可以通过专门的微调,学会自主决定调用哪些外部工具(如计算器、搜索引擎)来帮助自己回答问题,这为后来的函数调用功能奠定了重要的理论基础。
大模型的函数调用(Function Calling)功能是由 OpenAI 率先引入并产品化的,具体是在 2023年6月13日发布的 gpt-3.5-turbo 和 gpt-4 系列模型的API增加了这项能力。
2025 Q4 发布的 Claude Opus 4.5(由 Anthropic 发布)在软件工程能力(Software Engineering Capability)上出现了一个明显跃迁。业内关注的不是简单的“写代码更好”,而是从“代码生成”升级为“软件工程任务执行”。
正是Kiro、spec-kit、Tessl这些工具在2025年的集中发布和推广,让“规范驱动开发”这一方法论从理论探讨迅速走向了工程实践,成为开发者社区关注的焦点。SDD(规范驱动开发)作为现代实践术语,2025 年 中期至下半年兴起并被广泛讨论。
2026年2月11日 Harness engineering: leveraging Codex in an agent-first world https://openai.com/zh-Hans-CN/index/harness-engineering/