OpenAI揭秘：4人团队28天开发安卓版Sora，85%代码由Codex生成

IT之家12月13日消息，OpenAI昨天在官网发布博文，揭秘安卓版Sora应用如何在28天内完成开发。

IT之家在此援引博文，回到10月，SoraiOS版上线后使用量迅速爆发，人们立刻开始源源不断地生成视频，安卓版呼之欲出，但当时OpenAI内部只有安卓端Sora的原型版本，因此这项开发任务可谓是高风险、时间紧迫。

在这种场景下，一般的互联网公司往往会组建海量工程师组成的开发团队，花费数月时间进行打磨，但在OpenAI这种场合中，增加人力反而会无形生出沟通成本、任务切割和集成负担，显著拖慢开发速度。

OpenAI为此决定组建一支只有4人的强力小队，他们从10月8日开始开发安卓版Sora，11月5日交付最终成果，全程用时28天，期间并没有使用什么“秘密模型”，而是GPT-5.1-Codex的早期版本，整个应用代码的85%由Codex编写，实现了99.9%的版本稳定率。

据介绍，Codex更像是一名刚入职的高级工程师，能够将开发者的更多时间用于指挥和代码审查，不必亲自敲每一行代码。

不过，Codex并不擅长自行推断未被明确告知的信息，如开发者偏好的架构模式、产品策略、真实用户行为等，并且这名虚拟工程师无法感受应用的实际运行状况，最终只能由真人来进行调试，告诉AI滑动是否顺滑、某个流程是否令人困惑。

同时与Codex的每一次新对话都像是重新做入职培训，你必须清晰地说出目标、约束条件以及“怎么做事”，这样Codex才能最高效地生成代码，而且它在深层架构推断方面也有局限，如果完全让它自己跑就会引入不必要的ViewModel，或者把逻辑塞进本应属于Repository的UI层。

从这里可以看出，Codex的本能是“让代码跑起来”，而非长期整洁性，为此OpenAI在整个代码库中大量使用AGENT.md文件，用于进行统一指导和实践，让AI始终遵循规范写代码。

优点方面，Codex几乎熟悉所有主流编程语言，使得跨平台迁移变得异常轻松，而且对编写单元测试异常积极，尽管并非每个测试都很“深”，但广覆盖极大减少了回归问题，并且在CI失败时还可以直接把日志扔进Prompt，让它自己给出修复方案。

所以我们可以得出结论：Codex可以在明确边界的情况下实现高效工作，而人类工程师则可以专注于架构、体验、系统性决策，并负责监督最终质量。

游戏百科