IT之家12月13日消息,OpenAI昨天在官网发布博文,揭秘安卓版Sora应用如何在28天内完成开发。
IT之家在此援引博文,回到10月,SoraiOS版上线后使用量迅速爆发,人们立刻开始源源不断地生成视频,安卓版呼之欲出,但当时OpenAI内部只有安卓端Sora的原型版本,因此这项开发任务可谓是高风险、时间紧迫。

在这种场景下,一般的互联网公司往往会组建海量工程师组成的开发团队,花费数月时间进行打磨,但在OpenAI这种场合中,增加人力反而会无形生出沟通成本、任务切割和集成负担,显著拖慢开发速度。
OpenAI为此决定组建一支只有4人的强力小队,他们从10月8日开始开发安卓版Sora,11月5日交付最终成果,全程用时28天,期间并没有使用什么“秘密模型”,而是GPT-5.1-Codex的早期版本,整个应用代码的85%由Codex编写,实现了99.9%的版本稳定率。
据介绍,Codex更像是一名刚入职的高级工程师,能够将开发者的更多时间用于指挥和代码审查,不必亲自敲每一行代码。

不过,Codex并不擅长自行推断未被明确告知的信息,如开发者偏好的架构模式、产品策略、真实用户行为等,并且这名虚拟工程师无法感受应用的实际运行状况,最终只能由真人来进行调试,告诉AI滑动是否顺滑、某个流程是否令人困惑。
同时与Codex的每一次新对话都像是重新做入职培训,你必须清晰地说出目标、约束条件以及“怎么做事”,这样Codex才能最高效地生成代码,而且它在深层架构推断方面也有局限,如果完全让它自己跑就会引入不必要的ViewModel,或者把逻辑塞进本应属于Repository的UI层。
从这里可以看出,Codex的本能是“让代码跑起来”,而非长期整洁性,为此OpenAI在整个代码库中大量使用AGENT.md文件,用于进行统一指导和实践,让AI始终遵循规范写代码。
优点方面,Codex几乎熟悉所有主流编程语言,使得跨平台迁移变得异常轻松,而且对编写单元测试异常积极,尽管并非每个测试都很“深”,但广覆盖极大减少了回归问题,并且在CI失败时还可以直接把日志扔进Prompt,让它自己给出修复方案。
所以我们可以得出结论:Codex可以在明确边界的情况下实现高效工作,而人类工程师则可以专注于架构、体验、系统性决策,并负责监督最终质量。