ai 的真实交付价值的能力,和刷题结果之间有一个鸿沟还没有逾越。
否则 300 美金的 grok4 首先会让 xai 大规模失业。
就比如现在 ai 最强的代码能力,为了交付真实的结果,还是和真正的人类差了一些能力。
这个能力是什么我也无法准确描述(否则一定有人可以量化和测试了),但是随着用的越来越多,我隐约能感觉到。
就是一种类似于软件工程师的经验。理解需求,把握交付质量,规划架构,准备资源的能力。
这是一种基于沟通的协调,资源安排,以及迭代节奏,评估 roi 和优先级的能力。
然后分解问题,明确定义,拆分步骤,安排单元测试,定义清晰明确可以生产的阶段的能力。
在所有这些都准确把握之后,其实才到编码阶段。
在之前,我们把这些能力统称为“软件工程”。