AI 公司是否需要,或者能不能产生私有数据?
这是我比较好奇的一个问题,我的困惑在于:我所理解的目前 ai 有两个较强的线,一个是做底座基础模型的;另一个是想做应用的。
这两个原本来互联网这个基础框架上,基本上是互不干涉,比如 阿里、腾讯、百度等,都是建立在互联网基础设施上的超级应用,事实上,它们做的是用户触达和app 运营。
特点是,天然产生数据。
而到了大模型阶段,理论上现有的技术范式是,需要依赖大量且高质量的数据来训练自己的模型,而做基础模型的公司事实上在私有数据的拥有上是不足的。
而做应用的公司,如果没有基础模型的支撑,其实应用的存活其实并不乐观。
AI 领域的应用,如果用套壳的模型做出一个可用好用的应用不难,难点在于,如果一个模型更新后其实会覆盖掉应用现有的能力。
数据、模型、应用,这会是一个会在 AI 范式下形成一个怎么样的关系?
求解答。