OpenAI 推出新模型 CriticGPT, 让 GPT-4 帮人类训练 GPT-4 6 月 28 日,OpenAI 公布,其研究人员训练了一个基于 GPT-4 的模型,它被称为 CriticGPT,用于捕捉 ChatGPT 代码输出中的错误。简单来说就是,CriticGPT 让人能用 GPT-4 查找 GPT-4 的错误。它可以写出使用者对 ChatGPT 响应结果的批评评论,从而帮助人类训练者在 RLHF 期间发现错误。 OpenAI 发现,如果通过 CriticGPT 获得帮助审查 ChatGPT 编写的代码,人类训练师的审查效果比没有获得帮助的人强 60%。OpenAI 称,正着手将类似 CriticGPT 的模型集成到旗下 RLHF 标记管道中,为自己的训练师提供明确的 AI 帮助。 OpenAI 称,因为没有更好的工具,所以人们目前难以评估高级的 AI 系统的表现。而 CriticGPT 意味着,OpenAI 向能够评估高级 AI 系统输出的目标迈进了一步。
OpenAI推出新模型CriticGPT,让GPT-4帮人类训练GP
飞雪科技
2024-06-30 23:10:05
0
阅读:40
博士李®
开始套娃了[静静吃瓜]