OpenAI推出新模型CriticGPT,让GPT-4帮人类训练GP

飞雪科技 2024-06-30 23:10:05

OpenAI 推出新模型 CriticGPT, 让 GPT-4 帮人类训练 GPT-4 6 月 28 日,OpenAI 公布,其研究人员训练了一个基于 GPT-4 的模型,它被称为 CriticGPT,用于捕捉 ChatGPT 代码输出中的错误。简单来说就是,CriticGPT 让人能用 GPT-4 查找 GPT-4 的错误。它可以写出使用者对 ChatGPT 响应结果的批评评论,从而帮助人类训练者在 RLHF 期间发现错误。 OpenAI 发现,如果通过 CriticGPT 获得帮助审查 ChatGPT 编写的代码,人类训练师的审查效果比没有获得帮助的人强 60%。OpenAI 称,正着手将类似 CriticGPT 的模型集成到旗下 RLHF 标记管道中,为自己的训练师提供明确的 AI 帮助。 OpenAI 称,因为没有更好的工具,所以人们目前难以评估高级的 AI 系统的表现。而 CriticGPT 意味着,OpenAI 向能够评估高级 AI 系统输出的目标迈进了一步。

0 阅读:40

评论列表

博士李®

博士李®

2
2024-07-01 04:38

开始套娃了[静静吃瓜]

飞雪科技

飞雪科技

感谢大家的关注