GPT4o变谄媚的原因万万没想到OpenAI新报告揭露GPT4o变谄媚原因GP

量子位看科技 2025-05-03 12:18:46

GPT4o变谄媚的原因万万没想到OpenAI新报告揭露GPT4o变谄媚原因

GPT-4o更新后“变谄媚”？后续技术报告来了。

OpenAI一篇新鲜出炉的认错小作文，直接引来上百万网友围观。

CEO奥特曼也做足姿态，第一时间转发小作文并表示：

（新报告）揭示了GPT-4o更新失败是因为什么，从中OpenAI学到了什么，以及我们将会采取的应对措施是什么。

概括而言，最新报告提到，大约一周前的bug原来出在了“强化学习”身上——

上次更新引入了一个基于用户反馈的额外奖励信号，即对ChatGPT的点赞或点踩。

虽然这个信号通常很有用，但可能使模型逐渐倾向于做出更令人愉快的回应。

此外，尽管还没有明确证据，但用户记忆在某些情况下也可能加剧奉承行为的影响。

一言以蔽之，OpenAI认为一些单独看可能对改进模型有益的举措，结合起来后却共同导致了模型变得“谄媚”。

而在看到这篇报告后，目前大多数网友的反应be like：

（你小汁）认错态度不错~

甚至有人表示，这算得上OpenAI过去几年里最详细的报告了。

具体咋回事儿？接下来一起吃瓜。

0 阅读：26

猜你喜欢

昨天发了很多碳纤维机盖，部分朋友可能以为我在洗地，但其实我只想讲明两个事情：1，

昨天发了很多碳纤维机盖，部分朋友可能以为我在洗地，但其实我只想讲明两个事情：1，

【6评论】

小米su7 小米汽车

特斯拉说这话肯定会被冲啊。64000的FSD，即便现在HW4在国内ota了fsd

特斯拉说这话肯定会被冲啊。64000的FSD，即便现在HW4在国内ota了fsd

完全自动驾驶特斯拉 ota 传感器

OpenAI发了篇博客分析为啥上次自己的模型出现了大规模谄媚行为。大概原因是I尝

OpenAI发了篇博客分析为啥上次自己的模型出现了大规模谄媚行为。大概原因是I尝

openai

惊呆了！英伟达突然宣布！宁愿冒着亏损55亿美元的风险，也要和我们做抵抗

惊呆了！英伟达突然宣布！宁愿冒着亏损55亿美元的风险，也要和我们做抵抗

【76评论】【233点赞】

英伟达芯片 cuda GPU it芯片创投圈

马斯克离开后，特朗普对这位老搭档的发言，能有多扎心？

马斯克离开后，特朗普对这位老搭档的发言，能有多扎心？

【6评论】【13点赞】

伊隆·马斯克唐纳德·特朗普

巴方使用了华为卫星电话和加密通讯应用程序，成功躲避了印度监控系统！印度和巴基

巴方使用了华为卫星电话和加密通讯应用程序，成功躲避了印度监控系统！印度和巴基

【1评论】【5点赞】

卫星华为

美议员提议，将英伟达晶片植入定位系统，防止流入中国，这是个好提议，可以效仿。当

美议员提议，将英伟达晶片植入定位系统，防止流入中国，这是个好提议，可以效仿。当

英伟达

激光雷达基本被国内公司垄断

激光雷达基本被国内公司垄断

【2评论】【6点赞】

激光雷达华为余承东

量子位看科技

感谢大家的关注

作者最新文章

1

论文一键转代码论文代码复现工具PaperCoder：论文转代码工具，专治未公开代

2

马斯克筹200亿还债马斯克为新公司筹资200亿美元马斯克筹资200亿刀乐还债？彭

3

数学家们仍在追赶天才拉马努金数学鬼才靠托梦推出4000个公式如果有这么一个人，写

4

今年是AI应用创业最佳时期不到2年，AI PPT赛道第一！像素绽放CEO赵充今

5

o3新玩法火了AI看照片判断地点仅靠一张照片，就能判断出拍摄的地点？这个挑战曾一

6

中年发福真正原因中年发福并非代谢变慢中年发福的真正原因，并非基础代谢变慢？《科学

7

DeepSeekR2最新爆料DeepSeekR2成本下降97.3%DeepSee

8

双臂机器人挑战赛奖金20万WBCD双臂机器人挑战赛全球开幕 5月19-23日，I

9

轻松搞定高质量问答数据开源垂直领域高质量数据合成框架垂直领域大模型训练里，高质量

10

AI教育如何规模化落地用C端应用反推大模型发展大模型趋势下，教育领域正在经历前所

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

一图解读：十款手机配置，各显神通，你更喜欢哪款？

2

存一张美得很人山人海的（AI

3

【王腾官宣REDMI旗舰小平板：手感非常好，性能非常强，配置非常满】王腾在微博上

4

刘强东还能不能撑住！美团王兴放话“不惜一切代价”狙击京东，这边京东外卖日单量破2

5

荣耀宣布2100起售之后我估计友商集体沉默了，已经不是掀桌子那么简单，而是全部

6

618iPhone手机哪款值得入手啊？

7

看来Mate系列才是真旗舰，昨天发布的Pura80系列虽然影像牛的不行，但有一点

8

左边是我花了5499国补价买到的iPhone16Pro，右边是苹果直营店里

9

华为又有几款平板要开始鸿蒙5公测了，如果不是游戏用户，可以升级体验体验，毕竟视频

10

2025年5月OPPO四款手机推荐，性能与颜值并存！618你会选购哪款呢？

科技最新文章

1

正式官宣！荣耀MagicV5发布会定档，配置全面曝光搭载骁龙8至尊版、

2

我去，华为Mate70Pro价格这么坚挺，基本没怎么跳水，Mate系列的保值率

3

这些年用了很多个手机，发现一个规律，买1000元的手机只能用一年，一年一到，各种

4

华为Mate80的配置实在是太诱人！全系都换成直屏了，而且采用侧边超声波指纹

5

这些年用了很多个手机，发现一个规律，买1000元的手机只能用一年，一年一到，各种

6

回收一个iPhone13Pro循环1546次，电池健康92我问他有没

7

不懂就问：小伙伴们，同为618＋国补后价格为3199元，12+512G版本的荣耀

8

在犹豫荣耀300系列跟荣耀Magic7系列如何选？荣耀300系列定位荣耀数字

9

华为于2024年11月就已经上市了mate70pro，华为mate80Pro也即

10

马斯克刚刚宣布："星链"卫星通信系统已在伊朗投入使用。要知道这对于伊朗当地的通信