很多人说o1不就是个CoT+强化学习吗？强化学习有个前提，就是模型原来试了

JavaEdge聊AIss 2024-09-15 16:03:51

很多人说 o1 不就是个 CoT+强化学习吗？强化学习有个前提，就是模型原来试了一万次，有一次成功了。 - 模型原来做不到的事情，尝试一万次没有一次成功，那强化也没用 - 模型通过 CoT 尝试了一万次没有一次成功，那强化也没用 - 模型通过一些 Prompt 提示或引入其他因素进行思考，在一万次里有几次成功了，强化学习才开始有用 - 但是模型自增强 Prompt 这件事本身就和 Agent 中的规划是一个思路了可以关注的信息： 1. 关于 CoT，360 做了一个简单可视化的版本，全程思考都暴露出来，可以自己感受下 CoT 的思维方式和局限，看看哪些问题 4o 无法解决，可以通过 Cot 解决 2. 关于 Agent，可以参考赛博禅心这篇文章，内含代码，可以测试有哪些4o无法解决的问题，可以通过 Agent 解决#程序员 #软件开发 #人工智能 #计算机 #编程严选网

0 阅读：0

JavaEdge聊AIss

感谢大家的关注

作者最新文章

1

关于 JWT 及其在身份验证中的作用的 10 点： [1] JWT 是定义令牌

2

Kubernetes Scaling Strategies#程序员 #软件开发

3

当你对数据库进行 SQL 查询时会发生什么？假设查询如下： 👉从用户中选

4

我们已添加对 LaTeX 渲染的支持作为功能预览。 Claude 现在可以以一

5

Docker commands essentials#程序员 #软件开发 #计算

6

Moffee是一个开源的幻灯片制作器，可将标记文档转换为干净、专业的幻灯片。

7

学习大模型应用开发的成本越来越高了！#程序员 #人工智能 #计算机 #互联网 #

8

Claude再更新！好用！我们添加了一个新的屏幕截图按钮，可让您快速捕获屏幕上任

9

Surfer是世界上第一个数字足迹导出器，旨在将来自各种在线平台的所有个人数据集

10

这是目前最怕谷歌未来关停的小众产品。 notebooklm.google.com

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

哈哈哈昨晚三星发布会我是真的看爽了！三星折叠屏比直板更轻薄GalaxyZF

2

2025下半年新机打架谁是你的菜？

3

被董明珠说中了！内鬼作乱，国产芯片出了大问题，技术遭严重泄露，然而一查却发现，主

4

荣耀线下店基本全面铺货，趁着周末去摸了摸荣耀X70，跟我想的有点不一样上手真

5

论手感的话，个人感觉还得是钛金属，大家觉得呢？[思考]

6

三星折叠屏比直板更轻薄刷到三星的全球新品发布会，又被三星的折叠屏手机硬控了，知道

7

很庆幸买了荣耀400Pro，没买华为Nova14Pro。最近换手机，在华为Nov

8

目前来看，iPhone17系列只要你不选标准版，大概率是怎么选都不会后悔，当然

9

9月份集体硬刚iPhone？你更期待哪款？9月份就是新一轮旗舰机，集体硬刚i

10

比亚迪APP征集全新名称了，目前看了一下，提到比较多的就是“迪家”，确实简单好记

科技最新文章

1

有人总结了用荣耀X70的五大好处，你get到几个？1.扔掉移动电源，8300

2

一加真要卖爆了吧，红米都开始学了？一加现在是真变了，硬走性能路线了，最新爆料

3

荣耀Power2来了！10000mAh+骁龙8sGen4！荣耀倒逼充电宝彻底退市

4

被董明珠说中了！内鬼作乱，国产芯片出了大问题，技术遭严重泄露，然而一查却发现，主

5

荣耀Magic8系列已经定档，10月发布！骁龙峰会9月发布骁龙8Gen5，荣

6

真吓我一跳，难怪美国急着要卖H20芯片呢！据报道，这种芯片的价格一般是每片10万

7

目前最值得入手的3款荣耀手机1、荣耀400Pro，相对上一代产品升级到了满

8

荣耀最新旗舰荣耀Magic8系列配置预测，为了满足消费者的需求，这次的荣耀Mag

9

补充：华为Pura80Pro日均降价17.78元三星Galaxy

10

目前最值得入手的3款荣耀手机1、荣耀400Pro，相对上一代产品升级到了满