【后训练知识蒸馏：监督式蒸馏vs.合成数据蒸馏vs.在线策略蒸馏】●知

爱生活爱珂珂 2025-02-08 09:33:12

【后训练知识蒸馏：监督式蒸馏 vs. 合成数据蒸馏 vs. 在线策略蒸馏】

● 知识蒸馏三种方式：

- 监督式蒸馏：让小模型直接学习大模型的输出概率分布

- 合成数据蒸馏：用大模型生成高质量训练数据来教小模型

- 在线策略蒸馏：让小模型边学边实践，通过即时反馈不断改进

● 每种方法的特点：

- 监督式就像填鸭式教育，直接告诉答案

- 合成数据像准备精心设计的习题

- 在线策略则更像启发式教学，在实践中学习

《Post-Training Distillation for LLMs》

0 阅读：1

爱生活爱珂珂

感谢大家的关注

作者最新文章

1

【[698星]Shotgun Code：一键将代码库“发射”到大语言模型中，解决

2

【[77星]Tool-Star：通过强化学习为LLM驱动的多工具推理器赋能。亮点

3

【[145星]Mathpad：一款为学生和专业人士设计的数学键盘，让输入复杂公式

4

【[494星]Jujutsu UI (jjui)：为Jujutsu版本控制系统打

5

【[92星]new_bloom_filter_repo：一种创新的无损视频压缩方

6

【[82星]DiSA：让自回归图像生成更高效！它通过减少扩散步骤加速生成过程，同

7

Cursor使用最佳实践

8

AI术语单词卡：Softmax

9

AI术语单词卡：Tokenization

10

早！[太阳] 早安

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

好纠结呀！现在的小屏手机到底哪款性价比最出色呢？

2

华为自研鸿蒙电脑，没有键盘！是一整块可折叠的超大屏幕，然后内置大面积线性马达，通

3

2025年手机选购指南，全价位段手机推荐

4

一个人躺在沙发上玩手机。

5

昨天，华为终端发布华为nova全球代言人易烊千玺手持华为nova14系列的海报

6

字节的工资是真的高啊！

7

网传华为nova14部分规格曝光：全系内存12GB，超大杯麒麟9系芯片+红枫多光

8

中国仪仗队在莫斯科阅兵，有个细节，现场俄罗斯人，基本用苹果手机，中方摄影师，用的

9

不用看发布会了，荣耀400系列目前就差一个价格，具体的配置基本确定相对上一代

10

不得不说，AI越来越真实了。

科技最新文章

1

荣耀400官宣5月28日产品发布会五大亮点，荣耀新CEO李健将国内首次亮相。

2

发布会可以不开了，荣耀400系列真机基本解封，同档位没一个能打的1、全系金属

3

iPhone17配置越来越接近真相了！其实对于标准版iPhone17，大家还是

4

不怕神队手，就怕猪队友。小米这边刚刚宣布自研3nm芯片，这边高通CEO就在采访中

5

要是2299元起！全面升级的荣耀400系列真的香疯了！性能直接起飞——荣耀4

6

看完小米YU7发布会之后，友商心都凉了一半！最厉害的不是3.23秒零百，也不

7

指责小米YU7外形抄袭法拉利，阻碍不了YU7大卖的。小米从手机开始，就努力去

8

小米YU7首发评测解密了，详细内容全网应该都是的，在这里我就聊下小米YU7

9

雷军称小定太折腾大家了小米YU7取消小定，背后有何深意？小米一直对YU7的产品

10

我怀疑过鸿蒙系统是假的，也曾怀疑过麒麟芯片技术不靠谱，但万万没想到，这些数据