文本拆分（chunking）是上下文工程和embeddings流水线中被严重

爱生活爱珂珂 2025-07-30 07:26:58

文本拆分（chunking）是上下文工程和 embeddings 流水线中被严重低估的关键环节，其对性能的影响远超预期。

• 固定大小拆分 📏：将文本均匀切分为固定长度（如200-500 tokens），实现简单，适合初学者，但可能破坏句子完整性。

• 递归拆分 🔄：层级分割文档，保留结构与上下文，适合复杂文档和多层次信息。

• 基于文档结构拆分 📄：利用段落、章节等自然边界，保持相关信息集中，但块大小差异大。

• 语义拆分 🧠：基于语义相似度动态分块，更精准但计算开销大。

• 后期拆分 ⏰：先做 embeddings 再拆分，能更好保存上下文信息，适合高级应用。

没有万能方案，选用策略需结合具体数据和任务。建议从固定大小带一定重叠开始，结合文档结构调整，技术文档优先考虑结构拆分，叙事文本可尝试语义拆分。

拆分策略不仅影响向量检索效果，更直接决定 LLM 获得的上下文质量，是现代 context engineering 的核心组成。

详情🔗 x.com/victorialslocum/status/1950116284022018077

详解与实践指导🔗 docs.weaviate.io/academy/py/standalone/chunking

高级 RAG 策略深度指南🔗 weaviate.io/ebooks/advanced-rag-techniques

文本拆分向量检索语义理解上下文工程 RAG 人工智能

0 阅读：0

爱生活爱珂珂

感谢大家的关注

作者最新文章

1

早！[太阳] 早安

2

RAG（Retrieval-Augmented Generation）全攻略，涵

3

[笑cry]

4

生成式大语言模型（LLM）推理的本质与突破路径解析（“LLM推理”讲义）：• L

5

极简 AI Agent，100 行代码解决 GitHub Issues，兼具轻量

6

分布式训练核心术语全览，系统梳理多维度并行与优化方法，助力深入理解与高效实践：•

7

Answer.AI 推出首个开源系统，实现用常规桌面双卡（RTX 3090/40

8

Manus 的上下文工程方法为构建智能代理提供了深刻洞察，尤其聚焦工具使用与记忆

9

（简洁教程）概率图模型（PGM）：融合概率论与图论的机器学习分支，精准刻画多变量

10

[人人能懂] AI的下一步：造个更大的“大脑”，还是给它一个“工具箱”？

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

哈哈哈昨晚三星发布会我是真的看爽了！三星折叠屏比直板更轻薄GalaxyZF

2

2025下半年新机打架谁是你的菜？

3

吃晚瓜[吃瓜][吃瓜][吃瓜]

4

荣耀线下店基本全面铺货，趁着周末去摸了摸荣耀X70，跟我想的有点不一样上手真

5

论手感的话，个人感觉还得是钛金属，大家觉得呢？[思考]

6

三星折叠屏比直板更轻薄刷到三星的全球新品发布会，又被三星的折叠屏手机硬控了，知道

7

很庆幸买了荣耀400Pro，没买华为Nova14Pro。最近换手机，在华为Nov

8

目前来看，iPhone17系列只要你不选标准版，大概率是怎么选都不会后悔，当然

9

9月份集体硬刚iPhone？你更期待哪款？9月份就是新一轮旗舰机，集体硬刚i

10

比亚迪APP征集全新名称了，目前看了一下，提到比较多的就是“迪家”，确实简单好记

科技最新文章

1

三星这波系统升级真的让人又爱又恨啊！昨天看到推送通知马上就点了更新，结果

2

华为Mate60Pro，12+512GB，薄荷绿色。搭载HarmonyOS

3

iPhone17Pro传言：1.铝金属中框2.抗反射显示屏

4

红米新机Redmi15外观渲染图曝光：后置三摄采用纵向排列的矩形Deco今

5

OPPOFindX9Pro外围配置曝光---6.78英寸2.5D直屏，1

6

清华大学教授柳惯中说：搞无人驾驶汽车，无人商店、无人酒店我不奇怪。饭店里用机器人

7

我有种预感DeepSeek创始人梁文锋现在最后悔的不是下载量暴跌七成也不是

8

荣耀400真不愧销量这么高，确实厉害荣耀400这款手机用了有段时间了，确

9

荣耀中端机大电池会继续刷记录，后续会不会来8500毫安[捂脸哭]旗舰机更加保守，和

10

今年一加13是用着很顺手的机子，就是续航有点短，拍照和性能还有手感都很强，唯一的