Chunkr：开源文档智能API，打造高效RAG/LLM数据预处理基础设施•

爱生活爱珂珂 2025-08-02 07:28:27

Chunkr：开源文档智能API，打造高效RAG/LLM数据预处理基础设施

• 支持PDF、PPT、Word及图片文件，自动完成布局分析、OCR识别与语义分块，生成结构化HTML、Markdown及JSON

• 提供基础至高级视觉语言模型（VLM）处理，多层次文档理解能力，涵盖从开发测试到企业级生产环境

• 灵活部署：自托管开源版本、商业云API及企业定制方案，支持GPU加速和多架构环境（含Mac ARM）

• LLM配置支持多模型并发、限流及优先级切换，兼容OpenAI、Google AI Studio、OpenRouter等主流API

• 完善的开发者体验：Python SDK快速上手，社区活跃，支持Docker Compose一键启动，文档详尽

• 双重开源许可（AGPL-3.0 + 商业许可证），保障透明合规，适合科研、产品与大规模安全部署

Chunkr通过将复杂文档拆解成语义块，极大提升了RAG与LLM的数据质量和处理效率，是构建智能文档应用的基石。合理利用多模型配置与灵活部署策略，可实现更强的系统稳定性和扩展性。

🔗 了解详情/源码： github.com/lumina-ai-inc/chunkr

文档智能 OCR RAG LLM 开源人工智能机器学习

0 阅读：0

爱生活爱珂珂

感谢大家的关注

作者最新文章

1

《爱可可微博热门分享(8.2)》

2

数字隐私重塑指南：彻底删除你的数字足迹，重获网络自由• 擦除痕迹：访问 myac

3

Anthropic最新研究“Persona Vectors”揭示了大型语言模型中

4

独立开发穷鬼套餐(Web实践篇)，帮你用最低成本开启盈利项目：• 推荐框架：Ne

5

Chunkr：开源文档智能API，打造高效RAG/LLM数据预处理基础设施 •

6

构建融合 Text2SQL 与 RAG 的混合智能代理工作流，开启结构化与非结构

7

深度理解Transformers，从基础数学到核心机制全覆盖，适合入门深度学习：

8

Anthropic 推出免费 AI 教程，涵盖：• 提示工程（Prompt En

9

The Ultra-Scale Playbook 是 Hugging Face

10

入门PyTorch首选指南：Sebastian Raschka的《PyTorch

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

哈哈哈昨晚三星发布会我是真的看爽了！三星折叠屏比直板更轻薄GalaxyZF

2

2025下半年新机打架谁是你的菜？

3

荣耀线下店基本全面铺货，趁着周末去摸了摸荣耀X70，跟我想的有点不一样上手真

4

论手感的话，个人感觉还得是钛金属，大家觉得呢？[思考]

5

三星折叠屏比直板更轻薄刷到三星的全球新品发布会，又被三星的折叠屏手机硬控了，知道

6

很庆幸买了荣耀400Pro，没买华为Nova14Pro。最近换手机，在华为Nov

7

目前来看，iPhone17系列只要你不选标准版，大概率是怎么选都不会后悔，当然

8

9月份集体硬刚iPhone？你更期待哪款？9月份就是新一轮旗舰机，集体硬刚i

9

比亚迪APP征集全新名称了，目前看了一下，提到比较多的就是“迪家”，确实简单好记

10

红米新机Redmi15外观渲染图曝光：后置三摄采用纵向排列的矩形Deco今

科技最新文章

1

荣耀最新旗舰荣耀Magic8系列配置预测，为了满足消费者的需求，这次的荣耀Mag

2

目前最值得入手的3款荣耀手机1、荣耀400Pro，相对上一代产品升级到了满

3

预1500元以内，这3款手机的性能和续航“最强”，轻松用五年红米Turbo3

4

荣耀的10,000mAh电池手机要来了！更让人吃惊的是他的厚度将控制

5

华为Mate80系列爆料来啦～📱据博主透露，新机将搭载低轨卫星通讯，户外没

6

一加要站起来了！这不得卖爆？新款一加Ace6爆料也来了，超声波指纹、金属中框

7

罗永浩连怼网友罗永浩怎么了罗永浩连续发微博怼网友，他怎么了

8

三星这波系统升级真的让人又爱又恨啊！昨天看到推送通知马上就点了更新，结果

9

华为Mate60Pro，12+512GB，薄荷绿色。搭载HarmonyOS

10

iPhone17Pro传言：1.铝金属中框2.抗反射显示屏