【[146星]TWIX:开源数据提取工具,能从批量文档中高效、低成本地重建结构化

爱生活爱珂珂 2025-05-04 17:56:37

【[146星]TWIX:开源数据提取工具,能从批量文档中高效、低成本地重建结构化数据。亮点:1. 通过推断文档的共享视觉模板,实现高精度数据提取;2. 提供Python包和交互式UI,支持用户自定义模板;3. 在1292页文档中,单次模板推断成本仅需约0.001美元,数据提取仅需4秒】

'TWIX is an open-source data extraction tool that reconstructs structured data from documents at scale, accurately and at low cost, by inferring the shared underlying visual template across documents'

GitHub: github.com/ucbepic/TWIX

数据提取 开源工具 文档处理 AI创造营

0 阅读:0
爱生活爱珂珂

爱生活爱珂珂

感谢大家的关注