Docling 智能文档理解 是 AI Skill Hub 本期精选AI工具之一。在 GitHub 上收获超过 59.6k 颗 Star,综合评分 8.5 分,整体质量较高。我们强烈推荐将其纳入你的 AI 工具库,帮助提升工作效率。
专业文档转换工具,利用AI技术将PDF、Word等格式文档智能转换为生成式AI友好的结构化格式。支持表格识别、布局分析、多种输出格式。适合数据科学家、AI工程师和企业用户处理大规模文档
Docling 智能文档理解 是一款基于 Python 开发的开源工具,专注于 文档解析、AI预处理、格式转换 等核心功能。作为 GitHub 开源项目,它拥有活跃的社区支持和持续的版本迭代,代码完全透明可审计,支持本地部署以保护数据隐私。无论是个人使用还是集成到企业工作流,都能提供稳定可靠的解决方案。
专业文档转换工具,利用AI技术将PDF、Word等格式文档智能转换为生成式AI友好的结构化格式。支持表格识别、布局分析、多种输出格式。适合数据科学家、AI工程师和企业用户处理大规模文档
Docling 智能文档理解 是一款基于 Python 开发的开源工具,专注于 文档解析、AI预处理、格式转换 等核心功能。作为 GitHub 开源项目,它拥有活跃的社区支持和持续的版本迭代,代码完全透明可审计,支持本地部署以保护数据隐私。无论是个人使用还是集成到企业工作流,都能提供稳定可靠的解决方案。
# 方式一:pip 安装(推荐)
pip install docling
# 方式二:虚拟环境安装(推荐生产环境)
python -m venv .venv
source .venv/bin/activate # Windows: .venv\Scripts\activate
pip install docling
# 方式三:从源码安装(获取最新功能)
git clone https://github.com/docling-project/docling
cd docling
pip install -e .
# 验证安装
python -c "import docling; print('安装成功')"
# 命令行使用
docling --help
# 基本用法
docling input_file -o output_file
# Python 代码中调用
import docling
# 示例
result = docling.process("input")
print(result)
# docling 配置文件示例(config.yml) app: name: "docling" debug: false log_level: "INFO" # 运行时指定配置文件 docling --config config.yml # 或通过环境变量配置 export DOCLING_API_KEY="your-key" export DOCLING_OUTPUT_DIR="./output"
<p align="center"> <a href="https://github.com/docling-project/docling"> <img loading="lazy" alt="Docling" src="https://github.com/docling-project/docling/raw/main/docs/assets/docling_processing.png" width="100%"/> </a> </p>
.txt, .text) and Markdown supersets (.qmd, .Rmd)pip install docling
Note: Python 3.9 support was dropped in docling version 2.70.0. Please use Python 3.10 or higher.
Works on macOS, Linux and Windows environments. Both x86_64 and arm64 architectures.
More detailed installation instructions are available in the docs.
from docling.document_converter import DocumentConverter
source = "https://arxiv.org/pdf/2408.09869" # document per local path or URL
converter = DocumentConverter()
result = converter.convert(source)
print(result.document.export_to_markdown()) # output: "## Docling Technical Report[...]"
More advanced usage and configuration options.
Go hands-on with our examples, demonstrating how to address different application use cases with Docling.
If you use Docling in your projects, please consider citing the following:
@techreport{Docling,
author = {Deep Search Team},
month = {8},
title = {Docling Technical Report},
url = {https://arxiv.org/abs/2408.09869},
eprint = {2408.09869},
doi = {10.48550/arXiv.2408.09869},
version = {1.0.0},
year = {2024}
}
To further accelerate your AI application development, check out Docling's native integrations with popular frameworks and tools.
业界领先的文档AI预处理工具,5.9万Star验证其价值。智能解析+多格式输出组合强大,生态完善,是Gen AI时代文档处理标准方案
AI Skill Hub 为第三方内容聚合平台,本页面信息基于公开数据整理,不对工具功能和质量作任何法律背书。
建议在沙箱或测试环境中充分验证后,再部署至生产环境,并做好必要的安全评估。
✅ MIT 协议 — 最宽松的开源协议之一,可自由商用、修改、分发,仅需保留版权声明。
经综合评估,Docling 智能文档理解 在AI工具赛道中表现稳健,质量优秀。如果你已有明确的使用需求,可以直接上手体验;如果还在评估阶段,建议对比同类工具后再做决策。
| 原始名称 | docling |
| 原始描述 | 开源AI工具:Get your documents ready for gen AI。⭐59.6k · Python |
| Topics | 文档解析AI预处理格式转换表格识别Python工具 |
| GitHub | https://github.com/docling-project/docling |
| License | MIT |
| 语言 | Python |
收录时间:2026-05-13 · 更新时间:2026-05-26 · License:MIT · AI Skill Hub 不对第三方内容的准确性作法律背书。