MinerU:将复杂文档智能转换为LLM就绪格式
你是否曾经为从PDF等复杂文档中提取结构化信息而烦恼?MinerU的出现,旨在彻底解决这个问题。它是一个基于多模态大模型的文档解析工具,可以将PDF等复杂文档高效转换为LLM就绪的Markdown和JSON格式,为智能体工作流提供高质量数据输入。
截至收录:
MinerU项目stars数:46216
MinerU项目forks数:3832
MinerU项目目录截图

MinerU项目核心亮点
🌟 极致性能与效率:仅1.2B参数的MinerU2.5模型,在OmniDocBench基准测试中全面超越Gemini 2.5 Pro、GPT-4o等百亿级模型,重新定义了文档AI的性能参数比标准。
🎯 全功能文档解析:支持布局分析、文本识别、公式识别、表格识别和阅读顺序识别五大核心功能,能够处理单栏、多栏和复杂布局文档。
🔒 智能内容处理:自动移除页眉、页脚、脚注、页码等干扰元素,确保语义连贯性,并按人类阅读顺序输出文本。
🧩 多格式输出支持:支持多模态Markdown、按阅读顺序排序的JSON、丰富的中间格式等多种输出格式,满足不同应用场景需求。
MinerU项目快速开始
只需几步,你就能开始使用MinerU进行文档解析:
- 安装:
# 使用uv安装(推荐) pip install uv uv pip install -U "mineru[core]"或使用pip安装
pip install -U "mineru[core]" - 运行你的第一个解析命令:
mineru -p <input_path> -o <output_path> - 在线体验:
- 官方在线Web应用:功能完整,界面美观,需登录使用
- Gradio在线演示:界面简洁,仅核心解析功能,无需登录
MinerU项目应用场景
场景一:智能体工作流数据准备:为RAG系统、智能体应用提供高质量的文档解析能力,将PDF等非结构化文档转换为LLM友好的结构化数据。
场景二:学术文献处理:专门优化科学文献中的符号转换问题,支持公式自动转换为LaTeX格式,表格转换为HTML格式。
场景三:企业文档数字化:支持84种语言的OCR识别,能够处理扫描版PDF和乱码PDF,助力企业文档数字化转型。
用户案例:MinerU诞生于InternLM预训练过程,目前已被多个研究机构和企业用于文档智能处理工作流中。
MinerU项目链接
opendatalab / MinerU项目地址:https://github.com/opendatalab/MinerU
本文地址:https://www.tgoos.com/18159
