震撼发布！清华等联合推出全球首个UltraRAG 2.1：只需YAML文件，轻松构建智能检索系统！

7个月前发布aiba

摘要：

UltraRAG2.1是全球首个基于Model Context Protocol（MCP）架构的开源检索增强生成（RAG）框架，由清华大学、东北大学及其他机构共同研发。该框架简化了多模态智能检索系统的构建，用户仅需编写简短的YAML配置文件，无需编码。其三大核心升级包括原生多模态支持、全自动知识库构建及统一工作流，显著提升知识管理效率。UltraRAG2.1实现了模块解耦，用户可灵活组装任务流，标志着RAG技术向工程化范式的跨越，推动技术在实际应用中的普及与进步。

震撼发布！清华等联合推出全球首个UltraRAG 2.1：只需YAML文件，轻松构建智能检索系统！的封面图

PTAG 检索增强生成（RAG）技术取得了令人振奋的进展。由清华大学THUNLP实验室、东北大学NEUIR实验室、OpenBMB与AI9Stars共同研发的UltraRAG2.1正式发布，成为全球首个基于Model Context Protocol（MCP）架构的开源RAG框架。这一版本极大地简化了多模态智能检索系统的构建过程——研究人员只需编写简短的YAML配置文件，便可实现多阶段的推理、生成与评估，完全无需编写代码，大幅降低了技术门槛，真正实现了技术的普及。

UltraRAG2.1的三大核心升级，标志着下一代RAG标准的确立。它原生支持多模态，打通了图文检索的闭环。内置的Retriever-Generation-Evaluation一体化流水线，不仅能够处理文本，还支持图像、PDF等多模态数据。其创新的VisRAG Pipeline能够直接解析本地PDF文档，自动提取文字与图表，构建跨模态索引，实现“问图答文、以文搜图”的混合检索，尤其适用于科研论文分析和技术手册问答等高价值应用场景。

在知识库构建方面，UltraRAG2.1实现了全自动化，深度集成了MinerU工具。该框架支持Word、PDF、Markdown等多种格式的智能解析与语义分块，并与开源文档处理工具无缝对接，用户可以一键构建企业级的私有知识库，无需手动清洗或标注数据，系统会自动完成结构化处理，显著提升知识管理的效率，展现出技术的强大力量。

此外，UltraRAG2.1提供了统一的工作流和标准化评估体系，确保结果的可解释性和可优化性。它兼容多种检索引擎（如Elasticsearch、FAISS）和生成模型（如Llama、Qwen、Kimi等），并通过从相关性、忠实度、流畅性等多个维度量化结果质量，帮助开发者直观定位瓶颈，快速迭代优化，推动技术不断进步。

UltraRAG2.1的MCP架构使得RAG真正实现了“可组合、可扩展”。与传统RAG的硬编码模式不同，UltraRAG2.1将检索、推理、生成等模块解耦为标准化的“智能体”，用户只需简单的YAML声明式配置，就可以灵活组装复杂的任务流。例如，仅需少量配置，就能实现“先检索技术文档→再调用代码生成模型→最后用评估模块校验输出”的三阶段工作流，展现出极高的灵活性与实用性。

aidh认为，UltraRAG2.1的发布象征着RAG技术从“工具拼接”向“工程化范式”的跨越。当多模态理解、知识构建与效果评估被统一纳入一个轻量、开源、低代码的框架时，企业与研究者将能够更高效地将大模型能力应用到真实的业务场景中。这场由中文社区主导的技术革新，正在为全球RAG生态注入新的活力和动力，展现出科技进步带来的无限可能。

项目地址：UltraRAG GitHub

文章版权归作者所有，未经允许请勿转载。

本文地址：https://www.aidh.net/kuaixun/20186.html