LEANN:世界上最小的向量索引,让个人设备实现高效RAG
你是否曾经为传统向量数据库庞大的存储占用而烦恼?或者担心将个人数据上传到云端会泄露隐私?LEANN 的出现,旨在彻底解决这些问题。它是一个基于 Python 开发的创新向量数据库,通过革命性的图基选择性重计算技术,帮助开发者在个人设备上运行快速、准确且 100% 私有的 RAG 应用,同时节省高达 97% 的存储空间。本文将带你全面了解这个潜力新星。
截至收录:
LEANN stars数:4251
LEANN forks数:420
LEANN项目目录截图

LEANN项目核心亮点
🌟 极致存储效率:采用图基选择性重计算和高阶保持剪枝技术,仅需传统方案 3% 的存储空间即可索引相同规模数据。
🔒 完全隐私保护:所有数据处理都在本地完成,无需连接云端,确保个人数据 100% 私有安全。
🪶 轻量便携:智能图剪枝和 CSR 格式最小化图存储开销,整个知识库可在设备间轻松迁移。
📈 强大可扩展性:能够处理传统向量数据库无法应对的混乱个人数据,轻松管理不断增长的个性化数据。
LEANN项目快速开始
只需几步,你就能在本地运行起 LEANN:
- 安装前置工具:
# 安装 uv 包管理器 curl -LsSf https://astral.sh/uv/install.sh | sh - 安装 LEANN:
# 克隆仓库并安装 git clone https://github.com/yichuan-w/LEANN.git leann cd leann uv venv source .venv/bin/activate uv pip install leann - 运行第一个示例:
python -m apps.document_rag --query "LEANN 探索了哪些主要技术?"
LEANN项目应用场景
个人文档智能搜索:将 PDF、TXT、MD 等文档转换为可搜索的知识库,快速找到所需信息。
电子邮件智能管理:索引数十万封邮件,实现类似 Google 的智能搜索体验。
聊天历史语义检索:支持微信、iMessage、ChatGPT、Claude 等聊天记录的智能搜索。
实时数据集成:通过 MCP 协议连接 Slack、Twitter 等平台,实现实时数据检索。
代码库智能助手:与 Claude Code 无缝集成,提供基于语义的代码搜索和开发辅助。
用户案例:目前,伯克利 Sky Computing Lab 等研究机构都在使用 LEANN 来改善其数据处理和工作流程。
LEANN项目链接
yichuan-w / LEANN项目地址:https://github.com/yichuan-w/LEANN
本文地址:https://www.tgoos.com/24421
