vectro 是 AI Skill Hub 本期精选AI工具之一。综合评分 6.3 分,整体质量稳定。我们推荐使用将其纳入你的 AI 工具库,帮助提升工作效率。
vectro 是一款基于 Rust 开发的开源工具,专注于 installable、ai、ai-engineering 等核心功能。作为 GitHub 开源项目,它拥有活跃的社区支持和持续的版本迭代,代码完全透明可审计,支持本地部署以保护数据隐私。无论是个人使用还是集成到企业工作流,都能提供稳定可靠的解决方案。
vectro 是一款基于 Rust 开发的开源工具,专注于 installable、ai、ai-engineering 等核心功能。作为 GitHub 开源项目,它拥有活跃的社区支持和持续的版本迭代,代码完全透明可审计,支持本地部署以保护数据隐私。无论是个人使用还是集成到企业工作流,都能提供稳定可靠的解决方案。
# 方式一:cargo install(推荐) cargo install vectro # 方式二:从源码编译 git clone https://github.com/konjoai/vectro cd vectro cargo build --release # 二进制在 ./target/release/vectro
# 查看帮助 vectro --help # 基本运行 vectro [options] <input> # 详细使用说明请查阅文档 # https://github.com/konjoai/vectro
# vectro 配置说明 # 查看配置选项 vectro --config-example > config.yml # 常见配置项 # output_dir: ./output # log_level: info # workers: 4 # 环境变量(覆盖配置文件) export VECTRO_CONFIG="/path/to/config.yml"
┌───────────────────────────────────────────────────────────────────┐
│ Vectro v3.0.0 Package Contents │
├───────────────────────────────────────────────────────────────────┤
│ 📚 14 Production Mojo Modules SIMD + GPU + HNSW + Storage │
│ 🐍 25+ Python Modules Full v3 API surface │
│ ✅ 792 Tests (Python-only mode) All phases verified │
│ 📖 5 Documentation Guides Migration · API · Benchmarks │
│ ⚡ SIMD Vectorized vectorize[_kernel, SIMD_WIDTH] │
│ 🔢 7 Quantization Modes INT8/NF4/PQ/Binary/RQ/AE/Auto │
│ 🔍 Native HNSW Built-in ANN search index │
│ 🏎️ GPU Support MAX Engine + CPU SIMD fallback │
│ 📦 VQZ Format ZSTD-compressed, checksummed │
│ ☁️ Cloud Storage S3 · GCS · Azure Blob │
│ 🔌 Vector DB Connectors Qdrant · Weaviate · in-memory │
│ 🔄 Migration Tooling v1/v2 → v3 upgrade w/ dry-run │
│ 🖥️ CLI vectro compress / inspect / … │
└───────────────────────────────────────────────────────────────────┘
---
⚠️ RequirementsPython-Only Mode (Works Everywhere) - Python 3.10+ - NumPy - For INT8 throughput benefits: Mojo-Accelerated Mode (Optional, for 5M+ vec/s) - Requires: Optional Vector DB Support - All core functions work in Python-only mode. Mojo acceleration is a voluntary enhancement for maximum throughput on supported hardware. --- Cloud backends (requires pip install fsspec[s3])from python.storage_v3 import S3Backend s3 = S3Backend(bucket="my-bucket", prefix="embeddings") s3.save_vqz(quantized, scales, dims=768, remote_name="prod.vqz") ``` --- AWS S3 (requires pip install fsspec[s3])s3 = S3Backend(bucket="my-vectors", prefix="prod") s3.save_vqz(quantized, scales, dims=768, remote_name="batch1.vqz") Python API (Works Immediately, No Setup Required)```python from python.v3_api import VectroV3, auto_compress import numpy as np 1. Clone and setupgit clone https://github.com/wesleyscholl/vectro.git cd vectro pixi install && pixi shell 4. Build and verify the Mojo binarypixi run build-mojo # builds vectro_quantizer at project root pixi run selftest # verifies INT8/NF4/Binary correctness ``` Build store from texts — same interface as FAISS.from_texts, Chroma.from_textsstore = LangChainVectorStore.from_texts( texts=["Paris is the capital of France", "Berlin is cold in winter"], embedding=OpenAIEmbeddings(), compression_profile="balanced", # INT8 ~4× compression ) Build candidates: (doc_id, document, original_score)candidates = [(doc.metadata.get("id", str(i)), doc, score) for i, (doc, score) in enumerate(initial)] ⚡ Quick Start🔄 Migration Guide (v1/v2 to v3)Artifacts saved with Vectro < 2.0 use NPZ format version 1.
See docs/migration-guide.md for the complete guide. --- 2. Run visual demopython demos/demo_v3.py Train codebook on representative samplecodebook = PQCodebook.train(training_vectors, n_subspaces=96, n_centroids=256) codebook.save("codebook.vqz") v3 = VectroV3(profile="pq-96", codebook=codebook) result = v3.compress(vectors) # cosine_sim >= 0.95, 32x compression codebook48 = PQCodebook.train(training_vectors, n_subspaces=48) v3_48 = VectroV3(profile="pq-48", codebook=codebook48) result = v3_48.compress(vectors) # ~16x compression ``` Mojo (Ultra-High Performance - Optional)```bash Python API (Easy Integration)```python pip install vectro # basic pip install "vectro[data]" # + Arrow / Parquet pip install "vectro[integrations]" # + Qdrant, Weaviate, PyTorch from python import Vectro, compress_vectors, decompress_vectors import numpy as np vectors = np.random.randn(1000, 768).astype(np.float32) v3.0.0 New APIs```python from python.v3_api import VectroV3, PQCodebook, HNSWIndex, auto_compress 🐍 Python APIv3.0.0: All prior v2 capabilities plus seven new v3 modules. Async variants (FastAPI / asyncio services)docs = await store.asimilarity_search("async query", k=2) mmr_docs = await store.amax_marginal_relevance_search("async query", k=4) LoRAResult(profile='lora-nf4', rank=16, module='q_proj',Compress a full adapter (all target modules)```python adapter = { "q_proj": (A_q, B_q), "v_proj": (A_v, B_v), "k_proj": (A_k, B_k), } compressed = compress_lora_adapter(adapter, profile="lora-nf4") Returns: Dict[str, LoRAResult] — one entry per module``` 🔗 Vector Database Integrations
See docs/integrations.md for full configuration. --- 🔗 RAG Framework IntegrationsVectro provides drop-in compressed vector stores for the three dominant RAG frameworks. Embeddings are compressed at write time (INT8 or NF4) and decompressed on-the-fly at query time via Mojo SIMD. Per-modulepython -m pytest tests/test_v3_api.py -v # v3 unified API python -m pytest tests/test_hnsw.py -v # HNSW index python -m pytest tests/test_pq.py -v # Product quantization python -m pytest tests/test_nf4.py -v # NF4 python -m pytest tests/test_binary.py -v # Binary python -m pytest tests/test_rq.py -v # Residual quantization python -m pytest tests/test_storage_v3.py -v # VQZ format Voyage 3 (asymmetric: documents vs queries use different input_type)embed = VoyageEmbeddings(model="voyage-3", cache_dir="...") Memory comparison (768-dim, 1M documents)
---
🇨🇳 中文文档镜像
AI 翻译
2026-05-24
英文原文章节由系统翻译为中文摘要,便于快速理解。完整原文见上方 "📑 README 深度解析"。
📌 简介
Vectro 是一个用于向量压缩和存储的开源项目,提供了高性能的向量压缩算法和存储解决方案。 ⚡ 功能介绍
Vectro 包含了 14 个生产级 Mojo 模块,支持 SIMD、GPU、HNSW 和存储等功能,另外还提供了 25+ 个 Python 模块,覆盖了 v3 API 的全部功能,总共有 792 个测试用例。 📋 环境依赖
Vectro 需要 Python 3.10+ 和 NumPy 等依赖包,支持 INT8 透过率的优化,最高可达 ~167K–210K vec/s。 🛠 安装步骤(Docker/pip/源码)
Vectro 可以通过 pip 安装,或者从源码克隆并使用 pixi 安装和设置,支持 Docker 部署等方式。 🚀 使用教程
Vectro 的使用教程包括了快速开始、迁移指南、API 使用等方面,提供了详细的使用说明。 ⚙️ 配置说明(含 MCP / env)
Vectro 的配置包括了 MCP、环境变量和关键参数等方面,需要根据具体需求进行配置。 🔌 API 说明
Vectro 的 Python API 提供了高级接口,支持向量压缩、存储和检索等功能,包括了 v3.0.0 新增的七个模块。 🔄 工作流/模块
Vectro 的工作流包括了向量压缩、存储和检索等模块,提供了详细的工作流说明和示例代码。 📚 实用指南(长尾问题)
适合谁
最佳实践
常见错误
部署方案
⚡ 核心功能
👥 适合谁
⭐ 最佳实践
⚠️ 常见错误
👥 适合人群
🎯 使用场景
⚖️ 优点与不足
✅ 优点
⚠️ 不足
⚠️ 使用须知
AI Skill Hub 为第三方内容聚合平台,本页面信息基于公开数据整理,不对工具功能和质量作任何法律背书。 建议在沙箱或测试环境中充分验证后,再部署至生产环境,并做好必要的安全评估。 📄 License 说明
✅ MIT 协议 — 最宽松的开源协议之一,可自由商用、修改、分发,仅需保留版权声明。 🔗 相关工具推荐
transformers AI技能包
Hugging Face开源的深度学习框架,提供预训练语言模型、视觉模型和多模态模型。集成BERT、GPT、Llama等
ComfyUI 节点式AI图像生成
强大的开源扩散模型可视化工具,提供图形界面、API和后端服务。采用节点图式设计,支持模块化工作流构建,适合AI绘图、图像
llama-cpp AI技能包
高效的大语言模型C/C++推理框架,支持在本地CPU/GPU上运行量化LLM模型,具有内存占用小、推理速度快的特点。适合
yt-dlp 视频下载
功能强大的开源视频下载工具,支持YouTube、TikTok等数千个视频平台,可自动下载视频、字幕、封面和元数据。适合内
📰 相关 AI 新闻
🧩 你可能还需要
基于当前 Skill 的能力图谱,自动补全的工具组合
total-agent-memory MCP工具 为Claude Code和Codex CLI提供持久化记忆功能的开源MCP工具。自动提取知识图谱,支持多轮对话上下文保留,适合需要长期记忆和 MassGen多智能体系统 MCP · Agent · 工作流 kb-arena开源AI工作流 kb-arena是开源的AI工作流,用于Benchmark 9 retrieval architectures(向量、上下文、QnA、知识图 开源AI工具:RAG知识库系统 基于Vue.js前端的RAG知识库系统,提供高效的知识检索和生成功能,助力AI应用开发 CrewAI 多代理协作平台 MCP · Agent · 工作流 gptme Agent工作流 MCP · Agent · 工作流 ❓ 常见问题 FAQ
vectro 是一款Rust开发的AI辅助工具。开源AI工具:⚡ Vectro: Lightning-fast embedding quantization. Hit 12M+ vec/s throughput (4.85。⭐8 · Rust
💡 AI Skill Hub 点评
经综合评估,vectro 在AI工具赛道中表现稳健,质量良好。如果你已有明确的使用需求,可以直接上手体验;如果还在评估阶段,建议对比同类工具后再做决策。 🌐 原始信息
🔗 原始来源
🐙 GitHub 仓库 https://github.com/konjoai/vectro
🌐 官方网站 https://github.com/konjoai/vectro
收录时间:2026-05-17 · 更新时间:2026-05-18 · License:MIT · AI Skill Hub 不对第三方内容的准确性作法律背书。 |