pgvector 实战教程：在 PostgreSQL 中实现语义、混合、稀疏与量化向量搜索

一句话看懂

本教程在 Google Colab 中搭建 pgvector 环境，手把手教你用 PostgreSQL 实现语义搜索、混合检索、稀疏向量和量化搜索，全程开源工具。

详细发生了什么

MarkTechPost 发布了一篇详细的编码指南。作者 Sana Hassan 在 Google Colab 中构建了一个完整的 pgvector 实验环境。教程从零开始：安装 PostgreSQL、编译 pgvector 扩展、通过 Psycopg 连接数据库，并注册向量类型以实现 Python 集成。

接着，使用 SentenceTransformers 模型（all-MiniLM-L6-v2）生成文本嵌入，存入 PostgreSQL 表，并构建 HNSW 索引加速搜索。教程展示了多种搜索能力：

语义搜索：通过余弦相似度查找最相关文档
过滤搜索：按类别（如 space）筛选后搜索
距离度量对比：L2、余弦、负内积、L1 四种距离算子
半精度存储：使用 halfvec 类型减少存储空间
二进制量化：用 Hamming 距离进行近似搜索，再精确重排
稀疏向量：原生支持 sparsevec，适合关键词匹配场景
混合检索：结合向量相似度和关键词权重
向量聚合：对嵌入进行统计操作

所有代码均可直接复制到 Colab 运行，环境搭建约 1-2 分钟。

中文圈视角

对中文开发者来说，pgvector 是一个极具实用价值的工具，原因有三：

无需额外基础设施：如果你已经在用 PostgreSQL，pgvector 直接作为扩展安装，无需引入 Milvus、Weaviate 等专用向量数据库，降低运维复杂度。国内很多中小团队使用 PostgreSQL，pgvector 是性价比最高的向量搜索方案。
国产平替对比：国内类似方案有 Tencent Cloud 的 VectorDB、Zilliz Cloud（Milvus 托管版），但 pgvector 的优势在于开源、自托管、与关系型数据无缝结合。如果你的场景需要同时管理结构化数据和向量（如电商商品+属性），pgvector 比专用向量库更灵活。
中文场景适配：教程使用的 SentenceTransformers 模型 all-MiniLM-L6-v2 对英文效果好，但中文用户可替换为 paraphrase-multilingual-MiniLM-L12-v2 或国产 BGE 模型（BAAI/bge-small-zh-v1.5），pgvector 兼容任何 embedding 模型。注意：中文文本需要先分词或使用支持中文的模型，否则语义搜索效果会打折扣。
监管与合规：pgvector 完全本地部署，数据不出境，符合国内数据安全法规。对于金融、医疗等敏感行业，这是重要优势。

一个尚未被广泛讨论的盲点：pgvector 的 HNSW 索引在数据量超过百万级时，构建时间和内存消耗会显著增加，国内用户若需处理千万级数据，建议先评估索引参数（m, ef_construction）或考虑分区表策略。

几条值得记住的细节

pgvector 支持 4 种距离度量：L2、余弦、内积、L1，可通过不同算子（<->, <=>, <#>, <+>）调用。
半精度 halfvec 可减少 50% 存储空间，适合内存敏感场景。
二进制量化（binary_quantize）将向量转为 bit 类型，用 Hamming 距离近似搜索，速度极快，适合大规模召回后精排。
稀疏向量 sparsevec 原生支持，适合 TF-IDF 或关键词权重场景，与稠密向量互补。
教程中 HNSW 索引参数 m=16, ef_construction=64，搜索时 ef_search=100，可根据数据量调整。

一句话总结

如果你正在用 PostgreSQL 并需要向量搜索，pgvector 是最省心的开源方案，本教程让你 10 分钟跑通全流程。