AI 驱动的混合搜索正在进行封闭测试。 加入等候名单,获取提前体验资格!

前往主页Meilisearch 的标志
返回文章

向量存储即将加入 Meilisearch,以增强 AI 搜索能力

我们很高兴发布 Meilisearch 的向量存储功能,为 AI 驱动的应用程序带来快速、相关的搜索。

Laurent Cazanove
Laurent CazanoveDX 工程师 & 文案@StriftCodes
Vector storage is coming to Meilisearch to empower search through AI

向量搜索可以高效检索具有相似特征的对象。这种 AI 驱动的搜索技术使用嵌入向量。这些向量是由机器学习模型(如 LLM)生成的对象的数学表示。从 1.3 版本开始,Meilisearch 支持存储和搜索向量。

Meilisearch v1.3 发布了!阅读发行说明

为搜索的未来提供动力

向量搜索可能是搜索新时代的曙光。其用例众多。在电子商务中,它可以为类似产品提供推荐。它还允许构建多模态搜索,如图像或音频搜索。基于对话式 AI 技术可以创建问答应用程序。将向量搜索与用户提供的信息(如地理位置和搜索历史)相结合,可以提供更具上下文的搜索体验。

向量搜索也是语义搜索的基础,其目的是理解查询的含义。相反,传统的词法搜索只匹配关键字。通过语义搜索,暖和的衣服查询可以给出诸如手套外套以及更多与冬季服装相关的结果。

向量搜索为搜索解锁了全新的功能。看看一些用户已经实现的功能

Meilisearch 可以作为 LangChain 向量存储使用。

Meilisearch 向量存储入门

从 v1.3 开始,您可以将 Meilisearch 用作向量存储。Meilisearch 允许您方便地将向量嵌入与文档一起存储。您将需要使用您选择的第三方工具(Hugging FaceOpenAI)创建向量嵌入。

首先,启动 Meilisearch 实例。您可以在本地安装 Meilisearch,或者创建一个 Meilisearch Cloud 帐户。

然后,启用 向量存储 实验性功能

curl 
  -X PATCH 'https://127.0.0.1:7700/experimental-features/' 
  -H 'Content-Type: application/json'  
  --data-binary '{
    "vectorStore": true
  }'

本指南使用 `curl` 来发送 HTTP 请求与 Meilisearch 通信。在实践中,我们建议使用我们的SDK 来代替。

Meilisearch 现在接受文档中的 _vector 字段。使用它来存储与此字段中的文档对应的向量嵌入。

curl -X POST -H 'content-type: application/json' 
     'localhost:7700/indexes/songs/documents' 
     --data-binary '[
         { "id": 0, "_vectors": [0, 0.8, -0.2], "title": "Across The Universe" },
         { "id": 1, "_vectors": [1, -0.2, 0], "title": "All Things Must Pass" },
         { "id": 2, "_vectors": [0.5, 3, 1], "title": "And Your Bird Can Sing" }
     ]'

在 Meilisearch 中存储向量化文档后,您可以使用 searchmulti-search 路由查询它们。为此,您需要计算查询的向量(使用第三方工具)并在 vector 字段中发送它。

curl -X POST -H 'content-type: application/json' 
   'localhost:7700/indexes/songs/search' 
   --data-binary '{ "vector": [0, 1, 2] }'

使用向量搜索时,返回的文档包括一个 semanticScore 字段

{
  "hits": [
    { "id": 0, "_vectors": [0, 0.8, -0.2], "title": "Across The Universe", "_semanticScore": 0.6754 },
    { "id": 1, "_vectors": [1, -0.2, 0], "title": "All Things Must Pass", "_semanticScore": 0.7546 },
    { "id": 2, "_vectors": [0.5, 3, 1], "title": "And Your Bird Can Sing", "_semanticScore": 0.78 }
  ],
  "query": "",
  "vector": [0, 1, 2],
  "processingTimeMs": 0,
  "limit": 20,
  "offset": 0,
  "estimatedTotalHits": 2
}

此 API 是实验性的。您可以通过在此 Github 讨论中分享您的反馈来帮助我们改进它。

迈向语义搜索的第一步

向量搜索是我们迈向语义搜索的第一步。但我们的长期目标是提供混合搜索,结合全文搜索和语义搜索的优势,以提供最相关的搜索体验。Meilisearch 的创始人兼 CTO Clément Renault 在 Github 上分享了他关于探索语义搜索的想法 — 阅读以了解创始人的观点。我们迫不及待地想与您分享更多!

在下方留下您的电子邮件,了解更多关于我们 AI 驱动的搜索进展。我们将随时向您通报有关向量搜索和语义搜索的所有更新。

将 Meilisearch AI 更新直接发送到您的收件箱 💌

* 表示必填

电子邮件地址 *

营销许可

请选择您希望从 Meilisearch 收听的所有方式

电子邮件

您可以随时取消订阅。

我们使用Mailchimp发送电子邮件。

我们很高兴迈出迈向语义搜索的第一步。我们迫不及待地想听到您对将 Meilisearch 集成作为向量存储的想法。您可以在此 Github 讨论中提供您的反馈。

您可以通过订阅我们的新闻通讯来了解最新动态。要了解更多关于 Meilisearch 的未来并帮助塑造它,请查看我们的路线图并参与我们的产品讨论

对于其他任何问题,请在Discord上加入我们的开发者社区。

我们那里见。

Software Engineering Predictive Search: A Complete Guide

软件工程预测搜索:完整指南

了解如何在您的软件应用程序中实现预测搜索。探索关键概念、优化技术和真实示例,以增强用户体验。

Ilia Markov
Ilia Markov2024 年 12 月 11 日
Meilisearch November Updates

Meilisearch 11 月更新

您的 Meilisearch 每月回顾。2024 年 11 月版。

Laurent Cazanove
Laurent Cazanove2024 年 12 月 3 日
Beyond the Hype: Practical AI Search Strategies That Deliver ROI

超越炒作:提供投资回报率的实用 AI 搜索策略

了解如何实施能够推动实际投资回报率的 AI 驱动搜索。通过关于预算、功能选择和衡量成功情况的实用策略来摆脱炒作。

Ilia Markov
Ilia Markov2024 年 12 月 2 日