向量存储即将加入 Meilisearch,以增强 AI 搜索能力
我们很高兴发布 Meilisearch 的向量存储功能,为 AI 驱动的应用程序带来快速、相关的搜索。
向量搜索可以高效检索具有相似特征的对象。这种 AI 驱动的搜索技术使用嵌入向量。这些向量是由机器学习模型(如 LLM)生成的对象的数学表示。从 1.3 版本开始,Meilisearch 支持存储和搜索向量。
Meilisearch v1.3 发布了!阅读发行说明
为搜索的未来提供动力
向量搜索可能是搜索新时代的曙光。其用例众多。在电子商务中,它可以为类似产品提供推荐。它还允许构建多模态搜索,如图像或音频搜索。基于对话式 AI 技术可以创建问答应用程序。将向量搜索与用户提供的信息(如地理位置和搜索历史)相结合,可以提供更具上下文的搜索体验。
向量搜索也是语义搜索的基础,其目的是理解查询的含义。相反,传统的词法搜索只匹配关键字。通过语义搜索,暖和的衣服
查询可以给出诸如手套
、外套
以及更多与冬季服装相关的结果。
向量搜索为搜索解锁了全新的功能。看看一些用户已经实现的功能
Meilisearch 可以作为 LangChain 向量存储使用。
Meilisearch 向量存储入门
从 v1.3 开始,您可以将 Meilisearch 用作向量存储。Meilisearch 允许您方便地将向量嵌入与文档一起存储。您将需要使用您选择的第三方工具(Hugging Face、OpenAI)创建向量嵌入。
首先,启动 Meilisearch 实例。您可以在本地安装 Meilisearch,或者创建一个 Meilisearch Cloud 帐户。
然后,启用 向量存储 实验性功能
curl -X PATCH 'https://127.0.0.1:7700/experimental-features/' -H 'Content-Type: application/json' --data-binary '{ "vectorStore": true }'
本指南使用 `curl` 来发送 HTTP 请求与 Meilisearch 通信。在实践中,我们建议使用我们的SDK 来代替。
Meilisearch 现在接受文档中的 _vector
字段。使用它来存储与此字段中的文档对应的向量嵌入。
curl -X POST -H 'content-type: application/json' 'localhost:7700/indexes/songs/documents' --data-binary '[ { "id": 0, "_vectors": [0, 0.8, -0.2], "title": "Across The Universe" }, { "id": 1, "_vectors": [1, -0.2, 0], "title": "All Things Must Pass" }, { "id": 2, "_vectors": [0.5, 3, 1], "title": "And Your Bird Can Sing" } ]'
在 Meilisearch 中存储向量化文档后,您可以使用 search
或 multi-search
路由查询它们。为此,您需要计算查询的向量(使用第三方工具)并在 vector
字段中发送它。
curl -X POST -H 'content-type: application/json' 'localhost:7700/indexes/songs/search' --data-binary '{ "vector": [0, 1, 2] }'
使用向量搜索时,返回的文档包括一个 semanticScore
字段
{ "hits": [ { "id": 0, "_vectors": [0, 0.8, -0.2], "title": "Across The Universe", "_semanticScore": 0.6754 }, { "id": 1, "_vectors": [1, -0.2, 0], "title": "All Things Must Pass", "_semanticScore": 0.7546 }, { "id": 2, "_vectors": [0.5, 3, 1], "title": "And Your Bird Can Sing", "_semanticScore": 0.78 } ], "query": "", "vector": [0, 1, 2], "processingTimeMs": 0, "limit": 20, "offset": 0, "estimatedTotalHits": 2 }
此 API 是实验性的。您可以通过在此 Github 讨论中分享您的反馈来帮助我们改进它。
迈向语义搜索的第一步
向量搜索是我们迈向语义搜索的第一步。但我们的长期目标是提供混合搜索,结合全文搜索和语义搜索的优势,以提供最相关的搜索体验。Meilisearch 的创始人兼 CTO Clément Renault 在 Github 上分享了他关于探索语义搜索的想法 — 阅读以了解创始人的观点。我们迫不及待地想与您分享更多!
在下方留下您的电子邮件,了解更多关于我们 AI 驱动的搜索进展。我们将随时向您通报有关向量搜索和语义搜索的所有更新。
将 Meilisearch AI 更新直接发送到您的收件箱 💌
* 表示必填
电子邮件地址 *
营销许可
请选择您希望从 Meilisearch 收听的所有方式
电子邮件
您可以随时取消订阅。
我们使用Mailchimp发送电子邮件。
我们很高兴迈出迈向语义搜索的第一步。我们迫不及待地想听到您对将 Meilisearch 集成作为向量存储的想法。您可以在此 Github 讨论中提供您的反馈。
您可以通过订阅我们的新闻通讯来了解最新动态。要了解更多关于 Meilisearch 的未来并帮助塑造它,请查看我们的路线图并参与我们的产品讨论。
对于其他任何问题,请在Discord上加入我们的开发者社区。
我们那里见。