向量存储将引入 Meilisearch,以通过人工智能增强搜索能力
我们很高兴为 Meilisearch 发布向量存储,以将快速、相关的搜索带入 AI 驱动的应用程序。

向量搜索能够高效检索具有相似特征的对象。这种 AI 驱动的搜索技术使用嵌入向量。这些向量是由机器学习模型(如 LLM)生成的对象的数学表示。从 1.3 版本开始,Meilisearch 支持存储和搜索向量。
Meilisearch v1.3 已发布!阅读发行说明
赋能搜索的未来
向量搜索可能是搜索新时代的曙光。它的用例众多。在电子商务中,它能够提供相似产品的推荐。它还允许构建多模态搜索,如图像或音频搜索。基于会话式 AI 技术可以创建问答应用程序。将向量搜索与用户提供的信息(如地理位置和搜索历史)相结合,可以提供更具上下文感知的搜索体验。
向量搜索也是语义搜索的基础,旨在理解查询的含义。相反,传统的词法搜索只匹配关键词。通过语义搜索,保暖衣物
查询可能会返回手套
、外套
等与冬季服装相关的结果。
向量搜索开启了搜索的新能力世界。看看一些用户已经实现了什么:
Meilisearch 可用作 LangChain 向量存储。
开始使用 Meilisearch 向量存储
从 v1.3 开始,您可以将 Meilisearch 用作向量存储。Meilisearch 允许您方便地将向量嵌入与文档一起存储。您需要使用您选择的第三方工具(Hugging Face、OpenAI)创建向量嵌入。
首先,启动一个 Meilisearch 实例。您可以本地安装 Meilisearch 或创建一个Meilisearch Cloud 账户。
然后,启用 *向量存储* 实验性功能
curl -X PATCH 'http://localhost:7700/experimental-features/' -H 'Content-Type: application/json' --data-binary '{ "vectorStore": true }'
本指南使用 `curl` 进行 HTTP 请求以与 Meilisearch 通信。实际上,我们建议使用我们的SDK 代替。
Meilisearch 现在接受您的文档中的 _vector
字段。使用此字段存储与您的文档对应的向量嵌入。
curl -X POST -H 'content-type: application/json' 'localhost:7700/indexes/songs/documents' --data-binary '[ { "id": 0, "_vectors": [0, 0.8, -0.2], "title": "Across The Universe" }, { "id": 1, "_vectors": [1, -0.2, 0], "title": "All Things Must Pass" }, { "id": 2, "_vectors": [0.5, 3, 1], "title": "And Your Bird Can Sing" } ]'
将向量化文档存储在 Meilisearch 中后,您可以使用 search
或 multi-search
路由来查询它们。为此,您需要计算查询的向量(使用第三方工具)并将其发送到 vector
字段中。
curl -X POST -H 'content-type: application/json' 'localhost:7700/indexes/songs/search' --data-binary '{ "vector": [0, 1, 2] }'
使用向量搜索时,返回的文档包含一个 semanticScore
字段
{ "hits": [ { "id": 0, "_vectors": [0, 0.8, -0.2], "title": "Across The Universe", "_semanticScore": 0.6754 }, { "id": 1, "_vectors": [1, -0.2, 0], "title": "All Things Must Pass", "_semanticScore": 0.7546 }, { "id": 2, "_vectors": [0.5, 3, 1], "title": "And Your Bird Can Sing", "_semanticScore": 0.78 } ], "query": "", "vector": [0, 1, 2], "processingTimeMs": 0, "limit": 20, "offset": 0, "estimatedTotalHits": 2 }
此 API 处于实验阶段。您可以通过在此 GitHub 讨论中分享您的反馈来帮助我们改进它。
迈向语义搜索的第一步
向量搜索是我们迈向语义搜索的第一步。但我们的长期目标是提供混合搜索——结合全文搜索和语义搜索的优势,以提供最相关的搜索体验。Meilisearch 的创始人兼 CTO Clément Renault 在 GitHub 上分享了他关于探索语义搜索的看法——阅读以了解创始人的视角。我们迫不及待地想与您分享更多!
在下方留下您的电子邮件,了解我们在 AI 驱动搜索方面的进展。我们将及时向您通报有关向量搜索和语义搜索的所有更新。
直接将 Meilisearch AI 更新发送到您的收件箱 💌
* 表示必填项
电子邮件地址 *
营销许可
请选择您希望从 Meilisearch 获取信息的所有方式
电子邮件
您可以随时取消订阅。
我们使用Mailchimp发送电子邮件。
我们很高兴迈出语义搜索的第一步。我们迫不及待想听听您关于将 Meilisearch 集成作为向量存储的看法。您可以在此 GitHub 讨论中提供您的反馈。
您可以订阅我们的新闻通讯以保持联系。要了解 Meilisearch 的未来并帮助塑造它,请查看我们的路线图并参与我们的产品讨论。
如需其他帮助,请在Discord上加入我们的开发者社区。
我们期待在那里与您相见。