Meilisearch 官方支持许多不同的嵌入器,例如 OpenAI、Hugging Face 和 Ollama,以及大多数具有 RESTful API 的嵌入生成器。

本文包含关于如何为您的项目选择最合适的嵌入器的一般指南。

如果不确定,请选择 OpenAI

OpenAI 在不同主题和数据集中返回相关的搜索结果。它适用于大多数应用程序,并且 Meilisearch 在每个新版本中都积极支持和改进 OpenAI 功能。

在大多数情况下,特别是如果您是第一次使用 LLM 和 AI 搜索,请选择 OpenAI。

如果您已在使用特定的 AI 服务,请选择 REST 嵌入器

如果您已在使用兼容嵌入器中的特定模型,请选择 Meilisearch 的 REST 嵌入器。这可确保您在现有工具和工作流程的基础上继续构建,且只需最少的配置。

如果处理非文本内容,请选择用户提供的嵌入器

Meilisearch 不支持搜索图像、音频或任何未以文本形式呈现的内容。此限制适用于查询和文档。例如,Meilisearch 的内置嵌入器源无法使用图像而不是文本进行搜索。它们也无法在没有附加文本元数据的情况下使用文本搜索图像。

在这些情况下,您将需要提供自己的嵌入。

仅在自托管小型静态数据集时选择 Hugging Face

尽管它返回非常相关的搜索结果,但 Hugging Face 嵌入器必须直接在您的服务器中运行。当您在 DigitalOcean 或 AWS 等服务中托管 Meilisearch 时,这可能会导致性能下降和额外成本。

也就是说,对于不常更新且文档数量少于 1 万的数据集,Hugging Face 是一个不错的嵌入器。

Meilisearch Cloud 不支持源为 `{"source": "huggingFace"}` 的嵌入器。

要在 Cloud 中实现 Hugging Face 嵌入器,请使用使用 REST 嵌入器实现 HuggingFace 推理点