常见问题解答
我以前从未使用过搜索引擎。我仍然可以使用 Meilisearch 吗?
当然!使用 Meilisearch 不需要 ElasticSearch 或 Solr 的知识。
Meilisearch 真的易于使用,因此各种开发人员都可以访问。
快速浏览以了解 Meilisearch 的基础知识!
我们还提供了许多工具,包括 SDK,以帮助您轻松地将 Meilisearch 集成到您的项目中。我们每天都在添加新工具!
此外,如果您需要任何帮助,可以联系我们。
如何知道 Meilisearch 是否完全适合我的用例?
由于 Meilisearch 是一个开源且易于使用的工具,您可以尝试使用您的数据。按照本指南以快速入门!
此外,我们发布了Meilisearch 和其他搜索引擎之间的比较,旨在提供 Meilisearch 替代方案的概述。
我正在尝试添加我的文档,但我一直收到 400 - Bad Request
响应
400 - Bad request
响应通常表示您的数据格式不正确。您可能有无关的逗号、不匹配的括号、缺少引号等。Meilisearch API 接受 JSON、CSV 和 NDJSON 格式。
当添加或替换文档时,即使只有一个新文档,也必须将它们放在数组中。
我已上传我的文档,但在我的索引中搜索时没有结果
您的文档上传可能失败。要了解原因,请使用返回的 taskUid
检查文档添加任务的状态。如果任务失败,响应应包含一个 error
对象。
这是一个失败任务的示例
{
"uid": 1,
"indexUid": "movies",
"status": "failed",
"type": "documentAdditionOrUpdate",
"canceledBy": null,
"details": {
"receivedDocuments": 67493,
"indexedDocuments": 0
},
"error": {
"message": "Document does not have a `:primaryKey` attribute: `:documentRepresentation`.",
"code": "internal",
"type": "missing_document_id",
"link": "https://docs.meilisearch.com/errors#missing-document-id",
},
"duration": "PT1S",
"enqueuedAt": "2021-08-10T14:29:17.000000Z",
"startedAt": "2021-08-10T14:29:18.000000Z",
"finishedAt": "2021-08-10T14:29:19.000000Z"
}
检查您的错误消息以获取更多信息。
杀死 Meilisearch 进程安全吗?
杀死 Meilisearch 是安全的,即使在进程中间(例如:添加一批文档)。当您重启服务器时,它将从头开始任务。更多信息请参见异步操作指南。
你们是否为 Meilisearch 及其集成工具提供公共路线图?
是的,由于 Meilisearch 及其集成工具是开源的,我们维护了一个公共路线图,用于我们计划进行的一般功能。
有关更准确的功能和问题,所有内容都在我们所有GitHub 仓库的问题中详细说明。
托管 Meilisearch 实例的推荐要求是什么?
简短的回答
托管 Meilisearch 实例的推荐要求将取决于许多因素,例如文档数量、文档大小、您需要的过滤器/排序数量等等。为了快速估算开始,请尝试使用磁盘空间至少是您数据集十倍的机器。
详细的回答
索引文档是一个复杂的过程,因此很难准确估计 Meilisearch 数据库的大小和内存使用量。在优化实例时,需要记住几个方面。
内存使用
有两件事会导致您的内存使用量 (RAM) 飙升
- 添加文档
- 更新索引设置(如果索引包含文档)
为了减少内存使用和索引时间,请遵循此最佳实践:始终在添加文档之前更新索引设置。这避免了不必要的双重索引。
磁盘使用
以下因素对数据库的大小有很大影响(无特定顺序)
- 文档数量
- 文档大小
- 可搜索字段的数量
- 可筛选字段的数量
- 每次更新的大小
- 数据集中存在的不同单词的数量
提示
注意多语言数据集和包含许多独特单词(如 ID 或 URL)的数据集,因为它们可能会降低搜索速度并大大增加数据库大小。如果您有 ID 或 URL 字段,使它们不可搜索,除非它们可用作搜索条件。
搜索速度
由于 Meilisearch 使用内存映射,搜索速度基于 RAM 和数据库大小之间的比率。换句话说:
- 大数据库 + 少量 RAM => 搜索缓慢
- 小数据库 + 大量 RAM => 闪电般快速的搜索
Meilisearch 还使用磁盘空间作为虚拟内存。此磁盘空间不对应于数据库大小;相反,它通过允许引擎超出物理 RAM 的限制,为引擎提供速度和灵活性。
目前,CPU 核心的数量对索引或搜索速度没有直接影响。但是,您为引擎提供的核心越多,引擎能够同时处理的搜索查询就越多。
加速 Meilisearch
Meilisearch 旨在快速(≤50 毫秒响应时间),因此很少需要加速。但是,如果您发现您的 Meilisearch 实例查询速度缓慢,则有两种主要方法可以提高搜索性能
- 增加 RAM(或虚拟内存)的量
- 减小数据库的大小
总的来说,我们建议前者。但是,如果您出于任何原因需要减小数据库的大小,请记住
- 相关性规则越多 => 数据库越大
- 仅邻近度排名规则就可能导致近 80% 的数据库大小
- 将许多属性添加到
filterableAttributes
也会消耗大量磁盘空间 - 多语言数据集成本高昂,因此请拆分您的数据集——每个索引一种语言
- 停用词对于减小数据库大小至关重要
- 并非所有属性都需要是可搜索的。避免索引唯一 ID。
为什么 Meilisearch 向 Segment 发送数据?Meilisearch 是否跟踪其用户?
Meilisearch 永远不会跟踪或识别个人用户。话虽如此,我们确实使用 Segment 来收集关于用户趋势、功能使用情况和错误的匿名数据。
您可以在我们的遥测页面上阅读更多关于我们收集哪些指标、为什么收集它们以及如何禁用它们的信息。透明度和隐私问题对我们非常重要,因此如果您觉得我们在这一领域有所欠缺,请提出问题或发送电子邮件至我们的专用电子邮件地址:privacy@meilisearch.com。