v0.29 版本的新功能
本月发布的版本为您带来期待已久的新功能:匹配策略自定义。它还带来了许多关于索引速度、过滤器和密钥管理的改进。

本文着眼于 Meilisearch 最新版本中的一些主要更改。有关更多详细信息,请阅读 GitHub 上的完整更新日志。
新功能:匹配策略
v0.29 引入了一个新的搜索参数:matchingStrategy
。此参数允许您在搜索时定义 Meilisearch 应如何匹配查询词
last
:首先返回包含所有查询词的文档。然后,通过减少匹配中存在的查询词的数量来检索其他结果:Meilisearch 将一次删除一个查询词,从查询的末尾开始,并将任何新的匹配项添加到结果列表中。自 v0.21 以来,这一直是默认策略,并将保持不变。all
:仅返回包含所有查询词的文档。
示例
curl \ -X POST '<http://localhost:7700/indexes/movies/search>' \ -H 'Content-Type: application/json' \ --data-binary '{ "q": "american ninja", "matchingStrategy": "all" }'
通过上述请求,Meilisearch 将仅返回包含 "american" 和 "ninja" 的文档。
我们希望这个新功能能够鼓励那些仍在使用 v0.20(默认情况下使用 all
匹配策略的最后一个官方 Meilisearch 版本)的用户更新到我们的最新版本,并从那时以来引入的新功能中受益:排序、地理搜索、细粒度的 API 密钥权限等等!如果您仍在使用 v0.20,并且不认为您会立即升级,我们很乐意了解是什么阻碍了您。
您可以使用匹配策略演示来测试此功能,并在专门的博客文章中了解更多信息。改进:索引性能
我们加快了索引速度,特别是对于以下操作
- Facet 索引:我们修改了算法以提高可筛选属性的索引速度
- 文档删除和更新
- 我们引入了软删除。这是一种技术,其中使用标志将数据标记为已删除,使其对所有用户不可访问,而实际上并未从数据库中删除它。文档会在稍后日期删除,在它们占用设备上过多空间之前。因此,延迟了在磁盘上删除记录的时间,并且不会延迟索引过程。
- 重新索引时,Meilisearch 现在会检测是否已存在完全相同版本的文档,如果是,则不会再次索引它
行为变更:自动批处理
在 v0.26 中,我们引入了一个实验性功能:自动批处理。激活后,自动批处理会自动组合连续的文档添加请求,从而显着加快索引过程。
我们很高兴地宣布自动批处理现在是默认的索引行为,不再是实验性的 🥳
这意味着您不再需要使用 **--enable-auto-batching**
CLI 标志来启用它。使用 --enable-auto-batching
现在将抛出以下错误
error: Found argument '--enable-auto-batching' which wasn't expected, or isn't valid in this context Did you mean '--disable-auto-batching'? If you tried to supply `--enable-auto-batching` as a value rather than a flag, use `-- --enable-auto-batching` USAGE: meilisearch --disable-auto-batching
以下自动批处理自定义选项也已被删除,如果使用,将抛出错误,因此在升级到 v0.29 之前,请确保您的应用程序未使用其中任何一个
--debounce-duration-sec
--max-batch-size
--max-documents-per-batch
如果您尚未激活自动批处理功能,则无需执行任何操作,只需享受索引速度的提高 🏎️
🧐 您可能已经在上面的错误消息中注意到:如果出于某种原因您不希望 Meilisearch 自动批处理请求,则可以使用新的 CLI 标志来停用此功能:--disable-auto-batching
。
我们一直在努力改进我们的搜索引擎,您的反馈至关重要。如果您在文档索引速度方面遇到任何问题,如果您能在这个讨论中告知我们,我们将不胜感激。
改进:过滤器
我们添加了两个新的过滤器运算符:IN
和 EXISTS
IN
运算符选择指定字段包含至少一个给定值的所有文档EXISTS
运算符检查字段是否存在。请注意,具有空值或 null 值的字段仍算作存在
给定以下图书数据集
[ { "id": 1, "title": "Pride and Prejudice", "genres": ["romance"] }, { "id": 2, "title": "Le Petit Prince", "genres": [] }, { "id": 3, "title": "Alice In Wonderland" }, { "id": 4, "title": "The Hobbit", "genres": ["adventure", "fantasy"] }, { "id": 5, "title": "A Game of Thrones", "genres": ["fantasy"] }, ]
表达式 genres IN [fantasy, adventure]
将返回文档 4
和 5
。
表达式 genres EXISTS
将返回文档 1
、 2
、 4
和 5
。
这两个运算符都可以与 NOT
(!=
) 运算符结合使用。
行为变更:!=
(NOT
) 过滤器运算符
!=
(NOT
) 过滤器运算符返回不满足条件的文档。
考虑以下文档
{ "id": 1, "product": "T-shirt", "price": 20 } { "id": 2, "product": "T-shirt" } { "id": 3, "product": "T-shirt", "price": 30 }
NOT price = 20
应返回价格属性不等于 20 的所有文档。
在 v0.29 中,!=
(NOT
) 过滤器匹配缺少指定属性的文档。在上面的示例中,这意味着 Meilisearch 返回文档 2
和 3
。
在 v0.29 之前,Meilisearch 不包括缺少 price
属性的结果。在上面的示例中,v0.28 将仅返回文档 3
。
您可以通过将 !=
(NOT
) 运算符与新的 EXISTS
运算符结合使用来确保过滤器仅返回包含指定属性的文档:price EXISTS AND price != 20
将仅返回文档 3
。
改进:密钥管理
在管理密钥时,在 actions
数组中使用 *
通配符字符可以访问所有端点
{ "name": "Default Admin API Key", "description": "Use it for anything that is not a search operation. Caution! Do not expose it on a public frontend", "key": "380689dd379232519a54d15935750cc7625620a2ea2fc06907cb40ba5b421b6f", "uid": "20f7e4c4-612c-4dd1-b783-7934cc038213", "actions": ["*"], "indexes": ["*"], "expiresAt": null, "createdAt": "2021-08-11T10:00:00Z", "updatedAt": "2021-08-11T10:00:00Z" }
现在,感谢我们的贡献者,它也可以用作通配符来表示单个特定路由的所有端点 🙌
您无需列出每个端点,只需将 *
字符附加到所需的路由即可。例如,documents.*
授权访问所有与文档相关的端点。
改进:泰语支持
我们亲爱的贡献者 @aFluffyHotdog 引入了对泰语的优化支持 🥳
我们一直在寻找方法来使 Meilisearch 的语言支持变得更好。我们从母语人士那里获得的反馈越多,我们就越容易了解如何提高这些语言的性能和搜索相关性。
想要帮助我们支持您的语言吗?贡献!如果您需要指导或帮助,请随时联系我们;我们期待与您合作!
贡献者
如果没有我们社区的支持,Meilisearch 就不会像今天这样存在。你们真的非常棒,我们对你们为 Meilisearch 付出的所有努力、建议、评论和时间表示衷心的感谢。本月,我们要特别感谢 @evpeople、@Mcdostone、@pavo-tusker、@phdavis1027、@ryanrussell 和 @VasiliySoldatkin 对 Meilisearch 的帮助,感谢 @GraDKh 对 Milli 的帮助,以及感谢 @aFluffyHotdog、@matthias-wright 和 @mosuka 对我们的分词器 Charabia 的帮助。
各位,这就是全部内容!请记住查看更新日志以获取完整的发行说明,我们下次再见!