v0.21 版本的新功能
了解 MeiliSearch v0.21 版本中的一些重大变化

今天标志着 Meilisearch v0.21 的发布,这是自 2021 年 3 月以来的首次新版本发布。正如您可能预期的那样,此版本为我们的搜索引擎带来了许多重大和细小的更改。您可以查看我们的详尽的变更日志,其中概述了所有重大更改并在此处下载二进制文件,但在本文中,我们想仔细研究一些最重要的更新。
搜索性能
首先,我们想给您带来一个最好的消息:v0.21 是迄今为止最快的 Meilisearch 版本。有多快?我们使用包含 1.15 亿个文档的 1GB 数据集进行的测试表明,复杂查询的返回结果速度比 v0.20 快十倍;过滤这些结果(以前是一个缓慢的操作)最多需要 50 毫秒。
重构
Clémentine 已经写过一篇关于我们为什么选择重构核心引擎基本部分的文章,但如果您错过了它:我们越来越难以保持我们的代码易于外部贡献者阅读,并在不 негативно 影响性能的情况下添加新功能。
我们为这些月来的成就感到非常自豪,不仅因为我们成功地大大提高了 Meilisearch 的性能,还因为我们知道我们的搜索引擎拥有了一个新的、坚如磐石的基础。
分面和过滤器
v0.21 中一些最大的可见(和重大)更改涉及分面和过滤器。
首先,搜索参数 filters
和 facetFilters
已被 filter
取代。这个新参数允许您根据文档属性的值(数字或字符串)来优化搜索结果。
$ curl 'http://localhost:7700/indexes/movies/search' --data '{ "q": "thriller", "filter": ["genres = Horror", "genres = Mystery"]}'
在这个例子中,我们创建了一个过滤器,只返回被分类为恐怖片和悬疑片的电影。
要将属性与 filter
搜索参数一起使用,您必须首先将其添加到新的 filterableAttributes
索引设置。filterableAttributes
的工作方式与 attributesForFaceting
索引设置完全相同,并取代了它。
$ curl -X POST 'http://localhost:7700/indexes/movies/settings' --data '{ "filterableAttributes": [ "director", "genres" ] }'
Meilisearch 不再区分分面和过滤器:您可以使用新的 filter
搜索参数和 filterableAttributes
索引设置来创建 分面搜索界面。
短语搜索
Meilisearch v0.21 支持短语搜索。如果您将一个或多个搜索词用双引号括起来(例如,“african-american poet”
或 “John Waters”
),Meilisearch 将只返回包含这些词语且顺序与书写顺序完全一致的文档。短语搜索是使查询更精确的好方法,当您知道搜索应该只得到一个结果时(例如,使用 ISBN 编号查找书籍时),它会派上用场。
$ curl 'http://localhost:7700/indexes/movies/search' --data '{ "q": ""John" Waters" }'
Web 界面
如果您不知道,当您在开发模式下启动实例时,Meilisearch 会自动创建一个 Web 界面,以便您可以立即测试我们的搜索引擎。我们更新了这个界面,使其更易于使用(并且外观更漂亮!)!
新的遥测页面和更简单的分析设置
默认情况下,Meilisearch 从所有使用我们搜索引擎的实例中收集匿名数据。我们使禁用此行为和添加了一个新页面到我们的文档中,准确解释了我们收集哪些数据以及我们如何使用它变得更加容易。隐私对我们来说是一个重要的问题,因此请随时分享您可能有的任何意见、疑虑或建议。
$ ./meilisearch --no-analytics=true
突出显示数组和对象字段中的匹配项
Meilisearch v0.20 允许您突出显示字符串字段中匹配的搜索词,以便用户可以看到在文档中的哪个位置找到了该词。在 v0.21 中,我们将此功能扩展到适用于字符串数组和嵌套对象。与以前一样,您可以在每个返回文档的 _formatted
对象中找到突出显示的匹配项。
$ curl 'http://localhost:7700/indexes/movies/search' --data '{ "q": "adventure", "attributesToHighlight": ["title", "genres"] }'
{ "id": "50393", "title": "The Adventures of Huck Finn", "overview": "Climb aboard for an extraordinary version of Mark Twain's sweeping adventure when Walt Disney presents The Adventures of Huck Finn, starring Elijah Wood.", "release_date": 733712400, "genres": ["Adventure","Family"] "_formatted": { "id": "50393", "title": "The <em>Adventures</em> of Huck Finn", "overview": "Climb aboard for an extraordinary version of Mark Twain's sweeping adventure when Walt Disney presents The Adventures of Huck Finn, starring Elijah Wood.", "release_date": 733712400, "genres": ["<em>Adventure</em>","Family"] } }
标题和类型突出显示的匹配项在 _formatted
中可用。
其他更改
- 您可能会注意到索引器性能的细微提升:这是一项正在进行的工作,我们渴望收到您对此的反馈
wordsPosition
排名规则已合并到attribute
中max-mdb-size
已重命名为[max-index-size](https://docs.meilisearch.com/reference/features/configuration.html#max-index-size)
- 现在可以使用人类可读的单位(例如
Kb
或Gb
)来指定[max-index-size](https://docs.meilisearch.com/reference/features/configuration.html#max-index-size)
和[http-payload-limit-size](https://docs.meilisearch.com/reference/features/configuration.html#payload-limit-size)
- 我们已取消每个实例 200 个索引的限制
Bug 修复
- Windows 实例在启动时不再立即占用最大索引大小
- 排名规则
Words
现在可以按预期工作 - Dumps 现在可以正确导出所有文档字段,无论它们是否出现在
displayedAttributes
中
贡献者
这一切很大程度上归功于我们的社区:我们真诚地感谢您的慷慨。Meilisearch 因为有您而变得更好。
我们要特别感谢 @sanders41 和 @bb:您的错误报告和反馈非常有帮助!
最后,非常感谢 @shekhirin 在新的搜索引擎实现方面提供的所有帮助。
这就是本次发布的所有内容!要全面了解所有更改(包括重大更改和其他更改),您可以查看我们的变更日志。