AI 驱动的混合搜索正在进行封闭测试。 加入等候名单 即可提前体验!

回到主页Meilisearch 的标志
返回文章
2022 年 10 月 3 日

v0.29 版本的新功能

本月版本为您带来期盼已久的新功能:匹配策略自定义。它还在索引速度、过滤器和密钥管理方面带来了很多改进。

Carolina Ferreira
Carolina FerreiraMeilisearch 开发者倡导者@CarolainFG
What’s new in v0.29

本文着眼于 Meilisearch 最新版本的一些主要变化。有关更多详细信息,请阅读 GitHub 上的完整变更日志

新功能:匹配策略

v0.29 引入了一个新的搜索参数:matchingStrategy。此参数允许您在搜索时定义 Meilisearch 应如何匹配查询词

  • last:首先返回包含所有查询词的文档。然后通过减少匹配中存在的查询词数量来检索其他结果:Meilisearch 将一次删除一个查询词,从查询末尾开始,并将任何新匹配项添加到结果列表中。自 v0.21 以来一直是这种行为,并且将保持默认策略。
  • all:仅返回包含所有查询词的文档。

示例

curl \
  -X POST '<https://127.0.0.1:7700/indexes/movies/search>' \
  -H 'Content-Type: application/json' \
  --data-binary '{ "q": "american ninja", "matchingStrategy": "all" }'

通过上述请求,Meilisearch 将仅返回包含“american”和“ninja”的文档。

我们希望这个新功能能够鼓励那些仍然使用 v0.20(默认使用 all 匹配策略的最后一个官方 Meilisearch 版本)的人员更新到我们的最新版本,并从那时起引入的新功能中获益:排序地理搜索细粒度的 API 密钥权限等等!如果您仍然使用 v0.20 并且认为暂时不会升级,我们很乐意知道是什么在阻止您。

您可以使用匹配策略演示来测试此功能,并在专门的博客文章中了解更多信息。

改进:索引性能

  • 我们加快了索引速度,特别是对于以下操作
  • 分面索引:我们修改了算法以提高可过滤属性的索引速度
  • 文档删除和更新
  • 我们引入了软删除。这是一种使用标志将数据标记为已删除的技术,使所有用户都无法访问该数据,而实际上不会将其从数据库中删除。文档会在稍后删除,然后再占用设备上的太多空间。因此,在磁盘上删除记录所花费的时间会推迟,并且不会延迟索引过程。

重新索引时,Meilisearch 现在会检测是否已存在完全相同的文档版本,如果是这种情况,则不会再次对其进行索引

行为变更:自动批处理

在 v0.26 中,我们引入了一个实验性功能:自动批处理。激活后,自动批处理会自动合并连续的文档添加请求,从而显着加快索引过程。

我们很高兴地宣布自动批处理现在是默认的索引行为,不再是实验性的了🥳

error: Found argument '--enable-auto-batching' which wasn't expected, or isn't valid in this context

	Did you mean '--disable-auto-batching'?

	If you tried to supply `--enable-auto-batching` as a value rather than a flag, use `-- --enable-auto-batching`

USAGE:
    meilisearch --disable-auto-batching

这意味着您不再需要使用 **--enable-auto-batching** CLI 标志来启用它。使用 --enable-auto-batching 现在将抛出以下错误

  • 以下自动批处理自定义选项也已被删除,如果使用也会抛出错误,因此请确保您的应用程序在升级到 v0.29 之前没有使用任何这些选项
  • --debounce-duration-sec
  • --max-batch-size

--max-documents-per-batch

如果您没有激活自动批处理功能,您无需执行任何操作,只需享受提高的索引速度即可 🏎️

🧐 您可能已经在上面的错误消息中注意到:如果由于某种原因您不希望 Meilisearch 自动批处理请求,则可以使用新的 CLI 标志来禁用此功能:--disable-auto-batching

我们正在不断努力改进我们的搜索引擎,您的反馈至关重要。如果您在文档索引速度方面遇到任何问题,如果您能在此讨论中告知我们,我们将不胜感激。

改进:过滤器

  • 我们添加了两个新的过滤器运算符:INEXISTS
  • IN 运算符选择指定字段包含至少一个给定值的所有文档

EXISTS 运算符检查字段是否存在。请注意,具有空值或 null 值的字段仍计为存在

[
  { "id": 1, "title": "Pride and Prejudice", "genres": ["romance"] },
  { "id": 2, "title": "Le Petit Prince", "genres": [] },
  { "id": 3, "title": "Alice In Wonderland" },
  { "id": 4, "title": "The Hobbit", "genres": ["adventure", "fantasy"] },
  { "id": 5, "title": "A Game of Thrones", "genres": ["fantasy"] },
]

给定以下图书数据集

表达式 genres IN [fantasy, adventure] 将返回文档 45

表达式 genres EXISTS 将返回文档 1245

这两个运算符都可以与 NOT (!=) 运算符组合使用。

行为变更:!= (NOT) 过滤器运算符

!= (NOT) 过滤器运算符返回不满足条件的文档。

{ "id": 1, "product": "T-shirt", "price": 20 }
{ "id": 2, "product": "T-shirt" }
{ "id": 3, "product": "T-shirt", "price": 30 }

考虑到以下文档

NOT price = 20 应返回价格属性不等于 20 的所有文档。

在 v0.29 中,!= (NOT) 过滤器匹配缺少指定属性的文档。在上面的示例中,这意味着 Meilisearch 返回文档 23

在 v0.29 之前,Meilisearch 不会包含缺少 price 属性的结果。在上面的示例中,v0.28 将仅返回文档 3

您可以使用新的 EXISTS 运算符将 != (NOT) 运算符结合使用,以确保过滤器仅返回包含指定属性的文档:price EXISTS AND price != 20 将仅返回文档 3

改进:密钥管理

{
      "name": "Default Admin API Key",
      "description": "Use it for anything that is not a search operation. Caution! Do not expose it on a public frontend",
      "key": "380689dd379232519a54d15935750cc7625620a2ea2fc06907cb40ba5b421b6f",
      "uid": "20f7e4c4-612c-4dd1-b783-7934cc038213",
      "actions": ["*"],
      "indexes": ["*"],
      "expiresAt": null,
      "createdAt": "2021-08-11T10:00:00Z",
      "updatedAt": "2021-08-11T10:00:00Z"
 }

在管理 密钥 时,在 actions 数组中使用 * 通配符字符可以访问所有端点

现在,感谢我们的贡献者,它也可以用作通配符来表达单个特定路由的所有端点 🙌

您无需列出每个端点,可以将 * 字符附加到所需的路由。例如,documents.* 授权访问所有与文档相关的端点。

改进:泰语支持

我们亲爱的贡献者 @aFluffyHotdog 引入了对泰语的优化支持 🥳

我们一直在寻找使 Meilisearch 的语言支持更好的方法。我们从母语人士那里获得的反馈越多,我们就越容易理解如何提高这些语言的性能和搜索相关性。

想帮助我们支持您的语言吗? 贡献!如果您需要指导或帮助,请随时联系我们;我们期待与您合作!

Meilisearch 今天能取得如此成就,离不开我们社区的支持。你们真的非常棒,我们对你们为 Meilisearch 付出的所有努力、建议、评论和时间表示衷心的感谢。这个月,我们要特别感谢 @evpeople@Mcdostone@pavo-tusker@phdavis1027@ryanrussell@VasiliySoldatkinMeilisearch 的帮助;感谢 @GraDKhMilli 的帮助;以及感谢 @aFluffyHotdog@matthias-wright@mosuka 对我们的分词器 Charabia 的帮助。

就这样啦,各位!记得查看更新日志获取完整的发行说明,我们下次再见!

Meilisearch 1.12

Meilisearch 1.12

Meilisearch 1.12 带来了显著的索引速度提升,并引入了新的 API 来禁用前缀搜索和分面搜索,以及检索任务批次。

Laurent Cazanove
Laurent Cazanove2024年12月23日
Meilisearch Q4 2024 release wrap-up

Meilisearch 2024 年第四季度发布总结

Meilisearch 第四季度发布包括更快的搜索速度、对 UI 中设置的更多控制以及一个新区域。

Maya Shin
Maya Shin2024年11月27日
Meilisearch 1.11

Meilisearch 1.11

Meilisearch 1.11 通过关键改进(包括二进制量化)推动 AI 驱动的搜索走向稳定。此版本还根据用户反馈增强了联邦搜索功能。

Carolina Ferreira
Carolina Ferreira2024年10月29日