Meilisearch 1.10
Meilisearch 1.10 引入了联合搜索和语言环境设置,并为 AI 驱动的搜索稳定化铺平了道路。
今天,我们宣布推出 Meilisearch v1.10。在本文中,我们将回顾最具影响力的变化。有关详尽的列表,请查看 GitHub 上的更新日志。
Meilisearch 1.10 也可在 Meilisearch Cloud 上使用 — 立即升级!
新增:联合搜索
我们很高兴地宣布 [联合搜索](/blog/what-is-federated-search/?utm_campaign=release-v1-10&utm_source=blog) 最终将加入 Meilisearch。此功能扩展了 多搜索 API,允许您将多个查询的结果合并为单个统一的响应。您现在可以搜索不同的索引,并获得整个数据集中最相关的结果,而不仅仅是每个索引中最相关的结果。
对于需要在各种类型的资源中搜索的 SaaS 平台或具有不同产品类别的电子商务网站,联合搜索是一个游戏规则的改变者。
以下是针对 movies
和 comics
索引发出 联合搜索请求 的示例有效负载
{ "federation": { "offset": 5, "limit": 10 }, "queries": [ { "q": "Batman", "indexUid": "movies" }, { "q": "Batman", "indexUid": "comics" } ] }
在此示例中,联合搜索响应 将如下所示
{ "hits": [ { "id": 42, "title": "Batman returns", "overview": "..", "_federation": { "indexUid": "movies", "queriesPosition": 0 } }, { "comicsId": "batman-killing-joke", "description": "..", "title": "Batman: the killing joke", "_federation": { "indexUid": "comics", "queriesPosition": 1 } }, ], "processingTimeMs": 0, "limit": 2, "offset": 0, "estimatedTotalHits": 2, "semanticHitCount": 0 }
查询权重
联合搜索不仅仅是合并结果;更是使这些结果更有意义和相关。借助 查询权重,您可以优先处理某些查询,确保最重要的数据显示在顶部。
下面的示例有效负载在联合搜索中使用查询权重,以更重视 boosted
字段为 true
的文档
{ "federation": {}, "queries": [ { "q": "iphone case", "indexUid": "products", "filter": "BOOSTED = true", "federationOptions": { "weight": 3.0 } }, { "q": "iphone case", "indexUid": "products" // federationOptions.weight defaults to 1 } ] }
了解有关 联合搜索及其用例 的更多信息
新增:查询和文档的语言设置
默认情况下,Meilisearch 会自动检测文档和查询中使用的语言。这对于边缘情况有一些限制。Meilisearch 1.10 引入了新的语言设置,允许用户手动自定义其语言首选项。
有两种方法可以声明搜索中使用的语言
- 设置查询中使用的语言
- 设置文档字段中使用的语言
设置搜索查询语言环境
您可以在 搜索参数 中定义查询中使用的语言。
使用查询 locales
进行搜索的示例有效负载
{ "q": "進撃の巨人", "locales": ["jpn"] }
设置文档属性的语言环境
您可以通过 索引设置 定义数据集中使用的语言。
使用 localizedAttributes
进行设置的示例有效负载
{ "localizedAttributes": [ { "locales": ["jpn"], "attributePatterns": ["*_japanese"] } ] }
Meilisearch 支持所有 ISO-639-2B 语言环境。
自托管:现在需要 Ubuntu v20
如果您是自托管 Meilisearch,请注意:Meilisearch 1.10 现在需要 Ubuntu 版本 20。此更新确保与最新功能的兼容性,并保持最佳的性能和安全性。我们建议阅读有关 如何升级 Ubuntu 版本 的文档。
此更改不影响 Meilisearch Cloud 用户。
实验性:AI 驱动的搜索 DX 改进
新增:REST API 嵌入器的自定义标头
Meilisearch 1.10 支持将自定义标头发送到您的基于 API 的嵌入服务。当使用 rest
作为您的 嵌入器设置 的来源时,Meilisearch 现在接受可选的 headers
对象。这些标头将被添加到向嵌入器 API 发出的所有请求中。
嵌入器设置的示例有效负载
{ "source": "rest", "apiKey": "•••••••••••••••••", "headers": { "Custom-Header": "value" } }
新增:生活质量改进
此外,我们还添加了一些小的更改,以简化使用 Meilisearch AI 驱动的搜索 API 的操作
- 嵌入器设置现在接受用于 OpenAI 嵌入器的
url
参数,以通过代理访问 OpenAI - 嵌入器设置现在接受用于 ollama 嵌入器的
dimensions
参数 - Meilisearch 现在在没有向量的文档的响应中包含
_vectors
(仅当启用retrieveVectors
时)
⚠️ 破坏性更改:基于 REST API 的嵌入器的破坏性更改
基于 REST API 配置嵌入器(例如,OpenAI、Mistral 等)的 API 发展迅速,为了避免混淆,我们决定在专用的 request
和 response
字段中重新组织参数。
在实践中,此更改
- 删除
query
、inputField
、inputType
、pathToEmbeddings
和embeddingObject
字段 - 添加
request
和response
字段
查看以下示例,了解如何迁移到新语法。
之前 — 使用 Meilisearch 1.9
{ "source": "rest", "url": "https://127.0.0.1:10006", "query": { "model": "minillm", }, "inputField": ["prompt"], "inputType": "text", "embeddingObject": ["embedding"] }
之后 — 从 Meilisearch 1.10 开始
{ "source": "rest", "url": "https://127.0.0.1:10006", "request": { "model": "minillm", "prompt": "{{text}}" }, "response": { "embedding": "{{embedding}}" } }
升级步骤
仅当您使用基于 REST API 的嵌入器时,此步骤才是必要的。要升级到 Meilisearch 1.10,请按照以下步骤操作
- 删除源为
"rest"
的嵌入器 - 像往常一样更新您的 Meilisearch Cloud 项目 或 自托管 Meilisearch 实例
实验性:CONTAINS
筛选器运算符
Meilisearch 1.10 引入了 CONTAINS
运算符。由于我们正在努力解决一些性能问题,因此它仍处于实验阶段。这个新的 筛选器运算符 允许检查子字符串是否包含在较大的字符串中。
给定文档 { id: 1, name: "Keffir" }
,您可以按如下方式使用筛选器
name CONTAINS kef
— 搜索将匹配该文档name CONTAINS clifford
— 搜索将不匹配该文档
请记住,所有筛选器都使用小写、规范化的字符串(所有重音都已删除)。
通过此 Github 讨论 分享您的反馈。
实验性:使用函数更新文档
Meilisearch 1.10 允许您通过执行 Rhai 函数 来编辑文档。这允许您仅使用筛选器更新数据集的一部分。此外,使用函数允许您根据文档的数据实现动态逻辑。
以下有效负载更新 id
大于 3000 的所有文档的标题
{ "filter": "id > 3000", "function": "doc.title = `✨ ${doc.title.to_upper()} ✨`" }
这还支持更复杂的使用场景,例如实现衰减排名策略。根据您的需求,您可能会实现一个如下的函数,该函数将由 Cron 作业定期运行。
{ "context": { "now": 1715423249 }, "function": " // `posted_at` and `now` are Unix Epoch timestamps in seconds // they must be converted to hours. let age_hours = (context.now - doc.posted_at) / 60 / 60; doc.ranking_score = doc.upvotes ** 0.8 / (age_hours + 2) ** 1.8; " }
通过此Github 讨论分享您的反馈。
这就是 v1.10 的全部内容!这些发行说明仅重点介绍了最重要的更新。有关详尽的列表,请阅读 Github 上的更新日志。
使用 Meilisearch Cloud 轻松升级。
感谢贡献者
如果没有 Meilisearch 和 Charabia 的贡献者 @Karribalu、 @hanbings、 @junhochoi、 @JWSong、 @PeterDaveHello、 @LukasKalbertodt 和 @phillitrOSU,此次发布是不可能实现的。
我们还要特别感谢我们的 SDK 维护者,他们努力使 Meilisearch 可用于许多语言和框架。我们很高兴 @Sherlouk 和 @Ja7ad 加入我们的开源维护者行列。 💪
订阅我们的每月新闻通讯,随时了解 Meilisearch 的一切动态。要了解有关 Meilisearch 未来并帮助塑造其发展方向的更多信息,请查看我们的路线图并参与我们的产品讨论。
如有其他任何问题,请加入我们在 Discord 上的开发者社区。