AI 驱动的混合搜索正在封闭测试中。 加入等候名单 以获得早期访问权限!

返回首页Meilisearch 的标志
返回文章
2024 年 8 月 27 日

Meilisearch 1.10

Meilisearch 1.10 引入了联合搜索和语言环境设置,并为 AI 驱动的搜索稳定化铺平了道路。

Laurent Cazanove
Laurent CazanoveDX 工程师 & 文案@StriftCodes
Meilisearch 1.10

今天,我们宣布推出 Meilisearch v1.10。在本文中,我们将回顾最具影响力的变化。有关详尽的列表,请查看 GitHub 上的更新日志

Meilisearch 1.10 也可在 Meilisearch Cloud 上使用 — 立即升级!

新增:联合搜索

我们很高兴地宣布 [联合搜索](/blog/what-is-federated-search/?utm_campaign=release-v1-10&utm_source=blog) 最终将加入 Meilisearch。此功能扩展了 多搜索 API,允许您将多个查询的结果合并为单个统一的响应。您现在可以搜索不同的索引,并获得整个数据集中最相关的结果,而不仅仅是每个索引中最相关的结果。

对于需要在各种类型的资源中搜索的 SaaS 平台或具有不同产品类别的电子商务网站,联合搜索是一个游戏规则的改变者。

以下是针对 moviescomics 索引发出 联合搜索请求 的示例有效负载

{
  "federation": {
    "offset": 5,
    "limit": 10
  },
  "queries": [
    {
      "q": "Batman",
      "indexUid": "movies"
    },
    {
      "q": "Batman",
      "indexUid": "comics"
    }
  ]
}

在此示例中,联合搜索响应 将如下所示

{
  "hits": [
    {
      "id": 42,
      "title": "Batman returns",
      "overview": "..",
      "_federation": {
        "indexUid": "movies",
        "queriesPosition": 0
      }
    },
    {
      "comicsId": "batman-killing-joke",
      "description": "..",
      "title": "Batman: the killing joke",
      "_federation": {
        "indexUid": "comics",
        "queriesPosition": 1
      }
    },
 ],
  "processingTimeMs": 0,
  "limit": 2,
  "offset": 0,
  "estimatedTotalHits": 2,
  "semanticHitCount": 0
}

查询权重

联合搜索不仅仅是合并结果;更是使这些结果更有意义和相关。借助 查询权重,您可以优先处理某些查询,确保最重要的数据显示在顶部。

下面的示例有效负载在联合搜索中使用查询权重,以更重视 boosted 字段为 true 的文档

{
  "federation": {},
  "queries": [
    {
      "q": "iphone case",
      "indexUid": "products",
      "filter": "BOOSTED = true",
      "federationOptions": {
        "weight": 3.0
      }
    },
    {
      "q": "iphone case",
      "indexUid": "products"
      // federationOptions.weight defaults to 1
    }
  ]
}

了解有关 联合搜索及其用例 的更多信息

新增:查询和文档的语言设置

默认情况下,Meilisearch 会自动检测文档和查询中使用的语言。这对于边缘情况有一些限制。Meilisearch 1.10 引入了新的语言设置,允许用户手动自定义其语言首选项。

有两种方法可以声明搜索中使用的语言

  • 设置查询中使用的语言
  • 设置文档字段中使用的语言

设置搜索查询语言环境

您可以在 搜索参数 中定义查询中使用的语言。

使用查询 locales 进行搜索的示例有效负载

{
   "q": "進撃の巨人",
   "locales": ["jpn"]
}

设置文档属性的语言环境

您可以通过 索引设置 定义数据集中使用的语言。

使用 localizedAttributes 进行设置的示例有效负载

{
  "localizedAttributes": [
    {
      "locales": ["jpn"], 
      "attributePatterns": ["*_japanese"]
    }
  ]
}

Meilisearch 支持所有 ISO-639-2B 语言环境。

自托管:现在需要 Ubuntu v20

如果您是自托管 Meilisearch,请注意:Meilisearch 1.10 现在需要 Ubuntu 版本 20。此更新确保与最新功能的兼容性,并保持最佳的性能和安全性。我们建议阅读有关 如何升级 Ubuntu 版本 的文档。

此更改不影响 Meilisearch Cloud 用户。

实验性:AI 驱动的搜索 DX 改进

新增:REST API 嵌入器的自定义标头

Meilisearch 1.10 支持将自定义标头发送到您的基于 API 的嵌入服务。当使用 rest 作为您的 嵌入器设置 的来源时,Meilisearch 现在接受可选的 headers 对象。这些标头将被添加到向嵌入器 API 发出的所有请求中。

嵌入器设置的示例有效负载

{
  "source": "rest",
  "apiKey": "•••••••••••••••••",
  "headers": {
    "Custom-Header": "value"
  }
}

新增:生活质量改进

此外,我们还添加了一些小的更改,以简化使用 Meilisearch AI 驱动的搜索 API 的操作

  • 嵌入器设置现在接受用于 OpenAI 嵌入器的 url 参数,以通过代理访问 OpenAI
  • 嵌入器设置现在接受用于 ollama 嵌入器的 dimensions 参数
  • Meilisearch 现在在没有向量的文档的响应中包含 _vectors(仅当启用 retrieveVectors 时)

⚠️ 破坏性更改:基于 REST API 的嵌入器的破坏性更改

基于 REST API 配置嵌入器(例如,OpenAI、Mistral 等)的 API 发展迅速,为了避免混淆,我们决定在专用的 requestresponse 字段中重新组织参数。

在实践中,此更改

  • 删除 queryinputFieldinputTypepathToEmbeddingsembeddingObject 字段
  • 添加 requestresponse 字段

查看以下示例,了解如何迁移到新语法。

之前 — 使用 Meilisearch 1.9

{
   "source": "rest",
   "url": "https://127.0.0.1:10006",
   "query": {
     "model": "minillm",
   },
   "inputField": ["prompt"],
   "inputType": "text",
   "embeddingObject": ["embedding"]
}

之后 — 从 Meilisearch 1.10 开始

{
   "source": "rest",
   "url": "https://127.0.0.1:10006",
   "request": {
     "model": "minillm",
     "prompt": "{{text}}"
   },
   "response": {
     "embedding": "{{embedding}}"
   }
}

升级步骤

仅当您使用基于 REST API 的嵌入器时,此步骤才是必要的。要升级到 Meilisearch 1.10,请按照以下步骤操作

  1. 删除源为 "rest" 的嵌入器
  2. 像往常一样更新您的 Meilisearch Cloud 项目自托管 Meilisearch 实例

实验性:CONTAINS 筛选器运算符

Meilisearch 1.10 引入了 CONTAINS 运算符。由于我们正在努力解决一些性能问题,因此它仍处于实验阶段。这个新的 筛选器运算符 允许检查子字符串是否包含在较大的字符串中。

给定文档 { id: 1, name: "Keffir" },您可以按如下方式使用筛选器

  • name CONTAINS kef — 搜索将匹配该文档
  • name CONTAINS clifford — 搜索将不匹配该文档

请记住,所有筛选器都使用小写、规范化的字符串(所有重音都已删除)。

通过此 Github 讨论 分享您的反馈。

实验性:使用函数更新文档

Meilisearch 1.10 允许您通过执行 Rhai 函数 来编辑文档。这允许您仅使用筛选器更新数据集的一部分。此外,使用函数允许您根据文档的数据实现动态逻辑。

以下有效负载更新 id 大于 3000 的所有文档的标题

{
  "filter": "id > 3000",
  "function": "doc.title = `✨ ${doc.title.to_upper()} ✨`"
}

这还支持更复杂的使用场景,例如实现衰减排名策略。根据您的需求,您可能会实现一个如下的函数,该函数将由 Cron 作业定期运行。

{
  "context": { "now": 1715423249 },
  "function": "
    // `posted_at` and `now` are Unix Epoch timestamps in seconds
    // they must be converted to hours.
    let age_hours = (context.now - doc.posted_at) / 60 / 60;
    doc.ranking_score = doc.upvotes ** 0.8 / (age_hours + 2) ** 1.8;
  "
}

通过此Github 讨论分享您的反馈。


这就是 v1.10 的全部内容!这些发行说明仅重点介绍了最重要的更新。有关详尽的列表,请阅读 Github 上的更新日志

使用 Meilisearch Cloud 轻松升级。

打开 Meilisearch Cloud


感谢贡献者

如果没有 MeilisearchCharabia 的贡献者 @Karribalu@hanbings@junhochoi@JWSong@PeterDaveHello@LukasKalbertodt@phillitrOSU,此次发布是不可能实现的。

我们还要特别感谢我们的 SDK 维护者,他们努力使 Meilisearch 可用于许多语言和框架。我们很高兴 @Sherlouk@Ja7ad 加入我们的开源维护者行列。 💪


订阅我们的每月新闻通讯,随时了解 Meilisearch 的一切动态。要了解有关 Meilisearch 未来并帮助塑造其发展方向的更多信息,请查看我们的路线图并参与我们的产品讨论

如有其他任何问题,请加入我们在 Discord 上的开发者社区。

Meilisearch 1.12

Meilisearch 1.12

Meilisearch 1.12 带来了显着的索引速度提升,并引入了新的 API 来禁用前缀搜索和分面搜索,以及检索任务批次。

Laurent Cazanove
Laurent Cazanove2024 年 12 月 23 日
Meilisearch Q4 2024 release wrap-up

Meilisearch 2024 年第四季度发布总结

Meilisearch 第四季度版本包括更快的搜索速度、对 UI 中设置的更多控制以及新区域。

Maya Shin
Maya Shin2024 年 11 月 27 日
Meilisearch 1.11

Meilisearch 1.11

Meilisearch 1.11 通过关键改进(包括二进制量化)推进了 AI 驱动的搜索走向稳定。此版本还根据用户反馈增强了联合搜索功能。

Carolina Ferreira
Carolina Ferreira2024 年 10 月 29 日