搜索

    Meilisearch 通过两种路由提供搜索功能

    您可以在本文的 末尾 找到这两个路由接受的参数的详尽描述。

    使用 POST 在索引中搜索

    POST/indexes/{index_uid}/search

    在给定索引中搜索与特定查询匹配的文档。

    当需要 API 密钥时,这是执行搜索的首选端点,因为它允许缓存预检请求。缓存预检请求可显著提高搜索速度

    注意

    默认情况下,此端点最多返回 1000 个结果。如果你想爬取数据库,请使用获取文档端点

    路径参数

    名称类型描述
    index_uid *字符串uid请求的索引

    主体

    搜索参数类型默认值描述
    q字符串""查询字符串
    offset整数0跳过的文档数
    limit整数20返回文档的最大数
    hitsPerPage整数1页面的返回文档的最大数
    page整数1请求特定结果页面
    filter字符串null通过属性值过滤查询
    facets字符串数组null显示每种切面的匹配计数
    attributesToRetrieve字符串数组["*"]返回文档中显示的属性
    attributesToCrop字符串数组null其值必须裁剪的属性
    cropLength整数10以字数计的裁剪值的长度
    cropMarker字符串"…"标记裁剪边界的字符串
    attributesToHighlight字符串数组null突出显示属性中包含的匹配项
    highlightPreTag字符串"<em>"插入到突出显示项开始的字符串
    highlightPostTag字符串"</em>"插入到突出显示项结尾的字符串
    showMatchesPosition布尔值false返回匹配项位置
    sort字符串数组null按属性值对搜索结果进行排序
    matchingStrategy字符串last在文档中匹配查询项所用的策略
    showRankingScore布尔值false显示文档的全局排名分数
    showRankingScoreDetails布尔值false添加详细的全局排名分数字段
    rankingScoreThreshold数字null排除排名分数较低的搜索结果
    attributesToSearchOn字符串数组["*"]将搜索限制到指定属性
    hybrid对象null根据查询关键字和含义返回结果
    向量数字数组null使用自定义查询向量
    retrieveVectors布尔值false返回文档向量数据
    语言环境字符串数组null明确地在查询中使用的语言

    详细了解如何使用每个搜索参数.

    响应

    名称类型描述
    命中对象数组查询结果
    offset数字跳过的文档数量
    limit数字要取出文档的数量
    estimatedTotalHits数字估算的匹配总数
    totalHits数字详尽的匹配总数
    totalPages数字详尽的搜索结果页总数
    hitsPerPage数字每页的结果数
    page数字当前搜索结果页
    facetDistribution对象给定方面的分布
    facetStats对象每个方面的数值minmax
    processingTimeMs数字查询处理时间
    查询字符串发起响应的查询

    搜索结果的详尽估算总数

    默认情况下,Meilisearch 仅返回查询中搜索结果总数的估计值:estimatedTotalHits。 这发生是因为 Meilisearch 优先考虑相关性和性能,而不是提供详尽的搜索结果数量。 在使用 estimatedTotalHits 工作时,使用 offsetlimit 在搜索结果之间导航。

    如果你需要搜索结果的总数,请在查询中使用 hitsPerPagepage 搜索参数。 此查询的响应将 estimatedTotalHits 替换为 totalHits,并根据你的 hitsPerPage 包含一个带有搜索结果页面数量的额外字段:totalPages。 使用 totalHitstotalPages 可能导致性能略有降低,但在创建诸如带数字页选择器之类的 UI 元素时推荐使用。

    estimatedTotalHitstotalHits 都不能超过在 maxTotalHits 索引设置 中配置的限制。

    你可以在 我们的专门指南中阅读有关分页的更多信息

    示例

    curl \
      -X POST 'http://localhost:7700/indexes/movies/search' \
      -H 'Content-Type: application/json' \
      --data-binary '{ "q": "american ninja" }'

    响应:200 Ok

    {
      "hits": [
        {
          "id": 2770,
          "title": "American Pie 2",
          "poster": "https://image.tmdb.org/t/p/w1280/q4LNgUnRfltxzp3gf1MAGiK5LhV.jpg",
          "overview": "The whole gang are back and as close as ever. They decide to get even closer by spending the summer together at a beach house. They decide to hold the biggest…",
          "release_date": 997405200
        },
        {
          "id": 190859,
          "title": "American Sniper",
          "poster": "https://image.tmdb.org/t/p/w1280/svPHnYE7N5NAGO49dBmRhq0vDQ3.jpg",
          "overview": "U.S. Navy SEAL Chris Kyle takes his sole mission—protect his comrades—to heart and becomes one of the most lethal snipers in American history. His pinpoint accuracy not only saves countless lives but also makes him a prime…",
          "release_date": 1418256000
        },],
      "offset": 0,
      "limit": 20,
      "estimatedTotalHits": 976,
      "processingTimeMs": 35,
      "query": "american "
    }
    

    使用 GET 在索引中搜索

    获取/indexes/{index_uid}/search

    在给定索引中搜索与特定查询匹配的文档。

    警告

    此端点仅接受 字符串过滤表达式

    仅在不需要 API 密钥时才能使用此端点。如果需要 API 密钥,请使用 POST 路径。

    注意

    默认情况下,此端点最多返回 1000 个结果。如果你想爬取数据库,请使用获取文档端点

    路径参数

    名称类型描述
    index_uid *字符串uid请求的索引

    查询参数

    搜索参数类型默认值描述
    q字符串""查询字符串
    offset整数0跳过的文档数
    limit整数20返回文档的最大数
    hitsPerPage整数1页面的返回文档的最大数
    page整数1请求特定结果页面
    filter字符串null通过属性值过滤查询
    facets字符串数组null显示每种切面的匹配计数
    attributesToRetrieve字符串数组["*"]返回文档中显示的属性
    attributesToCrop字符串数组null其值必须裁剪的属性
    cropLength整数10以字数计的裁剪值的长度
    cropMarker字符串"…"标记裁剪边界的字符串
    attributesToHighlight字符串数组null突出显示属性中包含的匹配项
    highlightPreTag字符串"<em>"插入到突出显示项开始的字符串
    highlightPostTag字符串"</em>"插入到突出显示项结尾的字符串
    showMatchesPosition布尔值false返回匹配项位置
    sort字符串数组null按属性值对搜索结果进行排序
    matchingStrategy字符串last在文档中匹配查询项所用的策略
    showRankingScore布尔值false显示文档的全局排名分数
    showRankingScoreDetails布尔值false添加详细的全局排名分数字段
    rankingScoreThreshold数字null排除排名分数较低的搜索结果
    attributesToSearchOn字符串数组["*"]将搜索限制到指定属性
    hybrid对象null根据查询关键字和含义返回结果
    向量数字数组null使用自定义查询向量
    retrieveVectors布尔值false返回文档向量数据
    语言环境字符串数组null明确地在查询中使用的语言

    详细了解如何使用每个搜索参数.

    响应

    名称类型描述
    命中对象数组查询结果
    offset数字跳过的文档数量
    limit数字要取出文档的数量
    estimatedTotalHits数字估算的匹配总数
    totalHits数字详尽的匹配总数
    totalPages数字详尽的搜索结果页总数
    hitsPerPage数字每页的结果数
    page数字当前搜索结果页
    facetDistribution对象给定方面的分布
    facetStats对象每个方面的数值minmax
    processingTimeMs数字查询处理时间
    查询字符串发起响应的查询

    示例

    curl \
      -X GET 'http://localhost:7700/indexes/movies/search?q=american%20ninja'

    响应:200 Ok

    {
      "hits": [
        {
          "id": 2770,
          "title": "American Pie 2",
          "poster": "https://image.tmdb.org/t/p/w1280/q4LNgUnRfltxzp3gf1MAGiK5LhV.jpg",
          "overview": "The whole gang are back and as close as ever. They decide to get even closer by spending the summer together at a beach house. They decide to hold the biggest…",
          "release_date": 997405200
        },
        {
          "id": 190859,
          "title": "American Sniper",
          "poster": "https://image.tmdb.org/t/p/w1280/svPHnYE7N5NAGO49dBmRhq0vDQ3.jpg",
          "overview": "U.S. Navy SEAL Chris Kyle takes his sole mission—protect his comrades—to heart and becomes one of the most lethal snipers in American history. His pinpoint accuracy not only saves countless lives but also makes him a prime…",
          "release_date": 1418256000
        },],
      "offset": 0,
      "limit": 20,
      "estimatedTotalHits": 976,
      "processingTimeMs": 35,
      "query": "american "
    }
    

    搜索参数

    以下对当前在使用搜索端点时可用的每个搜索参数进行了详尽说明。除非另有说明,所有参数都适用于 GET /indexes/{index_uid}/searchPOST /indexes/{index_uid}/search/multi-search 路径。

    警告

    如果 使用 GET 路径执行搜索,所有参数都必须 URL 编码

    使用 POST 路径或我们的 SDK 之一时无需执行此操作。

    概述

    搜索参数类型默认值描述
    q字符串""查询字符串
    offset整数0跳过的文档数
    limit整数20返回文档的最大数
    hitsPerPage整数1页面的返回文档的最大数
    page整数1请求特定结果页面
    filter字符串数组null通过属性值过滤查询
    facets字符串数组null显示每种切面的匹配计数
    attributesToRetrieve字符串数组["*"]返回文档中显示的属性
    attributesToCrop字符串数组null其值必须裁剪的属性
    cropLength整数10以字数计的裁剪值的长度
    cropMarker字符串"…"标记裁剪边界的字符串
    attributesToHighlight字符串数组null突出显示属性中包含的匹配项
    highlightPreTag字符串"<em>"插入到突出显示项开始的字符串
    highlightPostTag字符串"</em>"插入到突出显示项结尾的字符串
    showMatchesPosition布尔值false返回匹配项位置
    sort字符串数组null按属性值对搜索结果进行排序
    matchingStrategy字符串last在文档中匹配查询项所用的策略
    showRankingScore布尔值false显示文档的全局排名分数
    attributesToSearchOn字符串数组["*"]将搜索限制到指定属性
    hybrid对象null根据查询关键字和含义返回结果
    向量数字数组null使用自定义查询向量
    retrieveVectors布尔值false返回文档向量数据
    语言环境字符串数组null明确地在查询中使用的语言

    查询 (q)

    参数q
    预期值:任何字符串
    默认值null

    设置搜索词。

    警告

    Meilisearch 仅考虑任何给定搜索查询的前十个单词。此项操作对于提供 快速键入即搜索体验 是必要的。

    示例

    你可以通过设置 q 参数搜索提到 shifu 的电影

    curl \
      -X POST 'http://localhost:7700/indexes/movies/search' \
      -H 'Content-Type: application/json' \
      --data-binary '{ "q": "shifu" }'

    这将为你提供一个文档列表,其中至少一个属性包含你的查询词。

    {
      "hits": [
        {
          "id": 50393,
          "title": "Kung Fu Panda Holiday",
          "poster": "https://image.tmdb.org/t/p/w500/rV77WxY35LuYLOuQvBeD1nyWMuI.jpg",
          "overview": "The Winter Feast is Po's favorite holiday. Every year he and his father hang decorations, cook together, and serve noodle soup to the villagers. But this year Shifu informs Po that as Dragon Warrior, it is his duty to host the formal Winter Feast at the Jade Palace.",
          "release_date": 1290729600,
          "genres": [
            "Animation",
            "Family",
            "TV Movie"
          ]
        }
      ],
      "query": "shifu"
    }
    

    查询词规范化

    查询词将经历一个规范化过程,该过程将移除 非间隔符号。因此,Meilisearch 在返回结果时有效地忽略了重音和变音符号。例如,搜索 "sábia" 会返回包含 "sábia""sabiá""sabia" 的文档。

    规范化还将所有字母转换为小写。搜索 "Video" 会返回与搜索 "video""VIDEO""viDEO" 相同的结果。

    当未指定 q 时,Meilisearch 会执行 占位符搜索。占位符搜索会修改索引中的所有可搜索文档,修改内容受所使用的任何搜索参数影响,并按该索引的 自定义排名规则 进行排序。由于没有查询词,因此 内置排名规则 不适用。

    如果索引没有排序规则或自定义排序规则,则结果将按照内部数据库位置返回。

    提示

    创建时,占位符搜索特别有用 多个搜索界面,它使用户可以查看目录并更改排序规则而无需输入查询。

    如果您用双引号(")将搜索词包含在内,则 Meilisearch 仅返回按给定顺序包含这些词的文档。这称为词组搜索

    词组搜索不区分大小写,并忽略 软分隔符,如 -,:。在词组搜索中使用硬分隔符实际上会将其拆分为多个单独的词组搜索:"Octavia.Butler" 将返回与 "Octavia" "Butler" 相同的结果。

    您可以在单个搜索请求中组合词组搜索和常规查询。在这种情况下,Meilisearch 首先会获取与给定词组完全匹配的所有文档,然后继续执行其默认行为

    示例
    curl \
      -X POST 'http://localhost:7700/indexes/movies/search' \
      -H 'Content-Type: application/json' \
    --data-binary '{ "q": "\"african american\" horror" }'

    在单词或短语前使用减号 (-) 运算符以将其从搜索结果中排除。

    示例

    以下查询返回不包含单词“escape”的所有文档

    curl \
      -X POST 'http://localhost:7700/indexes/movies/search' \
      -H 'Content-Type: application/json' \
      --data-binary '{ "q": "-escape" }'

    否定搜索可与词组搜索一起使用

    curl \
      -X POST 'http://localhost:7700/indexes/movies/search' \
      -H 'Content-Type: application/json' \
      --data-binary '{ "q": "-\"escape room\"" }'

    偏移

    参数offset
    期望值:任何正整数
    默认值0

    设置搜索结果的起点,有效跳过给定数量的文档。

    使用 offsetlimit 查询仅返回搜索结果总数的估算值。

    您可以通过组合 offsetlimit 查询来对搜索结果进行分页

    警告

    offset 设置为大于 索引的 maxTotalHits 的值将返回一个空数组。

    示例

    如果您想跳过查询中的第一个结果,请将 offset 设置为 1

    curl \
      -X POST 'http://localhost:7700/indexes/movies/search' \
      -H 'Content-Type: application/json' \
      --data-binary '{
        "q": "shifu",
        "offset": 1
      }'

    限制

    参数limit
    期望值:任何正整数
    默认值20

    设置单个查询返回的最大文档数。

    您可以通过组合 offsetlimit 查询来对搜索结果进行分页

    警告

    搜索查询不能返回多于在 maxTotalHits 中配置的结果,即使 limit 的值大于 maxTotalHits 的值也是如此。

    示例

    如果您希望您的查询仅返回 两个文档,请将 limit 设置为 2

    curl \
      -X POST 'http://localhost:7700/indexes/movies/search' \
      -H 'Content-Type: application/json' \
      --data-binary '{
        "q": "shifu",
        "limit": 2
      }'

    每个页面显示的结果数

    参数: hitsPerPage
    期望值:任何正整数
    默认值20

    设置单次查询返回的最大文档数。此参数配置的值可决定总页数:如果 Meilisearch 为查询找到 20 个匹配项,而你的 hitsPerPage 设置为 5,则 totalPages4

    包含 hitsPerPage 的查询是详尽无遗的,并且不返回 estimatedTotalHits。相反,响应主体将包括 totalHitstotalPages

    如果将 hitsPerPage 设置为 0,Meilisearch 会处理你的请求,但不返回任何文档。在这种情况下,响应主体将包括 totalHits 的详尽值。响应主体还将包括 totalPages,但其值为 0

    你可以使用 hitsPerPagepage 分页搜索结果

    注意

    hitsPerPagepage 优先于 offsetlimit。如果查询包含 hitsPerPagepage,则会忽略传递给 offsetlimit 的任何值。

    警告

    hitsPerPagepage 是资源密集型选项,可能会对搜索性能产生负面影响。如果 maxTotalHits 设置为高于其默认值,则尤其如此。

    示例

    以下示例返回查询的前 15 个结果

    curl \
      -X POST 'http://localhost:7700/indexes/movies/search' \
      -H 'Content-Type: application/json' \
      --data-binary '{
        "q": "",
        "hitsPerPage": 15
      }'

    页面

    参数: page
    期望值:任何正整数
    默认值: 1

    请求特定的结果页面。页面使用 hitsPerPage 搜索参数计算。

    包含 page 的查询是详尽无遗的,并且不返回 estimatedTotalHits。相反,响应主体将包括两个新字段:totalHitstotalPages

    如果将 page 设置为 0,Meilisearch 会处理你的请求,但不返回任何文档。在这种情况下,响应主体将包括 facetDistributiontotalPagestotalHits 的详尽值。

    你可以使用 hitsPerPagepage 分页搜索结果

    注意

    hitsPerPagepage 优先于 offsetlimit。如果查询包含 hitsPerPagepage,则会忽略传递给 offsetlimit 的任何值。

    警告

    hitsPerPagepage 是资源密集型选项,可能会对搜索性能产生负面影响。如果 maxTotalHits 设置为高于其默认值,则尤其如此。

    示例

    以下示例返回搜索结果的第二页

    curl \
      -X POST 'http://localhost:7700/indexes/movies/search' \
      -H 'Content-Type: application/json' \
      --data-binary '{
        "q": "",
        "page": 2
      }'

    筛选器

    参数: filter
    预期值: 以字符串或字符串数组形式编写的筛选器表达式
    默认值: []

    使用筛选器表达式来细化搜索结果。用作筛选条件的属性必须添加到 filterableAttributes 列表 中。

    有关详细信息,请阅读我们的指南,了解如何使用筛选器和构建筛选器表达式

    示例

    你可以使用逻辑连接符以字符串语法编写筛选器表达式

    "(genres = horror OR genres = mystery) AND director = 'Jordan Peele'"
    

    你可以将相同的筛选器写成一个数组

    [["genres = horror", "genres = mystery"], "director = 'Jordan Peele'"]
    

    然后可以在搜索查询中使用筛选器

    curl \
      -X POST 'http://localhost:7700/indexes/movies/search' \
      -H 'Content-Type: application/json' \
      --data-binary '{
        "q": "thriller",
        "filter": [
          [
            "genres = Horror",
            "genres = Mystery"
          ],
          "director = \"Jordan Peele\""
        ]
      }'

    使用 _geoRadius_geoBoundingBox 筛选结果

    如果你的文档包含 _geo 数据, 则可以使用内置筛选规则 _geoRadius_geoBoundingBox 根据其地理位置筛选结果。

    _geoRadius 根据中心点和半径建立一个圆形区域。此筛选规则需要三个参数: latlngdistance_in_meters

    _geoRadius(lat, lng, distance_in_meters)
    

    latlng 应为表示为浮点数的地理坐标。distance_in_meters 表示想要结果的区域半径, 应为整数。

    curl \
      -X POST 'http://localhost:7700/indexes/restaurants/search' \
      -H 'Content-type:application/json' \
      --data-binary '{ "filter": "_geoRadius(45.472735, 9.184019, 2000)" }'

    如果任何参数无效或缺失, Meilisearch 将返回错误代码 invalid_search_filter

    分面

    参数: facets
    预期值: attribute 数组或 ["*"]
    默认值: null 为每个给定的分面返回匹配当前搜索查询的文档数。此参数可以取两个值

    默认情况下, facets 为每个分面字段返回最多 100 个分面值。你可以使用 faceting 索引设置maxValuesPerFacet 属性更改此值。

    设置 facets 时, 搜索结果对象包括 facetDistributionfacetStats 字段。

    注意

    如果对 facets 使用的属性未添加到 filterableAttributes 列表中, 则将忽略该属性。

    facetDistribution

    facetDistribution 包含分布在给定分面的值之间的匹配文档数。每个分面都表示为一个对象

    {"facetDistribution": {
        "FACET_A": {
          "FACET_VALUE_X": 6,
          "FACET_VALUE_Y": 1,
        },
        "FACET_B": {
          "FACET_VALUE_Z": 3,
          "FACET_VALUE_W": 9,
        },
      },}
    

    facetDistribution 为传递给 facets 参数的每个属性包含一个对象。每个对象包含该属性的返回值和具有该值匹配结果的计数。Meilisearch 不返回空分面。

    提示

    facetStats

    facetStats 包含每个分面中所有文档的最小 (min) 和最大 (max) 数值。仅考虑数值

    {"facetStats":{
      "rating":{
        "min":2.5,
        "max":4.7
        }
      }}
    

    如果匹配的文档中没有分面的数值, 则该分面不包含在 facetStats 对象中。facetStats 忽略字符串值, 即使该字符串包含数字。

    示例

    给定一个电影评分数据库, 以下代码示例返回每个类型的 蝙蝠侠 电影的数量以及最低和最高评分

    curl \
      -X POST 'http://localhost:7700/indexes/movie_ratings/search' \
      -H 'Content-Type: application/json' \
      --data-binary '{
        "q": "Batman",
        "facets": ["genres", "rating"]
      }'

    响应显示 genresrating 的方面分布。由于 rating 是一个数字字段,因此您可以在 facetStats 中获取它的最小值和最大值。

    {"estimatedTotalHits":22,
      "query":"Batman",
      "facetDistribution":{
        "genres":{
          "Action":20,
          "Adventure":7,"Thriller":3
        },
        "rating":{
          "2":1,"9.8":1
        }
      },
      "facetStats":{
        "rating":{
          "min":2.0,
          "max":9.8
        }
      }
    }
    

    在分面搜索指南中了解有关方面分布的更多信息。

    搜索时的不同属性

    参数distinct
    预期值filterableAttributes 列表中存在的 attribute
    默认值null

    filterableAttributes 列表中的一个属性定义为不同属性。不同属性表明共享指定字段相同值的文档是等效的,并且在搜索结果中应仅返回最相关的文档。

    此行为类似于 distinctAttribute 索引设置,但是可以在搜索时进行配置。 distinctAttribute 充当您可以用 distinct 覆盖的默认不同属性值。

    示例

    curl \
      -X POST 'http://localhost:7700/indexes/INDEX_NAME/search' \
      -H 'Content-Type: application/json' \
      --data-binary '{
        "q": "QUERY TERMS",
        "distinct": "ATTRIBUTE_A"
      }'

    要检索的属性

    参数attributesToRetrieve
    预期值: attribute 数组或 ["*"]
    默认值["*"]

    配置将在返回的文档中检索哪些属性。

    如果未指定值,则 attributesToRetrieve 使用 displayedAttributes 列表,该列表默认包含文档中找到的所有属性。

    注意

    如果某个属性已从 displayedAttributes 中移除,则 attributesToRetrieve 将默默地忽略它,并且该字段不会出现在返回的文档中。

    示例

    要仅获取 overviewtitle 字段,请将 attributesToRetrieve 设置为 ["overview", "title"]

    curl \
      -X POST 'http://localhost:7700/indexes/movies/search' \
      -H 'Content-Type: application/json' \
      --data-binary '{
        "q": "shifu",
        "attributesToRetrieve": [
          "overview",
          "title"
        ]
      }'

    要裁剪的属性

    参数attributesToCrop
    预期值:属性数组或 ["*"]
    默认值null

    将返回结果中的所选字段裁剪到由 cropLength 参数指定的长度。当设置 attributesToCrop 时,每个返回的文档都包含一个名为 _formatted 的额外字段。此对象包含所选属性的裁剪版本。

    默认情况下,裁剪边界用省略号 () 标记。您可以使用 cropMarker 搜索参数更改此内容。

    或者,您可以为提供给 attributesToCrop 的任何属性指定自定义裁剪长度:attributesToCrop=["attributeNameA:5", "attributeNameB:9"]。如果已配置,则这些值优先于 cropLength

    而不是提供单个属性,你可以提供 ["*"] 作为通配符: attributesToCrop=["*"]。这将导致 _formatted 包含有 attributesToRetrieve 中所有属性裁剪后的值。

    裁剪算法

    假设你有一个包含以下字符串的字段:唐纳泰罗是一只熟练聪明的海龟。莱昂纳多是最熟练的海龟。拉斐尔是最强壮的海龟。

    裁剪时,Meilisearch 会尝试尊重句子边界。例如,如果你搜索的词条是 莱昂纳多,你的 cropLength 是 6,Meilisearch 会优先保留这个句子并返回:莱昂纳多是最熟练的海龟。

    如果一个查询只包含一个搜索词条,Meilisearch 会以该词条第一次出现的位置为中心进行裁剪。如果你搜索 海龟,并且你的 cropLength 是 7,Meilisearch 会返回该单词的第一个实例:唐纳泰罗是一只熟练聪明的海龟。

    如果一个查询包含多个搜索词条,Meilisearch 会以最多唯一匹配的词条周围为中心进行裁剪,优先考虑彼此之间距离更近且符合原始查询顺序的词条。如果你搜索 熟练的海龟cropLength 是 6,Meilisearch 会返回 莱昂纳多是最熟练的海龟

    如果 Meilisearch 在一个字段中找不到任何查询词条,裁剪会从该字段的第一个单词开始。如果你搜索 米开朗基罗cropLength 是 4,这个字符串出现在另一个字段中,Meilisearch 会返回 唐纳泰罗是一只熟练的…

    示例

    如果你使用 shifu 作为搜索查询,并将 cropLength 参数的值设置为 5

    curl \
      -X POST 'http://localhost:7700/indexes/movies/search' \
      -H 'Content-Type: application/json' \
      --data-binary '{
        "q": "shifu",
        "attributesToCrop": ["overview"],
        "cropLength": 5
      }'

    你会在 _formatted 对象中获得裁剪后的文本

    {
      "id": 50393,
      "title": "Kung Fu Panda Holiday",
      "poster": "https://image.tmdb.org/t/p/w1280/gp18R42TbSUlw9VnXFqyecm52lq.jpg",
      "overview": "The Winter Feast is Po's favorite holiday. Every year he and his father hang decorations, cook together, and serve noodle soup to the villagers. But this year Shifu informs Po that as Dragon Warrior, it is his duty to host the formal Winter Feast at the Jade Palace. Po is caught between his obligations as the Dragon Warrior and his family traditions: between Shifu and Mr. Ping.",
      "release_date": 1290729600,
      "_formatted": {
        "id": 50393,
        "title": "Kung Fu Panda Holiday",
        "poster": "https://image.tmdb.org/t/p/w1280/gp18R42TbSUlw9VnXFqyecm52lq.jpg",
        "overview": "…this year Shifu informs Po…",
        "release_date": 1290729600
      }
    }
    

    裁剪长度

    参数cropLength
    预期值:一个正整数
    默认值10

    使用 attributesToCrop 时,配置裁剪值中出现的单词的总数。如果未配置 attributesToCropcropLength 不会影响返回结果。

    查询词条被视为裁剪值长度的一部分。如果 cropLength 设置为 2,并且你搜索一个词条(例如 shifu),裁剪后的字段将总共包含两个单词(例如 "…Shifu informs…")。

    停止词也会计入此数字。如果 cropLength 设置为 2,并且你搜索一个词条(例如 grinch),裁剪后的结果可能会包含一个停止词(例如 "…the Grinch…")。

    如果 attributesToCrop 使用 attributeName:number 语法为某个属性指定自定义裁剪长度,则该值优先于 cropLength

    裁剪标记

    参数: cropMarker
    预期值: 字符串
    默认值: "…"

    使用 attributesToCrop 参数时,设置用于标记裁剪边界的一个字符串。裁剪标记将插入到裁剪的两侧。如果没有配置 attributesToCrop,则 cropMarker 对返回的搜索结果没有影响。

    如果将 cropMarker 设置为 null 或空字符串,返回结果中将不包含任何标记。

    仅在移除内容的地方添加裁剪标记。例如,如果裁剪的文本包含字段值的第一个单词,则不会在裁剪结果的开头添加裁剪标记。

    示例

    搜索 shifu 时,可以用 cropMarker 来更改默认的

    curl \
      -X POST 'http://localhost:7700/indexes/movies/search' \
      -H 'Content-Type: application/json' \
      --data-binary '{
        "q": "shifu",
        "cropMarker": "[…]",
        "attributesToCrop": ["overview"]
      }'
    {
      "id": 50393,
      "title": "Kung Fu Panda Holiday",
      "poster": "https://image.tmdb.org/t/p/w1280/gp18R42TbSUlw9VnXFqyecm52lq.jpg",
      "overview": "The Winter Feast is Po's favorite holiday. Every year he and his father hang decorations, cook together, and serve noodle soup to the villagers. But this year Shifu informs Po that as Dragon Warrior, it is his duty to host the formal Winter Feast at the Jade Palace. Po is caught between his obligations as the Dragon Warrior and his family traditions: between Shifu and Mr. Ping.",
      "release_date": 1290729600,
      "_formatted": {
        "id": 50393,
        "title": "Kung Fu Panda Holiday",
        "poster": "https://image.tmdb.org/t/p/w1280/gp18R42TbSUlw9VnXFqyecm52lq.jpg",
        "overview": "[…]But this year Shifu informs Po that as Dragon Warrior,[…]",
        "release_date": 1290729600
      }
    }
    

    需要高亮的属性

    参数: attributesToHighlight
    预期值:属性数组或 ["*"]
    默认值null

    高亮指定的属性中与查询项匹配的文本。attributesToHighlight 仅适用于以下类型的属性值:字符串、数字、数组、对象。

    设置此参数时,返回的文档将包含一个 _formatted 对象,其中包含高亮的术语。

    可以将 ["*"] 用于属性列表,即:attributesToHighlight=["*"]。在这种情况下,在 attributesToRetrieve 中列出的所有属性都将赋给 attributesToHighlight

    默认情况下,将高亮的元素放在 <em></em> 标记中。可以通过使用 highlightPreTaghighlightPostTag 搜索参数 更改这种设置。

    注意

    attributesToHighlight 还将高亮配置为 同义词停用词 的术语。

    警告

    attributesToHighlight 将高亮添加到 attributesToHighlight 数组的所有属性内的匹配项,即使这些属性未设置为 searchableAttributes

    示例

    下面的查询高亮显示了 overview 属性中的所有匹配项

    curl \
      -X POST 'http://localhost:7700/indexes/movies/search' \
      -H 'Content-Type: application/json' \
      --data-binary '{
        "q": "winter feast",
        "attributesToHighlight": ["overview"]
      }'

    然后可以在每个返回文档中包含的 _formatted 对象,找到文本的高亮版本

    {
      "id": 50393,
      "title": "Kung Fu Panda Holiday",
      "poster": "https://image.tmdb.org/t/p/w1280/gp18R42TbSUlw9VnXFqyecm52lq.jpg",
      "overview": "The Winter Feast is Po's favorite holiday. Every year he and his father hang decorations, cook together, and serve noodle soup to the villagers. But this year Shifu informs Po that as Dragon Warrior, it is his duty to host the formal Winter Feast at the Jade Palace. Po is caught between his obligations as the Dragon Warrior and his family traditions: between Shifu and Mr. Ping.",
      "release_date": 1290729600,
      "_formatted": {
        "id": 50393,
        "title": "Kung Fu Panda Holiday",
        "poster": "https://image.tmdb.org/t/p/w1280/gp18R42TbSUlw9VnXFqyecm52lq.jpg",
        "overview": "The <em>Winter Feast</em> is Po's favorite holiday. Every year he and his father hang decorations, cook together, and serve noodle soup to the villagers. But this year Shifu informs Po that as Dragon Warrior, it is his duty to host the formal <em>Winter Feast</em> at the Jade Palace. Po is caught between his obligations as the Dragon Warrior and his family traditions: between Shifu and Mr. Ping.",
        "release_date": 1290729600
      }
    }
    

    高亮标记

    参数: highlightPreTaghighlightPostTag
    预期值: 字符串
    默认值: 分别为 "<em>""</em>"

    highlightPreTaghighlightPostTag 分别配置单词在 attributesToHighlight 中高亮显示时需要插入的字符串之前和之后的字符串。如果 attributesToHighlight 没有进行配置,highlightPreTaghighlightPostTag 不会对返回的搜索结果造成影响。

    可以使用 highlightPreTaghighlightPostTag 将任意文本字符串(不仅仅是 HTML 标签)包含在术语之间:"<em>""<strong>""*""__" 都是受支持的值。

    如果将 highlightPreTaghighlightPostTag 设置为 null 或空字符串,则不会在高亮显示的术语的开头或结尾插入任何内容。

    示例

    以下查询会使用带有 class 属性的 <span> 标签将高亮显示的匹配内容包含在其中

    curl \
      -X POST 'http://localhost:7700/indexes/movies/search' \
      -H 'Content-Type: application/json' \
      --data-binary '{
        "q": "winter feast",
        "attributesToHighlight": ["overview"],
        "highlightPreTag": "<span class=\"highlight\">",
        "highlightPostTag": "</span>"
      }'

    可以在 _formatted 属性中找到高亮显示的查询字词

    {
      "id": 50393,
      "title": "Kung Fu Panda Holiday",
      "poster": "https://image.tmdb.org/t/p/w1280/gp18R42TbSUlw9VnXFqyecm52lq.jpg",
      "overview": "The Winter Feast is Po's favorite holiday. Every year he and his father hang decorations, cook together, and serve noodle soup to the villagers. But this year Shifu informs Po that as Dragon Warrior, it is his duty to host the formal Winter Feast at the Jade Palace. Po is caught between his obligations as the Dragon Warrior and his family traditions: between Shifu and Mr. Ping.",
      "release_date": 1290729600,
      "_formatted": {
        "id": 50393,
        "title": "Kung Fu Panda Holiday",
        "poster": "https://image.tmdb.org/t/p/w1280/gp18R42TbSUlw9VnXFqyecm52lq.jpg",
        "overview": "The <span class=\"highlight\">Winter Feast</span> is Po's favorite holiday. Every year he and his father hang decorations, cook together, and serve noodle soup to the villagers. But this year Shifu informs Po that as Dragon Warrior, it is his duty to host the formal <span class=\"highlight\">Winter Feast</span> at the Jade Palace. Po is caught between his obligations as the Dragon Warrior and his family traditions: between Shifu and Mr. Ping.",
        "release_date": 1290729600
      }
    }
    
    DENGER

    尽管没有必要同时使用 highlightPreTaghighlightPostTag,但请务必确保标签匹配正确。在上面的示例中,如果不设置 highlightPostTag,会导致 HTML 格式错误:<span>Winter Feast</em>

    显示匹配位置

    参数showMatchesPosition
    预期值truefalse
    默认值false

    _matchesPosition 对象添加到搜索响应中,该对象包含所有字段中查询到的术语的每个出现位置。当需要比 内置高亮显示 提供的更精准的控制时,这很有用。showMatchesPosition 仅适用于字符串、数字和字符串和数字数组。

    警告

    showMatchesPosition 返回所有属性中匹配的查询术语的位置,即使这些属性没有设置为 searchableAttributes

    字段中的匹配术语的开端由 start 指示,其长度由 length 指示。

    警告

    startlength 以字节为单位测量,而不是字符数。例如,ü 表示两个字节,但一个字符。

    示例

    如果将 showMatchesPosition 设置为 true,并搜索 winter feast

    curl \
      -X POST 'http://localhost:7700/indexes/movies/search' \
      -H 'Content-Type: application/json' \
      --data-binary '{
        "q": "winter feast",
        "showMatchesPosition": true
      }'

    将会获得带有 **有关 _matchesPosition 对象中匹配项的信息** 的以下响应。请注意,由于空格的存在,Meilisearch 将 winterfeast 分开搜索

    {
      "id": 50393,
      "title": "Kung Fu Panda Holiday",
      "poster": "https://image.tmdb.org/t/p/w500/rV77WxY35LuYLOuQvBeD1nyWMuI.jpg",
      "overview": "The Winter Feast is Po's favorite holiday. Every year he and his father hang decorations, cook together, and serve noodle soup to the villagers. But this year Shifu informs Po that as Dragon Warrior, it is his duty to host the formal Winter Feast at the Jade Palace. Po is caught between his obligations as the Dragon Warrior and his family traditions: between Shifu and Mr. Ping.",
      "release_date": 1290729600,
      "_matchesPosition": {
        "overview": [
          {
            "start": 4,
            "length": 6
          },
          {
            "start": 11,
            "length": 5
          },
          {
            "start": 234,
            "length": 6
          },
          {
            "start": 241,
            "length": 5
          }
        ]
      }
    }
    

    排序

    参数sort
    预期值:一个以数组或逗号分隔的字符串形式编写的属性列表
    默认值null

    在查询时根据指定的属性和指示的顺序对搜索结果进行排序。

    列表中的每个属性后面都必须跟一个冒号 (:) 及首选排序顺序:升序 (asc) 或降序 (desc)。

    注意

    属性顺序是有意义的。列表中的第一个属性将优先于后面出现的属性。

    例如,sort="price:asc,author:desc 在对结果排序时,将优先考虑 price 高于 author

    使用 POST 路由时,sort 期望一个字符串数组。

    使用 GET 路由时,sort 期望列表为逗号分隔的字符串。

    在我们的专用指南中阅读有关如何对搜索结果进行排序的更多信息。

    示例

    您可以按从最便宜到最贵的顺序搜索科幻小说

    curl \
      -X POST 'http://localhost:7700/indexes/books/search' \
      -H 'Content-Type: application/json' \
      --data-binary '{
        "q": "science fiction",
        "sort": ["price:asc"]
      }'

    使用 _geoPoint 排序结果

    在处理包含地理位置数据的文件时,您可以使用 _geoPoint 根据位置与特定地理位置的距离对结果进行排序。

    _geoPoint 是一個排序函數,需要兩個浮點數來表示位置的緯度和經度。您還必須指定排序應該是升序 (asc) 還是降序 (desc)

    curl \
      -X POST 'http://localhost:7700/indexes/restaurants/search' \
      -H 'Content-type:application/json' \
      --data-binary '{ "sort": ["_geoPoint(48.8561446,2.2978204):asc"] }'

    使用 _geoPoint 的查詢總會包含一個 geoDistance 欄位,其中包含文件位置與 _geoPoint 之間的距離(以公尺為單位)。

    [
      {
        "id": 1,
        "name": "Nàpiz' Milano",
        "_geo": {
          "lat": 45.4777599,
          "lng": 9.1967508
        },
        "_geoDistance": 1532
      }
    ]
    

    您可以在我們的專用指南中閱讀有關基於位置排序的更多信息。

    匹配策略

    **參數**:matchingStrategy
    **預期值**:lastallfrequency
    **預設值**:last

    定義用於在文件中匹配查詢字詞的策略。

    last

    last 會先傳回包含所有查詢字詞的文件。如果沒有足夠包含所有查詢字詞的結果來符合請求的 limit,Meilisearch 會從查詢的結尾開始逐一移除查詢字詞。

    curl \
      -X POST 'http://localhost:7700/indexes/movies/search' \
      -H 'Content-Type: application/json' \
      --data-binary '{
        "q": "big fat liar",
        "matchingStrategy": "last"
      }'

    使用上述程式碼範例,Meilisearch 首先會傳回包含所有三個字詞的文件。如果結果不符合所請求的 limit,它也會傳回僅包含前兩個字詞的文件,即 big fat,然後傳回僅包含 big 的文件。

    all

    all 只會傳回包含所有查詢字詞的文件。即使沒有足夠的文件來符合請求的 limit,Meilisearch 也不會再匹配任何文件。

    curl \
      -X POST 'http://localhost:7700/indexes/movies/search' \
      -H 'Content-Type: application/json' \
      --data-binary '{
        "q": "big fat liar",
        "matchingStrategy": "all"
      }'

    上述程式碼範例只會傳回包含所有三個字詞的文件。

    frequency

    frequency 會先傳回包含所有查詢字詞的文件。如果沒有足夠包含所有查詢字詞的結果來符合請求的 limit,Meilisearch 會逐一移除查詢字詞,從資料集中出現頻率最高的那個字詞開始。frequency 實際上讓出現頻率較低的一組結果中較輕微的字詞有更高的加權。

    curl \
      -X POST 'http://localhost:7700/indexes/movies/search' \
      -H 'Content-Type: application/json' \
      --data-binary '{
        "q": "white shirt",
        "matchingStrategy": "frequency"
      }'

    在很多文档均包含术语 "shirt" 的数据集里,以上代码示例会优先显示包含 "white" 的文档。

    排名分数

    参数showRankingScore
    预期值truefalse
    默认值false

    向每个文档添加一个全局排名分数字段 _rankingScore_rankingScore 是一个 0.01.0 之间的数值。_rankingScore 越高,则文档越相关。

    sort 排名规则不会影响 _rankingScore。而文档顺序由其排位字段的值决定。

    注意

    文档的排名分数不会根据同一索引里其他文档的分数而改变。

    例如,如果文档 A 对于查询术语的分数为 0.5,则无论文档 B、C 或 D 的分数为何,此值都保持不变。

    示例

    movies 中搜索 dragon 时,以下代码示例会返回 _rankingScore

    curl \
      -X POST 'http://localhost:7700/indexes/movies/search' \
      -H 'Content-Type: application/json' \
      --data-binary '{
        "q": "dragon",
        "showRankingScore": true
      }'
    {
      "hits": [
        {
          "id": 31072,
          "title": "Dragon",
          "overview": "In a desperate attempt to save her kingdom…","_rankingScore": 0.92
        },
        {
          "id": 70057,
          "title": "Dragon",
          "overview": "A sinful martial arts expert wants…","_rankingScore": 0.91
        },],}
    

    排名分数详细信息

    参数showRankingScoreDetails
    预期值truefalse
    默认值false

    向每个文档添加一个详细的全局排名分数字段 _rankingScoreDetails_rankingScoreDetails 是一个对象,包含一个针对每个活跃排名规则的嵌套对象。

    排名分数详细信息对象

    每个排名规则会将其分数描述在自己的对象里。字段根据每个排名规则而异。

    words
    typo
    proximity
    attribute
    exactness
    field_name:direction

    sort 排序规则不会作为单个字段显示在得分详细信息对象中。相反,每个已排序的属性都将以其自身的字段形式出现,后面跟着一个冒号 (:) 和排序方向:attribute:direction

    _geoPoint(lat:lng):direction
    vectorSort(target_vector)

    示例

    movies 中搜索 dragon 时,以下代码示例将返回 _rankingScoreDetail

    curl \
      -X POST 'http://localhost:7700/indexes/movies/search' \
      -H 'Content-Type: application/json' \
      --data-binary '{
        "q": "dragon",
        "showRankingScoreDetails": true
      }'
    {
      "hits": [
        {
          "id": 31072,
          "title": "Dragon",
          "overview": "In a desperate attempt to save her kingdom…","_rankingScoreDetails": {
            "words": {
              "order": 0,
              "matchingWords": 4,
              "maxMatchingWords": 4,
              "score": 1.0
            },
            "typo": {
              "order": 2,
              "typoCount": 1,
              "maxTypoCount": 4,
              "score": 0.75
            },
            "name:asc": {
              "order": 1,
              "value": "Dragon"
            }
          }
        },],}
    

    排名分数阈值

    参数rankingScoreThreshold
    预期值0.01.0 之间的一个数字
    默认值null

    排除低于指定排名分数的结果。

    被排除的结果不计入 estimatedTotalHitstotalHits 和分面分布。

    `rankingScoreThreshold` 和 `limit`

    出于性能考虑,如果高于 rankingScoreThreshold 的文档数量大于 limit,Meilisearch 不会评估剩余文档的排名分数。低于阈值的排序结果不会立即从候选集中移除。在这种情况下,Meilisearch 可能会高估 estimatedTotalHitstotalHits 和分面分布的计数。

    示例

    以下查询仅返回排名分数大于 0.2 的结果

    curl \
    -X POST 'http://localhost:7700/indexes/INDEX_NAME/search' \
    -H 'Content-Type: application/json' \
    --data-binary '{
        "q": "badman",
        "rankingScoreThreshold": 0.2
    }'

    在搜索时自定义用于搜索的属性

    参数attributesToSearchOn
    预期值:以数组形式编写的可搜索属性列表
    默认值["*"]

    将查询配置为仅在指定属性中查找术语。

    你可以将通配符值 (["*"]) 和 null 传递给 attributesToSearchOn,而不是属性列表。在这两种情况下,Meilisearch 都会搜索所有可搜索属性中的匹配项。

    警告

    传递给 attributesToSearchOn 的属性也必须存在于 searchableAttributes 列表中。

    attributesToSearchOn 中的属性顺序不会影响相关性。

    示例

    以下查询返回其中 overview 包含 "adventure" 的文档

    curl \
      -X POST 'http://localhost:7700/indexes/movies/search' \
      -H 'Content-Type: application/json' \
      --data-binary '{
        "q": "adventure",
        "attributesToSearchOn": ["overview"]
      }'

    结果不会包括在其他字段(如 titlegenre)中包含 "adventure" 的文档,即使这些字段出现在 searchableAttributes 列表中。

    混合搜索(实验性)

    参数hybrid
    预期值:具有两个字段的对象:embeddersemanticRatio
    默认值null

    将 Meilisearch 配置为根据查询的含义和上下文返回搜索结果。

    hybrid 必须是一个对象。它接受两个字段:embeddersemanticRatio

    embedder 必须是指示使用 /settings 终结点配置的一个嵌入器的字符串。如果您未指定一个嵌入器,并且您的索引包含一个嵌入器,则 Meilisearch 会默认使用它。如果一个索引包含多个嵌入器,则 Meilisearch 将使用名为 default 的嵌入器。

    semanticRatio 必须介于 0.01.0 之间,表示关键字结果和语义搜索结果之间的比例。0.0 导致 Meilisearch 仅返回关键字结果。1.0 导致 Meilisearch 仅返回基于含义的结果。默认为 0.5

    警告

    如果您在激活实例的 vectorStore配置一个嵌入器 之前使用 hybrid,则 Meilisearch 将返回一个错误。

    示例

    curl -X POST 'localhost:7700/indexes/INDEX_NAME/search' \
      -H 'content-type: application/json' \
      --data-binary '{
        "q": "kitchen utensils",
        "hybrid": {
          "semanticRatio": 0.9,
          "embedder": "default"
        }
      }'

    矢量(实验性功能)

    参数vector
    期望值:一个数字数组
    默认值null

    使用自定义矢量执行搜索查询。必须是一个数字数组,对应于自定义矢量的维度。

    当使用 userProvided 嵌入器执行搜索时,vector 是必需的。您还可以使用 vector 覆盖嵌入器的自动矢量生成功能。

    vector 维度必须与嵌入器的维度相匹配。

    示例

    curl -X POST 'localhost:7700/indexes/INDEX_NAME/search' \
      -H 'content-type: application/json' \
      --data-binary '{ "vector": [0, 1, 2] }'
    警告

    如果您在激活实例的 vectorStore配置一个自定义嵌入器 之前使用 vector,则 Meilisearch 将返回一个错误。

    在响应中显示 _vectors(实验性功能)

    参数retrieveVectors
    预期值truefalse
    默认值false

    返回文档嵌入数据和搜索结果。如果为 true,则 Meilisearch 将在每个 文档的 _vectors 字段 中显示矢量数据。

    示例

    curl -X POST 'localhost:7700/indexes/INDEX_NAME/search' \
      -H 'content-type: application/json' \
      --data-binary '{
        "q": "kitchen utensils",
        "retrieveVectors": true,
        "hybrid": {
          "embedder": "default"
        }
      }'
    {
      "hits": [
        {
          "id": 0,
          "title": "DOCUMENT NAME",
          "_vectors": {
            "default": {
              "embeddings": [0.1, 0.2, 0.3],
              "regenerate": true
            }
          }},],}
    

    查询语言环境

    参数locales
    期望值受支持的 ISO-639-2B 语言环境 数组
    默认值: []

    默认情况下,Meilisearch 会自动检测查询的语言。使用此参数可以明确地说明查询的语言。

    如果 locales语言环境化属性索引设置 不匹配,则此参数优先。

    `locales`和 `localizedAttributes`

    localeslocalizedAttributes 有相同目标:在 Meilisearch 的语言自动检测不出所料时明确说明搜索中使用的语言。

    如果您认为 Meilisearch 由于查询文本而检测到不正确的语言,请使用 locales 明确设置搜索语言。

    如果您认为 Meilisearch 因文档而检测错误的语言,请使用 localizedAttributes 在索引级别明确设置文档语言。

    如需完全控制 Meilisearch 在索引和搜索期间检测语言的方式,请同时设置 localeslocalizedAttributes

    示例

    curl \
    -X POST 'http://localhost:7700/indexes/INDEX_NAME/search' \
    -H 'Content-Type: application/json' \
    --data-binary '{
      "q": "進撃の巨人",
      "locales": ["jpn"]
    }'
    {
      "hits": [
        {
          "id": 0,
          "title": "DOCUMENT NAME",
          "overview_cn": "OVERVIEW TEXT IN CHINESE",
          "overview_jp": "OVERVIEW TEXT IN JAPANESE"
        }],}