拼写容错设置
拼写容错功能帮助用户即使在搜索查询中包含拼写错误或错别字时也能找到相关结果,例如,输入 phnoe
而不是 phone
。 你可以为每个索引配置拼写容错功能。
已启用
拼写容错功能默认启用,但你可以根据需要禁用它
curl \
-X PATCH 'MEILISEARCH_URL/indexes/movies/settings/typo-tolerance' \
-H 'Content-Type: application/json' \
--data-binary '{ "enabled": false }'
禁用拼写容错后,Meilisearch 不再将与你的查询词相差几个字符的词语视为匹配项。 例如,查询 phnoe
将不再返回包含单词 phone
的文档。
在大多数情况下,保持启用拼写容错功能可以获得更好的搜索体验。 大型或多语言数据集可能是例外,因为在这些情况下,拼写容错功能可能会导致误报匹配。
minWordSizeForTypos
默认情况下,Meilisearch 接受查询词中包含五个或更多字符的一个错别字,如果查询词至少包含九个字符,则最多接受两个错别字。
如果你的数据集包含 seven
,则搜索 sevem
或 sevan
将匹配 seven
。 但 tow
不会匹配 two
,因为它少于 5
个字符。
你可以使用 minWordSizeForTypos
对象覆盖这些默认设置。 以下代码示例将一个错别字的最小字号设置为 4
,将两个错别字的最小字号设置为 10
。
curl \
-X PATCH 'MEILISEARCH_URL/indexes/movies/settings/typo-tolerance' \
-H 'Content-Type: application/json' \
--data-binary '{
"minWordSizeForTypos": {
"oneTypo": 4,
"twoTypos": 10
}
}'
更新 minWordSizeForTypos
对象时,请记住
oneTypo
必须大于等于 0 且小于等于twoTypos
twoTypos
必须大于等于oneTypo
且小于等于255
换句话说:0 ≤ oneTypo ≤ twoTypos ≤ 255
。
我们建议将 oneTypo
的值保持在 2
到 8
之间,将 twoTypos
的值保持在 4
到 14
之间。 如果任一值太低,你可能会获得大量误报结果。 另一方面,如果两个值都设置得太高,则许多搜索查询可能无法从拼写容错中受益。
拼写容错:特殊情况
首字母错字 Meilisearch 将查询首字母的错字视为两个错字。
连接 在考虑拼写容错的可能候选项时,Meilisearch 会连接由空格分隔符分隔的多个搜索词。 这被视为一个错别字。 例如,搜索 any way
将匹配包含 anyway
的文档。
有关拼写计算的更多信息,请参见下文。
disableOnWords
你可以通过将查询词添加到 disableOnWords
来禁用列表中查询词的拼写容错。 disableOnWords
不区分大小写。
curl \
-X PATCH 'MEILISEARCH_URL/indexes/movies/settings/typo-tolerance' \
-H 'Content-Type: application/json' \
--data-binary '{
"disableOnWords": [
"shrek"
]
}'
在搜索时,Meilisearch 不会对查询词 Shrek
或 shrek
应用拼写容错来匹配文档。
disableOnAttributes
你可以通过将特定的文档属性添加到 disableOnAttributes
来禁用其拼写容错。 以下代码示例禁用 title
的拼写容错
curl \
-X PATCH 'MEILISEARCH_URL/indexes/movies/settings/typo-tolerance' \
-H 'Content-Type: application/json' \
--data-binary '{ "disableOnAttributes": ["title"] }'
使用上述设置,title
属性中的匹配项将不容忍任何拼写错误。 例如,搜索 beautiful
(9 个字符)将不会匹配由 Javier Bardem 主演的电影“Biutiful”。 使用默认设置,这将是一个匹配项。