返回文章列表
2021年1月11日
v0.18.0 版本新特性
v0.18.0 版本新特性

大家新年快乐!2021年带来了 Meilisearch 的新版本。是不是很棒?
在此版本中,我们修复了一些错误,并增加了向 Meilisearch 添加文档时的默认负载大小。然而,本次更新的明星是全新的分词器。
我们的主要目标是提供最佳的搜索体验,而一个好的分词器对于获得高质量的搜索结果至关重要。我们为我们的核心团队和贡献者感到非常自豪——他们辛勤工作,并交付了成果!让我们仔细看看它。
新分词器
分词器就像 Meilisearch 的大脑:它理解语言的工作方式,并相应地调整文档在 Meilisearch 中的存储方式。没有分词器,我们就无法知道一个词的开始和结束位置。我们也无法理解用户在执行搜索时想要查找什么。
更仔细地看
分词器的作用是根据语言的特性,查找并提取字符串中的所有词语。每种语言都需要独特的处理过程。例如:
- 在拉丁语系语言中,词语通常由空格分隔。
- 在中文中,分词则更为复杂。
Meilisearch 的新分词器会逐字段进行处理,确定该字段最可能的语言,并为每种语言运行不同的处理流程。由于分词器是模块化的,因此添加新语言比以前容易得多。
对于拉丁语系字母(如英语),新分词器可能感觉不到明显差异,但对于我们的中文用户来说,体验应该会有显著改善。
Meilisearch 在中文方面的演进
以前,分词器将一个汉字视为一个词。新分词器:
- 识别由一个或多个字符组成的中文词语。
- 更准确地评估匹配查询词之间的距离(参见:邻近规则)。
- 积极提升搜索相关性.
- 现在,单个搜索查询会返回繁体和简体中文的结果。
增加最大负载大小
在 Meilisearch 的早期版本中,文档负载的默认限制为10MB。我们将此限制增加到100MB。当然,您仍然可以更改此限制。
$ ./meilisearch --http-payload-size-limit=209715200 # Change limit to 200MB
Bug 修复
- 即使属性已首先添加到
attributesForFaceting
中,Meilisearch 现在也能正确地将属性添加到searchableAttributes
中。 - 属性现在会按照它们出现的顺序被添加到
searchableAttributes
中,正如预期。 - 当未设置要显示的属性时,Meilisearch 会返回一个空对象 ``,而不是错误。
其他更改
- 我们对测试套件进行了一些修改。
- 转储测试现在可以并行运行.
- 大多数依赖项都已更新。
有关具体更改和提交列表,请查看发行说明。
贡献
我们很幸运能拥有这个令人惊叹的支持性社区。
特别感谢:
- @piaoger 参与了新分词器的 Beta 测试。
- @woshilapin 改进了 CI。
- @sanders41 增加了默认负载大小。
我们还要感谢所有贡献者,是他们帮助维护了使 Meilisearch 更易于使用的工具包。
您的参与对我们意义重大!💜
💬 参与进来!
我们总是渴望听到用户和贡献者的建议!请通过您喜欢的方式与我们交流:
🚀 祝您编程愉快!