Meilisearch v1.14 发布啦 ✨ 在我们的博客上阅读更多内容

转到主页Meilisearch 的标志
返回文章
2023 年 3 月 20 日

Minoru Osuka:主要语言贡献者的视角

加入我们,参与我们与主要语言支持贡献者 Minoru 的首次 Meilistar 访谈。

Carolina Ferreira
Carolina Ferreira开发者布道师 @ Meilisearch@CarolainFG
Minoru Osuka: POV of a main language contributor

今年,我们启动了 Meilisearch 的首个贡献者计划:Meilistars。贡献者计划的目的是聚集顶级社区贡献者并培养我们的关系,突出他们产生的出色工作,甚至可能帮助建立联系。我们目前不会深入探讨这个话题,因为我们希望在专门的博客文章中分享更多信息,敬请关注!

作为一项旨在 spotlight 我们优秀社区成员的倡议,我们询问他们是否有兴趣参加一系列访谈,以便我们更好地了解他们。

我们正在启动对 Minoru Osuka 的采访。您可能已经在 GitHub 上以 Mosuka 的身份见过他,或者在 Twitter 上以 @minoru_osuka 的身份见过他。

让我们一起听听更多关于他的信息!

认识 Minoru

首先,我们请他用自己的话介绍一下自己!

“我是 Minoru Osuka。我是一家在日本提供职位搜索引擎的公司的软件工程师和技术主管。我主要参与搜索平台开发。我的爱好是软件开发,我发布了一些我开发的软件作为 GitHub 上的 OSS。”

Minoru 不仅从事技术工作,而且他还将其视为自己的爱好!我们非常好奇想知道他是如何进入技术领域的。

Minoru 解释说,他最初在一所技术学校担任编程讲师,但他希望增加他的实践经验,并决定加入一家软件开发公司。

“这是我作为软件开发人员职业生涯的开始。当我在工作中使用了搜索引擎后,我对它们的工作原理产生了兴趣,所以我搬到了一个互联网门户网站,并一直在搜索引擎领域工作至今。”

Minoru + Meiliseach:这是命中注定的

听到 Minoru 实际上从事搜索引擎工作,我们忍不住想问他是什么时候听说 Meilisearch 的,以及他是如何开始使用它的。

“大约是 2022 年 5 月,当时 Meilisearch 开始支持日语。Meilisearch 使用日语形态分析器 Lindera 作为他们的日语分词器。我维护着 Lindera,所以这是一件非常幸运的事情。”

Minoru 非常感谢 KinationMiiton,他们分别创建了 第一个 pull request,以在 Meilisearch 中添加日语语言支持并实现了它。正是由于他们的共同努力,Meilisearch 的日语支持才发展到今天的水平。

“我还没有真正在我的工作中使用 Meilisearch,但是 voluntas 介绍了 一个使用 Meilisearch 的案例研究,用于他们的日语文档搜索服务,这引起了很多关注。”

骨子里的开源精神

Minoru 在采访中频繁提及 Meilisearch 社区的其他成员,这太重要了,不容忽视。他对有机会与其他社区成员建立联系表示非常满意。

“自从 Meilisearch 采用 Lindera 以来,我的 Twitter 粉丝数量有所增加。我很高兴认识他们。我非常感谢 Meilisearch。”

Minoru 如此深入地参与开源社区真是太了不起了。除了为 Meilisearch 做出贡献和维护 Lindera 之外,他还构建了自己的 分布式搜索服务器

“我长期以来一直使用 Elasticsearch 和 Solr,但是使用它们对我来说还不够,所以我决定构建一个分布式搜索服务器,同时也学习 Rust。这很艰难,但我学到了很多东西。”

奇怪的是,正是这个项目促使他维护 Lindera

“我开始研究 Lindera 是因为我自己开发了一个分布式搜索服务器。[...] 我的朋友,他正在开发一个全文搜索库,也开发了一个日语形态分析器,但它没有在 crates.io 上注册。当我联系他,看看他是否会在 crates.io 上注册它时,他给了我一个令人惊讶的答案:“我想让你接管这个项目。”我对形态分析器也很感兴趣,所以我决定接管开发。”

Minoru 还感谢 fulmicotonkuromoji-rs 的开发者,kuromoji-rs 是最终演变成 Lindera 的原始软件,他将其描述为“一个很棒的 OSS”。

对未来的展望

鉴于他的广泛贡献,Minoru 对 Meilisearch 了如指掌也就不足为奇了。它最直接的可用性是 Minoru 最看重的。实际上,他特别看重有助于这种可访问性的特定功能。

“Meilisearch 的自动检测索引文档是用哪种语言编写的功能非常棒。对于不熟悉搜索引擎的用户来说,这是一个非常有用的功能。”

在我们与 Minoru 的对话中,我们没有错过机会,询问他对 Meilisearch 近期未来希望看到的任何改进。毫不奇怪,他的建议集中在语言支持上。具体来说,他建议实施一种机制,在对字符进行分词之前对其进行规范化。

对于那些不熟悉该过程的人来说,目前的情况正好相反。文本被分词——分割成单词——然后,根据语言的特殊性对每个单词进行规范化。对于像法语这样的罗曼语,此过程包括小写化和删除变音符号,例如重音符号或任何不影响文本含义的符号。对于那些对该主题感兴趣的人,您可以加入 GitHub 上的讨论 GitHub阅读更多关于我们如何处理语言支持的信息。

Minoru 关于语言支持的建议包括为每个字段自定义规范化器。假设有一个包含地址字段的文档,他希望能够指示 Meilisearch 将地址字段中的汉字数字转换为阿拉伯数字。用他的话说

“目前,Meilisearch 没有日语规范化器,但如果能够为每个字段自定义它是很不错的 [...] 我也希望为日语规范化器做出贡献。”

我们期待与 Minoru 以及任何希望支持我们工作的语言爱好者一起改进我们的语言支持!

与 Minoru 交谈,更好地了解他,并了解他对 Meilisearch、他的使用以及他通过它结识的人们的见解,真是一种享受。

提醒一下,您可以在 GitHub 上找到 Minoru 或为 Lindera 做出贡献。
我们希望您像我们一样觉得这次采访很有趣,并期待与我们所有令人难以置信的 Meilistars 会面。

TutKit's journey with Meilisearch: powering multilingual learning at scale.

TutKit 与 Meilisearch 的旅程:大规模地为多语言学习提供支持。

借助 Meilisearch,Tutkit.com 扩展了其学习平台,以处理跨 26 种语言的 15,000 多种资源的搜索。

Maya Shin
Maya Shin2024 年 10 月 30 日
Vishal Sodani: POV of a Hacktoberfest contributor

Vishal Sodani:Hacktoberfest 贡献者的视角

今天,我们与 Vishal Sodani 坐在一起,他是一位贡献者,去年 Hacktoberfest 期间首次加入我们。

Carolina Ferreira
Carolina Ferreira2023 年 7 月 24 日
Miiton: a master of Japanese has entered the fight!

Miiton:日语大师加入了战斗!

今天,我们很高兴与 Miiton 坐在一起,他是一位经验丰富的贡献者,致力于改进日语支持

Carolina Ferreira
Carolina Ferreira2023 年 7 月 17 日