前往首页Meilisearch 的标志
返回文章
2023年9月4日

隆重推出文档爬虫 — Meilisearch Cloud

隆重推出文档爬虫,帮助用户将其搜索功能集成到文档中

Carolina Ferreira
Carolina FerreiraMeilisearch 开发者布道师@CarolainFG
Introducing Documentation Crawler — Meilisearch Cloud

在这个信息爆炸的时代,文档的效率不仅取决于其质量,还取决于用户能多快地找到他们正在寻找的内容。通过增强文档的高级搜索功能,可以显著提升用户体验。

Meilisearch Cloud 的文档爬虫正提供此功能,它弥合了海量内容与用户友好型搜索功能之间的鸿沟。

什么是爬虫?

网络爬虫,有时被称为“蜘蛛”或“机器人”,是一种数字工具,它在广阔的互联网上漫游,为搜索引擎索引和编目内容。这确保了在用户搜索时,最相关的信息能呈现给他们。

什么是 Meilisearch 的文档爬虫?

Meilisearch 的文档爬虫不仅仅是一个传统的爬虫;它还充当一个高效的抓取工具。在从网页提取重要数据的同时,它也尊重文档固有的结构,确保精确和结构化的索引。

此系统允许用户将搜索功能集成到他们的文档中,确保其受众能够快速找到所需信息。

如何使用文档爬虫?

使用文档爬虫非常简单;只需一个 Meilisearch Cloud 项目和您现有文档的 URL。

设置您的项目

首先,您需要在 Meilisearch Cloud 中运行一个项目。创建项目后,导航到您项目的索引列表并创建一个新索引。

Step 1 of Create Index form: Enter the index name.

抓取您的内容

当提示您导入文档时,选择“文档爬虫”。

Step 2 of Create Index form: Import documents via crawler or file upload.

然后,输入或粘贴您的文档 URL,并点击“下一步”。

Step 2 of Create Index form: Import documents using a crawler by pasting the website URL

点击“运行”开始抓取您的文档内容,并将其推送到 Meilisearch 实例中。此过程可能需要几分钟。

Setup interface for the Crawler with a 'Run' button.

抓取后验证

一旦状态更新为“就绪”,您可以返回到您的项目概览并访问“搜索预览”。点击项目 URL 或从顶部菜单选择“预览搜索”选项。

Project overview

执行几次搜索,确保您的文档已正确索引。此步骤对于理解文档的模式特别有用。

Search preview displaying results for the query 'releva' with highlighted matches.

将搜索栏添加到您的文档中

使用 Meilisearch 文档爬虫成功索引文档后,提升用户体验的下一步是将搜索栏集成到您的文档中。

返回您的项目并导航到索引设置。在那里,选择“工具”选项卡,然后选择“爬虫”。这将显示爬虫设置和相关资源。

Setup interface for the Crawler with the 'UI starter kit: Doscsearch' option.

UI 快速入门套件只需几行代码即可帮助您将功能性搜索栏添加到文档中。

您现在已完全具备为文档添加无缝搜索体验的能力!

_____

订阅我们的新闻通讯,随时了解最新动态。要了解更多关于 Meilisearch 的未来并帮助塑造它,请查看我们的路线图,并参与我们的产品讨论

如需其他帮助,请加入我们的 Discord 开发者社区。

Meilisearch indexes embeddings 7x faster with binary quantization

Meilisearch 通过二进制量化将嵌入索引速度提高了 7 倍

通过使用向量存储 Arroy 实现二进制量化,在保持搜索相关性和效率的同时,显著减少了大型嵌入的磁盘空间使用和索引时间。

Tamo
Tamo2024年11月29日
How to add AI-powered search to a React app

如何将 AI 驱动的搜索添加到 React 应用中

使用 Meilisearch 的 AI 驱动搜索构建一个 React 电影搜索和推荐应用。

Carolina Ferreira
Carolina Ferreira2024年9月24日
Meilisearch is too slow

Meilisearch 太慢了

在这篇博客文章中,我们探讨了 Meilisearch 文档索引器所需的增强功能。我们将讨论当前的索引引擎、其缺点以及优化性能的新技术。

Clément Renault
Clément Renault2024年8月20日