Meilisearch v1.14 发布啦 ✨ 在我们的博客上阅读更多内容

返回首页Meilisearch's logo
返回文章
2023 年 9 月 4 日

文档爬虫介绍 — Meilisearch Cloud

文档爬虫介绍,帮助用户将搜索功能集成到他们的文档中

Carolina Ferreira
Carolina Ferreira开发者布道师 @ Meilisearch@CarolainFG
Introducing Documentation Crawler — Meilisearch Cloud

在这个信息过载的时代,文档的效率不仅取决于其质量,还取决于用户查找所需内容有多容易。通过高级搜索功能增强您的文档可以显著提升用户体验。

Meilisearch Cloud 的 文档爬虫 正是为此而生,弥合了海量内容和用户友好搜索之间的差距。

什么是爬虫?

网络爬虫,有时被称为“蜘蛛”或“机器人”,是一种数字工具,它在广阔的互联网上漫游,为搜索引擎索引和编目内容。这确保了在用户搜索期间向用户呈现最相关的信息。

什么是 Meilisearch 的文档爬虫?

Meilisearch 的文档爬虫不仅仅是一个传统的爬虫;它还充当高效的网络数据抓取工具。虽然它从网页中提取重要数据,但它同时尊重文档的内在结构,确保精确和结构化的索引。

该系统允许用户将 搜索功能 集成到他们的文档中,确保他们的受众可以快速找到他们需要的信息。

如何使用文档爬虫?

使用文档爬虫轻而易举;它只需要一个 Meilisearch Cloud 项目和您现有文档的 URL。

设置您的项目

首先,您需要在 Meilisearch Cloud 中运行一个项目。创建项目后,导航到项目的索引列表并创建一个新索引。

Step 1 of Create Index form: Enter the index name.

抓取您的内容

当提示导入文档时,选择“文档爬虫”。

Step 2 of Create Index form: Import documents via crawler or file upload.

然后,输入或粘贴您的文档 URL,然后单击“下一步”。

Step 2 of Create Index form: Import documents using a crawler by pasting the website URL

单击“运行”以开始抓取您的文档内容并将其推送到 Meilisearch 实例中。此过程可能需要几分钟。

Setup interface for the Crawler with a 'Run' button.

爬取后验证

一旦状态更新为“就绪”,您可以返回到项目的概览并访问“搜索预览”。单击项目的 URL 或从顶部菜单中选择“预览搜索”选项。

Project overview

执行一些搜索以确保您的文档已正确索引。此步骤对于理解文档的模式尤其有用。

Search preview displaying results for the query 'releva' with highlighted matches.

向您的文档添加搜索栏

使用 Meilisearch 的文档爬虫成功索引文档后,增强用户体验的下一步是将搜索栏集成到您的文档中。

返回您的项目并导航到索引设置。从那里,选择“工具”选项卡,然后选择“爬虫”。这将显示爬虫设置和相关资源。

Setup interface for the Crawler with the 'UI starter kit: Doscsearch' option.

UI 入门套件 帮助您只需几行代码即可向文档添加功能性搜索栏。

您现在已完全准备好为您的文档添加无缝搜索体验!

_____

订阅我们的新闻资讯,随时了解最新动态。要了解有关 Meilisearch 未来并帮助塑造它的更多信息,请查看我们的路线图并参与我们的产品讨论

如有任何其他问题,请加入我们在 Discord 上的开发者社区。

Meilisearch indexes embeddings 7x faster with binary quantization

Meilisearch 通过二元量化将嵌入向量索引速度提升 7 倍

通过使用向量存储 Arroy 实施二元量化,在保持搜索相关性和效率的同时,大幅减少了大型嵌入向量的磁盘空间使用量和索引时间。

Tamo
Tamo2024 年 11 月 29 日
How to add AI-powered search to a React app

如何在 React 应用中添加 AI 驱动的搜索功能

使用 Meilisearch 的 AI 驱动搜索构建一个 React 电影搜索和推荐应用。

Carolina Ferreira
Carolina Ferreira2024 年 9 月 24 日
Meilisearch is too slow

Meilisearch 速度太慢了

在这篇博文中,我们将探讨 Meilisearch 文档索引器所需的增强功能。我们将讨论当前的索引引擎、其缺点以及优化性能的新技术。

Clément Renault
Clément Renault2024 年 8 月 20 日