遥测

    美利搜从用户处收集匿名数据以改进我们的产品。这可以随时停用,并且已收集的任何数据都可以根据请求删除

    我们使用什么工具来收集和可视化数据?

    我们使用Segment,一个数据收集和管理平台,来收集使用数据。然后我们将数据输入Amplitude,图表和突出显示数据的工具,以便我们可以根据需要构建可视化效果。

    我们收集哪类的数据?

    我们的数据收集关注下列类别

    请参见我们当前收集的所有指标的完整列表

    我们永远不会

    为何收集遥测数据?

    我们仅出于两个原因收集遥测数据,以便我们可以改进我们的产品以及我们可以继续全职处理该项目。

    为了创造更好的产品,我们需要可靠的定量信息。我们收集的数据帮助我们修复错误、评估功能的成功并更好地了解用户的需求。

    我们还需要证明人们实际上正在使用美利搜。使用指标帮助我们向投资者证明我们的存在,以便我们可以使该项目继续进行下去。

    您为何应该相信我们?

    不要信任我们,要对我们负责。我们认为,当涉及到你的私人数据时,不信任科技公司是明智之举。这就是为什么我们努力保持关于我们数据收集的完全透明性、提供退出选项,并允许用户随时请求删除其所有收集的数据。在没有全球数据保护法的情况下,我们相信这是处理数据收集的唯一合乎道德的方式。

    没有一家公司是完美的。如果你感觉我们有一丝不透明或收集侵犯你个人隐私的数据,请通过发送电子邮件至我们专门的帐户告知我们:[email protected]。类似地,如果你发现与我们相关的某个数据权利倡议或数据保护工具,请与我们分享。我们对该主题充满热情,并非常重视它。

    如何禁用数据收集

    可以通过设置命令行选项或环境变量,然后重新启动 Meilisearch 实例,随时禁用数据收集。

    meilisearch --no-analytics
    

    有关配置 Meilisearch 的更多信息,请阅读我们的配置参考

    如何删除所有收集的数据

    我们,Meilisearch 团队,提供了一个电子邮件地址,以便用户请求从我们所有工具中完全删除其数据。

    为此,请发送一封电子邮件到 [email protected],其中包含为你的 Meilisearch 安装生成的唯一标识符(在启动 Meilisearch 时为“实例 UID”)。任何有关我们收集的数据的管理问题也可以发送到此电子邮件地址。

    所有收集数据的详尽列表

    只要触发某个收集部分数据的事件,Meilisearch 不会立即发送数据。相反,它将数据与其他数据捆绑成高达 500kb 的一批。批次要么每小时发送一次,要么在达到 500kb 后发送,以先发生者为准。这样做是为了提高性能并减少网络流量。

    请注意!

    此列表可能会随着 Meilisearch 的每个新版本而更改。这不是因为我们试图耍花招!这是因为当我们添加新功能时,我们需要收集更多的数据点来了解其性能。

    指标名称描述示例
    context.app.versionMeilisearch 的版本号0.23.0
    infos.env--env/MEILI_ENV 的值production
    infos.db_path若指定了 --db-path/MEILI_DB_PATH,则为 true,否则为 falsetrue
    infos.import_dump若指定了 --import-dump,则为 true,否则为 falsetrue
    infos.dump_dir若指定了 --dump-dir/MEILI_DUMP_DIR,则为 true,否则为 falsetrue
    infos.ignore_missing_dump若启用了 --ignore-missing-dump,则为 true,否则为 falsetrue
    infos.ignore_dump_if_db_exists若启用了 --ignore-dump-if-db-exists,则为 true,否则为 falsetrue
    infos.import_snapshot若指定了 --import-snapshot,则为 true,否则为 falsetrue
    infos.schedule_snapshot若启用了计划快照,则为 --schedule_snapshot/MEILI_SCHEDULE_SNAPSHOT 的值,否则为 None86400
    infos.snapshot_dir若指定了 --snapshot-dir/MEILI_SNAPSHOT_DIR,则为 true,否则为 falsetrue
    infos.ignore_missing_snapshot若启用了 --ignore-missing-snapshot,则为 true,否则为 falsetrue
    infos.ignore_snapshot_if_db_exists若启用了 --ignore-snapshot-if-db-exists,则为 true,否则为 falsetrue
    infos.http_addr若指定了 --http-addr/MEILI_HTTP_ADDR,则为 true,否则为 falsetrue
    infos.http_payload_size_limit--http-payload-size-limit/MEILI_HTTP_PAYLOAD_SIZE_LIMIT 的值,单位为字节336042103
    infos.log_level--log-level/MEILI_LOG_LEVEL 的值debug
    infos.max_indexing_memory--max-indexing-memory/MEILI_MAX_INDEXING_MEMORY 的值,单位为字节336042103
    infos.max_indexing_threads--max-indexing-threads/MEILI_MAX_INDEXING_THREADS 的值,为整数4
    infos.log_level--log-level/MEILI_LOG_LEVEL 的值debug
    infos.ssl_auth_path若指定了 --ssl-auth-path/MEILI_SSL_AUTH_PATH,则为 true,否则为 falsefalse
    infos.ssl_cert_path若指定了 --ssl-cert-path/MEILI_SSL_CERT_PATH,则为 true,否则为 falsefalse
    infos.ssl_key_path若指定了 --ssl-key-path/MEILI_SSL_KEY_PATH,则为 true,否则为 falsefalse
    infos.ssl_ocsp_path若指定了 --ssl-ocsp-path/MEILI_SSL_OCSP_PATH,则为 true,否则为 falsefalse
    infos.ssl_require_auth--ssl-require-auth/MEILI_SSL_REQUIRE_AUTH 的值,为布尔值false
    infos.ssl_resumption若指定了 --ssl-resumption/MEILI_SSL_RESUMPTION,则为 true,否则为 falsefalse
    infos.ssl_tickets若指定了 --ssl-tickets/MEILI_SSL_TICKETS,则为 true,否则为 falsefalse
    system.distribution运行 Meilisearch 的发行版Arch Linux
    system.kernel_version运行 Meilisearch 的内核版本5.14.10
    system.cores核心数量24
    system.ram_sizeRAM 总容量。以 KB 为单位16777216
    system.disk_size最大磁盘的总容量。以 Bytes 为单位1048576000
    system.server_provider用户可以通过填充MEILI_SERVER_PROVIDER环境变量来告诉我们 Meilisearch 托管在哪个提供商上。这也由我们的云部署脚本填充,例如,GCP cloud-config.yamlGCP
    stats.database_size数据库大小。以字节表示2621440
    stats.indexes_number索引数2
    start_since_days实例启动以来经过的天数365
    user_agentAPI 调用期间遇到的用户代理头["Meilisearch Ruby (2.1)", "Ruby (3.0)"]
    requests.99th_response_time在最快的 99% 的成功搜索请求中延迟最高57 毫秒
    requests.total_succeeded成功请求的总数3456
    requests.total_failed失败请求的总数24
    requests.total_received收到的搜索请求的总数3480
    requests.total_degraded在达到搜索时间截止后取消的搜索总数100
    requests.total_used_negative_operator使用否定词或否定短语运算符的计数搜索。173
    sort.with_geoPoint如果已指定排序规则_geoPoint,则为true,否则为falsetrue
    sort.avg_criteria_number包含sort参数的所有搜索请求中的平均排序条件数2
    filter.with_geoBoundingBox如果已指定过滤器规则_geoBoundingBox,则为true,否则为falsefalse
    filter.with_geoRadius如果已指定过滤器规则_geoRadius,则为true,否则为falsefalse
    filter.most_used_syntax包含filter参数的所有搜索请求中最常用的过滤器语法字符串
    q.max_terms_numberq参数给出的最高术语数5
    pagination.max_limitlimit参数给出的最高值60
    pagination.max_offsetoffset参数给出的最高值1000
    formatting.max_attributes_to_retrieve要检索的最大属性数量100
    formatting.max_attributes_to_highlight要高亮的最大属性数量100
    formatting.highlight_pre_tag如果已指定highlightPreTag,则为true,否则为falsefalse
    formatting.highlight_post_tag如果已指定highlightPostTag,则为true,否则为falsefalse
    formatting.max_attributes_to_crop要裁剪的最大属性数100
    formatting.crop_length为真,如果指定了 cropLength;否则 为假false
    formatting.crop_marker为真,如果指定了 cropMarker;否则 为假false
    formatting.show_matches_position为真,如果此批中使用了 showMatchesPosition;否则 为假false
    facets.avg_facets_number平均分类面数目10
    primary_key主要键的名称,作为文档添加、文档更新、索引创建或索引更新的一部分被明确设置时;否则 为 nullid
    payload_typeContent-Type 标头中遇到的所有值,包括无效值["application/json", "text/plain", "application/x-ndjson"]
    index_creation为真,如果文档添加或更新请求触发了索引创建;否则 为假true
    ranking_rules.words_positionwords 排名规则的位置(如果存在);否则 为 null1
    ranking_rules.typo_positiontypo 排名规则的位置(如果存在);否则 为 null2
    ranking_rules.proximity_positionproximity 排名规则的位置(如果存在);否则 为 null3
    ranking_rules.attribute_positionattribute 排名规则的位置(如果存在);否则 为 null4
    ranking_rules.sort_positionsort 排名规则的位置5
    ranking_rules.exactness_positionexactness 排名规则的位置(如果存在);否则 为 null6
    ranking_rules.values表示没有自定义升序-降序规则的排名规则的字符串"words, typo, attribute, sort, exactness"
    sortable_attributes.total可排序属性的数量3
    sortable_attributes.has_geo为真,如果 _geo 设置为可排序属性;否则 为假true
    filterable_attributes.total可过滤属性的数量3
    filterable_attributes.has_geo为真,如果 _geo 设置为可过滤属性;否则 为假false
    searchable_attributes.total可搜索属性的数量4
    searchable_attributes.with_wildcard为真,如果 * 指定为可搜索属性;否则 为假false
    per_task_uid为真,如果 uids 用于获取某个任务资源;否则 为假true
    filtered_by_uid为真,如果任务通过 uids 查询参数进行过滤;否则 为假false
    filtered_by_index_uid为真,如果任务通过 indexUids 查询参数进行过滤;否则 为假false
    filtered_by_type为真,如果任务通过 types 查询参数进行过滤;否则 为假false
    filtered_by_status为真,如果任务通过 statuses 查询参数进行过滤;否则 为假false
    filtered_by_canceled_by为真,如果任务通过 canceledBy 查询参数进行过滤;否则 为假false
    filtered_by_before_enqueued_at为真,如果任务通过 beforeEnqueuedAt 查询参数进行过滤;否则 为假false
    filtered_by_after_enqueued_attrue如果任务通过afterEnqueuedAt查询参数进行筛选,否则为falsefalse
    filtered_by_before_started_attrue如果任务通过beforeStartedAt查询参数进行筛选,否则为falsefalse
    filtered_by_after_started_attrue如果任务通过afterStartedAt查询参数进行筛选,否则为falsefalse
    filtered_by_before_finished_attrue如果任务通过beforeFinishedAt查询参数进行筛选,否则为falsefalse
    filtered_by_after_finished_attrue如果任务通过afterFinishedAt查询参数进行筛选,否则为falsefalse
    typo_tolerance.enabledtrue如果启用错别字容忍,否则为falsetrue
    typo_tolerance.disable_on_attributestrue 如果至少为disableOnAttributes定义了一个值,否则为falsefalse
    typo_tolerance.disable_on_wordstrue 如果至少为disableOnWords定义了一个值,否则为falsefalse
    typo_tolerance.min_word_size_for_typos.one_typominWordSizeForTypos.oneTypo参数定义的值5
    typo_tolerance.min_word_size_for_typos.two_typosminWordSizeForTypos.twoTypos参数定义的值9
    pagination.max_total_hitspagination.maxTotalHits属性定义的值1000
    faceting.max_values_per_facetfaceting.maxValuesPerFacet属性定义的值100
    distinct_attribute.settrue 如果指定了一个字段名,否则为falsefalse
    distinct布尔值,指示是否在聚合的请求列表中指定了 distinct。true
    proximity_precision.settrue 如果设置已手动设置,否则为falsefalse
    proximity_precision.value按单词按属性按单词
    displayed_attributes.total显示的属性数3
    displayed_attributes.with_wildcardtrue 如果*指定为显示的属性,否则为falsefalse
    stop_words.total停止词数3
    separator_tokens.total分隔符令牌数3
    non_separator_tokens.total非分隔符令牌数3
    dictionary.total词典中的单词数3
    synonyms.total同义词数3
    per_index_uidtrue 如果uid用于获取索引统计资源,否则为falsefalse
    searches.avg_search_count聚合事件每次调用接收到的平均搜索查询数4.2
    searches.total_search_count聚合事件接收到的搜索查询总数16023
    indexes.avg_distinct_index_count聚合事件每次调用接收到的平均查询索引数1.2
    indexes.total_distinct_index_count聚合事件的索引查询总数6023
    indexes.total_single_index仅查询一个索引时的总调用次数2007
    matching_strategy.most_used_strategy最常用的单词匹配策略last
    infos.with_configuration_file若是使用配置文件启动实例,则为 true,否则为 falsefalse
    infos.experimental_contains_filter若是启用 containsFilter 试验功能,则为 truefalse
    infos.experimental_edit_documents_by_function若是启用 editDocumentsByFunction 试验功能,则为 truefalse
    infos.experimental_enable_metrics若是指定 --experimental-enable-metrics/MEILI_EXPERIMENTAL_ENABLE_METRICS,则为 true,否则为 falsefalse
    infos.experimental_replication_parameters若是启动时指定 --experimental-replication-parameters/MEILI_EXPERIMENTAL_REPLICATION_PARAMETERS,则为 true,否则为 falsefalse
    infos.experimental_reduce_indexing_memory_usage若是启动时指定 --experimental-reduce-indexing-memory-usage/MEILI_EXPERIMENTAL_REDUCE_INDEXING_MEMORY_USAGE,则为 true,否则为 falsefalse
    infos.experimental_logs_mode根据指定的值,为 humanjsonhuman
    infos.experimental_enable_logs_route若是启动时指定 --experimental-enable-logs-route/MEILI_EXPERIMENTAL_ENABLE_LOGS_ROUTE,则为 true,否则为 falsefalse
    infos.gpu_enabled若是 Meilisearch 在编译时具备 CUDA 支持,则为 true,否则为 falsefalse
    swap_operation_number交换操作次数2
    pagination.most_used_navigation最常用的搜索结果导航estimated
    per_document_id若是使用端点 DELETE /indexes/:indexUid/documents/:documentUid,则为 true,否则为 falsefalse
    per_filter若是使用端点 POST /indexes/:indexUid/documents/fetchGET /indexes/:indexUid/documents/POST /indexes/:indexUid/documents/delete,则为 true,否则为 falsefalse
    clear_all若是使用端点 DELETE /indexes/:indexUid/documents,则为 true,否则为 falsefalse
    per_batch若是使用端点 POST /indexes/:indexUid/documents/delete-batch,则为 true,否则为 falsefalse
    facets.total_distinct_facet_count总共查询聚合事件的唯一 facet 数false
    facets.additional_search_parameters_provided若是为聚合事件提供其他搜索参数,则为 true,否则为 falsefalse
    faceting.sort_facet_values_by_star_count若是设置所有字段按数量排序,则为 true,否则为 falsefalse
    faceting.sort_facet_values_by_total设置的不同值数量10
    scoring.show_ranking_score若是聚合事件中使用 showRankingScore,则为 true,否则为 falsetrue
    scoring.show_ranking_score_details若是聚合事件中使用 showRankingScoreDetails,则为 true,否则为 falsetrue
    scoring.ranking_score_threshold指示是否在聚合请求列表中指定 rankingScoreThreshold 的 Boolean 值true
    vector_store若是启用 vector store 功能,则为 true,否则为 falsetrue
    attributes_to_search_on.total_number_of_uses若是启用 vector store 功能,则为 true,否则为 falsetrue
    vector.max_vector_size此批中对 vector 参数给出的最高维度数1536
    vector.retrieve_vectors如果此批中使用了 retrieve_vectors 参数,则为 true。false
    hybrid.enabled如果聚合事件中使用了混合搜索,则为 true,否则为 falsetrue
    hybrid.semantic_ratio如果此批中使用了 semanticRatio,则为 true,否则为 falsefalse
    hybrid.embedder如果此批中使用了特定嵌入器,则为 true,否则为 falsetrue
    embedders.total定义的嵌入器数2
    embedders.sources表示不同已提供数据源的数组[”huggingFace”, “userProvided”]
    embedders.document_template_used表示提供的嵌入器之一是否有自定义模版定义的布尔值true
    infos.task_queue_webhook如果实例以任务队列 webhook 启动,则为 true,否则为 falsefalse
    infos.experimental_search_queue_size搜索队列大小750
    locales/search/settings 路由中使用的语言列表[”fra”, “eng”]
    federation.use_federation如果上一次聚合中至少有一个多搜索请求包含一个非空顶层联合对象,则为 truefalse