From 9700b1ce7f4e87c1f8f2c700a0a626a1b0684f2a Mon Sep 17 00:00:00 2001 From: Abby <78209557+abby-cyber@users.noreply.github.com> Date: Wed, 25 May 2022 15:05:10 +0800 Subject: [PATCH] metric updates --- .../1.query-performance-metrics.md | 82 ++++++-- .../7.monitor-parameter.md | 197 ++++++++++++------ .../nebula-dashboard/6.monitor-parameter.md | 195 +++++++++++------ 3 files changed, 340 insertions(+), 134 deletions(-) diff --git a/docs-2.0/6.monitor-and-metrics/1.query-performance-metrics.md b/docs-2.0/6.monitor-and-metrics/1.query-performance-metrics.md index 6ef51be8501..d8c494dd22a 100644 --- a/docs-2.0/6.monitor-and-metrics/1.query-performance-metrics.md +++ b/docs-2.0/6.monitor-and-metrics/1.query-performance-metrics.md @@ -145,8 +145,16 @@ curl -G "http://:/stats?stats= [&format=json]" | `num_heartbeats` | 心跳次数。 | | `num_raft_votes` | Raft 协议中投票的次数。 | | `transfer_leader_latency_us` | Raft 协议中转移 Leader 的延迟时间。 | -| `num_agent_heartbeats` | AgentHBProcessor 心跳次数。| -| `agent_heartbeat_latency_us` | AgentHBProcessor 延迟时间。| +| `num_agent_heartbeats` | AgentHBProcessor 心跳次数。| +| `agent_heartbeat_latency_us` | AgentHBProcessor 延迟时间。| +| `replicate_log_latency_us` | Raft 复制日志至大多数节点的延迟。 | +| `num_send_snapshot` | Raft 发送快照至其他节点的次数。 | +| `append_log_latency_us` | Raft 复制日志到单个节点的延迟。 | +| `append_wal_latency_us` | Raft 写入单条 WAL 的延迟。 | +| `num_grant_votes` | Raft 投票给其他节点的次数。 | +| `num_start_elect` | Raft 发起投票的次数。 | + + ### Storage @@ -172,7 +180,7 @@ curl -G "http://:/stats?stats= [&format=json]" | `num_vertices_deleted` | 删除的点数量。 | | `num_vertices_inserted` | 插入的点数量。 | | `transfer_leader_latency_us` | Raft 协议中转移 Leader 的延迟时间。 | -| `lookup_latency_us` | LookupProcessor 执行的延迟时间。 | +| `lookup_latency_us` | LookupProcessor 执行的延迟时间。 | | `num_lookup_errors` | LookupProcessor 执行时出错的次数。| | `num_scan_vertex` | ScanVertexProcessor 执行的次数。| | `num_scan_vertex_errors` | ScanVertexProcessor 执行时出错的次数。| @@ -189,22 +197,62 @@ curl -G "http://:/stats?stats= [&format=json]" | `num_kv_remove_errors` | RemoveProcessor 执行出错次数。| | `num_kv_remove` | RemoveProcessor 执行次数。| | `forward_tranx_latency_us` | 传输平均延迟时间。| +| `scan_edge_latency_us` | ScanEdgeProcessor 执行的延迟时间。 | +| `num_scan_edge_errors` | ScanEdgeProcessor 执行时出错的次数。 | +| `num_scan_edge` | ScanEdgeProcessor 执行的次数。 | +| `scan_vertex_latency_us` | ScanVertexProcessor 执行的延迟时间。 | +| `num_add_edges` | 添加边的次数。 | +| `num_add_edges_errors` | 添加边时出错的次数。 | +| `num_add_vertices` | 添加点的次数。 | +| `num_start_elect` | Raft 发起投票的次数 | +| `num_add_vertices_errors` | 添加点时出错的次数。 | +| `num_delete_vertices_errors` | 删除点时出错的次数。 | +| `append_log_latency_us` | Raft 复制日志到单个节点的延迟。 | +| `num_grant_votes` | Raft 投票给其他节点的次数。 | +| `replicate_log_latency_us` | Raft 复制日志到大多数节点的延迟。 | +| `num_delete_tags` | 删除 Tag 的次数。 | +| `num_delete_tags_errors` | 删除 Tag 时出错的次数。 | +| `num_delete_edges` | 删除边的次数。 | +| `num_delete_edges_errors` | 删除边时出错的次数。 | +| `num_send_snapshot` | 发送快照的次数。 | +| `update_vertex_latency_us` | UpdateVertexProcessor 执行的延迟时间。 | +| `append_wal_latency_us` | Raft 写入单条 WAL 的延迟。 | +| `num_update_edge` | UpdateEdgeProcessor 执行的次数。 | +| `delete_tags_latency_us` | 删除 Tag 的平均延迟时间。 | +| `num_update_edge_errors` | UpdateEdgeProcessor 执行时出错的次数。 | +| `num_get_neighbors` | GetNeighborsProcessor 执行的次数。 | +| `num_get_prop_errors` | GetPropProcessor 执行时出错的次数。 | +| `num_delete_vertices` | 删除点的次数。 | +| `num_lookup` | LookupProcessor 执行的次数。 | + + + + ### 图空间级别监控指标 | 参数 | 说明 | | ---------------------------------------------- | ----------------------------------------- | -| `num_active_queries` | 当前正在执行的查询数。 | -| `num_queries` | 查询次数。 | -| `num_sentences` | Graphd 服务接收的语句数。 | -| `optimizer_latency_us` | 优化器阶段延迟时间。 | -| `query_latency_us` | 查询平均延迟时间。 | -| `num_slow_queries` | 慢查询次数。 | -| `num_query_errors` | 查询报错语句数量。| -| `num_query_errors_leader_changes` | 因查询错误而导致的 Leader 变更的次数。 | -| `num_killed_queries` | 被终止的查询数量。 | -| `num_aggregate_executors` | 聚合(Aggregate)算子执行时间。 | -| `num_sort_executors` | 排序(Sort)算子执行时间。 | -| `num_indexscan_executors` | 索引扫描(IndexScan)算子执行时间。 | -| `num_oom_queries` | 导致内存耗尽的语句数量。| - +| `num_active_queries` | 当前正在执行的查询数。 | +| `num_queries` | 查询次数。 | +| `num_sentences` | Graphd 服务接收的语句数。 | +| `optimizer_latency_us` | 优化器阶段延迟时间。 | +| `query_latency_us` | 查询平均延迟时间。 | +| `num_slow_queries` | 慢查询次数。 | +| `num_query_errors` | 查询报错语句数量。| +| `num_query_errors_leader_changes` | 因查询错误而导致的 Leader 变更的次数。 | +| `num_killed_queries` | 被终止的查询数量。 | +| `num_aggregate_executors` | 聚合(Aggregate)算子执行时间。 | +| `num_sort_executors` | 排序(Sort)算子执行时间。 | +| `num_indexscan_executors` | 索引扫描(IndexScan)算子执行时间。 | +| `num_oom_queries` | 导致内存耗尽的语句数量。| +| `num_auth_failed_sessions_bad_username_password` | 因用户名密码错误导验证失败的会话数量。 | +| `num_auth_failed_sessions` | 登录验证失败的会话数量。 | +| `num_opened_sessions` | 服务端建立过的会话数量。 | +| `num_queries_hit_memory_watermark` | 达到内存水位线的语句的数量。 | +| `num_reclaimed_expired_sessions` | 服务端主动回收的过期的会话数量。 | +| `num_rpc_sent_to_metad_failed` | Graphd 服务发给 Metad 的 RPC 请求失败的数量。 | +| `num_rpc_sent_to_metad` | Graphd 服务发给 Metad 服务的 RPC 请求数量。 | +| `num_rpc_sent_to_storaged_failed` | Graphd 服务发给 Storaged 服务的 RPC 请求失败的数量。 | +| `num_rpc_sent_to_storaged` | Graphd 服务发给 Storaged 服务的 RPC 请求数量。 | +| `slow_query_latency_us` | 慢查询平均延迟时间。 | \ No newline at end of file diff --git a/docs-2.0/nebula-dashboard-ent/7.monitor-parameter.md b/docs-2.0/nebula-dashboard-ent/7.monitor-parameter.md index 99da74138f2..1117b700714 100644 --- a/docs-2.0/nebula-dashboard-ent/7.monitor-parameter.md +++ b/docs-2.0/nebula-dashboard-ent/7.monitor-parameter.md @@ -77,79 +77,158 @@ |`P99`| 周期内响应耗时从小到大排列,顺序处于 99% 位置的分位数值。| |`P999`| 周期内响应耗时从小到大排列,顺序处于 99.9% 位置的分位数值。| + +!!! note + + 以下为 Dashboard 获取内核的全量指标,但 Dashboard 仅展示重要的指标。 + ### Graph | 参数 | 说明 | | ---------------------------------------------- | ----------------------------------------- | -| num_active_queries | 当前正在执行的查询数。 | -| num_active_sessions | 当前活跃的会话数量。 | -| num_aggregate_executors | 聚合(Aggregate)算子执行时间。 | -| num_auth_failed_sessions_bad_username_password | 因用户名密码错误导验证失败的会话数量。 | -| num_auth_failed_sessions | 登录验证失败的会话数量。 | -| num_indexscan_executors | 索引扫描(IndexScan)算子执行时间。 | -| num_killed_queries | 被终止的查询数量。 | -| num_opened_sessions | 服务端建立过的会话数量。 | -| num_queries | 查询次数。 | -| num_query_errors_leader_changes | 因查询错误而导致的 Leader 变更的次数。 | -| num_query_errors | 查询错误次数。 | -| num_reclaimed_expired_sessions | 服务端主动回收的过期的会话数量。 | -| num_rpc_sent_to_metad_failed | Graphd 服务发给 Metad 的 RPC 请求失败的数量。 | -| num_rpc_sent_to_metad | Graphd 服务发给 Metad 服务的 RPC 请求数量。 | -| num_rpc_sent_to_storaged_failed | Graphd 服务发给 Storaged 服务的 RPC 请求失败的数量。 | -| num_rpc_sent_to_storaged | Graphd 服务发给 Storaged 服务的 RPC 请求数量。 | -| num_sentences | Graphd 服务接收的语句数。 | -| num_slow_queries | 慢查询次数。 | -| num_sort_executors | 排序(Sort)算子执行时间。 | -| optimizer_latency_us | 优化器阶段延时。 | -| query_latency_us | 查询平均延迟时间。 | -| slow_query_latency_us | 慢查询平均延迟时间。 | +| `num_active_queries` | 当前正在执行的查询数。 | +| `num_active_sessions` | 当前活跃的会话数量。 | +| `num_aggregate_executors` | 聚合(Aggregate)算子执行时间。 | +| `num_auth_failed_sessions_bad_username_password` | 因用户名密码错误导验证失败的会话数量。 | +| `num_auth_failed_sessions_out_of_max_allowed` | 因为超过`FLAG_OUT_OF_MAX_ALLOWED_CONNECTIONS`参数导致的验证登录的失败的 session 数量。| +| `num_auth_failed_sessions` | 登录验证失败的会话数量。 | +| `num_indexscan_executors` | 索引扫描(IndexScan)算子执行时间。 | +| `num_killed_queries` | 被终止的查询数量。 | +| `num_opened_sessions` | 服务端建立过的会话数量。 | +| `num_queries` | 查询次数。 | +| `num_query_errors_leader_changes` | 因查询错误而导致的 Leader 变更的次数。 | +| `num_query_errors` | 查询错误次数。 | +| `num_reclaimed_expired_sessions` | 服务端主动回收的过期的会话数量。 | +| `num_rpc_sent_to_metad_failed` | Graphd 服务发给 Metad 的 RPC 请求失败的数量。 | +| `num_rpc_sent_to_metad` | Graphd 服务发给 Metad 服务的 RPC 请求数量。 | +| `num_rpc_sent_to_storaged_failed` | Graphd 服务发给 Storaged 服务的 RPC 请求失败的数量。 | +| `num_rpc_sent_to_storaged` | Graphd 服务发给 Storaged 服务的 RPC 请求数量。 | +| `num_sentences` | Graphd 服务接收的语句数。 | +| `num_slow_queries` | 慢查询次数。 | +| `num_sort_executors` | 排序(Sort)算子执行时间。 | +| `optimizer_latency_us` | 优化器阶段延迟时间。 | +| `query_latency_us` | 查询平均延迟时间。 | +| `slow_query_latency_us` | 慢查询平均延迟时间。 | +| `num_queries_hit_memory_watermark` | 达到内存水位线的语句的数量。 | ### Meta | 参数 | 说明 | | -------------------------- | ----------------------------------- | -| commit_log_latency_us | Raft 协议中 Commit 日志的延迟时间。 | -| commit_snapshot_latency_us | Raft 协议中 Commit 快照的延迟时间。 | -| heartbeat_latency_us | 心跳延迟时间。 | -| num_heartbeats | 心跳次数。 | -| num_raft_votes | Raft 协议中投票的次数。 | -| transfer_leader_latency_us | Raft 协议中转移 Leader 的延迟时间。 | +| `commit_log_latency_us` | Raft 协议中 Commit 日志的延迟时间。 | +| `commit_snapshot_latency_us` | Raft 协议中 Commit 快照的延迟时间。 | +| `heartbeat_latency_us` | 心跳延迟时间。 | +| `num_heartbeats` | 心跳次数。 | +| `num_raft_votes` | Raft 协议中投票的次数。 | +| `transfer_leader_latency_us` | Raft 协议中转移 Leader 的延迟时间。 | +| `num_agent_heartbeats` | AgentHBProcessor 心跳次数。| +| `agent_heartbeat_latency_us` | AgentHBProcessor 延迟时间。| +| `replicate_log_latency_us` | Raft 复制日志至大多数节点的延迟。 | +| `num_send_snapshot` | Raft 发送快照至其他节点的次数。 | +| `append_log_latency_us` | Raft 复制日志到单个节点的延迟。 | +| `append_wal_latency_us` | Raft 写入单条 WAL 的延迟。 | +| `num_grant_votes` | Raft 投票给其他节点的次数。 | +| `num_start_elect` | Raft 发起投票的次数。 | + + ### Storage | 参数 | 说明 | | ---------------------------- | --------------------------------------------------- | -| add_edges_latency_us | 添加边的平均延迟时间。 | -| add_vertices_latency_us | 添加点的平均延迟时间。 | -| commit_log_latency_us | Raft 协议中 Commit 日志的延迟时间。 | -| commit_snapshot_latency_us | Raft 协议中 Commit 快照的延迟时间。 | -| delete_edges_latency_us | 删除边的平均延迟时间。 | -| delete_vertices_latency_us | 删除点的平均延迟时间。 | -| get_neighbors_latency_us | 查询邻居平均延迟时间。 | -| num_edges_deleted | 删除的边数量。 | -| num_edges_inserted | 插入的边数量。 | -| num_raft_votes | Raft 协议中投票的次数。 | -| num_rpc_sent_to_metad_failed | Storaged 服务发给 Metad 服务的 RPC 请求失败的数量。 | -| num_rpc_sent_to_metad | Storaged 服务发给 Metad 服务的 RPC 请求数量。 | -| num_tags_deleted | 删除的 Tag 数量。 | -| num_vertices_deleted | 删除的点数量。 | -| num_vertices_inserted | 插入的点数量。 | -| transfer_leader_latency_us | Raft 协议中转移 Leader 的延迟时间。 | - - -### 图空间 +| `add_edges_atomic_latency_us` | 添加边单次延迟。 | +| `add_edges_latency_us` | 添加边的平均延迟时间。 | +| `add_vertices_latency_us` | 添加点的平均延迟时间。 | +| `commit_log_latency_us` | Raft 协议中 Commit 日志的延迟时间。 | +| `commit_snapshot_latency_us` | Raft 协议中 Commit 快照的延迟时间。 | +| `delete_edges_latency_us` | 删除边的平均延迟时间。 | +| `delete_vertices_latency_us` | 删除点的平均延迟时间。 | +| `get_neighbors_latency_us` | 查询邻居平均延迟时间。 | +| `num_get_prop` | GetPropProcessor 执行的次数。 | +| `num_get_neighbors_errors` | GetNeighborsProcessor 执行出错的次数。 | +| `get_prop_latency_us` | GetPropProcessor 执行的延迟时间。| +| `num_edges_deleted` | 删除的边数量。 | +| `num_edges_inserted` | 插入的边数量。 | +| `num_raft_votes` | Raft 协议中投票的次数。 | +| `num_rpc_sent_to_metad_failed` | Storaged 服务发给 Metad 服务的 RPC 请求失败的数量。 | +| `num_rpc_sent_to_metad` | Storaged 服务发给 Metad 服务的 RPC 请求数量。 | +| `num_tags_deleted` | 删除的 Tag 数量。 | +| `num_vertices_deleted` | 删除的点数量。 | +| `num_vertices_inserted` | 插入的点数量。 | +| `transfer_leader_latency_us` | Raft 协议中转移 Leader 的延迟时间。 | +| `lookup_latency_us` | LookupProcessor 执行的延迟时间。 | +| `num_lookup_errors` | LookupProcessor 执行时出错的次数。| +| `num_scan_vertex` | ScanVertexProcessor 执行的次数。| +| `num_scan_vertex_errors` | ScanVertexProcessor 执行时出错的次数。| +| `update_edge_latency_us` | UpdateEdgeProcessor 执行的延迟时间。| +| `num_update_vertex` | UpdateVertexProcessor 执行的次数。| +| `num_update_vertex_errors` | UpdateVertexProcessor 执行时出错的次数。| +| `kv_get_latency_us` | Getprocessor 的延迟时间。| +| `kv_put_latency_us` | PutProcessor 的延迟时间。| +| `kv_remove_latency_us` | RemoveProcessor 的延迟时间。| +| `num_kv_get_errors` | GetProcessor 执行出错次数。| +| `num_kv_get` | GetProcessor 执行次数。| +| `num_kv_put_errors` | PutProcessor 执行出错次数。| +| `num_kv_put` | PutProcessor 执行次数。| +| `num_kv_remove_errors` | RemoveProcessor 执行出错次数。| +| `num_kv_remove` | RemoveProcessor 执行次数。| +| `forward_tranx_latency_us` | 传输平均延迟时间。| +| `scan_edge_latency_us` | ScanEdgeProcessor 执行的延迟时间。 | +| `num_scan_edge_errors` | ScanEdgeProcessor 执行时出错的次数。 | +| `num_scan_edge` | ScanEdgeProcessor 执行的次数。 | +| `scan_vertex_latency_us` | ScanVertexProcessor 执行的延迟时间。 | +| `num_add_edges` | 添加边的次数。 | +| `num_add_edges_errors` | 添加边时出错的次数。 | +| `num_add_vertices` | 添加点的次数。 | +| `num_start_elect` | Raft 发起投票的次数 | +| `num_add_vertices_errors` | 添加点时出错的次数。 | +| `num_delete_vertices_errors` | 删除点时出错的次数。 | +| `append_log_latency_us` | Raft 复制日志到单个节点的延迟。 | +| `num_grant_votes` | Raft 投票给其他节点的次数。 | +| `replicate_log_latency_us` | Raft 复制日志到大多数节点的延迟。 | +| `num_delete_tags` | 删除 Tag 的次数。 | +| `num_delete_tags_errors` | 删除 Tag 时出错的次数。 | +| `num_delete_edges` | 删除边的次数。 | +| `num_delete_edges_errors` | 删除边时出错的次数。 | +| `num_send_snapshot` | 发送快照的次数。 | +| `update_vertex_latency_us` | UpdateVertexProcessor 执行的延迟时间。 | +| `append_wal_latency_us` | Raft 写入单条 WAL 的延迟。 | +| `num_update_edge` | UpdateEdgeProcessor 执行的次数。 | +| `delete_tags_latency_us` | 删除 Tag 的平均延迟时间。 | +| `num_update_edge_errors` | UpdateEdgeProcessor 执行时出错的次数。 | +| `num_get_neighbors` | GetNeighborsProcessor 执行的次数。 | +| `num_get_prop_errors` | GetPropProcessor 执行时出错的次数。 | +| `num_delete_vertices` | 删除点的次数。 | +| `num_lookup` | LookupProcessor 执行的次数。 | + + + + + +### 图空间级别监控指标 | 参数 | 说明 | | ---------------------------------------------- | ----------------------------------------- | -| num_active_queries | 当前正在执行的查询数。 | -| num_aggregate_executors | 聚合(Aggregate)算子执行时间。 | -| num_indexscan_executors | 索引扫描(IndexScan)算子执行时间。 | -| num_killed_queries | 被终止的查询数量。 | -| num_queries | 查询次数。 | -| num_query_errors_leader_changes | 因查询错误而导致的 Leader 变更的次数。 | -| num_query_errors | 查询错误次数。 | -| num_sentences | Graphd 服务接收的语句数。 | -| num_slow_queries | 慢查询次数。 | -| num_sort_executors | 排序(Sort)算子执行时间。 | -| optimizer_latency_us | 优化器阶段延时。 | -| query_latency_us | 查询平均延迟时间。 | \ No newline at end of file +| `num_active_queries` | 当前正在执行的查询数。 | +| `num_queries` | 查询次数。 | +| `num_sentences` | Graphd 服务接收的语句数。 | +| `optimizer_latency_us` | 优化器阶段延迟时间。 | +| `query_latency_us` | 查询平均延迟时间。 | +| `num_slow_queries` | 慢查询次数。 | +| `num_query_errors` | 查询报错语句数量。| +| `num_query_errors_leader_changes` | 因查询错误而导致的 Leader 变更的次数。 | +| `num_killed_queries` | 被终止的查询数量。 | +| `num_aggregate_executors` | 聚合(Aggregate)算子执行时间。 | +| `num_sort_executors` | 排序(Sort)算子执行时间。 | +| `num_indexscan_executors` | 索引扫描(IndexScan)算子执行时间。 | +| `num_oom_queries` | 导致内存耗尽的语句数量。| +| `num_auth_failed_sessions_bad_username_password` | 因用户名密码错误导验证失败的会话数量。 | +| `num_auth_failed_sessions` | 登录验证失败的会话数量。 | +| `num_opened_sessions` | 服务端建立过的会话数量。 | +| `num_queries_hit_memory_watermark` | 达到内存水位线的语句的数量。 | +| `num_reclaimed_expired_sessions` | 服务端主动回收的过期的会话数量。 | +| `num_rpc_sent_to_metad_failed` | Graphd 服务发给 Metad 的 RPC 请求失败的数量。 | +| `num_rpc_sent_to_metad` | Graphd 服务发给 Metad 服务的 RPC 请求数量。 | +| `num_rpc_sent_to_storaged_failed` | Graphd 服务发给 Storaged 服务的 RPC 请求失败的数量。 | +| `num_rpc_sent_to_storaged` | Graphd 服务发给 Storaged 服务的 RPC 请求数量。 | +| `slow_query_latency_us` | 慢查询平均延迟时间。 | \ No newline at end of file diff --git a/docs-2.0/nebula-dashboard/6.monitor-parameter.md b/docs-2.0/nebula-dashboard/6.monitor-parameter.md index 89fc362b728..4720b6c1fb7 100644 --- a/docs-2.0/nebula-dashboard/6.monitor-parameter.md +++ b/docs-2.0/nebula-dashboard/6.monitor-parameter.md @@ -79,78 +79,157 @@ |`P99`| 周期内响应耗时从小到大排列,顺序处于 99%位置的分位数| |`P999`| 周期内响应耗时从小到大排列,顺序处于 99.9%位置的分位数| + +!!! note + + 以下为 Dashboard 获取内核的全量指标,但 Dashboard 仅展示重要的指标。 + + ### Graph | 参数 | 说明 | | ---------------------------------------------- | ----------------------------------------- | -| num_active_queries | 当前正在执行的查询数。 | -| num_active_sessions | 当前活跃的会话数量。 | -| num_aggregate_executors | 聚合(Aggregate)算子执行时间。 | -| num_auth_failed_sessions_bad_username_password | 因用户名密码错误导验证失败的会话数量。 | -| num_auth_failed_sessions | 登录验证失败的会话数量。 | -| num_indexscan_executors | 索引扫描(IndexScan)算子执行时间。 | -| num_killed_queries | 被终止的查询数量。 | -| num_opened_sessions | 服务端建立过的会话数量。 | -| num_queries | 查询次数。 | -| num_query_errors_leader_changes | 因查询错误而导致的 Leader 变更的次数。 | -| num_query_errors | 查询错误次数。 | -| num_reclaimed_expired_sessions | 服务端主动回收的过期的会话数量。 | -| num_rpc_sent_to_metad_failed | Graphd 服务发给 Metad 的 RPC 请求失败的数量。 | -| num_rpc_sent_to_metad | Graphd 服务发给 Metad 服务的 RPC 请求数量。 | -| num_rpc_sent_to_storaged_failed | Graphd 服务发给 Storaged 服务的 RPC 请求失败的数量。 | -| num_rpc_sent_to_storaged | Graphd 服务发给 Storaged 服务的 RPC 请求数量。 | -| num_sentences | Graphd 服务接收的语句数。 | -| num_slow_queries | 慢查询次数。 | -| num_sort_executors | 排序(Sort)算子执行时间。 | -| optimizer_latency_us | 优化器阶段延时。 | -| query_latency_us | 查询平均延迟时间。 | -| slow_query_latency_us | 慢查询平均延迟时间。 | +| `num_active_queries` | 当前正在执行的查询数。 | +| `num_active_sessions` | 当前活跃的会话数量。 | +| `num_aggregate_executors` | 聚合(Aggregate)算子执行时间。 | +| `num_auth_failed_sessions_bad_username_password` | 因用户名密码错误导验证失败的会话数量。 | +| `num_auth_failed_sessions_out_of_max_allowed` | 因为超过`FLAG_OUT_OF_MAX_ALLOWED_CONNECTIONS`参数导致的验证登录的失败的 session 数量。| +| `num_auth_failed_sessions` | 登录验证失败的会话数量。 | +| `num_indexscan_executors` | 索引扫描(IndexScan)算子执行时间。 | +| `num_killed_queries` | 被终止的查询数量。 | +| `num_opened_sessions` | 服务端建立过的会话数量。 | +| `num_queries` | 查询次数。 | +| `num_query_errors_leader_changes` | 因查询错误而导致的 Leader 变更的次数。 | +| `num_query_errors` | 查询错误次数。 | +| `num_reclaimed_expired_sessions` | 服务端主动回收的过期的会话数量。 | +| `num_rpc_sent_to_metad_failed` | Graphd 服务发给 Metad 的 RPC 请求失败的数量。 | +| `num_rpc_sent_to_metad` | Graphd 服务发给 Metad 服务的 RPC 请求数量。 | +| `num_rpc_sent_to_storaged_failed` | Graphd 服务发给 Storaged 服务的 RPC 请求失败的数量。 | +| `num_rpc_sent_to_storaged` | Graphd 服务发给 Storaged 服务的 RPC 请求数量。 | +| `num_sentences` | Graphd 服务接收的语句数。 | +| `num_slow_queries` | 慢查询次数。 | +| `num_sort_executors` | 排序(Sort)算子执行时间。 | +| `optimizer_latency_us` | 优化器阶段延迟时间。 | +| `query_latency_us` | 查询平均延迟时间。 | +| `slow_query_latency_us` | 慢查询平均延迟时间。 | +| `num_queries_hit_memory_watermark` | 达到内存水位线的语句的数量。 | ### Meta | 参数 | 说明 | | -------------------------- | ----------------------------------- | -| commit_log_latency_us | Raft 协议中 Commit 日志的延迟时间。 | -| commit_snapshot_latency_us | Raft 协议中 Commit 快照的延迟时间。 | -| heartbeat_latency_us | 心跳延迟时间。 | -| num_heartbeats | 心跳次数。 | -| num_raft_votes | Raft 协议中投票的次数。 | -| transfer_leader_latency_us | Raft 协议中转移 Leader 的延迟时间。 | +| `commit_log_latency_us` | Raft 协议中 Commit 日志的延迟时间。 | +| `commit_snapshot_latency_us` | Raft 协议中 Commit 快照的延迟时间。 | +| `heartbeat_latency_us` | 心跳延迟时间。 | +| `num_heartbeats` | 心跳次数。 | +| `num_raft_votes` | Raft 协议中投票的次数。 | +| `transfer_leader_latency_us` | Raft 协议中转移 Leader 的延迟时间。 | +| `num_agent_heartbeats` | AgentHBProcessor 心跳次数。| +| `agent_heartbeat_latency_us` | AgentHBProcessor 延迟时间。| +| `replicate_log_latency_us` | Raft 复制日志至大多数节点的延迟。 | +| `num_send_snapshot` | Raft 发送快照至其他节点的次数。 | +| `append_log_latency_us` | Raft 复制日志到单个节点的延迟。 | +| `append_wal_latency_us` | Raft 写入单条 WAL 的延迟。 | +| `num_grant_votes` | Raft 投票给其他节点的次数。 | +| `num_start_elect` | Raft 发起投票的次数。 | + + ### Storage | 参数 | 说明 | | ---------------------------- | --------------------------------------------------- | -| add_edges_latency_us | 添加边的平均延迟时间。 | -| add_vertices_latency_us | 添加点的平均延迟时间。 | -| commit_log_latency_us | Raft 协议中 Commit 日志的延迟时间。 | -| commit_snapshot_latency_us | Raft 协议中 Commit 快照的延迟时间。 | -| delete_edges_latency_us | 删除边的平均延迟时间。 | -| delete_vertices_latency_us | 删除点的平均延迟时间。 | -| get_neighbors_latency_us | 查询邻居平均延迟时间。 | -| num_edges_deleted | 删除的边数量。 | -| num_edges_inserted | 插入的边数量。 | -| num_raft_votes | Raft 协议中投票的次数。 | -| num_rpc_sent_to_metad_failed | Storaged 服务发给 Metad 服务的 RPC 请求失败的数量。 | -| num_rpc_sent_to_metad | Storaged 服务发给 Metad 服务的 RPC 请求数量。 | -| num_tags_deleted | 删除的 Tag 数量。 | -| num_vertices_deleted | 删除的点数量。 | -| num_vertices_inserted | 插入的点数量。 | -| transfer_leader_latency_us | Raft 协议中转移 Leader 的延迟时间。 | - -### 图空间 +| `add_edges_atomic_latency_us` | 添加边单次延迟。 | +| `add_edges_latency_us` | 添加边的平均延迟时间。 | +| `add_vertices_latency_us` | 添加点的平均延迟时间。 | +| `commit_log_latency_us` | Raft 协议中 Commit 日志的延迟时间。 | +| `commit_snapshot_latency_us` | Raft 协议中 Commit 快照的延迟时间。 | +| `delete_edges_latency_us` | 删除边的平均延迟时间。 | +| `delete_vertices_latency_us` | 删除点的平均延迟时间。 | +| `get_neighbors_latency_us` | 查询邻居平均延迟时间。 | +| `num_get_prop` | GetPropProcessor 执行的次数。 | +| `num_get_neighbors_errors` | GetNeighborsProcessor 执行出错的次数。 | +| `get_prop_latency_us` | GetPropProcessor 执行的延迟时间。| +| `num_edges_deleted` | 删除的边数量。 | +| `num_edges_inserted` | 插入的边数量。 | +| `num_raft_votes` | Raft 协议中投票的次数。 | +| `num_rpc_sent_to_metad_failed` | Storaged 服务发给 Metad 服务的 RPC 请求失败的数量。 | +| `num_rpc_sent_to_metad` | Storaged 服务发给 Metad 服务的 RPC 请求数量。 | +| `num_tags_deleted` | 删除的 Tag 数量。 | +| `num_vertices_deleted` | 删除的点数量。 | +| `num_vertices_inserted` | 插入的点数量。 | +| `transfer_leader_latency_us` | Raft 协议中转移 Leader 的延迟时间。 | +| `lookup_latency_us` | LookupProcessor 执行的延迟时间。 | +| `num_lookup_errors` | LookupProcessor 执行时出错的次数。| +| `num_scan_vertex` | ScanVertexProcessor 执行的次数。| +| `num_scan_vertex_errors` | ScanVertexProcessor 执行时出错的次数。| +| `update_edge_latency_us` | UpdateEdgeProcessor 执行的延迟时间。| +| `num_update_vertex` | UpdateVertexProcessor 执行的次数。| +| `num_update_vertex_errors` | UpdateVertexProcessor 执行时出错的次数。| +| `kv_get_latency_us` | Getprocessor 的延迟时间。| +| `kv_put_latency_us` | PutProcessor 的延迟时间。| +| `kv_remove_latency_us` | RemoveProcessor 的延迟时间。| +| `num_kv_get_errors` | GetProcessor 执行出错次数。| +| `num_kv_get` | GetProcessor 执行次数。| +| `num_kv_put_errors` | PutProcessor 执行出错次数。| +| `num_kv_put` | PutProcessor 执行次数。| +| `num_kv_remove_errors` | RemoveProcessor 执行出错次数。| +| `num_kv_remove` | RemoveProcessor 执行次数。| +| `forward_tranx_latency_us` | 传输平均延迟时间。| +| `scan_edge_latency_us` | ScanEdgeProcessor 执行的延迟时间。 | +| `num_scan_edge_errors` | ScanEdgeProcessor 执行时出错的次数。 | +| `num_scan_edge` | ScanEdgeProcessor 执行的次数。 | +| `scan_vertex_latency_us` | ScanVertexProcessor 执行的延迟时间。 | +| `num_add_edges` | 添加边的次数。 | +| `num_add_edges_errors` | 添加边时出错的次数。 | +| `num_add_vertices` | 添加点的次数。 | +| `num_start_elect` | Raft 发起投票的次数 | +| `num_add_vertices_errors` | 添加点时出错的次数。 | +| `num_delete_vertices_errors` | 删除点时出错的次数。 | +| `append_log_latency_us` | Raft 复制日志到单个节点的延迟。 | +| `num_grant_votes` | Raft 投票给其他节点的次数。 | +| `replicate_log_latency_us` | Raft 复制日志到大多数节点的延迟。 | +| `num_delete_tags` | 删除 Tag 的次数。 | +| `num_delete_tags_errors` | 删除 Tag 时出错的次数。 | +| `num_delete_edges` | 删除边的次数。 | +| `num_delete_edges_errors` | 删除边时出错的次数。 | +| `num_send_snapshot` | 发送快照的次数。 | +| `update_vertex_latency_us` | UpdateVertexProcessor 执行的延迟时间。 | +| `append_wal_latency_us` | Raft 写入单条 WAL 的延迟。 | +| `num_update_edge` | UpdateEdgeProcessor 执行的次数。 | +| `delete_tags_latency_us` | 删除 Tag 的平均延迟时间。 | +| `num_update_edge_errors` | UpdateEdgeProcessor 执行时出错的次数。 | +| `num_get_neighbors` | GetNeighborsProcessor 执行的次数。 | +| `num_get_prop_errors` | GetPropProcessor 执行时出错的次数。 | +| `num_delete_vertices` | 删除点的次数。 | +| `num_lookup` | LookupProcessor 执行的次数。 | + + + +### 图空间级别监控指标 | 参数 | 说明 | | ---------------------------------------------- | ----------------------------------------- | -| num_active_queries | 当前正在执行的查询数。 | -| num_aggregate_executors | 聚合(Aggregate)算子执行时间。 | -| num_indexscan_executors | 索引扫描(IndexScan)算子执行时间。 | -| num_killed_queries | 被终止的查询数量。 | -| num_queries | 查询次数。 | -| num_query_errors_leader_changes | 因查询错误而导致的 Leader 变更的次数。 | -| num_query_errors | 查询错误次数。 | -| num_sentences | Graphd 服务接收的语句数。 | -| num_slow_queries | 慢查询次数。 | -| num_sort_executors | 排序(Sort)算子执行时间。 | -| optimizer_latency_us | 优化器阶段延时。 | -| query_latency_us | 查询平均延迟时间。 | \ No newline at end of file +| `num_active_queries` | 当前正在执行的查询数。 | +| `num_queries` | 查询次数。 | +| `num_sentences` | Graphd 服务接收的语句数。 | +| `optimizer_latency_us` | 优化器阶段延迟时间。 | +| `query_latency_us` | 查询平均延迟时间。 | +| `num_slow_queries` | 慢查询次数。 | +| `num_query_errors` | 查询报错语句数量。| +| `num_query_errors_leader_changes` | 因查询错误而导致的 Leader 变更的次数。 | +| `num_killed_queries` | 被终止的查询数量。 | +| `num_aggregate_executors` | 聚合(Aggregate)算子执行时间。 | +| `num_sort_executors` | 排序(Sort)算子执行时间。 | +| `num_indexscan_executors` | 索引扫描(IndexScan)算子执行时间。 | +| `num_oom_queries` | 导致内存耗尽的语句数量。| +| `num_auth_failed_sessions_bad_username_password` | 因用户名密码错误导验证失败的会话数量。 | +| `num_auth_failed_sessions` | 登录验证失败的会话数量。 | +| `num_opened_sessions` | 服务端建立过的会话数量。 | +| `num_queries_hit_memory_watermark` | 达到内存水位线的语句的数量。 | +| `num_reclaimed_expired_sessions` | 服务端主动回收的过期的会话数量。 | +| `num_rpc_sent_to_metad_failed` | Graphd 服务发给 Metad 的 RPC 请求失败的数量。 | +| `num_rpc_sent_to_metad` | Graphd 服务发给 Metad 服务的 RPC 请求数量。 | +| `num_rpc_sent_to_storaged_failed` | Graphd 服务发给 Storaged 服务的 RPC 请求失败的数量。 | +| `num_rpc_sent_to_storaged` | Graphd 服务发给 Storaged 服务的 RPC 请求数量。 | +| `slow_query_latency_us` | 慢查询平均延迟时间。 | \ No newline at end of file