tencent cloud

弹性 MapReduce

动态与公告
产品动态
产品公告
安全公告
产品简介
产品概述
产品优势
产品架构
产品功能
应用场景
约束与限制
技术支持范围
产品发行版
购买指南
EMR on CVM 计费说明
EMR on TKE 计费说明
EMR Serverless HBase 计费说明
快速入门
EMR on CVM 快速入门
EMR on TKE 快速入门
EMR on CVM 操作指南
规划集群
管理权限
配置集群
管理集群
管理服务
监控告警
智能管家
EMR on TKE 操作指南
EMR on TKE 简介
配置集群
管理集群
管理服务
监控运维
应用分析
EMR Serverless HBase 操作指南
EMR Serverless HBase 产品简介
配额与限制
规划实例
管理实例
监控告警
开发指南
EMR 开发指南
Hadoop开发指南
Spark 开发指南
HBASE开发指南
Phoenix on Hbase 开发指南
Hive 开发指南
Presto开发指南
Sqoop 开发指南
Hue 开发指南
Oozie 开发指南
Flume 开发指南
Kerberos 开发指南
Knox 开发指南
Alluxio 开发指南
Kylin 开发指南
Livy 开发指南
Kyuubi 开发指南
Zeppelin 开发指南
Hudi 开发指南
Superset 开发指南
Impala 开发指南
Druid 开发指南
Tensorflow 开发指南
Kudu 开发指南
Ranger 开发指南
Kafka 开发指南
Iceberg 开发指南
StarRocks 开发指南
Flink 开发指南
JupyterLab 开发指南
MLflow 开发指南
实践教程
EMR on CVM 运维实践
数据迁移实践
自定义伸缩实践教程
API 文档
History
Introduction
API Category
Cluster Resource Management APIs
Cluster Services APIs
User Management APIs
Data Inquiry APIs
Scaling APIs
Configuration APIs
Other APIs
Serverless HBase APIs
YARN Resource Scheduling APIs
Making API Requests
Data Types
Error Codes
常见问题
EMR on CVM常见问题
服务等级协议
联系我们

配置中心-识别诊断

PDF
聚焦模式
字号
最后更新时间: 2026-01-13 17:53:37

功能介绍

配置中心是一个集中化管理功能,旨在帮助企业高效管理大数据集群环境中的各项配置和策略。通过配置中心,用户可以灵活调整和优化基础诊断、计算洞察、存储洞察和资源洞察等核心模块的策略,从而实现对大数据集群的全方位监管分析。
配置中心支持以下主要功能:
基础诊断策略:提供多种 AI 特征识别模型(如满载、毛刺、均值偏移)及预测分析能力。
计算洞察策略:支持 Hadoop 生态中的 Spark、Hive、Yarn、Trino 等引擎的全生命周期计算洞察值配置。
存储洞察策略:针对 HDFS 和 COS 存储,提供文件和 Hive 数据表的分析,支持大小文件识别和冷热数据分类配置。
资源洞察策略:按计算集群、引擎队列及组件维度,分析物理资源和虚拟资源的使用情况。

操作步骤

1. 登录 腾讯云 EMR 控制台,在控制台左侧菜单中选中智能管家 > 配置中心,单击进入配置中心页面。
2. 在配置中心页面选中地域可用区及需要配置的集群。

3. 您可按需调整相关维度的策略参数及状态。

配置中心策略明细

基础诊断的策略如下:
维度
特征
指标
触发策略
默认状态
严重程度
是否支持关闭
基础诊断
毛刺
HBase RS 请求处理时延
特征分析
已启用
一般
HBase 读写总请求量
已启用
HBase RS 慢操作次数_slowAppendCount
已启用
HBase RS 慢操作次数_slowDeleteCount
已启用
HBase RS 慢操作次数_slowPutCount
已启用
节点内存使用占比
已启用
TCP LISTEN 异常_ListenDrops
已启用
TCP 重传率_InErrRate
已启用
SR EDITLOG 写延时
已启用
SR FE 查询延时
已启用
满载
HDFS 存储空间使用率
threshold=90
已启用
HiveServer2堆内存使用占比
threshold=90
已启用
节点存储空间使用率
threshold=90
已启用
TCP 套接字内存
threshold=3221225472
已启用
UDP 套接字内存
threshold=3221225472
已启用
TCP4连接状态_CloseWait
threshold=50000
已启用
TCP4连接状态_ESTABLISHED
threshold=50000
已启用
TCP4连接状态_TimeWait
threshold=50000
已启用
Yarn Node Manager 堆内存使用率
threshold=90
已启用
Yarn Resource Manager 堆内存使用率
threshold=90
已启用
均值偏移
TCP4连接数_CLOSE-WAIT
特征分析
已启用
TCP4连接数_ESTABLISHED
已启用
TCP4连接数_TIME-WAIT
已启用
系统进程个数
已启用
计算洞察策略如下:
维度
引擎
洞察项
严重程度
计算洞察项
Hive
JOIN 数据膨胀
一般
空输入
一般
全表扫描分区表
一般
输入小文件
中等
扫描大量数据
严重
MapJoin 优化
一般
元数据扫描过多
严重
大表扫描
严重
编译耗时过长
严重
不合理参数
中等
Spark
BroadcastJoin 优化
一般
查询条件未下推
一般
CPU 资源浪费
一般
JOIN 数据膨胀
一般
数据倾斜
严重
Task 输入为空
严重
ExecutorGC
中等
全表扫描分区表
一般
全局排序
严重
输入小文件过多
严重
资源不足
严重
扫描大量数据
严重
峰值内存超限
一般
Memory 资源浪费
一般
输出小文件过多
严重
Task 读卡顿
严重
Resource 开销异常
严重
调度延迟
一般
ScheduleOverhead
严重
调度倾斜
严重
ShuffleFailure
中等
慢Task
中等
Task 输入数据过小
严重
Stage 耗时异常
中等
StageScheduleDelay
中等
多Spark APP并发插入相同表
一般
ShuffleServer应用写入TopN
一般
Trino
全表扫描分区表
一般
扫描大量数据
严重
StarRocks
JOIN 数据膨胀
一般
数据倾斜
严重
全表扫描分区表
严重
扫描大量数据
严重
存储洞察策略如下:
维度
类型
监测数据
触发策略
默认状态
是否支持配置
存储洞察项
大小文件
大文件存储 大于3072MB
存储量占比
大于30%
小文件存储 大于0MB, 小于2MB
文件数占比
大于30%
空文件存储 等于0MB
文件数占比
大于15%
垃圾目录最近修改时间7天前
垃圾目录匹配正则
.*/warehouse/.*/_temporary/.*/task_.*|.*/.hive-staging.*/
冷热数据
热文件最近一次访问时间
时间
小于1月
温文件最近一次访问时间
时间
大于等于1月,小于等于1年
冷文件最近一次访问时间
存储量
存储量占比大于50%触发预警
StarRocks洞察项
数据表
分桶倾斜
分桶存储量
分桶存储量倾斜偏差大于1%
索引优化
查询非索引/查询次数
查询包含非索引比例1%
表查询次数/天阈值2次
资源洞察策略如下:
维度
类型
洞察项
严重程度
洞察默认规则(可配置)
默认状态
是否支持关闭
资源洞察
集群
集群资源 CPU 持续空载
一般
空载最大使用比例10%
持续时间30分钟
已关闭
集群资源 CPU 持续满载
严重
满载最小使用比例90%
持续时间30分钟
已启用
集群资源内存持续空载
一般
空载最大使用比例10%
持续时间30分钟
已关闭
集群资源内存持续满载
严重
满载最小使用比例90%
持续时间30分钟
已启用
Yarn 队列
Yarn 队列物理 CPU 超用
严重
CPU 超分配比例10%
集群整体 CPU 使用率大于90%
已启用
Yarn 队列虚拟 CPU 浪费
一般
CPU 浪费比例10%
集群整体 CPU 使用率大于90%
已关闭
Yarn 队列物理内存超用
严重
内存超分配比例10%
集群整体内存使用率大于90%
已启用
Yarn 队列虚拟内存浪费
一般
内存浪费比例10%
集群整体内存使用率大于90%
已关闭
Yarn 队列虚拟 CPU 持续空载
一般
空载最大使用比例10%
持续时间30分钟
已关闭
Yarn 队列虚拟 CPU 持续满载
严重
满载最小使用比例90%
持续时间30分钟
已启用
Yarn 队列虚拟内存持续空载
一般
空载最大使用比例10%
持续时间30分钟
已关闭
Yarn 队列虚拟内存持续满载
严重
满载最小使用比例90%
持续时间30分钟
已启用
StarRocks
StarRocksBe CPU 持续空载
一般
空载最大使用比例10%
持续时间30分钟
已关闭
StarRocksBe CPU 持续满载
严重
满载最小使用比例90%
持续时间30分钟
已启用
StarRocksBe 内存持续空载
一般
空载最大使用比例10%
持续时间30分钟
已关闭
StarRocksBe 内存持续满载
严重
满载最小使用比例90%
持续时间30分钟
已启用
StarRocksFe CPU 持续空载
一般
空载最大使用比例10%
持续时间30分钟
已关闭
StarRocksFe CPU 持续满载
严重
满载最小使用比例90%
持续时间30分钟
已启用
StarRocksFe 内存持续空载
一般
空载最大使用比例10%
持续时间30分钟
已关闭
StarRocksFe 内存持续满载
严重
满载最小使用比例90%
持续时间30分钟
已启用

帮助和支持

本页内容是否解决了您的问题?

填写满意度调查问卷,共创更好文档体验。

文档反馈