tencent cloud

云顾问 - 混沌演练

产品简介
产品概述
产品优势
应用场景
购买指南
购买说明
快速入门
控制台快速上手
API 快速上手
操作指南
经验库
演练任务
故障动作
护栏监控
标签
探针管理
故障动作库
计算
数据库
网络
容器
大数据
负载均衡
消息队列
专线
自定义动作
云直播
权限管理指南
概述
授权策略语法
可授权资源类型
服务授权与角色权限
子用户与授权
API 文档
History
Introduction
API Category
Making API Requests
Task APIs
Template Library APIs
Data Types
Error Codes
常见问题
产品特性问题
动作执行问题
探针问题 FAQ
相关协议
PRIVACY POLICY MODULE CHAOTIC FAULT GENERATOR
DATA PRIVACY AND SECURITY AGREEMENT MODULE CHAOTIC FAULT GENERATOR
联系我们
文档云顾问 - 混沌演练故障动作库容器容器资源应用进程故障演练案例

容器资源应用进程故障演练案例

PDF
聚焦模式
字号
最后更新时间: 2024-09-26 15:47:38

背景

容器资源提供了一种轻量级、可移植和可扩展的应用程序运行环境。然而,容器内的应用进程可能会遇到崩溃、死锁、资源泄漏等故障,导致应用程序无法正常运行。
为了提高容器服务的可靠性和稳定性,需进行应用进程故障演练。通过演练,可以验证系统在应用进程发生故障时是否能正常运行,提前暴露此故障场景下的一系列问题,以便优化系统架构和做好应急预案。

演练实施

说明:
适用资源对象:标准集群普通节点、标准集群 Pod、Serverless 集群 Pod。

步骤一:演练准备

购买容器实例,部署测试服务。若已有可以演练的容器实例,则直接创建演练。
进入 探针管理 页面安装探针。

步骤二:创建演练

1. 登录 云顾问 > 混沌演练控制台,进入演练管理页面,单击新建演练
2. 点击跳过,新建空白演练,并填写演练信息。
3. 实例类型选择容器,实例对象选择标准集群Pod, 然后添加实例。
4. 添加故障动作,点击立即添加,选择应用进程。
5. 选择故障动作进程停止,然后点击下一步
6. 设置动作参数,点击确定
全部容器:每个容器中的目标进程都会被停止
按字母排序选择首个容器:首个容器中的目标进程会被停止
指定容器名称:目标容器中的目标进程会被停止
7. 动作参数配置完成之后,单击下一步。根据实际情况配置护栏策略监控指标,最后单击提交,完成演练创建。

步骤三:执行演练

1. 登录准备执行故障的机器,查看当前进程管理详情。可以发现,存在一个 python 进程。



2. 进入演练详情,单击前往动作组执行
3. 点击执行,开始演练。
4. 点击动作卡片,查看动作执行详情。
5. 查看执行日志,确认执行成功。
6. 查看故障执行后的效果。再次查看当前进程管理详情,可以发现,python 进程已经被杀死。




帮助和支持

本页内容是否解决了您的问题?

填写满意度调查问卷,共创更好文档体验。

文档反馈