SSH连接失败、远程桌面无法连接、网络不通、端口无法访问等连接相关问题。
服务器无法启动、启动缓慢、启动后异常、系统崩溃等启动相关问题。
CPU占用过高、内存不足、磁盘IO异常、响应缓慢等性能相关问题。
网站无法访问、域名解析失败、带宽异常、网络延迟高等网络相关问题。
服务器被攻击、异常登录、安全组配置错误、防火墙问题等安全相关问题。
磁盘空间不足、数据丢失、快照恢复失败、存储扩容异常等存储相关问题。
首先明确故障的具体表现,记录故障发生的时间、频率、影响范围等信息,为后续排查提供依据。
在控制台查看服务器运行状态、CPU使用率、内存使用、网络流量等基础指标,判断是否正常。
检查系统日志、应用日志、错误日志等,查找异常信息和错误提示,定位问题可能原因。
根据日志信息和故障现象,逐一排查可能的原因,如配置错误、资源不足、软件冲突等。
根据排查结果采取相应措施,如修改配置、重启服务、清理资源、恢复备份等解决问题。
实施解决方案后验证故障是否解决,确认服务恢复正常,记录排查过程供后续参考。
检查安全组是否开放22端口,确认IP和密码正确,尝试使用密钥登录,必要时重置密码。
查看系统日志定位原因,检查是否欠费或配置异常,尝试使用快照恢复或重装系统。
使用top命令查看占用进程,优化应用代码,考虑升级配置或使用负载均衡分担压力。
检查内存使用情况,优化应用内存占用,清理缓存释放空间,升级内存配置。
检查安全组端口配置,确认Web服务运行状态,检查域名解析是否正确指向服务器。
清理无用文件和日志释放空间,扩容云硬盘增加容量,设置定期清理任务。