如何运营服务器服务器运营注意事项

一服务器怎么运营

检查磁盘使用率当磁盘使用率超过80%可以清除一些日志文件

检查内存使用情况当内存使用过多时需要检查是哪个进程占用是否合理

检查CPU使用情况负载大小当CPU使用过多负载过大时需要检查是哪个进程占用是否合理

检查服务器网卡接口的数据统计和每秒收发包的个数和流量

还需要结合服务器的业务当然这些可用使用监控软件自动检查故障报警等实时掌握服务器的运行情况

二服务器运营注意事项

1提前检查

服务器和网站漏洞检测对Web漏洞弱口令潜在的恶意行为违法信息等进行定期扫描

代码的定期检查安全检查漏洞检查

服务器安全加固安全基线设置安全基线检查

数据库执行的命令添加字段加索引等必须是经过测试检查的命令才能在正式环境运行

2数据备份

服务器数据备份包括网站程序文件备份数据库文件备份配置文件备份如有资源最好每小时备份和异地备份

建立五重备份机制常规备份自动同步LVM快照Azure备份S3备份

定期检查备份文件是否可用避免出故障后备份数据不可用

重要数据多重加密算法加密处理

程序文件版本控制测试发布故障回滚

3安全监控

nagios监控服务器常规状态CPU负载内存磁盘流量超过阈值告警

zabbix或cacti监控服务器常规状态CPU负载内存磁盘流量等状态可以显示历史曲线方便排查问题

监控服务器SSH登录记录iptables状态进程状态有异常记录告警

监控网站WEB日志（包括nginx日志php日志等）可以采用EKL来收集管理有异常日志告警

运维人员都要接收告警邮件和短信至少所负责的业务告警邮件和短信必须接收运维经理接收重要业务告警邮件和短信（除非是专职运维开发）

除服务器内部监控外最好使用第三方监控从外部监控业务是否正常（监控URL端口等）比如监控宝

4故障避免预防

网站WEB增加WAF避免XSS跨站脚本SQL注入网页挂马等漏洞威胁

程序代码连接数据库memcacheredis等可以使用域名（域名HOSTS指定IP）当出问题有备用的服务器就可以通过修改DNS或者HOSTS恢复服务

建立应急预案机制定期演练事故场景估算修复时间

部署蜜罐系统防范企业和服务器内网APT攻击

建立双活集群包括业务服务的高可用避免业务服务单点

服务器集群采用跳板机或堡垒机登录避免服务器集群每台服务器可以远程连接管理

操作重要业务升级迁移扩容之前列一下操作步骤越详细越好实际操作按步骤操作操作完做好记录

5事中操作

网站WEB增加WAF发现XSSSQL注入网页挂马等攻击会自动拦截并记录日志

检查服务器数据备份是否可用

在处理需求和故障时执行风险命令（比如rmrestartreboot等）需再三确认执行命令前检查所在服务器所在服务器路径再执行

不要疲劳驾驶喝酒不上机上机不喝酒尤其别动数据库避免在不清醒的状态下在服务器上执行了错误命令导致数据丢失或业务故障

在处理事故时一定要考虑处理措施是否会引发连锁故障重要操作三思而行

6事后检查分析

实现网络安全可视化管理可以看到每天有那些异常IP和异常URL请求服务器集群开放端口列表等能对全网进行安全策略集中管理统一日志收集和分析

备份及篡改恢复功能程序文件图片数据文件配置文件的备份故障回滚机制

对攻击日志进行深度分析展现攻击路径攻击源协助管理员溯源

践行DevOps的无指责文化尤其是在做事故分析时事故分析重在定位原因制定改进措施

点击阅读全文

2023-07-27

「真诚赞赏，手留余香」

赞赏支持

还没有人赞赏，支持一下吧

网友评论

默认排序按时间排序

还没有用户评论

如何运营服务器 服务器运营注意事项

网友评论

相关链接

如何运营服务器服务器运营注意事项