运维工程师的工作内容有哪些?

如题所述

一: 运维工程师要保证线上系统地稳定,这是运维人员的核心价值 ,围绕这个展开,是一个非常大的话题,后面细化

二:基础建设:安全,质量,效率,成本 是运维人员可以展开运维工作的四大方面。围绕着这四个方面,我们需要制定规范,流程,建设对应的系统保证效率,标准化提升效率等等
质量: 立体化监控系统;测速,备份容灾等等
效率: 提升运维效率的系统建设,标准化机器初始化,软件安装标准化,监控标准化等等,提升效率,批量部署脚本等等
安全:互联网安全,系统支持,cgi扫描等等
成本:预算制定等等,合理优化部署,平衡成本与体验

三:基础建设升华:一切以用户价值为依归
1:异地部署 ,异地容灾
2:柔性可用 ,柔性可损
3:全网调度 ,实现成本与 用户体验的平衡
4:优化用户体验:提升速度
四:从一个项目上看运维人员的工作分解
1:项目初期介入,提对应运维需求,需要运维工程师预计运营时可能需要的数据,可以从两个方向考虑:A监控;B评估系统好坏的运维指标,如接口调用数据,用户访问速度等等,提出对应需求,开发在设计时实现,方便上线后运维采集这些数据做系统评估。 这个阶段要了解系统架构,评估运维上是否合理。是否方便部署,运维风险有哪些,从哪些层面可以避免,做好容灾,cache数据丢数,db down掉等的评估以及应对方案设计,全网调度方案等。
2:项目开发阶段,这个阶段运维也要参与其中,了解对应运维需求开发的完成情况
3:项目测试发布: 运维负责运营环境的搭建,发布上线,并监控线上系统稳定
4:项目发布后:保证对应监控,备份,容灾等对应工作完成
5:项目运营阶段:及时对告警进行处理,对系统发展趋势做好评估,扩容等,预估可能的运营风向,并做好对应的应对措施
6:相关演习
7:做好系统优化,提升用户体验

五:从运维人员面对的周边角色做 运维人员的工作分解
1:上游战略依从:理解公司发展方向,调整运营战略
2;开发
3:测试
4:QA
5:老板等
温馨提示:答案为网友推荐,仅供参考