工作职责:
1.负责广告业务线监控运维及容灾体系的建设,提升可靠性和稳定性,保障系统SLA;
2.负责制定优化SRE流程规范并推动落地,包括容量规划、交付部署、变更升级、容灾备份、监控告警、事故响应处理等;
3.推动SRE运维工作向自动化、智能化的方向演进,提升整体运维管理效率;
4.推进业务系统所需的资源(服务器、计算资源、存储资源)的评估、申请、初始化、交付等流程的顺利进行,确保资源的合理使用和分配。
任职资格:
1.全日制统招本科及以上学历,计算机相关专业,有三年以上实际运维工作经验,责任意识强,自主学习能力强;
2.熟悉一种或多种编程语言或自动化工具,例如 Python/Shell/Ansible;
3.具有监控系统相关运维经验,例如 (Prometheus/Alertmanager/Grafana/Zabbix);
4.具有相关计算/分布式/大数据等系统运维经验, 例如:(ElasticSearch/Redis/Kafka/Nginx/Kubernetes/Docker/Hadoop/ClickHouse/Zookeeper等)。
更新于 2024-10-16
查看更多岗位职责