岗位职责 1,负责公有云平台的运维保障; 2,组织日常运维流程,负责云平台的容量管理、事件管理、问题管理、配置管理、变更管理和安全管理; 3,负责云平台等系统的架构审核、业务监控、持续交付、应急响应、容量规划等; 4,深入理解云计算平台架构,发现并解决重大故障及性能瓶颈; 5,通过量化分析云平台的运维状态,挖掘潜在隐患和问题,提出解决办法,持续优化云平台的服务质量; 6. 管理好供应商的服务质量,应对日常突发事件,提出短期和长期的解决办法; 7. 了解行业动态,把行业新的运维管理思想、技术带回到团队中; 工作地点 北京 岗位要求 1, 统招本科及以上学历,计算机相关专业优先; 2、5年以上云平台运维经验,其中3年以上服务提供商工作经验; 3,有大型云平台管理经验,熟悉云计算平台运维管理,具备分布式或异地多云平台管理经验优先; 4, 熟悉OpenStack架构,部署及运维,5年以上相关运维经验; 5,熟悉KVM虚拟化技术,网络和存储相关技术; 6,良好的沟通能力和组织能力; 7,熟悉ceph 或其他分布式存储产品; 8,熟悉saltstack、ansible、zabbix、open-falcon、ELK等运维工具,对服务器的监控、日志分析有深入理解