岗位职责 1 负责智能运维平台的设计、开发及迭代优化; 2 负责打通从故障监控、预警、告警到根因分析、故障自愈的全流程中落地AIOps,提升业务可用性; 3 负责人工智能在运维场景中的分析和算法建模工作,并根据分析结果,抽象平台需求,完善设计,并开发实现; 4 减轻运维人力成本,通过数据挖掘办法快速识别、定位出异常问题,提高异常检测的准确性和时效性; 工作地点 北京/济南 任职资格 大学本科以上学历,计算机相关专业,5年以上软件开发经验; 方向一(架构研发) 1 有至少4年以上后端开发经验,有中间件架构设计经验; 2 具备技术选型、需求分析、独立设计新系统的能力; 3 了解AIOps基本概念、能力分级、能力框架、团队角色、常见应用场景等; 4 熟悉分布式链路跟踪技术,以及压测、降级、流控、熔断等稳定性保障手段; 5 深度掌握Java,熟练掌握Spring、Mybatis、SpringBoot等开发组件; 6 具有良好的沟通能力,有较强的独立工作能力和解决问题的能力; 方向二(效果提升) 1 熟悉AIOPS相关算法,异常检测、趋势预测、根因分析、告警收缩等算法,能够根据场景选择合适算法,并进行优化,提高准确性和时效性。 2 熟悉 Tensorflow,Caffe等机器学习架构。 3 了解并能够使用hadoop,spark等大数据平台。 4 有良好的英文阅读能力,善于发现业界及学术界前沿技术并应用到项目中,提高运维水平。 具备以下者优先 1 在运维领域有丰富经验和案例,金融行业或大型互联网公司人工智能相关工作经验; 2 有完整自动化运维工具开发经验者优先; 3 在深度学习、机器学习等某一领域有深入研究或资深工作经验者优先; 4 有AIOps生产落地经验者优先。