职位描述:
1、负责直播cdn/实时通信的系统高可用架构和规划,包括但不限于全链路压测、故障诊断、故障容灾、智能调度、弹性扩容与防攻击
2、设计并实现能够保障线上大规模集群的迭代、自动化运维平台
3、全球化流媒体传输网络建设与调优
4、设计优化的qos数据上报机制,大数据pipeline,监控,分析和报表系统,不间断监测用户体验
任职要求:
1、有大型系统的运维管理经验,对立体监控、自动部署、容量管理、自动容灾有较深入的理解和实践经验
2、熟悉linux操作系统、tcp/ip等常用协议,熟悉cdn&dns基本原理,了解nginx/lvs/puppet/ansible/zabbix/falcon等开源软件(至少2种)
3、熟悉全链路压测、降级、流控、熔断等稳定性保障手段
4、有日志处理及分析相关经验,熟悉相关的组件者优先,如:kafka,elk,flink,storm,flume等
5、有监控系统构建研发经验优先