天基集群管理团队为阿里云提供针对大规模集群进行快速软硬件技术创新的核心技术,负责研发飞天操作系统的核心基础组件之一,当前阿里云百万规模服务器、飞天系统中的数千基础服务、从操作系统、驱动、虚拟化到监控服务都运行在天基集群管理服务之上。集群管理团队的技术产品不仅是阿里云公共云的技术基础,也是阿里云专有云的技术基础,将阿里云的各类产品服务输出到各行各业。
我们的团队欢迎对分布式系统设计、研发以及数据分析感兴趣的同学加入。在这里,你将有机会与阿里云共同成长,挑战世界级的技术难题,实现自己的技术理想。
在我们的日常工作中您可能面对以下问题:
- 如何让程序运行在百万级服务器上?
- 如何能基于 PB 级数据分析出系统中潜在的问题,并自动决策出合理的修复策略?
- 如何能让新的服务版本更快更安全的发布到生产环境中?
除此之外,您可能还需要负责以下职责: - 设计并实现基于大规模数据分析技术的解决方案,从而提升阿里云基础服务的稳定性及运行效率。
- 与团队一起通过新技术将阿里云的技术产品扩展到边缘计算等更多新的业务场景。
- 解决生产环境中发生的故障,让阿里云基础服务能够达到 99.999%的可用性。
- 与其他研发团队一起协作,为用户提供更高质量的云服务。
职位要求 基本要求:
- 具有计算机科学及相关学科学士以上学位。
- 至少熟悉 Golang/C++/Java 中的一种编程语言
简历可以发送到: emhlbmdsdW4ueHpsQGFsaWJhYmEtaW5jLmNvbQo=