DevOps

暂无描述

记一次 Kubernetes Pod 资源分配设置不当导致的事故

  • 2020/12/23
  • 2021/06/30
  • 2631 字 (6 分钟读完)
  • 云原生 ,Kubernetes ,DevOps

背景 笔者最近加入了校内某在线课程平台的运维团队。此运维团队在 on-premise 的私有云上搭建了 Kubernetes 集群来管理服务,包括前后端服务以及数据库、消息队列等基础服务。 最近,由于种种原因,团队管理的供测试环境使用的 Kubernetes 集群需要支撑某研究生团队的 NLP 运算程序。他们每天都会...