Pod 的 status 定义在 PodStatus 对象中,其中有一个 phase 字段。它简单描述了 Pod 在其生命周期的阶段。熟悉Pod的各种状态对我们理解如何设置Pod的调度策略、重启策略是很有必要的。
下面是 phase 可能的值:
阶段 | 描述 |
---|---|
Pending | Pod 已被 Kubernetes 系统接受,但有一个或者多个容器镜像尚未创建。等待时间包括调度 Pod 的时间和通过网络下载镜像的时间,这可能需要花点时间。 |
Running | 该 Pod 已经绑定到了一个节点上,Pod 中所有的容器都已被创建。至少有一个容器正在运行,或者正处于启动或重启状态。 |
Succeeded | Pod 中的所有容器都被成功终止,并且不会再重启。 |
Failed | Pod 中的所有容器都已终止了,并且至少有一个容器是因为失败终止。也就是说,容器以非0状态退出或者被系统终止。 |
Unknown | 因为某些原因无法取得 Pod 的状态,通常是因为与 Pod 所在主机通信失败。 |
Pod 有一个 PodStatus 对象,其中包含一个 PodCondition 数组,代表 Condition 是否通过。
PodCondition 属性描述:
字段 | 描述 |
---|---|
lastProbeTime | 最后一次探测 Pod Condition 的时间戳。 |
lastTransitionTime | 上次 Condition 从一种状态转换到另一种状态的时间。 |
message | 上次 Condition 状态转换的详细描述。 |
reason | Condition 最后一次转换的原因。 |
status | Condition 状态类型,可以为 True False Unknown |
type | Condition 类型 |
Condition Type 的描述:
Type | 描述 |
---|---|
PodScheduled | Pod 已被调度到一个节点 |
Ready | Pod 能够提供请求,应该被添加到负载均衡池中以提供服务 |
Initialized | 所有 init containers 成功启动 |
Unschedulable | 调度器不能正常调度容器,例如缺乏资源或其他限制 |
ContainersReady | Pod 中所有容器全部就绪 |
Pod的重启策略(RestartPolicy)应用于Pod内的所有容器,并且仅在Pod所处的Node上由kubelet进行判断和重启操作。当某个容器异常退出或者健康检查失败时,kubelet将根据 RestartPolicy 的设置来进行相应的操作。
Pod的重启策略包括 Always、OnFailure和Never,默认值为Always。
失败的容器由 kubelet 以五分钟为上限的指数退避延迟(10秒,20秒,40秒…)重新启动,并在成功执行十分钟后重置。
探针 是由 kubelet 对容器执行的定期诊断。要执行诊断,kubelet 调用由容器实现的 Handler。有三种类型的处理程序:
每次探测都将获得以下三种结果之一:
Kubelet 可以选择是否执行在容器上运行的两种探针执行和做出反应:
示例:
ExecAction:
apiVersion: apps/v1
kind: Deployment
metadata:
***
spec:
***
containers:
***
livenessProbe: # 健康状态检查
exec:
command:
- touch
- /tmp/healthy
initialDelaySeconds: 30 # 初始化时间,单位:秒
timeoutSeconds: 5 # 探测超时时长,单位:秒
periodSeconds: 30 # 探测时间间隔,单位:秒
successThreshold: 1 # 失败后探测成功的最小连续成功次数
failureThreshold: 5 # 最大失败次数
readinessProbe: # 准备状态检查
exec:
command:
- touch
- /tmp/ok
initialDelaySeconds: 30
timeoutSeconds: 5
TCPSocketAction:
apiVersion: v1
kind: Pod
metadata:
name: liveness-tcp-socket
spec:
containers:
- name: nginx
image: nginx
ports:
- containerPort: 80
livenessProbe:
tcpSocket:
port: 80
initialDelaySeconds: 15
timeoutSeconds: 1
HTTPGetAction:
apiVersion: apps/v1
kind: Deployment
metadata:
***
spec:
***
containers:
***
livenessProbe:
httpGet:
path: /healthCheck
port: 8080
scheme: HTTP
initialDelaySeconds: 30
timeoutSeconds: 5
periodSeconds: 30
successThreshold: 1
failureThreshold: 5
readinessProbe:
httpGet:
path: /healthCheck
port: 8080
scheme: HTTP
initialDelaySeconds: 30
timeoutSeconds: 5
一般来说,Pod 不会消失,直到人为销毁他们。这可能是一个人或控制器。这个规则的唯一例外是成功或失败的 phase 超过一段时间(由主服务器中的 terminate-pod-gc-threshold 确定)的Pod将过期并被自动销毁。
三种可用的控制器类型:
所有这三种类型的控制器都包含一个 PodTemplate。建议创建适当的控制器,让它们来创建 Pod,而不是直接自己创建 Pod。这是因为单独的 Pod 在机器故障的情况下没有办法自动复原,而控制器却可以。
如果节点死亡或与集群的其余部分断开连接,则 Kubernetes 将应用一个策略将丢失节点上的所有 Pod 的 phase 设置为 Failed。
Pod 的生命周期
kubernetes-api - PodStatus v1 core
kubernetes-api - PodCondition v1 core
Kubernetes Pod 生命周期
Pod生命周期、重启策略和健康检查