Kubernetes 入门
1. Kubernetes 生产环境
2. Kubernetes 最佳实践
Kubernetes 概述
1. Kubernetes 简介
2. Kubernetes 组件
3. Kubernetes API
Kubernetes 安装
1. Kubernetes Linux安装
2. Kubernetes macOS安装
3. Kubernetes Windows安装
Kubernetes 对象
1. Kubernetes 对象简介
2. Kubernetes 对象管理
3. Kubernetes 对象名称和IDs
4. Kubernetes 名字空间
5. Kubernetes 标签和选择算符
6. Kubernetes 注解
7. Kubernetes Finalizers
8. Kubernetes 字段选择器
9. Kubernetes 属主与附属
10. Kubernetes 推荐使用的标签
Kubernetes 架构
1. Kubernetes 节点
2. Kubernetes 控制面到节点通信
3. Kubernetes 控制器
4. Kubernetes 云控制器管理器
5. Kubernetes 垃圾收集
6. Kubernetes 容器运行时接口（CRI）
Kubernetes 容器
1. Kubernetes 镜像
2. Kubernetes 容器环境
3. Kubernetes 容器运行时类（Runtime Class）
4. Kubernetes 容器生命周期回调
Kubernetes Pods
1. Kubernetes Pod的生命周期
2. Kubernetes Init容器
3. Kubernetes Pod拓扑分布约束
4. Kubernetes 干扰（Disruptions）
5. Kubernetes 临时容器
Kubernetes 工作负载资源
1. Kubernetes Deployments
2. Kubernetes ReplicaSet
3. Kubernetes StatefulSets
4. Kubernetes DaemonSet
5. Kubernetes Jobs
6. Kubernetes 已完成 Job 的自动清理
7. Kubernetes CronJob
8. Kubernetes ReplicationController
Kubernetes 服务、负载均衡和联网
1. Kubernetes 使用拓扑键实现拓扑感知的流量路由
2. Kubernetes 服务
3. Kubernetes Pod 与 Service 的 DNS
4. Kubernetes 使用 Service 连接到应用
5. Kubernetes Ingress
6. Kubernetes Ingress 控制器
7. Kubernetes 拓扑感知提示
8. Kubernetes 服务内部流量策略
9. Kubernetes 端点切片（Endpoint Slices）
10. Kubernetes 网络策略
11. Kubernetes IPv4/IPv6 双协议栈
Kubernetes 存储
1. Kubernetes 卷
2. Kubernetes 持久卷
3. Kubernetes 投射卷
4. Kubernetes 临时卷
5. Kubernetes 存储类
Kubernetes 配置
1. Kubernetes 配置最佳实践
2. Kubernetes ConfigMap
3. Kubernetes Secret
4. Kubernetes 为 Pod 和容器管理资源
5. Kubernetes 使用 kubeconfig 文件组织集群访问
6. Kubernetes Windows 节点的资源管理
Kubernetes 安全
1. Kubernetes 云原生安全概述
2. Kubernetes Pod安全性标准
3. Kubernetes Pod安全性准入
4. Kubernetes Pod安全策略
5. Kubernetes Windows节点的安全性
6. Kubernetes API访问控制
7. Kubernetes 基于角色的访问控制良好实践
Kubernetes 策略
1. Kubernetes 限制范围
2. Kubernetes 资源配额
3. Kubernetes 进程ID约束与预留
4. Kubernetes 节点资源管理器
Kubernetes 调度，抢占和驱逐
1. Kubernetes 调度器
2. Kubernetes 将Pod指派给节点
3. Kubernetes Pod开销
4. Kubernetes 污点和容忍度
5. Kubernetes Pod优先级和抢占
6. Kubernetes 节点压力驱逐
7. Kubernetes API发起的驱逐
8. Kubernetes 扩展资源的资源装箱
9. Kubernetes 调度框架
10. Kubernetes 调度器性能调优
Kubernetes 集群管理
1. Kubernetes 管理资源
2. Kubernetes 集群网络系统
3. Kubernetes 系统组件指标
4. Kubernetes 日志架构
5. Kubernetes 系统日志
6. Kubernetes 追踪系统组件
7. Kubernetes 代理
8. Kubernetes API优先级和公平性
9. Kubernetes 安装扩展（Addons）
Kubernetes 扩展
1. Kubernetes 扩展API
  1. Kubernetes 定制资源
  2. Kubernetes 通过聚合层扩展API
2. Kubernetes Operator模式
3. Kubernetes 计算、存储和网络扩展
  1. Kubernetes 网络插件
  2. Kubernetes 设备插件
4. Kubernetes 服务目录
Kubernetes 应用故障排除
1. Kubernetes 调试Pod
2. Kubernetes 调试Service
3. Kubernetes 调试StatefulSet
4. Kubernetes 调试Init容器
5. Kubernetes 确定Pod失败的原因
6. Kubernetes 获取正在运行容器的Shell
7. Kubernetes 调试运行中的Pod
Kubernetes 集群故障排查
1. Kubernetes 资源指标管道
2. Kubernetes 节点健康监测
3. Kubernetes 使用crictl对Kubernetes节点进行调试
4. Kubernetes Windows调试提示
5. Kubernetes 使用telepresence在本地开发和调试服务
6. Kubernetes 审计
7. Kubernetes 资源监控工具
Kubernetes 管理集群
1. Kubernetes 从dockershim迁移
  1. Kubernetes 将节点上的容器运行时从Docker Engine改为containerd
  2. Kubernetes 将Docker Engine节点从dockershim迁移到cri-dockerd
  3. Kubernetes CNI插件相关错误故障排除
  4. Kubernetes 查明节点上所使用的容器运行时
  5. Kubernetes 检查弃用Dockershim是否对你有影响
  6. Kubernetes 从dockershim迁移遥测和安全代理
2. Kubernetes 用kubeadm进行管理
  1. Kubernetes 使用kubeadm进行证书管理
  2. Kubernetes 配置cgroup驱动
  3. Kubernetes 重新配置kubeadm集群
  4. Kubernetes 升级kubeadm集群
  5. Kubernetes 添加Windows节点
  6. Kubernetes 升级Windows节点
3. Kubernetes 手动生成证书
4. Kubernetes 管理内存，CPU和API资源
  1. Kubernetes 为命名空间配置默认的内存请求和限制
  2. Kubernetes 为命名空间配置默认的CPU请求和限制
  3. Kubernetes 配置命名空间的最小和最大内存约束
  4. Kubernetes 为命名空间配置CPU最小和最大约束
  5. Kubernetes 为命名空间配置内存和CPU配额
  6. Kubernetes 配置命名空间下Pod配额
5. Kubernetes 安装网络策略驱动
  1. Kubernetes 使用Antrea提供NetworkPolicy
  2. Kubernetes 使用Calico提供NetworkPolicy
  3. Kubernetes 使用Cilium提供NetworkPolicy
  4. Kubernetes 使用kube-router提供NetworkPolicy
  5. Kubernetes 使用Romana提供NetworkPolicy
  6. Kubernetes 使用Weave Net提供NetworkPolicy
6. Kubernetes IP Masquerade Agent用户指南
7. Kubernetes 云管理控制器
8. Kubernetes 验证签名的容器镜像
9. Kubernetes 运行 etcd 集群
10. Kubernetes 为系统守护进程预留计算资源
11. Kubernetes 为节点发布扩展资源
12. Kubernetes 以非root用户身份运行Kubernetes节点组件
13. Kubernetes 使用CoreDNS进行服务发现
14. Kubernetes 使用KMS驱动进行数据加密
15. Kubernetes 使用Kubernetes API访问集群
16. Kubernetes 使用NUMA感知的内存管理器
17. Kubernetes 保护集群
18. Kubernetes 关键插件Pod的调度保证
19. Kubernetes 升级集群
20. Kubernetes 名字空间演练
21. Kubernetes 启用/禁用Kubernetes API
22. Kubernetes 在Kubernetes集群中使用NodeLocal DNSCache
23. Kubernetes 在Kubernetes集群中使用sysctl
24. Kubernetes 在运行中的集群上重新配置节点的kubelet
25. Kubernetes 在集群中使用级联删除
26. Kubernetes 声明网络策略
27. Kubernetes 安全地清空一个节点
28. Kubernetes 开发云控制器管理器
29. Kubernetes 开启服务拓扑
30. Kubernetes 控制节点上的CPU管理策略
31. Kubernetes 控制节点上的拓扑管理策略
32. Kubernetes 改变默认StorageClass
33. Kubernetes 更改PersistentVolume的回收策略
34. Kubernetes 自动扩缩集群DNS服务
35. Kubernetes 自定义DNS服务
36. Kubernetes 调试DNS问题
37. Kubernetes 迁移多副本的控制面以使用云控制器管理器
38. Kubernetes 通过名字空间共享集群
39. Kubernetes 通过配置文件设置Kubelet参数
40. Kubernetes 配置API对象配额
41. Kubernetes 限制存储消耗
42. Kubernetes 静态加密Secret数据
Kubernetes 配置Pods和容器
1. Kubernetes 为容器和Pod分配内存资源
2. Kubernetes 为Windows Pod和容器配置GMSA
3. Kubernetes 为Windows的Pod和容器配置RunAsUserName
4. Kubernetes 为容器和Pods分配CPU资源
5. Kubernetes 创建Windows HostProcess Pod
6. Kubernetes 配置Pod的服务质量
7. Kubernetes 为容器分派扩展资源
8. Kubernetes 配置Pod以使用卷进行存储
9. Kubernetes 配置Pod以使用PersistentVolume作为存储
10. Kubernetes 配置Pod使用投射卷作存储
11. Kubernetes 为Pod或容器配置安全上下文
12. Kubernetes 为Pod配置服务账户
13. Kubernetes 从私有仓库拉取镜像
14. Kubernetes 配置存活、就绪和启动探测器
15. Kubernetes 将Pod分配给节点
16. Kubernetes 用节点亲和性把Pods分配到节点
17. Kubernetes 配置Pod初始化
18. Kubernetes 为容器的生命周期事件设置处理函数
19. Kubernetes 配置Pod使用ConfigMap
20. Kubernetes 在Pod中的容器之间共享进程命名空间
21. Kubernetes 创建静态Pod
22. Kubernetes 将Docker Compose文件转换为Kubernetes资源
23. Kubernetes 从PodSecurityPolicy迁移到内置的PodSecurity准入控制器
24. Kubernetes 使用名字空间标签来实施Pod安全性标准
25. Kubernetes 通过配置内置准入控制器实施Pod安全标准
Kubernetes 管理Kubernetes对象
1. Kubernetes 使用配置文件对Kubernetes对象进行声明式管理
2. Kubernetes 使用Kustomize对Kubernetes对象进行声明式管理
3. Kubernetes 使用指令式命令管理Kubernetes对象
4. Kubernetes 使用配置文件对Kubernetes对象进行命令式管理
5. Kubernetes 使用kubectl patch更新API对象
Kubernetes 管理Secrets
1. Kubernetes 使用kubectl管理Secret
2. Kubernetes 使用配置文件管理Secret
3. Kubernetes 使用Kustomize管理Secret
Kubernetes 给应用注入数据
1. Kubernetes 为容器设置启动时要执行的命令和参数
2. Kubernetes 为容器设置环境变量
3. Kubernetes 定义相互依赖的环境变量
4. Kubernetes 通过环境变量将Pod信息呈现给容器
5. Kubernetes 通过文件将Pod信息呈现给容器
6. Kubernetes 使用Secret安全地分发凭证
Kubernetes 运行应用
1. Kubernetes 使用Deployment运行一个无状态应用
2. Kubernetes 运行一个单实例有状态应用
3. Kubernetes 运行一个有状态的应用程序
4. Kubernetes 删除StatefulSet
5. Kubernetes 强制删除StatefulSet中的Pods
6. Kubernetes Pod水平自动扩缩
7. Kubernetes HorizontalPodAutoscaler演练
8. Kubernetes 为应用程序设置干扰预算（Disruption Budget）
9. Kubernetes 从Pod中访问Kubernetes API
10. Kubernetes 扩缩StatefulSet
Kubernetes 运行Jobs
1. Kubernetes 使用CronJob运行自动化任务
2. Kubernetes 使用工作队列进行粗粒度并行处理
3. Kubernetes 使用工作队列进行精细的并行处理
4. Kubernetes 使用索引作业完成静态工作分配下的并行处理
5. Kubernetes 使用展开的方式进行并行处理
Kubernetes 访问集群中的应用程序
1. Kubernetes 部署和访问Kubernetes仪表板（Dashboard）
2. Kubernetes 访问集群
3. Kubernetes 使用端口转发来访问集群中的应用
4. Kubernetes 使用服务来访问集群中的应用
5. Kubernetes 使用Service把前端连接到后端
6. Kubernetes 创建外部负载均衡器
7. Kubernetes 列出集群中所有运行容器的镜像
8. Kubernetes 在Minikube环境中使用NGINX Ingress控制器配置Ingress
9. Kubernetes 为集群配置DNS
10. Kubernetes 同Pod内的容器使用共享卷通信
11. Kubernetes 访问集群上运行的服务
12. Kubernetes 配置对多集群的访问
Kubernetes 扩展Kubernetes
1. Kubernetes 使用自定义资源
  1. Kubernetes 使用CustomResourceDefinition扩展Kubernetes API
  2. Kubernetes CustomResourceDefinition的版本
2. Kubernetes 配置聚合层
3. Kubernetes 安装一个扩展的API server
4. Kubernetes 配置多个调度器
5. Kubernetes 使用HTTP代理访问Kubernetes API
6. Kubernetes 使用SOCKS5代理访问Kubernetes API
7. Kubernetes 设置Konnectivity服务
Kubernetes TLS
1. Kubernetes 为kubelet配置证书轮换
2. Kubernetes 手动轮换CA证书
3. Kubernetes 管理集群中的TLS认证
Kubernetes 管理集群守护进程
1. Kubernetes 对DaemonSet执行滚动更新
2. Kubernetes 对DaemonSet执行回滚
Kubernetes 安装服务目录
1. Kubernetes 使用Helm安装Service Catalog
2. Kubernetes 使用SC安装服务目录
Kubernetes 网络
1. Kubernetes 使用HostAliases向Pod /etc/hosts文件添加条目
2. Kubernetes 验证IPv4/IPv6双协议栈
Kubernetes 任务
1. Kubernetes 调度GPUs
2. Kubernetes 管理巨页（HugePages）
3. Kubernetes 配置kubelet镜像凭据提供程序
4. Kubernetes 用插件扩展kubectl
Kubernetes 安全
1. Kubernetes 使用AppArmor限制容器对资源的访问
2. Kubernetes 在集群级别应用Pod安全标准
3. Kubernetes 在名字空间级别应用Pod安全标准
4. Kubernetes 使用seccomp限制容器的系统调用
Kubernetes 无状态应用程序
1. Kubernetes 公开外部IP地址以访问集群中应用程序
2. Kubernetes 示例：使用Redis部署PHP留言板应用程序
Kubernetes 有状态的应用
1. Kubernetes StatefulSet基础
2. Kubernetes 示例：使用Persistent Volumes部署WordPress和MySQL
3. Kubernetes 示例：使用StatefulSet部署Cassandra
4. Kubernetes 运行ZooKeeper，一个分布式协调系统
Kubernetes Service
1. Kubernetes 使用源IP

阅读(2.5k) 书签赞(0) 我要纠错

Kubernetes 为 Pod 和容器管理资源

2022-05-21 14:57 更新

为 Pod 和容器管理资源

当你定义 Pod 时可以选择性地为每个容器设定所需要的资源数量。最常见的可设定资源是 CPU 和内存（RAM）大小；此外还有其他类型的资源。

当你为 Pod 中的 Container 指定了资源请求时， kube-scheduler 就利用该信息决定将 Pod 调度到哪个节点上。当你还为 Container 指定了资源约束时，kubelet 就可以确保运行的容器不会使用超出所设约束的资源。 kubelet 还会为容器预留所请求数量的系统资源，供其使用。

请求和约束

如果 Pod 运行所在的节点具有足够的可用资源，容器可能（且可以）使用超出对应资源 request 属性所设置的资源量。不过，容器不可以使用超出其资源 limit 属性所设置的资源量。

例如，如果你将容器的 memory 的请求量设置为 256 MiB，而该容器所处的 Pod 被调度到一个具有 8 GiB 内存的节点上，并且该节点上没有其他 Pods 运行，那么该容器就可以尝试使用更多的内存。

如果你将某容器的 memory 约束设置为 4 GiB，kubelet （和容器运行时）就会确保该约束生效。容器运行时会禁止容器使用超出所设置资源约束的资源。例如：当容器中进程尝试使用超出所允许内存量的资源时，系统内核会将尝试申请内存的进程终止，并引发内存不足（OOM）错误。

约束值可以以被动方式来实现（系统会在发现违例时进行干预），或者通过强制生效的方式实现（系统会避免容器用量超出约束值）。不同的容器运行时采用不同方式来实现相同的限制。

Note:
如果你为某个资源指定了限制，但不指定请求，并且没有应用准入时机制为该资源设置默认请求，然后 Kubernetes 复制你所指定的限制值，将其用作资源的请求值。

资源类型

CPU 和内存都是资源类型。每种资源类型具有其基本单位。 CPU 表达的是计算处理能力，其单位是 Kubernetes CPUs。内存的单位是字节。对于 Linux 负载，则可以指定巨页（Huge Page）资源。巨页是 Linux 特有的功能，节点内核在其中分配的内存块比默认页大小大得多。

例如，在默认页面大小为 4KiB 的系统上，你可以指定约束 hugepages-2Mi: 80Mi。如果容器尝试分配 40 个 2MiB 大小的巨页（总共 80 MiB ），则分配请求会失败。

Note:
你不能过量使用 hugepages- * 资源。这与 memory 和 cpu 资源不同。

CPU 和内存统称为“计算资源”，或简称为“资源”。计算资源的数量是可测量的，可以被请求、被分配、被消耗。它们与 API 资源不同。 API 资源（如 Pod 和 Service）是可通过 Kubernetes API 服务器读取和修改的对象。

Pod 和容器的资源请求和约束

针对每个容器，你都可以指定其资源约束和请求，包括如下选项：

spec.containers[].resources.limits.cpu
spec.containers[].resources.limits.memory
spec.containers[].resources.limits.hugepages-<size>
spec.containers[].resources.requests.cpu
spec.containers[].resources.requests.memory
spec.containers[].resources.requests.hugepages-<size>

尽管你只能逐个容器地指定请求和限制值，考虑 Pod 的总体资源请求和约束也是有用的。对特定资源而言，Pod 的资源请求/约束值是 Pod 中各容器对该类型资源的请求/约束值的总和。

Kubernetes 中的资源单位

CPU 资源单位

CPU 资源的约束和请求以 “cpu” 为单位。在 Kubernetes 中，一个 CPU 等于1 个物理 CPU 核或者一个虚拟核，取决于节点是一台物理主机还是运行在某物理主机上的虚拟机。

你也可以表达带小数 CPU 的请求。当你定义一个容器，将其 spec.containers[].resources.requests.cpu 设置为 0.5 时，你所请求的 CPU 是你请求 1.0 CPU 时的一半。对于 CPU 资源单位，数量表达式 0.1 等价于表达式 100m，可以看作 “100 millicpu”。有些人说成是“一百毫核”，其实说的是同样的事情。

CPU 资源总是设置为资源的绝对数量而非相对数量值。例如，无论容器运行在单核、双核或者 48-核的机器上，500m CPU 表示的是大约相同的计算能力。

Note:
Kubernetes 不允许设置精度小于 1m 的 CPU 资源。因此，当 CPU 单位小于 1 或 1000m 时，使用毫核的形式是有用的；例如 5m 而不是 0.005。

内存资源单位

memory 的约束和请求以字节为单位。你可以使用普通的证书，或者带有以下数量后缀的定点数字来表示内存：E、P、T、G、M、k。你也可以使用对应的 2 的幂数：Ei、Pi、Ti、Gi、Mi、Ki。例如，以下表达式所代表的是大致相同的值：

128974848、129e6、129M、128974848000m、123Mi

请注意后缀的大小写。如果你请求 400m 内存，实际上请求的是 0.4 字节。如果有人这样设定资源请求或限制，可能他的实际想法是申请 400 兆字节（400Mi）或者 400M 字节。

容器资源示例

以下 Pod 有两个容器。每个容器的请求为 0.25 CPU 和 64MiB（226 字节）内存，每个容器的资源约束为 0.5 CPU 和 128MiB 内存。你可以认为该 Pod 的资源请求为 0.5 CPU 和 128 MiB 内存，资源限制为 1 CPU 和 256MiB 内存。

apiVersion: v1
kind: Pod
metadata:
  name: frontend
spec:
  containers:
  - name: app
    image: images.my-company.example/app:v4
    resources:
      requests:
        memory: "64Mi"
        cpu: "250m"
      limits:
        memory: "128Mi"
        cpu: "500m"
  - name: log-aggregator
    image: images.my-company.example/log-aggregator:v6
    resources:
      requests:
        memory: "64Mi"
        cpu: "250m"
      limits:
        memory: "128Mi"
        cpu: "500m"

带资源请求的 Pod 如何调度

当你创建一个 Pod 时，Kubernetes 调度程序将为 Pod 选择一个节点。每个节点对每种资源类型都有一个容量上限：可为 Pod 提供的 CPU 和内存量。调度程序确保对于每种资源类型，所调度的容器的资源请求的总和小于节点的容量。请注意，尽管节点上的实际内存或 CPU 资源使用量非常低，如果容量检查失败，调度程序仍会拒绝在该节点上放置 Pod。当稍后节点上资源用量增加，例如到达请求率的每日峰值区间时，节点上也不会出现资源不足的问题。

Kubernetes 应用资源请求与约束的方式

当 kubelet 启动 Pod 中的容器时，它会将容器的 CPU 和内存请求与约束信息传递给容器运行时。

在 Linux 系统上，容器运行时通常会配置内核 CGroups，负责应用并实施所定义的请求。

CPU 约束值定义的是容器可使用的 CPU 时间的硬性上限。在每个调度周期（时间片）期间，Linux 内核检查是否已经超出该约束值；内核会在允许该 cgroup 恢复执行之前会等待。
CPU 请求值定义的是一个权重值。如果若干不同的容器（CGroups）需要在一个共享的系统上竞争运行， CPU 请求值大的负载会获得比请求值小的负载更多的 CPU 时间。
内存请求值主要用于（Kubernetes）Pod 调度期间。在一个启用了 CGroup v2 的节点上，容器运行时可能会使用内存请求值作为设置 memory.min 和 memory.low 的提示值。
内存约束值定义的是 CGroup 的内存约束。如果容器尝试分配的内存量超出约束值，则 Linux 内核的内存不足处理子系统会被激活，并停止尝试分配内存的容器中的某个进程。如果该进程在容器中 PID 为 1，而容器被标记为可重新启动，则 Kubernetes 会重新启动该容器。
Pod 或容器的内存约束值也适用于通过内存供应的卷，例如 emptyDir 卷。 kubelet 会跟踪 tmpfs 形式的 emptyDir 卷用量，将其作为容器的内存用量，而不是临时存储用量。

如果某容器内存用量超过其内存请求值并且所在节点内存不足时，容器所处的 Pod 可能被逐出.

每个容器可能被允许也可能不被允许使用超过其 CPU 约束的处理时间。但是，容器运行时不会由于 CPU 使用率过高而杀死 Pod 或容器。

监控计算和内存资源用量

kubelet 会将 Pod 的资源使用情况作为 Pod status 的一部分来报告的。

如果为集群配置了可选的监控工具，则可以直接从指标 API 或者监控工具获得 Pod 的资源使用情况。

本地临时存储

FEATURE STATE: Kubernetes v1.10 [beta]

节点通常还可以具有本地的临时性存储，由本地挂接的可写入设备或者有时也用 RAM 来提供支持。 “临时（Ephemeral）”意味着对所存储的数据不提供长期可用性的保证。

Pods 通常可以使用临时性本地存储来实现缓冲区、保存日志等功能。 kubelet 可以为使用本地临时存储的 Pods 提供这种存储空间，允许后者使用 emptyDir 类型的卷将其挂载到容器中。

kubelet 也使用此类存储来保存节点层面的容器日志，容器镜像文件、以及运行中容器的可写入层。

Caution: 如果节点失效，存储在临时性存储中的数据会丢失。你的应用不能对本地临时性存储的性能 SLA（例如磁盘 IOPS）作任何假定。

作为一种 beta 阶段功能特性，Kubernetes 允许你跟踪、预留和限制 Pod 可消耗的临时性本地存储数量。

本地临时性存储的配置

Kubernetes 有两种方式支持节点上配置本地临时性存储：

单一文件系统

采用这种配置时，你会把所有类型的临时性本地数据（包括 emptyDir 卷、可写入容器层、容器镜像、日志等）放到同一个文件系统中。作为最有效的 kubelet 配置方式，这意味着该文件系统是专门提供给 Kubernetes （kubelet）来保存数据的。

kubelet 也会生成节点层面的容器日志，并按临时性本地存储的方式对待之。

kubelet 会将日志写入到所配置的日志目录（默认为 /var/log）下的文件中；还会针对其他本地存储的数据使用同一个基础目录（默认为 /var/lib/kubelet）。

通常，/var/lib/kubelet 和 /var/log 都是在系统的根文件系统中。kubelet 的设计也考虑到这一点。

你的集群节点当然可以包含其他的、并非用于 Kubernetes 的很多文件系统。

双文件系统

你使用节点上的某个文件系统来保存运行 Pods 时产生的临时性数据：日志和 emptyDir 卷等。你可以使用这个文件系统来保存其他数据（例如：与 Kubernetes 无关的其他系统日志）；这个文件系统还可以是根文件系统。

kubelet 也将节点层面的容器日志写入到第一个文件系统中，并按临时性本地存储的方式对待之。

同时你使用另一个由不同逻辑存储设备支持的文件系统。在这种配置下，你会告诉 kubelet 将容器镜像层和可写层保存到这第二个文件系统上的某个目录中。

第一个文件系统中不包含任何镜像层和可写层数据。

当然，你的集群节点上还可以有很多其他与 Kubernetes 没有关联的文件系统。

kubelet 能够度量其本地存储的用量。实现度量机制的前提是：

LocalStorageCapacityIsolation 特性门控被启用（默认状态），并且
你已经对节点进行了配置，使之使用所支持的本地临时性储存配置方式之一

如果你的节点配置不同于以上预期，kubelet 就无法对临时性本地存储的资源约束实施限制。

Note: kubelet 会将 tmpfs emptyDir 卷的用量当作容器内存用量，而不是本地临时性存储来统计。

为本地临时性存储设置请求和约束值

你可以使用 ephemeral-storage 来管理本地临时性存储。 Pod 中的每个容器可以设置以下属性：

spec.containers[].resources.limits.ephemeral-storage
spec.containers[].resources.requests.ephemeral-storage

ephemeral-storage 的请求和约束值是按量纲计量的。你可以使用一般整数或者定点数字加上下面的后缀来表达存储量：E、P、T、G、M、K。你也可以使用对应的 2 的幂级数来表达：Ei、Pi、Ti、Gi、Mi、Ki。例如，下面的表达式所表达的大致是同一个值：

128974848
129e6
129M
123Mi

在下面的例子中，Pod 包含两个容器。每个容器请求 2 GiB 大小的本地临时性存储。每个容器都设置了 4 GiB 作为其本地临时性存储的约束值。因此，整个 Pod 的本地临时性存储请求是 4 GiB，且其本地临时性存储的约束为 8 GiB。

apiVersion: v1
kind: Pod
metadata:
  name: frontend
spec:
  containers:
  - name: app
    image: images.my-company.example/app:v4
    resources:
      requests:
        ephemeral-storage: "2Gi"
      limits:
        ephemeral-storage: "4Gi"
    volumeMounts:
    - name: ephemeral
      mountPath: "/tmp"
  - name: log-aggregator
    image: images.my-company.example/log-aggregator:v6
    resources:
      requests:
        ephemeral-storage: "2Gi"
      limits:
        ephemeral-storage: "4Gi"
    volumeMounts:
    - name: ephemeral
      mountPath: "/tmp"
  volumes:
    - name: ephemeral
      emptyDir: {}

带临时性存储的 Pods 的调度行为

当你创建一个 Pod 时，Kubernetes 调度器会为 Pod 选择一个节点来运行之。每个节点都有一个本地临时性存储的上限，是其可提供给 Pods 使用的总量。

调度器会确保所调度的容器的资源请求总和不会超出节点的资源容量。

临时性存储消耗的管理

如果 kubelet 将本地临时性存储作为资源来管理，则 kubelet 会度量以下各处的存储用量：

emptyDir 卷，除了 tmpfs emptyDir 卷
保存节点层面日志的目录
可写入的容器镜像层

如果某 Pod 的临时存储用量超出了你所允许的范围，kubelet 会向其发出逐出（eviction）信号，触发该 Pod 被逐出所在节点。

就容器层面的隔离而言，如果某容器的可写入镜像层和日志用量超出其存储约束， kubelet 也会将所在的 Pod 标记为逐出候选。

就 Pod 层面的隔离而言，kubelet 会将 Pod 中所有容器的约束值相加，得到 Pod 存储约束的总值。如果所有容器的本地临时性存储用量总和加上 Pod 的 emptyDir 卷的用量超出 Pod 存储约束值，kubelet 也会将该 Pod 标记为逐出候选。

Caution:
如果 kubelet 没有度量本地临时性存储的用量，即使 Pod 的本地存储用量超出其约束值也不会被逐出。
不过，如果用于可写入容器镜像层、节点层面日志或者 emptyDir 卷的文件系统中可用空间太少，节点会为自身设置本地存储不足的污点标签。这一污点会触发对那些无法容忍该污点的 Pods 的逐出操作。

kubelet 支持使用不同方式来度量 Pod 的存储用量：

周期性扫描

kubelet 按预定周期执行扫描操作，检查 emptyDir 卷、容器日志目录以及可写入容器镜像层。

这一扫描会度量存储空间用量。

Note:
在这种模式下，kubelet 并不检查已删除文件所对应的、仍处于打开状态的文件描述符。
如果你（或者容器）在 emptyDir 卷中创建了一个文件，写入一些内容之后再次打开该文件并执行了删除操作，所删除文件对应的 inode 仍然存在，直到你关闭该文件为止。 kubelet 不会将该文件所占用的空间视为已使用空间。

文件系统项目配额

FEATURE STATE: Kubernetes v1.15 [alpha]

项目配额（Project Quota）是一个操作系统层的功能特性，用来管理文件系统中的存储用量。在 Kubernetes 中，你可以启用项目配额以监视存储用量。你需要确保节点上为 emptyDir 提供存储的文件系统支持项目配额。例如，XFS 和 ext4fs 文件系统都支持项目配额。

Note: 项目配额可以帮你监视存储用量，但无法对存储约束执行限制。

Kubernetes 所使用的项目 ID 始于 1048576。所使用的 IDs 会注册在 /etc/projects 和 /etc/projid 文件中。如果该范围中的项目 ID 已经在系统中被用于其他目的，则已占用的项目 IDs 也必须注册到 /etc/projects 和 /etc/projid 中，这样 Kubernetes 才不会使用它们。

配额方式与目录扫描方式相比速度更快，结果更精确。当某个目录被分配给某个项目时，该目录下所创建的所有文件都属于该项目，内核只需要跟踪该项目中的文件所使用的存储块个数。如果某文件被创建后又被删除，但对应文件描述符仍处于打开状态，该文件会继续耗用存储空间。配额跟踪技术能够精确第记录对应存储空间的状态，而目录扫描方式会忽略被删除文件所占用的空间。

如果你希望使用项目配额，你需要：

在 kubelet 配置中使用 featureGates 字段或者使用 --feature-gates 命令行参数启用 LocalStorageCapacityIsolationFSQuotaMonitoring=true 特性门控。
确保根文件系统（或者可选的运行时文件系统）启用了项目配额。所有 XFS 文件系统都支持项目配额。对 extf 文件系统而言，你需要在文件系统尚未被挂载时启用项目配额跟踪特性：

# 对 ext4 而言，在 /dev/block-device 尚未被挂载时执行下面操作
sudo tune2fs -O project -Q prjquota /dev/block-device

确保根文件系统（或者可选的运行时文件系统）在挂载时项目配额特性是被启用了的。对于 XFS 和 ext4fs 而言，对应的挂载选项称作 prjquota。

扩展资源（Extended Resources）

扩展资源是 kubernetes.io 域名之外的标准资源名称。它们使得集群管理员能够颁布非 Kubernetes 内置资源，而用户可以使用他们。

使用扩展资源需要两个步骤。首先，集群管理员必须颁布扩展资源。其次，用户必须在 Pod 中请求扩展资源。

管理扩展资源

节点级扩展资源

节点级扩展资源绑定到节点。

其他资源

为了颁布新的节点级扩展资源，集群操作员可以向 API 服务器提交 PATCH HTTP 请求，以在集群中节点的 status.capacity 中为其配置可用数量。完成此操作后，节点的 status.capacity 字段中将包含新资源。 kubelet 会异步地对 status.allocatable 字段执行自动更新操作，使之包含新资源。

由于调度器在评估 Pod 是否适合在某节点上执行时会使用节点的 status.allocatable 值，调度器只会考虑异步更新之后的新值。在更新节点容量使之包含新资源之后和请求该资源的第一个 Pod 被调度到该节点之间，可能会有短暂的延迟。

示例：

这是一个示例，显示了如何使用 curl 构造 HTTP 请求，公告主节点为 k8s-master 的节点 k8s-node-1 上存在五个 example.com/foo 资源。

curl --header "Content-Type: application/json-patch+json" \
--request PATCH \
--data '[{"op": "add", "path": "/status/capacity/example.com~1foo", "value": "5"}]' \
http://k8s-master:8080/api/v1/nodes/k8s-node-1/status

Note: 在前面的请求中，~1 是在 patch 路径中对字符 / 的编码。 JSON-Patch 中的操作路径的值被视为 JSON-Pointer 类型。有关更多详细信息，请参见 IETF RFC 6901 第 3 节。

集群层面的扩展资源

集群层面的扩展资源并不绑定到具体节点。它们通常由调度器扩展程序（Scheduler Extenders）管理，这些程序处理资源消耗和资源配额。

你可以在调度器策略配置中指定由调度器扩展程序处理的扩展资源。

示例：

下面的调度器策略配置标明集群层扩展资源 "example.com/foo" 由调度器扩展程序处理。

仅当 Pod 请求 "example.com/foo" 时，调度器才会将 Pod 发送到调度器扩展程序。
ignoredByScheduler 字段指定调度器不要在其 PodFitsResources 断言中检查 "example.com/foo" 资源。

{
  "kind": "Policy",
  "apiVersion": "v1",
  "extenders": [
    {
      "urlPrefix":"<extender-endpoint>",
      "bindVerb": "bind",
      "managedResources": [
        {
          "name": "example.com/foo",
          "ignoredByScheduler": true
        }
      ]
    }
  ]
}

使用扩展资源

就像 CPU 和内存一样，用户可以在 Pod 的规约中使用扩展资源。调度器负责资源的核算，确保同时分配给 Pod 的资源总量不会超过可用数量。

Note: 扩展资源取代了非透明整数资源（Opaque Integer Resources，OIR）。用户可以使用 kubernetes.io （保留）以外的任何域名前缀。

要在 Pod 中使用扩展资源，请在容器规范的 spec.containers[].resources.limits 映射中包含资源名称作为键。

Note: 扩展资源不能过量使用，因此如果容器规范中同时存在请求和约束，则它们的取值必须相同。

仅当所有资源请求（包括 CPU、内存和任何扩展资源）都被满足时，Pod 才能被调度。在资源请求无法满足时，Pod 会保持在 PENDING 状态。

示例：

下面的 Pod 请求 2 个 CPU 和 1 个 "example.com/foo"（扩展资源）。

apiVersion: v1
kind: Pod
metadata:
  name: my-pod
spec:
  containers:
  - name: my-container
    image: myimage
    resources:
      requests:
        cpu: 2
        example.com/foo: 1
      limits:
        example.com/foo: 1

PID 限制

进程 ID（PID）限制允许对 kubelet 进行配置，以限制给定 Pod 可以消耗的 PID 数量。

疑难解答

我的 Pod 处于悬决状态且事件信息显示 FailedScheduling

如果调度器找不到该 Pod 可以匹配的任何节点，则该 Pod 将保持未被调度状态，直到找到一个可以被调度到的位置。每当调度器找不到 Pod 可以调度的地方时，会产生一个 Event。你可以使用 kubectl 来查看 Pod 的事件；例如：

kubectl describe pod frontend | grep -A 9999999999 Events

Events:
  Type     Reason            Age   From               Message
  ----     ------            ----  ----               -------
  Warning  FailedScheduling  23s   default-scheduler  0/42 nodes available: insufficient cpu

在上述示例中，由于节点上的 CPU 资源不足，名为 “frontend” 的 Pod 无法被调度。由于内存不足（PodExceedsFreeMemory）而导致失败时，也有类似的错误消息。一般来说，如果 Pod 处于悬决状态且有这种类型的消息时，你可以尝试如下几件事情：

向集群添加更多节点。
终止不需要的 Pod，为悬决的 Pod 腾出空间。
检查 Pod 所需的资源是否超出所有节点的资源容量。例如，如果所有节点的容量都是cpu：1，那么一个请求为 cpu: 1.1 的 Pod 永远不会被调度。
检查节点上的污点设置。如果集群中节点上存在污点，而新的 Pod 不能容忍污点，调度器只会考虑将 Pod 调度到不带有该污点的节点上。

你可以使用 kubectl describe nodes 命令检查节点容量和已分配的资源数量。例如：

kubectl describe nodes e2e-test-node-pool-4lw4

Name:            e2e-test-node-pool-4lw4
[ ... 这里忽略了若干行以便阅读 ...]
Capacity:
 cpu:                               2
 memory:                            7679792Ki
 pods:                              110
Allocatable:
 cpu:                               1800m
 memory:                            7474992Ki
 pods:                              110
[ ... 这里忽略了若干行以便阅读 ...]
Non-terminated Pods:        (5 in total)
  Namespace    Name                                  CPU Requests  CPU Limits  Memory Requests  Memory Limits
  ---------    ----                                  ------------  ----------  ---------------  -------------
  kube-system  fluentd-gcp-v1.38-28bv1               100m (5%)     0 (0%)      200Mi (2%)       200Mi (2%)
  kube-system  kube-dns-3297075139-61lj3             260m (13%)    0 (0%)      100Mi (1%)       170Mi (2%)
  kube-system  kube-proxy-e2e-test-...               100m (5%)     0 (0%)      0 (0%)           0 (0%)
  kube-system  monitoring-influxdb-grafana-v4-z1m12  200m (10%)    200m (10%)  600Mi (8%)       600Mi (8%)
  kube-system  node-problem-detector-v0.1-fj7m3      20m (1%)      200m (10%)  20Mi (0%)        100Mi (1%)
Allocated resources:
  (Total limits may be over 100 percent, i.e., overcommitted.)
  CPU Requests    CPU Limits    Memory Requests    Memory Limits
  ------------    ----------    ---------------    -------------
  680m (34%)      400m (20%)    920Mi (12%)        1070Mi (14%)

在上面的输出中，你可以看到如果 Pod 请求超过 1120m CPU 或者 6.23Gi 内存，节点将无法满足。

通过查看 "Pods" 部分，你将看到哪些 Pod 占用了节点上的资源。

Pods 可用的资源量低于节点的资源总量，因为系统守护进程也会使用一部分可用资源。在 Kubernetes API 中，每个 Node 都有一个 .status.allocatable 字段。

字段 .status.allocatable 描述节点上可以用于 Pod 的资源总量（例如：15 个虚拟 CPU、7538 MiB 内存）。

你可以配置资源配额功能特性以限制每个名字空间可以使用的资源总量。当某名字空间中存在 ResourceQuota 时，Kubernetes 会在该名字空间中的对象强制实施配额。例如，如果你为不同的团队分配名字空间，你可以为这些名字空间添加 ResourceQuota。设置资源配额有助于防止一个团队占用太多资源，以至于这种占用会影响其他团队。

你还需要考虑为这些名字空间设置授权访问：为名字空间提供全部的写权限时，具有合适权限的人可能删除所有资源，包括所配置的 ResourceQuota。

我的容器被终止了

你的容器可能因为资源紧张而被终止。要查看容器是否因为遇到资源限制而被杀死，请针对相关的 Pod 执行 kubectl describe pod：

kubectl describe pod simmemleak-hra99

输出类似于：

Name:                           simmemleak-hra99
Namespace:                      default
Image(s):                       saadali/simmemleak
Node:                           kubernetes-node-tf0f/10.240.216.66
Labels:                         name=simmemleak
Status:                         Running
Reason:
Message:
IP:                             10.244.2.75
Containers:
  simmemleak:
    Image:  saadali/simmemleak
    Limits:
      cpu:                      100m
      memory:                   50Mi
    State:                      Running
      Started:                  Tue, 07 Jul 2015 12:54:41 -0700
    Last Termination State:     Terminated
      Exit Code:                1
      Started:                  Fri, 07 Jul 2015 12:54:30 -0700
      Finished:                 Fri, 07 Jul 2015 12:54:33 -0700
    Ready:                      False
    Restart Count:              5
Conditions:
  Type      Status
  Ready     False
Events:
  Type    Reason     Age   From               Message
  ----    ------     ----  ----               -------
  Normal  Scheduled  42s   default-scheduler  Successfully assigned simmemleak-hra99 to kubernetes-node-tf0f
  Normal  Pulled     41s   kubelet            Container image "saadali/simmemleak:latest" already present on machine
  Normal  Created    41s   kubelet            Created container simmemleak
  Normal  Started    40s   kubelet            Started container simmemleak
  Normal  Killing    32s   kubelet            Killing container with id ead3fb35-5cf5-44ed-9ae1-488115be66c6: Need to kill Pod

在上面的例子中，Restart Count: 5 意味着 Pod 中的 simmemleak 容器被终止并且（到目前为止）重启了五次。原因 OOMKilled 显示容器尝试使用超出其限制的内存量。

你接下来要做的或许是检查应用代码，看看是否存在内存泄露。如果你发现应用的行为与你所预期的相同，则可以考虑为该容器设置一个更高的内存约束（也可能需要设置请求值）。

以上内容是否对您有帮助：

← Kubernetes Secret

Kubernetes 使用 kubeconfig 文件组织集群访问 →

写笔记

我要补充