跳转到文档内容

1 篇文档带有标签[隔离]

查看全部标签

实验 3: 使用 HAMi 进行 GPU 分区

本实验在 实验 1 的基础上继续。你有一块拥有 15360 MiB 显存的物理 Tesla T4。在本实验中,你将在这一张卡上运行多个 Pod,每个 Pod 都有独立的显存和算力上限,并验证隔离的真实性:当一个 Pod 尝试分配超出其配额的显存时,会触发 CUDA OOM,而相邻 Pod 不受影响继续运行。

CNCFHAMi 是 CNCF Sandbox 项目