跳转到文档内容
版本:下一个

分配特定 Qos Policy 的设备

用户可以通过 metax-tech.com/sgpu-qos-policy 为任务配置 Qos Policy 参数以指定 sGPU 使用的调度策略。具体的 sGPU 调度策略说明参见下表。

调度策略描述
best-effortsGPU 不限制算力
fixed-sharesGPU 有固定的算力配额,且无法超过固定配额使用
burst-sharesGPU 有固定的算力配额,若 GPU 卡还有空闲算力,就可以被 sGPU 使用
apiVersion: v1
kind: Pod
metadata:
name: gpu-pod
annotations:
metax-tech.com/sgpu-qos-policy: "best-effort" # 分配特定的 qos sgpu
spec:
containers:
- name: ubuntu-container
image: ubuntu:22.04
imagePullPolicy: IfNotPresent
command: ["sleep","infinity"]
resources:
limits:
metax-tech.com/sgpu: 1 # 请求 1 个 GPU
metax-tech.com/vcore: 60 # 每个 GPU 使用 60% 的计算核
metax-tech.com/vmemory: 4 # 每个 GPU 需要 4 GiB 设备显存