2023-11-24
gpu
00

推荐一个轻量级的gpu stress test 工具

1. 介绍:

这是一个体量很小且运行很简单的在容器中运行的 gpu stress test 工具,镜像是作者7年以前提交的,惊喜的是现在仍然能运行。倍感惊喜!!! dockerhub链接: https://hub.docker.com/r/chrstnhntschl/gpu_burn

2. 步骤:

  1. 确保 nvidia-docker2 已经安装
  2. docker pull chrstnhntschl/gpu_burn
  3. nvidia-docker run --rm chrstnhntschl/gpu_burn
    120

3. result

2023-11-23
slurm集群
00

前言

这是一个使用最新版本的slurm(23.02)进行GPU集群部署配置的示例,并进行了初步测试。鉴于slurm官方文档内容的稀缺和不够丰富,使得很多slurm初学者经常在部署这里踩坑。希望本文档能够对他们有所帮助。