翼度科技»论坛 编程开发 python 查看内容

GPU状态监测 nvidia-smi 命令的用法详解

7

主题

7

帖子

21

积分

新手上路

Rank: 1

积分
21
在进行深度学习实验时,GPU 的实时状态监测十分有必要。

今天详细解读一下 nvidia-smi 命令


上图是服务器上 GeForce GTX 1080 Ti 的信息,下面一一解读参数。
上面的表格中的红框中的信息与下面的四个框的信息是一一对应的:

    1. GPU
    复制代码
    :GPU 编号;
    1. Name
    复制代码
    :GPU 型号;
    1. Persistence-M
    复制代码
    :持续模式的状态。持续模式虽然耗能大,但是在新的GPU应用启动时,花费的时间更少,这里显示的是off的状态;
    1. Fan
    复制代码
    :风扇转速,从0到100%之间变动;
    1. Temp
    复制代码
    :温度,单位是摄氏度;
    1. Perf
    复制代码
    :性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能(即 GPU 未工作时为P0,达到最大工作限度时为P12)。
    1. Pwr:Usage/Cap
    复制代码
    :能耗;
    1. Memory Usage
    复制代码
    :显存使用率;
    1. Bus-Id
    复制代码
    :涉及GPU总线的东西,domain:bus:device.function;
    1. Disp.A
    复制代码
    :Display Active,表示GPU的显示是否初始化;
    1. Volatile GPU-Util
    复制代码
    :浮动的GPU利用率;
    1. Uncorr. ECC
    复制代码
    :Error Correcting Code,错误检查与纠正;
    1. Compute M
    复制代码
    :compute mode,计算模式。
下方的 Processes 表示每个进程对 GPU 的显存使用率。

第二个命令:nvidia-smi -L


该命令用于列出所有可用的 NVIDIA 设备信息。
以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

来源:https://www.jb51.net/article/266515.htm
免责声明:由于采集信息均来自互联网,如果侵犯了您的权益,请联系我们【E-Mail:cb@itdo.tech】 我们会及时删除侵权内容,谢谢合作!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x

举报 回复 使用道具