你大爷的大爷的大大爷 发表于 2023-12-26 18:54:43

在linux中查看运行指定进程资源占用(cpu+gpu)

在运行程序时有时候会需要查看资源占用,以方便部署在其他服务器上时进行参考。以下是总结了我在linux上查找程序进程资源的两种方法(cpu和gpu都有)。
CPU

1. 查找进程号

如果进程较多,输入 ps -ef | grep+ 指令关键词 进行搜索。如果运行的是python程序,可以输入 ps -ef | grep python3
比如我想查找所有指令中含hello关键词的进程,输入:ps -ef | grep hello
输出示例:
user      52584759140 13:22 pts/9    00:00:00 docker run -it -p 8887:8887 image_hello:v1
user           12345123450 13:21 pts/4    00:00:00 python3 hello.py其中第二列为pid
2. 查看指定进程号

用top指令查看指定进程(例如我这里查看PID为3833)的进程:
top -p 3833出现以下内容:
Tasks:   1 total,   0 running,   1 sleeping,   0 stopped,   0 zombie
%Cpu(s): 30.8 us, 11.3 sy,0.0 ni, 55.6 id,2.2 wa,0.0 hi,0.1 si,0.0 st
KiB Mem : 26359936+total, 10537104 free, 64877176 used, 18818508+buff/cache
KiB Swap:      0 total,      0 free,      0 used. 19780235+avail Mem

   PID USER      PRNI    VIRT    RES    SHR S%CPU %MEM   TIME+ COMMAND            
12345 root      20   0   11.1g   1.9g 126324 S13080.8 196:31.05 python3其中 RES代表运行内存,%CPU代表运行占用多少核。每100为1.0核(1.0c),以上示例为13.08c。
其他参数解释

倒数第二行为参数名称,最后一行是参数内容。以上参数解释如下:

[*]PID:Process ID,进程标识号。这是系统用来唯一标识活动进程的数字。
[*]USER:该进程所属的用户名称或ID。
[*]PR:Priority,进程的优先级。它显示了进程的调度优先级,数字越小代表优先级越高。
[*]NI:Nice value,进程的nice值。这是一个用户设定的优先级值,用来影响进程的调度优先级。正值降低优先级,负值增加优先级。
[*]VIRT:Virtual Memory Size,虚拟内存大小,单位通常是KiB。它包括进程使用的所有可用内存,包括交换空间、设备映射和分配但未使用的内存。
[*]RES:Resident Set Size,常驻内存大小。这是该进程已分配的、位于RAM中的非交换区内存的大小,不包括被交换出去的部分。
[*]SHR:Shared Memory,共享内存大小。指的是可被其他进程共享的内存量。
[*]S:Process Status,进程状态。常见状态有:

[*]S (sleeping): 睡眠状态
[*]R (running): 运行状态
[*]T (stopped): 停止状态
[*]Z (zombie): 僵尸状态

[*]%CPU:该进程占用的CPU百分比。
[*]%MEM:该进程占用的物理内存百分比。
[*]TIME+:该进程自启动以来占用的CPU总时间。
[*]COMMAND:启动进程的命令名称或命令行。
GPU


[*]如果是NVIDIA GPU,可以使用 nvidia-smi 命令。它会显示所有NVIDIA GPU的使用情况,包括每个GPU的利用率,以及每个进程的具体GPU使用情况。
[*]nvidia-smi指令示例输出如下:
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 460.32.03    Driver Version: 460.32.03    CUDA Version: 11.2   |
|-------------------------------+----------------------+----------------------+
| GPUName      Persistence-M| Bus-Id      Disp.A | Volatile Uncorr. ECC |
| FanTempPerfPwr:Usage/Cap|         Memory-Usage | GPU-UtilCompute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0GeForce RTX 3080    Off| 00000000:01:00.0On |                  N/A |
| 30%   55C    P2    70W / 320W |   5478MiB / 10018MiB |   28%      Default |
+-------------------------------+----------------------+----------------------+
                                                                           
+-----------------------------------------------------------------------------+
| Processes:                                                                  |
|GPU   GI   CI      PID   Type   Process name                  GPU Memory |
|      ID   ID                                                   Usage      |
|=============================================================================|
|    0   N/AN/A      1569      G   /usr/lib/xorg/Xorg                169MiB |
|    0   N/AN/A      2410      G   /usr/bin/gnome-shell            106MiB |
|    0   N/AN/A      4021      C   python3                        5201MiB |
+-----------------------------------------------------------------------------+Processes部分显示了当前在GPU上运行的进程列表,通常包括进程ID、使用的GPU、使用的内存等信息。通过GPU Memory Usage参数查看每个进程的GPU的显存。
实时监控

nvidia-smi -l 1这里 1 可以替换为其他数字,代表每x秒刷新一次。
Reference


[*]TOP命令参数详解---10分钟学会top用法 - 新盟教育的文章 - 知乎

来源:https://www.cnblogs.com/tungsten106/p/linux_check_resources.html
免责声明:由于采集信息均来自互联网,如果侵犯了您的权益,请联系我们【E-Mail:cb@itdo.tech】 我们会及时删除侵权内容,谢谢合作!
页: [1]
查看完整版本: 在linux中查看运行指定进程资源占用(cpu+gpu)