显卡使用情况

使用命令

1
nvidia-smi

或每隔5s更新一次显卡信息:

1
watch -n 5 nvidia-smi

image.png

第一部分

| NVIDIA-SMI 525.125.06 Driver Version: 525.125.06 CUDA Version: 12.0 |

  • Driver Version: 显卡驱动版本
  • CUDA Version: CUDA版本

第二部分

| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |

  • GPU: 显卡序号,0, 1, …
  • Name: 显卡型号,例如 NVIDIA GeForce RTX 3090 Ti

| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |

  • Fan: 风扇转速,0到100%,如果风扇损坏则显示N/A
  • Temp: 显卡温度,摄氏度
  • Perf: 性能状态,P0到P12,P0表示最大性能,P12表示最小性能状态
  • Pwr: 显卡功率
  • Memory Usage: 显存使用情况
  • Volatile GPU-Util: 浮动的GPU利用率
  • Compute: 计算模式

第三部分

每个进程的显卡显存使用情况

CPU、内存、网络

可视化界面

一下命令仅用于图形化界面:

1
gnome-system-monitor

查看内存占用

1
free -h -w

image.png

  • total: 总计内存大小
  • used: 已使用内存
  • free: 空闲内存
  • shared: 共享内存
  • buffers: 缓冲区
  • cache: 缓存
  • available: 可用内存

CPU

1
top

image.png

第一行(系统状态)

top - 16:31:54 up 15 days, 41 min, 0 users, load average: 14.45, 14.82, 15.31

  • 16:31:54: 当前系统时间
  • 15 days, 41 min: 当前系统已经连续开机运行了15天41分钟
  • 15 days, 41 min: 有0个用户登录系统(可能远程桌面没被计算)
  • load average: 14.45, 14.82, 15.31: 显示最近1分钟、5分钟、15分钟的负载情况(特定算法计算的值)

第二行(任务进程状态)

Tasks: 771 total, 17 running, 748 sleeping, 0 stopped, 6 zombie

  • Tasks: 771 total: 一共有771个进程
  • 17 running: 有17个进程正在运行
  • 748 sleeping: 有748个进程处于休眠状态
  • 0 stopped: 有0个任务处于被停止状态
  • 6 zombie: 有6个任务处于zombie状态

第三行(CPU状态)

%Cpu(s): 67.4 us, 1.0 sy, 0.0 ni, 31.6 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st

  • 67.4 us: 用户空间占用CPU的百分比为67.4%
  • 1.0 sy: 内核空间占用CPU的百分比为1.0%
  • 0.0 ni: 该变过优先级的任务占用系统CPU的百分比为0%
  • 31.6 id: 空闲CPU百分比为31.6%
  • 0.0 wa: IO等待占用CPU的百分比为0%
  • 0.0 hi: 硬中断占用CPU的百分比为0%
  • 0.0 si: 软中断占用CPU的百分比为0%

第四行(内存状态)

MiB Mem : 64090.2 total, 596.0 free, 15622.8 used, 47871.4 buff/cache

  • 64090.2 total: 物理内存总量 64G
  • 596.0 free: 空闲内存总量 596Mb
  • 15622.8 used: 使用中的内存总量 15622.8Mb
  • 47871.4 buff/cache: 缓存的内存量 47871.4 Mb

第五行(交换分区状态)

MiB Swap: 2048.0 total, 1993.0 free, 55.0 used. 47513.7 avail Mem

  • 2048.0 total: 交换分区总量
  • 1993.0 free: 空闲的交换分区容量
  • 55.0 used: 使用中的交换分区容量
  • 47513.7 avail Mem: 缓冲的交换分区容量

第六行及以下(进程信息)

PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND

  • PID: 进程id
  • USER: 进程所有者的用户名
  • PR: 优先级
  • NI: nice值,负值表示高优先级,正值表示低优先级
  • VIRT: 进程使用的虚拟内存总量,单位kb
  • RES: 进程使用的、未被换出的物理内存大小,单位kb
  • SHR: 共享内存大小,单位kb
  • S: 进程状态。D=不可中断的睡眠状态 R=运行 S=睡眠 T=跟踪/停止 Z=僵尸进程
  • %CPU: 上次更新到现在的CPU时间占用百分比
  • %MEM: 进程使用的物理内存百分比
  • TIME+: 进程使用的CPU时间总计,单位1/100秒
  • COMMAND: 命令名/命令行

参考文章:

  1. kilig _. ubuntu查看GPU信息和使用情况. CSDN
  2. 我有一个魔盒. Ubuntu 查看系统资源占用(CPU、内存、网络). CSDN