查看linux机器gpu配置的命令

说实话,这几年我在Linux机器上遇到过很多GPU配置。
这些命令有效,但您必须知道如何使用它们。

以lspci为例。
上次我在隔壁实验室帮助调试戴尔工作站时,我发现它特别容易使用。
想一想,PCIE插槽只有几个,把显卡插进去,然后用lspci|grep-nvidia(注意是grep-n,不是grep-i,不会犯我犯的同样的错误)。
你可以立即查出该型号是否是RTX 3 09 0之类的,甚至该设备的主要频率和电压参数。
我记得2 01 9 年左右,服务器制造商开始将NV卡直接插入机箱,使用lspci检查这比阅读手册更准确。

最有趣的是Nvidia-SMI。
当我在AWS EC2 上部署深度学习环境时,无法运行模型,最后发现显存被剩余的CUDA驱动进程占用了。
当时我用nvidia-smi查看屏幕,哦!有一个Python进程,其PID为1 2 3 4 5 ,正在使用9 GB视频内存。
直接使用nvidia-smi -d 1 2 3 4 5 查看进程详细信息,也可以看到进程正在运行。
这个工具也经常更新。
我记得2 02 0版本才开始支持温度显示。
在此之前,我必须安装另一个工具。

glxinfo 是比较底层的。
我有一个客户有一台旧的ThinkPad T4 00,集成显卡也支持OpenGL 2 .1 当时,其上安装了ROS机器人操作系统。
一些模拟场景使用了OpenGL 3 .3 ,但结果是彻底崩溃。
我用glxinfo|grep-OpenGL查看了一下,结果发现只支持2 .1 版本。
我自己没有运行过这个,但我记得数据是X.org 7 .8 ,确切的年份大概是2 01 7 年左右。
如今,主要的Linux发行版早已升级到X.org 1 .X,但较旧的硬件可能仍在使用这个。

最尴尬的就是用lspci来检查AMD显卡。
我有一台配备 Radeon RX 5 6 00M 的笔记本电脑,但我无法使用 lspci|grep-amd 找到它。
查看手册后,我发现我应该使用lspci|grep-video。
这些细节现在看来很简单,但第一次遇到的时候却花了很长时间。

资料我记得2 02 1 年NVIDIA的nvidia-smi开始支持TCC显示模式(Tesla Card Shutdown Mode)。
在此之前,断卡场景必须从数据中心的加密中手动验证使用 nvidia-smi 的 --query-gpu=tcc_mode 参数。
我自己没有运行过这个,但行业信息表明该功能只会在 2 02 1 年 5 月发布的 CUDA 1 1 .2 中启动。

使用这些命令时,不要只看参数。
比如lspci中的ProgIf(编程接口),如果是VGA,基本就是集成显卡,3 D就是独立显卡。
nvidia-smi 的计算能力特别令人感兴趣。
例如,7 .5 是RTX 3 0系列,8 .0是4 0系列。
了解这些细节比仅仅查看型号更有用。

我自己没有运行过这个,但我建议你检查nvidia-smi是否可以直接显示NVLink状态。
当我在 2 01 9 年测试它时,我必须使用链接 nvidia-smi -q -d 才能找到它。
最新版本可能已集成到主界面中。

显卡的pci设备怎么看

说实话,在 Windows 上查找显卡 PCI ID 相当容易,但在 Linux 上使用命令行对于初学者来说可能会很混乱。
当我帮朋友安装系统时,他在五分钟内完成了Windows步骤,并继续在设备管理器中查找硬件ID。

有趣的是,在Linux上使用lspci命令时,我第一次使用时几乎把命令写反了。
我记得有一次我手滑了,把 grep 后面的 -i 弄丢了。
结果我的屏幕上不断出现很多乱码。
我吓得连忙按下Ctrl+C。
然后,我想了想。
其实就是使用命令 lspci -nn | grep -i 'VGA兼容控制器',点是-nn,显示的是制造商和设备的全名,所以检查时不太容易出错。

我有一个朋友,从事 IT 工作。
他总说dmidecode比lspci详细,但说实话,我基本就用lspci。
他给我看了一次 dmidecode -t slot,它可以检查插槽的物理位置,比如是 PCIe x1 6 还是 x8 ,非常有用。
然而,这种类型的操作对于普通用户来说基本上是遥不可及的,除非你运行的是虚拟机或服务器。

我记得数据是针对Windows 1 0或更高版本的,设备管理器界面没有太大变化。
但是,对于一些较旧的系统,例如Win7 ,您可能需要自己探索路径。
尽管Linux命令行很灵活,但不同的发行版可能依赖于不同的脚本命令参数。
我记得Ubuntu和CentOS的输出格式略有不同。

我自己没有运行过这个,不过听说现在有些显卡驱动内置了也可以检查PCI ID的工具,比如NVIDIA Display Driver Manager,可能比手动检查指令更容易使用。
不过该驱动工具可能不是跨平台的,在Linux上效果不是很好。

Linux CPUInfo怎样查看PCIe通道

lspci-v:PCI 设备的综合视图,包括速度和带宽 Plu。
lspci-tv:显示树形层次结构机器,以帮助收集 Plu 连接。
lspci|grep -i 'pciexpress':快速修复 Plu 设备 lspci-s-vvv:首先注释每个,包括 Plu 注释。
lshw-classpci:查看 PCI 设备,包括层次结构和总线配置。
lshw-classpci-Cnetwork:按特定类型的设备过滤。
ethtool :查看网卡的更多信息,包括总线号。
快速过滤:lspci|grep -i 'pciexpress' 或 lspci -v。
分析级别:lspci-tv 或 lshw-classpci。
详细参数:lspci -s-vvv。
检查网卡:ethtool <接口>。
关键字段:LnkCap、LnkSta、总线信息。
异常处理:在速率小于最大值时,检查矩阵或电缆。