快捷搜索:  汽车  科技

linux怎么监控显卡(推荐一款Linux下监控CPU温度)

linux怎么监控显卡(推荐一款Linux下监控CPU温度)上图是空载情况下(准确地说是把压力停了一会)的s-tui界面。柱状图从上到下依次显示:温度、频率、CPU占用率、功耗和风扇转速。图片点开后可放大(以下同)$ sudo apt installpython-pip stress$ sudo pip installs-tui(如果是Python 3.x,替换“pip”为“pip3”)$ sudo s-tui

这两天我手头正好有一台配置较高的工作站,2颗Xeon Gold 6258R 28核CPU、1TB(1024GB)内存,跑了下功耗压测。

在Windows下我习惯用AIDA64、Hwinfo这些监控软件。Linux下能看CPU温度和频率的工具也有一些,而此次我还要同时监控功耗,另外要是再有个简单的图形界面就更好了。在网上搜了一下,找到s-tui,发现还挺好用,顺手分享给大家。

linux怎么监控显卡(推荐一款Linux下监控CPU温度)(1)

s-tui是一款开源软件,关于它的简介和安装方法可以参考《s-tui:在 Linux 中监控 CPU 温度、频率、功率和使用率的终端工具》(https://linux.cn/article-10467-1.html)。

本次我是在Ubuntu下安装使用,具体的步骤比较简单:

$ sudo apt installpython-pip stress

$ sudo pip installs-tui(如果是Python 3.x,替换“pip”为“pip3”

$ sudo s-tui

linux怎么监控显卡(推荐一款Linux下监控CPU温度)(2)

图片点开后可放大(以下同)

上图是空载情况下(准确地说是把压力停了一会)的s-tui界面。柱状图从上到下依次显示:温度、频率、CPU占用率、功耗和风扇转速。

- 温度:用红框标出的Pa(Package)显示CPU封装温度,Co代表各个核心温度;

- 频率:红框标出的A(Avg)显示平均频率,C代表各个Core的频率;

- 占用率:A(Avg)显示整体占用率,C代表各个Core占用率;

- 功率:package-0 0 / 1 0分别显示2颗CPU功耗,dram 0、dram 1对应各自内存控制器所插的内存(注:由于Dell Precision 7920 Tower工作站多达24个DIMM槽,内存功耗这项监控不准);

- 风扇转速:nouveau 0应该代表显卡(未安装NV驱动,也不一定准),dell_smm 1/ 2不知读取的机箱内哪2个风扇,这里仅作为一般参考。

图中左下方的Summaries是经过我筛选后列出的实时监控数字。由于测试机CPU核心数较多,因此默认设置在这里不能显示全,可进入上面Control Option对应的选项设置一下,如下图:

linux怎么监控显卡(推荐一款Linux下监控CPU温度)(3)

s-tui是基于Linux字符终端呈现,把上面的选项改成这样我也费了一番功夫。

linux怎么监控显卡(推荐一款Linux下监控CPU温度)(4)

CPU频率全核满载保持2.1GHz,后面我来讨论下是否达标?

当我把prime95压测软件跑起来,2颗Xeon 6258R CPU一开始可以到230W功耗,稳定后保持在205W TDP附近。2颗CPU封装的温度分别为70℃和78℃(室温25摄氏度左右);此时风扇转速有一定提高,我们看到dell_smm 1读数从800转提高到2596转。当然工作站整体上肯定比服务器静音,各风扇还没有到全速。

注:这里的温度读数来自CPU内部温度传感器,而CPU表面实际温度比这个要低。详情参见《Xeon Scalable CPU跑到90℃了:为什么风扇转速还不提高?》。

工作站BIOS中的监控、诊断功能

如果是服务器,我要想监控全部风扇转速的途径是BMC(如:iDRAC)管理。但塔式工作站的情况不同,没有BMC,但有另一个办法——启动时按F12,然后进入诊断界面。这时如果插满1TB内存,等待的时间会比较长,因为涉及到对系统各组件的检测,完成后我们进入下图的界面:

linux怎么监控显卡(推荐一款Linux下监控CPU温度)(5)

《双Xeon SP只用一个风扇?Percision 7920工作站散热设计解析》中我介绍过这款主机的散热设计。除了CPU1 FAN之外,4个SYS FAN用于机箱前部进风,2个REAR FAN专用于CPU和内存风罩区域的排风,如果满配硬盘的话FB FAN的数量应该还可以多2个。

linux怎么监控显卡(推荐一款Linux下监控CPU温度)(6)

在SupportAssist | Pre-Boot System Performance Check界面的进一步测试选项中,可以看到内存测试就有若干项目。这个对售后工程师比较有用,在怀疑故障可能与操作系统/软件因素有关时,可以用来初步判断硬件是否正常工作。

为什么跑不到AVX 512最高全核Turbo频率?

Intel Xeon Gold 6258R的标称频率是2.7GHz,最高Turbo(单核)频率为4.0GHz,不过这是在运行Non AVX指令时才能达到的;如果是AVX 2.0浮点计算会有降低;而AVX 512则会进一步降低。

linux怎么监控显卡(推荐一款Linux下监控CPU温度)(7)

如上面Intel文档,Xeon 6258R在AVX 512浮点负载下的Base基础频率是1.8GHz(也就是没有Turbo的时候),28核跑满最高Turbo频率为2.5GHz。经过对比测试,prime95(如下图)的压力负载较重,所以同样功耗下CPU频率较低一些;如果换成AIDA 64等跑AVX 512就能达到高一点的频率。另外,Windows和Linux系统等因素也会有细微影响。

linux怎么监控显卡(推荐一款Linux下监控CPU温度)(8)

我看s-tui软件自己也有Stress压力测试功能,今天先不做更多讨论了。

祝玩得愉快!大家如有什么好东西也欢迎推荐给我:)

注:本文只代表作者个人观点,与任何组织机构无关,如有错误和不足之处欢迎在留言中批评指正。如果您想在这个公众号上分享自己的技术干货,也欢迎联系我:)

尊重知识,转载时请保留全文。感谢您的阅读和支持!

猜您喜欢: