linux常用的监控服务器运行状态(怎么监控Linux服务器状态)
linux常用的监控服务器运行状态(怎么监控Linux服务器状态)$watchuptime Every2.0s:uptimebutterfly:TueJan2316:25:482019 16:25:48up22days 4:38 3users loadaverage:1.15 0.89 1.02一些关键的进程肯定不能挂,否则可能会影响到业务开展,所以我们可以重复统计服务器中的所有进程数量。$watch-n10who Every10.0s:whobutterfly:TueJan2316:02:032019 shs:02019-01-2309:45(:0) dorypts/02019-01-2315:50(192.168.0.5) alvinpts/12019-01-2316:01(192.168.0.15) sharkpts/32019-01-2311:11(192.168.0.27)如果发现系统运行很慢,我们可以调用 uptime 命令来查
Linux 服务器我们天天打交道,特别是 Linux 工程师更是如此。为了保证服务器的安全与性能,我们经常需要监控服务器的一些状态,以保证工作能顺利开展。
本文介绍的几个命令,不仅仅适用于服务器监控,也适用于我们日常情况下的开发。
1. watch
watch 命令我们的使用频率很高,它的基本作用是,按照指定频率重复执行某一条指令。使用这个命令,我们可以重复调用一些命令来达到监控服务器的作用。
默认情况下,watch 命令的执行周期是 2 秒,但我们可以使用 -n 选项来指定运行频率,比如我们想要每隔 5 秒执行 date 命令,可以这么执行:
$watch-n5date
一台服务器肯定有多人在用,特别是本部门的小伙伴。对于这些小伙伴有没浑水摸鱼,我们可以使用一些命令来监控他们。
我们可以每隔 10 秒执行 who 命令,来看看都有谁在使用服务器。
$watch-n10who
Every10.0s:whobutterfly:TueJan2316:02:032019
shs:02019-01-2309:45(:0)
dorypts/02019-01-2315:50(192.168.0.5)
alvinpts/12019-01-2316:01(192.168.0.15)
sharkpts/32019-01-2311:11(192.168.0.27)
如果发现系统运行很慢,我们可以调用 uptime 命令来查看系统平均负载情况。
$watchuptime
Every2.0s:uptimebutterfly:TueJan2316:25:482019
16:25:48up22days 4:38 3users loadaverage:1.15 0.89 1.02
一些关键的进程肯定不能挂,否则可能会影响到业务开展,所以我们可以重复统计服务器中的所有进程数量。
$watch-n5'ps-ef|wc-l'
Every5.0s:ps-ef|wc-lbutterfly:TueJan2316:11:542019
245
想动态知道服务器内存使用情况,可以重复执行 free 命令。
$watch-n5free-m
Every5.0s:free-mbutterfly:TueJan2316:34:092019
totalusedfreesharedbuff/cacheavailable
Mem:595977632761219064878
Swap:204702047
当然不仅仅是这些,我们还可以重复调用很多命令来对服务器一些关键参数进行监控,
2. top
使用 top 命令我们可以知道系统的很多关键参数,而且是动态更新的。默认情况下,top 监控的是系统的整体状态,如果我们只想知道某个人的使用情况,可以使用 -u 选项来指定这个人。
$top-ualvin
top-16:14:33up2days 4:27 3users loadaverage:0.00 0.01 0.02
Tasks:199total 1running 198sleeping 0stopped 0zombie
%Cpu(s):0.0us 0.2sy 0.0ni 99.8id 0.0wa 0.0hi 0.0si 0.0st
MiBMem:5959.4total 3277.3free 776.4used 1905.8buff/cache
MiBSwap:2048.0total 2048.0free 0.0used.4878.4availMem
PIDUSERPRNIVIRTRESSHRS%CPU%MEMTIME COMMAND
23026alvin2004634078206504S0.00.10:00.05systemd
23033alvin200149660314072S0.00.10:00.00(sd-pam)
23125alvin2006339651004092S0.00.10:00.00sshd
23128alvin2001683656364284S0.00.10:00.03zsh
在这个结果里,你不仅仅可以看到 alvin 这个用户运行的所有的进程数,也可以看到每个进程所消耗的系统资源(CPU,内存),同时依然可以看到整个系统的关键参数。
3. ac
如果你想知道每个用户登录服务器所使用的时间,你可以使用 ac 命令。这个命令需要你安装 acct 包(Debian)或 psacct 包(RHEL,Centos)。
如果我们想知道所有用户登陆服务器所使用的时间之和,我们可以直接运行 ac 命令,无需任何参数。
$ac
total1261.72
如果我们想知道各个用户所使用时间,可以加上 -p 选项。
$ac-p
shark5.24
alvin5.52
shs1251.00
total1261.76
我们还可以通过加上 -d 选项来查看具体每一天用户使用服务器时间之和。
$ac-d|tail-10
Jan11total0.05
Jan12total1.36
Jan13total16.39
Jan15total55.33
Jan16total38.02
Jan17total28.51
Jan19total48.66
Jan20total1.37
Jan22total23.48
Todaytotal9.83
小结
我们可以使用很多命令来监控系统的运行状态,本文主要介绍了三个:watch 命令可以让你重复执行某一条命令来监控一些参数的变化,top 命令可以查看某个用户运行的进程数以及消耗的资源,而 ac 命令则可以查看每个用户使用服务器时间。你经常使用哪个命令呢?
原文来自:https://os.51cto.com/art/202006/618310.html