Linux awk 命令详解(二) if 分支 数组

一、awk if分支结构

  • if分支结构(单分支、双分支、多分支)
  • 单分支
    -- if(条件){编辑指令}
  • 双分支
    -- if(条件){编辑指令1}else{编辑指令2}
  • 多分支
    -- if(条件){编辑指令1}else if(条件){编辑指令2}.. ..
    else{编辑指令N}

案例1
awk过滤中的if分支结构
1)单分支
统计/etc/passwd文件中UID小于或等于1000的用户个数:

[root@case100 ~]# awk -F: '{if($3<=1000){i++}}END{print i}' /etc/passwd
23

统计/etc/passwd文件中UID大于1000的用户个数:

[root@case100 ~]# awk -F: '{if($3>1000){i++}}END{print i}' /etc/passwd
3

统计/etc/passwd文件中登录Shell是“/bin/bash”的用户个数:

[root@case100 ~]# awk -F: '{if($7~/bash$/){i++}}END{print i}' /etc/passwd
5

2)双分支
分别统计/etc/passwd文件中UID小于或等于1000、UID大于1000的用户个数:

[root@case100 ~]# awk -F: '{if($3<=1000){i++}else{j++}}END{print i,j}' /etc/passwd
23 3

分别统计/etc/passwd文件中登录Shell是“/bin/bash”、 登录Shell不是“/bin/bash”的用户个数:

[root@case100 ~]# awk -F: '{if($7~/bash$/){i++}else{j++}}END{print i,j}' /etc/passwd
5 21

二、awk数组

  • 数组的语法格式
    数组是一个可以存储多个值的变量,具体使用的格式如下:
  • 定义数组
    -- 格式:数组名[下标]=元素值
  • 调用数组
    -- 格式:数组名[下标]
  • 遍历数组
    -- 用法:for(变量 in 数组名){print 数组名[变量]}

案例2 for循环

[root@case100 ~]# awk 'BEGIN{a[0]=11;a[1]=88;print a[1],a[0]}'
88 11
[root@case100 ~]# awk 'BEGIN{a++;print a}'
1
[root@case100 ~]# awk 'BEGIN{a[0]=0;a[1]=11;a[2]=222;for(i in a){print i,a[i]}}'
0 0
1 11
2 222

注意,awk数组的下标除了可以使用数字,也可以使用字符串,字符串需要使用双引号:

[root@case100 ~]# awk 'BEGIN{a["hehe"]=22;print a["hehe"]}'
22

案例3:awk扩展应用
1)awk统计Web访问排名
在分析Web日志文件时,每条访问记录的第一列就是客户机的IP地址,其中会有很多重复的IP地址。因此只用awk提取出这一列是不够的,还需要统计重复记录的数量并且进行排序。
通过awk提取信息时,利用IP地址作为数组下标,每遇到一个重复值就将此数组元素递增1,最终就获得了这个IP地址出现的次数。
针对文本排序输出可以采用sort命令,相关的常见选项为-r、-n、-k。其中-n表示按数字顺序升序排列,而-r表示反序,-k可以指定按第几个字段来排序

实现此案例需要按照如下步骤进行。
步骤一:统计Web访问量排名
分步测试、验证效果如下所述。
1)提取IP地址及访问量

[root@case100 ~]# awk '{ip[$1]++} \
>  END{for(i in ip) {print ip[i],i }}' /var/log/httpd/access_log
4  127.0.0.1
17 192.168.4.5
13 192.168.4.110
... ...

2)对第1)步的结果根据访问量排名

[root@case100 ~]# awk  '{ip[$1]++} END{for(i in ip) {print i,ip[i]}}'  /var/log/httpd/access_log | sort -nr
17  192.168.4.5
13  192.168.4.110
4   127.0.0.1
... ...

案例4:编写监控脚本
本案例要求编写脚本,实现计算机各个性能数据监控的功能,具体监控项目要求如下:
CPU负载
网卡流量
内存剩余容量
磁盘剩余容量
计算机账户数量
当前登录账户数量
计算机当前开启的进程数量
本机已安装的软件包数量

步骤
实现此案例需要按照如下步骤进行。
步骤一:准备工作
1)查看性能数据的命令

[root@case100 ~]# uptime                            //查看CPU负载
[root@case100 ~]# ifconfig eth0                    //查看网卡流量
[root@case100 ~]# free                            //查看内存信息
[root@case100 ~]# df                                //查看磁盘空间
[root@case100 ~]# wc -l /etc/passwd                //查看计算机账户数量
[root@case100 ~]# who |wc -l                        //查看登录账户数量
[root@case100 ~]# rpm -qa |wc -l                    //查看已安装软件包数量

步骤二:编写参考脚本
1)脚本内容如下:

[root@svr5 ~]# vim test.sh
#!/bin/bash
ip=`ifconfig eth0 | awk '/inet /{print $2}'`
echo "本地IP地址是:"$ip
cpu=`uptime | awk '{print $NF}'`            
#awk中NF为当前行的列数,$NF是最后一列
echo "本机CPU最近15分钟的负载是:"$cpu
net_in=`ifconfig eth0 | awk '/RX p/{print $5}'`
echo "入站网卡流量为:"$net_in
net_out=`ifconfig eth0 | awk '/TX p/{print $5}'`
echo "出站网卡流量为:"$net_out
mem=`free | awk '/Mem/{print $4}'`
echo "内存剩余容量为:"$mem
disk=`df | awk '/\/$/{print $4}'`
echo "根分区剩余容量为:"$disk
user=`cat /etc/passwd |wc -l`
echo "本地账户数量为:"$user
login=`who | wc -l`
echo "当前登陆计算机的账户数量为:"$login
process=`ps aux | wc -l`
echo "当前计算机启动的进程数量为:"$process
soft=`rpm -qa | wc -l`
echo "当前计算机已安装的软件数量为:"$soft
[root@logfile ~]# bash test.sh 
本地IP地址是:192.168.44.99
本机CPU最近15分钟的负载是:0.05
入站网卡流量为:4942189501092
出站网卡流量为:9051024375282
内存剩余容量为:160136
根分区剩余容量为:84142524
本地账户数量为:32
当前登陆计算机的账户数量为:1
当前计算机启动的进程数量为:160
当前计算机已安装的软件数量为:403

你可能感兴趣的