awk与sed序列(5)awk条件、循环和数组
sinye56 2024-10-03 00:43 24 浏览 0 评论
今天介绍一下awk里面的条件、循环和数组相关的基础知识
条件语句
语法如下:
if(expression){ action1; action2; }[else action]
注:expression 为空或者0时,表达式为假条件操作符
awk中提供的条件操作符可以在C语言中找到,它的形式为:
expr?action1:action2
当expr为真时,执行action1,为假时执行action2。
循环
循环是一种用于重复执行一个或者多个操作的结构。在awk中循环结构可以用while、do或for语句指定。
While循环
while循环语法:
while (condition){ action }
Do循环
Do循环语法为:
do action while(condition)
For循环
For循环语法:
for(set_counter;test_counter;increment_counter){ action }
for循环由3个表达式组成:
set_counter:设置计数器变量的初值。
test_counter:描述在循环开始时要测试的条件。
increatment_counter:每次在循环底部递增计数器,且恰好在重新测试test_counter之前。
影响流控制的其他语句
在一个循环中有两个可以影响控制流,break和continue。
break语句顾名思义就是退出循环,这样将不再继续执行循环。
continue语句在到达循环底部之前终止当前的循环,并从循环的顶部开始一个新的循环。
有两个语句能影响主输入循环,next和exit。
next语句能够导致读入下一个输入行,并返回到脚本顶部。这个可以避免对当前输入行执行其他的操作过程。
exit语句是主输入循环退出并将控制转移到END规则,如果END存在的话。如果没有定义END规则,或在END中应用exit语句,则终止脚本的执行。
另外,它可以使用一个表达式作为参数,该表达式将作为awk的退出状态返回,如果没有提供表达式,那么将返回0。如果为exit语句设置一个初值,然后在END中再次调用没有参数的exit,则使用第一个值。
数组
在awk中不必指明数组的大小,只需要为数组指定标识符。
$awk 'BEGIN{arr[1]="ouhanzhong";print arr[1]}' $ouhanzhong
还可以和awk内置变量联系起来用。如NR,记录编号。
关联数组
awk中,所有的数组都是关联数组。关联数组的独特之处在于它的下标可以是一个字符串或者一个数值。
有一个特殊的循环语法可以访问关联数组的所有元素,它是for循环的一个版本
for(variable in array){ do something with array[variable] }
array是一个数组名字。variable是一个变量,可以将它看作和普通for循环计数器一样递增的临时变量。该变量在每次循环时被赋予一个特殊的下标。
重要的是需要记住awk中的所有数组下标都是字符串类型。即使使用数字作为下标,awk将自动将它们转换为字符串。
测试数组中的成员资格
关键词in也是一个操作符,用在条件表达式中来测试一个下标是否是数组的成员,表达式为:
item in array
如果array[item]存在则返回1,不存在则返回0。
用split()创建数组
内置函数split()能够将任何字符串分解到数组的元素中。这个函数对于从字段中提取“子字段”是很有用的。
函数split()的语法为:
n = split(string,array,separator)
string是要被分解到名字为array的元素中的输入字符串。数组的下标从1开始到n,n即为数组中元素的个数。元素根据指定的separate分隔符来分解。
[oracle@centos ~]$ echo "Ou Han Zhong tet ttt"|awk -F' ' '{n=split($0,y," ");print n}' 输出: 5 [oracle@centos ~]$ echo "Ou Han Zhong"|awk -F' ' '{n=split($0,y," ");print y[n-1]}' 输出: Han
删除数组元素
awk提供了一个语句用于从数组中删除一个元素。语法是:
delete array[subscript]
这里的方括号是必须的。这个语句将删除array中下标为subscript的元素。
多维数组
需要注意,awk数组是关联数组,只要通过数组引用它的key,就会自动创建改序列。如下:
[oracle@centos ~]$ awk 'BEGIN{tB["a"]="a1";tB["b"]="b1";if(tB["c"]!="1"){print "no found";};for(k in tB){print k,tB[k];}}' 输出: no found a a1 b b1 c
上面代码 tB[“c”] 会自动创建序列。
awk的多维数组在本质上是一维数组,更确切一点,awk在存储上并不支持多维数组。awk提供了逻辑上模拟二维数组的访问方式。
例如,array[2,4] = 1这样的访问是允许的。awk使用一个特殊的字符串SUBSEP (\034)作为分割字段,在上面的例子中,关联数组array存储的键值实际上是2\0344。
类似一维数组的成员测试,多维数组可以使用if ( (i,j) in array)这样的语法,但是下标必须放置在圆括号中。
类似一维数组的循环访问,多维数组使用 for ( item in array )这样的语法遍历数组。与一维数组不同的是,多维数组必须使用split()函数来访问单独的下标分量。split ( item, subscr, SUBSEP)
[oracle@centos ~]$ awk 'BEGIN{ > for(i=1;i<=9;i++){ > for(j=1;j<=9;j++){ > tarr[i,j]=i*j; > print i,"*",j,"=",tarr[i,j]; > } > } > }' 1 * 1 = 1 1 * 2 = 2 1 * 3 = 3 1 * 4 = 4 1 * 5 = 5 1 * 6 = 6 1 * 7 = 7 1 * 8 = 8 .... 9 * 7 = 63 9 * 8 = 72 9 * 9 = 81
作为系统变量的数组
awk中提供了两个系统变量,他们是数组。
ARGV
这是一个命令行参数的数组,不包括脚本本身和任何调用awk指定的选项。这个数组中的元素的个数可以从ARGC中获得。数组中的第一个元素的下标是0(和awk中的其他数组不同,而和C一致),最后一个下标是ARGC-1。
ENVIRON
一个环境变量数组,数组中的每个元素时当前环境变量的值,而其下标是环境变量的名字。
命令行参数数组
注意,如果你在shell脚本中调用了awk,命令行的参数将传递给shell而不是传递给awk。你必须将shell脚本的命令行参数,传递给在shell脚本中的awk程序。例如你可以用“$*”将shell脚本中的所有命令行参数传递给awk。如下所示:
awk ' BEGIN{ for(x=0;x<ARGC;==x){ print ARGV[x]; print ARGC; }' $*
在特殊情况下,如果ARGV的元素的值是一个空串(“ “),awk将跳过它并继续处理下一个元素。
环境变量数组
awk 'BEGIN{ > for (env in ENVIRON) > print env "=" ENVIRON[env]; > }' 输出: AWKPATH=.:/usr/share/awk SSH_ASKPASS=/usr/libexec/openssh/gnome-ssh-askpass LANG=en_US.UTF-8 HISTSIZE=1000 ... jpg=01;35:*.gif=01;35:*.bmp=01;35:*.xbm=01;35:*.xpm=01;35:*.png=01;35:*.tif=01;35: ORACLE_SID=ORCL
可以使用变量名作为数组的下标访问任意元素:
ENVIRON["HISTSIZE"]
也可以修改数组ENVRION中的任意元素:
ENVRION["HISTSIZE"]=100
但是这个改变并不改变用户的真实环境。
相关资料
1. sed与awk编程语言
相关推荐
- linux 查看当前应用内存状况,以及内存参数含义
-
1、查看进程号ps-ef|greptomcat2、查看当前内存分配,200ms打印一次jstat-gc进程号2001jstat-gc344802001S0CS1C...
- 如何显示 Linux 系统上的可用内存?这几个命令很好用!
-
在Linux系统中,了解可用内存是优化系统性能、故障排查以及资源管理的重要一环。本文将详细介绍如何在Linux系统上显示可用内存,包括多种方法和工具的使用。在讨论可用内存之前,我们需要了解一些...
- Linux 下查看内存使用情况方法总结
-
Q:我想监视Linux系统的内存使用情况,在Linux下有哪些视图或者命令行工具可用呢?在做Linux系统优化的时候,物理内存是其中最重要的一方面。自然的,Linux也提供了非常多的方法来监控宝贵的内...
- 2、linux命令-用户管理
-
linux命令-用户管理用户切换[root@eric~]#sueric#切换到用户eric[eric@ericroot]$[eric@ericroot]$su#切换到rootPas...
- Centos 7 进入单用户模式详解
-
1、开机在启动菜单按e进入编辑模式找到linux16行,在最后添加init=/bin/sh编辑完后,按ctrl+x退出2、进单用户模式后,使用passwd修改密码,提示以下错误:passwd:Aut...
- 每日一个Linux命令解析——newusers
-
newusers:在Linux系统中,newusers是一个用于批量创建用户的命令。它从一个文件中读取多行用户信息,每行描述一个用户的详细信息,并根据这些信息创建多个用户或对现有用户进行批量修改。一...
- openEuler操作系统管理员指南:管理用户与用户组
-
在Linux中,每个普通用户都有一个账户,包括用户名、密码和主目录等信息。除此之外,还有一些系统本身创建的特殊用户,它们具有特殊的意义,其中最重要的是管理员账户,默认用户名是root。同时Linux也...
- Linux用户管理
-
1、用户信息文件/etc/passwdroot:x:0:0:root:/root:/bin/bash第一列:用户名第二列:密码位第三列:用户ID0超级用户UID。如果用户UID...
- centos7基础-用户、组、权限管理
-
用户和组(1)用户、组、家目录的概念linux系统支持多用户,除了管理员,其他用户一般不应该使用root,而是应该向管理员申请一个账号。组类似于角色,系统可以通过组对有共性的用户进行统一管理。每个用户...
- LINUX基础 ----------组及用户的概念
-
在Linux中,用户和组都是非常重要的概念,可以控制文件访问权限和资源的管理。用户是标识一个进程、应用程序或系统管理员的账号,Linux中每个用户用一个用户ID(UID)来标识。对于一个...
- 从零入门Linux(四)用户与权限管理
-
在Linux系统中,用户和权限管理是系统安全的重要组成部分。通过合理配置用户和权限,可以确保系统的安全性和资源的合理分配。以下是一些与用户和权限管理相关的常用命令和概念。1.用户管理1.1添加...
- 如何在 Linux 中管理用户?
-
在Linux系统中,用户是系统资源的主要使用者,每个用户都有一个唯一的标识符(用户ID)。为了更好地组织和管理用户,Linux还引入了用户组的概念。用户组是用户的集合,有助于更有效地分配权限和资...
- 在 Linux 中将用户添加到特定组的四种方法
-
在Linux多用户操作系统中,用户组管理是系统安全架构的基石。通过合理的组权限分配,管理员可以实现:精确控制文件访问权限(chmod775project/)简化批量用户权限管理(setfacl-...
- 我不是网管 - 如何在Ubuntu Linux下创建sudo用户
-
Sudo用户是Linux系统的普通用户,具有一定的管理权限,可以对系统执行管理任务。在Linux中,root是超级用户,拥有完全的管理权限,但不建议将root凭证授予其他用户或作为r...
- Linux创建普通用户,为密钥方式登录做准备
-
Hi,我是聪慧苹果8,就是江湖上人见人爱、花见花开,土到掉榨的Linux爱好者,一起学习吧!上一篇关于SSH安全加固的文字,有网友点评通过密钥登录更加安全,先创建一个普通用户,拒绝直接使用密码登录,这...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- oracle忘记用户名密码 (59)
- oracle11gr2安装教程 (55)
- mybatis调用oracle存储过程 (67)
- oracle spool的用法 (57)
- oracle asm 磁盘管理 (67)
- 前端 设计模式 (64)
- 前端面试vue (56)
- linux格式化 (55)
- linux图形界面 (62)
- linux文件压缩 (75)
- Linux设置权限 (53)
- linux服务器配置 (62)
- mysql安装linux (71)
- linux启动命令 (59)
- 查看linux磁盘 (72)
- linux用户组 (74)
- linux多线程 (70)
- linux设备驱动 (53)
- linux自启动 (59)
- linux网络命令 (55)
- linux传文件 (60)
- linux打包文件 (58)
- linux查看数据库 (61)
- linux获取ip (64)
- linux进程通信 (63)