百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 优雅编程 > 正文

awk与sed序列(5)awk条件、循环和数组

sinye56 2024-10-03 00:43 24 浏览 0 评论

今天介绍一下awk里面的条件、循环和数组相关的基础知识

条件语句

语法如下:

if(expression){
 action1;
 action2;
}[else
 action]

注:expression 为空或者0时,表达式为假条件操作符

awk中提供的条件操作符可以在C语言中找到,它的形式为:

expr?action1:action2

当expr为真时,执行action1,为假时执行action2。

循环

循环是一种用于重复执行一个或者多个操作的结构。在awk中循环结构可以用while、do或for语句指定。

While循环

while循环语法:

while (condition){
 action
}

Do循环

Do循环语法为:

do
 action
while(condition)

For循环

For循环语法:

for(set_counter;test_counter;increment_counter){
 action
}

for循环由3个表达式组成:

set_counter:设置计数器变量的初值。

test_counter:描述在循环开始时要测试的条件。

increatment_counter:每次在循环底部递增计数器,且恰好在重新测试test_counter之前。

影响流控制的其他语句

在一个循环中有两个可以影响控制流,break和continue。

break语句顾名思义就是退出循环,这样将不再继续执行循环。

continue语句在到达循环底部之前终止当前的循环,并从循环的顶部开始一个新的循环。

有两个语句能影响主输入循环,next和exit。

next语句能够导致读入下一个输入行,并返回到脚本顶部。这个可以避免对当前输入行执行其他的操作过程。

exit语句是主输入循环退出并将控制转移到END规则,如果END存在的话。如果没有定义END规则,或在END中应用exit语句,则终止脚本的执行。

另外,它可以使用一个表达式作为参数,该表达式将作为awk的退出状态返回,如果没有提供表达式,那么将返回0。如果为exit语句设置一个初值,然后在END中再次调用没有参数的exit,则使用第一个值。

数组

在awk中不必指明数组的大小,只需要为数组指定标识符。

$awk 'BEGIN{arr[1]="ouhanzhong";print arr[1]}'
$ouhanzhong

还可以和awk内置变量联系起来用。如NR,记录编号。

关联数组

awk中,所有的数组都是关联数组。关联数组的独特之处在于它的下标可以是一个字符串或者一个数值。

有一个特殊的循环语法可以访问关联数组的所有元素,它是for循环的一个版本

 for(variable in array){
 do something with array[variable]
}

array是一个数组名字。variable是一个变量,可以将它看作和普通for循环计数器一样递增的临时变量。该变量在每次循环时被赋予一个特殊的下标。

重要的是需要记住awk中的所有数组下标都是字符串类型。即使使用数字作为下标,awk将自动将它们转换为字符串。

测试数组中的成员资格

关键词in也是一个操作符,用在条件表达式中来测试一个下标是否是数组的成员,表达式为:

 item in array

如果array[item]存在则返回1,不存在则返回0。

用split()创建数组

内置函数split()能够将任何字符串分解到数组的元素中。这个函数对于从字段中提取“子字段”是很有用的。

函数split()的语法为:

 n = split(string,array,separator)

string是要被分解到名字为array的元素中的输入字符串。数组的下标从1开始到n,n即为数组中元素的个数。元素根据指定的separate分隔符来分解。

[oracle@centos ~]$ echo "Ou Han Zhong tet ttt"|awk -F' ' '{n=split($0,y," ");print n}'
输出:
5
[oracle@centos ~]$ echo "Ou Han Zhong"|awk -F' ' '{n=split($0,y," ");print y[n-1]}'
输出:
Han

删除数组元素

awk提供了一个语句用于从数组中删除一个元素。语法是:

 delete array[subscript]

这里的方括号是必须的。这个语句将删除array中下标为subscript的元素。

多维数组

需要注意,awk数组是关联数组,只要通过数组引用它的key,就会自动创建改序列。如下:

[oracle@centos ~]$ awk 'BEGIN{tB["a"]="a1";tB["b"]="b1";if(tB["c"]!="1"){print "no found";};for(k in tB){print k,tB[k];}}'
输出:
no found
a a1
b b1
c

上面代码 tB[“c”] 会自动创建序列。

awk的多维数组在本质上是一维数组,更确切一点,awk在存储上并不支持多维数组。awk提供了逻辑上模拟二维数组的访问方式。

例如,array[2,4] = 1这样的访问是允许的。awk使用一个特殊的字符串SUBSEP (\034)作为分割字段,在上面的例子中,关联数组array存储的键值实际上是2\0344。

类似一维数组的成员测试,多维数组可以使用if ( (i,j) in array)这样的语法,但是下标必须放置在圆括号中。

类似一维数组的循环访问,多维数组使用 for ( item in array )这样的语法遍历数组。与一维数组不同的是,多维数组必须使用split()函数来访问单独的下标分量。split ( item, subscr, SUBSEP)

[oracle@centos ~]$ awk 'BEGIN{
> for(i=1;i<=9;i++){
> for(j=1;j<=9;j++){
> tarr[i,j]=i*j;
> print i,"*",j,"=",tarr[i,j];
> }
> }
> }'
1 * 1 = 1
1 * 2 = 2
1 * 3 = 3
1 * 4 = 4
1 * 5 = 5
1 * 6 = 6
1 * 7 = 7
1 * 8 = 8
....
9 * 7 = 63
9 * 8 = 72
9 * 9 = 81

作为系统变量的数组

awk中提供了两个系统变量,他们是数组。

ARGV

这是一个命令行参数的数组,不包括脚本本身和任何调用awk指定的选项。这个数组中的元素的个数可以从ARGC中获得。数组中的第一个元素的下标是0(和awk中的其他数组不同,而和C一致),最后一个下标是ARGC-1。

ENVIRON

一个环境变量数组,数组中的每个元素时当前环境变量的值,而其下标是环境变量的名字。

命令行参数数组

注意,如果你在shell脚本中调用了awk,命令行的参数将传递给shell而不是传递给awk。你必须将shell脚本的命令行参数,传递给在shell脚本中的awk程序。例如你可以用“$*”将shell脚本中的所有命令行参数传递给awk。如下所示:

awk '
 BEGIN{
 for(x=0;x<ARGC;==x){
 print ARGV[x];
 print ARGC;
 }' $*

在特殊情况下,如果ARGV的元素的值是一个空串(“ “),awk将跳过它并继续处理下一个元素。

环境变量数组

awk 'BEGIN{
> for (env in ENVIRON)
> print env "=" ENVIRON[env];
> }'
输出:
AWKPATH=.:/usr/share/awk
SSH_ASKPASS=/usr/libexec/openssh/gnome-ssh-askpass
LANG=en_US.UTF-8
HISTSIZE=1000
...
jpg=01;35:*.gif=01;35:*.bmp=01;35:*.xbm=01;35:*.xpm=01;35:*.png=01;35:*.tif=01;35:
ORACLE_SID=ORCL

可以使用变量名作为数组的下标访问任意元素:

ENVIRON["HISTSIZE"]

也可以修改数组ENVRION中的任意元素:

ENVRION["HISTSIZE"]=100

但是这个改变并不改变用户的真实环境。

相关资料

1. sed与awk编程语言

相关推荐

linux 查看当前应用内存状况,以及内存参数含义

1、查看进程号ps-ef|greptomcat2、查看当前内存分配,200ms打印一次jstat-gc进程号2001jstat-gc344802001S0CS1C...

如何显示 Linux 系统上的可用内存?这几个命令很好用!

在Linux系统中,了解可用内存是优化系统性能、故障排查以及资源管理的重要一环。本文将详细介绍如何在Linux系统上显示可用内存,包括多种方法和工具的使用。在讨论可用内存之前,我们需要了解一些...

Linux 下查看内存使用情况方法总结

Q:我想监视Linux系统的内存使用情况,在Linux下有哪些视图或者命令行工具可用呢?在做Linux系统优化的时候,物理内存是其中最重要的一方面。自然的,Linux也提供了非常多的方法来监控宝贵的内...

2、linux命令-用户管理

linux命令-用户管理用户切换[root@eric~]#sueric#切换到用户eric[eric@ericroot]$[eric@ericroot]$su#切换到rootPas...

Centos 7 进入单用户模式详解

1、开机在启动菜单按e进入编辑模式找到linux16行,在最后添加init=/bin/sh编辑完后,按ctrl+x退出2、进单用户模式后,使用passwd修改密码,提示以下错误:passwd:Aut...

每日一个Linux命令解析——newusers

newusers:在Linux系统中,newusers是一个用于批量创建用户的命令。它从一个文件中读取多行用户信息,每行描述一个用户的详细信息,并根据这些信息创建多个用户或对现有用户进行批量修改。一...

openEuler操作系统管理员指南:管理用户与用户组

在Linux中,每个普通用户都有一个账户,包括用户名、密码和主目录等信息。除此之外,还有一些系统本身创建的特殊用户,它们具有特殊的意义,其中最重要的是管理员账户,默认用户名是root。同时Linux也...

Linux用户管理

1、用户信息文件/etc/passwdroot:x:0:0:root:/root:/bin/bash第一列:用户名第二列:密码位第三列:用户ID0超级用户UID。如果用户UID...

centos7基础-用户、组、权限管理

用户和组(1)用户、组、家目录的概念linux系统支持多用户,除了管理员,其他用户一般不应该使用root,而是应该向管理员申请一个账号。组类似于角色,系统可以通过组对有共性的用户进行统一管理。每个用户...

LINUX基础 ----------组及用户的概念

在Linux中,用户和组都是非常重要的概念,可以控制文件访问权限和资源的管理。用户是标识一个进程、应用程序或系统管理员的账号,Linux中每个用户用一个用户ID(UID)来标识。对于一个...

从零入门Linux(四)用户与权限管理

在Linux系统中,用户和权限管理是系统安全的重要组成部分。通过合理配置用户和权限,可以确保系统的安全性和资源的合理分配。以下是一些与用户和权限管理相关的常用命令和概念。1.用户管理1.1添加...

如何在 Linux 中管理用户?

在Linux系统中,用户是系统资源的主要使用者,每个用户都有一个唯一的标识符(用户ID)。为了更好地组织和管理用户,Linux还引入了用户组的概念。用户组是用户的集合,有助于更有效地分配权限和资...

在 Linux 中将用户添加到特定组的四种方法

在Linux多用户操作系统中,用户组管理是系统安全架构的基石。通过合理的组权限分配,管理员可以实现:精确控制文件访问权限(chmod775project/)简化批量用户权限管理(setfacl-...

我不是网管 - 如何在Ubuntu Linux下创建sudo用户

Sudo用户是Linux系统的普通用户,具有一定的管理权限,可以对系统执行管理任务。在Linux中,root是超级用户,拥有完全的管理权限,但不建议将root凭证授予其他用户或作为r...

Linux创建普通用户,为密钥方式登录做准备

Hi,我是聪慧苹果8,就是江湖上人见人爱、花见花开,土到掉榨的Linux爱好者,一起学习吧!上一篇关于SSH安全加固的文字,有网友点评通过密钥登录更加安全,先创建一个普通用户,拒绝直接使用密码登录,这...

取消回复欢迎 发表评论: