百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 优雅编程 > 正文

awk与sed序列(5)awk条件、循环和数组

sinye56 2024-10-03 00:43 10 浏览 0 评论

今天介绍一下awk里面的条件、循环和数组相关的基础知识

条件语句

语法如下:

if(expression){
 action1;
 action2;
}[else
 action]

注:expression 为空或者0时,表达式为假条件操作符

awk中提供的条件操作符可以在C语言中找到,它的形式为:

expr?action1:action2

当expr为真时,执行action1,为假时执行action2。

循环

循环是一种用于重复执行一个或者多个操作的结构。在awk中循环结构可以用while、do或for语句指定。

While循环

while循环语法:

while (condition){
 action
}

Do循环

Do循环语法为:

do
 action
while(condition)

For循环

For循环语法:

for(set_counter;test_counter;increment_counter){
 action
}

for循环由3个表达式组成:

set_counter:设置计数器变量的初值。

test_counter:描述在循环开始时要测试的条件。

increatment_counter:每次在循环底部递增计数器,且恰好在重新测试test_counter之前。

影响流控制的其他语句

在一个循环中有两个可以影响控制流,break和continue。

break语句顾名思义就是退出循环,这样将不再继续执行循环。

continue语句在到达循环底部之前终止当前的循环,并从循环的顶部开始一个新的循环。

有两个语句能影响主输入循环,next和exit。

next语句能够导致读入下一个输入行,并返回到脚本顶部。这个可以避免对当前输入行执行其他的操作过程。

exit语句是主输入循环退出并将控制转移到END规则,如果END存在的话。如果没有定义END规则,或在END中应用exit语句,则终止脚本的执行。

另外,它可以使用一个表达式作为参数,该表达式将作为awk的退出状态返回,如果没有提供表达式,那么将返回0。如果为exit语句设置一个初值,然后在END中再次调用没有参数的exit,则使用第一个值。

数组

在awk中不必指明数组的大小,只需要为数组指定标识符。

$awk 'BEGIN{arr[1]="ouhanzhong";print arr[1]}'
$ouhanzhong

还可以和awk内置变量联系起来用。如NR,记录编号。

关联数组

awk中,所有的数组都是关联数组。关联数组的独特之处在于它的下标可以是一个字符串或者一个数值。

有一个特殊的循环语法可以访问关联数组的所有元素,它是for循环的一个版本

 for(variable in array){
 do something with array[variable]
}

array是一个数组名字。variable是一个变量,可以将它看作和普通for循环计数器一样递增的临时变量。该变量在每次循环时被赋予一个特殊的下标。

重要的是需要记住awk中的所有数组下标都是字符串类型。即使使用数字作为下标,awk将自动将它们转换为字符串。

测试数组中的成员资格

关键词in也是一个操作符,用在条件表达式中来测试一个下标是否是数组的成员,表达式为:

 item in array

如果array[item]存在则返回1,不存在则返回0。

用split()创建数组

内置函数split()能够将任何字符串分解到数组的元素中。这个函数对于从字段中提取“子字段”是很有用的。

函数split()的语法为:

 n = split(string,array,separator)

string是要被分解到名字为array的元素中的输入字符串。数组的下标从1开始到n,n即为数组中元素的个数。元素根据指定的separate分隔符来分解。

[oracle@centos ~]$ echo "Ou Han Zhong tet ttt"|awk -F' ' '{n=split($0,y," ");print n}'
输出:
5
[oracle@centos ~]$ echo "Ou Han Zhong"|awk -F' ' '{n=split($0,y," ");print y[n-1]}'
输出:
Han

删除数组元素

awk提供了一个语句用于从数组中删除一个元素。语法是:

 delete array[subscript]

这里的方括号是必须的。这个语句将删除array中下标为subscript的元素。

多维数组

需要注意,awk数组是关联数组,只要通过数组引用它的key,就会自动创建改序列。如下:

[oracle@centos ~]$ awk 'BEGIN{tB["a"]="a1";tB["b"]="b1";if(tB["c"]!="1"){print "no found";};for(k in tB){print k,tB[k];}}'
输出:
no found
a a1
b b1
c

上面代码 tB[“c”] 会自动创建序列。

awk的多维数组在本质上是一维数组,更确切一点,awk在存储上并不支持多维数组。awk提供了逻辑上模拟二维数组的访问方式。

例如,array[2,4] = 1这样的访问是允许的。awk使用一个特殊的字符串SUBSEP (\034)作为分割字段,在上面的例子中,关联数组array存储的键值实际上是2\0344。

类似一维数组的成员测试,多维数组可以使用if ( (i,j) in array)这样的语法,但是下标必须放置在圆括号中。

类似一维数组的循环访问,多维数组使用 for ( item in array )这样的语法遍历数组。与一维数组不同的是,多维数组必须使用split()函数来访问单独的下标分量。split ( item, subscr, SUBSEP)

[oracle@centos ~]$ awk 'BEGIN{
> for(i=1;i<=9;i++){
> for(j=1;j<=9;j++){
> tarr[i,j]=i*j;
> print i,"*",j,"=",tarr[i,j];
> }
> }
> }'
1 * 1 = 1
1 * 2 = 2
1 * 3 = 3
1 * 4 = 4
1 * 5 = 5
1 * 6 = 6
1 * 7 = 7
1 * 8 = 8
....
9 * 7 = 63
9 * 8 = 72
9 * 9 = 81

作为系统变量的数组

awk中提供了两个系统变量,他们是数组。

ARGV

这是一个命令行参数的数组,不包括脚本本身和任何调用awk指定的选项。这个数组中的元素的个数可以从ARGC中获得。数组中的第一个元素的下标是0(和awk中的其他数组不同,而和C一致),最后一个下标是ARGC-1。

ENVIRON

一个环境变量数组,数组中的每个元素时当前环境变量的值,而其下标是环境变量的名字。

命令行参数数组

注意,如果你在shell脚本中调用了awk,命令行的参数将传递给shell而不是传递给awk。你必须将shell脚本的命令行参数,传递给在shell脚本中的awk程序。例如你可以用“$*”将shell脚本中的所有命令行参数传递给awk。如下所示:

awk '
 BEGIN{
 for(x=0;x<ARGC;==x){
 print ARGV[x];
 print ARGC;
 }' $*

在特殊情况下,如果ARGV的元素的值是一个空串(“ “),awk将跳过它并继续处理下一个元素。

环境变量数组

awk 'BEGIN{
> for (env in ENVIRON)
> print env "=" ENVIRON[env];
> }'
输出:
AWKPATH=.:/usr/share/awk
SSH_ASKPASS=/usr/libexec/openssh/gnome-ssh-askpass
LANG=en_US.UTF-8
HISTSIZE=1000
...
jpg=01;35:*.gif=01;35:*.bmp=01;35:*.xbm=01;35:*.xpm=01;35:*.png=01;35:*.tif=01;35:
ORACLE_SID=ORCL

可以使用变量名作为数组的下标访问任意元素:

ENVIRON["HISTSIZE"]

也可以修改数组ENVRION中的任意元素:

ENVRION["HISTSIZE"]=100

但是这个改变并不改变用户的真实环境。

相关资料

1. sed与awk编程语言

相关推荐

Linux在线安装JDK1.8

首先在服务器pingwww.baidu.com查看是否可以连网然后就可以在线下载一、下载安装JDK1.81、在下载安装的同时做好一些准备工作...

Linux安装JDK,超详细

1、了解RPMRPM是Red-HatPackageManager(RPM软件包管理器)的缩写,这一文件格式名称虽然打上了RedHat的标志,但是其原始设计理念是开放式的,现在包括OpenLinux...

Linux安装jdk1.8(超级详细)

前言最近刚购买了一台阿里云的服务器准备要搭建一个网站,正好将网站的一个完整搭建过程分享给大家!#一、下载jdk1.8首先我们需要去下载linux版本的jdk1.8安装包,我们有两种方式去下载安装...

Linux系统安装JDK教程

下载jdk-8u151-linux-x64.tar.gz下载地址:https://www.oracle.com/technetwork/java/javase/downloads/index.ht...

干货|JDK下载安装与环境变量配置图文教程「超详细」

1.JDK介绍1.1什么是JDK?SUN公司提供了一套Java开发环境,简称JDK(JavaDevelopmentKit),它是整个Java的核心,其中包括Java编译器、Java运行工具、Jav...

Linux下安装jdk1.8

一、安装环境操作系统:CentOSLinuxrelease7.6.1810(Core)JDK版本:1.8二、安装步骤1.下载安装包...

Linux上安装JDK

以CentOS为例。检查是否已安装过jdk。yumlist--installed|grepjdk或者...

Linux系统的一些常用目录以及介绍

根目录(/):“/”目录也称为根目录,位于Linux文件系统目录结构的顶层。在很多系统中,“/”目录是系统中的唯一分区。如果还有其他分区,必须挂载到“/”目录下某个位置。整个目录结构呈树形结构,因此也...

Linux系统目录结构

一、系统目录结构几乎所有的计算机操作系统都是使用目录结构组织文件。具体来说就是在一个目录中存放子目录和文件,而在子目录中又会进一步存放子目录和文件,以此类推形成一个树状的文件结构,由于其结构很像一棵树...

Linux文件查找

在Linux下通常find不很常用的,因为速度慢(find是直接查找硬盘),通常我们都是先使用whereis或者是locate来检查,如果真的找不到了,才以find来搜寻。为什么...

嵌入式linux基本操作之查找文件

对于很多初学者来说都习惯用windows操作系统,对于这个系统来说查找一个文件简直不在话下。而学习嵌入式开发行业之后,发现所用到的是嵌入式Linux操作系统,本想着跟windows类似,结果在操作的时...

linux系统查看软件安装目录的方法

linux系统下怎么查看软件安装的目录?方法1:whereis软件名以查询nginx为例子...

Linux下如何对目录中的文件进行统计

统计目录中的文件数量...

Linux常见文件目录管理命令

touch用于创建空白文件touch文件名称mkdir用于创建空白目录还可以通过参数-p创建递归的目录...

Linux常用查找文件方法总结

一、前言Linux系统提供了多种查找文件的命令,而且每种查找命令都具有其独特的优势,下面详细总结一下常用的几个Linux查找命令。二、which命令查找类型:二进制文件;...

取消回复欢迎 发表评论: