像我儿子一样永远保持好奇和梦想

[转】什么是awk?

上一篇 / 下一篇  2012-05-15 16:11:02 / 个人分类:linux

在帮朋友的解决的问题中包括以下代码:
-h0u,\A;M!D0sems | awk '$3!="name" {system("sems -r " $3)}' ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台8F)G^ VN~3r1m O
smems -r `smems | awk 'NR>1&&($3~/^GDS/||$3~/^EQC/||$3~/^MC/||$3~/^VME/){print $3}'`
/wX1@&n4]DT0ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台R Az t8Q5Q
网上:caoyanbao的解读应该是比较到位。希望能帮解读上诉代码

8f}*m!K)g _(t0【hsy75】转原文如下:
u%D)t{3R`0你可能对UNIX比较熟悉,但你可能对awk很陌生,这一点也不奇怪,的确,与其优秀的功能相比,awk还远没达到它应有的知名度。awk是什么?与其它 大多数UNIX命令不同的是,从名字上看,我们不可能知道awk的功能:它既不是具有独立意义的英文单词,也不是几个相关单词的缩写。事实上,awk是三 个人名的缩写,他们是:Aho、(Peter)Weinberg和(Brain)Kernighan。正是这三个人创造了awk---一个优秀的样式扫描 与处理工具ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台*NuS:`-Ih2tH)T.e[

8@;T ]k8v;k~ t0AWK的功能是什么?与sed和grep很相似,awk是一种样式扫描与处理工具。但其功能却大大强于sed和grep。awk提供了极其强大的 功能:它几乎可以完成grep和sed所能完成的全部工作,同时,它还可以可以进行样式装入、流控制、数学运算符、进程控制语句甚至于内置的变量和函数。 它具备了一个完整的语言所应具有的几乎所有精美特性。实际上,awk的确拥有自己的语言:awk程序设计语言,awk的三位创建者已将它正式定义为:样式 扫描和处理语言。 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台 k0t(lR I.tN
ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台!R'|r&AwQ
为什么使用awk?
A9u*`u]i(mZ!M#t0 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台$XAt$Fm8m
即使如此,你也许仍然会问,我为什么要使用awk? ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台/U&_%{X{wF

![I ^(k+`A Ga0使用awk的第一个理由是基于文本的样式扫描和处理是我们经常做的工作,awk所做的工作有些象数据库,但与数据库不同的是,它处理的是文本文 件,这些文件没有专门的存储格式,普通的人们就能编辑、阅读、理解和处理它们。而数据库文件往往具有特殊的存储格式,这使得它们必须用数据库处理程序来处 理它们。既然这种类似于数据库的处理工作我们经常会遇到,我们就应当找到处理它们的简便易行的方法,UNIX有很多这方面的工具,例如sed 、grep、sort以及find等等,awk是其中十分优秀的一种。
'CMPH!w0 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台*FPpH%s z,E Z{J
使用awk的第二个理由是awk是一个简单的工具,当然这是相对于其强大的功能来说的。的确,UNIX有许多优秀的工具,例如UNIX天然的开发 工具C语言及其延续C++就非常的优秀。但相对于它们来说,awk完成同样的功能要方便和简捷得多。这首先是因为awk提供了适应多种需要的解决方案:从 解决简单问题的awk命令行到复杂而精巧的awk程序设计语言,这样做的好处是,你可以不必用复杂的方法去解决本来很简单的问题。例如,你可以用一个命令 行解决简单的问题,而C不行,即使一个再简单的程序,C语言也必须经过编写、编译的全过程。其次,awk本身是解释执行的,这就使得awk程序不必经过编 译的过程,同时,这也使得它与shell script程序能够很好的契合。最后,awk本身较C语言简单,虽然awk吸收了C语言很多优秀的成分,熟悉C语言会对学习awk有很大的帮助,但 awk本身不须要会使用C语言――一种功能强大但需要大量时间学习才能掌握其技巧的开发工具。
-v hqxBvos%~0
&cE0R:@@ B2Tw0使用awk的第三个理由是awk是一个容易获得的工具。与C和C++语言不同,awk只有一个文件(/bin/awk),而且几乎每个版本的 UNIX都提供各自版本的awk,你完全不必费心去想如何获得awk。但C语言却不是这样,虽然C语言是UNIX天然的开发工具,但这个开发工具却是单独 发行的,换言之,你必须为你的UNIX版本的C语言开发工具单独付费(当然使用D版者除外),获得并安装它,然后你才可以使用它。
H#o&X+k O#L6iLi0
A6k/TKD @0基于以上理由,再加上awk强大的功能,我们有理由说,如果你要处理与文本样式扫描相关的工作,awk应该是你的第一选择。在这里有一个可遵循的 一般原则:如果你用普通的shell工具或shell script有困难的话,试试awk,如果awk仍不能解决问题,则便用C语言,如果C语言仍然失败,则移至C++。 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台%j;X;v O&Q
ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台%G.wI_.`C
awk的调用方式
a|;K+d:BM L M!Z0
+A4Lu%GRjt8p`*a0前面曾经说过,awk提供了适应多种需要的不同解决方案,它们是: ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台#AegG B

2fxB}+`lr o { v0一、awk命令行,你可以象使用普通UNIX命令一样使用awk,在命令行中你也可以使用awk程序设计语言,虽然awk支持多行的录入,但是录 入长长的命令行并保证其正确无误却是一件令人头疼的事,因此,这种方法一般只用于解决简单的问题。当然,你也可以在shell script程序中引用awk命令行甚至awk程序脚本。
9Bj)o @+[1t0
d;y Ef&}U.k AL-C0二、使用-f选项调用awk程序。awk允许将一段awk程序写入一个文本文件,然后在awk命令行中用-f选项调用并执行这段程序。具体的方法我们将在后面的awk语法中讲到。 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台/C0y$E7JYT

?iLX%jv0?c0三、利用命令解释器调用awk程序:利用UNIX支持的命令解释器功能,我们可以将一段awk程序写入文本文件,然后在它的第一行加上: ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台_-eT @:F1Mpj fE'W
#!/bin/awk -f ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台/_$o V t'zg!C)D.}
并赋予这个文本文件以执行的权限。这样做之后,你就可以在命令行中用类似于下面这样的方式调用并执行这段awk程序了。
7Z$U0w x ][-CK C0
0E'd? `*F%l0$awk脚本文本名 待处理文件
_h6C-VlNU+X0 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台6_\&q1mW#NM
awk的语法:
-d||+`LX7[2Gx0
)QO)TOD N$n0与其它UNIX命令一样,awk拥有自己的语法:
R-RV1P!tw2H!F&O0 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台9{6N |Iw|8|
awk [ -F re] [parameter...] ['prog'] [-f progfile][in_file...] ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台w&Emd&Jf zz$i

EHn@c r0参数说明:
rAl/\JV@7D0
e4ko,[-W L:pr r0-F re:允许awk更改其字段分隔符。 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台4A)v,c,I/]BRz3YO
ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台*x1dq:RM/o
parameter: 该参数帮助为不同的变量赋值。 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台Z\ n9i~R-EU%O2C0x
ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台4T(gt$msh
'prog': awk的程序语句段。这个语句段必须用单拓号:'和'括起,以防被shell解释。这个程序语句段的标准形式为: ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台"I;[8S"[1c*`?]$PB4mA9\j/}
ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台.JR/q|;} nu uo
'pattern {action}'
,y:h~?;~ dF0
q.T`!ZY^FUE0其中pattern参数可以是egrep正则表达式中的任何一个,它可以使用语法/re/再加上一些样式匹配技巧构成。与sed类似,你也可以使 用","分开两样式以选择某个范围。关于匹配的细节,你可以参考附录,如果仍不懂的话,找本UNIX书学学grep和sed(本人是在学习ed时掌握匹配 技术的)。action参数总是被大括号包围,它由一系统awk语句组成,各语句之间用";"分隔。awk解释它们,并在pattern给定的样式匹配的 记录上执行其操作。与shell类似,你也可以使用“#”作为注释符,它使“#”到行尾的内容成为注释,在解释执行时,它们将被忽略。你可以省略 pattern和action之一,但不能两者同时省略,当省略pattern时没有样式匹配,表示对所有行(记录)均执行操作,省略action时执行 缺省的操作――在标准输出上显示。 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台Tw1a)O6D
ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台SvcWkK*X?iz
-f progfile:允许awk调用并执行progfile指定有程序文件。progfile是一个文本文件,他必须符合awk的语法。
(` Qc'D5^w,cW0
{ql.P@E&^,\i0in_file:awk的输入文件,awk允许对多个输入文件进行处理。值得注意的是awk不修改输入文件。如果未指定输入文件,awk将接受标准输入,并将结果显示在标准输出上。awk支持输入输出重定向。 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台s:^%\-rZ ]nJP

h9IhPo%u l'}0awk的记录、字段与内置变量:
-i*Q C;O3OI?X0 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台*N g%MM*H
前面说过,awk处理的工作与数据库的处理方式有相同之处,其相同处之一就是awk支持对记录和字段的处理,其中对字段的处理是grep和sed 不能实现的,这也是awk优于二者的原因之一。在awk中,缺省的情况下总是将文本文件中的一行视为一个记录,而将一行中的某一部分作为记录中的一个字 段。为了操作这些不同的字段,awk借用shell的方法,用$1,$2,$3...这样的方式来顺序地表示行(记录)中的不同字段。特殊地,awk 用$0表示整个行(记录)。不同的字段之间是用称作分隔符的字符分隔开的。系统默认的分隔符是空格。awk允许在命令行中用-F re的形式来改变这个分隔符。事实上,awk用一个内置的变量FS来记忆这个分隔符。awk中有好几个这样的内置变量,例如,记录分隔符变量RS、当前工 作的记录数NR等等,本文后面的附表列出了全部的内置变量。这些内置的变量可以在awk程序中引用或修改,例如,你可以利用NR变量在模式匹配中指定工作 范围,也可以通过修改记录分隔符RS让一个特殊字符而不是换行符作为记录的分隔符。
o6n tut},Wk0 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台k:|GnuC%J
例:显示文本文件myfile中第七行到第十五行中以字符%分隔的第一字段,第三字段和第七字段: ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台)s9k(j:T c(dza'K#]
ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台S1^q!gfw eS r&V W
awk -F % 'NR==7,NR==15 {printf $1 $3 $7}'
+k!wp1^P0 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台 O?a/eM-b w
awk的内置函数
B~GQ1hvp)D0 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台BhZ9h T*R2i%a
awk之所以成为一种优秀的程序设计语言的原因之一是它吸收了某些优秀的程序设计语言(例如C)语言的许多优点。这些优点之一就是内置函数的使 用,awk定义并支持了一系列的内置函数,由于这些函数的使用,使得awk提供的功能更为完善和强大,例如,awk使用了一系列的字符串处理内置函数(这 些函数看起来与C语言的字符串处理函数相似,其使用方式与C语言中的函数也相差无几),正是由于这些内置函数的使用,使awk处理字符串的功能更加强大。 本文后面的附录中列有一般的awk所提供的内置函数,这些内置函数也许与你的awk版本有些出入,因此,在使用之前,最好参考一下你的系统中的联机帮助。
@~,o3e:S8tD0 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台.IQc;_\;A9H"hs
作为内置函数的一个例子,我们将在这里介绍awk的printf函数,这个函数使得awk与c语言的输出相一致。实际上,awk中有许多引用形式 都是从C语言借用过来的。如果你熟悉C语言,你也许会记得其中的printf函数,它提供的强大格式输出功能曾经带我们许多的方便。幸运的是,我们在 awk中又和它重逢了。awk中printf几乎与C语言中一模一样,如果你熟悉C语言的话,你完全可以照C语言的模式使用awk中的printf。因此 在这里,我们只给出一个例子,如果你不熟悉的话,请随便找一本C语言的入门书翻翻。 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台 AI;zt e8A @1W

"r Snv{D0例:显示文件myfile中的行号和第3字段:
oFx2E k0Z6S,R7K0
|"v0o\?0$awk '{printf"%03d%s",NR,$1}' myfile
A4[?/FP$z,Y+U0 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台n `:O2Q1_z7j
在命令行使用awk
Q4m\&ol'ab0
NO4gm+U8Vq0按照顺序,我们应当讲解awk程序设计的内容了,但在讲解之前,我们将用一些例子来对前面的知识进行回顾,这些例子都是在命令行中使用的,由此我 们可以知道在命令行中使用awk是多么的方便。这样做的原因一方面是为下面的内容作铺垫,另一方面是介绍一些解决简单问题的方法,我们完全没有必要用复杂 的方法来解决简单的问题----既然awk提供了较为简单的方法的话。 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台-B"{/~&w YQuXC

{5w9Po9Q*[v%U0例:显示文本文件mydoc匹配(含有)字符串"sun"的所有行。 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台%ql D0q6R2b!c Z
ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台hp)f U]T&Fdm
$awk '/sun/{print}' mydoc ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台!z$}`Ti2LF7D
ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台 r%hdCwn.?-Dv
由于显示整个记录(全行)是awk的缺省动作,因此可以省略action项。
a7_"P {-N0
:nQ FJ/J"up!g H S0$awk '/sun/' mydoc ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台;vl2x p]
ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台^$P6c-kp:s/`,G Q2b
例:下面是一个较为复杂的匹配的示例:
a9X4RX v@!V:u?0
-r ?7Z1r e0X x+e T0$awk '/[Ss]un/,/[Mm]oon/ {print}' myfile
_ ?bu])D{0@7A0
5@JU~9@7T,X0它将显示第一个匹配Sun或sun的行与第一个匹配Moon或moon的行之间的行,并显示到标准输出上。
/lzl%lA:f9|q'O0 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台N EV/_Xoh]5Wo
例:下面的示例显示了内置变量和内置函数length()的使用:
{ gJ(\kL7Tu0 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台dO9h6O_
$awk 'length($0)>80 {print NR}' myfile
h3V"e G,e*W2ae0 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台 ?$IPN)? zrr
该命令行将显示文本myfile中所有超过80个字符的行号,在这里,用$0表示整个记录(行),同时,内置变量NR不使用标志符'$'。 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台7w3\7DwS1Yk3rS$[r

9hHDxCE.B0例:作为一个较为实际的例子,我们假设要对UNIX中的用户进行安全性检查,方法是考察/etc下的passwd文件,检查其中的passwd字 段(第二字段)是否为"*",如不为"*",则表示该用户没有设置密码,显示出这些用户名(第一字段)。我们可以用如下语句实现: ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台5P;umIWi:A.w4[v

N!r3|XUP8t0#awk -F: '$2=="" {printf("%s no password!",$1' /etc/passwd
4u%n0]Lt*V0 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台)i_7[8wD T-`@`
在这个示例中,passwd文件的字段分隔符是“:”,因此,必须用-F:来更改默认的字段分隔符,这个示例中也涉及到了内置函数printf的使用。
7t^C&m%C9A(a0 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台i:@*P I!i8Z
awk的变量
.z kx1Ue0 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台X u#r5]*A W5t)g(i}m
如同其它程序设计语言一样,awk允许在程序语言中设置变量,事实上,提供变量的功能是程序设计语言的其本要求,不提供变量的程序设计语言本人还从未见过。 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台_-[ H2b(m]C
ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台7F`;IYtJpB/c
awk提供两种变量,一种是awk内置的变量,这前面我们已经讲过,需要着重指出的是,与后面提到的其它变量不同的是,在awk程序中引用内置变 量不需要使用标志符"$"(回忆一下前面讲过的NR的使用)。awk提供的另一种变量是自定义变量。awk允许用户在awk程序语句中定义并调用自已的变 量。当然这种变量不能与内置变量及其它awk保留字相同,在awk中引用自定义变量必须在它前面加上标志符"$"。与C语言不同的是,awk中不需要对变 量进行初始化,awk根据其在awk中第一次出现的形式和上下文确定其具体的数据类型。当变量类型不确定时,awk默认其为字符串类型。这里有一个技巧: 如果你要让你的awk程序知道你所使用的变量的明确类型,你应当在在程序中给它赋初值。在后面的实例中,我们将用到这一技巧。
c*r~R_&R.{^!jM0
w[#w"^;y0运算与判断: ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台0c ZKVy;aw{
ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台fX\vke D j
作为一种程序设计语言所应具有的特点之一,awk支持多种运算,这些运算与C语言提供的几本相同:如+、-、*、/、%等等,同时,awk也支持 C语言中类似++、--、+=、-=、=+、=-之类的功能,这给熟悉C语言的使用者编写awk程序带来了极大的方便。作为对运算功能的一种扩展,awk 还提供了一系列内置的运算函数(如log、sqr、cos、sin等等)和一些用于对字符串进行操作(运算)的函数(如length、substr等 等)。这些函数的引用大大的提高了awk的运算功能。 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台^6[CV-K tn8GK

4}~7o-k+_#LCy4u-vC0作为对条件转移指令的一部分,关系判断是每种程序设计语言都具备的功能,awk也不例外。awk中允许进行多种测试,如常用的==(等于)、!= (不等于)、>(大于)、<(小于)、>=(大于等于)、>=(小于等于)等等,同时,作为样式匹配,还提供了~(匹配于) 和!~(不匹配于)判断。
lf;Nj w4A0
&tP E&J^X1p7p&\Uwl0作为对测试的一种扩充,awk也支持用逻辑运算符:!(非)、&&(与)、||(或)和括号()进行多重判断,这大大增强了awk的功能。本文的附录中列出了awk所允许的运算、判断以及操作符的优先级。
wKT3MS9K~$u0 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台l#U%mmAQL
awk的流程控制
qV0?y:hn8t9P0 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台T.K)VfRm
流程控制语句是任何程序设计语言都不能缺少的部分。任何好的语言都有一些执行流程控制的语句。awk提供的完备的流程控制语句类似于C语言,这给我们编程带来了极大的方便。 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台1`a`C/anq6k7qI s
ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台3Mq8LilZ|eV7e
1、BEGIN和END:
7[)S%Hm8Cf,r,f6P^0 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台^Q\,r([;P ^
在awk中两个特别的表达式,BEGIN和END,这两者都可用于pattern中(参考前面的awk语法),提供BEGIN和END的作用是给 程序赋予初始状态和在程序结束之后执行一些扫尾的工作。任何在BEGIN之后列出的操作(在{}内)将在awk开始扫描输入之前执行,而END之后列出的 操作将在扫描完全部的输入之后执行。因此,通常使用BEGIN来显示变量和预置(初始化)变量,使用END来输出最终结果。 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台-toYrAVH2b

*Q0[6d+n?2W)oJ0例:累计销售文件xs中的销售金额(假设销售金额在记录的第三字段): ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台"~lNI6G
ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台xVub#k4o
$awk ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台#@`a*{5h'D/L!_
>'BEGIN { FS=":";print "统计销售金额";total=0}
"I MLl3}F _w9W0>{print $3;total=total+$3;} ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台T3~!G te&{
>END {printf "销售金额总计:%.2f",total}' sx
wm;HD&C\KY:]0(注:>是shell提供的第二提示符,如要在shell程序awk语句和awk语言中换行,则需在行尾加反斜杠) ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台4LO%t cQx^A
ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台9MY/G7W)b!Ta
在这里,BEGIN预置了内部变量FS(字段分隔符)和自定义变量total,同时在扫描之前显示出输出行头。而END则在扫描完成后打印出总合计。
xQ snin9G0
]#rj#q2fv0aYs02、流程控制语句
8d B!Kh9CN0awk提供了完备的流程控制语句,其用法与C语言类似。下面我们一一加以说明: ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台_Li-w4u^

QYU| J02.1、if...else语句: ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台1R$A$S7u7|D/Yy%N
ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台 O:L4~%|ij3T
格式: ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台$v E%lO9?l Dy
if(表达式) ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台;dop7f/wUA
语句1 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台]\rV9{ t
else
+^E,g2`m0语句2 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台J8Q ?c#@^\ac/i

'n,? j*NR2V#M0格式中"语句1"可以是多个语句,如果你为了方便awk判断也方便你自已阅读,你最好将多个语句用{}括起来。awk分枝结构允许嵌套,其格式为: ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台ah Bdi fm,XR9p.n's

Y7B5Y-@G,Y6u d0if(表达式1) ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台,W1Bz)U}I;X&{ E.i
{if(表达式2) ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台-Go%i'to/YS:T
语句1 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台p*\v-f|x`+Z
else
7e)s(aFdN;\3a/J$M0语句2 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台#Xq+ne$V]S
}
_`#N;S7y,nw m)Z A t0语句3
dm-]%Ny|Dj.AO0else {if(表达式3) ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台nj'Ndb9}\.O Vk
语句4
`8H0k'}*O0else
M-V[`%{$HO2K0语句5 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台$Q&RIT-Ge
} ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台 ~WA$ux)hx
语句6 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台 y%Vm5c7B X!?6I

!jQ9N(C+?$r1@:?~3a0当然实际操作过程中你可能不会用到如此复杂的分枝结构,这里只是为了给出其样式罢了。
-[#L(t8P)T]8f A0
5A2~c}%e {q a02.2、while语句
PzX(UI5U ](k1X0
f vR.jI0格式为:
8Ng,|l:~F C.C0
,oe7tp J!H0while(表达式) ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台 R3Q_*m0x+j
语句
k?+Tc ^6w}oq`0
[}B7@0Vcn02.3、do-while语句 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台vx6q-m m
ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台{h$J([b{,EU9M
格式为:
k2by m_R(T0 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台gG k3JJI`RQ
do
w? j|c4yAQ0{ ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台&a3fp"p1[w`'L
语句 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台+s z0xWr R"r Hi
}while(条件判断语句) ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台_yrBC:?q H[E
ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台+@/wc#i\.TB
2.4、for语句
?7JIR)`7K_-{"h @4AX0 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台(F(~z:J%cA-TgIKc8P h
格式为: ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台I;f V@7^$Z

YA"X'CT"G;l0for(初始表达式;终止条件;步长表达式) ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台7V/\TAXmI+{
{语句}
&V~3K0z[;nk0 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台b6n:J3G ^?1j _
在awk的 while、do-while和for语句中允许使用break,continue语句来控制流程走向,也允许使用exit这样的语句来退出。break 中断当前正在执行的循环并跳到循环外执行下一条语句。continue从当前位置跳到循环开始处执行。对于exit的执行有两种情况:当exit语句不在 END中时,任何操作中的exit命令表现得如同到了文件尾,所有模式或操作执行将停止,END模式中的操作被执行。而出现在END中的exit将导致程 序终止。 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台;w)aT*\ { _Gf7Ob:YL

!|x)pO `h*BH0例:为了
O)isa K*YKL0
/h6~"i;L&Z0awk中的自定义函数
9o @Z$?5UmDwp|;?0 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台Re5} VW
定义和调用用户自己的函数是几乎每个高级语言都具有的功能,awk也不例外,但原始的awk并不提供函数功能,只有在nawk或较新的awk版本中才可以增加函数。
;E;YA K"S9Z0
w@ pGk0函数的使用包含两部分:函数的定义与函数调用。其中函数定义又包括要执行的代码(函数本身)和从主程序代码传递到该函数的临时调用。
j+D%I|!Zr0
ISC8mR_0awk函数的定义方法如下:
6A#V.k[(f(n0 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台Vdv#YA1zZ|i|
function 函数名(参数表){
`\1Y;c)m,K0函数体
1\~u~~{0} ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台@.iY(HOhP:j

%z5|6@l#U-M}&QjP0在gawk中允许将function省略为func,但其它版本的awk不允许。函数名必须是一个合法的标志符,参数表中可以不提供参数(但在调用函数时函数名后的一对括号仍然是不可缺少的),也可以提供一个或多个参数。与C语言相似,awk的参数也是通过值来传递的。 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台c)p0F:ZiYp n FN

g$paN(a;ZY|W0在awk中调用函数比较简单,其方法与C语言相似,但awk比C语言更为灵活,它不执行参数有效性检查。换句话说,在你调用函数时,可以列出比函 数预计(函数定义中规定)的多或少的参数,多余的参数会被awk所忽略,而不足的参数,awk将它们置为缺省值0或空字符串,具体置为何值,将取决于参数 的使用方式。 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台|5pHd!U NL,V
ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台0}Y? i(j?t?
awk函数有两种返回方式:隐式返回和显式返回。当awk执行到函数的结尾时,它自动地返回到调用程序,这是函数是隐式返回的。如果需要在结束之前退出函数,可以明确地使用返回语句提前退出。方法是在函数中使用形如:return 返回值 格式的语句。
|6Vk:Ux v0 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台 w}r-c-@
例:下面的例子演示了函数的使用。在这个示例中,定义了一个名为print_header的函数,该函数调用了两个参数FileName和 PageNum,FileName参数传给函数当前使用的文件名,PageNum参数是当前页的页号。这个函数的功能是打印(显示)出当前文件的文件名, 和当前页的页号。完成这个功能后,这个函数将返回下一页的页号。
_2IT1U,c,q0
7T)kE F~"o0nawk ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台YO5M.~B'u r{
>'BEGIN{pageno=1;file=FILENAME
!RWe?;P @ ? a0>pageno=print_header(file,pageno);#调用函数print_header
mp c)XB4_"o[u"]2c0>printf("当前页页号是:%d",pageno); ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台l)m5jFw#VAf
>}
Ci5s_4a9aGG0
5U8| eC"O q*R*G0>#定义函数print_header ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台*hxJ _d*_ n
>function print_header(FileName,PageNum){ ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台 cT0G @T&S\
>printf("%s %d",FileName,PageNum); >PageNum++;return PageNUm;
S{6ub&?5p;d0>} ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台lhk2nmX^*XO
>}' myfile ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台P@'VT YXnJ3F
ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台ix/T;?+r }6N#L
执行这个程序将显示如下内容:
ZR*\#sCq,o9u0 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台(B3Pdy1};_{'Uu
myfile 1 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台v.})A0x'LfK#M2S8O
当前页页号是:2
8Tr"E.BgIJ[7H0 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台VR%u kE:Y$|Mb
awk高级输入输出 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台zY*|5[&n

UZ fR;[}Y8Z5M K7z01.读取下一条记录: ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台 j%A*?6R/X
ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台tVI1zR*{8DPI ?
awk的next语句导致awk读取下一个记录并完成模式匹配,然后立即执行相应的操作。通常它用匹配的模式执行操作中的代码。next导致这个记录的任何额外匹配模式被忽略。
#x8bkr{a3J0 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台#f9pW$yArCWJ2{m
2.简单地读取一条记录
4K6N$sceY0
L/C h^%pL|7[/gW0awk的 getline语句用于简单地读取一条记录。如果用户有一个数据记录类似两个物理记录,那么getline将尤其有用。它完成一般字段的分离(设置字段变 量$0 FNR NF NR)。如果成功则返回1,失败则返回0(到达文件尾)。如果需简单地读取一个文件,则可以编写以下代码:
?/[Dn#F7}0 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台3`*G6E/O KU P#K _
例:示例getline的使用 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台'B9z(b:FmoB3P+r
ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台$m7{8G&\/aEd7^
{while(getline==1) ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台K2W6y Cj"JO
{ ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台8_;Bl;e1}`$wb[
#process the inputted fields
'pIl}g}[4]0} ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台1D#M)C!WK1v y|
} ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台W}9g8iNs

yScGz3wa \0也可以使getline保存输入数据在一个字段中,而不是通过使用getline variable的形式处理一般字段。当使用这种方式时,NF被置成0,FNR和NR被增值。
1hf!?ye#Es%Kyc0
f$EHt DW S0用户也可以使用getline<"filename"方式从一个给定的文件中输入数据,而不是从命令行所列内容输入数据。此 时,getline将完成一般字段分离(设置字段变量$0和NF)。如果文件不存在,返回-1,成功,返回1,返回0表示失败。用户可以从给定文件中读取 数据到一个变量中,也可以用stdin(标准输入设备)或一个包含这个文件名的变量代替filename。值得注意的是当使用这种方式时不修改FNR和 NR。
PB.i\#eHh0 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台9@ N.W,Ix1co
另一种使用getline语句的方法是从UNIX命令接受输入,例如下面的例子:
y.r:{(],Z2rV0 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台?paWx#n'J,y]
例:示例从UNIX命令接受输入 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台:V#_Z9]]x[Lkih4_ f
ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台 @9WAT aPc B^k
{while("who -u"|getline) ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台(|bDo0WF ub
{ ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台FV`1`)o(z\{G
#process each line from the who command
5|P0}N K.U1nL!a0} ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台3f h-@.U*k1pKMn:` v
}
!GN!Lri!L0 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台P `NmBx$V c^
当然,也可以使用如下形式:
-kU}!mqF"H^(Je0
+@!HRG4sx-u0"command" | getline variable ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台-a[ `$P#Iowlg

7H$W&c$y@E%q*y03.关闭文件: ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台 P(q%E Y4t

J.e3k%{].K Ld0awk中允许在程序中关闭一个输入或输出文件,方法是使用awk的close语句。
b K i NAe7SL*~ ?*v0 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台,f[ Lr3C&_
close("filename")
m?qw$\}Sl^0 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台5C!k.m(f4m l
filename可以是getline打开的文件(也可以是stdin,包含文件名的变量或者getline使用的确切命令)。或一个输出文件(可以是stdout,包含文件名的变量或使用管道的确切命令)。
}b,b"ei(W0 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台]S_V{? q y
4.输出到一个文件: ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台*Iq JOE/xSIy([
ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台 eHN'xY
awk中允许用如下方式将结果输出到一个文件: ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台\q3V#mC*xe

Z `2k3nZ2F0printf("hello word!")>"datafile"
q,n)t6| o D@]A0ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台Jop$?i#g}
printf("hello word!")>>"datafile"
Adh&C EG0 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台"e5MR!Rz(~bG"V
5.输出到一个命令 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台&q(p;I4DW9O0sZ2Im n
ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台'v/x lb C3uh
awk中允许用如下方式将结果输出到一个命令:
s gL @jv^0 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台v6c/Ij DH ]P
printf("hello word!")|"sort-t','" ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台v^5DL@&c]8A RI
ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台(K'j+a w6c zI
awk与shell script混合编程
O:O(?Y.IR0 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台5E;v3a!j V5j
因为awk可以作为一个shell命令使用,因此awk能与shell批处理程序很好的融合在一起,这给实现awk与shell程序的混合编程提 供了可能。实现混合编程的关键是awk与shell script之间的对话,换言之,就是awk与shell script之间的信息交流:awk从shell script中获取所需的信息(通常是变量的值)、在awk中执行shell命令行、shell script将命令执行的结果送给awk处理以及shell script读取awk的执行结果等等。
-?2D V!U w0 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台uc!\'`E@Q b~`
1.awk读取Shell script程序变量
8uPg*Cb0
*M*Q5|&|F@u0在awk中我们可以通过“'$变量名'”的方式读取sell scrpit程序中的变量。
'FM eNa"s0 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台1l9e B M-X
例:在下面的示例中,我们将读取sell scrpit程序中的变量Name,该变量存放的是文本myfile的撰写者,awk将打印出这个人名。
#W$CD}kk'j,i?M0
$p/?G(O(^0$cat writename
L|i9kN6v8h ?8e0: ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台 cd.Cs5?7~
# @(#) ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台z9JiD G9M@F
# ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台VZ"F$G`|
. ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台'I#l)Q\&GO4nu
. ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台:Um6S-G.G/w9ma
. ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台 g"nVA8A-E
Name="张三" nawk 'BEGIN {name="'Name'"; printf("%s撰写者%s",FILENAME,name");} ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台/G%tq*jeN ?
{...}END{...}' myfile ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台JT(dK q/r
.
6`wg"^t$B/p-F9v0.
z1_(IG-t&@ oVp ~0. ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台 TC/Ip/gVV$C7PO:i

%?&A0S(G`D02.将shell命令的执行结果送给awk处理
/^:ZmC.y0
9nG!n{z$_0作为信息传送的一种方法,我们可以将一条shell命令的结果通过管道线(|)传递给awk处理:
vM!Y*DB w0
!yZn?:Z4P%d0例:示例awk处理shell命令的执行结果
$z Zt-y)Q,H&U0
d.|ft4o!R0$who -u | awk '{printf("%s正在执行%s",$2,$1)}' ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台qMf]5wz khb w'K(n

$Jkw5_ BP M0该命令将打印出注册终端正在执行的程序名。 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台|0uC4LdQXc:m-U

6d'zFBp-Y2e03.shell script程序读awk的执行结果 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台d.S*t#y7au)`
ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台%B)KF;Mm w
为了实现shell script程序读取awk执行的结果,我们可以采取一些特殊的方法,例如我们可以用变量名=`awk语句`的形式将awk执行的结果存放入一个 shell script变量。当然也可以用管道线的方法将awk执行结果传递给shell script程序处理。 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台xz h`U;lmH ?Q
ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台#^w"X6wV;j)Sn+D
例:作为传送消息的机制之一,UNIX提供了一个向其所有用户传送消息的命令wall(意思是write to all写给所有用户),该命令允许向所有工作中的用户(终端)发送消息。为此,我们可以通过一段shell批处理程序wall.shell来模拟这一程序 (事实上比较老的版本中wall就是一段shell批处理程序:
(~.I?1KnH%l0
"s^o+I2Dh0$cat wall.shell
3Eyig)L/VR2S0: ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台jiU)fZ)Xo[E'|
# @(#) wall.shell:发送消息给每个已注册终端 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台,A3jy%N7Y|.U5r
#
-L7rh7H\p%N.\0cat >/tmp/$$
MT]*|y X}0#用户录入消息文本 who -u | awk '{print $2}' | while read tty ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台Q8a%h:IS3a,zw&h
do ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台5x]&a})bW:S
cat /tmp/$$>$tty ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台 ew\ r\3bh4`5b
done ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台eH_D s

hI+CiO6^1P2r0在这个程序里,awk接受who -u命令的执行结果,该命令打印出所有已注册终端的信息,其中第二个字段是已注册终端的设备名,因此用awk命令析出该设备名,然后用while read tty语句循环读出这些文件名到变量(shell script变量)tty中,作为信息传送的终结地址。 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台v&lEZ9XL)S6k,v
ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台5` y+Sx3Y;y4W[,}
4.在awk中执行shell命令行----嵌入函数system() ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台? G%w3e1u Uq
ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台Gcm oI
system()是一个不适合字符或数字类型的嵌入函数,该函数的功能是处理作为参数传递给它的字符串。system对这个参数的处理就是将其作为命令处理,也就是说将其当作命令行一样加以执行。这使得用户在自己的awk程序需要时可以灵活地执行命令或脚本。
tz|a'MJ;Ax0
,MgS.se6LS4P0例:下面的程序将使用system嵌入函数打印用户编制好的报表文件,这个文件存放在名为myreport.txt的文件中。为简约起见,我们只列出了其END部分: ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台nL0_.k-`
ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台1^cz0w6n r$S
. ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台mJe%aM$Q:u
.
#O/yv+GIo9V0.
Jk%v3OHj0END {close("myreport.txt");system("lp myreport.txt");} ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台-D2j'}\ |q

]a"w F9G H T]0在这个示例中,我们首先使用close语句关闭了文件myreport.txt文件,然后使用system嵌入函数将myreport.txt送入打印机打印。
R,Tt[/h/M0
"iV.INd#Au4\0写到这里,我不得不跟朋友们说再见了,实在地说,这些内容仍然是awk的初步知识,电脑永远是前进的科学,awk也不例外,本篇所能做的只是在你 前行的漫漫长途中铺平一段小小开端,剩下的路还得靠你自己去走。老实说,如果本文真能给你前行的路上带来些许的方便,那本人就知足了! ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台A ~;m'o bZx

P@ED+f4iAm/S0如对本篇有任何疑问,请E-mail To:Chizlong@yeah.net或到主页http://chizling.yeah.net中留言。 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台6K$i.|3y-rgNb5T*j
ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台5k1W D]^-K6X
ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台,gj O Ul*G B
附录:
|Ni A'TFu d0
Q/xaLM(AIg01.awk的常规表达式元字符
:m{"iihw0
l-G,tB#C0换码序列
[/EM#E8Q"\2K-BS0^ 在字符串的开头开始匹配 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台a0SF6k:Z*on0y `|%x
$ 在字符串的结尾开始匹配 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台8p]\X6ZV#W
. 与任何单个字符串匹配 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台:t;cje6Vt4{
[ABC] 与[]内的任一字符匹配
^%j;~n Fv ^ X|0[A-Ca-c] 与A-C及a-c范围内的字符匹配(按字母表顺序)
uHr n?0[^ABC] 与除[]内的所有字符以外的任一字符匹配
2P ttIl9i)z0Desk|Chair 与Desk和Chair中的任一个匹配
uI Y7Y:uJ,n0[ABC][DEF] 关联。与A、B、C中的任一字符匹配,且其后要跟D、E、F中的任一个字符。 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台9^,W0m4G6ghS!J d
* 与A、B或C中任一个出现0次或多次的字符相匹配
tA@}B0M0+ 与A、B或C中任何一个出现1次或多次的字符相匹配
.@^i(l [J6} OG0? 与一个空串或A、B或C在任何一个字符相匹配 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台hmSNn?2e$Fbv-j"H
(Blue|Black)berry 合并常规表达式,与Blueberry或Blackberry相匹配 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台%_(sj6s$h x6U
ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台4s#_3A o#]:tqu,rJ(^
2.awk算术运算符 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台 a!\-C_#Ni\.a*]4~ Gn o
ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台 tClMKQ-I/},t
运算符 用途 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台B1hJ.NApgb
------------------ ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台~ W'^QB#\RQ6j
x^y x的y次幂 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台 y RTu"L{Y
x**y 同上
b3c5v-j-cx:Vf.k#J0s0x%y 计算x/y的余数(求模) ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台b%N(OF2B+g;Jx2DB
x+y x加y ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台m)L}JbW,a
x-y x减y
8Ul2M `KPqv)ht)|z0x*y x乘y
-X"pSrSmEg5Gn0x/y x除y
fK,Hl;o"u0-y 负y(y的开关符号);也称一目减 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台Zb~$|;AV2V
++y y加1后使用y(前置加) ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台 Wb*J1FZp:K
y++ 使用y值后加1(后缀加) ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台6hDO'` @Z%`
--y y减1后使用y(前置减) ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台&@.M!c"w"^oav
y-- 使用后y减1(后缀减)
h)_t;L(}5]'cX0x=y 将y的值赋给x ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台%`{%Fn'O.t7Q
x+=y 将x+y的值赋给x
\k nHD;Z0x-=y 将x-y的值赋给x ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台:h'_7lKt;zs5u
x*=y 将x*y的值赋给x ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台lwADZ6@
x/=y 将x/y的值赋给x x%=y 将x%y的值赋给x
8c(gWUZo0x^=y 将x^y的值赋给x
L+M{#z P!{E0x**=y 将x**y的值赋给x ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台'O9v3z~!i
ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台d Wqn]v
3.awk允许的测试:
9DWT4MQ tp0
UcI2G`;pQ Q"[X0操作符 含义 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台xI_'L%_ B F

)|!z ]ysZoC0x==y x等于y
}y(n ~+L0x!=y x不等于y
Ux8Vm|^)sHC0x>y x大于y ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台0y0s qMBp
x>=y x大于或等于y
!M!|fU-V3L)S0x<y x小于y
mrd-`OcGi0x<=y x小于或等于y?
MkMwSUi;e0x~re x匹配正则表达式re? ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台!YL3GE ]/YSc
x!~re x不匹配正则表达式re? ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台AO,ST'YAxL:{]

0Sd)w s/h C$N04.awk的操作符(按优先级升序排列)
z C zx!Pg;^0
_3Pas KWs0= 、+=、 -=、 *= 、/= 、 %= ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台HKR&TLlcJ
||
7B B s8A9S_y0&& ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台0c mk Nq6R o
> >= < <= == != ~ !~ ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台5Q8~I9^6k7u-P4YX
xy (字符串连结,'x'y'变成"xy")
qj2_$F7_"p0+ - ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台 y9u$r1~ p;a4k
* / %
2Kv$g9EU$]k#W0++ -- ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台3G,h|,|5ys9H6[d
ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台l{TYU%S
5.awk内置变量(预定义变量)
KR"~rOh0
+Ch:{2oYZ*J]0说明:表中v项表示第一个支持变量的工具(下同):A=awk,N=nawk,P=POSIX awk,G=gawk ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台.h9M:Dj"Uk

-[[5XG3a/{D(B&n0V 变量 含义 缺省值 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台:o(NhzNRU}
-------------------------------------------------------- ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台q]jY Y
N ARGC 命令行参数个数 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台 SIQ GA)Mk
G ARGIND 当前被处理文件的ARGV标志符
~ z$t0gkB0N ARGV 命令行参数数组
'b7s'yY0U&F%_Y0G CONVFMT 数字转换格式 %.6g ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台3~eT ZrsD[ j;FjF
P ENVIRON UNIX环境变量 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台?!bK5`Rb
N ERRNO UNIX系统错误消息
"j%b%v r m/|!EZ(d0G FIELDWIDTHS 输入字段宽度的空白分隔字符串 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台Q~\ zU!d
A FILENAME 当前输入文件的名字
3hzl#}f n8po0P FNR 当前记录数 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台]6Eh:Pu'z(vA
A FS 输入字段分隔符 空格
6o#Z?Ion.ZY^hY0G IGNORECASE 控制大小写敏感0(大小写敏感) ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台1GE/Y-Mhq!B9D.?%\
A NF 当前记录中的字段个数 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台.CXx4QM*p8s8d
A NR 已经读出的记录数 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台 { I"Z3CP$`
A OFMT 数字的输出格式 %.6g
TCn2]5Ob0A OFS 输出字段分隔符 空格 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台EhDuyz7bv6\h
A ORS 输出的记录分隔符 新行
I7q(a7iL!ctW+j0A RS 输入的记录他隔符 新行
W&HXy8p|&Uw0N RSTART 被匹配函数匹配的字符串首 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台;GmCGa*_&uK]| LVRY
N RLENGTH 被匹配函数匹配的字符串长度 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台 O?v0v(m | f
N SUBSEP 下标分隔符 "34" ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台ujP3xL|

nJ3zfbT06.awk的内置函数
+X$mU0NT0GT8[DzS0 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台6n hw#q Rz+i3U9jqj
V 函数 用途或返回值
1MO)`lz0------------------------------------------------
A'Zu-C8Wi R"I0N gsub(reg,string,target) 每次常规表达式reg匹配时替换target中的string
'R0an/Rh0N index(search,string) 返回string中search串的位置
:pG)vM6T+?0A length(string) 求串string中的字符个数
B h w.GW'E"|D["~1G1_0N match(string,reg) 返回常规表达式reg匹配的string中的位置 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台{0z,?m]
N printf(format,variable) 格式化输出,按format提供的格式输出变量variable。
E?*C d4P3N&R0N split(string,store,delim) 根据分界符delim,分解string为store的数组元素
:L Y~h&Ipd1I0N sprintf(format,variable) 返回一个包含基于format的格式化数据,variables是要放到串中的数据
@-b5|ER'F0G strftime(format,timestamp) 返回一个基于format的日期或者时间串,timestmp是systime()函数返回的时间
:Z6~ B8m{$C1c0N sub(reg,string,target) 第一次当常规表达式reg匹配,替换target串中的字符串
/G;i)r,cn?(E0A substr(string,position,len) 返回一个以position开始len个字符的子串 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台9ok%XA7u4O-h{Mg!~
P totower(string) 返回string中对应的小写字符
Q/s!_k+f0P toupper(string) 返回string中对应的大写字符
GT/~.N t$F+q2E*jV9n0A atan(x,y) x的余切(弧度)
mz`3V9@'L8k0N cos(x) x的余弦(弧度) ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台EFD r,c7l,I
A exp(x) e的x幂
ut*WTl p0A int(x) x的整数部分
7_ S2I!C t1d+Ik0A log(x) x的自然对数值 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台m+GhWq,my*h+@
N rand() 0-1之间的随机数
ePNX~#ea4I(}0N sin(x) x的正弦(弧度) ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台d+i J*FKO~ wHx'qJ
A sqrt(x) x的平方根 ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台{"GCnZ3C}&H
A srand(x) 初始化随机数发生器。如果忽略x,则使用system()
gs9CE,[-WRm&x7|0G system() 返回自1970年1月1日以来经过的时间(按秒计算)
2i1Z)n#].o0
【深入]ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台0W TF(k7a D3Fxp6p
1 awk and mawk:
2yp~Pk'M0X0franklin@franklin-LifeBook-S-Series:~$ type mawk
mawk is /usr/bin/mawk
franklin@franklin-LifeBook-S-Series:~$ type awk
awk is /usr/bin/awk
franklin@franklin-LifeBook-S-Series:~$ man awkET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台3eioh2Wu+`.G]#}

j;dSid"cYVi0ubuntu 下man awk 得到的其实是mawk,type 检查指令好像两者都有存在。
i5E{8S%H02
F~s4\!\ia~0
hAdj Uo9_T0
)hG.}-|K;n,m7kJC4QV0
Ref:ET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台UI$}/} OsV0W

F0b.k$FeJ t _0//-http://caoyanbao.iteye.com/blog/570868
6Ua-pN#H \ n(srM R0
TBCET创芯网(EETOP)-电子设计论坛、博客、超人气的电子工程师资料分享平台4G&|7@xQRj E3yS

$?$B!Z A8F m};t+@0
`nA_R#?0
Q } ~ V;Y dLAu0

TAG: unix Unix awk

 

评分:0

我来说两句

显示全部

:loveliness: :handshake :victory: :funk: :time: :kiss: :call: :hug: :lol :'( :Q :L ;P :$ :P :o :@ :D :( :)

Open Toolbar