标题: grep命令 [打印本页]

作者: 51黑tt    时间: 2016-3-6 15:19
标题: grep命令
既然要使用 grep 当然就得要先了解一下 grep 的语法啰~
[root@test root]# grep [-acinv] '搜寻字符串' filename
参数说明:
-a :将 binary 档案以 text 档案的方式搜寻数据
-c :计算找到 '搜寻字符串' 的次数
-i :忽略大小写的不同,所以大小写视为相同
-n :顺便输出行号
-v :反向选择,亦即显示出没有 '搜寻字符串' 内容的那一行!
范例:
[root@test root]# grep 'root' /var/log/secure
将 /var/log/secure 这个档案中有 root 的那一行秀出来

[root@test root]# grep -v 'root' /var/log/secure
若该行没有 root 才将数据秀出来到屏幕上!

[root@test root]# last | grep root
若该行有 root 才将数据秀出来到屏幕上!

grep 是一个很常见也很常用的指令,他最重要的功能就是进行字符串数据的比对, 然后将符合使用者需求的字符串打印出来。 需要说明的是『grep 在资料中查寻一个字符串时,是以 "整行" 为单位来进行数据的撷取的!』也就是说,假如一个档案内有 10 行,其中有两行具有你所搜寻的字符串,则将那两行显示在屏幕上,其它的就丢弃了!

而 grep 除了可以进行档案的资料搜寻之外,也常常被应用在 input/output 的数据处理当中,例如常见的 管线命令 ( pipe ) 就可以常常见到他的踪影! 以上面表格中的例子来看,我们可以发现前两个例子是查寻档案的内容,有没有加上 -v 所显示出来的结果是『相反的!』,而第三个例子则是以 pipe 的功能进行数据的处理的喔!

好了,我们就开始以 grep 来进行正规表示法的简易说明吧!我们先以底下这个档案来作为范例:

[root@test root]# vi regular_express.txt
"Open Source" is a good mechanism to develop programs.
apple is my favorite food.
Football game is not use feet only.
this dress doesn't fit me.
However, this dress is about $ 3183 dollars.
GNU is free air not free beer.
Her hair is very beauty.
I can’t finish the test.
Oh! The soup taste good.
motorcycle is cheap than car.
This window is clear.
the symbol '*' is represented as start.
Oh! My god!
The gd software is a library for drafting programs.
You are the best is mean you are the no. 1.
The world is the same with "glad".
I like dog.
google is the best tools for search keyword.
goooooogle yes!
go! go! Let's go.
# I am VBird


需要特别注意的是,上面这个档案鸟哥是在 Windows 的环境下编辑的, 并且经过特殊处理过,因此,他虽然是纯文字文件,但是内含一些 Windows 环境下的软件常常自行加入的一些特殊字符,例如断行字符(^M)就是一例! 所以,您可以直接将上面的文字以 vi 储存成 regular_express.txt 这个档案, 不过,比较建议直接点底下的连结下载:

此外,因为不同的语系编码是不一样的,所以,您必须要将语系改成英文语系, 才能够进行底下的测试,否则,可能会有显示的内容与底下的输出不符的状况喔! 修改语系的方法为:
[root@test root]# LANG=en
[root@test root]# export LANG
好了,现在开始我们一个案例一个案例的来介绍吧!

◎grep -- print lines matching a pattern
grep [options] PATTERN [FILE...]
grep [options] [-e PATTERN | -f FILE] [FILE...]
    grep用以在file内文中比对相对应的部分,或是当没有指定档案时,由标准输入中去比对。 在预设的情况下,grep会将符合样式的那一行列出。
    此外,还有两个程式是grep的变化型,egrep及fgrep其中egrep就等同於grep -E ,fgrep等同於grep -F 。
◎参数
    1. -A NUM,--after-context=NUM  
        除了列出符合行之外,并且列出后NUM行。   
         ex:   $ grep -A 1 panda file  
               (从file中搜寻有panda样式的行,并显示该行的后1行)
                                 
    2. -a或--text   
         grep原本是搜寻文字档,若拿二进位的档案作为搜寻的目标,
         则会显示如下的讯息: Binary file 二进位档名 matches 然后结束。
                  
         若加上-a参数则可将二进位档案视为文字档案搜寻,
         相当於--binary-files=text这个参数。
            
         ex:   (从二进位档案mv中去搜寻panda样式)
               (错误!!!)
         $ grep panda mv  
         Binary file mv matches   
         (这表示此档案有match之处,详见--binary-files=TYPE )
         $ (正确!!!)
         $ grep -a panda mv  
        
    3. -B NUM,--before-context=NUM
         与 -A NUM 相对,但这此参数是显示除符合行之外
         并显示在它之前的NUM行。         
              
         ex:   (从file中搜寻有panda样式的行,并显示该行的前1行)
         $ grep -B 1 panda file  
    4. -C [NUM], -NUM, --context[=NUM]   
         列出符合行之外并列出上下各NUM行,预设值是2。
              
         ex:   (列出file中除包含panda样式的行外并列出其上下2行)
               (若要改变预设值,直接改变NUM即可)
               $ grep -C[NUM]  panda file  
              
    5. -b, --byte-offset
       列出样式之前的内文总共有多少byte ..
               
        ex:  $ grep -b  panda file   
         显示结果类似於:
         0:panda
        66:pandahuang
       123:panda03
            
    6. --binary-files=TYPE
        此参数TYPE预设为binary(二进位),若以普通方式搜寻,只有2种结果:
        1.若有符合的地方:显示Binary file 二进位档名 matches
        2.若没有符合的地方:什麽都没有显示。
                    
        若TYPE为without-match,遇到此参数,
        grep会认为此二进位档案没有包含任何搜寻样式,与-I 参数相同。
                    
        若TPYE为text, grep会将此二进位档视为text档案,与-a 参数相同。
         
        Warning: --binary-files=text 若输出为终端机,可能会产生一些不必要的输出。
               
    7. -c, --count
       不显示符合样式行,只显示符合的总行数。
       若再加上-v,--invert-match,参数显示不符合的总行数。
    8. -d ACTION, --directories=ACTION
               若输入的档案是一个资料夹,使用ACTION去处理这个资料夹。
       预设ACTION是read(读取),也就是说此资料夹会被视为一般的档案;
       若ACTION是skip(略过),资料夹会被grep略过:
       若ACTION是recurse(递),grep会去读取资料夹下所有的档案,
       此相当於-r 参数。
    9.  -E, --extended-regexp
       采用规则表示式去解释样式。
      
   10.  -e PATTERN, --regexp=PATTERN
       把样式做为一个partern,通常用在避免partern用-开始。   
   11.  -f FILE, --file=FILE
       事先将要搜寻的样式写入到一个档案,一行一个样式。
       然后采用档案搜寻。
       空的档案表示没有要搜寻的样式,因此也就不会有任何符合。
        
   ex: (newfile为搜寻样式档)
       $grep -f newfile file     
   12.  -G, --basic-regexp
       将样式视为基本的规则表示式解释。(此为预设)
   13.  -H, --with-filename
       在每个符合样式行前加上符合的档案名称,若有路径会显示路径。
        
   ex: (在file与testfile中搜寻panda样式)   
       $grep -H panda file ./testfile
                file:panda
                ./testfile:panda
                $
      
   14.  -h, --no-filename   
        与-H参数相类似,但在输出时不显示路径。
   15.  --help  
        产生简短的help讯息。
   16.  -I
        grep会强制认为此二进位档案没有包含任何搜寻样式,
        与--binary-files=without-match参数相同。
        ex:  $ grep -I  panda mv
   17.  -i, --ignore-case        
        忽略大小写,包含要搜寻的样式及被搜寻的档案。
               
        ex:  $ grep -i panda mv
                 
   18.  -L, --files-without-match  
        不显示平常一般的输出结果,反而显示出没有符合的档案名称。
   19.  -l, --files-with-matches               
        不显示平常一般的输出结果,只显示符合的档案名称。
   20.  --mmap               
         如果可能,使用mmap系统呼叫去读取输入,而不是预设的read系统呼叫。  
         在某些状况,--mmap 能产生较好的效能。 然而,--mmap  
         如果运作中档案缩短,或I/O 错误发生时,
         可能造成未定义的行为(包含core dump),。
               
   21.  -n, --line-number
         在显示行前,标上行号。
               
         ex:  $ grep -n  panda file   
                显示结果相似於下:
                行号:符合行的内容
   22.  -q, --quiet, --silent  
        不显示任何的一般输出。请参阅-s或--no-messages
   23.  -r, --recursive
      
        递地,读取每个资料夹下的所有档案,此相当於 -d recsuse 参数。
   24.  -s, --no-messages
       不显示关於不存在或无法读取的错误讯息。
      
       小: 不像GNU grep,传统的grep不符合POSIX.2协定,
       因为缺乏-q参数,且他的-s 参数表现像GNU grep的 -q 参数。
       Shell Script倾向将传统的grep移植,避开-q及-s参数,
       且将输出限制到/dev/null。
     
       POSIX: 定义UNIX及UNIX-like系统需要提供的功能。               
     
   25.  -V, --version
        显示出grep的版本号到标准错误。
        当您在回报有关grep的bugs时,grep版本号是必须要包含在内的。
   26.  -v, --invert-match
        显示除搜寻样式行之外的全部。
                    
   27.  -w, --word-regexp
        将搜寻样式视为一个字去搜寻,完全符合该"字"的行才会被列出。
   28.  -x, --line-regexp
        将搜寻样式视为一行去搜寻,完全符合该"行"的行才会被列出。






欢迎光临 (http://www.51hei.com/bbs/) Powered by Discuz! X3.1