當前位置:才華齋>計算機>作業系統>

如何在Linux中使用GNU sed

作業系統 閱讀(1.21W)

導語:如何在Linux中使用GNU sed,下面是小編給大家提供的使用方法,大家可以參考閱讀,更多詳情請關注應屆畢業生考試網。

如何在Linux中使用GNU sed

  處理 Linux 中的文字流

Linux 將程式中的輸入和輸出當成字元流或者字元序列。在開始理解重定向和管道之前,我們必須先了解三種最重要的I/O(輸入和輸出(Input and Output))流,事實上,它們都是特殊的檔案(根據 UNIX 和 Linux 中的約定,資料流和外圍裝置(裝置檔案)也被視為普通檔案)。

在 > (重定向操作符) 和 | (管道操作符)之間的區別是:前者將命令與檔案相連線,而後者將命令的輸出和另一個命令相連線。

# command >file

# command1 | command2

由於重定向操作符會靜默地建立或覆蓋檔案,我們必須特別小心謹慎地使用它,並且永遠不要把它和管道混淆起來。在 Linux 和 UNIX 系統上管道的優勢是:第一個命令的輸出不會寫入一個檔案而是直接被第二個命令讀取。

在下面的操作練習中,我們將會使用這首詩——《A happy child》(作者未知)

  使用 sed

sed 是流編輯器(stream editor)的縮寫。為那些不懂術語的人額外解釋一下,流編輯器是用來在一個輸入流(檔案或者管道中的輸入)執行基本的文字轉換的工具。

sed 最基本的用法是字元替換。我們將通過把每個出現的小寫 y 改寫為大寫 Y 並且將輸出重定向到 開始。g 標誌表示 sed 應該替換檔案每一行中所有應當替換的例項。如果這個標誌省略了,sed 將會只替換每一行中第一次出現的例項

  基本語法:

#sed's/term/replacement/flag'file

我們的樣例:

#sed's/y/Y/g' >

如果你要在替換文字中搜索或者替換特殊字元(如 /,,&),你需要使用反斜槓對它進行轉義。

例如,我們要用一個符號來替換一個文字,與此同時我們將把一行最開始出現的第一個 I 替換為 You。

#sed's/and/&/g;s/^I/You/g'

在上面的命令中,眾所周知 ^(插入符號)是正則表示式中用來表示一行開頭的符號。

正如你所看到的,我們可以通過使用分號分隔以及用括號包裹來把兩個或者更多的替換命令(並在它們中使用正則表示式)連線起來。

另一種 sed 的.用法是顯示或者刪除檔案中選中的一部分。在下面的樣例中,將會顯示 /var/log/messages 中從6月8日開始的頭五行。

#sed-n '/^Jun 8/ p'/var/log/messages |sed-n 1,5p

請注意,在預設的情況下,sed 會列印每一行。我們可以使用 -n 選項來覆蓋這一行為並且告訴 sed 只需要列印(用 p來表示)檔案(或管道)中匹配的部分(第一個命令中指定以“Jun 8” 開頭的行,第二個命令中指定一到五行)。

最後,可能有用的技巧是當檢查指令碼或者配置檔案的時候可以保留檔案本身並且刪除註釋。下面的單行 sed 命令刪除(d)空行或者是開頭為#的行(| 字元對兩個正則表示式進行布林 OR 操作)。

#sed'/^#|^$/d'

  uniq 命令

uniq 命令允許我們返回或者刪除檔案中重複的行,預設寫到標準輸出。我們必須注意到,除非兩個重複的行相鄰,否則uniq 命令不會刪除他們。因此,uniq 經常和一個前置的 sort 命令(一種用來對文字行進行排序的演算法)搭配使用。預設情況下,sort 使用第一個欄位(用空格分隔)作為關鍵欄位。要指定一個不同的關鍵欄位,我們需要使用 -k 選項。

  樣例

du –sch /path/to/directory/* 命令將會以人類可讀的格式返回在指定目錄下每一個子資料夾和檔案的磁碟空間使用情況(也會顯示每個目錄總體的情況),而且不是按照大小輸出,而是按照子資料夾和檔案的名稱。我們可以使用下面的命令來讓它通過大小排序。

#du-sch /var/* | sort -h

你可以通過使用下面的命令告訴 uniq 比較每一行的前6個字元(-w 6)(這裡是指定的日期)來統計日誌事件的個數,而且在每一行的開頭輸出出現的次數(-c)。

#cat/var/log/ |uniq-c -w6

  grep 命令

grep 在檔案(或命令輸出)中搜索指定正則表示式,並且在標準輸出中輸出匹配的行。

  樣例

顯示檔案 /etc/passwd 中使用者 gacanepa 的資訊,忽略大小寫。

#grep-i gacanepa /etc/passwd

顯示 /etc 資料夾下所有 rc 開頭並跟隨任意數字的內容。

#ls-l /etc |grep rc[0-9]

  tr 命令使用技巧

tr 命令可以用來從標準輸入中轉換(改變)或者刪除字元,並將結果寫入到標準輸出中。

  樣例

把 檔案中所有的小寫改為大寫。

#cat |tr[:lower:][:upper:]

壓縮ls –l輸出中的分隔符為一個空格。

#ls-l |tr-s ' '

  cut 命令使用方法

cut 命令可以基於位元組(-b選項)、字元(-c)或者欄位(-f)提取部分輸入(從標準輸入或者檔案中)並且將結果輸出到標準輸出。在最後一種情況下(基於欄位),預設的欄位分隔符是一個製表符,但可以由 -d 選項來指定不同的分隔符。

  樣例

從 /etc/passwd 中提取使用者賬戶和他們被分配的預設 shell(-d 選項允許我們指定分界符,-f 選項指定那些欄位將被提取)。

#cat/etc/passwd|cut-d:-f1,7

將以上命令結合起來,我們將使用 last 命令的輸出中第一和第三個非空檔案建立一個文字流。我們將使用 grep 作為第一過濾器來檢查使用者 gacanepa 的會話,然後將分隔符壓縮至一個空格(tr -s ' ')。下一步,我們將使用 cut 來提取第一和第三個欄位,最後使用第二個欄位(本樣例中,指的是IP地址)來排序之後,再用 uniq 去重。

#last|grep gacanepa |tr-s ‘‘|cut-d’‘-f1,3|sort-k2 |uniq

上面的命令顯示瞭如何將多個命令和管道結合起來,以便根據我們的要求得到過濾後的資料。你也可以逐步地使用它以幫助你理解輸出是如何從一個命令傳輸到下一個命令的(順便說一句,這是一個非常好的學習經驗!)