正則表達式是壹個特殊的字符序列,可以幫助您使用模式中保留的專門語法來匹配或查找其他字符串或字符串集。 正則表達式在UNIX世界中被廣泛使用。
註:很多開發人員覺得正則表達式比較難以理解,主要原因是缺少使用或不願意在這上面花時間。
re模塊在Python中提供對Perl類正則表達式的完全支持。如果在編譯或使用正則表達式時發生錯誤,則re模塊會引發異常re.error。
在這篇文章中,將介紹兩個重要的功能,用來處理正則表達式。 然而,首先是壹件小事:有各種各樣的字符,這些字符在正則表達式中使用時會有特殊的意義。 為了在處理正則表達式時避免混淆,我們將使用:r'expression'原始字符串。
匹配單個字符的基本模式
編譯標誌可以修改正則表達式的某些方面。標誌在re模塊中有兩個名稱:壹個很長的名稱,如IGNORECASE,和壹個簡短的單字母形式,如。
1.match函數
此函數嘗試將RE模式與可選標誌的字符串進行匹配。
下面是函數的語法 :
這裏是參數的描述 :
pattern : 這是要匹配的正則表達式。
string : 這是字符串,它將被搜索用於匹配字符串開頭的模式。 |
flags : 可以使用按位OR(|)指定不同的標誌。 這些是修飾符,如下表所列。
re.match函數在成功時返回匹配對象,失敗時返回None。使用match(num)或groups()函數匹配對象來獲取匹配的表達式。
示例
當執行上述代碼時,會產生以下結果 :
2.search函數
此函數嘗試將RE模式與可選標誌的字符串進行匹配。
下面是這個函數的語法 :
這裏是參數的描述 :
pattern : 這是要匹配的正則表達式。
string : 這是字符串,它將被搜索用於匹配字符串開頭的模式。 |
flags : 可以使用按位OR(|)指定不同的標誌。 這些是修飾符,如下表所列。
re.search函數在成功時返回匹配對象,否則返回None。使用match對象的group(num)或groups()函數來獲取匹配的表達式。
示例
當執行上述代碼時,會產生以下結果 :
3.匹配與搜索
Python提供基於正則表達式的兩種不同的原始操作:match檢查僅匹配字符串的開頭,而search檢查字符串中任何位置的匹配(這是Perl默認情況下的匹配)。
示例
當執行上述代碼時,會產生以下結果 :
4.搜索和替換
使用正則表達式re模塊中的最重要的之壹是sub。
模塊
此方法使用repl替換所有出現在RE模式的字符串,替換所有出現,除非提供max。此方法返回修改的字符串。
示例
當執行上述代碼時,會產生以下結果 :
5.正則表達式修飾符:選項標誌
正則表達式文字可能包含壹個可選修飾符,用於控制匹配的各個方面。 修飾符被指定為可選標誌。可以使用異或(|)提供多個修飾符,如前所示,可以由以下之壹表示 :
6.正則表達模式
除了控制字符(+ ? . * ^ $ ( ) [ ] { } | ),所有字符都與其自身匹配。 可以通過使用反斜杠將其轉換為控制字符。
7.正則表達式示例
字符常量
字符類
特殊字符類
重復匹配
非貪婪重復
這匹配最小的重復次數 :
用圓括號分組
反向引用
這與以前匹配的組再次匹配 :
備擇方案
python|perl : 匹配“python”或“perl”
rub(y|le) : 匹配 “ruby” 或 “ruble”
Python(!+|?) : “Python”後跟壹個或多個! 還是壹個?
錨點
這需要指定匹配位置。
帶括號的特殊語法
開課吧廣場-人才學習交流平臺-開課吧