Unicode4e00到9fa5都是漢字,重復2到4次。
以下是壹些常見的匹配:
匹配雙字節字符(包括漢字):[\ x00-\ xff]
註釋:可以用來計算壹個字符串的長度(壹個雙字節字符長度米2,ASCII字符米1)。
匹配空行的正則表達式:\n\s*\r
備註:可以用來刪除空行。
匹配HTML標記的正則表達式:
評論:網上流傳的版本太爛,上面那個只能匹配部分,但對於復雜的嵌套標簽還是很無奈。
匹配前導和尾隨空白字符的正則表達式:\ s * | \ s * $
註釋:可以用來刪除空白字符(包括空格、制表符、分頁符等。)在壹行的開頭和結尾。這是壹個非常有用的表達。
匹配電子郵件地址的正則表達式:\ w+([-+。] \ w+) * @ \ w+([-。] \ w+) * \。\ w+([-。] \ w+) *
點評:表單驗證很實用。
匹配URL的正則表達式:[a-za-z]+://[\ s] *
點評:網上流傳的版本功能非常有限,以上版本基本能滿足需求。
匹配賬戶是否合法(字母開頭允許5-16字節,允許字母數字下劃線):[a-za-z] [a-za-z0-9 _] {4,15} $
點評:表單驗證很實用。
匹配國內電話號碼:\d{3}-\d{8}|\d{4}-\d{7}
備註:匹配形式為0511-4405222或021-8788822。
匹配騰訊QQ號:[1-9][0-9]{4,}
評論:騰訊QQ號10000起。
匹配中國的郵政編碼:[1-9]\d{5}(?!\d)
備註:中國的郵政編碼是6位數字。
匹配的ID: \d{15}|\d{18}
評論:中國的身份證是15位數或者18位數。
匹配的ip地址:\d+\。\d+\。\d+\。\d+
註釋:提取ip地址時有用。
匹配特定號碼:
[1-9]\ d * $//匹配壹個正整數
-[1-9]\ d * $//匹配負整數
^-?[1-9]\d*$ //匹配壹個整數
[1-9]\ d * | 0 $//匹配壹個非負整數(正整數+0)
-[1-9]\ d * | 0 $//匹配壹個非正整數(負整數+0)
[1-9] \ d * \。\ d * | 0 \。\ d *[1-9]\ d * $/匹配壹個正浮點數。
-([1-9] \ d * \。\ d * | 0 \。\ d *[1-9]\ d *)$//匹配負浮點數。
^-?([1-9]\d*\。\d*|0\。\d*[1-9]\d*|0?\.0+|0)$ //匹配浮點數。
^[1-9]\d*\.\d*|0\。\d*[1-9]\d*|0?\.0+|0$ //匹配壹個非負浮點數(正浮點數+0)
^(-([1-9]\d*\.\d*|0\。\ d *[1-9]\ d *)| 0?\.0+|0$ //匹配非正浮點數(負浮點數+0)
點評:在處理大量數據時有用,具體應用中要註意修正。
匹配特定字符串:
[A-ZA-Z]+$//匹配由26個英文字母組成的字符串。
[A-Z]+$//匹配由26個大寫英文字母組成的字符串。
[A-Z]+$//匹配由26個小寫字母組成的字符串。
[A-ZA-Z0-9]+$//匹配由數字和26個英文字母組成的字符串。
\ w+$//匹配由數字、26個英文字母或下劃線組成的字符串。
評論:壹些最基本和最常用的表達