正则表达式是一种用于匹配字符串模式的工具,它用一种描述性的语言来定义搜索模式。常用的正则表达式语法包括:
-
字符匹配:使用普通字符直接匹配文本的字符,例如
abc
可以匹配 “abc”。 -
元字符:元字符是具有特殊意义的字符,常用的元字符包括:
-
.
:匹配任意单个字符,除了换行符。 -
*
:匹配前一个字符0次或多次。 -
+
:匹配前一个字符1次或多次。 -
?
:匹配前一个字符0次或1次。 -
|
:匹配两个或多个表达式之一。 -
[]
:匹配方括号内的任意一个字符。 -
()
:捕获分组,可以用于后续引用。
- 字符类:用于匹配某个位置上的字符,常用的字符类包括:
-
\d
:匹配一个数字字符,等同于[0-9]
。 -
\w
:匹配一个字母、数字或下划线字符,等同于[a-zA-Z0-9_]
。 -
\s
:匹配一个空白字符,包括空格、制表符、换行符等。 -
\D
、\W
、\S
:分别为\d
、\w
、\s
的取反。
- 边界匹配:用于限定匹配的边界,常用的边界匹配包括:
-
^
:匹配字符串的开头。 -
$
:匹配字符串的结束。 -
\b
:匹配单词边界。 -
\B
:匹配非单词边界。
- 重复限定符:用于指定匹配的重复次数,常用的重复限定符包括:
-
{n}
:匹配前一个字符恰好 n 次。 -
{n,}
:匹配前一个字符至少 n 次。 -
{n,m}
:匹配前一个字符至少 n 次,但不超过 m 次。
- 转义字符:用于匹配元字符本身,常用的转义字符包括
\
,例如\.
可以匹配句点字符。
这些只是正则表达式语法中的一部分,正则表达式还有很多其他功能和语法。要熟练掌握正则表达式,需要不断练习和实践。