正则表达式(Regular Expression),又称为正规表达式、规则表达式、常规表示法等,是一种用来匹配、查找和替换字符串的工具。它的语法和规则相对复杂,但却非常强大和灵活。
在Java中,可以使用java.util.regex包中的类来使用正则表达式。常用的类有Pattern和Matcher。
-
Pattern类:用于定义正则表达式的模式。可以通过Pattern.compile()方法来创建Pattern对象。
-
Matcher类:用于对字符串进行匹配操作。可以通过Pattern.matcher()方法来创建Matcher对象。
下面是一些常用的正则表达式语法:
- 字符类:
-
[abc]:匹配a、b、c中的任意一个字符。
-
[^abc]:匹配除了a、b、c以外的任意一个字符。
-
[a-z]:匹配a到z之间的任意一个小写字母。
-
[A-Z]:匹配A到Z之间的任意一个大写字母。
-
[0-9]:匹配0到9之间的任意一个数字。
-
[a-zA-Z0-9]:匹配任意一个字母或数字。
- 边界匹配:
-
^:匹配字符串的开始位置。
-
$:匹配字符串的结束位置。
-
\b:匹配单词的边界。
- 数量词:
-
*:匹配前面的元素零次或多次。
-
+:匹配前面的元素一次或多次。
-
?:匹配前面的元素零次或一次。
-
{n}:匹配前面的元素恰好n次。
-
{n,}:匹配前面的元素至少n次。
-
{n,m}:匹配前面的元素至少n次,但不超过m次。
- 转义字符:
- \:用于转义特殊字符。
- 分组和引用:
-
(pattern):匹配pattern并捕获结果。
-
\1、\2、\3…:引用前面的分组。
- 常用的预定义字符类:
-
.:匹配任意一个字符。
-
\d:匹配任意一个数字。
-
\D:匹配任意一个非数字字符。
-
\w:匹配任意一个字母、数字或下划线。
-
\W:匹配任意一个非字母、数字或下划线字符。
-
\s:匹配任意一个空白字符。
-
\S:匹配任意一个非空白字符。
以上只是正则表达式的一部分语法,还有很多其他的语法和操作符可以使用。在实际使用中,可以根据具体的需求来编写正则表达式。
下面是一个示例代码,演示如何使用正则表达式来匹配字符串:
import java.util.regex.*; public class RegexExample { public static void main(String[] args) { String text = "This is a test string."; String pattern = "test"; Pattern p = Pattern.compile(pattern); Matcher m = p.matcher(text); if (m.find()) { System.out.println("Pattern found!"); } else { System.out.println("Pattern not found!"); } } }
运行以上代码,输出结果为:Pattern found!