正则表达式(Regular Expression,简称正则或RegExp)是用于匹配字符串中字符组合的表达式。它是一种强大的工具,可以用于搜索、替换和提取字符串中的文本。
正则表达式由字符和操作符构成,用于描述字符串模式。以下是一些基本的正则表达式元素:
字符类 | [abc] | 匹配字符串中的任意一个字符是 "a"、"b" 或 "c"。 |
示例:正则表达式 /[abc]/ 匹配字符串 "hello" 中的字符 "e",因为它是字符类中的一个字符。 | ||
[^abc] | 匹配字符串中的任意一个字符不是 "a"、"b" 或 "c"。 | |
示例:正则表达式 /[^abc]/ 匹配字符串 "hello" 中的字符 "h",因为它不在字符类中。 | ||
元字符 | .
| 匹配除换行符之外的任意一个字符。 |
示例:正则表达式 /he./ 匹配字符串 "hello" 中的字符 "hel"。 | ||
^ | 匹配字符串的开始。 | |
示例:正则表达式 /^he/ 匹配字符串 "hello",因为它在字符串的开头。 | ||
$ | 匹配字符串的结束。 | |
示例:正则表达式 /lo$/ 匹配字符串 "hello",因为它在字符串的末尾。 | ||
量词 | * | 匹配前面的元素零次或多次。 |
示例:正则表达式 /ba*/ 匹配字符串 "ba", "baa", "baaa" 等。 | ||
+ | 匹配前面的元素一次或多次。 | |
示例:正则表达式 /ba+/ 匹配字符串 "ba", "baa", 但不匹配 "b"。 | ||
? | 匹配前面的元素零次或一次。 | |
示例:正则表达式 /ba?/ 匹配字符串 "b" 和 "ba"。 | ||
{n} | 匹配前面的元素恰好 n 次。 | |
示例:正则表达式 /ba{2}/ 匹配字符串 "baa"。 | ||
{n,} | 匹配前面的元素至少 n 次。 | |
示例:正则表达式 /ba{2,}/ 匹配字符串 "baa", "baaa" 等。 | ||
{n,m} | 匹配前面的元素至少 n 次但不超过 m 次。 | |
示例:正则表达式 /ba{2,4}/ 匹配字符串 "baa", "baaa", "baaaa"。 | ||
特殊字符 | \ | 转义字符,用于匹配特殊字符。 |
示例:正则表达式 /\d/ 匹配字符串 "123", 不匹配 "abc"。 | ||
| | 或操作符,匹配两者之一。 | |
示例:正则表达式 /cat|dog/ 匹配字符串 "cat" 或 "dog"。 |
常用正则表达式涵盖了一系列常见的文本匹配需求。以下是一些常用的正则表达式示例:
匹配数字:
- 匹配整数:/^\d+$/
- 匹配浮点数:/^\d+(\.\d+)?$/
- 匹配正整数:/^[1-9]\d*$/
- 匹配非负整数:/^\d+$/
匹配字母和数字:
- 匹配由数字和字母组成的字符串:/^[a-zA-Z0-9]+$/
匹配邮箱地址:
- /^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$/
匹配手机号码:
- /^1[3456789]\d{9}$/
匹配日期:
- 匹配 yyyy-mm-dd 格式的日期:/^\d{4}-\d{2}-\d{2}$/
- 匹配 yyyy/mm/dd 格式的日期:/^\d{4}\/\d{2}\/\d{2}$/
匹配 URL:
- /^(http|https):\/\/\w+(\.\w+)+([\w\-.,@?^=%&:/~+#]*[\w\-@?^=%&/~+#])?$/
匹配 IP 地址:
- /^((25[0-5]|2[0-4]\d|1\d{2}|[1-9]\d|\d)\.){3}(25[0-5]|2[0-4]\d|1\d{2}|[1-9]\d|\d)$/
匹配中文字符:
- /[\u4e00-\u9fa5]/
匹配 HTML 标签:
- /<\/?[^>]+(>|$)/
匹配用户名:
- /^[a-zA-Z0-9_-]{3,16}$/
参考资料:
正则表达式 – 语法 | 菜鸟教程
正则表达式手册
上一篇:如何学习正则表达式