4. 正则表达式必知必会-使用元字符

4.1 对特殊字符进行转义

. 表示匹配任意一个单字字符。 [] 表示匹配字符集

const str = 'const arr = []; if (arr[0] === 0) {}';
const reg = /arr[0]/g; // <-- 想匹配 arr[0] 这个内容,但是 [0] 表示包含 0 的字符集,只能匹配 arr0
let match;
while ((match = reg.exec(str))) { // <-- 匹配不到
  console.log(match);
}

加上反斜杠可以将元字符转义。

const str = 'const arr = []; if (arr[0] === 0) {}';
const reg = /arr\[0\]/g; // <-- 将 [] 进行转义
let match;
while ((match = reg.exec(str))) {
  console.log(match);
}
// ["arr[0]", index: 20, input: "const arr = []; if (arr[0] === 0) {}", groups: undefined]

\ 也是一个元字符,使用它本身时,也需要转义:\。

在一个完整的正则表达式里,\ 后面永远跟着一个字符,否则会报错。

4.2 匹配空白字符

元字符 说明
[\b] 回退并删除一个字符
\f 换页符
\n 换行符
\r 回车符
\t 制表符
\v 垂直制表符
const str = '01 test01 \n\r' + '02 test02 \n\r' + '03 test03';
console.log(str);
/*01 test01 ↵
 *02 test02 ↵
 *03 test03
*/
const reg = /\n\r/g;
console.log(str.replace(reg, '')); // 01 test01 02 test02 03 test03

4.3 匹配特定的字符类型

4.3.1 匹配数字(与非数字)

元字符 说明
\d 匹配任何一个数字字符,等价于 [0-9]
\D 匹配任何一个非数字字符,等价于 [^0-9]
const str = 'const arr = [];\nconsole.log(arr[0], arr[1], arr[2]);';
const reg = /arr\[\d\]/g;
let match;
while ((match = reg.exec(str))) {
  console.log(`匹配项: ${match[0]}, index: ${match.index}`);
}
// 匹配项: arr[0], index: 28
// 匹配项: arr[1], index: 36
// 匹配项: arr[2], index: 44

4.3.2 匹配字母和数字(与非字母和数字)

元字符 说明
\w 匹配任何一个字母数字字符(不区分大小写)或下划线字符,等价于 [a-zA-Z0-9_]
\W 匹配任何一个非字母数字字符或非下划线字符,等价于 [^a-zA-Z0-9_]

4.3.3 匹配空白字符(与非空白字符)

元字符 说明
\s 匹配任何一个空白字符,等价于 [\f\n\r\t\v]
\S 匹配任何一个非空白字符,等价于 [^\f\n\r\t\v]

注意:[\b] 比较特殊,没有包含了 \s 中。

4.3.4 匹配十六进制或八进制数值

1. 使用十六进制值

正则表达式里,十六进制要用前缀 \x 来表示。

\x0A 对应于 ASCII 码中的 10(换行符),等价于 \n。

2. 使用八进制值

使用前缀 \0 表示。

4.4 使用 POSIX 字符类

JavaScript 不支持。

Last Updated: 7/20/2019, 11:27:47 AM