正则表达式
来自Wiki.Citydatum
正则表达式(Regular Expression,常简写为regex、regexp)是计算机科学的一个概念,表示用字符序列代表的某种文本模式,用来检索、替换那些符合这个模式(规则)的文本。
概述
模式
主流的正则引擎主要分为3类,分别为DFA,传统型NFA,POSIX NFA。其中DFA、NFA两种引擎都经历了20多年的发展,各自产生了很多变体,出台POSIX NFA规避了不必要变体的继续产生。
符号
正则表达式由普通字符和元字符(metacharacters)组成。普通字符包括大小写的字母和数字,而元字符则具有特殊的含义。
元字符 | 含义 | 描述 |
---|---|---|
\ | 转义符 | 匹配特殊字符或被用作“元字符”的符号 |
* | 通配符 | 匹配前面的子表达式任意次 |
+ | 通配符 | 匹配前面的子表达式一次或多次 |
? | 通配符 | 匹配前面的子表达式零次或一次 |