javascript正则表达式和字符串的详细介绍

来源：www.45fan.com 2016-11-19 11:51:26

前言

思维导图

RegExp(正则表达式）的创建方式

可以通过两种方式创建一个RegExp，具体如下：

通过/…./的方式来创建正则表达式（注意： /……/两边是没有单引号或双引号的）
通过RegExp构造方法来创建一正则表达式
为了更好的描述模式，正则表达式提供了3个标识，分别是： g/i/m

g: 全局匹配：在整个字符串中匹配，而不是在第一次匹配后之后停止
i: 忽略大小写匹配
m: 对多行字符串中的每一行，应用行首和行末的特殊字符（分别是^和$)
具体看参照下面代码加深理解：

var regx = new RegExp('are','g');
var regx1 = /are/g; //常用的创建方式

RegExp实例的主要属性

根据RegExp的构造函数，我们大概也能猜到RegExp的主要属性，关于实例属性，了解下就可以了。但有一点要注意：这些实例属性是不能通过for in进行遍历获取的。

可参照下面代码加深理解：

var regx1 = /are/g; //常用的创建方式
console.log("source:"+regx.source +" global:"+regx.global+" ignoreCase:"+regx.ignoreCase +" multiline:"+regx.multiline);
// source:are global:true ignoreCase:false multiline:false

for(var p in regx) { //不会进入该for循环
 if(regx.hasOwnProperty(p)) {
 console.log(regx[p]);
 }
}

RegExp实例的主要方法 - test

根据该方法非常简单，只有一个参数，常用来验证输入的参数与正则表达式模式是否匹配，如果匹配返回true，否则返回false. 可参照下面代码加深理解：

var regx1 = /are/g;
var res = regx.test('you are a good boy!');
console.log(res) ; //true
var res1 = regx.test('I am a good boy!');
 console.log(res1) ; //false

RegExp实例的主要方法 - exec

法该方法是一个非常常用的方法，需要好好理解。它只接收一个参数，即要匹配的字符串，返回值却是一个数组arr，数组里存储的是第一个匹配项的相关信息，包括：

input: 要匹配的字符串，exec方法的输入值

index:匹配性在字符串中的位置

arr[0]: 模式匹配的字符串

arr[1]…arr[n]: 第n个捕获组字符串

使用该方法时要注意：如果在正则表达式中未指定全局标志g,则每次执行始终返回的都是第一个匹配项，如果设置了全局标志g，每次调用exec，则会在字符串中继续查找新匹配项

可参照下面代码加深理解：

 var regx = /fn:(\w+)\s+ln:(\w+)\s/g;
 var s ="your fn:xiaoxin ln:tang right?";
 var result = regx.exec(s);
 console.log(result.input); //your fn:xiaoxin ln:tang right?
 console.log(result.index); //5
 console.log(result[0]); //fn:xiaoxin ln:tang
 console.log(result[1]); //xiaoxin
 console.log(result[2]); //tang
 console.log(result[3]); //undefined 因为只有2个捕获组，所以打印undefined

RegExp构造函数属性

关于函数属性，可以参照其它编程语言（如java)中类的静态属性来理解，这些属性被所有的RegExp实例共享，也就是所有的RegExp都可以访问和修改这些属性，当某个实例执行test或exec方法时，这些属性的值也将跟着发生变化

关于这些属性，我们可以按照自己的理解记忆：

input : 需要进行模式匹配的字符串，test或exec方法的输入参数。参数别名： $-
lastMatch ：最近一次匹配项。参数别名：$&
leftContext : 匹配项左边的字符串。参数别名：$`
rightContext : 匹配项右边的字符串。参数别名：$'
1,2,$3….: 捕获组对应的字符串。

当然这些值，完全可以通过RegExp实例执行exec返回的结果计算得到，那为什么要在构造函数RegExp中设置这些属性呢？*

可参照下面代码加深理解：

var regx = /fn:(\w+)\s+ln:(\w+)\s/g;
var s ="your fn:xiaoxin ln:tang right?";
var result = regx.exec(s);
console.log(RegExp.input); //your fn:xiaoxin ln:tang right?
console.log(RegExp.lastMatch); //fn:xiaoxin ln:tang
console.log(RegExp.leftContext); //your
console.log(RegExp.rightContext); //right?
console.log(RegExp.$1); //xiaoxin
console.log(RegExp.$2); //tang

RegExp - 元字符

与其它语言中的正则表达式类似， js正则表达式中也存在一些元字符，这些字符有特殊的用途和含义，所以在使用的过程中，需要对这些字符进行转义，通过在这些字符前加上'\' 进行转义处理. JS正则表达是的元字符有：

( [ { \ ^ $ | ) ? * + . ] }

RegExp - 贪婪匹配和懒惰匹配

贪婪匹配就是在正则表达式的匹配过程中，默认会使得匹配长度越大越好。在JS正则表达式中，懒惰限定符是 ‘?' ,在模式中添加 ‘?' 则要求是懒惰匹配。具体参照下面代码来理解：

var s = 'I am a good boy,you are also a good boy !';
var regx = /good.*boy/g; //贪婪匹配
console.log(regx.exec(s)[0]); //good boy,you are also a good boy
var regx1 = /good.*?boy/g; //懒惰匹配
console.log(regx1.exec(s)[0]); //good boy

路由器

电脑

手机

网络

javascript正则表达式和字符串的详细介绍

推荐阅读