Javascript正则表达式详细描述

正则表达式regular expression 正则表达式就是检查表达式符不符合规定 正则表达式有一个功能十分强大而又十分复杂的对象RegExp,在JavaS

正则表达式regular expression

正则表达式就是检查表达式符不符合规定.正则表达式有一个功能十分强大而又十分复杂的对象RegExp,在JavaScript1.2 版本以上提供。
下面我们来看有关正则表达式的介绍:
正则表达式对象用来规范一个规范的表达式(也就是表达式符不符合特定的要求,譬如是不是正确Email地址格式等),它具有用来检查给出的字符串是否符合规则的属性和方法。除此之外,你用RegExp构造器建立的个别正则表达式对象的属性,就已经预先定义好了正则表达式对象的静态属性,我们随时可以使用它们。
核心对象:
在JavaScript 1.3以后版本增加了toSource方法。
建立方法:
文字格式或RegExp构造器函数。
文字建立格式使用以下格式:
/pattern/flags即/模式/标记

构造器函数方法使用方法如下:
new RegExp("pattern"[, "flags"])即new RegExp("模式"[,"标记"])

参数:
pattern(模式)
表示正则表达式的文本

flags(标记)
如果指定此项,flags可以是下面值之一:
g: global match(全定匹配)
i: ignore case(忽略大小写)
gi: both global match and ignore case(匹配所有可能的值,也忽略大小写)

注意:文本格式中的参数不要使用引号标记,而构造器函数的参数则要使用引号标记。所以下面的表达式建立同样的正则表达式:
/hell+0/world
new RegExp("hell+o", "world")

描述:
当使用构造函数的时候,必须使用正常的字符串避开规则(在字符串中加入前导字符\ )是必须的。
例如,下面的两条语句是等价的:
re = new RegExp("http://www.cnblogs.com/enterBeijingThreetimes/admin/file://w/+")
re = /\w+/

下面提供了在正则表达式中能够使用的完整对特殊字符的一个完整的列表和描述。

1.1:正则表达式中的特殊字符:

字符\
意义:对于字符,通常表示按字面意义,指出接着的字符为特殊字符,\不作解释。
eg:/b/匹配字符'b',通过在b 前面加一个反斜杠\,也就是/\b/,则该字符变成特殊字符,表示匹配一个单词的分界线。
或者:
对于几个字符,通常说明是特殊的,指出紧接着的字符不是特殊的,而应该按字面解释。
eg1:*是一个特殊字符,匹配任意个字符(包括0个字符);

eg2:/a*/意味匹配0个或多个a。
为了匹配字面上的*,在a前面加一个反斜杠;例如:/a\*/匹配'a*'。

字符^
意义:表示匹配的字符必须在最前边。
例如:/^A/不匹配"an A,"中的'A',但匹配"An A."中最前面的'A'。

字符$
意义:与^类似,匹配最末的字符。
例如:/t$/不匹配"eater"中的't',但匹配"eat"中的't'。

字符*
意义:匹配*前面的字符0次或n次。
例如:/bo*/匹配"A fast booooed"中的'boooo'或"A bird warbled"中的'b',但不匹配"A fast grunted"中的任何字符。

字符+
意义:匹配+号前面的字符1次或n次。等价于{1,}。
例如:/a+/匹配"candy"中的'a'和"caaaaaaandy."中的所有'a'。

字符?
意义:匹配?前面的字符0次或1次。
例如:/e?le?/匹配"angel"中的'el'和"angle."中的'le'。

字符
意义:(小数点)匹配除换行符外的所有单个的字符。
例如:/.n/匹配"nay, an apple is on the tree"中的'an'和'on',但不匹配'nay'。


字符(x)
意义:匹配'x'并记录匹配的值。
例如:/(too)/匹配和记录"too bar."中的'too'。匹配子串能被结果数组中的素[1], ..., [n] 返回,或被RegExp对象的属性$1, ..., $9返回。

字符xy
意义:匹配'x'或者'y'。
例如:/greenred/匹配"green apple"中的'green'和"red apple."中的'red'。

字符{n}
意义:这里的n是一个正整数。匹配前面的n个字符。
例如:/a{2}/不匹配"candy,"中的'a',但匹配"caandy," 中的所有'a'和"caaandy."中前面的两个'a'。

字符{n,}
意义:这里的n是一个正整数。匹配至少n个前面的字符。
例如:/a{2,}不匹配"candy"中的'a',但匹配"caandy"中的所有'a'和"caaaaaaandy."中的所有'a'

字符{n,m}
意义:这里的n和m都是正整数。匹配至少n个最多m个前面的字符。
例如:/a{1,3}/不匹配"cndy"中的任何字符,但匹配 "candy,"中的'a',"caandy," 中的前面两个'a'和"caaaaaaandy"中前面的三个'a',注意:即使"caaaaaaandy" 中有很多个'a',但只匹配前面的三个'a'即"aaa"。

字符[xyz]
意义:一字符列表,匹配列出中的任一字符。你可以通过连字符-指出一个字符范围。
例如:[abcd]跟[a-c]一样。它们匹配"brisket"中的'b'和"ache"中的'c'。

字符[^xyz]
意义:一字符补集,也就是说,它匹配除了列出的字符外的所有东西。 你可以使用连字符-指出一字符范围。
例如:[^abc]和[^a-c]等价,它们最早匹配"brisket"中的'r'和"chop."中的'h'。

字符[\b]
意义:匹配一个空格(不要与\b混淆)

字符\b
意义:匹配一个单词的分界线,比如一个空格(不要与[\b]混淆)
例如:/\bn\w/匹配"noonday"中的'no',/\wy\b/匹配"possibly yesterday."中的'ly'。

字符\B
意义:匹配一个单词的非分界线
例如:/\w\Bn/匹配"noonday"中的'on',/y\B\w/匹配"possibly yesterday."中的'ye'。

字符\cX
意义:这里的X是一个控制字符。匹配一个字符串的控制字符。
例如:/\cM/匹配一个字符串中的control-M。

字符\d
意义:匹配一个数字,等价于[0-9]。
例如:/\d/或/[0-9]/匹配"B2 is the suite number."中的'2'。

字符\D
意义:匹配任何的非数字,等价于[^0-9]。
例如:/\D/或/[^0-9]/匹配"B2 is the suite number."中的'B'。

字符\f
意义:匹配一个表单符

字符\n
意义:匹配一个换行符

字符\r
意义:匹配一个回车符

字符\s
意义:匹配一个单个white空格符,包括空格,tab,form feed,换行符,等价于[ \f\n\r\t\v]。
例如:/\s\w*/匹配"foo bar."中的' bar'。

字符\S
意义:匹配除white空格符以外的一个单个的字符,等价于[^ \f\n\r\t\v]。
例如:/\S/\w*匹配"foo bar."中的'foo'。

字符\t
意义:匹配一个制表符

字符\v
意义:匹配一个顶头制表符

字符\w
意义:匹配所有的数字和字母以及下划线,等价于[A-Za-z0-9_]。
例如:/\w/匹配"apple,"中的'a',"$5.28,"中的'5'和"3D."中的'3'。

字符\W
意义:匹配除数字、字母外及下划线外的其它字符,等价于[^A-Za-z0-9_]。
例如:/\W/或者/[^$A-Za-z0-9_]/匹配"50%."中的'%'。

字符\n
意义:这里的n是一个正整数。匹配一个正则表达式的最后一个子串的n的值(计数左圆括号)。

例如:/apple(,)\sorange\1/匹配"apple, orange, cherry, peach."中的'apple, orange',下面有一个更加完整的例子。
注意:如果左圆括号中的数字比\n指定的数字还小,则\n取下一行的八进制escape作为描述。

字符\ooctal和\xhex
意义:这里的\ooctal是一个八进制的escape值,而\xhex是一个十六进制的escape值,允许在一个
正则表达式中嵌入ASCII码。


当表达式被检查的时候,文字符号提供了编辑正则表达式的方法。利用文字符号可以使到正则表达
式保持为常数。例如,如果你在一个循环中使用文字符号来构造一个正则表达式,正则表达式不需进行
反复编译。
正则表达式对象构造器,例如,new RegExp("ab+c"),提供正则表达式的运行时编译。当你知道正
则表达式的模式会变化的时候,应该使用构造函数,或者你不知道正则表达式的模式,而它们是从另外
的源获得的时候,比如由用户输入时。一旦你定义好了正则表达式,该正则表达式可在任何地方使用,
并且可以改变,你可以使用编译方法来编译一个新的正则表达式以便重新使用。
一个分离预先定义的RegExp对象可以在每个窗口中使用;也就是说,每个分离的JavaScript线程运
行以获得自己的RegExp对象。因为每个脚本在一个线程中是不可中断的,这就确保了不同的脚本不会覆
盖RegExp对象的值。
预定义的RegExp对象包含的静态属性:input, multiline, lastMatch,lastParen, leftContext,
rightContext, 以及从$1到$9。input和multiline属性能被预设。其它静态属性的值是在执行个别正则
表达式对象的exec和test方法后,且在执行字符串的match和replace方法后设置的。

属性
注意RegExp对象的几个属性既有长名字又有短名字(象Perl)。这些名字都是指向相同的值。Perl是
一种编程语言,而JavaScript模仿了它的正则表达式。

属性$1, ..., $9
取得匹配的子串,如果有的话

属性$_
参考input

属性$*
参考multiline

属性$&
参考lastMatch

属性$+
参考lastParen

属性$`
参考leftContext

属性$'
参考rightContext

属性constructor
指定用来建立对象原型函

属性global
决定是否测试正则表达式是否不能匹配所有的字符串,或者只是与最先的冲突。

属性ignoreCase
决定试图匹配字符串的时候是否忽略大小写

属性input
当正则表达式被匹配的时候,为相反的字符串。

属性lastIndex
决定下一次匹配从那里开始

属性lastMatch
最后一个匹配的字符

属性lastParen
子串匹配的时候,最后一个parenthesized,如果有的话。

属性leftContext
最近一次匹配前的子串。

属性multiline
是否在串的多行中搜索。

属性prototype
允许附加属性到所有的对象

属性rightContext
最近一次匹配后的的子串。

属性source
模式文本

方法
compile方法
编译一个正则表达式对象

exec方法
运行正则表达式匹配

test方法
测试正则达式匹配

toSource方法
返回一个对象的文字描述指定的对象;你可以使用这个值来建立一个新的对象。不考虑Object.toS
ource方法。

toString方法
返回一个字符串描述指定的对象,不考虑Object.toString对象。

valueOf方法
返回指定对角的原始值。不考虑Object.valueOf方法。

 另外,这个对象继承了对象的watch和unwatch方法

Example:
eg1、下述示例脚本使用replace方法来转换串中的单词。在替换的文本中,脚本使用全局 RegExp
对象的$1和$2属性的值。注意,在作为第二个参数传递给replace方法的时候,RegExp对象的$属性的名
称。
<SCRIPT LANGUAGE="JavaScript">
re = /(\w+)\s(\w+)/;
str = "World Hello";
newstr=str.replace(re,"$2, $1");
document.write(newstr)
</SCRIPT>
显示结果:"Hello,World".

  eg2、下述示例脚本中,RegExp.input由onChange事件处理句柄设置。在getInfo函数中,exec 方法
使用RegExp.input的值作为它的参数,注意RegExp预置了$属性。

<html>
<SCRIPT LANGUAGE="JavaScript">
function getInfo(age)
{
re = /(\w+)\s(\d+)/;
re.exec(age.value);
window.alert(RegExp.$1 + ", your age is " + RegExp.$2);
}
</SCRIPT>
请输入你的姓和年龄,输入完后按回车键。
<FORM>
         <input type="text" name="Age" onChange="getInfo(this);"/>
    </FORM>
</html>


$1, ..., $9属性
用圆括号括着的匹配子串,如果有的话。是RegExp的属性静态,只读

在JavaScript 1.2, NES 3.0以上版本提供
描述:因为input是静态属性,不是个别正则表达式对象的属性。你可以使用RegExp.input 访问该属性。

能加上圆括号的子串的数量不受限制,但正则表达式对象只能保留最后9 条。如果你要访问所有的圆括号内的匹配字串,你可以使用返回的数组。

这些属性能用在RegExp.replace方法替换后的字符串(输出结果)。当使用这种方式的时候,不用预先考虑RegExp对象。下面给出例子。当正则表达式中没有包含圆括号的时候,该脚本解释成$n的字面意
义。(这里的n是一个正整数)。


例如:
下例脚本使用replace 方法来交换串中单词的位置。在替换后的文本字串中,脚本使用正则表达式
RegExp对象的$1和$2属性的值。注意:当它们向replace方法传递参数的时候,这里没有考虑 $ 属性的
RegExp对象的名称。
<SCRIPT LANGUAGE="JavaScript">
re = /(\w+)\s(\w+)/;
str = "World Hello";
newstr=str.replace(re,"$2, $1");
document.write(newstr)
</SCRIPT>
显示的输出结果为:Hello,World。
以下这些不是正则表达式的新增对象请参阅对应的JavaScript对象的属性 $_属性 参考input $*属性
参考multiline $&属性 参考lastMatch $+属性 参考lastParen $`属性
参考leftContext $'属性 参考rightContext compile方法 在脚本运行期间编译正则表达式对象属于RegExp的方法 在JavaScript 1.2, NES 3.0以上版本提供 语法:
regexp.compile(pattern[, flags]) 以数: regexp 正则表达式的名称,可以是变量名或文字串。
pattern 正则表达式的定义文本。 flags 如果指定的话,可以是下面其中的一个: "g": 匹配所有可能的字串"i": 忽略大小写 "gi": 匹配所有可能的字串及忽略大小写 描述:
使用compile方法来编译一个正则表达式 created with the RegExp constructor function。这样就强制正则表达式只编译一次,而不是每次遇到正则表达式的时候都编译一次.当你确认正则表达式能保持不变的时候可使用compile 方法来编译它(在获得它的匹配模式后),这样就可以在脚本中重复多次使用它.你亦可以使用compile 方法来改变在运行期间改变正则表达式。例如,假如正则表达式发生变化,你可以使用compile方法来重新编译该对象来提高使用效率。使用该方法将改变正则表达式的source, global和ignoreCasesource属性的值。 constructor 指出建立对象原型的function。注意这个属性的值由函数本身提供,而不是一个字串包含RegExp的name.Property提供。

在JavaScript 1.1, NES 2.0以上版本提供 ECMA版本ECMA-262 描述:参考Object.constructor.
exec方法 在指定的字符串运行匹配搜索。返回一个结果数组。 是RegExp的方法
在JavaScript 1.2, NES 3.0以上版本提供 语法: regexp.exec([str])regexp([str])
参数: regexp,正则表达式的名称,可以是一个变量名或文字定义串str,要匹配正则表达式的字符串,如果省略,将使用RegExp.input的值。
描述:就如在语法描述中的一样,正则表达工的exec方法能够被直接调用(使用regexp.exec(str))或者间接调用(使用regexp(str))。
假如你只是运行以找出是否匹配,可以使用String搜索方法。
假如匹配成功,exec方法返回一个数组并且更新正则表达式对象属性的值和预先定义的正则表达式对象、RegExp。如果匹配失败,exec方法返回null。
请看下例: <SCRIPT LANGUAGE="JavaScript1.2"> //匹配一个b接着一个或多个d,再接着一个b//忽略大小myRe=/d(b+)(d)/ig; myArray = myRe.exec("cdbBdbsbz");
</SCRIPT> 下面是该脚本的返回值:对象 属性/Index 描述 例子
myArray

myArray的内容 ["dbBd", "bB", "d"]
index
基于0的匹配index 1
input
原始字符串 cdbBdbsbz
[0]
最后匹配的字符 dbBd
[1], ...[n]
用圆括号括住的匹配字符串,如果有的话。不限制括号的个数。 [1] = bB
[2] = d
myRe
lastIndex 开始下次匹配操作的index值 5 ignoreCase
指出"i"是否使用以忽略大小写 true global
指出是否使用"g"标记来进行匹配所有可能的字串 true source
定义模式的文本字符串 d(b+)(d) RegExp lastMatch$&
最后匹配的字符 dbBd leftContext$\Q
最新匹配前面的子串 c rightContext$'
最新匹配后面的子串 bsbz $1, ...$9
圆括号内的匹配子串,如果有的话。圆括号的个数不受限制,但RegExp只能保留最后9个 $1 = bB $2 = d
lastParen $+
最后一个加上圆括号的匹配子串,如果有的话 d

假如你的正则表达式使用了"g"标记,你可以多次使用exec 方法来连续匹配相同的串。当你这样做
的时候,新的匹配将从由正则表达式的lastIndex 属性值确定的子串中开始。例如,假定你使用下面的脚本:
<SCRIPT LANGUAGE="JavaScript1.2"> myRe=/ab*/g;str = "abbcdefabh"
myArray = myRe.exec(str);
document.writeln("Found "+myArray[0]+". Next match starts at "+myRe.lastIndex)
mySecondArray = myRe.exec(str);
document.writeln("Found "+mySecondArray[0]+". Next match starts at "+myRe.lastIndex)
</SCRIPT> 这个脚本显示如下结果: Found abb. Next match starts at 3
Found ab. Next match starts at 9 例子:
在下面的例子中,用户输入一个名字,脚本根据输入执行匹配操作。接着检查数组看是否和其它用户的名字匹配。
本脚本假定已注册的用户的姓已经存进了数组A中,或许从一个数据库中取得。 <HTML>
<SCRIPT LANGUAGE="JavaScript1.2"> A = ["zhao","qian","sun","li","liang"]
function lookup() { firstName = /\w+/i(); if (!firstName)
window.alert (RegExp.input + "非法输入"); else { count=0;
for (i=0;i 输入你的姓然后按回车键。
<FORM><INPUT TYPE:"TEXT" NAME="FirstName" onChange="lookup(this);"></FORM>
</HTML>

 global属性 正则表达式中是否使用了"g"标记。 RegExp属性,只读
在JavaScript 1.2, NES 3.0以上版本提供 描述: global是一个个别正则表达式对象的属性
如果使用了"g"标记,global的值为true;否则为 false。"g"标记指定正则表达式测试所有可能的匹配。
你不能直接改变该属性的值,但可以调用compile方法来改变它。 ignoreCase 检查正则表达式是否使用了"i"标记
RegExp属性,只读 在JavaScript 1.2, NES 3.0以上版本提供 描述:
ignoreCase是个别正则表达式对象的一个属性。
如果使用了"i"标记,则返回true,否则返回false。"i"标记指示在进行匹配的时候忽略大小写。
你不能直接改变该属性的值,但可以通过调用compile方法来改变它 input 指出正则表达式要测试那个字串。$_是这个属性的另一个名字。
RegExp的属性,静态 在JavaScript 1.2, NES 3.0以上版本提供
描述:因为input是静态的,不是某个个别的正则表达式对象的属性。你也可以使用 RegExp.input来表示。
如果没有给正则表达式的exec或test方法提供字符串,并且RegExp.input中有值,则使用它的值来调用该方法。
脚本或浏览器能够预置input属性。如果被预置了值且调用exec或 test方法的时候没有提供字符串
则调用exec或test的时候使用input的值。input可以被浏览器以下面的方式设置:
当text表单域处理句柄被调用的时候,input被设置为该text输入的字串。
当textarea表单域处理句柄被调用的时候,input被设置为textarea域内输入的字串。注意multili
ne亦被设置成true从而能匹配多行文本。 当select表单域处理句柄被调用的时候,input被设置成selected text的值。
当链接对象的处理句柄被调用的时候,input被设置成<A HREF=...>和</A>之间的字符串。
事件理现句柄处理完毕后,input属性的值被清除。 lastIndex 可读/可写的一个整数属性,指出下一次匹配从哪里开始。
RegExp的属性 在JavaScript 1.2, NES 3.0以上版本提供
描述:lastIndex 是个别的正则表达式对象的属性。 这个属性只有当正则表达式的"g"标记被使用以进行全串匹配的时候才被设置。实行以下规则:
如果lastIndex大小字符串的长度,regexp.test和regexp.exec失败,且lastIndex被设为0。
如果lastIndex等于字串的长度且正则表达式匹配空字符串,则正则表达式从lastIndex的位置开始匹配。
如果lastIndex等于字符串的长度且正则表达式不匹配空字符串,则正则表达式不匹配input,且lastIndex被置为0。
否则,lastIndex被设置成最近一次匹配的下一点。 例如,按下面的顺序执行脚本: re = /(hi)?/g 匹配空字符串
re("hi") 返回["hi", "hi"],lastIndex置为2
re("hi") 返回[""],一个空数组,它的下标为0的元素就是匹配字符串。在这种情况下,返回空
串是因为lastIndex等于2(且仍然是2),并且"hi"的长度也是2。 lastMatch 最后一次匹配字符串,$&是同样的意思。
RegExp的属性,静态,只读 在JavaScript 1.2, NES 3.0以上版本提供
描述:因为lastMatch是静态的,所以它不是个别指定正则表达式的属性。你也可以使用RegExp.lastMatch。 lastParen
最后一次加上括号的匹配字符串,如果有的话。$+是同样的意思。 RegExp属性,静态,只读
在JavaScript 1.2, NES 3.0以上版本提供
描述:因为lastParen是静态的,它不是某个个别正则式的属性,你可以使用RegExp.lastParen 表达同样的意思。
leftContext 最近一次匹配前面的子串,$`具有相同的意思。 RegExp的属性,静态,只读
在JavaScript 1.2, NES 3.0以上版本提供
描述:因为leftContext是静态的,不是某一个正则表达式的属性,所以可以使用RegExp.leftContext来表达想同的意思。
multiline 反映是否匹配多行文本,$*是相同的意思。 RegExp的属性,静态
在JavaScript 1.2, NES 3.0以上版本提供
描述:因为multiline是静态的,而不是某个个别正则表达式的属性,所以能够用RegExp.multiline表达相同的意思。
如果允许匹配多行文本,则multiline为true,如果搜索必须在换行时停止,则为false。
脚本或浏览器能够设置multiline属性。当一个textarea的事件处理句柄被调用的时候,multiline
被置为true。在事件处理句柄处理完毕后,multiline属性值被清除。也就是说,如果你设置了multili
ne为true,则执行任何的事件处理句柄后,multiline被置为false。 prototype
描绘类的原型。你可以根据要求使用prototype来增加类的属性或方法。为了获得prototypes 的资
料,请参阅RegExp的Function.prototype.Property属性。 从JavaScript 1.1, NES 2.0版本开始提供
ECMA版本ECMA-262 rightContext 最后一次匹配的右边的字符串,$'是同样的效果。
RegExp的属性,静态,只读 从 JavaScript 1.2, NES 3.0以上版本开始提供
描述:因为rightContext是静态的,不是某个个别正则表达工的属性,可以使用RegExp.rightContext来达到相同的效果。
source 一个只读属性,包含正则表达式定义的模式,不包侨forward slashes和"g"或"i"标记。 RegExp的属性,只读
从JavaScript 1.2, NES 3.0以上版本开始提供
描述:source是个别正则表达式对象的属性,你不能直接改变它的值,但可以通过调用compile 方法来改变它。 test
执行指定字符串的正则表达式匹配搜索,返回true或false。 RegExp的方法
从JavaScript 1.2, NES 3.0以上版本开始提供

语法:regexp.test([str])
参数:regexp,正则表达式的名称,可以是变量名或正则表达式定义文字串
str,要匹配的字符串,如果省略,将使用RegExp.input的值为作参数
描述:当你需要知道一个字符串能否匹配某个正则表达工,可以使用test方法(与String.search方
法类似); 为了获得更多的信息(但速度将变慢),可以使用exec方法(与String.match方法类似)。 例子:下面的例子显示test是否成功的提示:
function testinput(re, str){
if (re.test(str)) midstring = " contains ";
else midstring = " does not contain ";
document.write (str + midstring + re.source); } toSource
返回一个字符串象征对象的源码 RegExp的方法 从JavaScript 1.3以上版本开始提供

语法:toSource()
参数:没有 描述:toSource方法返回下述的值: 对于内置的RegExp对象,toSource返回下面的字符象征源码不可用:
function Boolean(){ [native code] }
在RegExp场合中, toSource返回象征源码的字符串,通常这个方法是由JavaScript内部自动调用而不是不代码中显式调用。
更多请看Object.toSource toString 返回描绘指定对象的字符串。 RegExp的方法
从JavaScript 1.1, NES 2.0开始提供 ECMA版本ECMA-262 语法:toString() 参数:无
描述:RegExp对象不考虑Object对象的toString方法;它不继承Object.toString,对于RegExp 对
象,toString方法返回一个代表该对象的字符串。 例如:下面的例子显示象征RegExp对象的字符串
myExp = new RegExp("a+b+c"); alert(myExp.toString())
displays "/a+b+c/" 更多请看:Object.toString valueOf 返回一个RegExp对象的原始值
RegExp的方法 从JavaScript 1.1版本开始提供 ECMA版本:ECMA-262 语法:valueOf()
参数:无 描述:RegExp的valueOf方法以字符串形式返回RegExp对象的原始值,这个值与RegExp.toString相等。
该方法通常由JavaScript内部自动调用而不是显式调用 例子: myExp = new RegExp("a+b+c");
alert(myExp.valueOf()) displays "/a+b+c/"

eg:/apple(,)\sorange\1/匹配"apple, orange, cherry, peach."中的'apple, orange,',下面有一个更加完整的例子。注意:如果左圆括号中的数字比n指定的数字还小,则n取下一行的八进制escape作为描述。
字符ooctal和xhex
意义:这里的ooctal是一个八进制的escape值,而xhex是一个十六进制的escape值,允许在一个正则表达式中嵌入ASCII码。!/^\s*[\w.-]{5,15}\s*$/.test(str);   //是否合法字符
!/[^ \w\u4E00-\u9FA5-]/.test(str);   //是否为正规字符(含中文)
!/[u00-uFF]/.test(str);              //是否含有中文
!/[\x00-\xff]/.test(str);            //是否含有中文

function String.prototype.isGood(){return !/[^\w.-]{3,15}/g.test(this);}
function String.prototype.Trim() {return this.replace(/(^\s*)(\s*$)/g,"");}
function String.prototype.Ltrim(){return this.replace(/(^\s*)/g, "");}
function String.prototype.Rtrim(){return this.replace(/(\s*$)/g, "");}
function String.prototype.isEmail(){
  return new RegExp(/^\w+((-\w+)(\.\w+))*\@[A-Za-z0-9]+((\.-)[A-Za-z0-9]+)*\.[A-Za-z0-9]+$/).test(this);}

//检查是否为任意数(实数)
function isNumeric(strNumber) {
 var newPar=/^(-\+)?\d+(\.\d+)?$/
 alert(newPar.test(strNumber));}
//检查是否为正数
function isUnsignedNumeric(strNumber) {
 var newPar=/^\d+(\.\d+)?$/
 alert(newPar.test(strNumber)); }
大于零的正整数  /^[1-9]\d*$/
大于零的正数    /^([1-9]\d*(\.\d*[1-9])?)(0\.\d*[1-9])$/
//检查是否为整数
function isInteger(strInteger) {
 var newPar=/^(-\+)?\d+$/
 alert(newPar.test(strInteger)); }
//检查是否为正整数
function isUnsignedInteger(strInteger) {
 var newPar=/^\d+$/
 alert(newPar.test(strInteger));}


IP的验证
/^((1?\d?\d(2([0-4]\d5[0-5])))\.){3}(1?\d?\d(2([0-4]\d5[0-5])))$/


//meizz
RegExp 对象实例属性
global  g 全局标记(只读)
ignoreCase i 大小写不敏感(只读)
lastIndex 指定在字符串中开始下一个匹配的位置(读写)
multilane m 指明多行标记(只读)
source  正则表达式的字符串形式(只读)

RegExp 对象的静态属性
$1, $2,...$9  字符串含有最近匹配的前9个括号内了表达式的文本
index   包含最近模式匹配的第一个字符的字符串索引值
input  $_ 包含匹配模式的默认字符串的字符串
lastIndex  指明开始下一个匹配的字符串中位置的整数
lastMatch $& 包含最近匹配的文本的字符串
lastParen $+ 包含最近匹配的括号内子表达式的文本的字符串
leftContext $` 包含最近匹配的左边的文本的字符串
rightContext $' 包含最近匹配的右边的文本的字符串

/ab*c/    匹配 ac abc abbbbbbbbbbbbbbbc
/ab+c/    匹配 abc abbbbbbbbbbbbbbc 不匹配 ac
/ab?c/    匹配 ab abc 不匹配 abbc
/ab{5}c/  匹配 abbbbbc
/a(bc)+/  匹配 a后跟随一个或者多个"bc"的字符串
/ab{1,5}c/匹配 a与c之间有1到5个b的字符串
/ab{5,}c/ 匹配 a与c之间有5个或者5个以上个数b的字符串

var customer = "Alan 555-1212";
var pattern  = /(\w+) ([\d-]+)/;
alert(pattern.test(customer));
alert("$1 = "+ RegExp.$1 +"\r\n$2 = "+ RegExp.$2);

正则表达式   匹配   不匹配
/\Wten\W/   " ten "   "1ten", "tents"
/\wten\w/   "aten1"   " ten", "1ten "
/\bten\b/   "ten"   "attention", "tensile", "often"
/\d{1,3}\.\d{1,3}/  "128.2"   "1234.33", "aa.23"
/^(httpftphttps):\/\/.*/ "https://abc","ftp//s" "http://www.cnblogs.com/enterBeijingThreetimes/admin/file:///C:", "https//www.w3c.org"
/\w+@\w+\.\w{1,3}/  "mailto:meizz@hzcnc.com" "dds@.122.com", "fff@sina.com.cn"

var pattern = /(\d{3})(\d{2})(\d{4})/;
var ssn = "123456789";
ssn = ssn.replace(pattern, "$1-$2-$3");
alert(RegExp.$_); //返回要匹配的字符串123456789
alert(pattern.source); //正则式的字符串
alert(RegExp['$&']); //最近匹配的文本字符串
alert(RegExp['$+']); //最近匹配的括号内子表达式的文本的字符串 6789
alert(RegExp['$`']);    //包含最近匹配的左边的文本的字符串
alert(RegExp["$'"]); //包含最近匹配的右边的文本的字符串
alert(ssn);   //返回 123-45-6789


实际运用的一些实例


/^\[ \t]*$/     //匹配一个空白行。

/<(.*)>.*<\/\1>/    //匹配一个 HTML 标记。
var str = "<aa href='helloworld' style='color: red'>helloworld</aa>";
alert(str.replace(/<([^ >]*)( .*)?>(.*?)<\/\1>/, "<label>$3</label>"));

/<font.*?>(.*?)<\/font>/ 中间的(.*?) 加了 ? 之后可以切换贪婪模式(贪=>非非=>贪)

str.replace(/\b([a-z]+) \1\b/gi,"$1")       //将STR里所有重复的单词去掉
/^[\+-]?(0?[1-9]\d+)(\.\d{1,2})?$/         //匹配一个数字(最多两位小数)
href.match(/\/([^\?/]*)(\?$)/)[1]          //链接里提取出文件名
/\.([^\.]+)(\?$)/[1]                       //取出路径里的文件后缀名
/^#[\da-f]{6}$/i                           //匹配 #AABBCC 这种颜色
"aaaaaaqqqqqqq".replace(/(.)(\1)(\1)+/g, '')//替换掉重复出现三次的字符


var xx="abc def";
var i=3;
var re=new RegExp("(.{"+i+"}).")  //http://search.csdn.net/expert/topic/3/304/2003/1/8/1340478.htm
var s = xx.replace(re, "$1")   //去掉字符串中第N个字符

SongUrl="http://www.xxx.com/xx/.../yy/abc.mp3" //提取链接里的文件名(不带后缀)
alert(SongUrl.match(/([^\/.]+)[^\/]+$/)[1]);
alert(SongUrl.match(/([^\/]+)\.[^.]+$/)[1]);
alert(SongUrl.replace(/(^.+\/\..+$)/g,""));
alert(SongUrl.replace(/^.*\/([^.]+)[.][^.]+$/,"$1"));
alert(SongUrl.match(/[^\\\/]+(?=\?$)/));      //提取 abc.mp3


var str = "{dfds34#$#}}}{}{{sdf23}{sd}{as}{sd}";
alert(str.match(/[^{}][^{}]*(?=\})/g));

//!!!
function mm(str){return "<"+ (str.replace(/\s/g, "_")) +">"}
var str = "<a   a> a < c > <d   e>  f";
alert(str.replace(/<(.*?)>/g, function($0, $1){return mm($1)}));

var str = "a < c > <d   e>  f";
alert(str.replace(/<(.*?)>/g, function($1){return $1.replace(/\s/g, "_")}));


var pattern = /(?:abc)(def)/; //若使用不带有非俘获语法的常规号则返回First Subexpression: abc
alert("abcdef".replace(pattern, "First Subexpression: $1"));


(?:pattern)
匹配 pattern 但不获取匹配结果,也就是说这是一个非获取匹配,不进行存储供以后使用。
这在使用 "或" 字符 () 来组合一个模式的各个部分是很有用。例如, 'industr(?:yies)
就是一个比 'industryindustries' 更简略的表达式。
var s = "a1;b1\\;b2;c1c2c3";
alert(s.split(/(?:[^\\]);/).join("   @@   "))


(?=pattern)
正向预查,在任何匹配 pattern 的字符串开始处匹配查找字符串。这是一个非获取匹配,
也就是说,该匹配不需要获取供以后使用。例如, 'Windows (?=9598NT2000)' 能匹配
"Windows 2000" 中的 "Windows" ,但不能匹配 "Windows 3.1" 中的 "Windows"。预查不
消耗字符,也就是说,在一个匹配发生后,在最后一次匹配之后立即开始下一次匹配的搜
索,而不是从包含预查的字符之后开始。
"1/01/2/3/4/04/5".replace(/(^\D)(\d)(?=\D$)/g,"$10$2");  //结果是01/01/02/03/04/04/05

(?!pattern)
负向预查,在任何不匹配 pattern 的字符串开始处匹配查找字符串。这是一个非获取匹配,
也就是说,该匹配不需要获取供以后使用。例如'Windows (?!9598NT2000)' 能匹配
"Windows 3.1" 中的 "Windows",但不能匹配 "Windows 2000" 中的 "Windows"。预查不消
耗字符,也就是说,在一个匹配发生后,在最后一次匹配之后立即开始下一次匹配的搜索,
而不是从包含预查的字符之后开始
var reg = /^(http:\/\/)?(?!www\.bbs\.)(\w+\.)abc\.com/i;