经典JavaScript正则表达式实战

匹配结尾的数字 如 30CAC0040 取出40 3SFASDF92 取出92 正则如下: d+$ g 统一空格个数 字符串内字符键有空格,但是空格的数量可能

匹配结尾的数字


30CAC0040 取出40
3SFASDF92 取出92

正则如下:/\d+$/g

 

统一空格个数

字符串内字符键有空格,但是空格的数量可能不一致,通过正则将空格的个数统一变为一个。

例如:蓝 色  理    想

变成:蓝 色 理 想

aobert的正则:

<script type="text/javascript">
var str="蓝 色 理 想"
var reg=/\s+/g
str = str.replace(reg," ")
document.write(str)
</script>

 

判断字符串是不是由数字组成

<script type="text/javascript">
function isDigit(str){
var reg = /^\d*$/;
return reg.test(str);
}
var str = "7654321";
document.write(isDigit(str));
var str = "test";
document.write(isDigit(str));
</script>



 

电话号码正则

 /^\d{3,4}-\d{7,8}(-\d{3,4})?$/

区号必填为3-4位的数字,区号之后用“-”与电话号码连接

 ^\d{3,4}-

电话号码为7-8位的数字

 \d{7,8}

分机号码为3-4位的数字,非必填,但若填写则以“-”与电话号码相连接

 (-\d{3,4})?

 

手机号码正则表达式

正则验证手机号,忽略前面的0,支持130-139,150-159。忽略前面0之后判断它是11位的。

cloeft的正则:

 /^0*(13|15|14|18)\d{9}$/

^0*匹配掉开头任意数量的0。

由于手机号码是13任意数字9位,和15(14,18)任意数字9位,所以可以用(13|15)\d{9}匹配。

测试代码如下:

function testReg(reg,str){
return reg.test(str);
}
var reg = /^0*(13|15|14|18)\d{9}$/;
var str = '13889294444';
var str2 = '12889293333';
var str3 = '23445567';
document.write(testReg(reg,str)+'<br />');
document.write(testReg(reg,str2)+'<br />');
document.write(testReg(reg,str3)+'<br />');



 

使用正则表达式实现删除字符串中的空格:

代码以及测试代码如下:

 <script type="text/javascript">
//删除字符串两侧的空白字符。
function trim(str){
return str.replace(/^\s+|\s+$/g,'');
}
//删除字符串左侧的空白字符。
function ltrim(str){
return str.replace(/^\s+/g,'');
}
//删除字符串右侧的空白字符。
function rtrim(str){
return str.replace(/\s+$/g,'');
}
//以下为测试代码
var trimTest = " 123456789 ";
//前后各有一个空格。
document.write('length:'+trimTest.length+'<br />');
//使用前
document.write('ltrim length:'+ltrim(trimTest).length+'<br />');
//使用ltrim后
document.write('rtrim length:'+rtrim(trimTest).length+'<br />');
//使用rtrim后
document.write('trim length:'+trim(trimTest).length+'<br />');
//使用trim后
</script>


测试的结果如下:

 length:11
 ltrim length:10
 rtrim length:10
 trim length:9

 

限制文本框只能输入数字和小数点等等

只能输入数字和小数点

 var reg = /^\d*\.?\d{0,2}$/

开头有若干个数字,中间有0个或者一个小数点,结尾有0到2个数字。

只能输入小写的英文字母和小数点,和冒号,正反斜杠(:./\)

 var reg = /[a-z\.\/\\:]+/;

a-z包括了小写的英文字母,\.是小数点,\/和\\分别是左右反斜线,最后是冒号。整个组成一个字符集和代码任一均可,最后在加上+,1或者多个。

 

替换小数点前内容为指定内容

来源:求一正则表达式!

请问 怎么把这个字符串的小数点前面的字符替换为我自定义的字符串啊?
例如:infomarket.php?id=197 替换为 test.php?id=197
应该可以把第一个点“.”之前的所有单词字符替换为test就可以了。我写的正则如下:

 <script type="text/javascript">
 var str = "infomarket.php?id=197";
 var reg = /^\w*/ig;
 //匹配字符串开头的任意个单词字符
 str = str.replace(reg,'test');
 document.write(str);
 </script>

 

只匹配中文的正则表达式

前两天看的《JavaScript开发王》里恰好有中文的unicode范围,正则如下:

 /[\u4E00-\u9FA5\uf900-\ufa2d]/

写了一个简单的测试,会把所有的中文替换成“哦”。

<script type="text/javascript">
var str = "有中文?and English.";
var reg = /[\u4E00-\u9FA5\uf900-\ufa2d]/ig;
str = str.replace(reg,'哦');
document.write(str);
</script>

 

返回字符串的中文字符个数

一般的字符长度对中文和英文都是不分别的 如JS里的length,那么如何返回字符串中中文字符的个数呢?guoshuang老师在原帖中给出了解决方案,我又没看懂……

不过我自己也想到了一个办法:先去掉非中文字符,再返回length属性。函数以及测试代码如下:

<script type="text/javascript">
function cLength(str){
var reg = /[^\u4E00-\u9FA5\uf900-\ufa2d]/g;
//匹配非中文的正则表达式
var temp = str.replace(reg,'');
return temp.length;
}
var str = "中文123";
document.write(str.length+'<br />');
document.write(cLength(str));
</script>

结果:

 5
 2

中文两个,数字三个,正确。

下面的测试也正确。

var str = "中文123tets@#!#%$#[][{}";
document.write(str.length+'<br />');
document.write(cLength(str));

 

匹配<ul>与<ul>之间的内容

<ul>safsf<ul>safsf</ul><ul>safsf</ul></ul>

用正则可以得到 <ul>起到下个<ul> 之间的内容。

正则如下:

 /<ul>[\s\S]+?<ul>/i

首先匹配两侧的ul标签,中间的[\s\S]+?可以匹配一个或者多个任意字符,一定要非贪婪,否则会匹配<ul>safsf<ul>safsf</ul><ul>。

 

用正则表达式获得文件名

c:\images\tupian\006.jpg

可能是直接在盘符根目录下,也可能在好几层目录下,要求替换到只剩文件名。

xlez的正则如下:

 /[^\\\/]*[\\\/]+/g

首先匹配非左右斜线字符0或多个,然后是左右斜线一个或者多个。形如“xxx/”或者“xxx\”或者“/”或者“\”

函数以及测试代码:

<script type="text/javascript">
function getFileName(str){
var reg = /[^\\\/]*[\\\/]+/g;
//xxx\或者是xxx/
str = str.replace(reg,'');
return str;
}
var str = "c:\\images\\tupian\\006.jpg";
document.write(getFileName(str)+'<br />');
var str2 = "c:/images/tupian/test2.jpg";
document.write(getFileName(str2));
</script>

注意,\需要转义。

 

用户名正则

用于用户名注册,,用户名只 能用 中文、英文、数字、下划线、4-16个字符。

hansir和解决方案弄成正则:

 /^[\u4E00-\u9FA5\uf900-\ufa2d\w]{4,16}$/

中文字符或者单词字符,4到16个。实现4到16结成到正则里的关键就是开始^和结束$,这就等于整个字符串只能有这些匹配的内容,不能有多余的。

函数和测试代码如下:

<script type="text/javascript">
function isEmail(str){
var reg = /^[\u4E00-\u9FA5\uf900-\ufa2d\w]{4,16}$/;
return reg.test(str);
}
var str = '超级无敌用户名regExp';
var str2 = '捣乱的@';
var str3 = '太短'
var str4 = '太长longlonglonglonglonglonglonglong'
document.write(isEmail(str)+'<br />');
document.write(isEmail(str2)+'<br />');
document.write(isEmail(str3)+'<br />');
document.write(isEmail(str4)+'<br />');
</script>

 

正则匹配价格

价格的格式应该如下:

开头数字若干位,可能有一个小数点,小数点后面可以有两位数字。hansir给出的对应正则如下:

 /^(\d*\.\d{0,2}|\d+).*$/

hansir给出的测试代码如下:

 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"
>
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />
<title>无标题文档</title>
<script type="text/javascript">
function checkPrice(me){
if(!(/^(?:\d+|\d+\.\d{0,2})$/.test(me.value))){
me.value
= me.value.replace(/^(\d*\.\d{0,2}|\d+).*$/,'$1');
}
}
</script>
</head>
<body>
<input type="text" onkeyup="checkPrice(this);"/>
</body>
</html>

 

身份证号码的匹配

身份证号码可以是15位或者是18位,其中最后一位可以是X。其它全是数字,正则如下:

 /^(\d{14}|\d{17})(\d|[xX])$/

开头是14位或者17位数字,结尾可以是数字或者是x或者是X。

测试代码如下:

<script type="text/javascript">
function testReg(reg,str){
return reg.test(str);
}
var reg = /^(\d{14}|\d{17})(\d|[xX])$/;
var str = '123456789012345';//15位
var str2 = '123456789012345678';//18位
var str3 = '12345678901234567X';//最后一位是X
var str4 = '1234';//位数不对
document.write(testReg(reg,str)+'<br />');
document.write(testReg(reg,str2)+'<br />');
document.write(testReg(reg,str3)+'<br />');
document.write(testReg(reg,str4)+'<br />');
</script>

 

JavaScript正则表达式

 

单词首字母大写

每单词首字大写,其他小写。如blue idea转换为Blue Idea,BLUE IDEA也转换为Blue Idea

cloeft的正则:

 /\b(\w)|\s(\w)/g

所谓“首字母”包括两种情况:第一种是边界(开头)的单词字符,一种是空格之后的新单词的第一个字母。测试代码如下:

<script type="text/javascript">
function replaceReg(reg,str){
str = str.toLowerCase();
return str.replace(reg,function(m){return m.toUpperCase()})
}
var reg = /\b(\w)|\s(\w)/g;
var str = 'blue idea';
var str2 = 'BLUE IDEA';
var str3 = 'Test \n str is no good!';
var str4 = 'final test';
document.write(replaceReg(reg,str)+'<br />');
document.write(replaceReg(reg,str2)+'<br />');
document.write(replaceReg(reg,str3)+'<br />');
document.write(replaceReg(reg,str4)+'<br />');
</script>

 

正则验证日期格式

yyyy-mm-dd格式

正则如下:

 /^\d{4}-\d{1,2}-\d{1,2}$/

4位数字,横线,1或者2位数字,再横线,最后又是1或者2位数字。

测试代码如下:

 <script type="text/javascript">
function testReg(reg,str){
return reg.test(str);
}
var reg = /^\d{4}-\d{1,2}-\d{1,2}$/;
var str = '2008-8-8';
var str2 = '2008-08-08';
var str3 = '08-08-2008';
var str4 = '2008 08 08';
document.write(testReg(reg,str)+'<br />');
document.write(testReg(reg,str2)+'<br />');
document.write(testReg(reg,str3)+'<br />');
document.write(testReg(reg,str4)+'<br />');
</script>

yyyy-mm-dd

yyyy/mm/dd

用“或”简单地修改一下就行了。

 /^\d{4}(-|\/)\d{1,2}(-|\/)\d{1,2}$/

 

去掉文件的后缀名

www.abc.com/dc/fda.asp变为www.abc.com/dc/fda

如果文件后缀已知的话这个问题就非常简单了,正则如下:

 /\.asp$/

匹配最后的.asp而已,测试代码如下:

 <script type="text/javascript">
function delAspExtension(str){
var reg = /\.asp$/;
return str.replace(reg,'');
}
var str = 'www.abc.com/dc/fda.asp';
document.write(delAspExtension(str)+'<br />');
</script>

如果文件名未知的话就用这个正则:/\.\w+$/,测试代码如下:

<script type="text/javascript">
function delExtension(str){
var reg = /\.\w+$/;
return str.replace(reg,'');
}
var str = 'example.com/dc/fda.asp';
document.write(delExtension(str)+'<br />');
var str2 = 'test/regular/fda.do';
document.write(delExtension(str2)+'<br />');
var str3 = 'example.com/dc/fda.strange_extension';
document.write(delExtension(str3)+'<br />');
</script>

 

验证邮箱的正则表达式

fuchangxi的正则:

 /^([a-zA-Z0-9_-])+@([a-zA-Z0-9_-])+(\.[a-zA-Z0-9_-])+/

开始必须是一个或者多个单词字符或者是-,加上@,然后又是一个或者多个单词字符或者是-。然后是点“.”和单词字符和-的组合,可以有一个或者多个组合。

<script type="text/javascript">
function isEmail(str){
var reg = /^([a-zA-Z0-9_-])+@([a-zA-Z0-9_-])+(\.[a-zA-Z0-9_-])+/;
return reg.test(str);
}
var str = 'test@hotmail.com';
document.write(isEmail(str)+'<br />');
var str2 = 'test@sima.vip.com';
document.write(isEmail(str2)+'<br />');
var str3 = 'te-st@qq.com.cn';
document.write(isEmail(str3)+'<br />');
var str4 = 'te_st@sima.vip.com';
document.write(isEmail(str4)+'<br />');
var str5 = 'te.._st@sima.vip.com';
document.write(isEmail(str5)+'<br />');
</script>

我不太了解邮箱的具体规则。感觉这个正则比较简单,EMAIL校验 正则 讨论 求解里有比较详细的邮箱正则讨论。

 

正则判断是否为数字与字母的混合

不能小于12位,且必须为字母和数字的混合。

验证字符串包含数字简单,验证字符串包含字母也简单,验证字符串不包含其它字符也简单,可以用这三个正则分别检查一次字符串,逻辑运算出最终结果。

但是怎么能把这些功能写进一个正则表达式里呢?这个问题真有点伤脑筋。

下面是lexrus的正则:

 /^([a-z]+(?=[0-9])|[0-9]+(?=[a-z]))[a-z0-9]+$/ig

思路非常的清晰啊:

[a-z]+(?=[0-9])

字母开头,后面必须紧跟着数字。

[0-9]+(?=[a-z]

数字开头,后面必须紧跟着字母。

[a-z0-9]+

后面的字符只要是数字或者字母就可以了。经过测试,发现不好使,123dd会被识别为不合法,dd123则为合法,可见“数字开头,紧跟字母”的正则没有起作用。测试代码如下:

 <script type="text/javascript">
function istrue(str){
var reg=/^([a-z]+(?=[0-9])|[0-9]+(?=[a-z]))[a-z0-9]+$/ig;
return reg.test(str);
}
var str? = 'AaBc';
var str2 = 'aaa123';
var str3 = '123dd';
var str4 = '1230923403982';
document.write(istrue(str)+'<br />');
document.write(istrue(str2)+'<br />');
document.write(istrue(str3)+'<br />');
document.write(istrue(str4)+'<br />');
</script>

结果为:

false,true,false,false

结果中的第三个,将'123dd'判断为非法是错误的。刚开始以为是g的问题,去掉了还是不好使。应该是浏览器bug,我认为lexrus的正则是正确的,可能是浏览器无法处理或”|”的两边都包含正向预查(?=)。

修改之后的正则如下:

 /^(([a-z]+[0-9]+)|([0-9]+[a-z]+))[a-z0-9]*$/i

意思和上面差不多,但是没有使用正向预查,测试代码如下:

<script type="text/javascript">
function istrue(str){
var reg=/^(([a-z]+[0-9]+)|([0-9]+[a-z]+))[a-z0-9]*$/i;
return reg.test(str);
}
var str? = 'AaBc';
var str2 = 'aaa123';
var str3 = '123dd';
var str4 = '1230923403982';
document.write(istrue(str)+'<br />');
document.write(istrue(str2)+'<br />');
document.write(istrue(str3)+'<br />');
document.write(istrue(str4)+'<br />');
</script>

结果为

false,true,true,false

正确。

 

空格与英文同时存在

匹配英文以及空格,要求必须既有英文字母又有空格。

这个思路和上面的差不多,只要把数字改成空格就可以了。正则如下:

 /^(([a-z]+\s+)|(\s+[a-z]+))[a-z\s]*$/i

英文开头加空格,或者是空格开头加英文,后面可以是英文或者空格。测试代码如下:

<script type="text/javascript">
function istrue(str){
var reg=/^(([a-z]+\s+)|(\s+[a-z]+))[a-z\s]*$/i;
return reg.test(str);
}
var str? = 'asdf';
var str2 = 'sadf sdf';
var str3 = 'asdf ';
document.write(istrue(str)+'<br />');
document.write(istrue(str2)+'<br />');
document.write(istrue(str3)+'<br />');
</script>

利用这个思路也可以实现英文空格英文,英文单词多于两个的匹配。同样,也可以把英文字母换成单词字符\w。

 

将阿拉伯数字替换为中文大写形式

将123替换成壹贰叁。

只要匹配一个数字就可以了,测试代码如下(如果显示为乱码就调整一下浏览器的字符编码):

 function replaceReg(reg,str){
return str.replace(reg,function(m){return arr[m];})
}
arr=new Array("零","壹","贰","叁","肆","伍","陆","柒","捌","玖");
var reg = /\d/g;
var str = '13889294444';
var str2 = '12889293333';
var str3 = '23445567';
document.write(replaceReg(reg,str)+'<br />');
document.write(replaceReg(reg,str2)+'<br />');
document.write(replaceReg(reg,str3)+'<br />');

 

替换文本中的URL为链接

将一个用户输入的一段文字中的url替换成可以点击的link地址。例如:http://www.blueidea.com可以替换成 [url]http://www.cctv.com[/url]

或<a href="http://www.cctv.com">http://www. blueidea.com</a>.

这个正则的关键就在于匹配链接,匹配之后,在两边加上a标签和属性不是问题。

 /http:\/\/[\w-]*(\.[\w-]*)+/ig

首先匹配http://。

[\w-]*是可能的www和bbs等。

\.[\w-]*匹配.xxx形式,至少有一个。

测试代码如下:

 <script type="text/javascript">
function replaceReg(reg,str){
return str.replace(reg,function(m){return '<a href="'+m+'">'+m+'</a>';})
}
var reg = /http:\/\/[\w-]*(\.[\w-]*)+/ig;
var str = '将一个用户输入的一段文字中的url替换成可以点击的link地址。\
测试一下:http://www.blueidea.com紧接着中文,还有http://bbs.blueidea.com \
is very good!http://blueidea.com!最后在看看带.cn的:http://www.sina.com.cn呵呵。';
document.write(replaceReg(reg,str)+'<br />');
</script>

 

指定文字高亮显示

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
"http://www.w3.org/TR/2000/REC-xhtml1-20000126/DTD/xhtml1-transitional.dtd"
>
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />
<META name="Author" content="Sheneyan" />
<script type="text/javascript">
function encode(s){
return s.replace(/&/g,"&amp;").replace(/</g,"&lt;").replace(/>/g,"&gt;").replace(/([\\\.\*\[\]\(\)\$\^])/g,"\\$1");
}
function decode(s){
return s.replace(/\\([\\\.\*\[\]\(\)\$\^])/g,"$1").replace(/&gt;/g,">").replace(/&lt;/g,"<").replace(/&amp;/g,"&");
}
function highlight(s){
if (s.length==0){
alert(
'搜索关键词未填写!');
return false;
}
s
=encode(s);
var obj=document.getElementsByTagName("body")[0];
var t=obj.innerHTML.replace(/<span\s+class=.?highlight.?>([^<>]*)<\/span>/gi,"$1");
obj.innerHTML
=t;
var cnt=loopSearch(s,obj);
t
=obj.innerHTML
var r=/{searchHL}(({(?!\/searchHL})|[^{])*){\/searchHL}/g
t
=t.replace(r,"<span class='highlight'>$1</span>");
obj.innerHTML
=t;
alert(
"搜索到关键词"+cnt+"")
}
function loopSearch(s,obj){
var cnt=0;
if (obj.nodeType==3){
cnt
=replace(s,obj);
return cnt;
}
for (var i=0,c;c=obj.childNodes[i];i++){
if (!c.className||c.className!="highlight")
cnt
+=loopSearch(s,c);
}
return cnt;
}
function replace(s,dest){
var r=new RegExp(s,"g");
var tm=null;
var t=dest.nodeValue;
var cnt=0;
if (tm=t.match(r)){
cnt
=tm.length;
t
=t.replace(r,"{searchHL}"+decode(s)+"{/searchHL}")
dest.nodeValue
=t;
}
return cnt;
}
</script>
<style type="text/css">
.highlight
{background:green;font-weight:bold;color:white;}
</style>
</head>
<body>
<form onsubmit="highlight(this.s.value);return false;">
<p><input name="s" id="s" title="搜索内容:"/><input type="submit" value="搜索"/></p>
</form>
<div id="content">
测试高亮的代码。很长很长的代码……………………
</div>
</body>
</html>



匹配英文地址

规则如下:
包含 "点", "字母","空格","逗号","数字",但开头和结尾不能是除字母外任何字符。

[\.a-zA-Z\s,0-9]这个字符集就实现了字母,空格,逗号和数字。最终正则如下:

 /^[a-zA-Z][\.a-zA-Z\s,0-9]*?[a-zA-Z]+$/

开头必须有字母,结束也必须是一个以上字母。测试代码如下:

<script type="text/javascript">
function testReg(reg,str){
return reg.test(str);
}
var reg = /^[a-zA-Z][\.a-zA-Z\s,0-9]*?[a-zA-Z]+$/;
var str = 'No.8,ChangAn Street,BeiJing,China';
var str2 = '8.No,ChangAn Street,BeiJing,China';
var str3 = 'No.8,ChangAn Street,BeiJing,China88';
document.write(testReg(reg,str)+'<br />')
document.write(testReg(reg,str2)+'<br />')
document.write(testReg(reg,str3)+'<br />')
</script>