web前端JavaScript笔记四 正则表达式
sinye56 2024-10-27 14:12 6 浏览 0 评论
学习大纲
一、正则表达式简介
1、什么是正则表达式
正则表达式(Regular Expression 简称:RegExp或者re或者regex)又成规则表达式,描述了匹配字符串的规则(概况:有特殊含义的字符串称之为正则表达式)
在处理网页程序时候,经常需要从一个字符串中获取复杂的规则的数据,这时候就用正则表达式
2、正则表达式的作用
1)对表单域项目(用户名、密码、邮箱、qq号码、手机等等)进行验证
2)网络爬虫(一个网站到另一个网站的页面上去获取对方的相关信息)
3)内容替换、获取
前台的验证、正则处理满足条件的字符串(网络爬虫 Python编程)数据采集(大宗点评:商家评论 抓取) curl函数库:模拟http请求。
最最最常用:表单验证
二、创建正则对象
? 说明:创建正则表达式的方法有两种,分别叫:隐式创建、直接实例化
? 说明:两种方式的构造函数都是RegExp
1、隐式创建
语法:var regexp = /正则表达式/修饰符;
M //不需要加引号
2、直接实例化
语法:var regexp = new RegExp(“正则表达式”,修饰符);
3、参数说明
【必选】正则表达式:由一些普通字符和元字符组成(就是具有特殊含义的字符)【正则表达式区分大小写】
【可选】修饰符:可以使m、i、g分别表示多行匹配,i不区分大小写,g全局匹配
︴思考: /锄禾日当午/ 是不是正则表达式?
答:是的
原因:只要写在“/”和“/”直接的内容就是正则表达式
三、使用正则对象
1、RegExp对象方法
? test方法
- 判断正则表达式是否匹配成功
- 成功返回true,失败返回false
? exec方法
- 匹配符合正则表达式条件的数据
- 成功返回数组
- 失败返回null
︴小试牛刀
? 下述古诗中是否含有“锄禾日当午”?
“离离原上草,一岁一枯荣。
野火烧不尽,春风吹又生。
远芳侵古道,晴翠接荒城。
又送王孙去,萋萋满别情。”
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>Document</title>
</head>
<body>
<script type="text/javascript">
//创建字符串
var str = '离离原上草,一岁一枯荣。野火烧不尽,春风吹又生。远芳侵古道,晴翠接荒城。又送王孙去,萋萋满别情。';
//创建正则对象,语法:var regexp = /正则表达式/修饰符
var regexp = /锄禾日当午/;
//onsole.log(typeof regexp);
//调用正则表达式 的test方法,判断字符串是否存在
console.log(regexp.test(str));
</script>
</body>
</html>
? 匹配字符串“php离离原上php草php,一岁一枯荣。野火烧不尽,春风吹又生php。远芳侵古道,php晴翠接荒城。又送王孙去,萋萋满别情。”中的PHP?
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>Document</title>
</head>
<body>
<script type="text/javascript">
//创建字符串
var str = '_php离离原上php草php,一岁一枯荣。野火烧不尽,春风吹又生php。远芳侵古道,php晴翠接荒城。又送王孙去,萋萋满别情。';
//创建正则表达式对象
var regexp = /php/g; //脚下留心:需要增加修饰符g表示全局匹配,否则出现死循环
//调用exec方法匹配数据
//console.log(regexp.exec(str)); 匹配下标为1的数据
while (row = regexp.exec(str)) {
console.log(row);
}
</script>
</body>
</html>
︴课堂练习
? 判断字符串“Nice to meet you, how old are you? I'm 8.”中是否含有数字“3”?
var str = 'Nice to meet you, how old are you? I'm 8';
var regexp = /3/;
if (regexp.test(str)) {
有的
} else {
没有
}
︴思考a:如何判断字符串中是否含有数字?
解决:通过字符类
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>Document</title>
</head>
<body>
<script type="text/javascript">
//创建字符串
var str = '_php离离原上php草php,一8岁一枯荣。野火烧不尽,春风吹又生php。远芳侵古道,php晴翠接荒城。又送王孙去,萋萋满别情。';
//需求:判断字符串中是否有数字
//1.创建正则表达式对象
var regexp = /[0-9]/;
//2.判断
if (regexp.test(str)) {
alert('有');
} else {
alert('哎东特no');
}
</script>
</body>
</html>
2、支持正则表达式的 String 对象的方法
1)种类
search 、 match 、 replace 、 split
2)search方法
? 语法:字符串对象.search(待查找的字符串|正则)
? 作用:用于搜索字符串中指定的元素
? 返回:返回符合条件的第一个元素下标,没找到返回-1
3)split方法
? 语法:字符串对象.split(分割符)
? 作用:用于以指定的符号分割字符串
? 返回:返回一个数组
M 如果没有指定的分隔符或者分隔符不存在,则返回的数组第一个元素是本身
4)match方法
? 语法:字符串对象.match(待匹配的字符串|正则表达式)
? 作用:匹配符合条件的内容
? 返回:返回一个数组
M 脚下留心:默认匹配一个,需要通过正则表达式并且加了全局参数才可以匹配多个返回一个数组
5)replace方法
? 语法:字符串对象.replace(待匹配的字符串|正则表达式,替换的内容)
? 作用:用于替换字符串中的数据
? 返回:返回新的字符串(替换后的字符串)
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>Document</title>
</head>
<body>
<script type="text/javascript">
var str = 'php8真厉害';
console.log(str.replace(8, 9));
var str = 'php8真厉害8';
var regexp = /\d/;
console.log(str.replace(regexp, 9));
var regexp = /\d/g;
console.log(str.replace(regexp, 9));
</script>
</body>
</html>
四、正则字符类
1、什么是字符类?
答:就是一类字符的集合,用于匹配指定区间的数据,如:[0-9]匹配0-9任意
数字(中间“-”表示连接指区间)
? 小试牛刀
匹配a-z任意一个字符, 正则:[a-z]
匹配A-Z任意一个字符, 正则:[A-Z]
匹配26个英文字母(大小写), 正则:[a-zA-Z]
匹配一个数字, 正则:[0-9]
匹配一个字符可以是数字、字母和下划线:[0-9a-zA-Z_]
匹配非数字,正则:[^0-9]
匹配非字母,正则:[^a-zA-Z]
多学一早:如果需要取反在第一个“[”后面添加“^”符号即可
2、常用字符类
\d 匹配数字,相当于:[0-9]
\D 匹配非数字,相当于[^0-9]
\w 匹配数字、字母、下划线,相当于:[0-9a-zA-Z_]
\W 匹配非数字、字母、下划线,相当于:[^0-9a-zA-Z_]
\s 匹配空白字符串(空格)
\S 匹配非空白字符串
. 匹配所有字符
︴思考b:如何判断字符串中是否含有指定数量数字?
五、正则重复字符(限定符)
1、什么是重复字符?
用于限制指定字符串出现连续次数,出现了指定次数返回true,反之返回false
举例:字符重复字符
说明:
? 8{3} 含义出现3次,也就是 888 888 888
? 8{3,} 含义出现至少3,连续8,也就88888中胜多负少的88888
2、常用重复字符
* 指重复0到多次
+ 指重复1到多次
? 指重复0到1次
{n} 指匹配n次,如:{8} 匹配8次
{n, m} 指匹配n到m次,如:{1,8} 匹配1~8次
{n, } 指匹配至少n次,如:{1,} 匹配至少1次
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>Document</title>
</head>
<body>
<script type="text/javascript">
//创建字符串
var str = '_php离离原上php草php,5689899一岁一枯荣。野火烧不尽,春风吹又生php。远芳侵古道,php晴翠接荒城。又送王孙去,萋萋满别情。';
//需求:判断字符串中是否有指定数量的数字
//1.创建正则表达式 匹配出现3次的数字
var regexp = /\d{3}/;
if (regexp.test(str)) {
console.log('匹配出现3次的数字:有');
} else {
console.log('匹配出现3次的数字:没有');
}
//2.匹配含有3个9的数字
if (/9{3}/.test(str)) {
console.log('匹配出现练习的3个数字并且是数字9:有');
} else {
console.log('匹配出现练习的3个数字并且是数字9:没有');
}
//3.匹配数字5至少重复1次
if (/5{1,}/.test(str)) {
console.log('有');
} else {
console.log('没有');
}
if (/5+/.test(str)) {
console.log('有');
} else {
console.log('没有');
}
</script>
</body>
</html>
︴思考c: 如何判断字符串中只能是数字?
六、正则定位符
1、什么是定位符?
用于来限制匹配数据的行首和行位
2、常用定位符
^ 限定行首数据
$ 限定行尾数据
■知识点综合练习 ps. 讲完内存分配继续
? 匹配检测是否是秋秋号,规则:5~11数字,首字母不能是0
var str = ‘888888’;
var regexp = /^[1-9]\d{4,10}$/;
? 匹配检测是否是手机号,规则:1~11数字,首字母不能是0
var str = ‘18888888888’;
1)先匹配11位数字
var regexp = /\d{11}/;
2)发现有瑕疵:首字母不能是0
var regexp = /[1-9]\d{10}/;
3)发现瑕疵:两边不能写内容
var regexp = /^[1-9]\d{10}$/;
? 匹配网站账号是否合法,规则:账号由5~12个数字、字母下划线组成,首字母不能是数字
var username = ‘’;
1)先匹配5~12个数字、字母、下划线
var regexp = /\w{5,12}/
2)完善首字母不能是数字
var regexp = /[a-zA-Z_]\w{4,11}/
3)两边不能写东西
var regexp = /^[a-zA-Z_]\w{4,11}$/
? 邮箱验证
aadfasdff@163.com
sdfadf@126.com
1243123@qq.com
fadsf@gmail.com
sdfadsfdsf@sina.com
sdf1223sd@xxx.com
规律:
@前面 : 6~18个字符,可使用字母、数字、下划线,需以字母开头
@后面点前面:至少2个字符
点后面:2~5个英文字母
var email = ‘’;
1)6~18个字母、数字、下划线
var regexp = /\w{6,18}/;
2)有瑕疵:首字符必须是字母
var regexp = /[a-zA-Z]\w{5,17}/;
3)有瑕疵:两部不能有前天字符
var regexp = /^[a-zA-Z]\w{5,17}$/;
4)有瑕疵:@后面没有匹配 点前面
var regexp = /^[a-zA-Z]\w{5,17}@[a-zA-Z0-9]{2,}$/;
5)有瑕疵: 点后面
var regexp = /^[a-zA-Z]\w{5,17}@[a-zA-Z0-9]{2,}\.[a-z]{2,5}$/;
脚下留心:.匹配所字符,单独使用点需要转义
? 检测是内容是否为空
\s 匹配空白字符
匹配是否全部是空格
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>Document</title>
</head>
<body>
<script type="text/javascript">
var str = 'a';
var regexp = /^\s*$/;
console.log(regexp.test(str))
</script>
</body>
</html>
? 检测是内容是否有空格
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>Document</title>
</head>
<body>
<script type="text/javascript">
var str = ' sdfsd';
//var regexp = /8/; //匹配内容时是否含有数字8
var regexp = /\s/;
console.log(regexp.test(str))
</script>
</body>
</html>
? 综合练习
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>Document</title>
</head>
<body>
<p><input type="text" placeholder="请输入数字" id="contentObj" /></p>
<p><input type="button" value="检测是否是数字" id="isNum"/></p>
<p><input type="button" value="输出所有数字" id="getContent" /></p>
<script type="text/javascript">
//检测是否是数字
isNum.onclick = function() {
//alert(contentObj.value);
var regexp = /^\d+$/;
if (regexp.test(contentObj.value)) {
alert('是');
} else {
alert('不是');
}
}
//输出所有数字
getContent.onclick = function() {
//alert(contentObj.value);
var regexp = /\d/g;
while (row = regexp.exec(contentObj.value)) {
console.log(row);
}
}
</script>
</body>
</html>
七、分枝条件
1、什么是分枝条件?
就是多个规则,如果满足其中一个规则,则成功(相当于PHP中的逻辑或),用“|”一个管道表示。
? 练习:下述古诗中是否含有“锄禾日当午”或者“春风吹又生”?
var str = '锄禾日当午,汗滴禾下土。谁知盘中餐,粒粒皆辛苦。';
var regexp = /锄禾日当午/;
var regexp = /春风吹又生/;
var regexp = /锄禾日当午|春风吹又生/;
if (regexp.test(str)) {
有
} else {
木有
}
? 案例: 检测上传图片是否合法
jpg|png
var str = "xxx.jpg";
先判断一种情况
var regexp = /^.+\.jpg$/;
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>Document</title>
</head>
<body>
<script type="text/javascript">
var str = "xxx.png1";
var regexp = /^.+\.jpg$|^.+\.png$/;
console.log(regexp.test(str));
</script>
</body>
</html>
八、子表达式(分组)
1、什么是分组?
? 已知:正则表达式单个字符需要重复多次可以通过【重复字符】实现,但是多个字
符串需要一起重复怎么办?
? 解决:通过子表达式或者叫分组
? 流程:给正则表达式添加“()”小括号既可以实现分组功能,然后进一步操作
2、子表达式/捕获/反向引用 概念
? 子表达式
在正则表达式中,给正则表达式添加“()”小括号
例如:
var str = sdfdsfd
var regexp = /sdf(d)sfd/;
? 捕获
就是将正则表达式中,“()”小括号匹配的内容存到内存缓冲区域
上述子表达式中,第一个小括号中捕获:d 会存到内存中
? 反向引用
将内存中的数据,取出来在正则表达式中使用
一个小括号:\1
两个小括号:\1 \2
M 脚下留心:\1只能在正则表达式中写
3、分组案例练习
? 查找连续的四个数字,如:3569
/3569/
/\d\d\d\d/
/\d{4}/
? 查找连续的相同的四个数字,如:1111
/1{4}/
/(\d)\1\1\1/
先将第一个放到内存里面,然后通过反向引用获取第一个分组里面的数组
? 查找数字,如:1221,3443
规则:ABBA
var regexp = /(\d)(\d)\2\1/;
? 查找字符,如:AABB,TTMM
规律:AABB
var regexp = /(\d)\1(\d)\2/;
、︴优化分枝条件中判断图片是否合法
jpg|png
var str = "xxx.jpg";
先判断一种情况
var regexp = /^.+\.jpg$|^.+\.png$/;
var regexp = /^.+\.(jpg|png)$/
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>Document</title>
</head>
<body>
<script type="text/javascript">
var str = "sdfdsf.png";
//var regexp = /^.+\.jpg$|^.+\.png$/;
var regexp = /^.+\.(jpg|png)$/
console.log(regexp.test(str));
</script>
</body>
</html>
举一反三
验证邮箱,可以限制最后面可以使用什么域名后缀
明确:只能使用com/cn/org
var regexp = /^[a-zA-Z]\w{5,17}@[a-zA-Z0-9]{2,}\.[a-z]{2,5}$/;
var regexp = /^[a-zA-Z]\w{5,17}@[a-zA-Z0-9]{2,}\.(com|cn|org)$/;
九、特殊用法:
(?=)正向预查:匹配以指定内容结尾的数据
(?!)反向预查:匹配不以指定内容结尾的数据
■正则表达式习题
? 结巴程序
结巴哥哥:我...我是是......一个......个......帅帅帅帅...哥!";
治病:我是一个帅哥!
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>Document</title>
</head>
<body>
<script type="text/javascript">
var str = '我...我是是......一个......个......帅帅...哥!';
//字符串替换,语法:字符串对象.replace(正则或者字符串, 新字符串);
str = str.replace(/\./g, '');
//匹配字符串中AA格式的数据
//我我是是一个个帅帅帅帅哥!
//我 是 个 帅
var regexp = /(.)\1/g;
console.log(str.replace(regexp, '$1'));
</script>
</body>
</html>
去除字符串里面的空格(笔试写一个正则)
PHP中去空格trim()
JS没有,可以通过正则定义方法
正则中文的处理
一般在字符都存在一个编码的规则,对于中文的编码一般都是使用utf-8编码,并且js天生使用的就是utf-8对待字符串。并且utf-8的编码是存在一个范围的[\u4e00-\u9fa5]基本把所有常见中文都涵盖。
需求判断是否只有中文
var str = 内容
var regexp = /^[\u4e00-\u9fa5]$/;
console.log(regexp.test(str));
PHP正则表达式
1、语法
? preg_match(正则表达式,待匹配的字符串,[匹配结果])
? preg_match_all(正则表达式,待匹配的字符串,[匹配结果])
M PHP正则表达式必须加引号
2、练习:判断用户名
? 匹配网站账号是否合法,规则:账号由5~12个数字、字母下划线组成,首字母不能是数字
$regexp = ”/^[a-zA-Z_]\w{4,11}$/”;
<?php
$str = '1sdfadsfds';
$regexp = "/^[a-zA-Z_]\w{4,11}$/";
if (preg_match($regexp, $str)) {
echo '符合条件';
} else {
echo '不符合条件';
}
3、练习:匹配所有数字
$str = 'sdfasdf123sdfadsfs23sdfds1223';
<?php
$str = 'sdfasdf123sdfadsfs23sdfds1223';
$regexp = '/\d/';
preg_match_all($regexp, $str, $getArr);
var_dump($getArr);
相关推荐
- RHEL8和CentOS8怎么重启网络
-
本文主要讲解如何重启RHEL8或者CentOS8网络以及如何解决RHEL8和CentOS8系统的网络管理服务报错,当我们安装好RHEL8或者CentOS8,重启启动网络时,会出现以下报错:...
- Linux 内、外网双网卡路由配置
-
1.路由信息的影响Linux系统中如果有多张网卡的情况下,如果路由信息配置不正确,...
- Linux——centos7修改网卡名
-
修改网卡名这个操作可能平时用不太上,可作为了解。修改网卡默认名从ens33改成eth01.首先修改网卡配置文件名(建议将原配置文件进行备份)...
- CentOS7下修改网卡名称为ethX的操作方法
-
?Linux操作系统的网卡设备的传统命名方式是eth0、eth1、eth2等,而CentOS7提供了不同的命名规则,默认是基于固件、拓扑、位置信息来分配。这样做的优点是命名全自动的、可预知的...
- Linux 网卡名称enss33修改为eth0
-
一、CentOS修改/etc/sysconfig/grub文件(修改前先备份)为GRUB_CMDLINE_LINUX变量增加2个参数(net.ifnames=0biosdevname=0),修改完成...
- CentOS下双网卡绑定,实现带宽飞速
-
方式一1.新建/etc/sysconfig/network-scripts/ifcfg-bond0文件DEVICE=bond0IPADDR=191.3.60.1NETMASK=255.255.2...
- linux 双网卡双网段设置路由转发
-
背景网络情况linux双网卡:网卡A(ens3)和网卡B(...
- Linux-VMware设置网卡保持激活
-
Linux系统只有在激活网卡的状态下才能去连接网络,进行网络通讯。修改配置文件(永久激活网卡)...
- VMware虚拟机三种网络模式
-
01.VMware虚拟机三种网络模式由于linux目前很热门,越来越多的人在学习linux,但是买一台服务放家里来学习,实在是很浪费。那么如何解决这个问题?虚拟机软件是很好的选择,常用的虚拟机软件有v...
- 2023年最新版 linux克隆虚拟机 解决网卡uuid重复问题
-
问题描述1、克隆了虚拟机,两台虚拟机里面的ip以及网卡的uuid都是一样的2、ip好改,但是uuid如何改呢?解决问题1、每台主机应该保证网卡的UUID是唯一的,避免后面网络通信有问题...
- Linux网卡的Vlan配置,你可能不了解的玩法
-
如果服务器上连的交换机端口已经预先设置了TRUNK,并允许特定的VLAN可以通过,那么服务器的网卡在配置时就必须指定所属的VLAN,否则就不通了,这种情形在虚拟化部署时较常见。例如在一个办公环境中,办...
- Centos7 网卡绑定
-
1、切换到指定目录#备份网卡数据cd/etc/sysconfig/network-scriptscpifcfg-enp5s0f0ifcfg-enp5s0f0.bak...
- Linux搭建nginx+keepalived 高可用(主备+双主模式)
-
一:keepalived简介反向代理及负载均衡参考:...
- Linux下Route 路由指令使用详解
-
linuxroute命令用于显示和操作IP路由表。要实现两个不同子网之间的通信,需要一台连接两个网络的路由器,或者同时位于两个网络的网关来实现。在Linux系统中,设置路由通常是为了解决以下问题:该...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- oracle忘记用户名密码 (59)
- oracle11gr2安装教程 (55)
- mybatis调用oracle存储过程 (67)
- oracle spool的用法 (57)
- oracle asm 磁盘管理 (67)
- 前端 设计模式 (64)
- 前端面试vue (56)
- linux格式化 (55)
- linux图形界面 (62)
- linux文件压缩 (75)
- Linux设置权限 (53)
- linux服务器配置 (62)
- mysql安装linux (71)
- linux启动命令 (59)
- 查看linux磁盘 (72)
- linux用户组 (74)
- linux多线程 (70)
- linux设备驱动 (53)
- linux自启动 (59)
- linux网络命令 (55)
- linux传文件 (60)
- linux打包文件 (58)
- linux查看数据库 (61)
- linux获取ip (64)
- linux进程通信 (63)