个人开发学习资料库

正则表达式在线调试

//g

测试文本

匹配高亮共 2 处匹配

订单号 12345，电话 86，编号 007890

匹配详情

#	匹配内容	位置	捕获分组
1	`12345`	4 ~ 9	无
2	`007890`	19 ~ 25	无

中国大陆手机号

/1[3-9]\d{9}/g

适用场景：校验/提取 11 位手机号

写法说明：以 1 开头，第二位为 3-9，后接 9 位数字，共 11 位。

注意事项：若需严格校验整串，应加 ^ $ 锚点：/^1[3-9]\d{9}$/；提取场景才用全局 g。

电子邮箱

/[\w.%+-]+@[\w.-]+\.[A-Za-z]{2,}/gi

适用场景：提取或校验邮箱地址

写法说明：用户名允许字母数字及 .%+-，@ 后是域名，最后是 2 位以上顶级域。

注意事项：邮箱完整 RFC 规范极复杂，日常用此简化版即可；加 i 忽略大小写。

URL 链接

/https?://[\w.-]+(?:/[\w./?%&=-]*)?/gi

适用场景：从文本中提取网址

写法说明：http 或 https 开头（s 可选），后接域名与可选路径参数。

注意事项：? 表示前一字符可选；路径部分用非捕获组 (?:) 包裹，避免污染分组。

日期 YYYY-MM-DD

/(\d{4})-(\d{2})-(\d{2})/g

适用场景：提取标准格式日期并分组取出年月日

写法说明：三个捕获分组分别抓年、月、日，可在详情里看到 $1/$2/$3。

注意事项：此正则只校验格式不校验合法性（如 2026-13-40 也会过），业务需另判范围。

中文字符

/[\u4e00-\u9fa5]+/g

适用场景：提取连续的中文片段

写法说明：\u4e00-\u9fa5 是常用汉字的 Unicode 区间，+ 匹配连续多个。

注意事项：此区间不含生僻字/扩展区，若需全覆盖可配合 u 修饰符与 \p{Script=Han}。

身份证号（18位）

/[1-9]\d{5}(?:18|19|20)\d{2}(?:0[1-9]|1[0-2])(?:0[1-9]|[12]\d|3[01])\d{3}[\dXx]/g

适用场景：校验 18 位居民身份证号

写法说明：依次校验地区码、出生年月日、顺序码，末位允许数字或 X。

注意事项：仅做格式校验，不含校验码算法；末位 X 需兼容大小写 [\dXx]。

提取 HTML 标签

/</?([a-zA-Z][a-zA-Z0-9]*)[^>]*>/g

适用场景：匹配 HTML 标签并捕获标签名

写法说明：</? 兼容开始与结束标签，分组捕获标签名，[^>]* 吞掉属性。

注意事项：正则无法严谨解析嵌套 HTML，复杂场景应用 DOMParser，正则仅适合简单提取。