| # | 匹配内容 | 位置 | 捕获分组 |
|---|---|---|---|
| 1 | 12345 | 4 ~ 9 | 无 |
| 2 | 007890 | 19 ~ 25 | 无 |
/1[3-9]\d{9}/g适用场景:校验/提取 11 位手机号
写法说明:以 1 开头,第二位为 3-9,后接 9 位数字,共 11 位。
注意事项:若需严格校验整串,应加 ^ $ 锚点:/^1[3-9]\d{9}$/;提取场景才用全局 g。
/[\w.%+-]+@[\w.-]+\.[A-Za-z]{2,}/gi适用场景:提取或校验邮箱地址
写法说明:用户名允许字母数字及 .%+-,@ 后是域名,最后是 2 位以上顶级域。
注意事项:邮箱完整 RFC 规范极复杂,日常用此简化版即可;加 i 忽略大小写。
/https?://[\w.-]+(?:/[\w./?%&=-]*)?/gi适用场景:从文本中提取网址
写法说明:http 或 https 开头(s 可选),后接域名与可选路径参数。
注意事项:? 表示前一字符可选;路径部分用非捕获组 (?:) 包裹,避免污染分组。
/(\d{4})-(\d{2})-(\d{2})/g适用场景:提取标准格式日期并分组取出年月日
写法说明:三个捕获分组分别抓年、月、日,可在详情里看到 $1/$2/$3。
注意事项:此正则只校验格式不校验合法性(如 2026-13-40 也会过),业务需另判范围。
/[\u4e00-\u9fa5]+/g适用场景:提取连续的中文片段
写法说明:\u4e00-\u9fa5 是常用汉字的 Unicode 区间,+ 匹配连续多个。
注意事项:此区间不含生僻字/扩展区,若需全覆盖可配合 u 修饰符与 \p{Script=Han}。
/[1-9]\d{5}(?:18|19|20)\d{2}(?:0[1-9]|1[0-2])(?:0[1-9]|[12]\d|3[01])\d{3}[\dXx]/g适用场景:校验 18 位居民身份证号
写法说明:依次校验地区码、出生年月日、顺序码,末位允许数字或 X。
注意事项:仅做格式校验,不含校验码算法;末位 X 需兼容大小写 [\dXx]。
/</?([a-zA-Z][a-zA-Z0-9]*)[^>]*>/g适用场景:匹配 HTML 标签并捕获标签名
写法说明:</? 兼容开始与结束标签,分组捕获标签名,[^>]* 吞掉属性。
注意事项:正则无法严谨解析嵌套 HTML,复杂场景应用 DOMParser,正则仅适合简单提取。