最近使用 PHP 写了一个应用,主要是正则表达式的处理,趁机系统性的学习了相应知识。
$str = "http://www.google.com"; $preg= "/http:\/\/\w+\.\w+.("; $preg2= "/http:\/\/\w+\.\w+.(net|com|cn)+/is"; preg_match($preg,$str,$arr); preg_match($preg2,$str,$arr2);
$str='hello world china'; $preg="/\w+\s/is"; preg_match($preg,$str,$arr); print_r($arr); preg_match_all($preg,$str,$arr); print_r($arr);
正确理解 $ 和 ^
$str = "13521899942a"; $preg="/1[\d]{3,15}/is"; if (preg_match($preg,$str,$arr)) { echo "ok"; }
虽然字符串中有一个英文字母,但是这个子模式却匹配了,原因就在于模式匹配到后就结束了,不会再去寻找英文字母,为了解决这问题 $ 和 ^ 就发挥作用了,比如让字符串的开始和结尾必须匹配一定的模式,修改如下:
$str = "13521899942a"; $preg="/1[\d]{3,15}$/is"; if (preg_match($preg,$str,$arr)) { echo "ok"; }
$ 和 ^ 的跨行模式
默认的情况下,$ 和 ^ 只会匹配完整段落的开始和结尾,但是通过改变选项,允许匹配文本的每一行的开始和结尾,通过下面的例子就能明白
$str='hello world'; $preg='/\w+$/ism';//$preg='/("htmlcode">$str ="email:ywdblog@gmail.com;"; preg_match("/email:(", $str, $matches); echo $matches["email"] . "_" . $matches['no'];懒惰模式
正则在匹配的时候是贪婪的,只要符合模式就会一直匹配下去,下面的例子,匹配到的文本是 <h2>hello</h2><h2>world</h2>
$str = "<h2>hello</h2><h2>world</h2>"; $preg = "/<h2>.*<\/h2>/is"; preg_match($preg,$str,$arr); print_r($arr);通过改变一个选项可以修改为懒惰模式,就是一旦匹配到就中止,修改代码如下:
$str = "<h2>hello</h2><h2>world</h2>"; $preg = "/<h2>.*"; preg_match($preg,$str,$arr); print_r($arr);进一步理解 preg_match_all()
$str= 'jiangsu (nanjing) nantong guangdong (guangzhou) zhuhai beijing (tongzhou) haidian'; $preg = '/^\s*+([^(]+"htmlcode">$str = "china hello world"; $preg = '/\b(\w+)(\w)\b/'; function fun($m){ return $m[1].strtoupper($m[2]); } echo preg_replace_callback($preg,"fun",$str);在这一点上,PHP 比 Python 强大的多,Python 中没有正则回调,不过可以使用闭包的方式解决,可看我以前的文章。
这个函数类似于 Python 中的 re.compile() 函数,假如在模式中一些元字符仅仅想表达字符的本身含义,可以转义,但是假如在模式中写太多的转义,会显得很混乱,可以使用这个函数来统一转义:
$str = '\\*china*world'; $preg = "\*china"; $preg = preg_quote($preg); echo $preg; preg_match( "/{$preg}/is",$str,$arr); print_r($arr);向前查找 "" combination means "the next text must be like this". This construct doesn't capture the text.
(1)这个例子可以获取 URL 中的协议部分,比如 https,ftp,注意 "htmlcode">$str = "http://www.google.com"; $str = "https://www.google.com"; $preg = '/[a-z]+("invisible" 分隔符也叫 “zero-width” 分隔符,参考下面的例子:
$str = ("chinaWorldHello"); $preg = "/("; $arr = preg_split($preg,$str); print_r($arr);(3)匹配强密码
instead of specifying the order that things should appear, it's saying that it must appear but we're not worried about the order.
The first grouping is ("any alphanumeric character can happen zero or more times, then any digit can happen". So this checks if there is at least one number in the string. But since the string isn't captured, that one digit can appear anywhere in the string. The next groupings ("htmlcode">$str= "HelloWorld2016"; if (preg_match("/^.*(", $str,$arr)){ print_r($arr); }向后查找 "htmlcode">
$str = 'chinadhello'; $preg = '/(?<=a)d(?=h)/'; preg_match($preg, $str, $arr); print_r($arr);好了,今天的教程就先到这里,有什么问题大家可以留言,我们来讨论下
幽灵资源网 Design By www.bzswh.com
免责声明:本站文章均来自网站采集或用户投稿,网站不提供任何软件下载或自行开发的软件! 如有用户或公司发现本站内容信息存在侵权行为,请邮件告知! 858582#qq.com