正向预搜索和反向预搜索的学习

在看正则的时候中碰到一个这样的正则问题.
将 一句SQL语句中的“select”和“from” 之间的字符替换为 “count(*)”
问题很简单,我的答案是

代 码:
<?php
$sql = "select uid,sas,fd from asdf";
echo preg_replace("/select(.+?)from/i",'select count(*) from',$sql);
?>


但是看了别人的答案却十分的简单

代码:
echo preg_replace("/(?<=select).+?(?=from)/i",' count(*) ',$sql);


其中的?<=让我很不解.从资料上查得到:

代码:
(?<=select).+?(?=from)表示的是匹配从select开始到from结束中间的数据.



正向预搜索:"(?=xxxxx)","(?!xxxxx)"
反向预搜索:"(?<=xxxxx)","(?<!xxxxx)"
正向预搜索:"(?=xxxxx)","(?!xxxxx)"

格式:"(?=xxxxx)",在被匹配的字符串中,它对所处的 "缝隙" 或者 "两头" 附加的条件是:所在缝隙的右侧,必须能够匹配上 xxxxx 这部分的表达式。因为它只是在此作为这个缝隙上附加的条件,所以它并不影响后边的表达式去真正匹配这个缝隙之后的字符。这就类似 "\b",本身不匹配任何字符。"\b" 只是将所在缝隙之前、之后的字符取来进行了一下判断,不会影响后边的表达式来真正的匹配。

举例1:表达式 "Windows (?=NT|XP)" 在匹配 "Windows 98, Windows NT, Windows 2000" 时,将只匹配 "Windows NT" 中的 "Windows ",其他的 "Windows " 字样则不被匹配。


举例2:表达式 "(\w)((?=\1\1\1)(\1))+" 在匹配字符串 "aaa ffffff 999999999" 时,将可以匹配6个"f"的前4个,可以匹配9个"9"的前7个。这个表达式可以读解成:重复4次以上的字母数字,则匹配其剩下最后2位之前的部分。当 然,这个表达式可以不这样写,在此的目的是作为演示之用。

格式:"(?!xxxxx)",所在缝隙的右侧,必须不能匹配 xxxxx 这部分表达式。
举例3:表达式 "((?!\bstop\b).)+" 在匹配 "fdjka ljfdl stop fjdsla fdj" 时,将从头一直匹配到 "stop" 之前的位置,如果字符串中没有 "stop",则匹配整个字符串。
举例4:表达式 "do(?!\w)" 在匹配字符串 "done, do, dog" 时,只能匹配 "do"。在本条举例中,"do" 后边使用 "(?!\w)" 和使用 "\b" 效果是一样的。

反向预搜索:"(?<=xxxxx)","(?<!xxxxx)"

这两种格式的概念和正向预搜索是类似的,反向预搜索要求的条件是:所在缝隙的 "左侧",两种格式分别要求必须能够匹配和必须不能够匹配指定表达式,而不是去判断右侧。与 "正向预搜索" 一样的是:它们都是对所在缝隙的一种附加条件,本身都不匹配任何字符。
举例5:表达式 "(?<=\d{4})\d+(?=\d{4})" 在匹配 "1234567890123456" 时,将匹配除了前4个数字和后4个数字之外的中间8个数字。

php截取百度搜索结果

 

简单的通过file($URL)获取远程网页数据,用implode()函数把数组合并成string,再根据自己的需要,对string进行截取、过滤等个性化处理,基于此思想,可以进一步拓展,估计就是采集器的雏形了。。。

<?php
if(isset($keyword)&&$keyword!=”")
{
$kwd=urlencode($_POST["keyword"]);
$strurl=”http://www.baidu.com/s?wd=”.$kwd.”&cl=3“;
$resarr=file($strurl);
$resstr=implode(” “,$resarr);
$resstr=strstr($resstr,”<DIV id=ScriptDiv></DIV>”);
$footpos=strpos($resstr,’<td style=”font-size:14px;font-weight:bold;height:40px;width:70px;”>相关搜索</td>’);
$resstr=substr($resstr,o,$footpos); echo $resstr;
}else
{
echo”请输入查询单词”;
echo ‘<form name=”search” action=”search.php” method=”post”><input type=”text” name=”keyword”></input> <input name=”submit” type=”submit” value=”搜索”/></form>’;
}
?>

标签: 百度, 截取, 搜索