PHP中如何用正则表达式分离出某个关键词前后的文字？

比如有一篇中文文章，我的关键词是“域名”，并且“域名”这个词在这篇文章中多次出现。我想分离出每个“域名”左右的100个文字。用正则表达式如何做到？
多谢专家！太详细了！
“具体取关键词左右的文字是什么意思，是取该关键字前100个字，和该关键字后100个字码”：是这样的，就是取关键词前、后各一百个字。
剩下的我仔细琢磨琢磨~
======
另外，您的答案里的中文字，是按照GB码来算的吗？我看到操作字符串都是200~~那我要是用UTF8是不是就是300了？
=====
试了一下，截的还是有些问题...我这个问题不能用正则表达式直接截取吗？也就是用正则表达式直接把关键字左右各N个字截过来~
======
专家的方法可能过于高深-.-我是没琢磨透...yeahrahxephon同学的方法倒是不错，可有个问题，我有篇文章，里面有20个关键词，为什么在截取前后10个字的时候，能截取出15段（也就是数组里有15个），可改成50后，就只剩6个了，改成100后，只剩4个了。数组的大小有限制？
我明白了，是不是因为把截取范围改大了之后，关键词两边的句子重叠导致的这种情况？

举报该问题

推荐答案 2009-05-21

$str_arr = preg_split('|域名|',$str);
这种简单的匹配不建议使用正则表达式，用php的explode()函数就可以了。
$str_arr = explode("域名",$str);
具体取关键词左右的文字是什么意思，是取该关键字前100个字，和该关键字后100个字码。如果是这样那就要用substr来截取一下了。注意要考虑汉字与字符的区别。
刚才测了一下，程序确实有点问题，现在修改一下。
function cnsubstr($str,$strlen=10) {//截取函数

if(empty($str)||!is_numeric($strlen)){
return false;
}
if(strlen($str)<=$strlen){
return $str;
}

//得到第$length个字符并判断是否为非中文若为非中文
//直接返回$length长的字符串
$last_word_needed=substr($str,$strlen-1,1);
if(!ord($last_word_needed)>128){
$needed_sub_sentence=substr($str,0,$strlen);
return $needed_sub_sentence;
}else{
for($i=0;$i<$strlen;$i++){
if(ord($str[$i])>128){
$i++;
}
}//end of for
$needed_sub_sentence=substr($str,0,$i);
return $needed_sub_sentence;
}
}
//程序部分
$str_arr = explode(",",$str);
$num = count($str_arr);
for($i=0;$i<$num;$i++){
if($i == 0){
$outstr = strrev(cnsubstr(strrev($str_arr[$i]),200));
}elseif($i == ($num-1)){
$outstr = cnsubstr($str_arr[$i],200);
}else{
$outstr1 = strrev(cnsubstr(strrev($str_arr[$i]),200));
$outstr = cnsubstr($str_arr[$i],5);
}
echo $outstr;
echo " <hr> ";
echo $outstr1;
echo " <hr> ";
}

温馨提示：答案为网友推荐，仅供参考

当前网址：http://55.wendadaohang.com/zd/GRFILI4L.html

其他回答

第1个回答 2009-05-22

<?php
$temp = 'www.baidu.com';
$str = '多谢专家！太详细了！
“具体取关键词左右的文字是什么意思，是取该关键字前100个字，和该关键字后100个字码”：是这样的，就是取关键词前、后各一百个字。
剩下的我仔细琢磨琢磨~
======www.baidu.com
另外，您的答案里的中文字，是按照GB码来算的吗？我看到操作字符串都是200~~那我要是用UTF8是不是就是300了？
=====
试了一下，截的还是有些问题...我这个问题不能用正则表达式直接截取吗？也就是用正则表达式直接把关键字左右各N个字截过来~';
$str = mb_convert_encoding($str, "UTF-8", "GB2312");
preg_match_all("/(.{10}$temp.{10})/su", $str, $matches, PREG_SET_ORDER);
print_r($matches);
?>

这样？楼上回答的不是很好么。。。呵呵本回答被提问者采纳

相似回答

PHP中如何用正则表达式分离出某个关键词前后的文字?答：这种简单的匹配不建议使用正则表达式，用php的explode()函数就可以了。str_arr = explode("域名",$str);具体取关键词左右的文字是什么意思，是取该关键字前100个字，和该关键字后100个字码。如果是这样那就要用substr来截取一下了。注意要考虑汉字与字符的区别。刚才测了一下，程序确实有点问题，现...

如何用php正则表达式取出“字符”间的字符答：PHP使用正则表达式提取字符串中尖括号<>、小括号()、中括号[]、大括号{}中的字符示例,需要的朋友可以参考下复制代码代码如下:str="你好<我>(爱)[北京]{天安门}";echo f1($str); //返回你好 echo f2($str); //返回我 echo f3($str); //返回爱 echo f4($str); //返回北京 echo f5...

使用php正则式去除字符串中最后一个斜杠及之后的内容答：可以参考下面的两种方法：1、var s = '一句话描/述(您的)/疑问/123一二三abc';s.replace(/(.*)\/{1}.*/, '$1'); //标准模式下，.*会自动匹配到最后一个位置 //输出 "一句话描/述(您的)/疑问"2、$str = '一句话描/述(您的)疑问/123一二三abc';str = preg_replace('/(.*)...

php用正则表达式怎么获得两个字符串之间字符答：把要获得的正则表达式部分加上括号,然后看preg_match第三个参数,括号是第几个,获得的内容就在$matches中的索引就是几.比如:<?php subject = 'abcd123def';$pattern = '/(\w)(\d+)(\w)/';preg_match(pattern,subject,matches );var_dump (matches );// 自己看 ...

怎么用php正则获得a标签内的文字啊答：php中正则匹配只要使用这两个函数：preg_match_all preg_match 这里使用preg_match_all，代码如下：subject = 'abc测试'; // 假设这是需要匹配的字符串$pattern = '/]*>(.*)<\/a>/'; // 这是匹配的正则表达式preg_match_all($pattern, $subject, $matches); // 开始匹配，该...

大家正在搜

常用的正则表达式正则表达式中文论文的关键词是由什么选出的正则表达式怎么用正则表达式或者怎么表示正则表达式使用实例正则表达式.*?正则表达式\d 正则表达式点