网站带有index.php,影响网站收录

打开网站首页,直接跳转至带有index.php,百度收录了所有带有index.php后缀页面

通过爬虫模拟,首页.com后缀域名抓不到任何东西,但是带有index.php后缀文件却能全部抓取

百度收录了首页的.com域名地址,但是title、description却抓取不到

因服务器与网站管理是分属不同部门,解决方法是什么样的?昨日已通知服务器部门,把index.html提升最优先,不知道有没有作用这个问题是需要网站后台统一调整网址,还是需要服务器设置?
望各位大神帮忙解决,万分感谢!

第1个回答  2015-12-09
这个要查清楚是什么地方使得url会自动跳转,只要解决自动跳转问题就不会出现这问题了
自动跳转跟index.html的优先级没有关系
暂时想到的可以有以下几种情况:
1、url重写
2、程序判断追问

那这个就是需要网站后台修改了?另外我是中途接手这个网站,网站已经收录了六百多个页面,全部带有index.php,如果我一次性全部改回不带index.php,会不会影响很大?

追答

收录方面倒是不怕,可以写一个301,把所有带index.php的都转到不带这个页面的url上去
主要还是排查出跳转的原因

追问

那是因为跳转,但是跳转方式不对,导致蜘蛛爬行不到.com上面么?怎么.com上,根本就抓不到内容?

追答

爬虫本身也是一个模拟人为访问
你去访问时候也发现了,打开域名后是直接跳转到index.php了,所以域名本身下面不会显示任何信息,只有跳转到index.php后才能显示
可以先看看网站根目录下是不是有一个“.htaccess”,有的话可以打开看看里面有没有涉及到index.php的重写

追问

公司网站是外包服务,和那边沟通说是可以改成.com,但是公司网站英文页面是网站的子域名,修改成.com会影响应英文页面的跳转,所以不能修改。
还有.com是没有内容的,做了跳转爬虫是无法爬行到index.php么?我怎么不这么认为,是不是加上某些代码可以实现让爬虫爬至index.php呢?
大神如果不介意可以加我么?1656508742,这个问题我很想了解彻底一些,非常感谢!

追答

已经加你qq了,通过下

本回答被提问者采纳
相似回答