打开网站首页,直接跳转至带有index.php,百度收录了所有带有index.php后缀页面
通过爬虫模拟,首页.com后缀域名抓不到任何东西,但是带有index.php后缀文件却能全部抓取
百度收录了首页的.com域名地址,但是title、description却抓取不到
因服务器与网站管理是分属不同部门,解决方法是什么样的?昨日已通知服务器部门,把index.html提升最优先,不知道有没有作用这个问题是需要网站后台统一调整网址,还是需要服务器设置?
望各位大神帮忙解决,万分感谢!
那这个就是需要网站后台修改了?另外我是中途接手这个网站,网站已经收录了六百多个页面,全部带有index.php,如果我一次性全部改回不带index.php,会不会影响很大?
追答收录方面倒是不怕,可以写一个301,把所有带index.php的都转到不带这个页面的url上去
主要还是排查出跳转的原因
那是因为跳转,但是跳转方式不对,导致蜘蛛爬行不到.com上面么?怎么.com上,根本就抓不到内容?
追答爬虫本身也是一个模拟人为访问
你去访问时候也发现了,打开域名后是直接跳转到index.php了,所以域名本身下面不会显示任何信息,只有跳转到index.php后才能显示
可以先看看网站根目录下是不是有一个“.htaccess”,有的话可以打开看看里面有没有涉及到index.php的重写
公司网站是外包服务,和那边沟通说是可以改成.com,但是公司网站英文页面是网站的子域名,修改成.com会影响应英文页面的跳转,所以不能修改。
还有.com是没有内容的,做了跳转爬虫是无法爬行到index.php么?我怎么不这么认为,是不是加上某些代码可以实现让爬虫爬至index.php呢?
大神如果不介意可以加我么?1656508742,这个问题我很想了解彻底一些,非常感谢!
已经加你qq了,通过下
本回答被提问者采纳