我们在网站被黑或者网站大改版后,会产生大量的死链。其中被黑基本是在织梦站点,这时站长会选择转移到帝国cms平台,但百度已经收录的死链和恶意链接还要清除,这时我们怎么办呢。
如果只有几篇链接还好,如果有数万的死链,我们一个一个的手工收集显然不现实,时间成本太高。
其实我们也可以用工具来解决,下面帝国cms大学来跟大家分享一下批量清楚死链的步骤。
我们这里需要用到的工具是Xenu 1.3.8版本软件,该软件用于批量检测网页内链接的状态,我们以此来检测网站链接是否为死链。
首先我们打开软件,然后点击 文件 - 检查网址,填入以下链接。之所以用以下地址是可以减少链接查询时间和内容。(请把www.cmsdx.com换成你的网址)
http://www.baidu.com/s?ie=utf-8&tn=baidulocal&wd=site%3Awww.cmsdx.com
在包含以此开头的网址,我们输入需要检测的域名,也就是www.cmsdx.com,填写完成后点“开始检查”
检测完成后,会弹出通知,是否查看报告,这时我们就看到结果了。
列表中显示的链接的状态,其中“not found”状态就是404,这些也就是网站的死链。
接下来我们点文件 - 导出以制表符分割txt文件...
这样我们就得到了一个文件列表,但数据非常多,也很乱。我们需要把死链网址提取出来。
这里就有很多方法了。提取出来的文件内容如下(我们只展示一部分):
其中记录了链接状态,有200、404
接下来我们可以用正则提取出404链接,正则如下:
http:\/\/www.cmsdx.com(.*?)[^\s]*404
接下来我们在正则工具中测试一下。
下面我们可以愉快的去百度做死链提交了。
软件下载链接: http://pan.baidu.com/s/1slilnkT 密码: 1uqp