

在第四次深“度”接触结束后,spider工程师表示新浪的死链处理工作一直效果不错,提醒学院应该请其做个分享。新浪稳座国家级门户头把交椅,谁还敢说自己网站结构的复杂程度可以超越新浪。于是我们请王久明分享一下新浪在死链处理和死链预防(重要页面因修改而产生死链)方面的经验。
一、在以下背景下会较多产生死链:
1、时政新闻的敏感性;
2、来自监管的删除需求;
3、频道(编辑)自身删改的需求;
4、搜索方期望资源方主动优化和定期清除的需求
二、死链分类:
由于系统架构、历史遗留问题、多业务系统交叉影响等多方面因素,新浪存在如下三种死链:
1、协议死链,服务器端返回HTTP状态码404;
下一篇:什么是网站建设