一个收集了全世界几乎所有网站存在过的页面快照的网站
作者:英雄无敌 日期:2006-05-09
今天邮件列表收到一封信,我也找了2000年时我们做的站点,现在已经不存在了,居然真能找到,和他一样的体会,甚至连感觉都回到了那个时候的工作状态。
这个网站居然收集了全世界几乎所有网站存在过的页面快照
http://web.archive.org
刚才看keso那篇超链分析专利讨论的文章后面的留言,
发现有个人提到了这个网站里google历史上的首页模样,
好奇去看,结果发现google从创立开始,
每隔一段时间,这个网站就会弄一个快照,
保存这个网站的所有页面。
然后,我把我03年开始建的网站域名输入区查询,
天哪,居然全部存在,太令我震惊了。
看到那熟悉的页面布局和文字,
真是激动不已。
这个网站据说保存了550亿个在internet上曾经存在过的网页的快照。
这个数据有多大?
这种工作绝对是历史性的,
这和google一样,是在保存人类文明的纪录。
若干年后,当我们裸猿一族已经灭亡,
希望这些资料还能流传,
对下一代文明产生影响。
那我们人类也不枉存在过。
这个网站居然收集了全世界几乎所有网站存在过的页面快照
http://web.archive.org
刚才看keso那篇超链分析专利讨论的文章后面的留言,
发现有个人提到了这个网站里google历史上的首页模样,
好奇去看,结果发现google从创立开始,
每隔一段时间,这个网站就会弄一个快照,
保存这个网站的所有页面。
然后,我把我03年开始建的网站域名输入区查询,
天哪,居然全部存在,太令我震惊了。
看到那熟悉的页面布局和文字,
真是激动不已。
这个网站据说保存了550亿个在internet上曾经存在过的网页的快照。
这个数据有多大?
这种工作绝对是历史性的,
这和google一样,是在保存人类文明的纪录。
若干年后,当我们裸猿一族已经灭亡,
希望这些资料还能流传,
对下一代文明产生影响。
那我们人类也不枉存在过。
评论: 1 | 引用: 0 | 查看次数: 3931
发表评论
查了一下我的xxzb,哈哈,没有
因为我在根目录下设置了Robots.txt
内容是:
User-agent: *
Disallow: /
网络蜘蛛爬不到我的站上来。