一个收集了全世界几乎所有网站存在过的页面快照的网站

今天邮件列表收到一封信,我也找了2000年时我们做的站点,现在已经不存在了,居然真能找到,和他一样的体会,甚至连感觉都回到了那个时候的工作状态。
这个网站居然收集了全世界几乎所有网站存在过的页面快照


http://web.archive.org
刚才看keso那篇超链分析专利讨论的文章后面的留言,
发现有个人提到了这个网站里google历史上的首页模样,
好奇去看,结果发现google从创立开始,
每隔一段时间,这个网站就会弄一个快照,
保存这个网站的所有页面。

然后,我把我03年开始建的网站域名输入区查询,
天哪,居然全部存在,太令我震惊了。
看到那熟悉的页面布局和文字,
真是激动不已。

这个网站据说保存了550亿个在internet上曾经存在过的网页的快照。
这个数据有多大?

这种工作绝对是历史性的,
这和google一样,是在保存人类文明的纪录。

若干年后,当我们裸猿一族已经灭亡,
希望这些资料还能流传,
对下一代文明产生影响。

那我们人类也不枉存在过。


上一篇: 4月21、22、23日去了安徽的天柱山和琅琊山
下一篇: 一颗螺钉引发的...
文章来自: 本站原创
引用通告: 查看所有引用 | 我要引用此文章
Tags:
相关日志:
评论: 1 | 引用: 0 | 查看次数: 3931
西马
西马[2006-05-10 06:55 PM | | | 222.188.187.21 | del | 回复回复]
沙发
前两天刚在电脑报上看过介绍。
查了一下我的xxzb,哈哈,没有
因为我在根目录下设置了Robots.txt
内容是:
User-agent: *
Disallow: /

网络蜘蛛爬不到我的站上来。
发表评论
昵 称:
密 码: 游客发言不需要密码.
邮 箱: 邮件地址支持Gravatar头像,邮箱地址不会公开.
网 址: 输入网址便于回访.
内 容:
验证码:
选 项:
虽然发表评论不用注册,但是为了保护您的发言权,建议您注册帐号.
字数限制 5000 字 | UBB代码 关闭 | [img]标签 关闭