【朝网夕拾】

一个收集了全世界几乎所有网站存在过的页面快照的网站

作者:英雄无敌日期:2006-05-09

字体大小: 小中大

今天邮件列表收到一封信，我也找了2000年时我们做的站点，现在已经不存在了，居然真能找到，和他一样的体会，甚至连感觉都回到了那个时候的工作状态。
这个网站居然收集了全世界几乎所有网站存在过的页面快照

http://web.archive.org
刚才看keso那篇超链分析专利讨论的文章后面的留言，
发现有个人提到了这个网站里google历史上的首页模样，
好奇去看，结果发现google从创立开始，
每隔一段时间，这个网站就会弄一个快照，
保存这个网站的所有页面。

然后，我把我03年开始建的网站域名输入区查询，
天哪，居然全部存在，太令我震惊了。
看到那熟悉的页面布局和文字，
真是激动不已。

这个网站据说保存了550亿个在internet上曾经存在过的网页的快照。
这个数据有多大？

这种工作绝对是历史性的，
这和google一样，是在保存人类文明的纪录。

若干年后，当我们裸猿一族已经灭亡，
希望这些资料还能流传，
对下一代文明产生影响。

那我们人类也不枉存在过。

上一篇: 4月21、22、23日去了安徽的天柱山和琅琊山

下一篇: 一颗螺钉引发的...

文章来自: 本站原创

引用通告: 查看所有引用 | 我要引用此文章

Tags:

相关日志:

评论: 1 | 引用: 0 | 查看次数: 4569

西马[2006-05-10 06:55 PM |

| 222.188.187.21 |

回复]

沙发

前两天刚在电脑报上看过介绍。
查了一下我的xxzb，哈哈，没有
因为我在根目录下设置了Robots.txt
内容是：
User-agent: *
Disallow: /

网络蜘蛛爬不到我的站上来。

发表评论

昵　称:	记住我的信息
密　码:	游客发言不需要密码.
邮　箱:	邮件地址支持Gravatar头像,邮箱地址不会公开.
网　址:	输入网址便于回访.
内　容:	正在加载编辑器...
验证码:	点击获取验证码
选　项:	禁止表情转换禁止自动转换链接禁止自动转换关键字

虽然发表评论不用注册，但是为了保护您的发言权，建议您注册帐号. 字数限制 5000 字 \| UBB代码关闭 \| [img]标签关闭