Wayback Machine проиндексировала 400 миллиардов веб-страниц

Средство Интернет Архива Wayback Machine успешно проиндексировала более 400 миллиардов веб-страниц. Именно такое достижение, установленное за 18 лет, решило отметить руководство архива.

Wayback Machine — это цифровой архив Всемирной Паутины, созданный и поддерживаемый некоммерческой организацией Internet Archive. Данный сервис позволяет посетителям посмотреть веб-страницы, какими они были в разное время, начиная с 1996 года.

Как отмечено в праздничном сообщении, впервые публике Wayback Machine была открыта в 2001, в тот момент, когда она уже 5 лет собирала данные по всей Сети. В 2006 году был запущен сервис Archive-It, который позволил библиотекам, подписанным на сервис, создавать коллекции важного веб контента.

Мир NVIDIA в 2001 году

Тремя годами позднее Internet Archive начал совместную работу с Sun Microsystems по запуску нового ЦОД, который бы позволил хранить весь веб архив. Центр на 3 петабайта обрабатывал 500 запросов в секунду и размещался в контейнере для морских перевозок.

Позднее сервис приобрёл новые функции. Так, появилась возможность добавить страницу в архив или посмотреть заархивированную всего час назад страницу.

Если вы ещё не посмотрели на работу Wayback Machine, то вам непременно стоит это сделать, чтобы оценить, насколько далеко зашли наши технологические возможности и как сильно изменился дизайн Сети за столь короткий срок.