
Wayback Machine достигла триллиона страниц и хранит живую историю интернета
Инструмент Internet Archive удивляет и впечатляет: пять фактов о том, как Wayback Machine сохраняет прошлое Всемирной сети.
Основные идеи
Мнение автора
Wayback Machine — это настоящая машина времени для интернета, которая помогает не только копить страницы, но и хранить культурную память Сети. Огромный триллион страниц — это впечатляет, но важнее то, что архив даёт возможность видеть, как менялся интернет, и сохраняет то, что иначе исчезло бы навсегда.
Недавний репортаж CNN раскрыл множество интересных фактов о Wayback Machine и об интернет-архиве в целом. По сути, Wayback работает как машина времени. Она позволяет возвращаться к старым версиям веб-страниц. Если угодно, это TARDIW — время и относительные измерения в Сети.
Но функции Wayback Machine этим не ограничиваются. Деятельность некоммерческой организации Internet Archive намного шире. Ей управляют инженеры-программисты и библиотекари. Ниже я приведу список из пяти удивительных фактов.
1. Триллион страниц в книге Интернета

Чуть больше месяца назад Wayback Machine сохранила триллионную веб-страницу. Эта цифра ошеломляет. Сейчас библиотека растет и ежедневно пополняется почти на 150 ТБ или 150 000 ГБ данных.
2. Святилище служителей
Интернет-архив находится в округе Ричмонд города Сан-Франциско. Штаб-квартира занимает здание бывшей «Четвертой церкви Христа-Ученого». Это впечатляющее архитектурное сооружение. Вдоль фасада стоят восемь огромных колонн, которые напоминают логотип организации.
В церкви сохранились витражи, но внутри теперь стоит множество серверов. На них хранятся ценные данные для Wayback Machine. Разумеется, триллион веб-страниц не поместится в стенах одной штаб-квартиры. Большинство серверов Интернет-архива разместили на большом складе за пределами города. Служители бывшей церкви символически занимают главное святилище здания.
3. Важность сохранения Сети
Сохранение исторических снимков веб-страниц имеет огромную ценность. Это касается сайтов правительств, корпораций, организаций или личных блогов. Отслеживание изменений проливает свет на мотивы владельцев. Так мы сохраняем фрагменты контента, которые иначе исчезли бы из коллективной памяти.
Если правительства меняют официальные сайты, журналистам крайне важно получить доступ к старым версиям. Это помогает четко увидеть последствия любых правок.
4. Не только веб-страницы
Интернет-архив не только сохраняет историю сети. Организация оцифровывает книги и другие носители информации. В список входят винтажные виниловые пластинки 1920-х годов, компакт-диски, аудиокассеты, VHS, телешоу и видеоигры. Я даже не подозревал, насколько разнообразные исторические записи хранит Архив.
5. Основана пионером интернета

Брюстер Кейл основал Internet Archive и Wayback Machine в 2001 году. Он был пионером интернета и одним из создателей WAIS. Эта система стала предшественником Всемирной паутины и первым распределенным инструментом для поиска и извлечения документов в сети.











