En
Тренды

Как из интернета (навсегда!) исчезают сайты и кто пытается этому помешать

Казалось бы, электронные архивы надежнее бумажных. Но реальность в том, что страницы из интернета исчезают с ужасающей скоростью. Наталья Конрадова поговорила с физиком-теоретиком Кириллом Затримайловым о том, как можно спасти культурно значимые сайты и что такое интернет-археология.

В интернете информация хранится гораздо хуже, чем на бумаге. На бумаге — хуже, чем на пергаменте, который, естественно, хуже берестяной грамоты. Наверное, самая долговечная система хранения информации — это петроглифы, которые не меняются тысячелетиями. Проблема только в том, что камни вмещают на порядки меньше информации, чем береста, бумага и так далее. В интернете помещается так много, что кажется, как будто в Сети есть все. На самом деле, нет.

Когда люди поняли, что информация из интернета может пропадать

В 1996 году Брюстер Кейл и Брюс Джиллиат, основатели компании Alexa Internet, догадались, что информация исчезает из интернета, и когда-нибудь это может стать проблемой. Они создали интернет-архив Wayback Machine, чтобы обеспечить «универсальный доступ к знаниям» независимо от оплаты места на сервере.

Тогда интернет был совсем маленьким, и казалось, что можно заархивировать его чуть ли не целиком. Для этого архивисты запустили спайдербота — программу, которая ходила и автоматически сохраняла страницы и сайты. В 1999 году подсчитали, что спайдерботам удалось сохранить всего лишь 16% контента. Стало понятно, что боты не справляются — нужны люди. 

В начале нулевых проблема архивирования Сети стала очевидной уже всем, кто не только читал интернет, но и писал его. Появился Международный Консорциум по сохранению интернета, подключились американские библиотеки и архивы, сотрудники которых занимались архивированием уже за зарплату, а не просто по доброй воле. Разумеется, они не сохраняли все подряд, а разрабатывали критерии — искали и описывали «культурно значимое наследие». 

Сейчас у Wayback Machine 373 миллиарда сохраненных страниц, которые весят 45 петабайт (1 петабайт = 1 миллион гигабайт). 

Кто занимается сохранением информации

Совершенно непонятно, как определить, какое именно наследие можно считать культурно значимым. Особенно если речь идет о материалах на русском языке, которыми не занимаются ни библиотеки, ни архивы, а только редкие активисты. 

Один из таких людей написал мне недавно о том, как они с группой программистов восстанавливают сайт Vniz.net.

Кирилл Затримайлов — физик-теоретик, занимается теорией струн и темной материей. Закончил магистратуру в Новосибирске и получает PhD в Scuola Normale Superiore в Пизе. В свободное от темной материи время Кирилл занимается поиском и сохранением исчезающих из интернета страниц, которые сам считает культурно значимым наследием. 

Сайт Vniz.net был создан в 1990-е годы Андреем Черновым, известным в истории Рунета как @ache. Чернов был не только автором кодировки KOI8-R и участвовал в первых интернет-соединениях из СССР, но и деятелем андерграунда.

Сайт Чернова был одним из первых ресурсов на русском языке, но после смерти автора выяснилось, что нет никаких способов его сохранить. Чтобы заплатить за сервер, нужен пароль, который хранился на компьютере Чернова. А компьютер, в свою очередь, тоже запаролен с помощью сложной системы шифра.

После смерти Чернова и исчезновения его сайта из Сети оставалось немного времени на то, чтобы собрать все страницы, хранящиеся в Google Cache и Bing. 

Сайт уже частично собран и опубликован под именем Zachem.net на новом сервере.Он выглядит почти как оригинал, но эта легкость возвращения обманчива. Несколько человек на протяжении нескольких недель тратили все свободное время на то, чтобы сохранить страницы — и даже отдельные картинки — но так и не смогли вытащить из умирающей сетевой памяти все, что было на сайте Vniz.net до его закрытия.

Таких сайтов, исчезающих из интернета и недоступных на Wayback Machine, наберется немало. Только за последние пару лет исчез знаменитый в 1990-е вестник сетевой культуры Zhurnal.ru — в архиве на Wayback сохранились лишь отдельные страницы. Из той эпохи чудом остались порталы вроде «Чертовых куличек», который частные хозяева поддерживают из соображений ответственности или ностальгии. Найти, как выглядели некоторые страницы, можно в старых книжках об интернете — они написаны в те годы, когда еще был смысл издавать на бумаге справочники по Сети.

Но в целом архивы будут продолжать исчезать. Кирилл Затримайлов считает, что это станет одной из ключевых тем XXI века — жаль только, это произойдет уже после потери большого количества сайтов.

Наталья Конрадова

0 комментариев
5
Еще статьи на эту тему
0 комментариев