GitHub ушёл под лёд: 21 Тбайт открытого кода спрятано в арктическом хранилище
Как вы можете помнить, купленная компанией Microsoft платформа GitHub планировала создать защищённый архив открытого кода во льдах Арктики. Точнее, в специально оборудованной под хранилище шахте на острове Шпицберген, в условиях вечной мерзлоты. Снимок для архива был сделан 2 февраля 2020 года, но из-за пандемии COVID-19 архив достиг хранилища только в этом месяце.
Как сообщается в блоге GitHub, 2 февраля сделана копия наиболее важного или связанного с ним открытого исходного кода (почти всего, как утверждают в GitHub, но это вряд ли). «Отправленный в GitHub Arctic Code Vault снимок архива от 02/02/2020 охватывает все активные публичные репозитории GitHub, в дополнение к существенным, но бездействующим репозиториям».
Снимок включает каждый репозиторий с коммитами между объявлением в GitHub 13 ноября 2019 года и 2 февраля 2020 года, каждый репозиторий с минимум 1 звездой и коммитами за год до снимка (с 02/03/2019 по 02/02/2020), а также каждый репозиторий с 250 и более звёзд. Но на практике право попасть в арктический архив получил даже код без звёзд, что затрудняет дать полную оценку правилам выбора права на хранение. Добавим, пользователи GitHub, чей код попал в арктический архив, получили ярлычки с записью «Arctic Code Vault Contributor».
Всего для архива было отобрано 21 Тбайт данных, которые были записаны на специальные ленты в бобинах компании Piql. Это полиэфирная плёнка на основе галогенидов серебра. В каждой катушке чуть больше километра плёнки (1066 метров). Всего записано 186 таких катушек, и все они в девяти больших коробках доставлены в хранилище на острове Шпицберген в Норвегии. Пандемия не позволила команде GitHub лично сопровождать архив до хранилища на глубине в несколько сотен метров, но, как сообщают в компании, архив успешно доставлен и помещён в шахту 8 июля.
Компания Piql, которой принадлежит арктическое хранилище, гарантирует сохранность данных на ленте в течение 500 лет. Искусственное старение ленты показало, что данные с ленты можно считать даже после 1000 лет хранения. Остаётся надеяться, что к тому времени на Земле останутся средства считывания таких архивов, а то ведь всякое может случиться. Сохранить ― это одно, а понять, зачем оно нужно и что с ним делать ― это совсем другое.