Способы восстановления сайта из вебархива: Archivarix, Ruby

Сложилось впечатление, что народ не в курсе какие есть способы восстановления сайта из вебархива. Я все описывать не буду, т.к. мне лень. Опишу чем пользуюсь сам и к чему присматриваюсь.

Сервисы о которых пойдёт речь:

Archivarix
Ruby/Python

Содержание

Archivarix
Инструкция для восстановления сайта через Archivarix
Библиотека Ruby или Python
Инструкция для Ruby
Другие способы восстановления сайта

Archivarix

Норм сервис. Часто им пользуюсь.

Плюсы:

~~Восстановление сайта состоящего из 200 файлов будет бесплатным (халява, мужики и дамы!);~~ UPD: Халява кончилась, дамы и господа, настал капитализм и теперь всё что больше 1 файла — оплачивается.
Настройка восстановления (удалить рекламу, оптимизировать html и т.д.);
Archivarix CMS. Удобно потом добавлять метрику или что-то заменять на страницах. Не WordPress, но лучше чем файлики html;
Парсинг структурированных данных. Эти данные грузятся в WordPress. Удобно;
Недорого для небольших сайтов (а то и вовсе халява);
Можно нагенерировать статьи на html с помощью X-GPTWriter и закинуть их в CMS. Должно быть норм.

Сделаю за вас сайт со статьями от chatGPT3.5 на дропе или новореге. Пишите в телегу.

Минусы:

Дорого для больших сайтов;
Поддержка мне не понравилась. Ответили через стопицотмиллионов веков и завуалированно назвали тупым (возможно, я слишком нежный для ваших суровых интернетов…ну или правда тупой :D). Но это было года 2 назад, может всё поменялось.

Инструкция для восстановления сайта через Archivarix

Регаемся. Надеюсь подробности не нужны? 🙂
Тыкаем Восстановить сайт:
Заполняем строки:
- Домен — без http/https/www и других штук.
- Если ввести домен, появляются две кнопочки Календарь снимков (там можно выбрать дату от какого начинать парсить сайт и до какого числа) и Таблица URL (список урлов, которые есть в архиве);
- До временной отметки — т.е. дата последнего нормально снимка сайта. Например, 202308 (год и месяц). Обычно заполняю.
- Начиная с временной отметки — т.к. самый старый подходящий снимок сайта. Например, 202007. Обычно не заполняю.
Выбираем настройки, которые вам нужны:
Тыкаем кнопку Восстановить. Ждём.
Подождали, теперь можно и поработать.
Перешли в меню Мой аккаунт — Без подтверждения.
~~Аху~~ Ахаете от цены, но деваться некуда давайте восстанавливать.
Тыкаем оплатить, оплачиваете (думаю, догадаетесь как) и снова ждём…
Сайт появляется во вкладке Готовые. Тыкаем на кнопку Управлять (или какая там будет?).
Скачиваем CMS и копируем код для файлов сайта.
Отправляем архив на хостинг (я пользуюсь бегетом), распаковываем архив.
Вбиваем в адресную строку domen.ru/archivarix.cms.php
В появившемся окне вбиваем код файлов сайта и CMS сама скачивает файлы.
Вуяля!

Вот чёткая запись от Лёхи: Как покупать сайты с инвестором?

Сам пользуюсь, когда надо скачать небольшой сайт. Советую. Быстро и удобно поддерживать на Archivarix CMS.

Кому лень разбираться — пишите, восстановлю сайты за денежку.

Если вдруг где-то что-то косякнул или не понятно — пишите в комментариях или в телеге.

Библиотека Ruby или Python

Плюсы:

Халява! Вуху!

Минусы:

Придётся чуток разобраться с установкой и прочим;
Нет CMS (но халява!)

Инструкция для Ruby

Опишу на примере Ruby, т.к. с Python будет тоже самое.

Скачиваем Ruby.
Устанавливаем: пишем в терминале
```
gem install wayback_machine_downloader
```
Установилось. Теперь немного о командах:
Указываем домен и с какой даты начинаем закачку:
wayback_machine_downloader http://example.com --from 20060716231334
Указываем домен и до какой даты начинаем закачку:
wayback_machine_downloader http://example.com --to 20140716231334
Можно это указать вместе:
wayback_machine_downloader http://example.com --from 20060716231334 --to 20140716231334Другими командами я не пользуюсь. Если что в гугле найдете 🙂
Где взять дату? В адресной строке вебархива:
Дальше скачиваем и отправляем на хостинг.
Готово.

Кому лень разбираться — пишите, восстановлю сайты за денежку.

Другие способы восстановления сайта

Mydrop — сервис на слуху, его использую для поиска дропов. Но и восстановить сайт тоже можно. Вроде как, у них своя база, не из вебархива. Можно проверять сначала в вебархиве — если там сайт не сохранился, попробовать поискать здесь.
rush-analytics.ru — сервис тоже на слуху, я с него начинал, т.к. был промокод (немного уже описывал сервис в блоге).
https://gitlab.com/robotools-org-parser-download/webarchive_wayback — этим не пользовался не знаю че это. Если вдруг кому не подошли первые варианты.
https://www.waybackmachinedownloader.com/en/ — этим тоже не пользовался, но вдруг пригодится.

Я всё.

Алексей Адищев

Вебмастер. Работаю с сайтами под США. Канал в телеге: https://t.me/alexadiru
Качаю бицулю, учусь красиво кричать песни.

Вот чёткая запись от Лёхи: Cоздать бесплатный логотип

Добавить комментарий

Kintaro Oe 11.08.2023 в 12:29

На кой черт это надо?

1
3

Ответить
1. Алексей Адищев автор 11.08.2023 в 12:40
  
  я когда дропы регаю, восстанавливаю сайты, которые на дропах были
  
  4
  
  Ответить
seoonly.ru 12.08.2023 в 09:37

норм)

Ответить
Алекс 31.08.2023 в 15:10

Спасибо

Ответить
jkeks 07.10.2023 в 09:24

Всю жизнь пользуюсь http://r-tools.org/start#p5014
И все еще пользуюсь.. правда автор мог закрыть регистрацию.. надо проверять.
Сервис отличный, если слетает что-то у вебархивов, то ртул чинится быстро, автор на связи всегда. Вообщем стопудовый сервис — рабочий вариант.

1
0

Ответить
Chef 19.10.2023 в 18:30

Про майдроп не знал, спасибо, заценим.
А про либу на пайтоне так вообще шикос. Если понадобится, терь знаю куда ковырять.

Ответить
1. Алексей Адищев автор 19.10.2023 в 18:38
  
  пожалуйста 🙂
  
  Ответить