Содержание
- 1 1. Кэш Google, который всё помнит
- 2 2. Web-archive, в котором вся история интернета
- 3 3. Кэш Яндекса, почему бы и нет
- 4 4. Кэш Baidu, пробуем азиатское
- 5 5. CachedView.com, специализированный поисковик
- 6 6. Archive.is, для собственного кэша
- 7 7. Кэши других поисковиков, мало ли
- 8 8. Кэш браузера, когда ничего не помогает
- 9 9. Пробуем скачать файл страницы напрямую с сервера
- 10 Что делать, если вообще ничего не помогло
- 11 Ирина Чернова
Зачем это нужно: с утра мельком прочитали статью, решили вечером ознакомиться внимательнее, а ее на сайте нет? Несколько лет назад ходили на полезный сайт, сегодня вспомнили, а на этом же домене ничего не осталось? Это бывало с каждым из нас. Но есть выход.
Всё, что попадает в интернет, сохраняется там навсегда. Если какая-то информация размещена в интернете хотя бы пару дней, велика вероятность, что она перешла в собственность коллективного разума. И вы сможете до неё достучаться.
Поговорим о простых и общедоступных способах найти сайты и страницы, которые по каким-то причинам были удалены.
1. Кэш Google, который всё помнит
Google специально сохраняет тексты всех веб-страниц, чтобы люди могли их просмотреть в случае недоступности сайта. Для просмотра версии страницы из кэша Google надо в адресной строке набрать:
http://webcache.googleusercontent.com/search?q=cache:http://www.iphones.ru/
Где http://www.iphones.ru/ надо заменить на адрес искомого сайта.
2. Web-archive, в котором вся история интернета
Во Всемирном архиве интернета хранятся старые версии очень многих сайтов за разные даты (с начала 90-ых по настоящее время). На данный момент в России этот сайт заблокирован.
3. Кэш Яндекса, почему бы и нет
К сожалению, нет способа добрать до кэша Яндекса по прямой ссылке. Поэтому приходиться набирать адрес страницы в поисковой строке и из контекстного меню ссылки на результат выбирать пункт Сохраненная копия. Если результат поиска в кэше Google вас не устроил, то этот вариант обязательно стоит попробовать, так как версии страниц в кэше Яндекса могут отличаться.
4. Кэш Baidu, пробуем азиатское
Когда ищешь в кэше Google статьи удаленные с habrahabr.ru, то часто бывает, что в сохраненную копию попадает версия с надписью «Доступ к публикации закрыт». Ведь Google ходит на этот сайт очень часто! А китайский поисковик Baidu значительно реже (раз в несколько дней), и в его кэше может быть сохранена другая версия.
Иногда срабатывает, иногда нет. P.S.: ссылка на кэш находится сразу справа от основной ссылки.
5. CachedView.com, специализированный поисковик
На этом сервисе можно сразу искать страницы в кэше Google, Coral Cache и Всемирном архиве интернета. У него также еcть аналог cachedpages.com.
6. Archive.is, для собственного кэша
Если вам нужно сохранить какую-то веб-страницу, то это можно сделать на archive.is без регистрации и смс. Еще там есть глобальный поиск по всем версиям страниц, когда-либо сохраненных пользователями сервиса. Там есть даже несколько сохраненных копий iPhones.ru.
7. Кэши других поисковиков, мало ли
Если Google, Baidu и Yandeх не успели сохранить ничего толкового, но копия страницы очень нужна, то идем на seacrhenginelist.com, перебираем поисковики и надеемся на лучшее (чтобы какой-нибудь бот посетил сайт в нужное время).
8. Кэш браузера, когда ничего не помогает
Страницу целиком таким образом не посмотришь, но картинки и скрипты с некоторых сайтов определенное время хранятся на вашем компьютере. Их можно использовать для поиска информации. К примеру, по картинке из инструкции можно найти аналогичную на другом сайте. Кратко о подходе к просмотру файлов кэша в разных браузерах:
Safari
Ищем файлы в папке ~/Library/Caches/Safari.
Google Chrome
В адресной строке набираем chrome://cache
Opera
В адресной строке набираем opera://cache
Mozilla Firefox
Набираем в адресной строке about:cache и находим на ней путь к каталогу с файлами кеша.
9. Пробуем скачать файл страницы напрямую с сервера
Идем на whoishostingthis.com и узнаем адрес сервера, на котором располагается или располагался сайт:
После этого открываем терминал и с помощью команды curl пытаемся скачать нужную страницу:
Что делать, если вообще ничего не помогло
Если ни один из способов не дал результатов, а найти удаленную страницу вам позарез как надо, то остается только выйти на владельца сайта и вытрясти из него заветную инфу. Для начала можно пробить контакты, связанные с сайтом на emailhunter.com:
О других методах поиска читайте в статье 12 способов найти владельца сайта и узнать про него все.
А о сборе информации про людей читайте в статьях 9 сервисов для поиска информации в соцсетях и 15 фишек для сбора информации о человеке в интернете.
? Хочешь больше? Подпишись на наш Telegramнаш Telegram. … и не забывай читать наш Facebook и Twitter ? iPhones.ru Сервисы и трюки, с которыми найдётся ВСЁ. Зачем это нужно: с утра мельком прочитали статью, решили вечером ознакомиться внимательнее, а ее на сайте нет? Несколько лет назад ходили на полезный сайт, сегодня вспомнили, а на этом же домене ничего не осталось? Это бывало с каждым из нас. Но есть выход. Всё, что попадает в интернет,… —>
Ирина Чернова
@sweet_princess
Рас*здяйка. Графоманка. Боюсь людей. Страдаю манией величия. Фото удалено модераторами, так как внешность безнадежно испорчена тяжелой жизнью.
Существует настоящая, реальная машина времени, в которой можно ненадолго вернуться в прошлое и увидеть, например, как выглядел тот или иной сайт несколько лет назад. Думаете, никому не нужны копии сайтов многолетней давности? Ошибаетесь! Для очень многих людей сервис по архивированию информации весьма полезен.
Во-первых, это просто интересно! Из чистого любопытства и от избытка свободного времени можно посмотреть, как выглядел любимый, популярный ресурс на заре его рождения.
Во-вторых, далеко не все веб-мастера ведут свои архивы. Знать место, где можно найти информацию, которая была на сайте в какой-то момент, а потом пропала, не просто полезно, а очень важно.
В-третьих, само по себе сравнение является важнейшим методом анализа, который позволяет оценить ход и результаты нашей деятельности. Кстати, при проведении анализа веб-ресурса очень эффективно использовать ряд методов сравнения.
Поэтому наличие уникальнейшего архива веб-страниц интернета позволяет нам получить доступ к огромному количеству аудио-, видео- и текстовых материалов. По утверждению разработчиков, В«интернет-архивВ» хранит больше материалов, чем любая библиотека мира. Мы попали в правильное место!
Что нужно, чтобы найти копии сайтов интернета?
Для того, чтобы отправиться в прошлое, нужно перейти на сайт https://web-beta.archive.org/ и воспользоваться поисковой строкой.
Простой поиск в архиве сохраненных сайтов выдает нам ссылки на все сохраненные копии запрашиваемой страницы.
Из этого скриншота видно, что сайт http://pikabu.ru был создан в 2009 году. Переключаясь на нужный нам год, можно увидеть даты, выделенные кружочками, это и есть даты сохранения копии сайта. Например, в 2009 году, пока можно будет увидеть только две копии от 28 и 29 июня.
Конечно, это потрясающий ресурс! Ведь здесь индексируются и архивируются все сайты интернета! Это не только скриншоты… Имея в руках такой инструмент, можно восстановить массу потерянной со временем информации.
Надо заметить, что, безусловно все восстановить однозначно не получится, так как если на страницах сайта используются элементы Java Script, или скрипты или графика взяты со стороннего сервера, то на восстановление такой информации рассчитывать не придется. Поэтому к сохранению данных своего сайта нужно относиться с особенным вниманием, несмотря ни на что.
Берегите себя и своих близких!
15
В октябре 2019-го года Яндекс тихой сапой, безо всяких анонсов и объявлений, заменил формат сохраненной копии страницы. Нажав на ссылку «Сохраненная копия» в сниппете, мы попадаем на домен yandexwebcache.net, который раньше не использовался для хранения сохраненных копий.
Дизайн шапки страницы сохраненной копии со служебной информации изменился:
Хорошая новость – ссылка на текстовую копию стала рабочей в отличие от старого формата сохраненки. Она доступна по ссылке «Полный текст», URL страницы текстовой версии сохраненной копии отличается от URL полной версии наличием get-параметра mode=text:
К счастью, подсветку ключевых слов все-таки можно увидеть, применив несложный лайфхак. Оказывается, с вводом нового формата сохраненной копии, Яндекс пока еще не удалил возможность пользоваться старым форматом. Для доступа к сохраненкам в старом формате нам нужно заменить в URL сохраненки имя домена с https://yandexwebcache.net/ на https://hghltd.yandex.net/
При этом нужно иметь в виду, что при загрузке полной версии сохраненной копии Яндекс может убирать из ее URL в командной строке браузера get-параметр sign (по крайней мере, это происходит для сохраненной копии исследуемой нами главной страницы Яндекса). Если такое происходит, то URL полной версии сохраненки нужно скопировать не из командной строки браузера, а из ссылок на нее из сниппета на странице выдачи или со страницы текстовой сохраненной копии, в которых этот параметр присутствует. Далее заменяем в скопированном URL домен и получаем полную версию сохраненной копии в старом формате с подсветкой ключевых слов:
Для получения текстовой версии сохраненной копии в старом формате с подсветкой, надо к сконструированному нами URL полной версии сохраненки добавить get-параметр &cht=1, т.к. ссылка «Посмотреть текстовую копию», как я уже упоминал выше, здесь работает некорректно:
При этом надо иметь в виду тот факт, что время жизни текущего значения get-параметра sign в URL сохраненных версий как нового, так и старого формата ограничено. И если мы начинаем при попытке ее загрузить получать 404-ю ошибку, то необходимо обновить страницу с результатами поиска и извлечь из сниппета ссылку на сохраненную копию с новым значением get-параметра sign, которое будет рабочим некоторое время. Так, например, за время написания этой статьи, рабочее значение get-параметра sign в URL сохраненных копий рассматриваемого примера менялось несколько раз, что можно заметить на скриншотах.
Хотелось бы надеяться, что сотрудники Яндекса восстановят подсветку ключевых слов запроса в новом формате сохраненки. А пока придется совершать вот такие вот танцы с бубнами с возвращением к старому формату для продуктивного анализа сохраненных копий страниц. При этом проблема возможного несоответствия показываемой версии сохраненной копии страницы и той, что находится в индексе и используется для ранжирования, о которой я писал ранее, к сожалению, все еще остается актуальной.
Используемые источники:
- https://www.iphones.ru/inotes/562838
- https://pikabu.ru/story/kak_nayti_arkhivnyie_kopii_saytov_interneta_ili_mashina_vremeni_dlya_saytov_4712419
- https://www.searchengines.ru/novyj-format-sohranennoj-kopii.html