Jeśli zamierzasz zarejestrować daną domenę, to warto upewnić się, czy pod konkretnym adresem była kiedyś prowadzona strona WWW. Nie jest to jedyny przypadek, kiedy przydaje się archiwum stron internetowych. Jak zweryfikować poprzednią wersję witryny? Kiedy jeszcze jest to przydatne?
Czym jest archiwum stron WWW?
Witryny, które określane są jako archiwum stron WWW, utrzymują kopie serwisów internetowych. Tzn. dzięki nim można dowiedzieć się, jak wyglądała witryna w przeszłości. To sposób na odzyskanie danych, które usunęliśmy już z serwisu. Dzięki archiwum stron WWW to kwestia dosłownie kilku kliknięć.
Nie jest jednak tak, że serwis archiwizujący witryny musi mieć w swojej bazie kopie wszystkich stron. Właściciel serwisu może zablokować dostęp do niego robotowi. W takim przypadku pliki strony nie znajdą się w archiwum. Jeśli nie chcemy, aby nasza witryna była dostępna w najpopularniejszym archiwum stron WWW, czyli Wayback Machine, to wystarczy dodać odpowiedni kod w pliku robots.txt. Znajduje się on w katalogu głównym serwisu – można go edytować, np. korzystając z menedżera plików w ramach usługi hostingowej. Kod ten jest następujący:
User-agent: ia_archiver
Disallow: /
Ewentualnie można również wysłać e‑mail na adres info@archive.org z prośbą o usunięcie kopii, ale należy to zrobić ze skrzynki pocztowej w domenie, której dotyczy wniosek.
Archiwizacja strony internetowej – zalety
Utworzyć kopię witryny możemy samodzielnie, ale robot Wayback Machine trafia na strony WWW również sam, przegląda je i zapisuje.
Do największych zalet archiwizowania serwisów można zaliczyć:
- Sprawdzenie, jaka witryna znajdowała się wcześniej pod danym adresem – czy nie była prowadzona tam nielegalna działalność lub żadna inna, która może negatywnie wpływać na opinię o naszym biznesie?
- Przywrócenie kopii serwisu z danego dnia – archiwizacja stron internetowych daje dostęp do poprzednich wersji witryny, dzięki czemu można odzyskać treści, które np. przypadkiem usunęliśmy.
- Weryfikacja wcześniejszego wyglądu witryny – w takich serwisach można znaleźć kopie strony nawet sprzed 20 lat i zobaczyć, jak ogromne zaszły w niej zmiany.
Narzędzia do sprawdzenia archiwalnej strony internetowej
Archiwum stron można przejrzeć, korzystając z różnych narzędzi. Oto wybrane witryny, które dają taką możliwość:
1. Google – po znalezieniu danej strony w Google, najczęściej można znaleźć ostatnią zapisaną, klikając „Kopia”. Wystarczy kliknąć obok adresu URL ikonę trójkąta, a następnie wybrać Kopia. Może to być wersja strony z tego samego dnia, ale też starsza.
2. Wayback Machine – zdecydowanie najpopularniejsze narzędzie tego typu. Dzięki niemu znajdziemy kopie stron internetowych z różnych okresów – najczęściej jest ich kilka z jednego roku. W archiwum tym zapisanych jest blisko 750 miliardów stron.
Źródło: archive.org
3. Archive – to jedna z najlepszych alternatyw dla Wayback Machine. Umożliwia łatwe tworzenie kopii stron WWW. Zapisuje tekst i grafikę. Pozwala na śledzenie, jak zmieniała się zawartość danej strony WWW.
Źródło: archive.ph
4. Stillio – to narzędzie tworzy zrzuty stron WWW, a następnie je archiwizuje i udostępnia użytkownikom. Można m.in. ustalić częstość tworzenia kopii. Jest to rozwiązanie płatne.
Źródło: Stilio
5. Perma – to kolejne narzędzie, które tworzy kopie strony WWW. Dane zapisane są w nim na stałe.
Źródło: Perma
6. Smarsh – to narzędzie umożliwia archiwizowanie online danych z wielu kanałów komunikacji. Można dzięki niemu tworzyć kopie nie tylko stron WWW.
Źródło: Smarsh
Jak krok po kroku sprawdzić historyczną wersję strony internetowej?
Jak sprawdzić poprzednią wersję strony? Najczęściej internauci sięgają po Wayback Machine, które z reguły przechowuje wiele kopii serwisu, a poza tym jest proste w obsłudze. Oto, jak krok po kroku sprawdzić strony archiwalne w tym narzędziu:
1. Archiwum internetu znajduje się tutaj. Korzystanie z tej bazy nie wymaga zakładania konta i jest bezpłatne.
2. W polu widocznym na poniższym screenie należy podać adres witryny, której kopię chcemy zweryfikować. Następnie klikamy enter – wtedy wyświetli się nam kalendarz z zaznaczonymi dniami, w których narzędzie zapisało kopię serwisu.
3. W kalendarzu znajdują się daty oznaczone różnym kolorem. Niebieski oznacza, że robot indeksujący otrzymał kod wyniku 2xx (dobry), zielony – kod 3xx (przekierowanie), pomarańczowy – kod 4xx (błąd, np. strona niedostępna), a czerwony – kod 5xx (błąd serwera).
4. Po kliknięciu danej daty wyświetlą się ewentualne wersje strony zapisane w tym dniu. Będzie tam również informacja, o której godzinie wykonano kopię. Wystarczy kliknąć tę godzinę, aby sprawdzić stronę. Możliwe, że z jednego dnia dostępne będą różne wersje, z różnych pór dnia, ale raczej jest tak rzadko.
5. Następnie powinna się nam wyświetlić strona z dodatkowymi opcjami, które Wayback Machine wyświetla na górze widoku. Można łatwo zmienić kopię na pochodzącą z innego terminu, jeśli nie znaleźliśmy tego, czego szukamy.
Kopia strony internetowej – jak ją zrobić?
Dzięki wspomnianym narzędziom możemy sprawdzać historyczne strony internetowe, a dokładnie – wcześniejsze wersje witryn, nawet sprzed wielu lat. Jeśli chcemy zapisać kopię z konkretnego dnia, to możemy skorzystać Wayback Machine. Wystarczy dosłownie kilka kliknięć.
Wayback Machine umożliwia wykonanie aktualnej kopii serwisu ręcznie. Na stronie głównej narzędzia dostępna jest opcja Save Page Now, którą widać na poniższym screenie. Wystarczy podać adres URL, a wtedy Wayback Machine zapisze kopię witryny.
Źródło: Archive
Oczywiście to niejedyny sposób na wykonanie kopii strony WWW. Jeśli korzystamy z usługi hostingowej, to możemy zalogować się na serwer FTP i skopiować zapisane tam pliki do chmury czy też na dysk urządzenia. Warto je mieć np. na wypadek włamania na serwer i zainfekowania naszej witryny. Najczęściej firmy hostingowe zapewniają także narzędzia do tworzenia kopii strony internetowej. To bardzo przydatne rozwiązanie, gdyż często wystarczy jedno kliknięcie, by uzyskać backup witryny. Wtedy wszystkie pliki trafiają do jednego archiwum, łącznie z bazą danych i zdjęciami.
Mając kopię, łatwiej można odtworzyć stronę, np. po ataku hakerskim. Możliwość generowania takiego backupu mają m.in. użytkownicy hostingu z panelem zarządzania Direct Admin. Utworzone kopie warto sprawdzać, by dowiedzieć się, czy archiwum nie jest uszkodzone? Zapisane dane mogą się przydać w wielu przypadkach.