TeamQuest Blog

Cloudflare zarchiwizuje stronę automatycznie

Cloudflare zarchiwizuje stronę automatycznie

Marcin Sarna , 28.09.2020 r.

Wayback Machine i Cloudflare działają razem

Internet Archive i Cloudflare połączyły siły, aby zarchiwizować zawartość stron internetowych, które korzystają z usługi Cloudflare Always Online. Ma to na celu zwiększenie szans, że użytkownicy będą mogli przeglądać stosunkowo najnowszą wersję strony internetowej podczas awarii. Partnerstwo obu firm zwiększy więc liczbę stron internetowych skanowanych przez Internet Archive, czyniąc Wayback Machine narzędziem jeszcze bardziej użytecznym.

Automatyczna archiwizacja

Mark Graham, dyrektor Wayback Machine Internet Archive, powiedział, że:

Witryny internetowe, które obsługują usługę Cloudflare Always Online, będą teraz automatycznie archiwizowane. Jeśli zdarzy się, że oryginalny host nie będzie dostępny dla Cloudflare, wówczas archiwum internetowe samo się włączy tak aby zapewnić iż strony dotrą do użytkowników.

Cloudflare twierdzi, że jego funkcja Always Online zapisuje ograniczoną kopię witryny w pamięci podręcznej, aby była dostępna online dla odwiedzających, gdy serwer źródłowy jest niedostępny. Ma to zapewnić reprezentację najpopularniejszych stron witryny. Korzystanie z Wayback Machine ma usprawnić usługę Always Online w ocenie dyrektora generalnego Cloudflare, Matthew Prince’a. Zauważył on też, że:

Wayback Machine Internet Archive ma imponującą infrastrukturę, która może archiwizować Internet na dużą skalę.

Nowa metoda archiwizacji

Partnerstwo poprawi zdolność Wayback Machine do archiwizacji sieci. Graham napisał, że będący systemem non-profit Internet Archive nie przeszukuje całej sieci, ale udostępnia ponad 468 miliardów zarchiwizowanych stron internetowych i dodaje dziennie ponad 1 miliard nowych zarchiwizowanych adresów URL. Robi to za pomocą różnych metod, takich jak:

  • przeszukiwanie list milionów witryn, przesyłanych przez użytkowników za pośrednictwem funkcji „Zapisz stronę teraz” w Wayback Machine

  • dodawanie stron dodane do artykułów Wikipedii, do których odwołują się tweety

  • szereg innych „sygnałów” i źródeł, takich jak agregatory wiadomości

Usługa Cloudflare Always Online jest więc teraz właśnie taką kolejną, dodatkową drogą dla Wayback Machine do wyszukiwania i archiwizowania witryn internetowych. Gdy nowe adresy URL zostają dodawane do witryn korzystających z tej usługi, są one przesyłane do zarchiwizowania w Wayback Machine - napisał Graham. W niektórych przypadkach będzie to pierwszy raz, gdy adres URL zostanie odczytany przez nasz system i wywoła zdarzenie o nazwie „Pierwsze archiwum”. We wszystkich przypadkach te nowo zarchiwizowane adresy URL będą dostępne dla każdego, kto korzysta z Wayback Machine.

Graham przewiduje, że partnerstwo umożliwi archiwum internetowemu lepszą pracę polegającą na tworzeniu kopii zapasowych większej ilości publicznej sieci WWW, a tym samym uczyni ją bardziej użyteczną i niezawodną.

Jak to włączyć?

Integracja z archiwum internetowym jest dostępna dla bezpłatnych użytkowników Cloudflare, ale kopia zapasowa witryny będzie tworzona tylko co 30 dni. Płatni klienci Cloudflare będą otrzymywać częstsze kopie zapasowe, co 15 dni w przypadku użytkowników Pro i co 5 dni w przypadku użytkowników biznesowych i korporacyjnych.

Aby użytkownicy Cloudflare mogli włączyć integrację z Internet Archive, muszą wykonać szereg czynności. Po kolei:

  1. Zaloguj się na swoje konto Cloudflare.
  2. Wybierz domenę, dla której chcesz włączyć integrację Always Online z archiwum internetowym. Zostanie wyświetlony pulpit nawigacyjny Cloudflare.
  3. Kliknij aplikację Caching.
  4. W aplikacji Caching wybierz kartę Configuration.
  5. Aby włączyć Always Online, przewiń do karty Always Online Beta i włącz ją.
  6. Aby włączyć integrację z archiwum internetowym, kliknij Update.

Po więcej informacji zapraszamy tutaj.

Najnowsze oferty pracy:

Polecane wpisy na blogu IT:

Szukasz pracownika IT?

Dostarczymy Ci najlepszych specjalistów z branży IT. Wyślij zapytanie

Wyrażam zgodę TeamQuest Sp. z o.o. na przetwarzanie moich danych osobowych w celu marketingu produktów i usług własnych TeamQuest, w tym na kontaktowanie się ze mną w formie połączenia telefonicznego lub środkami elektronicznymi.
Administratorem podanych przez Ciebie danych osobowych jest TeamQuest Sp. z o.o., z siedzibą w Warszawie (00-814), ul. Miedziana 3a/21, zwana dalej „Administratorem".
Jeśli masz jakiekolwiek pytania odnośnie przetwarzania przez nas Twoich danych, skontaktuj się z naszym Inspektorem Ochrony Danych (IOD). Do Twojej dyspozycji jest pod adresem e-mail: office@teamquest.pl.
W jakim celu i na jakiej podstawie będziemy wykorzystywać Twoje dane? Dowiedz się więcej