Im dłużej prowadzimy stronę internetową, tym więcej pojawia się na niej martwych (czyli prowadzących do nieistniejących stron) linków. To normalna sytuacja – serwisy, o których wspominaliśmy dawno temu, mogły zmienić format adresów URL lub całkowicie zniknąć z Sieci. Warto od czasu do czasu wyszukać takie odnośniki i zrobić z nimi porządek. Oczywiście nie będziemy robić tego ręcznie – z pomocą przyjdzie nam wtyczka Broken Link Checker.
Nieaktywne linki na pewno nie wpływają pozytywnie na pozycję naszej strony w wyszukiwarkach (jest o tym mowa we wskazówkach dla webmasterów). Robią również złe wrażenie na użytkownikach, szczególnie tych, którzy trafili na naszą stronę po raz pierwszy – tekst, w którym połowa odnośników nie działa, nie sprawia wrażenia aktualnego.
Po aktywacji wtyczki będziemy musieli poświęcić chwilę na jej konfigurację, bo domyślne ustawienia w większości przypadków nie spełnią naszych oczekiwań. Przejdźmy więc do znajdującej się w menu Ustawienia sekcji Link Checker.
Zacznijmy od zakładki Ogólne. Znajdziemy tam informacje na temat działania wtyczki oraz kilka jej podstawowych ustawień. Na zamieszczonym powyżej przykładzie możemy zobaczyć informację o znalezieniu jednego niedziałającego linku – kliknięcie na ten komunikat przeniesie nas do listy odnośników, gdzie będziemy mogli zdecydować co zrobimy z nieaktywnymi linkami (ale o tym za chwilę).
Jednym z ważniejszych ustawień jest opcja Sprawdź każdy link co X godzin. Możemy za jej pomocą określić jak często mają być sprawdzane poszczególne odnośniki. Domyślnie ustawione są 72 godziny, ale dobrze jest zwiększyć nieco tę liczbę jeśli nasza strona zawiera bardzo dużo linków. Warto dodać, że ustawienie to działa tylko dla linków, które zostały już przynajmniej raz sprawdzone.
Niżej znajdziemy ustawienia dotyczące powiadamiania właściciela strony oraz poszczególnych autorów o pojawieniu się niedziałających linków. Możemy również ustawić dodatkowe style dla odnośników oznaczonych jako martwe – domyślnie są one przekreślane. Z kolei zaznaczenie opcji Nie pozwól wyszukiwarkom podążać po niedziałających linkach spowoduje dodanie do nieaktywnych linków atrybutu rel="nofollow"
.
Zakładka Szukasz linków w pozwala nam na określenie rodzajów treści, które będą przeszukiwane pod kątem martwych odnośników. Domyślnie wybrane są komentarze, strony i wpisy, ale możemy dodać do tej listy na przykład własne typy wpisów. Możemy również włączyć sprawdzanie wpisów jeszcze nie opublikowanych (szkiców i wpisów oczekujących) oraz zaplanowanych (ustawionych do publikacji w przyszłości). Co zastanawiające, nie ma możliwości przeszukiwania wpisów znajdujących się w koszu – chociaż nie sądzę, aby komukolwiek była taka opcja potrzebna.
Trzecia zakładka, zatytułowana Które linki sprawdzać, to najważniejsza część konfiguracji wtyczki. Możemy tam określić jakiego rodzaju linki będą sprawdzane. Domyślnie wybrane są opcje Linki HTML i Obrazki HTML. Warto zwrócić uwagę, że jeśli w którymś z wpisów mamy nieaktywny adres URL nie będący linkiem, to nie zostanie on sprawdzony – aby skaner uwzględniał również takie adresy trzeba zaznaczyć opcję URLe w czystym tekście. Pozostałe typy linków nie wymagają wyjaśnień – odnoszą się do różnego rodzaju multimediów, takich jak filmy z serwisów YouTube, Vimeo czy DailyMotion. Na dole zakładki mamy możliwość wykluczenia ze sprawdzania adresów URL zawierających wybrane słowa – w ten sposób możemy na przykład zabronić wtyczce sprawdzania linków do wybranych stron.
Zakładka Protokoły i API pozwala na włączenie sprawdzania wybranych linków za pomocą API serwisów, do których prowadzą. Pozwala to na przykład na lepsze wychwycenie niedziałających linków do YouTube czy kilku popularnych serwisów umożliwiających dzielenie się plikami. Nie należy wyłączać zaznaczonej domyślnie opcji Podstawowy HTTP – spowoduje to zaprzestanie skanowania „zwykłych” linków.
Ostania zakładka Zaawansowane pozwala nam na modyfikowanie działania skryptu skanującego. Opcja Timeout pozwala na ustawienie limitu czasu oczekiwania na odpowiedź – po tym czasie link zostanie uznany za martwy. Jeśli nasza strona zawiera dużo linków, można ten czas nieco skrócić aby przyśpieszyć sprawdzanie. Nie należy jednak przesadzać – 15-20 sekund to moim zdaniem wartość minimalna.
Skrypt sprawdzający linki na naszej stronie działa w tle. Domyślnie jest on uruchamiany co godzinę i działa przez maksymalnie 5 minut. Dzieki takiemu schematowi pracy nie powoduje on nadmiernego obciążenia serwera i spowolnienia naszej strony. Z jakiegoś powodu możemy jednak chcieć zmienić sposób działania wtyczki, co umożliwiają nam cztery kolejne opcje. Pracuj nieprzerwanie, kiedy Kokpit jest otwarty pozwala na ominięcie limitu czasu wykonywania skryptu, który po włączeniu tej opcji będzie działał bez przerwy (tak długo, jak długo będziemy mieli otwarty panel administracyjny naszej strony). Opcję tę powinno się wyłączyć w przypadku gdy w ogóle nie zamykamy panelu. Opcja Uruchom co godzinę w tle włącza automatyczne uruchamianie skryptu skanującego – jeśli ją wyłączymy, będziemy musieli uruchamiać skanowanie ręcznie. Maksymalny czas wykonywania określa jak długo skrypt będzie mógł pracować przy każdym uruchomieniu. Spokojnie możemy zostawić wartość domyślną, czyli 300 sekund (5 minut). Ostatnie z tej grupy ustawień to Limit obciążenia serwera, dzięki któremu możemy określić maksymalne dopuszczalne obciążenie serwera. Polecam zostawić te opcję w spokoju, chyba że naprawdę wiemy co robimy.
Na samym dole ostatniej zakładki znajduje się przycisk Sprawdź wszystkie strony. Po jego naciśnięciu baza przeskanowanych linków zostanie wyczyszczona, a wtyczka rozpocznie sprawdzanie od nowa. Nie polecam korzystania z tej opcji na działających stronach, szczególnie takich z dużą ilością treści.
Gdy wtyczka rozpocznie skanowanie, jego wyniki pojawią się w sekcji Niedziałające linki, znajdującej się w menu Narzędzia. Wbrew tytułowi, sekcja ta zawiera listę wszystkich linków znalezionych podczas skanowania, a nie tylko tych martwych.
Warto dodać, że w przypadków większych serwisów, z dużą ilością treści i linków, pierwsze skanowanie po instalacji wtyczki może spowodować zwiększone obciążenie serwera. Gdy wszystkie wpisy i strony zostaną przetworzone, obciążenie powinno wrócić do normy.
Każdy z linków może mieć jeden z trzech statusów: działający, przekierowanie i niedziałający. Lista zawiera również informację o zwracanym przez docelowy serwer statusie (dzięki temu możemy stwierdzić, czy strona w ogóle nie istnieje, czy też na przykład była chwilowo wyłączona), tekst linku oraz wpis, w którym znajduje się dany odnośnik.
Z poziomu tej listy możemy wykonać kilka operacji na linkach. Możemy zmodyfikować problematyczny adres URL (Edytuj URL), usunąć go z wpisu lub strony (Odlinkuj), oznaczyć jako działający (Działający – taki link nie będzie skanowany ponownie), a także przejść do edycji wpisu lub go usunąć.
Oczywiście listę linków można przeszukiwać, co może być pomocne gdy jest ona bardzo długa. Wybranej frazy można szukać w tekście linku, adresie URL, kodzie HTTP (czyli komunikacie zwróconym przez serwer), a także filtrować według statusu i rodzaju treści, w którym znajdują się linki. Warto zauważyć, że wtyczkę można wykorzystać również do zamieniania działających linków, gdy na przykład strona, do której często linkujemy, zmieniła domenę.
Wtyczkę Broken Link Checker można pobrać z oficjalnego repozytorium.