Wykorzystywanie cudzych treści bez pozwolenia jest niezgodne z prawem. Może to również negatywnie wpłynąć na pozycje zajmowane przez Twoją stronę w Google, jeśli je na niej umieścisz. Wyszukiwarka zaleca dodawanie unikatowych treści i karze obniżeniem widoczności te serwisy, które to ignorują. Sprawdź, czym jest duplicate content i jaki ma wpływ na pozycjonowanie. Jak wykryć takie treści w witrynie?
Czym jest duplicate content?
Duplikacja treści to nie tylko zastosowanie na stronie identycznego contentu, ale również bardzo podobnego, który dostępny jest w sieci pod więcej niż jednym adresem URL. Może to być zewnętrzny duplicate content, jak i wewnętrzny. W pierwszym przypadku chodzi o kopię treści znajdującą się na różnych stronach, a w drugim – w ramach jednej domeny, pod różnymi adresami. Aby dany fragment można było uznać za duplikat, powinien mieć następujące cechy:
- takie same sformułowania i strukturę,
- niewiele oryginalnych informacji lub ich brak,
- brak wartości dodanej dla czytelnika w porównaniu z podobnym tekstem.
Zazwyczaj twórcy witryn nie tworzą celowo duplikacji treści, ale to wcale nie oznacza, że ten problem nie występuje w ich serwisach. Jeszcze kilka lat temu różne badania pokazywały, że około 30% contentu w sieci to kopie. W listopadzie 2022 roku okazało się, że skala problemu jest zdecydowanie większa. Gary Illyes z Google opublikował poniższy slajd podczas Google Search Central Live w Singapurze. Został zaczerpnięty z tweeta Kenichi Suzuki, który uczestniczył w tym wydarzeniu:
Zduplikowane treści nie są problemem niewielkiego odsetka witryn. Jego skala jest bardzo duża, ale oczywiście możesz z nimi skutecznie walczyć.
Dowiedz się więcej o rodzajach duplikacji, metodach wykrywania i radzenia sobie z takim contentem.
Rodzaje duplicate content
Wiesz już, że możliwe są zewnętrzna i wewnętrzna duplikacja treści. Czym się różnią?
Wewnętrzna duplikacja treści
Wewnętrzny duplicate content oznacza, że ta sama treść została użyta więcej niż jeden raz na Twojej stronie. Nie jest to jednoznaczne z tym, że specjalnie używasz identycznych tekstów na różnych podstronach. Przeważnie problem wynika z błędu w postaci braku odpowiednich przekierowań. Możliwe, że masz ten sam produkt przypisany do kilku kategorii, a niepoprawna struktura powoduje, że każdy ma inny adres URL.
Pamiętaj, że roboty Google traktują adres strony z WWW i bez WWW jako różne. Na przykład https://responsywnie.pl/ i www.responsywnie.pl to dwa inne URL-e. Wystarczy przekierowanie 301, żeby nie były traktowane jako kopia strony.
Zewnętrzna duplikacja treści
Ta forma oznacza kopiowanie treści między różnymi serwisami – przeważnie chodzi o opisy produktów. Sklepy WWW, które oferują setki, a nawet tysiące artykułów, mają problem, jak zapewnić unikatowy content. Wymaga to mnóstwa pracy. Zdarza się, że dochodzi do ewidentnej kradzieży – na stronie pojawia się artykuł pochodzący z innej witryny, wstawiony bez zgody autora.
Jeśli prowadzisz serwis, nie używaj na nim treści dodanych już na innych stronach. Nie umieszczaj tego samego contentu na Facebooku i np. na aukcjach Allegro. Jego użycie może wpłynąć na widoczność strony – na wysokiej pozycji znajdzie się tekst z serwisu społecznościowego, a nie wartościowe treści z Twojej witryny. Niestety, ale zdarza się, że to internauci wystawiają na Allegro wcześniej kupiony produkt jako używany i korzystają przy tym z opisu ze strony producenta.
Jeśli wykryjesz podobny problem zastosowania identycznej treści, kontaktuj się z platformą, na której ją dodano albo z wystawcą danego przedmiotu.
Przykłady duplikacji contentu
Powyższy przykład wykorzystania przez internautę tekstu ze sklepu WWW jest częstym problemem, ale powielanie treści może mieć wiele różnych form. Błędem występującym w wielu witrynach jest dostępność tej samej strony WWW pod wieloma adresami. Widać to na poniższym przykładzie.
Jak widzisz, różne adresy URL zwracają dokładnie tę samą treść. Kolejną przyczyną problemów mogą być strony tagów, które tworzy większość popularnych systemów CMS. W efekcie może to wygenerować różne podstrony z tą samą treścią i powodować duplikację. Poniżej przykład dwóch identycznych stron tagów, co wynika z tego, że do każdego z nich pasuje tylko jeden produkt w sklepie.
Kolejny przypadek to efekt scrapingu. Zazwyczaj jest to problem tylko wtedy, gdy widzisz skopiowane wersje treści, które wyprzedzają Twoją witrynę w rankingu. To nie zdarza się często. Może to być problem głównie w przypadku nowych lub słabych witryn. Dlaczego? Ponieważ serwisy „skrobiące” treści są często wiarygodniejsze – budowane na domenach o bardzo dobrych parametrach SEO. To czasami „oszukuje” Google, które traktuje taką treść jako oryginalną. Tymczasem chodzi o manipulowanie wynikami wyszukiwarki.
Jaki wpływ ma duplikacja treści na SEO i pozycjonowanie stron?
Możesz trafić na wiele mitów związanych z duplicate content, takich jak:
Zduplikowana treść zawsze szkodzi widoczności witryny
Zduplikowany content w praktyce zazwyczaj ma dużo mniejszy wpływ, niż może się wydawać. Twórz unikatowe treści, ale też pamiętaj, że niewielka duplikacja wewnętrzna czy kilka publikacji z zewnętrznych źródeł nie spowodują automatycznie dużej utraty widoczności. Na ten temat wypowiedział się John Mueller:
W przypadku tego rodzaju zduplikowanej zawartości [John miał na myśli zduplikowaną zawartość nagłówka i stopki] nie chodzi o to, że wiąże się z nią obniżenie pozycji. Chodzi raczej o to, że jeśli znajdziemy dokładnie te same informacje na wielu stronach w sieci, a ktoś szuka konkretnie tych, to postaramy się znaleźć najlepiej pasującą stronę.
Jeśli więc masz tę samą treść na wielu stronach, nie pokażemy wszystkich. Spróbujemy wybrać jedną z nich i ją wyświetlić. Nie chodzi więc o to, że wiąże się z tym jakikolwiek negatywny sygnał.
Całej wypowiedzi możesz wysłuchać na poniższym wideo:
Wszystkie zduplikowane treści są karane
Google nie ukarze witryny za to, że ma kilka opisów ze strony producenta. Może to zrobić, jeśli korzysta ze skopiowanego contentu po to, aby manipulować wynikami wyszukiwania. Na ten temat również wypowiedział się John Mueller. Sprawdź, co powiedział na poniższym filmie (ok. 28 minuta).
Scrapery zagrażają Twojej stronie
Google od razu po wykryciu takiej witryny wie, z czym ma do czynienia. Bardzo mało prawdopodobne, że wykorzystanie na niej Twojej treści zaszkodzi widoczności witryny.
Google może zidentyfikować twórcę oryginalnej treści
Przeglądarka zazwyczaj nie jest w stanie zidentyfikować twórcy oryginalnego contentu. Ktoś może ukraść Twój content, opublikować na swoim blogu i oznaczyć siebie jako autora. Jeśli chcesz zgłosić Google taki content, zrób to na oficjalnej stronie pomocy technicznej Google.
Duplikacja może mieć negatywny wpływ na widoczność Twojej witryny, ale kilka skopiowanych treści nie spowoduje problemów. Te mogą się pojawić, jeśli używasz takiego contentu masowo. Natomiast najlepiej, jeśli będziesz stawiać na unikatowe treści. Jakość contentu to jeden z czynników, które mają znaczenie dla Google i może przesądzić, że to Twoja konkurencja zajmie wyższą pozycję.
Jakie są przyczyny duplikacji treści?
W artykule pojawiły się już wzmianki dotyczące różnych przyczyn powstawania duplicate content. Przyjrzyjmy się wszystkim najczęstszym, jeśli chodzi o duplikację zewnętrzną:
- kradzież contentu – czyli po prostu użycie cudzej treści bez praw do niej. Jeśli chcesz wykorzystać fragment tekstu, skontaktuj się z twórcą. Nigdy nie rób tego bez zgody, gdyż to przestępstwo,
- kopiowanie opisów – nawet jeśli producent wyraża na to zgodę, to weź pod uwagę, że skorzystać z nich mogą dziesiątki sklepów. Kiedy robot wyszukiwarki będzie oceniać Twoje treści, mało prawdopodobne, że na najwyższych pozycjach znajdziesz witryny z duplikatem. Zapewne będą to strony z unikatowym opisem,
- duplikacja w zewnętrznych serwisach – nie używaj treści ze strony w witrynach aukcyjnych czy w social media. Inaczej może się zdarzyć, że aukcja na Allegro czy wpis na Facebooku będą zajmować wyższe pozycje na daną frazę niż Twoja strona,
- Scrapery – strony, które automatycznie zbierają dane z sieci i je wykorzystują. Przeważnie ta forma duplikacji nie jest jednak groźna dla Twojej witryny.
Przyczyny duplikacji wewnętrznej:
- podstrona z tą samą zawartością dostępna pod różnymi adresami URL – przeważnie dochodzi do tego ze względu na błędną strukturę witryny,
- opis kategorii wyświetla się na wielu podstronach – ze względu na sortowanie/filtrowanie, w wyniku nieużycia rel=”canonical”,
- dodatkowe parametry w linkach, np. identyfikatory sesji czy też z tagami UTM,
- podstrony tagów, które wyświetlają wyłącznie część treści z jednego adresu URL,
- strona do druku – kiedy znajduje się pod innym adresem niż standardowy URL i nie jest wyłączone jej indeksowanie,
- strony dla załączników – wiele systemów CMS tworzy je dla plików graficznych. Zazwyczaj nie pokazują nic poza obrazem,
- komentarze podzielone na strony – tak powstaje kilka podstron z tą samą zawartością,
- nieprawidłowe wdrożenie certyfikatu SSL – problem wyniknie, jeśli nie przekierujesz strony z adresu w wersji z http:// na https://.
Metody wykrywania duplikacji treści
Duplicate content może być problemem, z którego istnienia nawet nie zdajesz sobie sprawy. Oczywiście, istnieją sposoby namierzania duplikacji treści. Z jakich narzędzi możesz skorzystać?
Siteliner
Znakomite narzędzie do analizy, czy na Twojej stronie występuje duplikacja wewnętrzna. Darmowa wersja sprawdza jedynie 250 podstron serwisu. Jeśli chcesz przeskanować wszystkie, potrzebujesz odpłatnej.
Copyscape
Za pomocą tego narzędzia sprawdzisz duplikację zewnętrzną i wewnętrzną. To jedno z najpopularniejszych tego typu rozwiązań.
Sitebulb
Narzędzie dobrze sobie radzi z identyfikowaniem zduplikowanych treści. Prezentuje przejrzysty raport.
Google Search Console
Po zalogowaniu się do GSC wybierz Indeksowanie -> Strony. Następnie sprawdź błędy, których przyczyną jest duplikat, wyszukiwarka Google wybrała inną stronę kanoniczną niż użytkownik.
Jak sobie radzić z duplikacją treści?
Możliwości są różne, ale wszystko zależy od tego, jaki występuje problem. Oto skuteczne rozwiązania:
- usuń duplikat – jeśli to taka sama treść, wystarczy ją skasować,
- Połącz artykuły – jeśli są podobnej treści, pozostaw ten, który zajmuje wyższe pozycje w Google i uzupełnij go o tę część, która jest wyłącznie w drugim artykule. Po wszystkim ustaw przekierowanie 301 na docelowy adres wpisu
- Zapewnij unikatowość – zmień treść tak, aby nie była kopią
- Dodaj linki kanoniczne – za ich pomocą wskazujesz, gdzie znajduje się oryginalny materiał. Google dzięki temu wie, który ma wyświetlać w wynikach
- Użyj przekierowania 301 tam, gdzie to konieczne, np. żeby ten sam URL nie był dostępny pod różnymi adresami
- Dodaj tag noindex w sekcji <head> – dzięki temu dany URL nie będzie indeksowany
- Poproś o usunięcie skopiowanej treści – jeśli bez Twojego pozwolenia znajduje się w innej witrynie.
Konsekwencje prawne i etyczne duplikacji treści
Każde wykorzystanie dzieła bez zgody jego twórcy jest niezgodne z prawem. Możesz dochodzić w takim przypadku odszkodowania. Poza tym może grozić nawet odpowiedzialność karna. Zgodnie z przepisem art. 115 ustawy o prawach autorskich i prawach pokrewnych za plagiat może być zasądzona nawet kara pozbawienia wolności do lat 3. W zależności od tego, czego dopuści się dana osoba, w grę wchodzi również odpowiedzialność m.in. za nielegalne utrwalenie utworu czy jego rozpowszechnianie bez pozwolenia.
Oczywiście, kopiowanie cudzej pracy jest nie tylko nielegalne, ale również nieetyczne.
Jakie znaczenie ma unikalna treść dla użytkowników i wyszukiwarek internetowych?
Wiesz już, czym jest duplikacja treści. Internauci przeszukują sieć w poszukiwaniu publikacji, które odpowiadają na ich zapytania. Nie chcą odwiedzić kilku adresów URL i pod każdym znaleźć dokładnie ten sam content. Jeśli tworzysz teksty, staraj się zapewniać treści unikatowe, odpowiadające na dane zapytanie. To ważne, jeśli zależy Ci na widoczności w Google. Wyszukiwarka nie zbanuje Twojej witryny za duplikację, ale kopie mogą się przyczynić do obniżenia widoczności Twojego serwisu. Dlatego twórz unikatowy content i eliminuj błędy, które powodują duplikację wewnętrzną lub zewnętrzną.