1 van de onderwerpen waar je aandacht aan moet besteden als je aan SEO doet, is duplicate content. Deze dubbele inhoud is niet alleen vervelend voor de bezoekers van je website, maar ook voor zoekmachines. Na het lezen van dit artikel weet je alles over gedupliceerde content, de verschillende soorten en hoe je het oplost.
We beginnen bij het begin met de betekenis van de term. Duplicate content houdt in dat dezelfde tekst en afbeeldingen op verschillende pagina’s is terug te vinden. Dat kan binnen je eigen site zijn, maar dat hoeft niet per se. Je spreekt ook van duplicate content als er bijvoorbeeld maar 1 paragraaf gekopieerd is van een andere pagina.
Als je je afvraagt hoe erg duplicate content is, dan hoeven we alleen maar even te kijken wat Google erover zegt. Het komt erop neer dat duplicate content nadelige invloed heeft op de positie van je pagina’s. Ze kunnen zelfs volledig verwijderd worden uit de index, zodat ze überhaupt niet meer in de zoekresultaten staan.
De soep wordt gelukkig niet zo heet gegeten als hij wordt opgediend, want duplicate content is op zichzelf geen reden voor zo’n zware straf. Alleen websites die bewust de zoekresultaten proberen te beïnvloeden door content van andere websites te kopiëren, worden bestraft.
Hoewel je niet direct bestraft wordt door Google voor duplicate content, is het niet goed voor je vindbaarheid in zoekmachines:
Duplicate content is trouwens niet altijd een gekopieerde tekst. Er zijn verschillende soorten.
Naast letterlijk gekopieerde pagina’s kan duplicate content ook per ongeluk ontstaan, bijvoorbeeld door technische instellingen van je websites.
Soms maakt je website of jijzelf onbedoeld duplicate content door variaties op je standaard URL. We zien bijvoorbeeld vaak:
Als je hier niet bewust mee bezig bent, kun je zomaar 5 varianten van een pagina hebben.
Ook pagina’s waarbij de verschillen in content te klein zijn, kunnen aangemerkt worden als duplicate content. Dat zie je onder andere bij:
Stelen is niet netjes. Het stelen van content dus ook niet. Hoewel dat helaas wel eens gebeurt, kan het ook ‘per ongeluk’ zijn dat dezelfde tekst op verschillende websites terugkomt:
Zeker met grotere sites is het een niet eenvoudig om te checken of je duplicate content hebt. Gelukkig zijn er verschillende methodes om het op te sporen:
DeepCrawl is een tool om een uitgebreide technische check van je website te doen, en kan ook duplicate content opsporen. Je kunt vervolgen zien welke pagina’s als eerste aangepakt moeten worden. Het mooie van deze tool is dat het niet alleen de technische kant ziet, maar ook de inhoud meepakt.
Met httpstatus.io ontdek je snel of er duplicate content is door variaties in je URL. Je vult alle varianten van de URL die je wilt checken in, en in het resultaat zie je de bijbehorende statuscodes. Als alles goed is, zie je 1 URL met 200 als code, de rest moet een code 301 laten zien. Dit betekent dat al het verkeer van de varianten worden doorgestuurd naar de standaard URL.
Met Copyscape zie je of iemand anders de content op jouw website hergebruikt. Vul de URL van je pagina in, en de tool checkt of dezelfde content ergens anders wordt aangeboden.
Siteliner is een simpele tool om duplicate content op te sporen. Wat erg prettig is, is dat je een voorbeeld van je pagina ziet waarop alle duplicate content is gearceerd. Het is wel belangrijk hier nog even goed naar te kijken, want Siteliner is soms wat ongenuanceerd. Zo kan het zijn dat je contactformulier, dat op meerdere pagina’s staat, als duplicate content aangemerkt wordt.
Of Google jouw content als duplicate content ziet, ontdek je in Google Search Console. Na het inloggen klik je op ‘Dekking’, vervolgens op ‘Uitgesloten’. Hier zie je of er pagina’s niet zijn geïndexeerd en wat de reden daarvan is. Soms is dat duplicate content.
Nu je weet welke soorten duplicate content er zijn en hoe je ze kunt vinden, wil je natuurlijk weten hoe je het probleem van duplicate content oplost. Dat verschilt per soort, laten we daar eerst nog even naar kijken:
Duplicate content die door technische instellingen ontstaat, los je op met een zogenaamde 301-redirect of de canonical tag. Welke oplossing het meest geschikt is, hangt af van de instelling die de duplicate content veroorzaakt.
Variaties in je URL’s komen vaak voor, maar er is altijd 1 standaard URL. Met de 301-redirect laat je aan Google zien welke URL dat is. Komt Google een duplicate pagina tegen met een 301, dan laat hij de standaard URL aan je bezoeker zien. De meeste linkwaarde gaat er ook naartoe. Wij hebben deze 301-redirects ingesteld:
Gebruiken we expres een URL die niet standaard is, dan zie je dankzij Ayima direct wat er gebeurt. Ayima is een handige extensie voor Google Chrome om redirects te checken. Je kunt voor bijna alle uitzonderingen een 301-redirect instellen. Overleg met je webbouwer of dit standaard ingericht kan worden, zodat je niet bij elke nieuwe pagina handmatig allerlei redirects moet instellen. Let ook op je interne linkstructuur, zodat je niet naar een URL met ‘www’ verwijst als dat niet de standaard is.
Als je filters, trackingcodes of paginering op je webpagina’s gebruikt, dan zorgen de bijbehorende parameters voor heel veel URL’s en zorgen. Je herkent de parameter aan de ‘?’ in jouw URL. Daarachter staat een stuk code. Met de canonical tag laat je aan Google zien dat de pagina met parameters een kopie is van de originele pagina.
De URL zonder parameters zet je in de ‘<head>’ van je pagina, waarbij je verwijst naar het deel voor het vraagteken. Bijvoorbeeld zo:
‘<link rel=”canonical” href=”https://www.sportswearonline.nl/schaatsen/dames/schaatsjacks/>’
Filter ik vervolgens op een jack dat geschikt is voor schaatsen bij hele lage temperaturen, dan ziet de URL er zo uit:
https://www.sportswearonline.nl/schaatsen/dames/sc…&max=150&min=0&brand=0&filter%5B%5D=20847
Omdat je de originele URL in de header hebt staan, weten zoekmachines wat de originele pagina is.
Je kunt de canonical tag ook gebruiken als een productpagina in een aantal categorieën terugkomt. In dit voorbeeld is het sportshirt ‘zoeff’ geschikt voor hardlopen, fietsen en fitness. Daarom zijn er 3 pagina’s voor hetzelfde shirt:
De linkwaarde van de productpagina is het meest waardevol voor de categorie ‘hardlopen’. Daarom plaatsen we onder ‘fietsen’ en ‘fitness’ deze canonical tag:
‘<link rel=”canonical” href=”https://onze-website/hardlopen/zoeff/>’
Heb je pagina’s die te veel op elkaar lijken, maar heb je ze wel allemaal nodig? Geen probleem, er zijn verschillende oplossingen.
Heb je veel vergelijkbare pagina’s nodig, dan kan het de moeite waard zijn om een aantal pagina’s door iemand anders te laten schrijven. Zelf zit je namelijk al snel vast in dezelfde formuleringen. Een copywriter of collega met ervaring kan er weer iets heel nieuws van maken.
Een andere optie is het samenvoegen van pagina’s met content die bijna identiek is. Geef je bijvoorbeeld een SEO-training op 2 verschillende dagen met 2 verschillende thema’s? Maak dan 1 pagina, waarbij je de verschillende thema’s in een eigen alinea beschrijft. Als je zo’n pagina hebt, verwijder ‘m dan nooit: hij behoudt z’n linkwaarde ook als je even geen trainingen geeft.
Misschien niet de beste, maar wel een hele praktische methode is het mixen van een aantal alinea’s. Stel dat je 100 pagina’s over jouw dienstverlening in plaatsen in de buurt wilt hebben. Je kunt dan 15 verschillende alinea’s schrijven en deze steeds anders combineren.
Gebruik deze methode nooit op zichzelf, dan is de kans groot dat het alsnog als duplicate content aangemerkt wordt. Kies daarom ook altijd 1 van de andere methodes.
Verkoop je producten die op elkaar lijken, maar wel een eigen pagina verdienen? Dan kun je de tekst nog vanuit een andere invalshoek schrijven. Speel met opsommingen, veelgestelde vragen en beschrijvingen om toch een unieke pagina te maken. Bijvoorbeeld zo, als je 2 soorten grasmaaiers verkoopt. Het enige verschil is het vermogen en dus de prijs.
Voor de Harry 1 kies je voor veelgestelde vragen, voor Harry 2 voor een beschrijving.
Variant 1 – veelgestelde vragen
> Hoeveel past er in de opvangbak?
De opvangbak van Harry 1 is 20 liter.
> Wat zijn de voordelen van deze grasmaaier?
Klein maar krachtig
Gras belandt direct in de opvangbak
Maaihoogte instelbaar
> Wat is de maximale gazongrootte?
Je maait met deze grasmaaier gazons tot ongeveer 100m2.
Variant 2 – beschrijving
De kleine maar stoere Harry 2 is een grasmaaier waar je u tegen zegt. Een gazon tot wel 100m2 is zo gemaaid, en het gras wordt opgevangen in de opvangbak van 20 liter. Nooit meer harken! Daarnaast is de maaihoogte in te stellen en past hij dankzij het compacte ontwerp in elke garage.
Is de tekst waar je zo hard aan hebt gewerkt ook op andere websites terechtgekomen? Dan kun je de volgende oplossingen gebruiken.
Heb je het idee dat iemand doelbewust je content heeft overgenomen? Dan kun je kiezen:
Wil je zelf een artikel delen op een extern platform? Dan kun je een canonical tag gebruiken om aan te geven wat je originele pagina is. Vraag de eigenaar van het platform om een link naar jouw website.
Veel webshops gebruiken de productinformatie van de fabrikant als beschrijving op hun website. Zo kan dezelfde beschrijving bij meerdere webshops terugkomen, waardoor er problemen met duplicate content kunnen ontstaan. Als het even kan, is het daarom slim om de aangeleverde productinformatie te herschrijven. Moet je verplicht de productinfo van de fabrikant gebruiken, vul de tekst dan aan met je eigen tekst. Door een concrete situatie voor het gebruik van het product te beschrijven, bijvoorbeeld. Een andere goede manier is om productreviews toe te voegen. Dit zorgt niet alleen voor unieke content op een productpagina, maar verbetert ook de conversie.
Stel dat je boeken verkoopt, dan ligt het voor de hand om de productinformatie, vaak een korte samenvatting, over te nemen van de uitgever. Je kunt daar content aan toevoegen die zowel een review bevat en een concrete situatie beschrijft:
Wat vindt onze leesclub?
‘Het laatste dagboek van Hendrik Groen’ is het perfecte boek voor een sombere winterdag. In je favoriete stoel met een lekkere kop thee zul je de pagina’s verslinden. Herkenbare situaties, boordevol humor en gevoelige momenten zorgen ervoor dat het derde deel uit de reeks niet onder doet voor deel 1 en 2. Het enige nadeel? Het is helaas het allerlaatste deel uit deze serie.
Duplicate content is belangrijk genoeg om mee aan de slag te gaan. Het verbetert je positie in de zoekresultaten en de gebruikerservaring van je bezoekers. Je weet nu wat duplicate content is en hoe je het kunt oplossen. Heb je hulp nodig, klop dan even bij ons aan.
Deze blogpost is geschreven door Ineke Withaar is SEO Specialist bij Onder.nl
[Fotocredits heroimage © khalid_spk – Adobe Stock]