Duplicate Content Penalty er en myte

mars 10, 2009

I ”Google Quality Raters Handbok” går det tydelig frem at Google ikke liker innhold som er hentet fra andre nettsider. Dette henger sammen med at det gjør det vanskeligere å identifisere  ”orginalsider”. Eksempler de bruker er innhold som er hentet fra Wikipedia, DMOZ, RSS feeds etc.

Når det gjelder RSS feeds så betyr ikke det at du ikke kan hente og publisere RSS feeds fra andre. RSS feeds må bare ikke være det eneste du har. De må komme i tillegg til eget unikt innhold.

Google fjerner periodisk nettsider fra sin indeks som utelukkende er laget for å generere Adsense inntekter og som er automatisk kopiert fra andre nettsider ved hjelp av en teknikk som kalles “content scraping”. Skraping av innhold benyttes også for å stjele rangering og trafikk fra andre. Slike nettsidenr er bare ment for søkemotorenes rangeringsalgoritmer og innhold kan derfor presenteres som løpende råtekst. Allerede i januar 2001 fikk Google registrert et patent relatert til “Detecting duplicate and near-duplicate files”.

Ny tagg for Duplikatinnhold
Session ID og Tracking ID i handlekurver, affiliate ID i linker og utskriftsvennlige versjoner av sider er noen av de mange mulighetene vi har for å skape flere sider med samme innhold.

Når dette skjer risikerer du å få inngående linker til sider som ikke er orginalsider og dermed miste linkverdi til orginalsiden. Kunder kommer via en inngående link til sider som ikke er ment å være en ”landingsside”. Ofte vil ikke søkemotorene oppdage at du har duplikatsider og dermed indeksere og rangere dem uavhengig av hverandre. Om de oppdager at det er flere sider med identisk innhold kan de få problemer med å finne ut hvilken side som er orginalsiden.

De tre store søkemotorene, Google, Yahoo og Microsoft, har nå blitt enige om en løsning på dette problemet og har lansert en ny tag rel=”canonical”. Denne plasserer du i HEAD-seksjonen på sider som er duplikatsider:

<link rel=”canonical” href=”http://dittdomene.no/orginalside/”>

I href= delen av taggen spesifiserer du linken til den siden som er orginalsiden. Altså den siden som skal indekseres.

Denne taggen sørger også for at inngående linker til duplikatsiden blir kreditert orginalsiden. Men, det skjer ingen fysisk redirigering så brukerne blir ikke sendt videre til orginalsiden.

Rel=”canonical” taggen erstatter dermed bruk av robots.txt og 301 redirect.

Taggen virker bare når orginalsiden og duplikatsiden ligger på samme domene eller om den ene ligger på et subdomene av den andre. Ligger sidene på forskjellige domener må du fortsatt benytte 301 redirect.

Taggen virker bare for sider som er faktiske duplikater. Du kan altså ikke bruke den for å sende linkverdi fra mindre viktige sider til viktige sider når sidene ikke er duplikater.