Canonical Content aka Plagiointi ja hakukoneoptimointi

Canonical Content aka Plagiointi ja hakukoneoptimointi

Canonical Content aka Plagiointi ja hakukoneoptimointi

Tämä asia tuli vastaan silloin, kun pähkäilin kuinka Googlen hakukone tulkitsee saman tekstin, joka on käännetty eri kielille. 

Ongelma piilee siinä, että Googlen hakukone ei katso pelkkää yhden kielen tekstiä, mutta rinnastaa kyseisen sisällön kaikilla kielillä tarjolla olevaan sisältöön. Jos sisältö on identtinen, botti päättää, mikä niistä on alkuperäinen ja mikä kopio, ellei se ole määritelty linkin polussa: 

Canonical Content aka Plagiointi ja hakukoneoptimointi
WordPress antaa tagin automaattisesti alkuperäiselle sisällölle.

Milloin hakubotti voi tulkita sisällön duplikaatiksi?

1. Tarkoituksellinen plagiointi

Tämä on selvä tapaus. Tahallinen ja tarkoituksellinen kopioiminen, luvallinen tai luvaton. Tekstin pitää olla hyvin lähellä alkuperäistä, jota hakukone tulkitsee sen kopioksi. Tarkkoja prosenttilukuja Google ei julkisuuteen ilmoita. 

Ymmärtääkseni, asiat ovat näin:

  • muutaman sanan muunnelma silti voi päätyä plagiaatiksi;
  • oikein merkitty sitaatti ei ole plagiointi (tietysti sitaatin pitää olla aika pieni osa alkuperäistä tekstiä, eikä dominoiva kokonaisuus);
  • jakotyökaluja käyttämällä plaginointiongelmaa ei pääse syntymään, koska silloin työkalu itse osaa määritellä polun ja viitata alkuperäiseen tekstiin (jakotyökalut ovat esim. WP pluginit Press This, Add To Any ja yms).  

2. Vahinkoja sattuu

Tämä ei ole kovin harvinainen tapaus. Ongelmia identtisen sisällön kanssa voi syntyä monella eri tavalla. Korjaaminen tai välttäminen voi olla joissakin tapauksissa helppoa, ja toisissa – varsin vaikeaa. 

Tapaus 1. Nettikauppa

Tässä melkein identtisiä sivuja syntyy runsaasti sekä niiden välttäminen on vaikeahkoa. Saman tuotteen versioita voi olla useita eikä esim. eri väri pelasta tilannetta. Tässä tapauksessa voi kokeilla sellaisia kauppaohjelmistoja, jotka mahdollistavat monivalintavalikon samalla tuotesivulla. Tämä on se paikka, jossa kannattaa kysyä neuvoa ammattilaiselta.

Tapaus 2. Vapaa sisältö. Esimerkkinä Blogi

  1. Bloggaamisessa duplikaattisivu voi syntyä esim. silloin, kun samasta sivustosta on olemassa sekä pöytäkoneelle että mobiililaitteille tarkoitetut erilliset versiot. Tähän ongelmaan on kaksi ratkaisua:

    • voi määritellä jommankumman pääversioksi, eli antaa sille canonical tagin (rel=”canonical”);
    • voi käyttää mobiiliystävällistä teemaa, ettei erillistä versiota tarvita.

  1. Toinen syy, miksi duplikaattisisältöä syntyy, voi olla siinä, että samalla kirjoittajalla on useita blogia. Tähän ei auta muu kuin tarkkailla manuaalisesti, ettei sisältö ole täydellinen kopio aikaisemmin kirjoitetusta. 

  2. Kolmas kompastuskivi on samaa sisältöä olevat eri kieliset sivut. Siitä ei ole sataprosenttista varmuutta, kuinka paljon samanlaisia tai erilaisia sivut saavat olla ennen kuin Google rankaisee ne kopioiksi. Yleinen käsitys on se, että editoitu teksti, josta kielioppivirheet on korjattu pois, on jo käypää tavaraa. Itse olisin neuvonut korjaamaan myös tyylivirheet ja sanajärjestyksen. Yoastia käyttämällä tekstiä pystyy hiomaan kohdekielellä niin, että se on myös tyyliasultaan varsin pätevä. 

3. Miksi tämä asia on tärkeä hakukoneoptimoinnille?  

Googlen hakukone (en ole perehtynyt muiden hakukoneiden toimintatapoihin) rankaisee sisällön sen mukaan, miten se vastaa sille asetettuihin “hyvän käytännön”-kriteereihin. Siihen sisältyvät perus-SEO:n lisäksi sellaiset kriteerit kuin ainutlaatuisuus ja hyödyllisyys. Näissä hakukone arvioi, miten hyvin sisältö tyydyttää käyttäjän tarpeita vertaamalla hakusanojen ja artikkelin metatiedostojen vastaavuutta. 

Jos kyseisestä artikkelista on olemassa useita identtisiä samantasoisia (ei-merkittyjä) versioita, hakukone antaa vain yhdelle niistä täydet pisteet (eli tulkitsee sen päälähteeksi), ja dumppaa loput listan loppuun. Näin esiin voi tulla väärä tai ei-toivottu versio sivusta. 

Vielä epäonnisempi skenaario on joutua rangaistuksi plagioinnista, jolloin hakukone hetken mietinnän jälkeen, rankaisee kaikki versiot listan viimeiselle sivulle. Poissa silmistä, poissa mielestä. 

Canonical Content aka Plagiointi ja hakukoneoptimointi

PS Tämä artikkeli on yksinkertaistettu tarkoituksella yleissivistävälle tasolle. Syventävää lukemista on tässä:

Bloggaaminen: Tekniset – Teknisten osien yhteensovittaminen

Tekniset kompastuskivet

Olen SEOnnut – Hakukoneoptimointi bloggaamisessa 

WordPress hosting: WordPress Sivustot 

Consolidate Duplicate URLs with Canonicals | Google Search Central 

Ahrefs – Canonical Tags: A Simple Guide for Beginners

Canonical URLs: A Beginner‘s Guide to Canonical Tags in 2021

Canonical Content aka Plagiointi ja hakukoneoptimointi

Yksi vastaus artikkeliiin “Canonical Content aka Plagiointi ja hakukoneoptimointi

Vastaa