Ai avut vreodata in vedere continutul duplicat de pe site-ul tau? Acest content poate fi intalnit in descrierea unui produs, descriere ce ai luat-o de la producatorul acelui produs, sau poate fi vorba despre un citat de pe internet, ori la prezentarea unui serviciu in website. Indiferent cat de mult vei incerca sa oferi un text unic, nu vei reusi 100%. Sa ai un content copiat reprezinta una dintre 5 probleme mari SEO.
Desigur, nu poti sterge absolut toate fragmentele duplicate de content de pe site-ul tau, mai ales daca ai unul complex. Matt Cutts este un specialist Google care spune ca acel continut se afla peste tot in mediul online. Ba chiar mai mult, in aproximativ 25-30% din internet.
Chiar daca Google nu penalizeaza site-urile care au continut plagiat, totusi le descurajeaza, afisandu-le mai jos in rezultatele cautarii – o problema destul de mare. Avantajul este ca imediat dupa ce rescrii textele copiate cu continut original, poti sa urci in rezultatele Google. Hai sa vedem cum se pot rezolva problemele pe care acest continut clonat le creeaza in site-ul tau.
Ce este continutul duplicat?
Google spune despre acest continut ca este un bloc de text care se poate regasi in acelasi domeniu web, sau chiar in mai multe, intr-o forma identica sau asemanatoare majoritar. Astfel, ne dam seama ca Google identifica doua tipuri mari de continut duplicat: cel din domenii diferite si cel din acelasi domeniu. Cea mai complicata parte este atunci cand vine vorba despre creare site, deoarece SEO este o parte complexa, de luat in considerare daca iti doresti rezultate favorabile.
Pentru mai mult detalii, ne poti contacta pe email.
Instante de continut duplicat pe acelasi domeniu
Acest tip de cuprins clonat se desfasoara in cadrul unui site.
- Continutul acesta este prezent in diferite locatii pe site-ul tau (URL)
- Poate fi accesibil prin diverse cai (URL-uri diferite)
Exemple:
Continut boilerplate (adica din anumite template-uri sau platforme pe care s-a lucrat):
Continutul este disponibil pe unele sabloane in diferite pagini de pe site sau sectiuni.
Daca te vei uita la un anumit site standar, acesta are de obicei un subsol, un antent si o bara laterala.
Cand robotii de cautare iti vor analiza site-ul, ei vor obseva ca acest continut e prezent de mai multe ori.
Totusi, acest tip de continut duplicat nu face rau SEO. Robotii sunt destul de sofisticati pentru a intelege faptul ca suprapunerea nu este deloc rau intentionata. Asadar, tu esti in siguranta.
Structuri URL neredirectionate:
Privește URL-urile de mai jos:
- http://yoursite.com
- http://www.yoursite.com
- https://yoursite.com
- https://www.yoursite.com
Sunt aproape identice, nu?
Cu siguranta sunt identice pentru tine, insa robotii Google nu inteleg la fel. Pentru ei, sunt URL-uri diferite, atunci cand vad acelasi content pe 2 sau pe mai multe link-uri de acest gen, le considera plagiate.
Domenii localizate:
Sa spunem ca postezi in tari diferite si ai creat domenii localizate pentru fiecare tara in parte.
De exemplu, e posibil sa ai o versiune a site-ului tau pentru Germania si o versiune pentru Austria. Este normal ca acest content sa se suprapuna pe ambele site-uri. Atunci cand cineva cauta afacerea ta, Google ii va afisa oricare din adrese URL.
Astfel, Google observa locatia celui care cauta.
Instante de continut duplicat pe domenii diferite:
Copierea continutului de pe un site, fara permisiune, reprezinta un lucru gresit iar Google considera la fel. Daca nu oferi decat un continut duplicat, site-ul tau va avea de suferit. Google nu va afisa in rezultate site-ul tau in primele pagini.
Sindicalizarea de content
Sindicalizarea, preluarea de content sau produse prin RSS reprezinta procesul de a cauta povesti relevante pentru cititori. Povestirile acestea s-ar putea afla oriunde in mediul online.
Daca vei oferi o noua perspectiva si vei explica lucrurile intr-un stil propriu, Google nu va vedea dublarea aceasta rau intentionata.
Totusi, valoarea optima nu ar trebui sa depaseasca 10%.
Asa cum se spune in Search Enige Land: “sindicalizarea de content este procesul de a impinge blog-ul, site-ul sau video in afara site-urilor a terte parti, ca un articol complet, fragment, link-ul sau miniatura.”
Schita asemanatoare este de fiecare data o zona gri atunci cand vorbim despre problemele despre text clonat.
Wikipedia defineste schita de content ca o tehnica de software de calculator de extragere a informatiilor din site-uri.
Dupa cum poti vedea, Google aduce continutul de la rezultatele de top si le arata in primele pagini. Aceasta tehnica este tot o schita de content. Astfel, nu este in regula sa desconsideri schitele de content, deoarece nu sunt tot timpul negative. Totusi, daca vei sapa putin mai adanc, vei observa faptul ca Google nu tolereaza site-urile care au numai schite din continutul altora, astfel partea de seo fiind folosita eronat si afectand siteul.
Ce nu se pune ca si continut duplicat:
Continutul tradus:
Continutul tradus nu este considerat duplicat. Daca ai un site in mai multe tari, poti avea acelasi text tradus pentru fiecare in parte. Ai grija totusi, daca vei folosi un software de traducere, nu vei avea prea mult succes iar traducerea nu va fi perfecta. Daca Google observa ca traducerile nu par deloc naturale in limba pe care o traduci, poate considera aceste traduceri drept spam. Un asemeneatext poate fi foarte usor de identificat si poate atrage atentia intr-un mod negativ asupra site-ului tau. Cel mai simplu mod de a evita aceasta problema este sa apelezi la un translator.
Continutul pentru varianta mobila:
Daca nu ai un site responsive, e posibil sa ai un alt site in versiunea mobila pentru dispozitivele mobile. Astfel, va fi acelasi lucru pe 2 URL-uri.
https://yoursite.com – Web version
https://m.yoursite.com – Mobile version
Daca ai acelasi text pe ambele site-uri, nu este nicio problema, deoarece Google utilizeaza acelasi tip de roboti pentru cautarile mobile si va identifica un cuprins clonat doar daca acesta este facut cu rea intentie.
Problema #1 – popularitate in scadere pentru link-ul tau
Seteaza un singur tip de link deoarece multe versiuni ale aceluiasi link duc la dizolvarea popularitatii. Ca sa intelegi mai bine, imagineaza-ti ca ai un content extraordinar si ai reusit sa aduci foarte multe accesari site-ului tau. Cu toate acestea, cifrele nu au crescut pe cat te asteptai. De ce? Poate pentru ca s-au folosit diverse versiuni ale link-ului tau, divizand popularitatea in cateva bucati.
- http://www.yoursite.com/resource
- http://yoursite.com/resource
- https://yoursite.com/resource
Google nu poate cumula aceste link-uri catre un singur site.
Duplicat este cea mai des intalnita problema in mediul online. In procesul de optimizare SEO, exista foarte multe reguli iar fiecare webmaster in parte va trebui sa le respecte.
Rel canonical reprezinta un element HTML, care face parte din zona header a unei pagini web. Cu ajutorul acestui rel canonical, motorul de cautare va identifica continuturile duplicate fara a le penaliza.
Problema #2 – URL-url non SEF (neprietenoase cu motoarele de cautare) sau nerescrise
Daca Google intalneste doua surse identice sau asemanatoare pe web, va alege sa arate doar una din ele. De cele mai multe ori, va alege versiunea cea mai potrivita pentru a fi aratata, dar asta nu se intampla mereu. Aici intra link-uri de genul http://yoursite.com/index.php?ro=1&prod_s=2&fil=5 Nu se regaseste nici un cuvant cheie clar care sa spuna motorului de cautare ce va gasi in acea pagina ca sa o poata indexa corect.
Problema # 3 – cautari disfunctionale
Daca intelegi cum functioneaza un crawler, stii faptul ca Google trimite roboti de cautare sa acceseze cu crawlerele sale, site-ul tau web , in functie de frecventa de publicare a continutului in mediul online. Desigur, se poate verifica incepand de la un simplu click, vazand apoi diverse pagini cu continutul duplicat.
Imagineaza-ti, crawlerele Google iti viziteaza site-ul web si acceseaza cinci adrese URL, doar pentru a gasi acelasi pagini ca un cuprins duplicat este in mediul online.
Atunci cand robotii de cautare observa si identifica acelasi text pe diferite locuri, vei pierde din incredere, si vei fi plasat cat mai jos in rezultatele cautarilor.
Cum gestioneaza Google acest content duplicat
Atunci cand Google gaseste instante identice, acesta decide sa arate una dintre ele. Alegerea resursei pe care sa o afiseze in rezultatele de cautare depinde de interogarea de cautare.
Daca ai acelasi continut si oferi versiunea de imprimare, Google va lua in considerare versiunea de imprimare. Astfel, doar versiunea de imprimare va putea fi preluata si prezentata.
Google ia in serios duplicarea de content si poate sa iti penalizeze site-ul sau pagini cu probleme din el.
Clasamentul site-ului tau poate avea de suferit, sau chiar poate fi eliminat complet din indexul Google.
Foarte des, aceste cazuri de content clonat se intampla intr-un mod neintentionat. De asemenea, este posibil ca diverse site-uri sa copieze sau sa republice continutul tau fara permisiunea ta. Exista diverse modalitati prin care poti verifica site-ul pentru astfel de probleme.
Cum sa identifici problemele de continut duplicat
Metoda # 1: Efectueaza o simpla cautare
Cel mai simplu mod de a detecta problemele de continut duplicat pe site-ul tau este de a face o simpla cautare.
O cautare cu un simplu cuvant cheie pe care il utilizezi. Daca observi ca afiseaza o adresa URL non-user-friendly a continutului, atunci ai un text clonat pe site.
Metoda # 2: Cautare pentru alerte in Google webmaster
Consola de cautare Google, de asemenea, va avertizeaza cu privire la aceste cazuri.
Pentru a le gasi, conecteaza-te la Google webmaster.
Metoda 3: consulta crawlerul din tabloul de bord Pentru webmasteri
Crawlerul arata numarul de pagini – Crawlerele Google le gasesc pe site.
Daca observi accesarea cu crawlere si indexarea a sute de pagini pe site-ul tau in timp ce tu ai doar cateva, probabil utilizezi URL-uri incompatibile. Prin urmare, crawlerele motorului de cautare analizeaza acelasi continut de mai multe ori..
Daca observi o activitate neobisnuit de mare, ar trebui sa verifici structura URL-urilor, pentru a vedea daca site-ul utilizeaza adrese URL incompatibile.
Metoda 4: Screaming Frog
Screaming Frog este un instrument de audit pentru desktop SEO care acceseaza cu crawlere site-ul. Poti vedea mai multe probleme.
Solutii pentru tratarea problemei de continut duplicat
- Coerenta
Majoritatea acestor cazuri se intampla atunci cand structura URL-ului nu este incompatibila.
Cea mai buna solutie este de a standardiza structura link-ului preferat. Poate fi www sau HTTP, ori HTTPS, oricare ar fi, ideea este sa fie coerenta.
Setarea unui domeniu preferat iti va ajuta site-ul sa retina link-ul.
Dupa setarea domeniului tau preferat in Instrumentele Google webmaster, urmatorul pas ar trebui sa fie cel de a face redirectionari din link-urile de domenii de baza non-preferate, pe site-ul tau la cele preferate. Lucrul acesta va ajuta motoarele de cautare dar si vizitatorii sa vada versiunea preferata.
- Canonizare
Majoritatea CMS-urilor iti vor permite sa organizezi continutul, utilizand categorii si tag-uri.
De multe ori, atunci cand utilizatorii folosesc tag-uri sau cautari bazate pe categorii, vor primi acelasi rezultat. Ca rezultat, robotii motoarelor de cautare ar putea crede ca adresele URL ofera acelasi continut.
http://www.yoursite.com/some-category
si
http://www.yoursite.com/some-tag
Este adevarat ca tag-urile, categoriile, casetele si filtrele pentru cautare te ajuta sa iti organizezi continutul si sa il faci mai accesibil.
Insa dupa cum poti observa, cautarile acestea vor avea ca rezultat cateva URL-uri si vor cauza unele probleme.
Pentru a evita aceste probleme, Google recomanda sa adaugi o eticheta canonica la URL-ul preferat al continutului tau.
Canonizarile pot fi implementate in diverse moduri:
Metoda 1: Seteaza versiunea preferata: www si non-www
Setarea vesiunii preferate a domeniului, asa cum ai vazut mai sus, este o forma de canonizare.
Ea abordeaza o problema foarte larga si nu se ocupa cu problemele legate de continutul duplicat care genereaza CMS.
Metoda 2: Punct manual la legatura canonica pentru toate paginile
Resursa originala este pagina ce doresti sa o pui la dispozitia cititorilor, de fiecare data cand cauta.
Resursa originala este, deasemenea, pagina pe care doresti sa o setezi ca pagina preferata.
Utilizeaza metodele enumerate mai sus. Identifica paginile care ofera continutul similar si alege o resursa originala pentru fiecare.
Acum esti pregatit sa utilizezi tag-ul canonic. Ca sa faci acest lucru, trebuie sa accesezi un source-code al resursei tale iar in sectiunea <head> tag, adauga:
<link rel=”canonical” href=”https://yoursite.com.com/category/resource” />
Aceasta va fi sursa ta originala. Fa aceeasi pasi pentru toate paginile similare.
Daca site-ul tau este construit pe WordPress, iti recomand sa instalezi Yoast SEO plug-in. Poti gasi aceasta optiune sub setarile avansate plug-in.
Metoda 3: Configurarea 301 redirect
De cele mai multe ori, restructurarea site-urilor are ca rezultat problemele legate de continutul duplicat. Restructurarea unui format prea similar poate sa creeze mai multe copii.
Pentru a reduce aceste probleme, instaleaza 301 redirect. Redirectionarile din adresele URL reprezinta o modalitate foarte buna de a alerta motoarele de cautare cu privire la preferintele tale.
Atunci cand un robot verifica o pagina si vede redirectionare 301, ajunge la resursa originala prin intermediul paginii. In cazurile acestea, toate link-urile catre pagina de duplicat sunt tratate ca link-uri catre pagina originala.
- Meta tag-ul noindex
Meta tag-urile sunt o modalitate pentru webmasteri pentru a oferi motoarelor de cautare, informatii importante cu privire la site-urile lor.
Oamenii confunda de cele mai multe ori tag-ul meta noindex cu meta tag-ul nofollow. Diferenta dintre ele este ca, atunci cand utilizezi Noindex si tag-ul nofollow, ceri motoarelor de cautare sa nu indexeze.
- Foloseste tagul hreflag pentru a administra localizarea site-ului
Atunci cand utilizezi un text tradus, ar trebui sa utilizezi tag-ul Hreflang pentru a ajuta motoarele de cautare sa inteleaga versiunea corecta a continutului tau. Daca site-ul tau este in limba engleza si tu l-ai tradus in limba spaniola pentru a servi publicului local, ar fi bine sa adaugi tag-ul, “<link rel =” alternativa “href =” http://example.com “hreflang =” en- es “/>” la versiunea spaniola a site-ului.
Ar trebui sa urmezi acelasi proces pentru toate versiunile diferite ale site-ului tau.
Cum sa nu repari continutul duplicat
Continutul duplicat apare tot timpul. Daca ai gasit astfel de probleme, trebuie sa le rezolvi. Ti-am aratat diverse moduri de a face acest lucru.
- Nu blocati adresele URL cu robots.txt
Robots.txt este un fisier text care are mesajele ce doresti sa le comunici crawlerelor motorului de cautare. Mesajele acestea pot solicita ca aceste crawlerele sa nu indexeze adresele URL specificate.
Unii webmasteri specifica adresele URL care au continutul duplicat in fisierele Robot.txt, si astfel incearca sa blocheze motoarele de cautare.
Google descurajeaza aceste practici care blocheaza crawlerele. Este important sa ai o optimizare seo, o promovare site organica, in asa fel incat sa cresti natural. Se poate acest lucru in online. Continutul duplicat este cea mai intalnita problema in mediul online.
- Nu invarti (sau reformula) continutul pentru a-l face “unic”
Robotii Google pot vedea daca continutul este filat sau generat de soft. Asa ca aceasta reformulare nu va ajuta.
2 Nu utilizati optiunea din Google Pentru webmasteri ” elimina URL”
Google webmasters ofera optiunea de a elimina adresele URL.
Astfel, multi webmasteri aleg o versiune non-friendly a resurselor, care sa apara in rezultatele cautarilor folosind optiunea – remove url.
Problema cu aceasta solutie este ca acele URL-uri sunt indepartate doar temporar. Iar site-ul tau se va confrunta in continuare cu aceste probleme.
Aceasta nu este o solutie, este doar o caracteristica utila cand doresti sa faci cateva modificari rapide.
Concluzie
Cele mai multe probleme de continut duplicat pot fi rezolvate sau evitate. Procesul de penalizare google panda continua impotriva site-urilor care incalca regulile de buna etica SEO.