Ho expliquem recentment amb el llançament de Google Search Essentials. Google està treballant per a ser més transparent amb tota la documentació que afecta el SEO en el seu motor de cerca. En aquest cas presenta una nova guia per a entendre els sistemes que usen per obtenir les posicions de cerques, els rànquing a les SERP. Ho han anunciant a través del seu blog per a SEO.
Aquesta guia sobre els rànquings de Google, ara com ara només publicada en anglès, aporta poques novetats respecte al que ja sabíem els Seus que seguim de prop als algorismes de Google. No obstant això, per primera vegada obtenim tota aquesta informació unificada, molt ben ordenada i explicada de forma molt pedagògica.
A la guia Google ens explica que utilitzen “sistemes de classificació automatitzats” que analitzen molts factors de les nostres pàgines web, i els usen per a presentar “els resultats més rellevants i útils”, tot en una fracció de segon. Realment en aquesta primera frase ja tenim el més essencial si volem fer SEO: plantejar-nos què serà el contingut més rellevant i útil per als meus clients i les seves intencions de cerca.
En segon lloc, Google confirma que realitzen proves i ajustos constants en tots aquests sistemes de rànquing, i que només a vegades notifiquen sobre aquestes actualitzacions, “quan poden ser útils per als creadors de contingut i altres”. Ja hem parlat en altres ocasions sobre com a vegades hi ha actualitzacions importants que no es comuniquen, i en canvi unes altres que no nomenarem, que s'anuncien a so de bombo i platerets perquè tinguin impacte en els creadors de contingut, però no obstant això no alteren pràcticament res els resultats.
No és casualitat que sigui el primer en nomenar a la guia. Les representacions de codificador bidireccional dels transformadors (BERT, Albert en català) és un sistema d'IA que usa Google per a intentar comprendre com les combinacions de paraules expressen diferents significats i intencions. Si realitzeu una prova veureu com canviant una sola paraula, matís o fins i tot una lletra en la nostra cerca, ens donarà resultats diferents. No obstant això el mateix Google reconeix que estan treballant en millores i que encara no abasta a totes les cerques.
Sí ens ha sorprès aquesta segona posició, potser és temporal. Google ha desenvolupat sistemes per a brindar informació útil i oportuna durant temps de crisi, ja sigui que es tracti de situacions de crisis personals, desastres naturals o altres situacions de crisis generalitzades. Ho hem vist recentment en casos com la COVID o la guerra d'Ucraïna. Els dos supòsits que Google comenta en el seu guia són:
Les aranyes a Google poden trobar milers, o fins i tot milions de pàgines web coincidents. Alguns d'aquests resultats poden ser molt similars entre si. En tals casos, els nostres sistemes mostren només els resultats més rellevants per a evitar duplicacions inútils. Cobra importància perquè el valor del contingut original, i devalua aquestes notes de premsa que màgicament es publiquen de manera idèntica i simultània en desenes de mitjans.
Una novetat molt important en aquest punt que ens aporta la guia, és que reconeix que la deduplicació també ocorre amb fragments destacats. Si una llista de pàgines web s'eleva per a convertir-se en un fragment destacat, no s'hauria de repetir la llista més endavant en la primera pàgina de resultats. Això ordena els resultats i ajuda a les persones a localitzar la informació rellevant més fàcilment.
Els sistemes de classificació de Google consideren les paraules dels noms de domini com un dels molts factors per determinar si el contingut és rellevant per a una cerca. Els EDM (Exact Match Domain) mai han passat del tot de moda, però s'agraeix aquest reconeixement tan explícit. Però ull, al seu torn Google explica que els seus sistema identifica webs que han estat creades explícitament per a això, i ho pondera amb altres sistemes de filtre i control. Perquè tampoc ens emboliquem a fer webs com a xurros per cobrir cerques longtail.
Google comenta que tenen un sistema “per a mostrar contingut més actualitzat per a consultes on s'esperaria”. La clau està en això últim, en quin tipus de cerques considerarà que la data de publicació o actualització és clau perquè un contingut sigui útil. Però en qualsevol cas, per a tot allò que sigui d'actualitat els resultats premiaran els resultats més recents, i en la resta serà un factor més a tenir en compte. De totes maneres el freshness ha arribat per a quedar-se i és obligada una revisió periòdica dels nostres continguts, a més de combinar-ho amb contingut nou 100%.
Google torna a fer èmfasi en el que ells denominen “contingut útil”, aquell creat per persones i per a persones. Diuen que aquests continguts es prioritzaran en els resultats de cerca, en lloc de contingut creat principalment per a obtenir trànsit de motors de cerca. Aquest punt l'abordem a fons en nostre post sobre el Helpful Content Update.
Fixem-nos que Google tracta abans aspectes de contingut que els enllaços. La companyia confirma que tenen “sistemes que entenen com les pàgines es vinculen entre si com una manera de determinar de quines pàgines tracten i quins poden ser més útils en resposta a una consulta”. I esmenta el famós PageRank com un dels principals sistemes que usa, és curiós perquè fa anys que no existeix segons alguns gurus SEO.
Aquests sistemes funcionen per identificar i mostrar fonts locals de notícies sempre que sigui rellevant, com a través de features com a "Històries destacades" i "Notícies locals". Això passa en pràcticament tots els continguts de les SERP, també els de web, esdeveniments o mapes.
El Model Unificat multitasca (MUM) és un sistema d'IA capaç de comprendre i generar llenguatge. Google afirma que “actualment no s'usa per a la classificació general en la Cerca, sinó per a algunes aplicacions específiques, com millorar les cerques d'informació sobre la vacuna COVID-19 i per a millorar les crides de fragments destacats que vam mostrar”. De totes formes caldrà estar alerta i donar-li molta manyaga a les nostres dades estructurades, és una cosa que venim repetint en altres posts i que cada vegada gaudeix de més importància.
L'aparellament o coincidència neuronal és un sistema d'intel·ligència artificial que utilitza Google per comprendre les representacions de conceptes en consultes i pàgines i relacionar-los entre si. Recorda que per molt intel·ligent que sigui sempre el podem ajudar a identificar els elements amb el seu title, ALT i altres.
Google confirma que compta amb “sistemes per ajudar a garantir que vam mostrar el contingut original de manera destacada en els resultats de cerca, inclosos els informes originals, per davant d'aquells que simplement ho citen”. Això no significa que no puguem citar informes o notícies, com estem fent en aquest post. El que sí que és rellevant és que a més de citar la font aportem valor: donant context, compartint la nostra opinió, incloent-hi exemples i experiències relacionades, etcètera. Però el contingut duplicat pot ser entre llocs o dins d'un mateix lloc: Google recomana explícitament que usem les etiquetes canòniques, per a ajudar les aranyes a “comprendre millor quina és la pàgina principal si una pàgina s'ha duplicat en diversos llocs”. Això és una cosa molt habitual en llocs grans que usin cercadors o filtres, entre altres.
Google té polítiques que permeten l'eliminació d'uns certs tipus de contingut. La majoria d'ells tenen relació amb el plagi, la pirateria o temàtiques que fereixin la sensibilitat. Es contemplen bàsicament dos supòsits:
Els usuaris prefereixen llocs que ofereixen una gran experiència de pàgina. És per això que compten amb un sistema d'experiència de pàgina que avalua una varietat de criteris, com la rapidesa amb la qual es carreguen les pàgines, la compatibilitat amb dispositius mòbils, si les pàgines manquen d'intersticials intrusius i si les pàgines es publiquen de manera segura. Ull, Google confirma que no és factor de posicionament per si sol PERÒ “en situacions en les quals hi ha moltes coincidències possibles amb una rellevància relativament igual, el sistema ajuda a donar preferència al contingut amb una millor experiència de pàgina”. Les optimitzacions dels Core Web Vitals i altres han de ser part fonamental del nostre treball SEO, si bé abans s'han d'haver atacat bé aspectes estratègics, de contingut i tècnics.
La classificació de passatges és un sistema d'intel·ligència artificial (IA) que utilitzen per a identificar seccions individuals o "passatges" d'una pàgina web. Això vol dir que a vegades no ens posicionaran pel tema principal d'un contingut per una determinada cerca, sinó que ens destacarà i portar a la part on s'aborda una qüestió concreta, la que consulta l'usuari. Per poder treure partit és molt important que estructurem bé els nostres continguts mitjançant encapçalats que jerarquitzin el contingut (h2, h3, h4…), i en el cas de comptar amb continguts extensos com aquest, podem usar sistemes d'accés als apartats com les TOC (Table Of Contents), que trobareu a l'inici dels nostres posts amb una certa extensió.
El sistema de ressenyes de productes té com a objectiu recompensar millor les ressenyes de productes d'alta qualitat. Google està intentant penalitzar webs d'afiliats amb contingut reescalfat i sense valor original. Busquen que el “contingut que proporciona tingui una anàlisi perspicaç i una recerca original, i està escrit per experts o entusiastes que coneixen bé el tema”. D'aquí venen els recents Product Review Update. Al cercador no li importen els afiliats mentre mostrem que hem provat el producte, aportem opinió i una guia de decisió als usuaris, i oferim més d'una opció de compra al nostre lector, en una pràctica antimonopoli que apunta clarament a Amazon.
RankBrain és un sistema d'intel·ligència artificial que ajuda a Google a comprendre com es relacionen les paraules amb els conceptes. Significa que intenta comprendre el context, la intenció de cerca, les inonímies o els conceptes relacionats. És per això que hem insistit en alguns posts sobre continguts per SEO en la importància d'usar un vocabulari ric i ampli sobre una temàtica, i no centrar-se en una keywords i anar-la repetint constantment.
Múltiples sistemes funcionen de diverses maneres per mostrar a la cerca la informació més de confiança possible, com per ajudar a mostrar pàgines més autoritzades i degradar el contingut de baixa qualitat i premiar el que Google diu “periodisme de qualitat”. És un intent clar de Google per a frenar l'auge dels mitjans sensacionalistes i amants del clickbait. Per aconseguir que el nostre lloc sigui més de confiança, especialment si toquem aspectes de diners o salut, però també per a tota mena de mitjans i blogs, és important entendre què és l'EAT i com treballar-ho.
Fa ja uns anys que Google va llançar el seu sistema de diversitat de llocs. Funciona de manera que, en general, no es mostren més de dos llistats de pàgines web del mateix lloc en els nostres resultats principals, de manera que cap lloc tendeix a dominar tots els resultats principals. Això ha frenat determinats monopolis, i donat més joc a diversitat d'actors. En general, veureu que funciona bé. Un aspecte important és que des de Google confirmen que els subdominis es consideren en principi parteix del mateix lloc, per la qual cosa atacar una mateixa cerca amb dos subdominis d'un mateix domini seria una entretinguda pèrdua de temps.
Internet inclou enormes quantitats d'spam i els resultats de cerca no s'escapen d'això. Tenen a SpamBrain i altres sistemes per a contenir-ho, encara que eliminar-ho és tasca impossible.
Google guarda un apartat especial a aquells sistemes que ja no s'usen però, ull, "s'han incorporat als sistemes successors o s'han convertit en part dels nostres sistemes de classificació principals". Molts d'ells els hem analitzat en el seu moment en aquest blog. La seva filosofia continua intacta així que semblaria temerari fer com si ja no existissin:
Tens un projecte en ment? En volem saber més!
Google està treballant per ser més transparent amb tota la documentació que afecta el SEO al seu motor de cerca