

L’objectiu de Google sempre ha estat retornar els millors resultats possibles davant la cerca d’un usuari. Amb el temps ha anat millorant aspectes de semàntica, que li permeten entendre millor tant el sentit de la cerca de l’usuari com el contingut dels llocs web. Mitjançant les millores que ha anat aplicant Google amb els seus algoritmes, les pràctiques SEO també han anat canviant. Antigament, per posicionar una keyword de dificultat mitjana n’hi havia prou amb una mica de SEO on page, molt keyword stuffing, algun enllaç (o ni això) i ja ho teníem. Ara això no només és insuficient, sinó que és manifestament contrari a diverses directrius per posicionar al cercador.
Avui dia quan fem una cerca, Google té en compte centenars d’aspectes: la meva possible intenció de cerca, l’historial de navegació, la geolocalització, l’idioma en què ho he cercat, les entitats relacionades, aspectes d’actualitat i molts més paràmetres, i em retorna una pàgina de resultats que pot incloure enllaços blaus però també múltiples formats de contingut.
NLP són les sigles en anglès de Processament de Llenguatge Natural. Aplicat al SEO, has d’entendre que Google l’usa per entendre millor la cerca de l’usuari i el contingut dels llocs per fer el “match” desitjat. Quan posem una query al cercador, Google fa una anàlisi semàntica, detecta relacions entre les paraules i obté un significat conjunt de la cerca, així com les entitats relacionades. Google també ho usa per comprendre i relacionar dades sobre l’actualitat, esdeveniments, notícies o fins i tot converses en fòrums o xarxes socials.
La tokenització és un procés clau per entendre com funciona el NLP a Google: fa referència a com separa les paraules d’un text, les analitza per separat i conjuntament, i considera la puntuació.
Una altra clau és la categorització gramatical. Com quan analitzàvem oracions a l’escola: etiqueta substantius, verbs, adverbis, preposicions... i entén com afecten el significat global.
Una altra dimensió són les lematitzacions. Converteix una paraula a la seva forma de diccionari. Per exemple, “finalizado” es processa com “finalizar”. Si busquem “posicionamiento SEO”, la lematització pot portar-nos a “posicionamiento en buscadores”, un terme més tècnic:
El següent concepte són les dependències: Google ha d’entendre quin mot modifica quin altre. Si dic “aquest post està molt bé”, “bé” modifica “post”, no la paraula anterior, com feia abans.
Això connecta amb el Knowledge Graph. Les entitats són objectes o conceptes inequívocs. Per exemple, “Barcelona” pot ser ciutat o club de futbol:

Si afegim matisos, Google identifica millor quina entitat és:
Per veure les entitats d’un text pots usar entity indexing checker. Exemple amb el nostre diccionari SEO:

Una eina potentíssima i gratuïta fins a cert punt és Cloud Natural Language. Li pots passar textos i et mostra com Google els processa i quines entitats detecta. Exemple amb un post sobre Open Graph:
Google analitza la query i després decideix quins resultats mostrar. Per això analitza el contingut d'una URL i les senyals d’enllaçat extern i intern.
Googlebot rastreja primer l’HTML. Si uses webs amb Javascript, ves amb compte: el que veu l’usuari pot no ser el que hi ha al codi. Després Google pren el DOM renderitzat. Millor que el contingut important ja aparegui a l’HTML.
Els anchor texts ajuden Google a entendre de què va una URL. Evita anchors com “aquí”, “veure més”. L’enllaç ha d’estar contextualitzat i en webs amb relació temàtica.
No cal posicionar per posicionar. L’important és assignar una keyword principal a cada URL. Macrocontinguts? Sí, però pensats com hubs d’enllaçat.
Hi ha moltes metodologies: densitat, prominència, coocurrència, TF-IDF… L'objectiu: Google ha d’entendre de què va el contingut sense forçar-lo.



Tens un projecte en ment? En volem saber més!
Entén com Google descodifica i comprèn el contingut dels nostres webs per donar un impuls al teu SEO.