

En el mundo del SEO técnico, cada detalle cuenta. Los datos son lo que nos ayuda a tomar las decisiones estratégicas. Pero ¿cómo filtrar, interpretar y aprovechar grandes volúmenes de datos de forma eficiente? Pues con expresiones regulares, también conocidas como regex.
A primera vista pueden parecer complejas o demasiado técnicas, pero si las comprendemos, las expresiones regulares son una herramienta extremadamente útil para quienes trabajan con posicionamiento web. Nos permiten identificar patrones en textos, URLs o consultas, filtrar información en herramientas como Google Analytics o Search Console, e incluso automatizar tareas repetitivas en hojas de cálculo.
Las expresiones regulares, comúnmente conocidas como regex, son secuencias de caracteres que definen un patrón de búsqueda. Aunque su origen está en el mundo de la programación, su utilidad se ha extendido a múltiples áreas, incluido el SEO.
En términos sencillos, regex permite encontrar, filtrar o modificar cadenas de texto que siguen un patrón determinado. Por ejemplo, podrías encontrar todas las URLs que terminan en ".jpg" o todos los títulos que contienen una palabra específica. Esta capacidad de filtrar datos de forma tan precisa las convierte en una herramienta muy poderosa.
Para empezar a usar regex en SEO, es esencial conocer los símbolos más comunes:
| Símbolo | Función |
| . | Representa cualquier carácter |
| ^ | Indica el inicio de una cadena |
| $ | Indica el final de una cadena |
| * | Coincide con el carácter anterior 0 o más veces |
| + | Coincide con el carácter anterior 1 o más veces |
| ? | Hace que el carácter anterior sea opcional |
| ()` | Agrupa expresiones |
| [] | Define una clase de caracteres |
| \ | Escapa caracteres especiales |
Ejemplos sencillos de aplicar:
Todo esto está muy bien, pero vamos a darle un uso práctico para poder usar todas estas expresiones regulares y que nos faciliten el trabajo. A continuación te cuento las diferentes herramientas en las que las puedes usar.
Google Analytics 4 permite usar expresiones regulares en diversas secciones para segmentar, filtrar o configurar condiciones. Algunos usos clave incluyen:
Puedes aplicar regex en filtros para mostrar solo ciertos eventos, páginas vistas o rutas de conversión.
Ejemplo:
^/blog/.* → Incluye solo URLs que comienzan con /blog/
Cuando creas segmentos personalizados (por ejemplo, sesiones que contienen una determinada categoría de producto), puedes usar regex para incluir/excluir comportamientos.
GA4 permite configurar eventos basados en coincidencias con expresiones regulares. Por ejemplo, para medir clicks en enlaces externos que contengan "oferta":
.*oferta.*
Puedes usar regex para excluir tráfico interno (como de tu equipo) basándote en patrones de IP o parámetros.
Desde 2021, GSC permite usar expresiones regulares en los filtros de "consultas" y "páginas". Esto ofrece muchísima flexibilidad en análisis.
Puedes encontrar patrones de búsqueda con mayor precisión.
^comprar.* → Palabras clave que comienzan por "comprar" .*gratis$ → Palabras clave que terminan en "gratis"
Filtrar URLs por subdirectorios, parámetros o patrones.
^/categoria/.*/producto → URLs que contienen estructuras de tipo categoría/producto
.*precio.*
\?ref= → Coincide con URLs que contienen el parámetro "?ref="
Screaming Frog es una herramienta muy potente para auditar sitios web, y regex amplía aún más su funcionalidad.
Puedes crear filtros en el crawler basados en URLs, títulos, descripciones, H1, etc.
.*\.pdf$ → Filtrar todas las URLs que terminan en .pdf
Extrae datos específicos del HTML como precios, encabezados o metadatos con regex:
Precio: (\d+,\d{2})€Úsalo en los "Config > Include / Exclude" para rastrear únicamente secciones concretas.
Analiza qué URLs están siendo bloqueadas o incluidas según patrones.
Google Sheets permite usar regex con funciones muy útiles para automatizar y limpiar datos SEO:
Comprueba si un texto cumple un patrón.
=REGEXMATCH(A2, ".*producto.*")
=REGEXEXTRACT(A2, "/producto/([a-zA-Z0-9\-]+)")
=REGEXREPLACE(A2, "(\?.*)", "") → Elimina parámetros de URLs
En Apache, los archivos .htaccess permiten redirecciones condicionales mediante expresiones regulares.
RewriteRule ^blog/([0-9]{4})/(.*)$ /archivo/$1/$2 [R=301,L]Redirige URLs como /blog/2022/post-titulo a /archivo/2022/post-titulo
RewriteCond %{HTTP_USER_AGENT} ^.*(AhrefsBot|SemrushBot).*$ [NC]RewriteRule .* - [F,L]
Puedes detectar parámetros y redirigir, reescribir o bloquear en base a ellos.
Puedes usar ChatGPT para:
"Necesito una expresión regular para detectar URLs con /categoria/ seguido de un número y que terminen en /"
ChatGPT te respondería con algo como:
^/categoria/\d+/$
Existen diferentes sitios que nos sirven para validar si estamos usando correctamente las diferentes expresiones regulares.
Las expresiones regulares son una herramienta extremadamente poderosa para quienes trabajan en SEO técnico. Aunque al principio pueden parecer complejas, su aprendizaje abre un mundo de posibilidades para optimizar, analizar y tomar decisiones con mayor precisión.
Y como ves, sus usos son múltiples, lo puedes hacer en Search Console, Analytics, hojas de cálculo o incluso .htaccess. Entender regex puede marcar la diferencia en tus estrategias de posicionamiento.

¿Tienes un proyecto en mente? Cuéntanoslo
Aprende qué son las expresiones regulares (regex) y cómo aplicarlas al SEO técnico en herramientas como Google Analytics, Search Console, Sheets y .htaccess. Mejora tu análisis y automatización.