El blog de coLenguando

La lengua, las humanidades y las expresiones regulares-0
22 Julio, 2015
|

La lengua, las humanidades y las expresiones regulares

Si te dedicas al mundo de la lengua, la comunicación o las humanidades, es posible que nunca hayas oído hablar de las expresiones regulares. A pesar de ser un recurso más que interesante para las disciplinas y profesiones de letras, suelen ser unas grandes desconocidas en el gremio. Vamos a ver qué son y por qué nos pueden resultar tan útiles si trabajamos con textos.

Qué es una expresión regular

Las expresiones regulares (a.k.a. regex) son patrones que nos permiten hacer búsquedas y sustituciones en los textos detectando secuencias de caracteres que cumplan una condición dada (por ejemplo, contener unos caracteres y no otros, empezar o terminar por una secuencia de caracteres determinada, ir precedido o no de una serie de caracteres, contener ciertos caracteres optativos, etc.). Por poner un paralelismo que nos ayude a hacernos una idea, las expresiones regulares son una forma de búsqueda (más compleja y sofisticada) similar a las búsquedas con comodines (que encontramos en algunos buscadores, diccionarios, corpus, y otras herramientas que incluyen cajas de búsqueda de texto) y que nos permiten buscar cas* y obtener como resultado tanto cas como casa, caso, casi, casas y casos. Si bien este ejemplo de cas* es un poco inexacto (ya que las regex no se expresan exactamente así), nos puede servir para hacernos una idea de en qué consiste esto de las expresiones regulares si no estamos familiarizados con el concepto. Aprender a manejar las expresiones regulares consiste, ni más ni menos, en familiarizarse con la sintaxis de las expresiones regulares; es decir, qué significan los distintos caracteres en regex para poder hacer nuestros propios patrones de búsqueda.

¿Para qué me sirven las expresiones regulares?

Puesto que son muy flexibles y potentes, las expresiones regulares resultan francamente útiles en la edición y revisión de textos porque permiten hacer búsquedas y sustituciones refinadas de forma masivafamiliarizándonos mínimamente con su sintaxis (es decir, conociendo las reglas detrás de las expresiones regulares y sabiendo cómo expresar lo que queremos buscar), podremos buscar patrones que se repiten en un texto, corregir errores recurrentes (espacios y saltos de línea múltiples, formatos de fecha), sustituir múltiples secuencias de caracteres en un texto, localizar y modificar etiquetas (por ejemplo, si estamos trabajando con archivos HTML), ubicar cifras, recuperar palabras que empiecen o terminen por unas letras determinadas, eliminar palabras duplicadas, detectar líneas escritas en mayúsculas y un largo etcétera… a golpe de clic. Correctores, traductores, editores, filólogos, lingüistas, investigadores de letras y otros profesionales que dedican buena parte de su tiempo a buscar, editar, reemplazar y modificar textos pueden ahorrarse trabajo farragoso y repetitivo utilizando búsquedas con expresiones regulares.

Tradicionalmente, las expresiones regulares se han usado sobre todo en programación para hacer consultas a bases de datos o comprobar que una secuencia de caracteres dada cumple una determinada condición formal (por ejemplo, que el usuario ha introducido en la casilla de correo electrónico una secuencia de caracteres que contiene un nombre seguido de una @ y un dominio). Pero si no somos programadores, ¿dónde podemos utilizar las expresiones regulares como profesionales de letras? Pues bien, hay cantidad de herramientas textuales que permiten hacer búsquedas y sustituciones usando expresiones regulares: podemos usar expresiones regulares en editores de texto (Word, Notepad++, Sublime), gestores de corpus (SketchEngine, Antconc, TshwaneLex) o programas de traducción asistida por ordenador y de localización (SDL Trados, MemoQ, Xbench, Wordfast).

¡Ojo! Existen varios “dialectos” de la sintaxis de expresiones regulares. Quizá una de las variantes más extendidas sea PCRE. La mala noticia es que, según el programa en el que trabajéis, es posible que os encontréis con que usan otro dialecto de regex. La buena noticia es que los cambios entre una variante y otra son mínimos y lo habitual es que los encontréis fácilmente documentados y requieran mínimas modificaciones. En esta lista tenéis una recopilación de editores de texto que ofrecen búsqueda con expresiones regulares (así como la “variante dialectal” que utilizan).

 

¿Quieres aprender a manejar expresiones regulares? Durante noviembre celebramos el curso online de expresiones regulares para profesionales de lengua y humanidades. ¡Inscripciones abiertas!

 



2 Comments


¿Nos dejas un comentario?

Leave a Reply