Tratamiento de datos digitales


 
Sábados 9, 16 y 23 de abril
de 10:00 a 13:00
en c/Encomienda 21, 28012 Madrid

Inscripciones abiertas
20 €

Taller de tratamiento de datos digitales

La web está llena de textos, textos que contienen datos interesantísimos que podemos explotar utilizando unas sencillas herramientas que están al alcance de todos. El objetivo de este taller es conocer y aprender a trabajar con estas herramientas para que tú mismo puedas realizar tus investigaciones y sacar conclusiones, ya seas periodista, filólogo, traductor, lingüista o curioso; el dato está ahí disponible, solo hay que saber llegar a él.

Deberás traer tu ordenador portátil porque aprenderemos directamente con la práctica. Alguna de las herramientas que utilizaremos son Antconc, Import.io o CartoDB, pero no hace falta que los traigas instalados, dará tiempo en el taller a hacerlo.

No te preocupes si no has programado nunca o no has tocado en la vida nada más que el paquete ofimático de MS Office; partiremos de un nivel usuario. ¡Solo hace falta no tener miedo a cacharrear!

Calendario y programa del curso

El curso está dividido en 3 sesiones:

Sábado 9, de 10:00 a 13:00.

En la primera sesión aprenderemos a descargar los textos que hay en la web de una forma automatizada, así como a limpiarlos y pasarlos a un formato que nos permitirá analizarlos. Es decir, utilizaremos el scraping para generar un corpus a partir de la Web.

aq_block_7-image

Sábado 16, de 10:00 a 13:00.

Una vez tenemos el corpus, hay que explorarlo. En esta sesión utilizaremos herramientas adecuadas para analizar los textos que hemos descargado de una forma fácil y rápida. Verás como empiezas a ver cosas interesantes en ese gran conjunto de palabras que obtuvimos la semana anterior.

Sábado 23, de 10:00 a 13:00.

Porque de nada sirve tener los datos si no los mostramos de una manera atractiva que permita comunicar la información que hemos encontrado, en la última sesión aprenderemos a mostrar visualmente los datos. Cada conjunto de datos puede requerir una visualización distinta, así que en función del corpus de trabajo podremos querer mostrarlos en un mapa, utilizar series temporales o diferentes diagramas.


Profes: Lingẅars

Se trata de un grupo heterogéneo de gente interesada en la lingüística computacional. Con formaciones y experiencias muy distintas (ingenierías, filologías, lingüística, traducción, bases de datos...), se juntan para aprender unos de otros y desarrollar los proyectos que van surgiendo. Cualquiera es bienvenido.

La idea surgió en julio de 2015 y desde entonces ha habido encuentros informales más o menos continuados y algún que otro encuentro oficial, donde se ha dado a conocer el proyecto y se ha aprovechado para enseñar y aprender a programar recursos lingüísticos en Python, a usar bases de datos MySQL y muchas más cosas.

La filosofía de Lingẅars es que sí, hay empresas y organizaciones de lingüística computacional que se dedican a desarrollar recursos lingüísticos. Pero a pequeña escala cualquiera puede hacer lo mismo si tiene el interés y está dispuesto a esforzarse solo un poquito en aprender a usar las herramientas adecuadas. Y juntos se pueden hacer proyectos muy interesantes a mayor escala. Si todavía no estás convencido de los milagros de estos conocimientos, descubre todo lo que puedes hacer con el procesamiento del lenguaje natural 😉

En concreto, impartirán los talleres Javi Sogo y Tania Karaseva, a los que conoceréis si habéis asistido a algún evento de Lingẅars porque son de los que nunca fallan. Un ingeniero enamorado de la lingüística y una traductora que programa en sus ratos libres: la combinación letras-ciencias ganadora por la que siempre apostamos desde coLenguando 😉

Puedes visitar el GitHub de Lingẅars, su blog, unirte a su grupo en Facebook o seguirles en Twitter.


Preguntas frecuentes

Son los sábados 9, 16 y 23 de abril por la mañana (de 10:00 a 13:00) de abril en coLenguando, el espacio de formación para profesionales de lengua y humanidades. Está en la c/Encomienda 21, muy cerca de la Plaza de Cascorro. Los metros más cercanos son La Latina (L5) y Tirso de Molina (L1).

Puede que, si hay muchas preguntas, el taller se alargue media hora, pero a la hora de comer habremos volado todos seguro 🙂

Solo saber manejar bien el ordenador a nivel usuario.

Es imprescindible que traigas tu ordenador portátil o no podrás seguir la lección.

Para cualquier duda sobre el curso, puedes ponerte en contacto con la organización escribiéndonos a mola[arrobita]lenguando.com.

Puedes recibir en tu correo los avisos de nuevas convocatorias y cursos de coLenguando puedes suscribirte a su boletín de actividades. Si lo que quieres es seguir las andaduras de Lingẅars, se comunican por su grupo de Facebook e informan de todas sus actividades en su blog y su cuenta de Twitter.