Lingüistica y Tecnologías por la UCM y la UPM

Máster. Curso 2025/2026.

ENFOQUES Y PROGRAMACIÓN AVANZADA EN LINGÜÍSTICA COMPUTACIONAL - 610720

Curso Académico 2025-26

Datos Generales

SINOPSIS

COMPETENCIAS

Específicas

CE8. Conocer los modelos y métodos más relevantes (simbólicos, estadísticos y biológicos) para el procesamiento automático de las lenguas y los fenómenos lingüísticos en sus diferentes niveles lingüísticos: fonético-fonológico, morfológico, sintáctico, semántico, pragmático y de discurso.
CE10. Saber utilizar con suficiente destreza los principales paquetes de programación para resolver tareas de procesamiento del lenguaje natural en formato texto.
CE11. Conocer el manejo de las herramientas software existentes para el procesamiento de las producciones lingüísticas en diferentes lenguas (ej. segmentadores, analizadores morfológicos, sintácticos, semánticos).

ACTIVIDADES DOCENTES

Otras actividades
El curso se impartirá en el Campus Virtual de la UCM. Se organizará en semanas. Cada semana se hará una propuesta temática de trabajo y se trabajará en tres partes:
1era. parte: presentación de la propuesta temática para que sirva de guía y punto de partida para la reflexión individual sobre su aplicación en cada asignatura concreta. Se realizará el lunes por parte de los profesores.
2ª parte: estudio y actividades de consolidación, se realizarán a lo largo de la semana por parte de los alumnos y con la guía de los profesores.
3ª parte: resolución de casos prácticos, se realizarán a lo largo de la semana por parte de los alumnos.

Las tareas semanales son:
1.- Presentación de los objetivos y contenidos del módulo. Guía para su estudio (lunes)
2.- Estudio, por parte del alumno, de los contenidos básicos. Incluirán lecturas (en modo texto, audio y/o vídeo) y casos prácticos resueltos.
3.- Realización de un caso práctico no resuelto evaluable.
4.- Ampliación opcional de conocimientos con el material complementario
5.- Reflexión entre iguales: uso del foro para preguntar y aclarar cuestiones de los contenidos básicos. El profesor hace el seguimiento sin intervenir excepto que sea necesario porque se observan errores o no se resuelven las dudas.

Se podrán realizar tutorías síncronas en la que el profesor atenderá las dudas que se planteen en foro.
TOTAL
- Visionado de video/audiolecciones y sesiones síncronas o asíncronas
- Estudio individual del material básico
- Lectura y análisis de material complementario
- Resolución de casos prácticos
- Comunicación virtual con el profesor
- Foros y comunicación colaborativa
- Seminarios presenciales

Presenciales

1,2

No presenciales

4,8

Semestre

1

Breve descriptor:

Para responder a la cuestión de la comunicación hombre-máquina en lenguaje natural, la idea es, en primer lugar, conseguir representar computacionalmente (en una máquina) el conocimiento que tienen las personas en su cerebro y, en segundo lugar, conseguir que con ese conocimiento las máquinas puedan procesar, es decir entender y producir, el lenguaje natural. Esta asignatura aborda el estudio de la Lingüística Computacional utilizando enfoques avanzados. Se centra en el estudio de los fundamentos matemáticos y de los modelos y técnicas de programación más recientes aplicados a la Lingüística computacional.

 

De forma más concreta, se tratará la extracción, estructuración y explotación de datos lingüísticos, su tratamiento automático con bibliotecas de Procesamiento del Lenguaje Natural, los fundamentos matemáticos de las representaciones vectoriales y de las redes neuronales, y los modelos de redes neuronales utilizados para el procesamiento del lenguaje natural.

Requisitos

- Conocimiento básico de Python
- Capacidad de leer en inglés
- Capacidad de autoaprendizaje y planificación
- Capacidad crítica: no dar nada por supuesto
- Capacidad de aprender del error

Objetivos

El objetivo básico es el estudio de la Lingüística Computacional utilizando enfoques avanzados.

 

Este objetivo se desgrana en los siguientes objetivos específicos:

 

1. Conocer y saber utilizar los principales modelos y métodos de representación y procesamiento del lenguaje natural en sus niveles fonético-fonológico, léxico, morfológico, sintáctico, semántico, pragmático y discursivo.

2. Conocer y saber seleccionar críticamente el modelo de representación del conocimiento más adecuado a un problema o aplicación de la Lingüística computacional.

3. Conocer y saber realizar tareas comunes en el procesamiento del lenguaje natural: segmentación, etiquetado morfosintáctico, lematización y análisis sintáctico.

4. Conocer y saber utilizar soluciones (bibliotecas o repositorios) consolidadas para el procesamiento del lenguaje natural, la generación de representaciones gráficas, acceso y extracción de datos de la web y el almacenamiento y gestión de versiones de proyectos software.

5. Conocer y saber definir y describir los fundamentos matemáticos de las representaciones vectoriales y de las redes neuronales.

6. Saber enumerar, definir y aplicar a tareas sencillas de procesamiento del lenguaje los principales modelos de redes neuronales para el Procesamiento del Lenguaje Natural (PLN).

7. Saber explicar cómo pueden contribuir las aplicaciones de la Lingüística computacional para mejorar la vida de las personas y para facilitar el progreso científico y tecnológico en beneficio de la humanidad.

Contenido

Cronograma del curso

Semana

Tema

Objetivos didácticos

Profesor

Semana 1

Presentación e introducción a la asignatura. Planteamiento del primer caso práctico.

Objetivos 1, 4, 6 y 7

Elena del Olmo Suárez

Alberto Díaz Esteban

Semana 2

Gestión web

Objetivos 1, 2 y 3

Elena del Olmo Suárez

Semana 3

Manipulación de datos estructurados

Objetivos 1, 2 y 3

Elena del Olmo Suárez

Semana 4

Generación de representaciones gráficas

Objetivos 1, 2 y 3

Elena del Olmo Suárez

Semana 5

Bibliotecas consolidadas para el PLN

Objetivos 4 y 7

Elena del Olmo Suárez

Semana 6

Bibliotecas consolidadas para el PLN

Objetivos 4 y 7

Elena del Olmo Suárez

Semana 7

Control de versiones

Objetivo 4

Elena del Olmo Suárez

Semana 8

Introducción a las redes neuronales

Objetivos 4, 5 y 6

Alberto Díaz Esteban

Semana 9

Representaciones vectoriales

Objetivos 4, 5 y 6

Alberto Díaz Esteban

Semana 10

Redes recurrentes

Objetivos 4, 5 y 6

Alberto Díaz Esteban

Semana 11

Redes secuencia-secuencia

Objetivo 4, 5 y 6

Alberto Díaz Esteban

Semana 12

Atención y transformers

Objetivos 4, 5 y 6

Alberto Díaz Esteban

Semana 13

Redes convolucionales

Objetivos 4, 5 y 6

Alberto Díaz Esteban

Semana 14

Transfer learning

Objetivos 4, 5 y 6

Alberto Díaz Esteban

minor-bidi; mso-fareast-language:EN-US">Alberto Díaz Esteban

Evaluación

La asignatura se evalúa a partir de las actividades siguientes:
- Actividades evaluables de la semana: 60% de la nota final
- Examen presencial: 40% nota final

Es necesario aprobar las dos mitades de la asignatura impartidas por cada profesor. El alumno que apruebe solamente una de las partes no deberá examinarse de la misma en la convocatoria extraordinaria.

Bibliografía

Bratko, I. Programming for Artificial Intelligence. Pearson. 2001.
Einsenstein, J. Introduction to Natural Language Processing. 2019. Borrador disponible en: https://github.com/jacobeisenstein/gt-nlp-class/blob/master/notes/eisenstein-nlp-notes.pdf
Jurafsky, D. and Martin, J.H. Speech and Language Processing. Pearson Prentice Hall. 2008.
Llisterri, J, Martí, M. A. (Eds). Tratamiento del Lenguaje Natural. Edicions Universitat de Barcelona. 2003.
Manning, C., Raghavan, P. and Schütze, H. Introduction to Information Retrieval. Cambridge University Press. 2008. Disponible en: https://nlp.stanford.edu/IR-book/pdf/irbookonlinereading.pdf
Deep Learning with Python. Francois Chollet. Second edition; Manning, 2021
Deep Learning with Python. Francois Chollet. First edition; Manning, 2018

Estructura

MódulosMaterias
No existen datos de módulos o materias para esta asignatura.

Grupos

Clases teóricas y/o prácticas
GrupoPeriodosHorariosAulaProfesor
Grupo T15/09/2025 - 12/12/2025MIÉRCOLES 17:00 - 19:00AULA VIRTUALALBERTO DIAZ ESTEBAN
ELENA DEL OLMO SUAREZ