Lingüistica y Tecnologías por la UCM y la UPM
Máster. Curso 2025/2026.
ENFOQUES Y PROGRAMACIÓN AVANZADA EN LINGÜÍSTICA COMPUTACIONAL - 610720
Curso Académico 2025-26
Datos Generales
- Plan de estudios: 069M - MÁSTER UNIVERSITARIO EN LINGÜÍSTICA Y TECNOLOGÍAS (2025-26)
- Carácter: OPTATIVA
- ECTS: 6.0
SINOPSIS
COMPETENCIAS
Específicas
CE8. Conocer los modelos y métodos más relevantes (simbólicos, estadísticos y biológicos) para el procesamiento automático de las lenguas y los fenómenos lingüísticos en sus diferentes niveles lingüísticos: fonético-fonológico, morfológico, sintáctico, semántico, pragmático y de discurso.
CE10. Saber utilizar con suficiente destreza los principales paquetes de programación para resolver tareas de procesamiento del lenguaje natural en formato texto.
CE11. Conocer el manejo de las herramientas software existentes para el procesamiento de las producciones lingüísticas en diferentes lenguas (ej. segmentadores, analizadores morfológicos, sintácticos, semánticos).
ACTIVIDADES DOCENTES
Otras actividades
1era. parte: presentación de la propuesta temática para que sirva de guía y punto de partida para la reflexión individual sobre su aplicación en cada asignatura concreta. Se realizará el lunes por parte de los profesores.
2ª parte: estudio y actividades de consolidación, se realizarán a lo largo de la semana por parte de los alumnos y con la guía de los profesores.
3ª parte: resolución de casos prácticos, se realizarán a lo largo de la semana por parte de los alumnos.
Las tareas semanales son:
1.- Presentación de los objetivos y contenidos del módulo. Guía para su estudio (lunes)
2.- Estudio, por parte del alumno, de los contenidos básicos. Incluirán lecturas (en modo texto, audio y/o vídeo) y casos prácticos resueltos.
3.- Realización de un caso práctico no resuelto evaluable.
4.- Ampliación opcional de conocimientos con el material complementario
5.- Reflexión entre iguales: uso del foro para preguntar y aclarar cuestiones de los contenidos básicos. El profesor hace el seguimiento sin intervenir excepto que sea necesario porque se observan errores o no se resuelven las dudas.
Se podrán realizar tutorías síncronas en la que el profesor atenderá las dudas que se planteen en foro.
TOTAL
- Estudio individual del material básico
- Lectura y análisis de material complementario
- Resolución de casos prácticos
- Comunicación virtual con el profesor
- Foros y comunicación colaborativa
- Seminarios presenciales
Presenciales
No presenciales
Semestre
Breve descriptor:
Para responder a la cuestión de la comunicación hombre-máquina en lenguaje natural, la idea es, en primer lugar, conseguir representar computacionalmente (en una máquina) el conocimiento que tienen las personas en su cerebro y, en segundo lugar, conseguir que con ese conocimiento las máquinas puedan procesar, es decir entender y producir, el lenguaje natural. Esta asignatura aborda el estudio de la Lingüística Computacional utilizando enfoques avanzados. Se centra en el estudio de los fundamentos matemáticos y de los modelos y técnicas de programación más recientes aplicados a la Lingüística computacional.
De forma más concreta, se tratará la extracción, estructuración y explotación de datos lingüísticos, su tratamiento automático con bibliotecas de Procesamiento del Lenguaje Natural, los fundamentos matemáticos de las representaciones vectoriales y de las redes neuronales, y los modelos de redes neuronales utilizados para el procesamiento del lenguaje natural.
Requisitos
- Capacidad de leer en inglés
- Capacidad de autoaprendizaje y planificación
- Capacidad crítica: no dar nada por supuesto
- Capacidad de aprender del error
Objetivos
El objetivo básico es el estudio de la Lingüística Computacional utilizando enfoques avanzados.
Este objetivo se desgrana en los siguientes objetivos específicos:
1. Conocer y saber utilizar los principales modelos y métodos de representación y procesamiento del lenguaje natural en sus niveles fonético-fonológico, léxico, morfológico, sintáctico, semántico, pragmático y discursivo.
2. Conocer y saber seleccionar críticamente el modelo de representación del conocimiento más adecuado a un problema o aplicación de la Lingüística computacional.
3. Conocer y saber realizar tareas comunes en el procesamiento del lenguaje natural: segmentación, etiquetado morfosintáctico, lematización y análisis sintáctico.
4. Conocer y saber utilizar soluciones (bibliotecas o repositorios) consolidadas para el procesamiento del lenguaje natural, la generación de representaciones gráficas, acceso y extracción de datos de la web y el almacenamiento y gestión de versiones de proyectos software.
5. Conocer y saber definir y describir los fundamentos matemáticos de las representaciones vectoriales y de las redes neuronales.
6. Saber enumerar, definir y aplicar a tareas sencillas de procesamiento del lenguaje los principales modelos de redes neuronales para el Procesamiento del Lenguaje Natural (PLN).
7. Saber explicar cómo pueden contribuir las aplicaciones de la Lingüística computacional para mejorar la vida de las personas y para facilitar el progreso científico y tecnológico en beneficio de la humanidad.
Contenido
Cronograma del curso
Semana |
Tema |
Objetivos didácticos |
Profesor |
Semana 1 |
Presentación e introducción a la asignatura. Planteamiento del primer caso práctico. |
Objetivos 1, 4, 6 y 7 |
Elena del Olmo Suárez Alberto Díaz Esteban |
Semana 2 |
Gestión web |
Objetivos 1, 2 y 3 |
Elena del Olmo Suárez |
Semana 3 |
Manipulación de datos estructurados |
Objetivos 1, 2 y 3 |
Elena del Olmo Suárez |
Semana 4 |
Generación de representaciones gráficas |
Objetivos 1, 2 y 3 |
Elena del Olmo Suárez |
Semana 5 |
Bibliotecas consolidadas para el PLN |
Objetivos 4 y 7 |
Elena del Olmo Suárez |
Semana 6 |
Bibliotecas consolidadas para el PLN |
Objetivos 4 y 7 |
Elena del Olmo Suárez |
Semana 7 |
Control de versiones |
Objetivo 4 |
Elena del Olmo Suárez |
Semana 8 |
Introducción a las redes neuronales |
Objetivos 4, 5 y 6 |
Alberto Díaz Esteban |
Semana 9 |
Representaciones vectoriales |
Objetivos 4, 5 y 6 |
Alberto Díaz Esteban |
Semana 10 |
Redes recurrentes |
Objetivos 4, 5 y 6 |
Alberto Díaz Esteban |
Semana 11 |
Redes secuencia-secuencia |
Objetivo 4, 5 y 6 |
Alberto Díaz Esteban |
Semana 12 |
Atención y transformers |
Objetivos 4, 5 y 6 |
Alberto Díaz Esteban |
Semana 13 |
Redes convolucionales |
Objetivos 4, 5 y 6 |
Alberto Díaz Esteban |
Semana 14 |
Transfer learning |
Objetivos 4, 5 y 6 |
Alberto Díaz Esteban |
Evaluación
- Actividades evaluables de la semana: 60% de la nota final
- Examen presencial: 40% nota final
Es necesario aprobar las dos mitades de la asignatura impartidas por cada profesor. El alumno que apruebe solamente una de las partes no deberá examinarse de la misma en la convocatoria extraordinaria.
Bibliografía
Einsenstein, J. Introduction to Natural Language Processing. 2019. Borrador disponible en: https://github.com/jacobeisenstein/gt-nlp-class/blob/master/notes/eisenstein-nlp-notes.pdf
Jurafsky, D. and Martin, J.H. Speech and Language Processing. Pearson Prentice Hall. 2008.
Llisterri, J, Martí, M. A. (Eds). Tratamiento del Lenguaje Natural. Edicions Universitat de Barcelona. 2003.
Manning, C., Raghavan, P. and Schütze, H. Introduction to Information Retrieval. Cambridge University Press. 2008. Disponible en: https://nlp.stanford.edu/IR-book/pdf/irbookonlinereading.pdf
Deep Learning with Python. Francois Chollet. Second edition; Manning, 2021
Deep Learning with Python. Francois Chollet. First edition; Manning, 2018
Estructura
Módulos | Materias |
---|---|
No existen datos de módulos o materias para esta asignatura. |
Grupos
Clases teóricas y/o prácticas | ||||
---|---|---|---|---|
Grupo | Periodos | Horarios | Aula | Profesor |
Grupo T | 15/09/2025 - 12/12/2025 | MIÉRCOLES 17:00 - 19:00 | AULA VIRTUAL | ALBERTO DIAZ ESTEBAN ELENA DEL OLMO SUAREZ |