Lingüistica y Tecnologías por la UCM y la UPM

Máster. Curso 2025/2026.

TECNOLOGÍAS DEL TEXTO - 610711

Curso Académico 2025-26

Datos Generales

SINOPSIS

COMPETENCIAS

Otras
Resultados de aprendizaje:
• RA4 - Explicar el funcionamiento de los métodos y paquetes de programación más relevantes para el análisis y el procesamiento automático de las lenguas. TIPO: Conocimientos o contenidos
• RA5 - Explicar las características de las metodologías y los procedimientos lingüísticos, técnicos y estadísticos utilizados para abordar problemas lingüísticos desde la perspectiva de las tecnologías. TIPO: Conocimientos o contenidos
• RA10 - Aplicar los métodos experimentales de carácter cualitativo y cuantitativo básicos en el ámbito de la Lingüística para analizar problemas y buscar soluciones. TIPO: Habilidades o destrezas
• RA11 - Utilizar los recursos y tecnologías para el análisis de muestras de habla y de texto escrito. TIPO: Habilidades o destrezas
• RA12 - Diseñar recursos lingüísticos (corpus textuales y de voz, bases de datos o bases de conocimiento lingüístico) para su utilización en Lingüística computacional, peritaje lingüístico o enseñanza de lenguas. TIPO: Habilidades o destrezas
• RA16 - Aplicar correcta y adecuadamente los conocimientos y habilidades adquiridos durante el máster en la planificación y desarrollo de actividades de investigación, en el diseño de aplicaciones tecnológicas o en el ejercicio profesional. TIPO: Competencias
• RA17 - Evaluar teorías, resultados y desarrollos, identificando lagunas, implementando soluciones y planificando la adquisición de nuevos conocimientos y habilidades. TIPO: Competencias
• RA18 - Comunicar eficazmente los resultados obtenidos y los análisis realizados, tanto de forma oral como escrita, y tanto para especialistas como para una audiencia más general. TIPO: Competencias
• RA19 - Actuar con responsabilidad social, lealtad, diligencia y transparencia en el ejercicio de las distintas actividades relacionadas con la Lingüística y las tecnologías, teniendo en cuenta los valores éticos y deontológicos en la actividad profesional. TIPO: Competencias

ACTIVIDADES DOCENTES

TOTAL
El curso se impartirá en el campus virtual de la UCM excepto la primera semana que será presencial en la Facultad de Filología. El curso se organiza en semanas. Cada semana se lleva a cabo una propuesta temática de trabajo organizada en dos partes: contenido teórico y contenido práctico.

La dinámica de trabajo será:
1ª parte: presentación síncrona, al inicio de la semana, de los objetivos didácticos y la propuesta temática de la semana para que sirva de guía y punto de partida.
2ª parte: estudio y actividades de consolidación, que se realizarán a lo largo de la semana por parte de los alumnos y con la guía de los profesores.
3º parte: evaluación de conocimientos/destrezas adquiridas en la semana de trabajo.

Los alumnos pueden trabajar todas las actividades de aprendizaje, incluida la evaluación continua semanal, con un compañero o compañeros, pero la realización y entrega de las evaluaciones semanales es individual. Si la evaluación continua se ha trabajado con compañeros se debe indicar, en dicha evaluación, el nombre de los compañeros de trabajo. El examen final de la asignatura será individual.

Además, se podrán realizar tutorías síncronas en la que el profesor atenderá las dudas que se planteen en el foro. Las tutorías se anunciarán en el foro para que puedan asistir, si lo desean, otros alumnos. La tutoría se dedicará a las dudas del alumno o alumnos que la hayan solicitado. Una vez resueltas estas dudas, el resto de alumnos asistentes a la tutoría podrán formular sus preguntas.

Presenciales

1,2

No presenciales

4,8

Semestre

1

Breve descriptor:

La asignatura ofrece una formación teórico-práctica en tecnologías del texto, orientada a la construcción y explotación de corpus de texto plano o texto etiquetado que constituyen las muestras de la lengua. Para la explotación de los corpus textuales se aprenderá a utilizar el lenguaje de marcado XML, como sistema básico de descripción de los datos textuales, y herramientas software para el procesamiento automático de los datos e información textual. El conocimiento que se adquiere en la asignatura proporcionará al alumno una de las herramientas de trabajo lingüístico más eficaces para su quehacer profesional tanto en la lingüística computacional para procesar el texto, como en la enseñanza en entornos digitales, para crear espacios de aprendizaje virtuales y contenidos educativos digitales, o como en la lingüística forense, para analizar muestras textuales indubitadas o dubitadas.


Requisitos

La asignatura no tiene requisitos
Conocimientos y/o destrezas previas recomendadas:
- conocimientos de lenguajes de marcado (complemento formativo)
- conocimientos básicos de estadística
- conocimientos de inglés a nivel B1 (mínimo) que permita la lectura de bibliografía en dicha lengua
- capacidad de aprender del error
- capacidad de autoaprendizaje y planificación
- capacidad de trabajar colaborativamente
- capacidad de reflexión crítica
- capacidad para desenvolverse con soltura en un entorno informático

Objetivos

El objetivo fundamental de la asignatura es adquirir los conocimientos teóricos y prácticos para la construcción, evaluación y análisis de muestras de la lengua escrita (corpus textuales)

 

El objetivo principal se desgrana en los siguientes objetivos específicos:

 

1.      Saber localizar y aplicar lenguajes estándares de etiquetado XML a la descripción de muestras lingüísticas de texto

2.      Saber crear y evaluar un corpus textual puro y corpus textual XML

3.      Tener la capacidad de realizar operaciones básicas de procesamiento automático de documentos textuales XML como la visualización de la información (CSS o XSL) o la consulta de datos (XQuery)

4.      Demostrar capacidad para segmentar y etiquetar automáticamente muestras lingüísticas de texto

5.      Ser capaz de analizar de forma cualitativa muestras lingüísticas de texto

6.      Desenvolverse con soltura a la hora de buscar, identificar y aplicar las herramientas de software adecuadas a un estudio lingüístico del texto

7.      Ser capaz de utilizar una herramienta de análisis textual para analizar cuantitativamente muestras lingüísticas de texto








Contenido

1.      Revisión de XML

2.      DTD, las gramáticas XML

3.      Mecanismos de identificación XML y los esquemas XML

4.      Lenguajes de marcado del Text Enconding Initiative (TEI)

5.      Aplicación del TEI

6.      Procesamiento de documentos XML-TEI

7.      Recapitulación de los lenguajes de marcado

8.      Creación y evaluación de corpus textuales

9.      Herramientas de análisis textual. Análisis lingüístico con SketchEngine

10.   Análisis lingüístico con SketchEngine

11.   CQL, el lenguaje de consultas de SketchEngine

12.   Resolución de un caso de estudio

13.   Resolución de un caso de estudio

14.   Evaluación del caso de estudio


e estudio



e estudio



e estudio



e estudio



e estudio



e estudio


Evaluación

La asignatura se evaluará de la forma siguiente:
- Evaluación continua: tiene un peso del 30% de la nota final. Se calculará como la media aritmética de todas las actividades evaluables a excepción del caso de estudio
- Evaluación del caso de estudio: tiene un peso del 20% de la nota final.
- Examen final: tiene un peso del 50% de la nota final. Es imprescindible aprobar el examen final para poder aprobar la asignatura

Bibliografía

- A Gentle Introduction to XML. En P5: Guidelines for Electronic Text Encoding and Interchange. Disponible en: https://tei-c.org/release/doc/tei-p5-doc/en/html/SG.html
- Arias, I.; Fernández-Pampillón, A.; Samy, D.; Arús, J. (2020). Taller sobre herramientas de análisis textual: la herramienta Sketch Engine. E-Prints Complutense. https://eprints.ucm.es/id/eprint/13796/21/Taller de Sketch Engine - Completo - 26-05-2020.pdf
- Casado, R. (2019). Introducción a HTML. En PIZÓN, C. (ed.), Knowledge extraction and representation. Salamanca: Ediciones Universidad de Salamanca, pp. 279-506
- Wynne, M. (ed.) (2005). Developing Linguistic Corpora: A Guide to Good Practice, Oxford: Oxbow Books. (disponible una version en línea en abierto: https://users.ox.ac.uk/~martinw/dlc/).

Otra información relevante

Actos fraudulentos:
"La realización de una actividad evaluable (e.g. examen, trabajo, práctica) supone la aceptación del Código de Conducta Complutense sobre Responsabilidad y Honestidad intelectual (https://www.ucm.es/medicinatraslacional/file/codigo-de-conducta-complutense?ver). La detección de actos fraudulentos (e.g. suplantación, plagio, generación de documentación falsa en actos académicos) se someterá a los procedimientos de disciplina universitaria previstos académicamente y reconocidos como falta grave."
Mecanismos de contacto
-Foro de la asignatura virtual que podrá complementarse cuando sea necesario con sesiones de videoconferencia. Lo atenderán los profesores de la asignatura.
-Correo electrónico institucional de los profesores en caso de que no tenga acceso al campus virtual
-Además el alumno dispone de un servicio de ayuda para las incidencias informáticas de la Universidad en https://ssii.ucm.es/estudiante

Requisitos técnicos especiales (no de campus virtual)
Ordenador con conexión a internet y cámara de vídeo (recomendada)

Estructura

MódulosMaterias
No existen datos de módulos o materias para esta asignatura.

Grupos

Clases teóricas y/o prácticas
GrupoPeriodosHorariosAulaProfesor
Grupo T15/09/2025 - 15/12/2025VIERNES 15:00 - 17:00AULA VIRTUAL 2ANA MARIA FERNANDEZ-PAMPILLON CESTEROS
ELENA DEL OLMO SUAREZ
MANUEL MARQUEZ CRUZ