Lingüistica y Tecnologías por la UCM y la UPM
Máster. Curso 2025/2026.
TECNOLOGÍAS DEL TEXTO - 610711
Curso Académico 2025-26
Datos Generales
- Plan de estudios: 069M - MÁSTER UNIVERSITARIO EN LINGÜÍSTICA Y TECNOLOGÍAS (2025-26)
- Carácter: OBLIGATORIA
- ECTS: 6.0
SINOPSIS
COMPETENCIAS
Otras
RA4 - Explicar el funcionamiento de los métodos y paquetes de programación más relevantes para el análisis y el procesamiento automático de las lenguas. TIPO: Conocimientos o contenidos
RA5 - Explicar las características de las metodologías y los procedimientos lingüísticos, técnicos y estadísticos utilizados para abordar problemas lingüísticos desde la perspectiva de las tecnologías. TIPO: Conocimientos o contenidos
RA10 - Aplicar los métodos experimentales de carácter cualitativo y cuantitativo básicos en el ámbito de la Lingüística para analizar problemas y buscar soluciones. TIPO: Habilidades o destrezas
RA11 - Utilizar los recursos y tecnologías para el análisis de muestras de habla y de texto escrito. TIPO: Habilidades o destrezas
RA12 - Diseñar recursos lingüísticos (corpus textuales y de voz, bases de datos o bases de conocimiento lingüístico) para su utilización en Lingüística computacional, peritaje lingüístico o enseñanza de lenguas. TIPO: Habilidades o destrezas
RA16 - Aplicar correcta y adecuadamente los conocimientos y habilidades adquiridos durante el máster en la planificación y desarrollo de actividades de investigación, en el diseño de aplicaciones tecnológicas o en el ejercicio profesional. TIPO: Competencias
RA17 - Evaluar teorías, resultados y desarrollos, identificando lagunas, implementando soluciones y planificando la adquisición de nuevos conocimientos y habilidades. TIPO: Competencias
RA18 - Comunicar eficazmente los resultados obtenidos y los análisis realizados, tanto de forma oral como escrita, y tanto para especialistas como para una audiencia más general. TIPO: Competencias
RA19 - Actuar con responsabilidad social, lealtad, diligencia y transparencia en el ejercicio de las distintas actividades relacionadas con la Lingüística y las tecnologías, teniendo en cuenta los valores éticos y deontológicos en la actividad profesional. TIPO: Competencias
ACTIVIDADES DOCENTES
TOTAL
La dinámica de trabajo será:
1ª parte: presentación síncrona, al inicio de la semana, de los objetivos didácticos y la propuesta temática de la semana para que sirva de guía y punto de partida.
2ª parte: estudio y actividades de consolidación, que se realizarán a lo largo de la semana por parte de los alumnos y con la guía de los profesores.
3º parte: evaluación de conocimientos/destrezas adquiridas en la semana de trabajo.
Los alumnos pueden trabajar todas las actividades de aprendizaje, incluida la evaluación continua semanal, con un compañero o compañeros, pero la realización y entrega de las evaluaciones semanales es individual. Si la evaluación continua se ha trabajado con compañeros se debe indicar, en dicha evaluación, el nombre de los compañeros de trabajo. El examen final de la asignatura será individual.
Además, se podrán realizar tutorías síncronas en la que el profesor atenderá las dudas que se planteen en el foro. Las tutorías se anunciarán en el foro para que puedan asistir, si lo desean, otros alumnos. La tutoría se dedicará a las dudas del alumno o alumnos que la hayan solicitado. Una vez resueltas estas dudas, el resto de alumnos asistentes a la tutoría podrán formular sus preguntas.
Presenciales
No presenciales
Semestre
Breve descriptor:
La asignatura ofrece una formación teórico-práctica en tecnologías del texto, orientada a la construcción y explotación de corpus de texto plano o texto etiquetado que constituyen las muestras de la lengua. Para la explotación de los corpus textuales se aprenderá a utilizar el lenguaje de marcado XML, como sistema básico de descripción de los datos textuales, y herramientas software para el procesamiento automático de los datos e información textual. El conocimiento que se adquiere en la asignatura proporcionará al alumno una de las herramientas de trabajo lingüístico más eficaces para su quehacer profesional tanto en la lingüística computacional para procesar el texto, como en la enseñanza en entornos digitales, para crear espacios de aprendizaje virtuales y contenidos educativos digitales, o como en la lingüística forense, para analizar muestras textuales indubitadas o dubitadas.
Requisitos
Conocimientos y/o destrezas previas recomendadas:
- conocimientos de lenguajes de marcado (complemento formativo)
- conocimientos básicos de estadística
- conocimientos de inglés a nivel B1 (mínimo) que permita la lectura de bibliografía en dicha lengua
- capacidad de aprender del error
- capacidad de autoaprendizaje y planificación
- capacidad de trabajar colaborativamente
- capacidad de reflexión crítica
- capacidad para desenvolverse con soltura en un entorno informático
Objetivos
El objetivo fundamental de la asignatura es adquirir los conocimientos teóricos y prácticos para la construcción, evaluación y análisis de muestras de la lengua escrita (corpus textuales)
El objetivo principal se desgrana en los siguientes objetivos específicos:
1. Saber localizar y aplicar lenguajes estándares de etiquetado XML a la descripción de muestras lingüísticas de texto
2. Saber crear y evaluar un corpus textual puro y corpus textual XML
3. Tener la capacidad de realizar operaciones básicas de procesamiento automático de documentos textuales XML como la visualización de la información (CSS o XSL) o la consulta de datos (XQuery)
4. Demostrar capacidad para segmentar y etiquetar automáticamente muestras lingüísticas de texto
5. Ser capaz de analizar de forma cualitativa muestras lingüísticas de texto
6. Desenvolverse con soltura a la hora de buscar, identificar y aplicar las herramientas de software adecuadas a un estudio lingüístico del texto
7. Ser capaz de utilizar una herramienta de análisis textual para analizar cuantitativamente muestras lingüísticas de texto
Contenido
1. Revisión de XML
2. DTD, las gramáticas XML
3. Mecanismos de identificación XML y los esquemas XML
4. Lenguajes de marcado del Text Enconding Initiative (TEI)
5. Aplicación del TEI
6. Procesamiento de documentos XML-TEI
7. Recapitulación de los lenguajes de marcado
8. Creación y evaluación de corpus textuales
9. Herramientas de análisis textual. Análisis lingüístico con SketchEngine
10. Análisis lingüístico con SketchEngine
11. CQL, el lenguaje de consultas de SketchEngine
12. Resolución de un caso de estudio
13. Resolución de un caso de estudio
14. Evaluación del caso de estudio
e estudio
e estudio
e estudio
e estudio
e estudio
e estudio
Evaluación
- Evaluación continua: tiene un peso del 30% de la nota final. Se calculará como la media aritmética de todas las actividades evaluables a excepción del caso de estudio
- Evaluación del caso de estudio: tiene un peso del 20% de la nota final.
- Examen final: tiene un peso del 50% de la nota final. Es imprescindible aprobar el examen final para poder aprobar la asignatura
Bibliografía
- Arias, I.; Fernández-Pampillón, A.; Samy, D.; Arús, J. (2020). Taller sobre herramientas de análisis textual: la herramienta Sketch Engine. E-Prints Complutense. https://eprints.ucm.es/id/eprint/13796/21/Taller de Sketch Engine - Completo - 26-05-2020.pdf
- Casado, R. (2019). Introducción a HTML. En PIZÓN, C. (ed.), Knowledge extraction and representation. Salamanca: Ediciones Universidad de Salamanca, pp. 279-506
- Wynne, M. (ed.) (2005). Developing Linguistic Corpora: A Guide to Good Practice, Oxford: Oxbow Books. (disponible una version en línea en abierto: https://users.ox.ac.uk/~martinw/dlc/).
Otra información relevante
"La realización de una actividad evaluable (e.g. examen, trabajo, práctica) supone la aceptación del Código de Conducta Complutense sobre Responsabilidad y Honestidad intelectual (https://www.ucm.es/medicinatraslacional/file/codigo-de-conducta-complutense?ver). La detección de actos fraudulentos (e.g. suplantación, plagio, generación de documentación falsa en actos académicos) se someterá a los procedimientos de disciplina universitaria previstos académicamente y reconocidos como falta grave."
Mecanismos de contacto
-Foro de la asignatura virtual que podrá complementarse cuando sea necesario con sesiones de videoconferencia. Lo atenderán los profesores de la asignatura.
-Correo electrónico institucional de los profesores en caso de que no tenga acceso al campus virtual
-Además el alumno dispone de un servicio de ayuda para las incidencias informáticas de la Universidad en https://ssii.ucm.es/estudiante
Requisitos técnicos especiales (no de campus virtual)
Ordenador con conexión a internet y cámara de vídeo (recomendada)
Estructura
Módulos | Materias |
---|---|
No existen datos de módulos o materias para esta asignatura. |
Grupos
Clases teóricas y/o prácticas | ||||
---|---|---|---|---|
Grupo | Periodos | Horarios | Aula | Profesor |
Grupo T | 15/09/2025 - 15/12/2025 | VIERNES 15:00 - 17:00 | AULA VIRTUAL 2 | ANA MARIA FERNANDEZ-PAMPILLON CESTEROS ELENA DEL OLMO SUAREZ MANUEL MARQUEZ CRUZ |