Ciencia de Datos e Inteligencia de Negocios

Máster. Curso 2024/2025.

PREPARACIÓN DE DATOS Y MODELOS PREDICTIVOS - 610505

Curso Académico 2024-25

Datos Generales

SINOPSIS

COMPETENCIAS

Generales
RA1, RA3
RA13, RA15, RA16, RA17, RA19, RA20, RA21
RA23, RA25, RA26, RA27

ACTIVIDADES DOCENTES

Clases teóricas
50%
Clases prácticas
50%

Presenciales

1,8

No presenciales

4,2

Semestre

1

Breve descriptor:

Esta asignatura se contempla como una introducción al análisis de datos integrado utilizando software estadístico (Miner SAS y R). Se describen técnicas estadísticas habituales con el objetivo de que se conozca el entorno informático.


Se hace especial hincapié en la presentación y resolución de problemas prácticos a los que se les va aplicando diferentes técnicas, entendiéndolas como un procedimiento sistemático de trabajo. El método de trabajo consistirá en utilizar dos grandes bases de datos y trabajar con ellas de forma integrada. 


Las técnicas a las que se dará prioridad en esta asignatura son los métodos de exploración y depuración de datos, la creación de modelos predictivos como la regresión lineal, la regresión logística y los árboles de regresión y clasificación.

Objetivos

  1. Obtener las habilidades básicas-medias de lenguajes de programación orientados al manejo y análisis de datos.

  2. Saber cargar, manipular y depurar conjuntos de datos de manera eficiente y óptima.

  3. Comprender, aplicar y desarrollo de modelos predictivos, tales como regresión lineal, regresión logística y árboles.

Contenido

  1. Metodologías de Minería de Datos y Machine Learning.

  2. Técnicas de exploración, visualización y depuración de datos.

  3. Introducción a los modelos predictivos.

  4. Regresión lineal

  5. Regresión logística.

  6. Árboles de clasificación y regresión.

Evaluación

El alumno será evaluado de manera continua a lo largo del curso. Esta evaluación consistirá en la entrega de dos trabajos individuales. Dichos trabajos tendrán un peso del 50% cada uno de ellos en la nota de evaluación continua. Sera necesario obtener un mínimo de 4 puntos en cada uno de los trabajos.
Para aquello alumnos que renuncien a la evaluación continua o que no alcancen los objetivos mínimos se les evaluará a través de un examen que constituirá el 100% de la nota.
Cualquier alumno tendrá derecho a una prueba final pudiendo resultar su calificación la nota final del curso

Bibliografía

-Hastie, Trevor; Tibshirani, Robert y Friedman, Jerome (2009). The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Springer.
- Kuhn, Max y Johnson, Kjell (2016). Applied Predictive Modelling. Springer. - Gareth, James et. al (2015). An introduction to statistical learning : with applications in R. Springer.
Brett Lantz (2019).Machine learning with R
- Swirl stats: aprendizaje básico de R dentro del propio R. Disponible gratuitamente en https://swirlstats.com/ - Wright, C., Ellis, S.E., Hicks, S. C., Peng, R. D. (2021). «Tidyverse skills for data science». Disponible gratuitamente en https: //jhudatascience.org/tidyversecourse/
- Matloff, N (2011). The Art of R Programming. A tour of statistical software design. Disponible como recurso electrónico en la biblioteca de la UCM. - Crawley, M.J. The R book. Disponible como recurso electrónico en la biblioteca de la UCM
- Santin González, Daniel y Pérez, López, César (2007). Minería de datos, técnicas y herramientas. Tomson.
- Cerrito B. Patricia (2006). Introduction to Data Mining Using SAS Enterprise Miner. SAS Institute.

Estructura

MódulosMaterias
No existen datos de módulos o materias para esta asignatura.

Grupos

Clases teóricas y/o prácticas
GrupoPeriodosHorariosAulaProfesor
Grupo A09/09/2024 - 10/01/2025VIERNES 18:00 - 19:30-JUAN ANTONIO GUEVARA GIL
Grupo B09/09/2024 - 10/01/2025MIÉRCOLES 18:00 - 19:30-DANIEL MARTIN GARCIA


Actividades Prácticas
GrupoPeriodosHorariosAulaProfesor
Grupo A09/09/2024 - 10/01/2025VIERNES 19:30 - 21:00-JUAN ANTONIO GUEVARA GIL
Grupo B09/09/2024 - 10/01/2025MIÉRCOLES 19:30 - 21:00-DANIEL MARTIN GARCIA