Ciencia de los Datos Aplicada

Grado y Doble Grado. Curso 2024/2025.

ESTUDIO Y DEPURACIÓN DE DATOS - 806310

Curso Académico 2024-25

Datos Generales

SINOPSIS

COMPETENCIAS

Generales
CB4 - Que los estudiantes puedan transmitir información, ideas, problemas y soluciones a un público tanto especializado como no especializado.
CB5 - Que los estudiantes hayan desarrollado aquellas habilidades de aprendizaje necesarias para emprender estudios posteriores con un alto grado de autonomía.
CG1 - Comunicar y transmitir la información a un público tanto especializado como no especializado.
CG2 - Adquirir la habilidad para expresarse claramente y de presentar los resultados de sus análisis, oralmente o por escrito, mediante un informe de carácter profesional.
CG4 - Cultivar interés en el conocimiento, descripción e interpretación de fenómenos susceptibles de cuantificación.
CG5 - Desarrollar la capacidad de trabajar de forma autónoma.
CG10 - Desarrollar la capacidad de expresar y aplicar rigurosamente los conocimientos adquiridos en la resolución de problemas.
CG11 - Poner en práctica las técnicas, herramientas y metodologías propias de la Ciencia de los Datos en distintos ámbitos de aplicación.
Específicas
CE2 - Identificar y seleccionar las principales fuentes de información e indicadores en diferentes ámbitos de aplicación como los sociales, económicos, bibliométricos, sanitarios, financieros, geográficos, etc. , incluyendo los aspectos de protección de datos.
CE4 - Identificar la utilidad y el potencial de las técnicas estadísticas y de análisis de datos adquiridas en las distintas áreas de aplicación (como la documental, geográfica, actuarial, económica, financiera, biosanitaria, etc.) y utilizarlas adecuadamente para descubrir patrones de comportamiento en datos de cualquier volumen y tipología y extraer conclusiones relevantes.
CE12 - Identificar y aplicar las técnicas adecuadas de exploración, gestión, procesamiento, explotación y visualización de datos en función de su volumen y complejidad.
CE13 - Identificar y aplicar las técnicas para la extracción de información, preparar y depurar la información disponible para su posterior análisis de datos.

ACTIVIDADES DOCENTES

Clases teóricas
50%
Clases prácticas
50%
TOTAL
100%

Presenciales

2,4

No presenciales

3,6

Semestre

4

Breve descriptor:

Depuración, codificación, transformaciones y tratamiento previo al análisis estadístico de una base de datos.

Requisitos

Se recomienda tener conocimientos de R o haber cursado Software 2 y estar cursando análisis supervisado I

Contenido

 TEMA 1. ARCHIVOS DE DATOS: CODIFICACIÓN Y TRANSFORMACIÓN

 
1.1 Tipos de variables
1.2 Codificación y transformación de datos
1.3 Gráficos y tablas
  
TEMA 2. CONTROL DE INTEGRIDAD DE LOS DATOS

2.1 Detección y tratamiento de datos atípicos (univariante)
2.2 Detección y tratamiento de datos atípicos (bivariante)
2.3 Detección y tratamiento de datos atípicos (multivariante)
2.4 Revisión de datos duplicados
  
TEMA 3. VALORES PERDIDOS: DETECCIÓN Y TRATAMIENTO
 
3.1 Detección de datos perdidos
3.2 Tratamiento de datos perdidos (imputación simple)
3.3 Tratamento de datos perdidos (imputación múltiple)
 

TEMA 4. EVALUACIÓN DE LAS HIPÓTESIS DE PARTIDA PARA EL ANÁLISIS DE DATOS
 
4.1 Pruebas de normalidad
4.2 Pruebas de homocedasticidad

Evaluación

Se valorará la nota final a través de los conocimientos adquiridos mediante el desarrollo de ejercicios, trabajos y participación en el aula , que contribuirán con el 40% a la nota final. El
porcentaje restante, el 60%, corresponderá al examen final.

La nota final tendrá en cuenta tanto la evaluación continua como la prueba final y se calculará como el máximo entre:

a) Calificación de la prueba final.
b) La media ponderada de la evaluación continua y la prueba final, siendo el peso de la evaluación continua del 40%.

La asignatura se podrá aprobar por evaluación continua.
Cualquier alumno podrá presentarse al examen final, siendo la valoración del mismo el 100% de su nota final.

Bibliografía

Introducción a la ciencia de datos con R: Preparación de los datos y análisis no supervisado. Aida Calviño Martínez, Juana María Alonso Revenga. García Maroto Editores , 2022

Depuración de datos con SPSS y SAS. Juana María Alonso Revenga. García Maroto Editores, 2019

R for data science: import, tidy, transform, visualize, and model data. Wickham, H., Grolemund, G. (2017): https://r4ds.hadley.nz/

Data Wrangling with R. Boehmke, Bradley. Springer. 2016

Estructura

MódulosMaterias
No existen datos de módulos o materias para esta asignatura.

Grupos

Clases Teóricas y/o Prácticas
GrupoPeriodosHorariosAulaProfesor
Clases Teóricas y/o Prácticas22/01/2025 - 13/05/2025VIERNES 11:00 - 13:00-SILVIA PINEDA SANJUAN


Actividades Prácticas
GrupoPeriodosHorariosAulaProfesor
Grupo Único22/01/2025 - 13/05/2025MARTES 13:00 - 15:00-SILVIA PINEDA SANJUAN