

El diploma de postítulo en Data Science es un programa de especialización de la Escuela de Ingeniería Informática de la Facultad de Ingeniería de la Universidad de Valparaíso. Este programa permite hacer una inmersión en corto tiempo, en un área fuertemente aplicada y de demanda en la actualidad como es la ciencia de datos. Con un enfoque orientado al manejo de conceptos y herramientas para la gestión de datos (pequeños y grandes), la analítica de datos (estadística, machine learning y visualización) y sus aplicaciones en problemas reales.
Hasta el 21 de Marzo 2025
Abril 2025
Desde el 22 al 31 de Marzo 2025
14
Los graduados del Diploma de Postítulo en Data Science de la Universidad de Valparaíso son profesionales capaces de reconocer y comprender problemáticas de data science en diversas áreas de aplicación, utilizando para ello conocimiento actualizado de ciencias de la computación, estadísticas, tecnologías avanzadas y áreas específicas de dominio. Asimismo, son capaces de encontrar y comunicar soluciones innovadoras a dichos problemas, con responsabilidad ética y práctica de acuerdo a las necesidades de la industria y la sociedad.
Actualizar a profesionales en conocimientos y uso de herramientas avanzadas en el área de ciencia de datos, con énfasis en el trabajo aplicado y multidisciplinario, con responsabilidad ética y social, a través de la experimentación, la aplicación creativa y el desarrollo innovador de soluciones a problemas reales.
Para acceder al Diploma de Postítulo en Data Science, los postulantes deberán acreditar un título profesional universitario de 4 años o más de duración, o el grado de Licenciado. Es deseable que el postulante demuestre una experiencia de al menos 3 años en el área del Diploma.
Se deberá presentar la siguiente documentación obligatoria:
*Se realizará, además, una entrevista personal al postulante.
Profesora: Ana Aguilera Faraco, PhD
DPDC-101 / 2 créditos SCT
INTRODUCCIÓN Y MOTIVACIÓN
FUENTES DE DATOS
○ Metodología de gestión de datos
○ Fuentes de datos y formatos
○ Preprocesamiento de datos
DIMENSIÓN DE LOS DATOS
○ Reducción de dimensionalidad (métodos de selección y extracción de características)
○ Selección de instancias (problema de sesgo)
○ Estudio de Over/underfitting (definición, problemas, métodos para tratarlo)
TRANSFORMACIÓN Y CARGA DE DATOS
○ Datos ausentes, outliers y otros
○ Carga de datos desde diferentes fuentes
ÉTICA DE LOS DATOS Y ALGORITMOS
○ Reflexiones sobre ética de la ingeniería: distribución de responsabilidades. Ética de negocios
○ Reflexiones sobre ética en Data Science: bioética, datos y normativa actual en Chile. Reactividad de las definiciones legales.
○ Reflexiones sobre ética en Data Science: inteligencia artificial y software.
Profesor: PhD Francisco Plaza
DPDC-102 / 2 créditos SCT
Introducción y motivación
Unidad 1: Probabilidad
● Experimento aleatorio, espacio muestral
● El concepto de probabilidad
● Cálculo de probabilidades
● Variables Aleatorias
● Variables aleatorias unidimensionales proveniente de distribución Normal
● Variables aleatorias unidimensionales proveniente de distribución Exponencial
● Vectores aleatorios proveniente de distribución Normal multivariada
● Transformación de variables
Unidad 2: Estimación de modelos corte transversal
● Métodos de estimación modelos de regresión lineal simple
● Métodos de estimación modelos de regresión Probit-Logit
● Métodos de estimación modelos de regresión logística multinomial
● Métodos de estimación modelos de regresión ordinal
● Otros métodos de estimación
Unidad 3: Estimación modelos en serie de tiempo
● Métodos de estimación modelos ARIMA
● Métodos de estimación modelos GARCH
● Métodos de estimación modelos de de datos en panel
● Otros métodos de estimación
Profesor: PhD Julio Sotelo
DPDC-103 / 2 créditos SCT
Unidad 1: Introducción a la analítica de datos elemental
Unidad 2: Recursos para la visualización de datos
Profesor: PhD Rodrigo Salas
DPDC-104 / 3 créditos SCT
INTRODUCCIÓN Y MOTIVACIÓN
FUNDAMENTOS TEÓRICOS DE MACHINE LEARNING
○ El aprendizaje estadístico
○ Tipos de Aprendizaje
MÉTODOS SUPERVISADOS DE MACHINE LEARNING
○ Clasificadores Bayesianos: LDA, QDA
○ Arboles de Decisión
○ Regresión Logística
○ Máquinas de Vectores de Soporte SVM
○ Técnicas de Ensamblado de Máquinas: Random Forest, XGBoost.
MÉTODOS NO-SUPERVISADOS DE MACHINE LEARNING
○ Técnicas de Clustering
○ K-Medias
○ Clustering Aglomerativo
○ Clustering Jerárquico
○ Clustering basado en densidad
REDES NEURONALES ARTIFICIALES Y DEEP LEARNING
○ Estructura y Aprendizaje de las Redes Neuronales Artificiales
○ Perceptrón Multicapa
○ Red Neuronal Convolucional
○ Red Neuronal Recurrente: LSTM
MÉTODOS DE EVALUACIÓN, VALIDACIÓN Y SELECCIÓN DE MODELOS
○ Matriz de Confusión
○ Métricas de Desempeño (Error cuadrático medio, coeficiente de determinación, etc)
○ Curva ROC
○ Criterios de Información AIC; BIC
○ Validación Cruzada
Profesor: Mag. Pablo González Cantergiani
DPDC-105 / 2 créditos SCT
Fundamentos de BigData
▪ Definición, conceptos y desafíos actuales del trabajo con Bigdata.
▪ Sistemas distribuidos, escalabilidad vertical y horizontal.
▪ Modelo de procesamiento MapReduce.
▪ Almacenamiento en HDFS.
▪ Programación MapReduce en Hadoop.
Cloud Computing
▪ Sistemas Cloud en comparación con On Premise.
▪ Proveedores públicos.
▪ Modelos de Servicio (IAAS, PAAS, SAAS).
▪ Modelos de Despliegue (Privada, Pública, Multi-cloud).
▪ Base de datos escalables.
▪ Casos de uso y arquitecturas.
Contenedores y arquitectura serverless
▪ Contenedores e imágenes Docker.
▪ Sistemas de integración y distribución continua.
▪ Introducción a Kubernetes.
Tecnologías para procesamiento batch y streaming
▪ Introducción a Apache Spark.
▪ Funciones y operaciones básicas.
▪ Programación ejemplos aplicados en streaming.
Profesor: PhD Fabián Riquelme
DPDC-106 / 2 créditos SCT
Data science en la Industria, Educación y Sociedad
Modalidad 100% virtual diurno/vespertivo
Sábados 8:30 - 14:30 pm
Horas Síncronicas 90 hrs
Horas Asíncronicas 126 hrs
1 Semestre / 13 créditos
Matrícula: $85.000
Arancel Total: $1.700.000
Directora de Programa, Ana Aguilera Faraco, Ph.D.
+56 32 260 3735