Data Science
Diploma de Postítulo
Diploma en Data Sciene
El diploma de postítulo en Data Science es un programa de especialización de la Escuela de Ingeniería Informática de la Facultad de Ingeniería de la Universidad de Valparaíso. Este programa permite hacer una inmersión en corto tiempo, en un área fuertemente aplicada y de demanda en la actualidad como es la ciencia de datos. Con un enfoque orientado al manejo de conceptos y herramientas para la gestión de datos (pequeños y grandes), la analítica de datos (estadística, machine learning y visualización) y sus aplicaciones en problemas reales.
-
Postulación
Hasta el 25 de Julio 2024
-
Inicio
Agosto 2024
-
Matrícula
Desde el 25 de Julio al 1 de Agosto 2024
Perfil de Egreso
Los graduados del Diploma de Postítulo en Data Science de la Universidad de Valparaíso son profesionales capaces de reconocer y comprender problemáticas de data science en diversas áreas de aplicación, utilizando para ello conocimiento actualizado de ciencias de la computación, estadísticas, tecnologías avanzadas y áreas específicas de dominio. Asimismo, son capaces de encontrar y comunicar soluciones innovadoras a dichos problemas, con responsabilidad ética y práctica de acuerdo a las necesidades de la industria y la sociedad.
Actualizar a profesionales en conocimientos y uso de herramientas avanzadas en el área de ciencia de datos, con énfasis en el trabajo aplicado y multidisciplinario, con responsabilidad ética y social, a través de la experimentación, la aplicación creativa y el desarrollo innovador de soluciones a problemas reales.
- Desarrollar capacidades en estudiantes para gestionar y manipular big data en entornos multidisciplinarios, mediante un tratamiento ético de los datos.
- Nivelar a los estudiantes en relación a los aspectos estadísticos y matemáticos fundamentales para la comprensión de modelos y resolución de problemáticas de la ciencia de datos.
- Potenciar las capacidades de análisis de datos e interpretación de resultados a través del uso de herramientas y técnicas computacionales avanzadas de data science, para la resolución de problemas aplicados, de forma creativa e innovadora, en diversas áreas del conocimiento.
- Ana Aguilera, Ingeniera en Informática, Doctora en Tratamiento de señales y comunicaciones, Magister en Ciencias de la computación, Académico Titular, Escuela de Ingeniería Informática. Universidad de Valparaíso.
- Fabián Riquelme, Ingeniero Civil Informático, Doctor en Computación, Magister en Ciencias de la Computación, Académico Adjunto, Escuela de Ingeniería Informática. Universidad de Valparaíso.
- Rodrigo Salas, Ingeniero Civil Informático, Doctor en Ingeniería Informática, Magister en Ingeniería Informática, Académico Titular, Escuela de Biomédica. Universidad de Valparaíso.
- Pablo González Cantergiani, Ingeniero Ejecución en Computación e Informática, Magister en Ingeniería Informática. Falabella Retail S.A. Principal Data Scientist.
- Julio Sotelo, Ingeniero Civil Biomédico, Doctor en Ciencias de la Ingeniería, Magister en Ciencias de la Ingeniería y Magister en Data Science, Académico del Departamento de Informática, Universidad Técnica Federico Santa María.
- Francisco Plaza, Ingeniero pesquero, Doctor en estadística, Académico asociado del Departamento de Matemática y Ciencias de la Computación, USACH
Para acceder al Diploma de Postítulo en Data Science, los postulantes deberán acreditar un título profesional universitario de 4 años o más de duración, o el grado de Licenciado. Es deseable que el postulante demuestre una experiencia de al menos 3 años en el área del Diploma.
Se deberá presentar la siguiente documentación obligatoria:
- Certificado de título profesional y/o grado académico.
- Currículum Vitae actualizado.
- Carta de motivación (resumen de intereses profesionales y/o académicos).
*Se realizará, además, una entrevista personal al postulante.
Plan de Estudios
Profesora: Ana Aguilera Faraco, PhD
DPDC-101 / 2 créditos SCT
INTRODUCCIÓN Y MOTIVACIÓN
FUENTES DE DATOS
○ Metodología de gestión de datos
○ Fuentes de datos y formatos
○ Preprocesamiento de datos
DIMENSIÓN DE LOS DATOS
○ Reducción de dimensionalidad (métodos de selección y extracción de características)
○ Selección de instancias (problema de sesgo)
○ Estudio de Over/underfitting (definición, problemas, métodos para tratarlo)
TRANSFORMACIÓN Y CARGA DE DATOS
○ Datos ausentes, outliers y otros
○ Carga de datos desde diferentes fuentes
ÉTICA DE LOS DATOS Y ALGORITMOS
○ Reflexiones sobre ética de la ingeniería: distribución de responsabilidades. Ética de negocios
○ Reflexiones sobre ética en Data Science: bioética, datos y normativa actual en Chile. Reactividad de las definiciones legales.
○ Reflexiones sobre ética en Data Science: inteligencia artificial y software.
Profesor: PhD Francisco Plaza
DPDC-102 / 2 créditos SCT
Introducción y motivación
Unidad 1: Probabilidad
● Experimento aleatorio, espacio muestral
● El concepto de probabilidad
● Cálculo de probabilidades
● Variables Aleatorias
● Variables aleatorias unidimensionales proveniente de distribución Normal
● Variables aleatorias unidimensionales proveniente de distribución Exponencial
● Vectores aleatorios proveniente de distribución Normal multivariada
● Transformación de variables
Unidad 2: Estimación de modelos corte transversal
● Métodos de estimación modelos de regresión lineal simple
● Métodos de estimación modelos de regresión Probit-Logit
● Métodos de estimación modelos de regresión logística multinomial
● Métodos de estimación modelos de regresión ordinal
● Otros métodos de estimación
Unidad 3: Estimación modelos en serie de tiempo
● Métodos de estimación modelos ARIMA
● Métodos de estimación modelos GARCH
● Métodos de estimación modelos de de datos en panel
● Otros métodos de estimación
-
Profesor: PhD Julio Sotelo
DPDC-103 / 2 créditos SCT
Unidad 1: Introducción a la analítica de datos elemental
- Tomar de decisiones basadas en información.
- Exploración uni y multi dimensional de datos.
- Tópicos de modelización para la ciencia de datos.
Unidad 2: Recursos para la visualización de datos
- Librerías computacionales para la visualización estática e interactiva.
- Visualización de datos no estructurados.
- Análisis, diseño y presentación de la visualización.
Profesor: PhD Rodrigo Salas
DPDC-104 / 3 créditos SCT
INTRODUCCIÓN Y MOTIVACIÓN
FUNDAMENTOS TEÓRICOS DE MACHINE LEARNING
○ El aprendizaje estadístico
○ Tipos de Aprendizaje
MÉTODOS SUPERVISADOS DE MACHINE LEARNING
○ Clasificadores Bayesianos: LDA, QDA
○ Arboles de Decisión
○ Regresión Logística
○ Máquinas de Vectores de Soporte SVM
○ Técnicas de Ensamblado de Máquinas: Random Forest, XGBoost.
MÉTODOS NO-SUPERVISADOS DE MACHINE LEARNING
○ Técnicas de Clustering
○ K-Medias
○ Clustering Aglomerativo
○ Clustering Jerárquico
○ Clustering basado en densidad
REDES NEURONALES ARTIFICIALES Y DEEP LEARNING
○ Estructura y Aprendizaje de las Redes Neuronales Artificiales
○ Perceptrón Multicapa
○ Red Neuronal Convolucional
○ Red Neuronal Recurrente: LSTM
MÉTODOS DE EVALUACIÓN, VALIDACIÓN Y SELECCIÓN DE MODELOS
○ Matriz de Confusión
○ Métricas de Desempeño (Error cuadrático medio, coeficiente de determinación, etc)
○ Curva ROC
○ Criterios de Información AIC; BIC
○ Validación Cruzada
Profesor: Mag. Pablo González Cantergiani
DPDC-105 / 2 créditos SCT
Fundamentos de BigData
▪ Definición, conceptos y desafíos actuales del trabajo con Bigdata.
▪ Sistemas distribuidos, escalabilidad vertical y horizontal.
▪ Modelo de procesamiento MapReduce.
▪ Almacenamiento en HDFS.
▪ Programación MapReduce en Hadoop.
Cloud Computing
▪ Sistemas Cloud en comparación con On Premise.
▪ Proveedores públicos.
▪ Modelos de Servicio (IAAS, PAAS, SAAS).
▪ Modelos de Despliegue (Privada, Pública, Multi-cloud).
▪ Base de datos escalables.
▪ Casos de uso y arquitecturas.
Contenedores y arquitectura serverless
▪ Contenedores e imágenes Docker.
▪ Sistemas de integración y distribución continua.
▪ Introducción a Kubernetes.
Tecnologías para procesamiento batch y streaming
▪ Introducción a Apache Spark.
▪ Funciones y operaciones básicas.
▪ Programación ejemplos aplicados en streaming.
Profesor: PhD Fabián Riquelme
DPDC-106 / 2 créditos SCT
Data science en la Industria, Educación y Sociedad
- Modelos de negocio, alcances y aplicaciones de data science en la industria
- Modelos de negocio, alcances y aplicaciones de data science en la educación
- Modelos de negocio, alcances y aplicaciones de data science en la sociedad
HORARIO
Modalidad 100% virtual diurno/vespertivo
Sábados 8:30 - 14:30 pm
Horas Síncronicas 90 hrs
Horas Asíncronicas 126 hrs
DURACIÓN
1 Semestre / 13 créditos
ARANCELES
Matrícula: $85.000
Arancel Total: $1.700.000
CONTACTO
Directora de Programa, Ana Aguilera Faraco, Ph.D.
+56 32 260 3735