Skip to main content

Data Science

Diploma de Postítulo


Diploma en Data Sciene

El diploma de postítulo en Data Science es un programa de especialización de la Escuela de Ingeniería Informática de la Facultad de Ingeniería de la Universidad de Valparaíso. Este programa permite hacer una inmersión en corto tiempo, en un área fuertemente aplicada y de demanda en la actualidad como es la ciencia de datos. Con un enfoque orientado al manejo de conceptos y herramientas para la gestión de datos (pequeños y grandes), la analítica de datos (estadística, machine learning y visualización) y sus aplicaciones en problemas reales.

  • Postulación

    Hasta el 25 de Julio 2024

  • Inicio

     Agosto 2024

  • Matrícula

         Desde el 25 de Julio al 1 de Agosto 2024


Perfil de Egreso

Los graduados del Diploma de Postítulo en Data Science de la Universidad de Valparaíso son profesionales capaces de reconocer y comprender problemáticas de data science en diversas áreas de aplicación, utilizando para ello conocimiento actualizado de ciencias de la computación, estadísticas, tecnologías avanzadas y áreas específicas de dominio. Asimismo, son capaces de encontrar y comunicar soluciones innovadoras a dichos problemas, con responsabilidad ética y práctica de acuerdo a las necesidades de la industria y la sociedad.


Objetivo General

Actualizar a profesionales en conocimientos y uso de herramientas avanzadas en el área de ciencia de datos, con énfasis en el trabajo aplicado y multidisciplinario, con responsabilidad ética y social, a través de la experimentación, la aplicación creativa y el desarrollo innovador de soluciones a problemas reales.

Objetivos Específicos
  • Desarrollar capacidades en estudiantes para gestionar y manipular big data en entornos multidisciplinarios, mediante un tratamiento ético de los datos.

  • Nivelar a los estudiantes en relación a los aspectos estadísticos y matemáticos fundamentales para la comprensión de modelos y resolución de problemáticas de la ciencia de datos.

  • Potenciar las capacidades de análisis de datos e interpretación de resultados a través del uso de herramientas y técnicas computacionales avanzadas de data science, para la resolución de problemas aplicados, de forma creativa e innovadora, en diversas áreas del conocimiento.
Cuerpo Académico
  • Ana Aguilera, Ingeniera en Informática, Doctora en Tratamiento de señales y comunicaciones, Magister en Ciencias de la computación, Académico Titular, Escuela de Ingeniería Informática. Universidad de Valparaíso.
  • Fabián Riquelme, Ingeniero Civil Informático, Doctor en Computación, Magister en Ciencias de la Computación, Académico Adjunto, Escuela de Ingeniería Informática. Universidad de Valparaíso.
  • Rodrigo Salas, Ingeniero Civil Informático, Doctor en Ingeniería Informática, Magister en Ingeniería Informática, Académico Titular, Escuela de Biomédica. Universidad de Valparaíso.
  • Pablo González Cantergiani, Ingeniero Ejecución en Computación e Informática, Magister en Ingeniería Informática. Falabella Retail S.A. Principal Data Scientist.
  • Julio Sotelo, Ingeniero Civil Biomédico, Doctor en Ciencias de la Ingeniería, Magister en Ciencias de la Ingeniería y Magister en Data Science, Académico del Departamento de Informática, Universidad Técnica Federico Santa María.
  • Francisco Plaza, Ingeniero pesquero, Doctor en estadística, Académico asociado del Departamento de Matemática y Ciencias de la Computación, USACH
Requisitos Académicos

Para acceder al Diploma de Postítulo en Data Science, los postulantes deberán acreditar un título profesional universitario de 4 años o más de duración, o el grado de Licenciado. Es deseable que el postulante demuestre una experiencia de al menos 3 años en el área del Diploma.

Se deberá presentar la siguiente documentación obligatoria:

  • Certificado de título profesional y/o grado académico.
  • Currículum Vitae actualizado.
  • Carta de motivación (resumen de intereses profesionales y/o académicos).

*Se realizará, además, una entrevista personal al postulante.

Plan de Estudios

Gestión y ética de los datos

Profesora: Ana Aguilera Faraco, PhD

DPDC-101 / 2 créditos SCT 

INTRODUCCIÓN Y MOTIVACIÓN

FUENTES DE DATOS
○ Metodología de gestión de datos
○ Fuentes de datos y formatos
○ Preprocesamiento de datos

DIMENSIÓN DE LOS DATOS
○ Reducción de dimensionalidad (métodos de selección y extracción de características)
○ Selección de instancias (problema de sesgo)
○ Estudio de Over/underfitting (definición, problemas, métodos para tratarlo)

TRANSFORMACIÓN Y CARGA DE DATOS
○ Datos ausentes, outliers y otros
○ Carga de datos desde diferentes fuentes

ÉTICA DE LOS DATOS Y ALGORITMOS
○ Reflexiones sobre ética de la ingeniería: distribución de responsabilidades. Ética de negocios
○ Reflexiones sobre ética en Data Science: bioética, datos y normativa actual en Chile. Reactividad de las definiciones legales.
○ Reflexiones sobre ética en Data Science: inteligencia artificial y software.

Modelos estadísticos

Profesor: PhD Francisco Plaza

DPDC-102 / 2 créditos SCT

Introducción y motivación

Unidad 1: Probabilidad
● Experimento aleatorio, espacio muestral
● El concepto de probabilidad
● Cálculo de probabilidades
● Variables Aleatorias
● Variables aleatorias unidimensionales proveniente de distribución Normal
● Variables aleatorias unidimensionales proveniente de distribución Exponencial
● Vectores aleatorios proveniente de distribución Normal multivariada
● Transformación de variables

Unidad 2: Estimación de modelos corte transversal 
● Métodos de estimación modelos de regresión lineal simple
● Métodos de estimación modelos de regresión Probit-Logit
● Métodos de estimación modelos de regresión logística multinomial
● Métodos de estimación modelos de regresión ordinal
● Otros métodos de estimación

Unidad 3: Estimación modelos en serie de tiempo
● Métodos de estimación modelos ARIMA
● Métodos de estimación modelos GARCH
● Métodos de estimación modelos de de datos en panel
● Otros métodos de estimación

Analítica y visualización de los datos
  • Profesor: PhD Julio Sotelo 

    DPDC-103 / 2 créditos SCT

    Unidad 1: Introducción a la analítica de datos elemental

    • Tomar de decisiones basadas en información.
    • Exploración uni y multi dimensional de datos.
    • Tópicos de modelización para la ciencia de datos.

    Unidad 2: Recursos para la visualización de datos 

    • Librerías computacionales para la visualización estática e interactiva.
    • Visualización de datos no estructurados.
    • Análisis, diseño y presentación de la visualización.
Machine learning y deep learning

Profesor: PhD Rodrigo Salas

DPDC-104 / 3 créditos SCT

INTRODUCCIÓN Y MOTIVACIÓN 

FUNDAMENTOS TEÓRICOS DE MACHINE LEARNING 
○ El aprendizaje estadístico
○ Tipos de Aprendizaje

MÉTODOS SUPERVISADOS DE MACHINE LEARNING
○ Clasificadores Bayesianos: LDA, QDA
○ Arboles de Decisión
○ Regresión Logística
○ Máquinas de Vectores de Soporte SVM
○ Técnicas de Ensamblado de Máquinas: Random Forest, XGBoost.

MÉTODOS NO-SUPERVISADOS DE MACHINE LEARNING 
○ Técnicas de Clustering
○ K-Medias
○ Clustering Aglomerativo
○ Clustering Jerárquico
○ Clustering basado en densidad

REDES NEURONALES ARTIFICIALES Y DEEP LEARNING
○ Estructura y Aprendizaje de las Redes Neuronales Artificiales
○ Perceptrón Multicapa
○ Red Neuronal Convolucional
○ Red Neuronal Recurrente: LSTM

MÉTODOS DE EVALUACIÓN, VALIDACIÓN Y SELECCIÓN DE MODELOS
○ Matriz de Confusión
○ Métricas de Desempeño (Error cuadrático medio, coeficiente de determinación, etc)
○ Curva ROC
○ Criterios de Información AIC; BIC
○ Validación Cruzada

Big Data

Profesor: Mag. Pablo González Cantergiani

DPDC-105 / 2 créditos SCT

Fundamentos de BigData
▪ Definición, conceptos y desafíos actuales del trabajo con Bigdata.
▪ Sistemas distribuidos, escalabilidad vertical y horizontal.
▪ Modelo de procesamiento MapReduce.
▪ Almacenamiento en HDFS.
▪ Programación MapReduce en Hadoop.

Cloud Computing
▪ Sistemas Cloud en comparación con On Premise.
▪ Proveedores públicos.
▪ Modelos de Servicio (IAAS, PAAS, SAAS).
▪ Modelos de Despliegue (Privada, Pública, Multi-cloud).
▪ Base de datos escalables.
▪ Casos de uso y arquitecturas.

Contenedores y arquitectura serverless
▪ Contenedores e imágenes Docker.
▪ Sistemas de integración y distribución continua.
▪ Introducción a Kubernetes.

Tecnologías para procesamiento batch y streaming
▪ Introducción a Apache Spark.
▪ Funciones y operaciones básicas.
▪ Programación ejemplos aplicados en streaming.

Aplicaciones Data Science

Profesor: PhD Fabián Riquelme

DPDC-106 / 2 créditos SCT

Data science en la Industria, Educación y Sociedad

  • Modelos de negocio, alcances y aplicaciones de data science en la industria
  • Modelos de negocio, alcances y aplicaciones de data science en la educación
  • Modelos de negocio, alcances y aplicaciones de data science en la sociedad

HORARIO

Modalidad 100% virtual diurno/vespertivo

Sábados 8:30 - 14:30 pm

Horas Síncronicas 90 hrs

Horas Asíncronicas 126 hrs

DURACIÓN

1 Semestre / 13 créditos

ARANCELES

Matrícula: $85.000
Arancel Total: $1.700.000

CONTACTO

Directora de Programa, Ana Aguilera Faraco, Ph.D.

+56 32 260 3735
Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo.
Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo.

Conoce nuestro programas de especialización