Descripción
Desarrolla competencias en análisis, modelamiento y gestión de datos para la toma de decisiones.
El Diplomado en Ciencia de Datos entrega una formación aplicada orientada al análisis, tratamiento y modelamiento de datos en contextos organizacionales.
El programa aborda fundamentos estadísticos, programación en Python, machine learning, deep learning y gobernanza de datos, integrando herramientas computacionales para el análisis y la visualización de información.
A lo largo del diplomado, los participantes desarrollan competencias para trabajar con datos estructurados, aplicar modelos analíticos y apoyar procesos de toma de decisiones, considerando buenas prácticas, calidad de datos y criterios éticos en su uso.
Certificación
Al finalizar el diplomado, el participante recibirá una certificación con el nombre institucional del programa: “Diplomado en Ciencia de Datos”, que valida sus competencias en análisis, modelamiento y gestión de datos.
Objetivos
Aplicar técnicas de análisis y modelamiento de datos mediante estadística, programación en Python, machine learning, deep learning y gobernanza de datos para apoyar la toma de decisiones organizacionales.
Orientado
Dirigido a técnicos y profesionales de áreas como informática, ingeniería, estadística, análisis de datos, control de gestión o afines, que buscan desarrollar competencias en ciencia de datos y aplicar modelos analíticos en contextos organizacionales.
Requisitos de ingreso
- Comprender código fuente de Python.
- Nivel básico de: programación, Python y SQL.
- Poseer conocimientos sobre estadística descriptiva e inferencial.
- Conocimientos generales de Excel o alguna herramienta para visualización de datos (power Bi, Tableau, otros).
Contenido del Diplomado
Curso 1: Gobernanza de datos y Business Intelligence en las organizaciones
Objetivo general: Aplicar herramientas de gobernanza de datos e inteligencia de negocios para apoyar la toma de decisiones en una organización.
Unidad 1: Fundamentos de datos y procesos empresariales
- Definición e importancia de la gobernanza de datos en las organizaciones.
- Concepto y dimensiones de la calidad de datos.
- Métodos para evaluar y mejorar la calidad de los datos.
- Fundamentos de seguridad de los datos: amenazas, riesgos y medidas preventivas.
- Aspectos éticos y regulaciones legales asociadas a la gestión de datos.
- Buenas prácticas en privacidad y confidencialidad.
Unidad 2: Inteligencia de negocios y minería de datos
- Conceptos clave y aplicaciones de Business Intelligence (BI).
- Componentes de un sistema BI y su arquitectura.
- Integración de datos en sistemas de inteligencia de negocios.
- Técnicas de análisis avanzado de datos: OLAP y data mining.
- Creación de informes y herramientas de visualización de datos.
- Optimización de procesos organizacionales mediante BI.
Curso 2: Estadística y Python
Objetivo general: Aplicar técnicas de análisis estadístico descriptivo e inferencial con Python para la exploración y evaluación de datos en diversos contextos.
Unidad 1: Análisis Estadístico Descriptivo en Python
Objetivo: Aplicar técnicas de análisis estadístico descriptivo en Python en diferentes contextos.
- Introducción a Google Colab
- Ambiente de trabajo y características de Google Colab
- Creación y manejo básico de notebooks
- Limpieza y Preparación de Datos
- Detección y manejo de datos faltantes
- Manejo de datos atípicos
- Transformación y normalización de datos
- Estadísticas Básicas y Visualización de Datos
- Medidas de tendencia central, dispersión y forma
- Representaciones gráficas básicas con Matplotlib y Seaborn
- Análisis Multivariante Introductorio
- Concepto de correlación y covarianza
- Introducción al análisis de componentes principales
- Aplicación en Python con pandas y Numpy
- Exploración de datasets
- Cálculos estadísticos básicos y visualización
Unidad 2: Análisis Estadístico Inferencial en Python
Objetivo: Analizar técnicas de análisis estadístico inferencial en Python a partir de muestras en contextos diversos.
- Introducción al Análisis Inferencial
- Diferencias entre estadística descriptiva e inferencial
- Concepto de población y muestra
- Variable aleatoria
- Distribuciones de muestreo y teorema del límite central
- Intervalos de Confianza
- Concepto y cálculo de intervalos de confianza para medias
- Pruebas de Hipótesis
- Introducción a las pruebas de hipótesis
- Pruebas para una muestra (t-test)
- Análisis de Regresión Simple
- Conceptos básicos de regresión lineal
- Evaluación del ajuste del modelo y predicción
- Aplicación en Python con Statsmodels
- Construcción y evaluación de modelos
- Interpretación de resultados
Curso 3: Aplicación de herramientas computacionales para Machine Learning
Objetivo general: Implementar modelos y herramientas especializadas en gestión de datos e identificación de patrones para la toma de decisiones.
Unidad 1: Técnicas para la exploración y preparación de datos
Objetivo: Analizar datos de una disciplina u organización mediante las herramientas disponibles en Python, según el estudio predictivo de interés.
- Análisis exploratorio de datos y uso de Jupyter Notebook mediante Google Colab.
- Librerías: Numpy, Pandas, Scikit-Learn.
- Procesos de limpieza de datos: lectura de datos desde archivo y desde URL externa.
- Visualizaciones básicas de un DataFrame.
Unidad 2: Técnicas de predicción de datos con Machine Learning
Objetivo: Establecer un algoritmo de aprendizaje automático que se ajuste a las necesidades de la disciplina u organización.
- Algoritmos de aprendizaje supervisado:
- Técnicas de clasificación: Regresión logística, Métodos basados en árboles, Support Vector Machine.
- Técnicas de regresión: Regresión lineal, Métodos basados en árboles, Support Vector Machine.
- Algoritmos de aprendizaje no supervisado:
- Análisis de conglomerados para datos numéricos, categóricos y mixtos.
- Reducción de dimensionalidad para datos numéricos.
- Uso de Python para realizar estos algoritmos.
Curso 4: Deep Learning: Poniendo a prueba las redes neuronales.
Objetivo general: Elaborar distintas arquitecturas de redes neuronales en determinados escenarios mediante técnicas de comparación de métricas y “tunning”.
Unidad 1: Bases del Deep Learning: cimientos de la IA
Objetivo: Analizar las bases de las redes neuronales y sus algoritmos fundamentales.
- El perceptrón como unidad básica de las redes neuronales.
- Regresores naturales y las básicas MultiLayerPerceptron (MLP).
- Algoritmos como el descenso del gradiente y sus variantes.
- Retropropagación del error.
- Técnicas de generalización.
- Funciones de activación y regularización.
Unidad 2: Aplicaciones del Deep Learning: pongamos a trabajar algunas arquitecturas de red neuronal
Objetivo: Evaluar la eficacia de distintos tipos de redes neuronales en ciertos escenarios.
- La convolución y el residuo, desde la arquitectura ResNet.
- Clasificación de imágenes y arquitecturas como LSTM y transformer para procesos de Natural Language Processing, usando la clasificación de sentimientos en texto como escenario.
Curso 5: Storytelling with data
Objetivo general: Diseñar presentaciones efectivas a través de recursos visuales y una narrativa de fácil comprensión ante fenómenos complejos.
Unidad 1: Técnicas para la visualización de datos
Objetivo específico: Seleccionar estrategias, datos pertinentes y la mejor visualización de acuerdo con el contexto de la industria.
- ¿A qué nos referimos cuando hablamos de Storytelling?
- Elementos claves del Storytelling
- Establecer estrategias de Storytelling según la audiencia
- Selección de datos útiles
- Eliminación de la sobrecarga
- Visualización según tipos de datos
- Dirigir la atención
- Elementos visuales claves
Unidad 2: Técnicas para la presentación creativa de datos
Objetivo específico: Analizar técnicas comunicacionales efectivas basadas en datos.
- Pasos para crear un Data Story
- Uso de la narración para transmitir el mensaje a la audiencia
- Técnicas de Storytelling
- Diseño de la presentación
Financiamiento
Descuentos
- 30% Titulados Duoc UC*
- 15% - 25% Ex-alumnos de Educación Continua*
- Consulta por descuentos promocionales (*Descuentos no acumulables)
Métodos de pago
- Webpay: 3, 6 o 12 cuotas tarjeta de crédito sin interés
- Transferencia
- Orden de compra Empresa
