Diplomado en Ciencia de Datos – Duoc UC

Diplomado en Ciencia de Datos

Diplomado en Ciencia de Datos

Horas

7 Meses


Modalidad

Online Sincrónica
Clases en vivo, con interacción inmediata y acompañamiento directo.

Fecha y horario

Fecha inicio: 08-04-2026
Clases: lunes y miércoles
19:00 a 22:00 hrs

Valor

$1.350.000


Descargar brochure Solicitar información Inscríbete ahora

Descripción

Desarrolla competencias en análisis, modelamiento y gestión de datos para la toma de decisiones.

El Diplomado en Ciencia de Datos entrega una formación aplicada orientada al análisis, tratamiento y modelamiento de datos en contextos organizacionales.

El programa aborda fundamentos estadísticos, programación en Python, machine learning, deep learning y gobernanza de datos, integrando herramientas computacionales para el análisis y la visualización de información.

A lo largo del diplomado, los participantes desarrollan competencias para trabajar con datos estructurados, aplicar modelos analíticos y apoyar procesos de toma de decisiones, considerando buenas prácticas, calidad de datos y criterios éticos en su uso.


Certificación

Al finalizar el diplomado, el participante recibirá una certificación con el nombre institucional del programa: “Diplomado en Ciencia de Datos”, que valida sus competencias en análisis, modelamiento y gestión de datos.


Objetivos

Aplicar técnicas de análisis y modelamiento de datos mediante estadística, programación en Python, machine learning, deep learning y gobernanza de datos para apoyar la toma de decisiones organizacionales.


Orientado

Dirigido a técnicos y profesionales de áreas como informática, ingeniería, estadística, análisis de datos, control de gestión o afines, que buscan desarrollar competencias en ciencia de datos y aplicar modelos analíticos en contextos organizacionales.

 


Requisitos de ingreso

  • Comprender código fuente de Python.
  • Nivel básico de: programación, Python y SQL.
  • Poseer conocimientos sobre estadística descriptiva e inferencial.
  • Conocimientos generales de Excel o alguna herramienta para visualización de datos (power Bi, Tableau, otros).

Contenido del Diplomado

Objetivo general: Aplicar herramientas de gobernanza de datos e inteligencia de negocios para apoyar la toma de decisiones en una organización.

Unidad 1: Fundamentos de datos y procesos empresariales

  • Definición e importancia de la gobernanza de datos en las organizaciones.
  • Concepto y dimensiones de la calidad de datos.
  • Métodos para evaluar y mejorar la calidad de los datos.
  • Fundamentos de seguridad de los datos: amenazas, riesgos y medidas preventivas.
  • Aspectos éticos y regulaciones legales asociadas a la gestión de datos.
  • Buenas prácticas en privacidad y confidencialidad.

Unidad 2: Inteligencia de negocios y minería de datos

  • Conceptos clave y aplicaciones de Business Intelligence (BI).
  • Componentes de un sistema BI y su arquitectura.
  • Integración de datos en sistemas de inteligencia de negocios.
  • Técnicas de análisis avanzado de datos: OLAP y data mining.
  • Creación de informes y herramientas de visualización de datos.
  • Optimización de procesos organizacionales mediante BI.

Objetivo general: Aplicar técnicas de análisis estadístico descriptivo e inferencial con Python para la exploración y evaluación de datos en diversos contextos.

Unidad 1: Análisis Estadístico Descriptivo en Python

Objetivo: Aplicar técnicas de análisis estadístico descriptivo en Python en diferentes contextos.

  • Introducción a Google Colab
    • Ambiente de trabajo y características de Google Colab
    • Creación y manejo básico de notebooks
  • Limpieza y Preparación de Datos
    • Detección y manejo de datos faltantes
    • Manejo de datos atípicos
    • Transformación y normalización de datos
  • Estadísticas Básicas y Visualización de Datos
    • Medidas de tendencia central, dispersión y forma
    • Representaciones gráficas básicas con Matplotlib y Seaborn
  • Análisis Multivariante Introductorio
    • Concepto de correlación y covarianza
    • Introducción al análisis de componentes principales
  • Aplicación en Python con pandas y Numpy
    • Exploración de datasets
    • Cálculos estadísticos básicos y visualización

Unidad 2: Análisis Estadístico Inferencial en Python

Objetivo: Analizar técnicas de análisis estadístico inferencial en Python a partir de muestras en contextos diversos.

  • Introducción al Análisis Inferencial
    • Diferencias entre estadística descriptiva e inferencial
    • Concepto de población y muestra
    • Variable aleatoria
    • Distribuciones de muestreo y teorema del límite central
  • Intervalos de Confianza
    • Concepto y cálculo de intervalos de confianza para medias
  • Pruebas de Hipótesis
    • Introducción a las pruebas de hipótesis
    • Pruebas para una muestra (t-test)
  • Análisis de Regresión Simple
    • Conceptos básicos de regresión lineal
    • Evaluación del ajuste del modelo y predicción
  • Aplicación en Python con Statsmodels
    • Construcción y evaluación de modelos
    • Interpretación de resultados

Objetivo general: Implementar modelos y herramientas especializadas en gestión de datos e identificación de patrones para la toma de decisiones.

Unidad 1: Técnicas para la exploración y preparación de datos

Objetivo: Analizar datos de una disciplina u organización mediante las herramientas disponibles en Python, según el estudio predictivo de interés.

  • Análisis exploratorio de datos y uso de Jupyter Notebook mediante Google Colab.
  • Librerías: Numpy, Pandas, Scikit-Learn.
  • Procesos de limpieza de datos: lectura de datos desde archivo y desde URL externa.
  • Visualizaciones básicas de un DataFrame.

Unidad 2: Técnicas de predicción de datos con Machine Learning

Objetivo: Establecer un algoritmo de aprendizaje automático que se ajuste a las necesidades de la disciplina u organización.

  • Algoritmos de aprendizaje supervisado:
    • Técnicas de clasificación: Regresión logística, Métodos basados en árboles, Support Vector Machine.
    • Técnicas de regresión: Regresión lineal, Métodos basados en árboles, Support Vector Machine.
  • Algoritmos de aprendizaje no supervisado:
    • Análisis de conglomerados para datos numéricos, categóricos y mixtos.
    • Reducción de dimensionalidad para datos numéricos.
  • Uso de Python para realizar estos algoritmos.

Objetivo general: Elaborar distintas arquitecturas de redes neuronales en determinados escenarios mediante técnicas de comparación de métricas y “tunning”.

Unidad 1: Bases del Deep Learning: cimientos de la IA

Objetivo: Analizar las bases de las redes neuronales y sus algoritmos fundamentales.

  • El perceptrón como unidad básica de las redes neuronales.
  • Regresores naturales y las básicas MultiLayerPerceptron (MLP).
  • Algoritmos como el descenso del gradiente y sus variantes.
  • Retropropagación del error.
  • Técnicas de generalización.
  • Funciones de activación y regularización.

Unidad 2: Aplicaciones del Deep Learning: pongamos a trabajar algunas arquitecturas de red neuronal

Objetivo: Evaluar la eficacia de distintos tipos de redes neuronales en ciertos escenarios.

  • La convolución y el residuo, desde la arquitectura ResNet.
  • Clasificación de imágenes y arquitecturas como LSTM y transformer para procesos de Natural Language Processing, usando la clasificación de sentimientos en texto como escenario.

Objetivo general: Diseñar presentaciones efectivas a través de recursos visuales y una narrativa de fácil comprensión ante fenómenos complejos.

Unidad 1: Técnicas para la visualización de datos

Objetivo específico: Seleccionar estrategias, datos pertinentes y la mejor visualización de acuerdo con el contexto de la industria.

  • ¿A qué nos referimos cuando hablamos de Storytelling?
  • Elementos claves del Storytelling
  • Establecer estrategias de Storytelling según la audiencia
  • Selección de datos útiles
  • Eliminación de la sobrecarga
  • Visualización según tipos de datos
  • Dirigir la atención
  • Elementos visuales claves

Unidad 2: Técnicas para la presentación creativa de datos

Objetivo específico: Analizar técnicas comunicacionales efectivas basadas en datos.

  • Pasos para crear un Data Story
  • Uso de la narración para transmitir el mensaje a la audiencia
  • Técnicas de Storytelling
  • Diseño de la presentación

Financiamiento

Descuentos

  • 30% Titulados Duoc UC*
  • 15% - 25% Ex-alumnos de Educación Continua*
  • Consulta por descuentos promocionales (*Descuentos no acumulables)

Métodos de pago

  • Webpay: 3, 6 o 12 cuotas tarjeta de crédito sin interés
  • Transferencia
  • Orden de compra Empresa