Digital House
Digital House

Data Science

Tipo: Privada
Nivel: Curso
Duracion: 4 meses
Modalidad: Presencial
Al presionar Contactar estarás enviando tus datos a Digital House para que te contacte. Al mismo tiempo te estás registrando en el boletín de viaedu.com y aceptando la POLÍTICA DE PRIVACIDAD Y PROTECCIÓN DE DATOS
Descripción General

En este programa presencial e intensivo de Data Science de 196 horas de duración vas a aprender todo lo necesario para llevar a cabo proyectos de principio a fin y al egresar vas a poder trabajar como Científico de Datos.

Incorporá las habilidades necesarias para trabajar con destreza en todo el ciclo de vida de los datos. Comenzá por aprender cómo recolectar y pre-procesar data, analizarla y visualizarla.  En 5 meses, vas a dominar los conceptos teóricos y metodologías más usadas en todo el mundo.

Vas a usar Python y librerías del ecosistema SciPy, entre otras, para la recolección, limpieza, análisis y visualización de datos. Además, aplicarás técnicas de estadística inferencial y algoritmos de machine learning usando NumPy, Pandas y Scikit-learn.


Ver Completo
Requisitos de Ingreso

Postulación

Completá la solicitud de inscripción.

Material de Nivelación

Luego de abonar la matrícula, realizá el Material de Nivelación

Desafío

Resolvé la evaluación en nuestra plataforma.

Entrevista de Admisión

Acercate a última instancia de evaluación para convertirte en alumno de Digital House.

Ver Completo
Plan de Estudio

HABILIDADES Y TECNOLOGÍAS QUE TRABAJARÁS DURANTE EL PROGRAMA

FUNDAMENTOS DE PROGRAMACIÓN EN PYTHON

Entorno de investigación y desarrollo

Aprendé a usar y configurar las herramientas que un científico de datos necesita para trabajar más eficiente y efectivamente.

Fundamentos de programación

Aprendé los algoritmos y estructuras de datos fundamentales para realizar tus análisis de datos en Python.

CONOCIMIENTOS DE PROBABILIDAD Y ESTADÍSTICA

Estadística Descriptiva

Aprendé las técnicas cuantitativas que describen las propiedades de tus datos. Las medidas de centralidad y dispersión serán tu primer aproximación a tu dataset.

Estadística Inferencial

Generalmente queremos inferir propiedades de la población sólo mirando nuestra muestra de datos. Entendé cómo realizar estas medidas predictivas asegurando un cierto grado de significación de los resultados obtenidos.

METODOLOGÍAS DE RECOLECCIÓN Y LIMPIEZA DE DATOS

Recolección de fuentes diversas

Vas a trabajar con datos estructurados y semi-estructurados, usando bases relacionales y archivos json, csv y xml. También experimentarás con datos no estructurados como texto imágenes y audio.

Medida de Calidad de los Datos

Los datos suelen incluir errores, campos vacíos y otras anomalías. Aprenderás a realizar chequeos de integridad y a lidiar con valores faltantes en tus datasets. Veremos las técnicas de limpieza y preprocesamiento más comunes usando la librería Pandas.

ELEMENTOS PRÁCTICOS DE MACHINE LEARNING

Aprendizaje Supervisado

Cuando usamos aprendizaje supervisado, disponemos de un conjunto de datos de entrenamiento. En el curso aplicarás algoritmos de clasificación y regresión para resolver los desafíos presentados en las clases.

Aprendizaje No supervisado

Se distingue del aprendizaje supervisado por el hecho de que no hay un conocimiento a priori. Usaremos Clustering para particionar los datos en grupos cuando no hay categorías/clases disponibles.

VISUALIZACIÓN DE DATOS

Técnicas de codificación visual

Vas a conocer las técnicas de codificación visual utilizadas por los expertos. Nuestra misión consiste en traducir datos complejos a relatos claros y efectivos.

Bibliotecas de visualización

Haremos prácticas con Matplotlib, Seaborn, plot.ly y Bokeh para que experimentes con distintas bibliotecas de visualización basadas en Python.



Ver Completo