Data Science
En este programa presencial e intensivo de Data Science de 196 horas de duración vas a aprender todo lo necesario para llevar a cabo proyectos de principio a fin y al egresar vas a poder trabajar como Científico de Datos.
Incorporá las habilidades necesarias para trabajar con destreza en todo el ciclo de vida de los datos. Comenzá por aprender cómo recolectar y pre-procesar data, analizarla y visualizarla. En 5 meses, vas a dominar los conceptos teóricos y metodologías más usadas en todo el mundo.
Vas a usar Python y librerías del ecosistema SciPy, entre otras, para la recolección, limpieza, análisis y visualización de datos. Además, aplicarás técnicas de estadística inferencial y algoritmos de machine learning usando NumPy, Pandas y Scikit-learn.
Postulación
Completá la solicitud de inscripción.
Material de Nivelación
Luego de abonar la matrícula, realizá el Material de Nivelación
Desafío
Resolvé la evaluación en nuestra plataforma.
Entrevista de Admisión
Acercate a última instancia de evaluación para convertirte en alumno de Digital House.
HABILIDADES Y TECNOLOGÍAS QUE TRABAJARÁS DURANTE EL PROGRAMA
FUNDAMENTOS DE PROGRAMACIÓN EN PYTHON
Entorno de investigación y desarrollo
Aprendé a usar y configurar las herramientas que un científico de datos necesita para trabajar más eficiente y efectivamente.
Fundamentos de programación
Aprendé los algoritmos y estructuras de datos fundamentales para realizar tus análisis de datos en Python.
CONOCIMIENTOS DE PROBABILIDAD Y ESTADÍSTICA
Estadística Descriptiva
Aprendé las técnicas cuantitativas que describen las propiedades de tus datos. Las medidas de centralidad y dispersión serán tu primer aproximación a tu dataset.
Estadística Inferencial
Generalmente queremos inferir propiedades de la población sólo mirando nuestra muestra de datos. Entendé cómo realizar estas medidas predictivas asegurando un cierto grado de significación de los resultados obtenidos.
METODOLOGÍAS DE RECOLECCIÓN Y LIMPIEZA DE DATOS
Recolección de fuentes diversas
Vas a trabajar con datos estructurados y semi-estructurados, usando bases relacionales y archivos json, csv y xml. También experimentarás con datos no estructurados como texto imágenes y audio.
Medida de Calidad de los Datos
Los datos suelen incluir errores, campos vacíos y otras anomalías. Aprenderás a realizar chequeos de integridad y a lidiar con valores faltantes en tus datasets. Veremos las técnicas de limpieza y preprocesamiento más comunes usando la librería Pandas.
ELEMENTOS PRÁCTICOS DE MACHINE LEARNING
Aprendizaje Supervisado
Cuando usamos aprendizaje supervisado, disponemos de un conjunto de datos de entrenamiento. En el curso aplicarás algoritmos de clasificación y regresión para resolver los desafíos presentados en las clases.
Aprendizaje No supervisado
Se distingue del aprendizaje supervisado por el hecho de que no hay un conocimiento a priori. Usaremos Clustering para particionar los datos en grupos cuando no hay categorías/clases disponibles.
VISUALIZACIÓN DE DATOS
Técnicas de codificación visual
Vas a conocer las técnicas de codificación visual utilizadas por los expertos. Nuestra misión consiste en traducir datos complejos a relatos claros y efectivos.
Bibliotecas de visualización
Haremos prácticas con Matplotlib, Seaborn, plot.ly y Bokeh para que experimentes con distintas bibliotecas de visualización basadas en Python.