Bluetab - Curso ciencia de datos 2017/18

Introducción

Este curso se apoya, por una parte, en la formación online a través de DataCamp y, por otra, en el grupo de trabajo. Cada semana el alumno deberá realizar el curso que toque más un pequeño ejercicio de refuerzo. Más o menos una vez al mes, dejaremos una semana de descanso en la que realizaremos un ejercicio más completo.

Cada alumno puede elegir si seguir el curso en R o en Python. Incluso si se atreve, ¡en ambos a la vez!

Programa

Semana (inicio) Curso track R Curso track Python
2017-10-30 Introduction to R Intro to Python for Data Science
2017-11-06 Intermediate R Intermediate Python for Data Science
2017-11-13 Intermediate R - Practice Python Data Science Toolbox (Part 1)
2017-11-20 Writing functions in R Python Data Science Toolbox (Part 2)
2017-11-27 Ejercicio Ejercicio
2017-12-04 Puente diciembre Puente diciembre
2017-12-11 Importing Data in R (Part 1) Importing Data in Python (Part 1)
2017-12-18 Importing Data in R (Part 2) Importing Data in Python (Part 2)
2017-12-25 Navidad Navidad
2018-01-01 Año nuevo Año nuevo
2018-01-08 Cleaning Data in R Cleaning Data in Python
2018-01-15 Importing & Cleaning Data in R: Case Studies Introduction to Databases in Python
2018-01-22 Reporting with R Markdown pandas Foundations
2018-01-29 Ejercicio Ejercicio
2018-02-05 Data Manipulation in R with dplyr Manipulating DataFrames with pandas
2018-02-12 Joining Data in R with dplyr Merging DataFrames with pandas
2018-02-19 Data Visualization with ggplot2 (Part 1) Introduction to Data Visualization with Python
2018-02-26 Data Visualization with ggplot2 (Part 2) Interactive Data Visualization with Bokeh
2018-03-05 Ejercicio Ejercicio
2018-03-12 Introduction to Data Statistical Thinking in Python (Part 1)
2018-03-19 Exploratory Data Analysis Statistical Thinking in Python (Part 2)
2018-03-26 Semana santa Semana santa
2018-04-02 Exploratory Data Analysis in R: Case Study Case Studies in Statistical Thinking
2018-04-09 Correlation and Regression Importing & Managing Financial Data in Python
2018-04-16 Ejercicio Ejercicio
2018-04-23 Introduction to Machine Learning Supervised Learning with scikit-learn
2018-04-30 Puente mayo Puente mayo
2018-05-07 Foundations of Inference Unsupervised Learning in Python
2018-05-14 Machine Learning Toolbox Machine Learning with the Experts: School Budgets
2018-05-21 Supervised Learning in R: Classification Network Analysis in Python (Part 1)
2018-05-28 Ejercicio Ejercicio
2018-06-04 Supervised Learning in R: Regression Network Analysis in Python (Part 2)
2018-06-11 Unsupervised Learning in R Natural Language Processing Fundamentals in Python
2018-06-18 Proyecto final Proyecto final

Preparación del entorno de trabajo

Tanto si vas a trabajar en R como en Python, necesitarás 4 cosas:

R

Instala la última versión de R y de RStudio. Están disponibles aquí:

Python

Instala la última versión de Python 3 y el IDE que prefieras. Para este último, hay muchas opciones: Spyder, Rodeo, un editor de texto (como Atom) + una extensión para ejecutar código, … Lo importante es que sea cómodo para ir ejecutando poco a poco el código que vas escribiendo. Mi recomendación es Rodeo (que está inspirado en RStudio), pero si tienes otra preferencia, adelante.

Además, necesitarás un gestor de dependencias (al estilo maven, npm, …) para instalar las liberías que necesites. Los más conocidos son pip y conda. Mi recomendación es pip, pero son similares.

Herramientas