Bluetab - Curso ciencia de datos 2017/18
Introducción
Este curso se apoya, por una parte, en la formación online a través de DataCamp y, por otra, en el grupo de trabajo. Cada semana el alumno deberá realizar el curso que toque más un pequeño ejercicio de refuerzo. Más o menos una vez al mes, dejaremos una semana de descanso en la que realizaremos un ejercicio más completo.
Cada alumno puede elegir si seguir el curso en R o en Python. Incluso si se atreve, ¡en ambos a la vez!
Programa
Preparación del entorno de trabajo
Tanto si vas a trabajar en R como en Python, necesitarás 4 cosas:
- El lenguaje de programación
- Un IDE
- Un gestor de dependencias. R lo trae por defecto, pero en Python existen diferentes opciones y lo tienes que instalar aparte
- Dependencias (librerías, paquetes): esto lo harás de forma incremental según las necesites
R
Instala la última versión de R y de RStudio. Están disponibles aquí:
Python
Instala la última versión de Python 3 y el IDE que prefieras. Para este último, hay muchas opciones: Spyder, Rodeo, un editor de texto (como Atom) + una extensión para ejecutar código, … Lo importante es que sea cómodo para ir ejecutando poco a poco el código que vas escribiendo. Mi recomendación es Rodeo (que está inspirado en RStudio), pero si tienes otra preferencia, adelante.
Además, necesitarás un gestor de dependencias (al estilo maven, npm, …) para instalar las liberías que necesites. Los más conocidos son pip y conda. Mi recomendación es pip, pero son similares.
Herramientas
- Nuestro grupo de slack, para preguntar dudas o comentar cosas relacionadas con ciencia de datos
- El repo de GitHub del curso, donde publicaré los ejercicios