Objetivos:  El objetivo de este curso es el desarrollo y optimización de algoritmos altamente escalables a ser ejecutados en plataformas paralelas para el análisis de datos. Utilizaremos para ello las herramientas R y Rstudio de programación paralela, para computadoras personales. Desde el punto de vista de la informática, el análisis de datos requiere del paralelismo para almacenar, recuperar y procesar grandes cantidades de datos, más grandes de las que normalmente se pueden tratar en una computadora personal. La implementación eficiente a gran escala requiere enfoques y algoritmos completamente nuevos. Usaremos las técnicas de procesamiento de datos conocidas, independientemente del campo de aplicación.

 

Al final del curso revisaremos las últimas técnicas para problemas realmente complejos que requieren combinar Algoritmos Paralelos y Big Data como el paquete paquete ff y bigmemory (The BigMemory Project (www.bigmemory.org)).