Clase 1 - Introducción y motivación
Perfilado de sección
-
-
Charla dictada por Federico La Rocca en el marco de las Tech Meetings de Tryolabs. Puede servir como introducción al curso.
-
Se cubren las nociones y definiciones básicas relacionadas con los grafos dirigidos y no dirigidos, el movimiento en un grafo y la conectividad, así como la aparición de una componente conexa gigante en muchas redes reales. A continuación, describimos familias de grafos clásicas que incluyen grafos completos, regulares, bipartitos, árboles y planares. Nos resultaran de gran utilidad las nociones de teoría algebraica de grafos, como la matriz adyacencia, la matriz de incidencia y el Laplaciano de un grafo, sus relaciones y propiedades espectrales. Terminamos con algoritmos y estructuras de datos para grafos y describimos breadth-first-search (BFS) para, por ejemplo, calcular distancias desde un vértice determinado.
-
Se repasan elementos básicos de inferencia estadística tales como los modelos paramétricos y no paramétricos, y los problemas fundamentales de estimación, predicción y test de hipótesis. Esbozaremos los conceptos de estimación puntual, intervalos de confianza y estadístico de prueba, ademas de estimadores clásicos como el método de los momentos, máxima verosimilitud, mínimos cuadrados y máximo a posteriori (MAP). Todos estos métodos se discutirán en el contexto de dos problemas clásicos: inferencia de la media de una distribución y regresión (mas predicción) con modelos lineales.
-
En esta clase introductoria comenzamos con una presentación de los aspectos administrativos del curso. Se introduce el concepto fundamental de red (así como su abstracción mediante un grafo) y desde una perspectiva histórica motivamos la “ciencia de datos de redes”. A través de ejemplos en múltiples disciplinas intentamos justificar la importancia e impacto del aprendizaje automático para datos en grafos. El resto de la clase se divide en cuatro “cuentos cortos” sobre problemas prototípicos del aprendizaje automático para datos en grafos. Durante esta recorrida resaltaremos el nuevo paradigma necesario para atacar problemas de inferencia estadística con datos irregulares, es decir donde no hay un dominio Euclideo subyacente como en series temporales o imágenes. También delineamos los principales desafíos técnicos (metodológicos y computacionales) de esta área emergente donde las oportunidades son cada vez mayores, motivando el camino a seguir en el resto del curso.
-