Estudiaremos el modelado estadístico de datos relacionales que representamos mediante grafos. Introduciremos varias familias de modelos generativos para dichos datos: (i) modelos clásicos de grafos aleatorios; (ii) modelos de crecimiento y conexión preferencial; (iii) modelos de redes “small world”; (iv) modelos de grafos aleatorios de la familia exponencial; y (v) modelado de grafos mediante variables latentes.
Por un tema de aplicabilidad, relevancia y madurez de los resultados existentes, nos enfocaremos principalmente en (v), cubriendo “stochastic block models” (SBMs), la contraparte no paramétrica basada en “graphons”, y los “random dot product graphs” (RDPGs). Haremos énfasis en la construcción de los modelos y su plausibilidad a la hora de representar datos de grafos reales, en la simulación, la inferencia de los parámetros del modelo (discutiendo aspectos computacionales de los estimadores y sus propiedades asintóticas), así como diagnósticos de bondad del ajuste. Durante la clase ilustraremos la utilidad práctica de estos modelos mediante aplicaciones, incluyendo la detección de motifs y comunidades, la evaluación formal de hipótesis acerca de mecanismos generativos de red y de factores predictivos de vínculos relacionales.