Curso: Aprendizaje Automático para Datos en Grafos

Perfilado de sección

Seleccionar sección Aprendizaje Automático para Datos en Grafos - Edición 2021

Colapsar Expandir
Aprendizaje Automático para Datos en Grafos - Edición 2021

Colapsar todo Expandir todo
IMPORTANTE: Esta versión intensiva de una semana del curso se dictó por única vez en 2021. Una versión extendida de todo el semestre se puede encontrar [aquí].
Los grafos (o redes) son una estructura de datos presente en muchísimas áreas de conocimiento: redes de telecomunicaciones, sistemas de recomendación, redes de regulación genética, estructuturas de proteínas o movilidad urbana son solo algunos ejemplos. Básicamente, son entidades (nodos) que interactúan entre sí (aristas).

Sobre estos datos existen muchos problemas interesantes de aprendizaje automático, donde básicamente se busca realizar predicciones o descubrir cierta estructura en los datos: detección de anomalías en una red inalámbrica, recomendación de libros a partir de clasificaciones anteriores y de otros usuarios, o clasificación del rol de ciertas proteínas en redes de interacción biológica. Sin embargo, está claro que técnicas de aprendizaje “tradicionales” (donde los datos son básicamente un vector o una matriz) que no toman en cuenta las relaciones entre las distintas entidades tendrán menor poder de generalización (y por lo tanto mucho peor desempeño) que aquellas que sí lo tomen en cuenta.

El objetivo general del curso es que los estudiantes puedan afrontar un problema de aprendizaje automático donde los datos se encuentran en forma de grafos. Se brindarán los conceptos teóricos fundamentales y las herramientas prácticas necesarias para ello. Al finalizar el curso los estudiantes serán capaces de implementar y entender distintas técnicas del estado del arte en inferencia y predicción en grafos.

Docente: Prof. Gonzalo Mateos (Universidad de Rochester, EEUU).

Docente invitado: Fernando Gama (Universidad de California Berkeley, EEUU).

Otros docentes: Marcelo Fiori y Federico La Rocca.

Fechas: Lunes 1º de febrero al ~~viernes 5~~ jueves 4 de febrero, y jueves 11 de febrero.

Horario: 9hs a 12hs15 (lunes a jueves) y 14hs a 17hs15 el jueves 11/2.

Lugar: remoto via zoom

IMPORTANTE:

Inscripciones como curso de posgrado en: https://bedelias.udelar.edu.uy/

Inscripciones como Educación Permanente en: https://www.fing.edu.uy/bedelia/inscripciones/actualizacion

De todas formas quienes planean inscribirse deben matricularse en este EVA para recibir los anuncios y demás información.
- Seleccionar actividad Novedades
  
  Novedades Foro
- Seleccionar actividad Consultas
  
  Consultas Foro
- Seleccionar actividad Programa
  
  Programa Archivo
- Seleccionar actividad Encuestas obligatorias por la Unidad de Enseñanza,...
  
  Los estudiantes deben
  
  Marcar como hecha
  
  Encuestas obligatorias por la Unidad de Enseñanza, Unidad de Posgrados y Educación Permanente
- Seleccionar actividad Formulario de inscripción
  
  Formulario de inscripción Encuesta
- Seleccionar actividad Formulario de evaluación
  
  Formulario de evaluación Encuesta
  
  Los estudiantes deben
  
  Enviar retroalimentación
Seleccionar sección Clase 1 - Introducción y motivación

Colapsar Expandir
Clase 1 - Introducción y motivación
- Seleccionar actividad Introducción a Machine Learning on Graphs
  
  Introducción a Machine Learning on Graphs URL
  
  Charla dictada por Federico La Rocca en el marco de las Tech Meetings de Tryolabs. Puede servir como introducción al curso.
- Seleccionar actividad Repaso de teoria de grafos, probabilidad e infer...
  
  Repaso de teoria de grafos, probabilidad e inferencia estadística
  
  Conceptos básicos de teoria de grafos e inferencia estadística que usaremos recurrentemente durante el curso. Este material no sera presentado en clase. A modo de repaso recomendamos su lectura previa al comienzo del curso.
- Seleccionar actividad Graph Theory Review
  
  Graph Theory Review Archivo
  
  Se cubren las nociones y definiciones básicas relacionadas con los grafos dirigidos y no dirigidos, el movimiento en un grafo y la conectividad, así como la aparición de una componente conexa gigante en muchas redes reales. A continuación, describimos familias de grafos clásicas que incluyen grafos completos, regulares, bipartitos, árboles y planares. Nos resultaran de gran utilidad las nociones de teoría algebraica de grafos, como la matriz adyacencia, la matriz de incidencia y el Laplaciano de un grafo, sus relaciones y propiedades espectrales. Terminamos con algoritmos y estructuras de datos para grafos y describimos breadth-first-search (BFS) para, por ejemplo, calcular distancias desde un vértice determinado.
- Seleccionar actividad Statistical Inference Review
  
  Statistical Inference Review Archivo
  
  Se repasan elementos básicos de inferencia estadística tales como los modelos paramétricos y no paramétricos, y los problemas fundamentales de estimación, predicción y test de hipótesis. Esbozaremos los conceptos de estimación puntual, intervalos de confianza y estadístico de prueba, ademas de estimadores clásicos como el método de los momentos, máxima verosimilitud, mínimos cuadrados y máximo a posteriori (MAP). Todos estos métodos se discutirán en el contexto de dos problemas clásicos: inferencia de la media de una distribución y regresión (mas predicción) con modelos lineales.
- Seleccionar actividad Slides de la Clase 1
  
  Slides de la Clase 1 Archivo
  
  En esta clase introductoria comenzamos con una presentación de los aspectos administrativos del curso. Se introduce el concepto fundamental de red (así como su abstracción mediante un grafo) y desde una perspectiva histórica motivamos la “ciencia de datos de redes”. A través de ejemplos en múltiples disciplinas intentamos justificar la importancia e impacto del aprendizaje automático para datos en grafos. El resto de la clase se divide en cuatro “cuentos cortos” sobre problemas prototípicos del aprendizaje automático para datos en grafos. Durante esta recorrida resaltaremos el nuevo paradigma necesario para atacar problemas de inferencia estadística con datos irregulares, es decir donde no hay un dominio Euclideo subyacente como en series temporales o imágenes. También delineamos los principales desafíos técnicos (metodológicos y computacionales) de esta área emergente donde las oportunidades son cada vez mayores, motivando el camino a seguir en el resto del curso.
- Seleccionar actividad Grabación de la Clase 1 - Parte 1
  
  Grabación de la Clase 1 - Parte 1 URL
- Seleccionar actividad Grabación de la Clase 1 - Parte 2
  
  Grabación de la Clase 1 - Parte 2 URL
Seleccionar sección Clase 2 - Graph Neural Networks

Colapsar Expandir
Clase 2 - Graph Neural Networks
- Seleccionar actividad Slides de la Clase 2
  
  Slides de la Clase 2 Archivo
  
  En esta clase introduciremos las Graph Neural Networks (GNN), mediante las cuales se busca extender el éxito de las redes convolucionales (CNNs) al procesamiento de señales de alta dimensión en dominios no Euclideos. Esto se logra explotando la estructura irregular del dominio de los datos (estructuras que naturalmente representamos mediante un grafo). Se cubrirán los siguientes temas:
  Convoluciones de señales en grafos y arquitecturas GNN. El concepto fundametal que permite la definición de GNNs es el filtro convolucional para señales en grafos, cuyo origen puede trazarse a la literatura de Graph Signal Processing (GSP). Las arquitecturas GNN componen filtros con no linealidades formando capas. Se cubrirán ejemplos ilustrativos sobre sistemas de recomendación y atribución de autoría en textos.
  Propiedades fundamentales de las GNN. Los filtros convolucionales y las GNN son arquitecturas ideales para procesar señales en grafos debido a su equivariancia respecto a las permutaciones. Las GNNs tienden a ser mas efectivas que los filtros lineales porque son Lipschitz-estables a las deformaciones del grafo subyacente. Esta es una propiedad que los filtros convolucionales lineales no pueden tener.
  Control distribuido de sistemas multiagente. Un dominio de aplicación interesante para las GNNs es el control distribuido de sistemas multiagente a gran escala. Se desarrollarán aplicaciones referentes al control de equipos de robots autónomos y a la signación de recursos en redes de comunicación inalámbrica.
- Seleccionar actividad Grabación de la Clase 2 - Parte 1
  
  Grabación de la Clase 2 - Parte 1 URL
- Seleccionar actividad Gabación de la Clase 2 - Parte 2
  
  Gabación de la Clase 2 - Parte 2 URL
- Seleccionar actividad Lectura suplementaria recomendadaM. M. Bronstein, ...
  
  Lectura suplementaria recomendada
  M. M. Bronstein, J. Bruna, Y. LeCun, A. Szlam, P. Vandergheynst, "Geometric deep learning: going beyond Euclidean data," 2017.
  F. Gama, E. Isufi, G. Leus, A. Ribeiro, "Graphs, convolutions, and neural networks," 2020.
  L. Ruiz, F. Gama, A. Ribeiro, "Graph neural networks: Architectures, stability and transferability," 2021.
  F. Gama, A. G. Marques, G. Leus, A. Ribeiro. "Convolutional neural network architectures for signals supported on graphs," 2018.
  F. Gama, J. Bruna, A. Ribeiro, "Stability properties of graph neural networks," 2019.
Seleccionar sección Clase 3 - Graph learning

Colapsar Expandir
Clase 3 - Graph learning
- Seleccionar actividad Slides de la Clase 3
  
  Slides de la Clase 3 Archivo
  
  En esta clase estudiamos el problema de inferencia de topología de la red. En particular, las GNNs que estudiamos la clase pasada presuponen que se dispone de un grafo que contiene información relevante sobre el problema a resolver. Sin embargo, tal suposición es a menudo insostenible en la práctica — el grafo puede ser desconocido y deseamos estimar su estructura a partir de observaciones de señales en los nodos. Presentaremos diversos métodos comenzando por enfoques estadísticos basados en modelos gráficos, inferencia de correlaciones y algoritmos para problemas en altas dimensiones. Luego estudiamos avances recientes inspirados en modelos de Graph Signal Processing (GSP) de una manera integral y unificadora, con aplicaciones a mobilidad urbana, clasificación de emociones, e identificación de la estructura de proteínas, entre otras.
- Seleccionar actividad Grabación de la Clase 3 - Parte 1
  
  Grabación de la Clase 3 - Parte 1 URL
- Seleccionar actividad Grabación de la Clase 3 - Parte 2
  
  Grabación de la Clase 3 - Parte 2 URL
- Seleccionar actividad Lectura suplementaria recomendadaG. Mateos, S. Seg...
  
  Lectura suplementaria recomendada
  G. Mateos, S. Segarra, A. G. Marques, A. Ribeiro, "Connecting the dots: Identifying network structure via graph signal processing," 2019.
  X. Dong, D. Thanou, M. Rabbat, P. Frossard, "Learning graphs from data: A signal representation perspective," 2019.
  G. B. Giannakis, Y. Shen, G. V. Karanikolas, "Topology Identification and Learning over Graphs: Accounting for Nonlinearities and Dynamics," 2018.
  J. Friedman, T. Hastie, R. Tibshirani, "Sparse inverse covariance estimation with the graphical lasso," 2008.
  S. Segarra, A. G. Marques, G. Mateos, A. Ribeiro, "Network topology inference from spectral templates," 2016.
  V. Kalofolias, "How to learn a graph from smooth signals," 2016.
Seleccionar sección Clase 4 - Modelos generativos

Colapsar Expandir
Clase 4 - Modelos generativos
- Seleccionar actividad Slides de la Clase 4
  
  Slides de la Clase 4 Archivo
  
  En esta cuarta clase estudiaremos el modelado estadístico de datos relacionales que representamos mediante grafos. Introducimos varias familias de modelos generativos para dichos datos: (i) modelos clásicos de grafos aleatorios; (ii) modelos de redes “small world”; (iii) modelos de crecimiento y conexión preferencial; (iv) modelos de grafos aleatorios de la familia exponencial; y (v) modelado de grafos mediante variables latentes. Por un tema de aplicabilidad, relevancia y madurez de los resultados existentes, nos enfocaremos principalmente en (v), cubriendo “stochastic block models” (SBMs), la contraparte no paramétrica basada en “graphons”, y los “random dot product graphs” (RDPGs). Haremos énfasis en la construcción de los modelos y su plausibilidad a la hora de representar datos de grafos reales, en la simulación, la inferencia de los parámetros del modelo (discutiendo aspectos computacionales de los estimadores y sus propiedades asintóticas), así como diagnósticos de bondad del ajuste. Durante la clase ilustraremos la utilidad práctica de estos modelos mediante aplicaciones, incluyendo la detección de motifs y comunidades, la evaluación formal de hipótesis acerca de mecanismos generativos de red y de factores predictivos de vínculos relacionales.
- Seleccionar actividad Grabación de la Clase 4 - Parte 1
  
  Grabación de la Clase 4 - Parte 1 URL
- Seleccionar actividad Grabación de la Clase 4 - Parte 2
  
  Grabación de la Clase 4 - Parte 2 URL
- Seleccionar actividad Lectura suplementaria recomendadaJ.-J. Daudin, F. ...
  
  Lectura suplementaria recomendada
  J.-J. Daudin, F. Picard, S. Robin, "A mixture model for random graphs," 2008.
  C. Shalizi, "Graph limits and infinite exchangeable arrays," 2019.
  E. R. Scheinerman, K. Tucker, "Modeling graphs using dot product representations," 2010.
  A. Athreya, D. E. Fishkind, K. Levin, V. Lyzinski, Y. Qin, Y. Park, D. L. Sussman, M. Tang, J. T. Vogelstein, and C. E. Priebe, "Statistical inference on random dot product graphs: A survey," 2018.
Seleccionar sección Clase 5 - Graph representation learning

Colapsar Expandir
Clase 5 - Graph representation learning
- Seleccionar actividad Slides de la Clase 5
  
  Slides de la Clase 5 Archivo
  
  Los estudiantes deben
  
  Marcar como hecha
- Seleccionar actividad Grabación de la Clase 5 - Parte 1
  
  Grabación de la Clase 5 - Parte 1 URL
  
  Los estudiantes deben
  
  Marcar como hecha
- Seleccionar actividad Grabación de la Clase 5 - Parte 2
  
  Grabación de la Clase 5 - Parte 2 URL
  
  Los estudiantes deben
  
  Marcar como hecha
- Seleccionar actividad Lectura suplementaria recomendadaI. Chami, S. Abu-...
  
  Lectura suplementaria recomendada
  I. Chami, S. Abu-El-Haija, B. Perozzi, C. Ré, K. Murphy, "Machine learning on graphs: A model and comprehensive taxonomy," 2021.
  W. L. Hamilton, R. Ying, J. Leskovec, "Representation learning on graphs: Methods and applications," 2017.
  William L. Hamilton, "Graph Representation Learning Book,", 2020.
Seleccionar sección Laboratorios

Colapsar Expandir
Laboratorios
- Seleccionar actividad Los laboratorios son actividades para que los estu...
  
  Los laboratorios son actividades para que los estudiantes exploren distintas herramientas y bajen a tierra los conceptos manejados en clase. En cada laboratorio habrá algunas preguntas cuyas respuestas deberán ser entregadas en un único PDF. De todas formas, la idea es que éstas sean una excusa para que el estudiante explore las herramientas (y tenga algunos ejemplos de cómo usarlas), datasets y conceptos.
- Seleccionar actividad Laboratorio 1: Introducción
  
  Laboratorio 1: Introducción URL
  
  Un primer laboratorio para familiarizarse con algunas herramientas para procesar grafos.
- Seleccionar actividad Laboratorio 2: modelos generativos, representation learning y detección de comunidades
  
  Laboratorio 2: modelos generativos, representation learning y detección de comunidades URL
  
  Un laboratorio para repasar algunos modelos clásicos de grafos, y sobre cómo usar espacios latentes para detectar comunidades en grafos.
- Seleccionar actividad Laboratorio 3: GNNs
  
  Laboratorio 3: GNNs URL
  
  Un laboratorio sobre sistemas de recomendación para afianzar conceptos de GNNs.
- Seleccionar actividad Entrega de los laboratorios
  
  Entrega de los laboratorios Tarea
  
  Entregar un único pdf con las respuestas a los tres laboratorios. Hay tiempo hasta el domingo 28 de febrero a las 23:55.
Seleccionar sección Trabajos finales

Colapsar Expandir
Trabajos finales
- Seleccionar actividad Propuesta de trabajo final
  
  Propuesta de trabajo final Tarea
  
  El plazo para entregar la propuesta de trabajo final es el viernes 19/2 a las 23:55.
- Seleccionar actividad Entrega trabajo final
  
  Entrega trabajo final Tarea
  
  Los estudiantes deben
  
  Marcar como hecha
  
  Entregar un único pdf con el informe. Material extra, como código o demos en google colab, deben referirse desde este pdf. La fecha límite para la entrega del informe final es el lunes 5 de abril a las 23:55.
- Seleccionar actividad Sobre el trabajo finalSe trata de un pequeño proye...
  
  Sobre el trabajo final
  Se trata de un pequeño proyecto de investigación (unas 35 horas de dedicación según el programa) en el que pueda investigar y aplicar herramientas y algoritmos de análisis de grafos/redes de última generación a una aplicación de su preferencia.
  Debe seleccionar un tema específico relacionado con el aprendizaje automático en grafos/redes y realizar un survey relativamente profundo del tema. Esto incluye encontrar buenas fuentes en la literatura (artículos de investigación, libros de texto, diapositivas de presentación, etc.), posiblemente realizar algún análisis y/o simulaciones numéricas para experimentar con conjuntos de datos de red interesantes y proporcionar un resumen detallado de las ideas principales. El proyecto es un estudio en profundidad de un tema específico; no es solo un resumen de algunos trabajos de investigación. Si desea ser más ambicioso, también puede realizar investigación original sobre el tema seleccionado además del survey del tema (posiblemente resultando en una publicación de conferencia), pero esto no es obligatorio.
  Somos bastante flexibles con el tipo de estudio que se puede realizar. Típicamente estos pueden ser de los siguientes dos tipos (o una combinación de ambos):
  Una evaluación experimental de algoritmos y modelos sobre datos de red interesantes, implementando su propio código y/o investigando software existente para el análisis de redes.
  Un proyecto analítico que considera un modelo, un algoritmo o una propiedad de red y deriva un resultado teórico riguroso al respecto.
  Pero también se pueden realizar trabajos sobre implementaciones escalables / más eficientes de algoritmos para el procesamiento de datos de red a gran escala, o podría pensar en recopilar sus propios datos de la web, redes sociales, etc. para el análisis posterior.
  Para los estudiantes de posgrado, se sugiere que hable con su director de tesis (si tiene uno) sobre un posible tema relacionado con redes/grafos. Si no es estudiante de posgrado, no tiene DT o simplemente desea feedback, puede consultar con los docentes. Podemos coordinar una reunión para hacer sugerencias, lluvia de ideas, ayudar a refinar sus ideas iniciales o indicarle conjuntos de datos, código, documentos y otros recursos (además de los disponibles en la web del curso). En todo caso, es importante elegir un área de aplicación que esté relacionada con su investigación actual o futura.
  Se le recomienda que forme equipo con otro estudiante para trabajar en su proyecto (es decir, trabajar en parejas). Aún así, si lo desea, puede trabajar solo.
  Evaluación
  Los trabajos se evaluarán en función de los siguientes criterios:
  Calidad técnica. ¿Es el proyecto técnicamente sólido? ¿Son razonables las suposiciones de modelado y los algoritmos probados? ¿Las conclusiones sugieren un pensamiento crítico en profundidad sobre el tema elegido, posiblemente transmitiendo ideas novedosas sobre el problema y / o algoritmos elegidos?
  Importancia. ¿Es este un problema interesante y oportuno para trabajar? ¿Es útil este trabajo y es probable que el área de investigación subyacente tenga impacto?
  Claridad de presentación. ¿Con qué eficacia se transmiten los resultados de la investigación?
  
  Sobre la propuesta del trabajo
  
  La propuesta de proyecto debe resumir lo que planea hacer para su proyecto. El informe no debe exceder las 3 páginas y debe incluir:
  Una descripción clara del problema que abordará.
  Ideas preliminares sobre cómo planea abordarlo (modelos / algoritmos / técnicas).
  Referencias bibliográficas básicas que consultará.
  Si corresponde, qué herramientas de software necesitará para su trabajo (o si planea escribir su propio código, qué lenguaje usará).
  Conjunto(s) de datos con los que trabajará.
  Lo que espera producir como resultado de su trabajo y cómo juzgará el éxito del proyecto.
  Cualquier otra cosa que crea que deberíamos saber para evaluar sus planes.
  
  Sobre el informe del trabajo final.
  El informe final debe proporcionar una descripción clara y detallada de lo que hizo, los resultados que obtuvo y lo que ha aprendido y concluido de su trabajo. El informe no debe exceder las 12 páginas y debe incluir:
  Una introducción motivadora, revisión de la literatura de trabajos anteriores relevantes y una declaración clara del problema en forma finalizada.
  Si recopiló sus propios datos para construir un grafo, describa ese proceso.
  Para todos los que correspondan, proporcione derivaciones matemáticas, descripciones detalladas de modelos y algoritmos que haya utilizado, adaptado o desarrollado.
  Descripción de sus experimentos, mostrando los resultados obtenidos y una discusión relevante basada en sus observaciones.
  Conclusiones que indiquen las metas logradas y lo que aprendió, así como posibles extensiones o direcciones futuras.
  Una lista de referencias relevantes.
  
  Se recomienda fuertemente usar LaTeX para ambas entregas. Puede usar cualquier template de paper con letra tamaño 10 con el que se sienta cómodo, overleaf ya trae varios pre-cargados (ver por ejemplo https://www.overleaf.com/gallery/tagged/ieee-official o https://www.overleaf.com/gallery/tagged/conference-paper). Para consejos de redacción, puede consultar la siguiente guía: https://iie.fing.edu.uy/personal/flarroca/teaching/recomendaciones-para-la-redaccion-de-una-tesis/.
Seleccionar sección Recursos

Colapsar Expandir
Recursos
- Seleccionar actividad Listamos a continuación algunos recursos que puede...
  
  Listamos a continuación algunos recursos que pueden ser de utilidad:
- Seleccionar actividad Bibliotecas y software
  
  Bibliotecas y software
- Seleccionar actividad NetworkX
  
  NetworkX URL
  
  Uno de los paquetes de análisis de grafos más populares para Python. Muy fácil de usar y se integra con otras bibliotecas.
- Seleccionar actividad SNAP: Stanford Network Analysis Project
  
  SNAP: Stanford Network Analysis Project URL
  
  El equipo dirigido por Jure Leskovec comparte una biblioteca (en C++ y Python), además de varios dataset.
- Seleccionar actividad Pytorch Geometric
  
  Pytorch Geometric URL
  
  Una biblioteca bastante popular para aprendizaje en grafos.
- Seleccionar actividad Deep Graph Library (DGL)
  
  Deep Graph Library (DGL) URL
  
  Una biblioteca para implementar GNNs con el gran plus de que es agnóstico al framework (PyTorch o TensorFlow).
- Seleccionar actividad Spektral
  
  Spektral URL
  
  Una biblioteca basada en TensorFlow para implementar GNNs.
- Seleccionar actividad StellarGraph
  
  StellarGraph URL
  
  Una biblioteca libre y gratuita básicamente para GNNs.
- Seleccionar actividad PyGSP: Graph Signal Processing in Python
  
  PyGSP: Graph Signal Processing in Python URL
  
  Una biblioteca en python para signal processing en grafos.
- Seleccionar actividad graph-tool
  
  graph-tool URL
  
  Similar a networkx, pero más eficiente.
- Seleccionar actividad igraph - The network analysis package
  
  igraph - The network analysis package URL
  
  Otra biblioteca similar a networkx, pero disponible en varios lenguajes (C, python y R), y también más rápida.
- Seleccionar actividad NetworKit - Large-Scale network analysis
  
  NetworKit - Large-Scale network analysis URL
  
  Otra biblioteca similar a networkx, pero también más rápida.
- Seleccionar actividad scikit-network
  
  scikit-network URL
  
  Un scikit específico para grafos.
- Seleccionar actividad Alelab's Graph Neural Networks
  
  Alelab's Graph Neural Networks URL
  
  El grupo de Alejandro Ribeiro comparte implementaciones basadas en Pytorch de casi todos sus trabajos en este repo.
- Seleccionar actividad Datasets
  
  Datasets
- Seleccionar actividad SNAP: Stanford Network Analysis Project
  
  SNAP: Stanford Network Analysis Project URL
  
  El equipo dirigido por Jure Leskovec comparte una biblioteca (en C++ y Python), además de varios dataset.
- Seleccionar actividad Netzschleuder: network catalogue, repository and centrifuge
  
  Netzschleuder: network catalogue, repository and centrifuge URL
  
  Un catálogo de grafos del grupo del creador de graph-tools.
- Seleccionar actividad Network Repository. An Interactive Scientific Network Data Repository.
  
  Network Repository. An Interactive Scientific Network Data Repository. URL
  
  Un catálogo de grafos, que además pueden visualizarse en línea.
- Seleccionar actividad Harvard Dataverse
  
  Harvard Dataverse URL
  
  Varios datasets de la Universidad de Harvard. No es específico de grafos, pero varios se pueden analizar desde esa perspectiva.
- Seleccionar actividad Grouplens
  
  Grouplens URL
  
  El grupo Grouplens de la Universidad de Minnesota tiene varios datasets disponibles.
- Seleccionar actividad Catálogo Nacional de Datos Abiertos
  
  Catálogo Nacional de Datos Abiertos URL
  
  Es un catálogo de datos abiertos a nivel gubernamental del Uruguay. Tiene varios datasets que pueden interpretarse como grafos. Por ejemplos, viajes de ómnibus (https://catalogodatos.gub.uy/dataset/intendencia-montevideo-viajes-realizados-en-los-omnibus-del-stm).
- Seleccionar actividad Open Graph Benchmark
  
  Open Graph Benchmark URL
  
  Los estudiantes deben
  
  Marcar como hecha
  
  Varios datasets para hacer benchmark. Incluye métodos para cargarlos desde PyTorch Geometric o DGL, además de Leaderboards (con código asociado).
- Seleccionar actividad Kaggle
  
  Kaggle URL
  
  Los estudiantes deben
  
  Marcar como hecha
  
  Kaggle ofrece varios datasets, códigos de ejemplo y turoriales. El link es para la sección de datasets.

Perfilado de sección

IMPORTANTE: Esta versión intensiva de una semana del curso se dictó por única vez en 2021. Una versión extendida de todo el semestre se puede encontrar [aquí].