Nombre
Apellido
Titulo del proyecto
Nro de grupo
Integrantes
Familia de proyecto
Objetivos del proyecto
Descripción general del proyecto
Plan de trabajo completo
Marcas


Editado por última vez: 12 may 2025

Titulo del proyecto
Análisis de Desempeño en la Serie A mediante Grafos y Sistema Elo
Nro de grupo
19
Integrantes

Lucía De Oliveira

Raúl Maglione

Familia de proyecto
Familia 4: Coast to coast (de la obtención al análisis, posible solución poliglota)
Objetivos del proyecto

El presente proyecto tiene como propósito principal realizar un análisis integral de los equipos que participan en la Serie A del fútbol profesional, a partir de diversas métricas deportivas y económicas. Para alcanzar este objetivo general, se plantean los siguientes objetivos específicos:

  • Analizar las estadísticas históricas de los enfrentamientos directos entre los equipos de la Serie A.
  • Evaluar el desempeño de cada equipo en términos de estadísticas de juego, tales como goles, asistencias, posesión, entre otros indicadores clave.
  • Estudiar el valor de las plantillas de cada equipo y sus mejores jugadores.
  • Analizar el impacto que tienen las participaciones en torneos internacionales.
Descripción general del proyecto

El grupo se propone diseñar un grafo orientado al análisis del desempeño deportivo de los equipos que participan en la Serie A. El objetivo central es modelar y evaluar, mediante un sistema de puntaje tipo Elo, la probabilidad de que un equipo supere a otro en un partido, considerando una serie de factores determinantes.

Entre las variables que se buscarán representar en el grafo se incluyen: el historial de partidos, la localía y el valor de plantilla de cada equipo, las cuales son cosas que se buscarán mapear en un grafo. La hipótesis del proyecto es que estos factores influyen significativamente en la probabilidad de victoria y pueden ser aprovechados para construir un modelo predictivo más preciso.

Además, se buscará comprobar si la participación en otro tipo de torneos, y el desgaste que esto trae, tiene un impacto en el desempeño del equipo.

Por ultimo, se buscara analizar el impacto de la ausencia de alguno de sus jugadores a la hora de disputar un partido.

Plan de trabajo completo
Marcas

Nadia Martinez Petrone
Editado por última vez: 12 may 2025

Titulo del proyecto
Sistema de recomendación musical a través de relaciones entre artistas
Nro de grupo
24
Integrantes

Elizabeth Bennett
Nadia Martínez

Familia de proyecto
Familia 4: Coast to coast (de la obtención al análisis, posible solución poliglota)
Objetivos del proyecto
  • Integrar información sobre artistas, álbumes, canciones, géneros y colaboraciones entre artistas, utilizando modelos no relacionales.
  • Explorar y visualizar relaciones musicales a través de un grafo de artistas y canciones, con foco en colaboraciones y géneros compartidos.
Descripción general del proyecto

La idea de este proyecto es construir un sistema de recomendación musical utilizando MongoDB como base documental para el almacenamiento detallado de canciones y sus artistas, y Neo4j como base de grafos para representar las relaciones entre canciones y artistas.

La motivación es poder recomendar canciones a partir de un artista o género, así como también según la popularidad de las mismas. A su vez, nos parece una buena forma de reforzar nuestro entendimiento tanto en las bases documentales como en las de grafos, usando las tecnologías vistas en el curso.

Plan de trabajo completo
Marcas

Editado por última vez: 12 may 2025

Titulo del proyecto
Analisis de fraude sobre BD de transacciones fintech
Nro de grupo
14
Integrantes

Andres Santucci, Pablo Recarte

Familia de proyecto
Familia 4: Coast to coast (de la obtención al análisis, posible solución poliglota)
Objetivos del proyecto
  • Construir una base de datos de grafos a partir de un conjunto de datos de transacciones financieras con etiquetas de fraude.

  • Detectar patrones, estructuras y comunidades (clusters) relacionadas con actividades fraudulentas.

  • Visualizar conexiones entre cuentas, dispositivos e IPs asociadas a fraude para facilitar el análisis forense.

Descripción general del proyecto

El proyecto propone modelar transacciones financieras como un grafo, donde los nodos representan cuentas, dispositivos, IPs, locaciones y otros elementos clave, y las aristas representan interacciones como transacciones y uso compartido de ciertos recursos. El objetivo es detectar estructuras sospechosas, comunidades de fraude y comportamientos anómalos difíciles de identificar con enfoques tradicionales. La motivación surge del interés en el análisis de fraudes mediante grafos, una técnica cada vez más usada en bancos, fintechs y seguridad informática.

Plan de trabajo completo
Marcas

Maximiliano Martin Lucero Bacardat
Editado por última vez: 13 may 2025

Titulo del proyecto
Exploración de patrones vinculados al MVP en la NBA mediante modelado en grafos
Nro de grupo
18
Integrantes

Maximiliano Lucero

Familia de proyecto
Familia 4: Coast to coast (de la obtención al análisis, posible solución poliglota)
Objetivos del proyecto

El presente proyecto tiene como propósito principal estudiar los factores que influyen en la
elección del Jugador Más Valioso (MVP) de la NBA, a partir de datos históricos de
desempeño individual y colectivo. Se busca, además, aplicar un enfoque predictivo sobre
la base de los patrones observados en temporadas anteriores.

Para alcanzar este objetivo general, se plantean los siguientes objetivos específicos:
• Analizar las estadísticas históricas de los jugadores que han ganado el premio
MVP.
• Evaluar el desempeño de estos jugadores y sus equipos en sus respectivas
temporadas MVP.
• Comparar estos desempeños con los de otros jugadores destacados que no
ganaron el premio.
• Modelar las relaciones entre jugadores, estadísticas, equipos y premios mediante
una base de datos de grafos.
• (Opcional) Utilizar esta base para estimar candidatos al MVP de la temporada
actual, en base a variables históricas relevantes.

Descripción general del proyecto

Se propone diseñar una solución que recorra todas las etapas del ciclo de vida de los
datos —recolección, análisis, modelado, transformación, persistencia y explotación— para
estudiar el premio MVP en la NBA.

El proyecto consistirá en construir un modelo basado en grafos que represente las
relaciones entre jugadores, temporadas, equipos, métricas estadísticas y premios. A
través de esta representación, se buscará entender qué características comunes tienen
los jugadores que han ganado el premio MVP, y qué factores tienden a influir con mayor
peso en su elección.

Entre las variables a considerar se encuentran estadísticas individuales (puntos,
asistencias, rebotes, eficiencia, etc.), desempeño colectivo (porcentaje de victorias del
equipo), logros destacados y la obtención de premios.

La hipótesis es que ciertos indicadores estadísticos, combinados con el rendimiento del
equipo, permiten identificar patrones en la elección del MVP. En caso de que los
resultados lo permitan, se considerará la posibilidad de entrenar un modelo de predicción
complementario que estime la probabilidad de que un jugador actual obtenga el premio.

Marcas

Jake Davis Sheppard
14 may 2025
Editado por última vez: 14 may 2025

Titulo del proyecto
Propiedades de grafos en redes de co-expresión génica en cáncer
Nro de grupo
17
Integrantes

Mathias Fuidio

Jake Sheppard

Familia de proyecto
Familia 4: Coast to coast (de la obtención al análisis, posible solución poliglota)
Objetivos del proyecto

Este proyecto plantea usar el Property Graph Model (PGM) y bases de datos de grafos para analizar diferencias en la expresión génica entre tejido tumoral y tejido sano, utilizando datos transcriptómicos libremente disponibles en repositorios públicos.

-          Objetivo Específico 1

Modelar datos ómicos de dos condiciones experimentales – tejido tumor y sano – utilizando el PGM mediante un motor de bases de datos de grafos visto en el curso (Neo4j).

-          Objetivo Específico 2

Estudiar las propiedades topológicas de los grafos generados: conectividad promedio, centralidad, diámetro de la red, detección de comunidades, camino más corto promedio entre dos nodos, etc. Analizar diferencias entre estas propiedades en los grafos creados a partir de los datos de cada condición.

-          Objetivo Específico 3

Interrogar posible relevancia biológica de los patrones hallados en las etapas anteriores del análisis, a partir de revisión bibliográfica: identidad génica de los nodos hub y posibles evidencias de su rol en cáncer, vías metabólicas alteradas, etc.

Descripción general del proyecto

El cáncer es una patología de crítica importancia para la sociedad humana y una de las principales causas de muerte en el mundo, incluyendo en nuestro país.

Nuestro proyecto consiste en un análisis de redes biológicas a partir de datos de secuenciación masiva obtenidos de pacientes con cáncer. Estos datos se tratan de muestras (e.g., biopsias) obtenidas del tejido tumoral y tejido normal adyacente a partir de un mismo paciente, y que se encuentran disponibles en repositorios públicos y bases de datos de uso libre, como son Gene Expression Omnibus (GEO) y Sequence Read Archive (SRA). Estos datos frecuentemente se depositan junto con su cuantificación en los estudios para los que fueron generados.

Generaremos grafos usando Neo4j donde las entidades, o nodos, representarán genes, que podrán ser poblados con atributos como: id en bases de datos conocidas, coordenadas genómicas, información acerca del biotipo, vías metabólicas en las que participa, si es de importancia conocida en cáncer, etc. Existirán relaciones entre aquellos genes que cumplan cierto criterio con respecto a la matriz de correlación.

Una vez obtenidos, procesados, y transformados los datos en un formato adecuado para su importación con Neo4j, se podrá analizar las propiedades de los grafos resultantes.

Plan de trabajo completo
Marcas

Guido Adrian Pereyra
Editado por última vez: 15 may 2025

Titulo del proyecto
Series Temporales en BDNR
Nro de grupo
23
Integrantes

Antonio Lopez

Guido Pereyra

Familia de proyecto
Familia 6: Relevamiento y comparación de bases analíticas
Objetivos del proyecto

Investigar y comparar las bases teóricas, arquitecturas y principios del funcionamiento de dos diferentes soluciones de bases de datos para el manejo de series temporales :

  • ClickHouse : real-time analytics database  (base analítica)

  • MongoDB : time series collections (base no analitica)

Ambos motores proponen estrategias diferentes para manejar el mismo tipo de información: 

  • ClickHouse es un motor columnar

  • MongoDB es un motor documental

Descripción general del proyecto

El proyecto consiste en un estudio comparativo de diferentes arquitecturas de bases de datos para un caso de uso muy específico y usado actualmente como son las series temporales. Se realizará un análisis de sus arquitecturas, modelos de datos y mecanismos de optimización, finalizando con una implementación práctica básica para verificar conceptos claves aprovechando la naturaleza open source de ambas soluciones. La motivación del proyecto es entender cómo estas soluciones tan diferentes abordan los desafíos específicos del análisis de series temporales y que ventajas/desventajas presenta cada enfoque.

Plan de trabajo completo
Marcas