Buenas tardes!
Descargamos una base de datos que mantiene los rangos de ip's asignados a los ASN, importada como dataframe al script de la solucion.
Las consultas sin embargo son relativamente lentas pues la base tiene 500.000 entradas y es necesario consultar los rangos convirtiendolos a su equivalente numérico. Podria cambiarse el orden de acceso a la base a log(n) si usamos alguna exploracion no lineal de la base (biparticion por ejemplo), pues los rangos estan ordenados de forma creciente.
Actualmente con una exploración lineal y un subgrupo de mas o menos 1800 ip's diferentes, la consulta para los ASN demora unos 2 minutos. Nuestro log tiene 45000 ip's diferentes, por lo que estimamos un poco menos de 50 minutos de procesamiento para esa parte. Es aceptable que la solución maneje estos tiempos de ejecución o se espera algo bastante mas rápido?
Saludos, y gracias por su tiempo!