Hola Agustín,
lo que se pide es que grafiquen las estimaciones y muestren lo que pasa con ventanas muy chicas o muy grandes. Lo de razonable es simplemente visual. Una medida más cualitativa podría resultar de dividir el conjunto de entrenamiento en entrenamiento/validación y ver para que rango de valores de la ventana el ajuste a los datos de validación es bueno.
Saludos,
Guillermo