Hola Leonardo,
está bien sí comparar las gráficas de error para paso decreciente y paso fijo. El paso decreciente (y justo en una función complicada) puede demorar mucho en converger, por lo que en una comparación gráfica a simple vista puede ser difícil ver detalles de una u otra. En escala logarítmica se puede ver un poco mejor.
En cualquier caso, la "forma" de la función de error solamente conocemos cómo debería ser para una función cuadrática (es el estudio que hicimos en una clase).
Sobre el 2.e. Prueben cambiar la tolerancia, y ponerse más exigentes ahí. Puede suceder que para valores poco exigentes de tolerancia la convergencia del método "simple" sea más rápida.
Supongo que lo hicieron, pero revisen también si le hacen la inversa a la matriz diagonal (en rosenbrock_diag o en gradient_descent_diagonal_scaling)
Saludos!
está bien sí comparar las gráficas de error para paso decreciente y paso fijo. El paso decreciente (y justo en una función complicada) puede demorar mucho en converger, por lo que en una comparación gráfica a simple vista puede ser difícil ver detalles de una u otra. En escala logarítmica se puede ver un poco mejor.
En cualquier caso, la "forma" de la función de error solamente conocemos cómo debería ser para una función cuadrática (es el estudio que hicimos en una clase).
Sobre el 2.e. Prueben cambiar la tolerancia, y ponerse más exigentes ahí. Puede suceder que para valores poco exigentes de tolerancia la convergencia del método "simple" sea más rápida.
Supongo que lo hicieron, pero revisen también si le hacen la inversa a la matriz diagonal (en rosenbrock_diag o en gradient_descent_diagonal_scaling)
Saludos!