Hola, estoy teniendo problemas para hacer este ejercicio.
Primero que nada implementé regresión logistica usando descenso por gradiente con este algoritmo:
Despues para calcular el error, nunca estoy segura de que error se refieren, si al error de clasificacion o que error en particular.
En este caso como yo encontre el w que maximiza la probabilidad de que y=yn dado xn y w, para calcular el error de clasificación tendría que definir los valores de mi y para compararlo con el y de etiquetas que nos dan. No estoy segura como hacer esto. Alguna ayuda?
Suponiendo que todo anda despues quise hacer el ej de las flores y me encontre que con la sugerencia:
ATENCIÓN: La clase Iris-setosa es linealmente separable de las demás utilizando una sola característica por lo que puede ser útil para verificar el correcto funcionamiento del método regresión logística
No entiendo bien, las graficas que dan mas arriba son los datos de las flores graficados segun 2 caracteristicas, donde se ve que en general "Iris-versicolor" e "Iris-virginica" las rojas y azules no son linealmente separables entre si mientras que iris-setosa en general si lo es respecto a las otras dos. Lo que no entiendo es eso de usar una sola caracteristica para separarlas, cómo hace preprocesar_iris para separarlas segun una sola caracteristica?
Siguiendo la sugerencia intente separar iris-setosa usando esta data y esas labels:
y elegi una sola caracteristica, por ejemplo la 1
en umbral la verdad no se que poner, puse 0.5 porque son dos clases pero al ver lo que grafica despues parece que nada que ver porque va hasta 5, o sea el umbral no es una probabilidad.
Se que la pregunta es larga, pero por favor me podrían contestar aunque sea algo? Asi no me tranco demasiado y puedo avanzar y entender los conceptos.
Saludos y gracias.