Tarea Final - Intención de voto

Tarea Final - Intención de voto

de Juan Manuel Perez -
Número de respuestas: 3

Buenas tardes, tengo dos consultas. 

1: ¿Cómo defino la variable intención de votos para poder agrupar el "df"? Entiendo que podría ser, los que manifiestan que votarían por "SI" son un grupo y los que manifiestan que votarían por "NO" o no responden por el "SI" ni por el "NO", son el otro grupo.

2: Respecto a si una persona respondió consistentemente o no. ¿El hecho de que haya pasado (Respuesta en el df "0") en "vota_si" y haya respondido estar de acuerdo (Respuesta en el df "1") en "vota_no", lo hace inconsistente? En la letra de la tarea dice que usemos como condición que es consistente si vota_si==-vota_no, en este caso, si la persona, en ambos enunciados optó por pasar, resulta consistente porque 0=-0 pero si en vota_si respondió estar de acuerdo y en vota_no pasó, la condición lógica va a indicar inconsistencia. El punto es que no veo mayor grado de inconsistencia en el segundo caso que en el primero y uno se considera inconsistente y el otro no.

Saludos 

En respuesta a Juan Manuel Perez

Re: Tarea Final - Intención de voto

de Daniel Herrera Esposito -

Hola Juan Manuel,

Te respondo primero la 2):

Sí, se puede discutir si poner  vota_si = 0, y responder vota_no = -1 o 1 es consistente o no. Propuse en la letra que se use la condición vota_si == -vota_no porque es razonable, y te soluciona la cuestión con sólo una comparación lógica. No necesariamente está mal si querés hacerlo como proponés, y lo podés hacer, pero te va a llevar más trabajo, y es más probable que te equivoques.


Sobre la 1):

Si usás el método propuesto de vota_si == -vota_no, podés simplemente usar cualquiera de estas dos columnas para agrupar el DataFrame por intención de voto. Vas a tener 3 valores en la columna, que son indecisos, gente que vota que sí, y gente que vota que no. Si elegís una columna o la otra, el agrupamiento va a ser exactamente el mismo, sólo cambia cómo están codificados.

Si preferís no usar el método propuesto de vota_si == -vota_no para filtrar las entradas consistentes, ahí sí se te complica, porque en los "0" de una de esas columnas (ej. vota_si) vas a tener tanto indecisos, como gente que vota que sí, y gente que vota que no en la otra columna (vota_no). Entonces, definir la variable de intención de voto en este caso es algo más difícil que te llevaría varias operaciones lógicas, que la verdad no traté de hacer.

Saludos

En respuesta a Daniel Herrera Esposito

Re: Tarea Final - Intención de voto

de Andoni Fabricio Alvarellos Vazquez -
Buenas. Si elegimos aceptar el caso de un sólo 0 como consistente ¿es razonable aplicar una transformación más (luego de filtrar los inconsistentes) para simplificar el agrupamiento? Es decir, si aceptamos que vota_si=1 vota_no=0 como consistente, es porque asumimos que el encuestado se expresó por la opción "Sí" y la única forma de que eso sea válido es si no vota no, por eso podríamos sustituir por -1 los casos como este (y los análogos). Ahí te quedarían nuevamente 3 casos al agrupar.