Hola,
en el ejemplo que mostrás está pasando tal cual lo que decis, está clasificando todo cómo positivo (menos 1). Esto posiblemente mejoraría al considerar otros/más atributos.
Respecto a CountVectorizer, el fin es exactamente lo que decís: hacer un bag-of-words utilizando las palabras o n-gramas de palabras. Incluir bow seguramente lleve a mejores resultados.
Saludos
en el ejemplo que mostrás está pasando tal cual lo que decis, está clasificando todo cómo positivo (menos 1). Esto posiblemente mejoraría al considerar otros/más atributos.
Respecto a CountVectorizer, el fin es exactamente lo que decís: hacer un bag-of-words utilizando las palabras o n-gramas de palabras. Incluir bow seguramente lleve a mejores resultados.
Saludos