Commons CLI

Commons CLI

de Marco Centurion Virdo -
Número de respuestas: 8

Buenas, quería preguntar si podemos usar la librería Commons Cli [http://commons.apache.org/proper/commons-cli/introduction.html] para implementar el tema de los argumentos.

En respuesta a Marco Centurion Virdo

Re: Commons CLI

de Martin Giachino -
En respuesta a Martin Giachino

Re: Commons CLI

de Marco Centurion Virdo -

Agrego otra consulta: el parseo del codigo html es necesario hacerlo nosotros o podemos recurrir a librerías externas como jsoup para dicha tarea?

El parseo de las respuestas http es obvio que lo debemos hacer nosotros, pero del html me quedó la duda.

En respuesta a Marco Centurion Virdo

Re: Commons CLI

de Ariel Sabiguero Yawelak -

No deben usar jsoup.

La manipulación de la conexión, los datos que se envían y reciben son ustedes. Deben crear los cabezales HTTP y enviarlos, así como recibir los cabezales interpretarlos y el contenido del HTML.

En respuesta a Ariel Sabiguero Yawelak

Re: Commons CLI

de Nicolas Federico Furquez Morena -

buenas, por lo que veo jsoup hace el parseo html pero ademas se conecta y resuelve toda la conexión y genera el cabezal http, y creo que esto no es la idea y se entiende, pero ¿que pasa si encontramos bibliotecas que pareseen documentos html (o xml ) sin generar todo lo otro?, o ¿ que a pesar de tenerlo usarlas SOLO para el parser y no la conexión?, ¿se podrían usar? 

Por ahí  encontré que html no es tan "regular" como dice ser, que no es buena idea usar expresiones regulares [1].

¿que pasa con las librerías de expresiones regulares? esas ¿se pueden usar?

 

muchas gracias

Nicolás

[1]:http://htmlparsing.com/regexes.html

En respuesta a Nicolas Federico Furquez Morena

Re: Commons CLI

de Ariel Sabiguero Yawelak -

Yo diría que con java.util.regex debería ser suficiente para el alcance de la tarea.

Algún detalle específico que quieran resolver/implementar con otra biblioteca, deberán "negociarlo" con su docente en los monitoreos.

En respuesta a Nicolas Federico Furquez Morena

Re: Commons CLI

de Jorge Visca -

Es verdad que html es suficientemente complejo para que sea mala idea intentar parsearlo de manera simplista.

Sin embrago, lo que se les pide es mucho menos que eso: simplemente reconocer cosas que parezcan URLs dentro de un bloque de texto. Hasta tienen cierta tolerancia para los falsos positivos y negativos: puede pasarles que no encuentren alguna URL, o que intenten procesar algo que parece ser una URL pero no es. Ninguno de los dos casos sería una catástrofe.