RedesComp: Commons CLI

Buenas, quería preguntar si podemos usar la librería Commons Cli [http://commons.apache.org/proper/commons-cli/introduction.html] para implementar el tema de los argumentos.

Re: Commons CLI

de Martin Giachino - martes, 2 de septiembre de 2014, 19:31

Re: Commons CLI

de Marco Centurion Virdo - martes, 2 de septiembre de 2014, 21:40

Agrego otra consulta: el parseo del codigo html es necesario hacerlo nosotros o podemos recurrir a librerías externas como jsoup para dicha tarea?

El parseo de las respuestas http es obvio que lo debemos hacer nosotros, pero del html me quedó la duda.

Re: Commons CLI

de Martin Giachino - martes, 2 de septiembre de 2014, 23:13

Re: Commons CLI

de Ariel Sabiguero Yawelak - miércoles, 3 de septiembre de 2014, 12:16

No deben usar jsoup.

La manipulación de la conexión, los datos que se envían y reciben son ustedes. Deben crear los cabezales HTTP y enviarlos, así como recibir los cabezales interpretarlos y el contenido del HTML.

Re: Commons CLI

de Nicolas Federico Furquez Morena - miércoles, 3 de septiembre de 2014, 13:19

buenas, por lo que veo jsoup hace el parseo html pero ademas se conecta y resuelve toda la conexión y genera el cabezal http, y creo que esto no es la idea y se entiende, pero ¿que pasa si encontramos bibliotecas que pareseen documentos html (o xml ) sin generar todo lo otro?, o ¿ que a pesar de tenerlo usarlas SOLO para el parser y no la conexión?, ¿se podrían usar?

Por ahí encontré que html no es tan "regular" como dice ser, que no es buena idea usar expresiones regulares [1].

¿que pasa con las librerías de expresiones regulares? esas ¿se pueden usar?

muchas gracias

Nicolás

[1]:http://htmlparsing.com/regexes.html

Re: Commons CLI

de Ariel Sabiguero Yawelak - miércoles, 3 de septiembre de 2014, 14:07

Yo diría que con java.util.regex debería ser suficiente para el alcance de la tarea.

Algún detalle específico que quieran resolver/implementar con otra biblioteca, deberán "negociarlo" con su docente en los monitoreos.

Re: Commons CLI

de Jorge Visca - miércoles, 3 de septiembre de 2014, 14:14

Es verdad que html es suficientemente complejo para que sea mala idea intentar parsearlo de manera simplista.

Sin embrago, lo que se les pide es mucho menos que eso: simplemente reconocer cosas que parezcan URLs dentro de un bloque de texto. Hasta tienen cierta tolerancia para los falsos positivos y negativos: puede pasarles que no encuentren alguna URL, o que intenten procesar algo que parece ser una URL pero no es. Ninguno de los dos casos sería una catástrofe.

Re: Commons CLI

de Marco Centurion Virdo - jueves, 4 de septiembre de 2014, 11:11

Por eso mismo preguntaba por jsoup, para parsear el html pasándoselo como un string, no para manejar las conexiones por mí...