Buenas, quería preguntar si podemos usar la librería Commons Cli [http://commons.apache.org/proper/commons-cli/introduction.html] para implementar el tema de los argumentos.
Agrego otra consulta: el parseo del codigo html es necesario hacerlo nosotros o podemos recurrir a librerías externas como jsoup para dicha tarea?
El parseo de las respuestas http es obvio que lo debemos hacer nosotros, pero del html me quedó la duda.
No deben usar jsoup.
La manipulación de la conexión, los datos que se envían y reciben son ustedes. Deben crear los cabezales HTTP y enviarlos, así como recibir los cabezales interpretarlos y el contenido del HTML.
buenas, por lo que veo jsoup hace el parseo html pero ademas se conecta y resuelve toda la conexión y genera el cabezal http, y creo que esto no es la idea y se entiende, pero ¿que pasa si encontramos bibliotecas que pareseen documentos html (o xml ) sin generar todo lo otro?, o ¿ que a pesar de tenerlo usarlas SOLO para el parser y no la conexión?, ¿se podrían usar?
Por ahí encontré que html no es tan "regular" como dice ser, que no es buena idea usar expresiones regulares [1].
¿que pasa con las librerías de expresiones regulares? esas ¿se pueden usar?
muchas gracias
Nicolás
[1]:http://htmlparsing.com/regexes.html
Yo diría que con java.util.regex debería ser suficiente para el alcance de la tarea.
Algún detalle específico que quieran resolver/implementar con otra biblioteca, deberán "negociarlo" con su docente en los monitoreos.
Es verdad que html es suficientemente complejo para que sea mala idea intentar parsearlo de manera simplista.
Sin embrago, lo que se les pide es mucho menos que eso: simplemente reconocer cosas que parezcan URLs dentro de un bloque de texto. Hasta tienen cierta tolerancia para los falsos positivos y negativos: puede pasarles que no encuentren alguna URL, o que intenten procesar algo que parece ser una URL pero no es. Ninguno de los dos casos sería una catástrofe.
Por eso mismo preguntaba por jsoup, para parsear el html pasándoselo como un string, no para manejar las conexiones por mí...