HTML Parser

Veloz y sencillo analizador HTML para extraer y transformar

En realidad, se trata de una librería Java usada para parsear HTML, fundamentalmente para extraer y transformar toda la información disponible a través de una página HTML, como por ejemplo el texto, los enlaces y las direcciones de correo, incluso podremos hacer capturas de pantallas o de bases de datos (screen y database scrapingg), extraer imágenes y sonido, o comprobar la validez de los enlaces y hacer monitoring del sitio web en cuestión. A este efecto, disponderemos de múltiples efectos, tags personalizados y facilidades para usar JavaBeans. Ver descripción completa

Muy bueno
8

En realidad, se trata de una librería Java usada para parsear HTML, fundamentalmente para extraer y transformar toda la información disponible a través de una página HTML, como por ejemplo el texto, los enlaces y las direcciones de correo, incluso podremos hacer capturas de pantallas o de bases de datos (screen y database scrapingg), extraer imágenes y sonido, o comprobar la validez de los enlaces y hacer monitoring del sitio web en cuestión. A este efecto, disponderemos de múltiples efectos, tags personalizados y facilidades para usar JavaBeans.

Robusto y muy rápido, el proceso de transformación abarca un gran abanico de posibilidades como la modificación de todos los enlaces de una página, la captura de un sitio web y de su contenido a un disco local, censura de palabras y demás expresiones de una página, limpieza y eliminación de errores de código HTML, conversión desde HTML a XML, todo esto y mucho más.

HTML Parser

Descargar

HTML Parser 1.42