Preparación de Nutch1.0: Guía básica de instalación en Ubuntu 9.10
Manuel Blázquez
2010-04-26T21:18:20+02:00
Clasificación temática:
Tecnologías Documentales, Sistemas de Recuperación de Información, Webcrawlers
Resumen:
El presente manual trata de ayudar en la instalación de programa Nutch. Se trata de un webcrawler de código abierto, de gran relevancia por ser desarrollado por el Apache Software Foundation y utilizado ampliamente en investigaciones de la web. A la par que su reputación, se encuentra su manejo, que puede resultar complejo si no se dominan sus comandos esenciales. Con el objetivo de facilitar su uso e instalación se propone la presente guí¬a de iniciación.
Palabras clave:
nutch, webcrawler, spiders, apache, tomcat, recuperación de información, information retrieval