de webmaster a webmaster

Chupones de la web

sin comentarios, faltaría plus, venga haz el tuyo pinchando aquí que esto tiene premio seguro!

Muchos de vosotros os preguntareis muchas veces como tal empresa tiene la misma información en su que la de otra empresa, o los mismos productos que tal mayorista.

Por lo general existe una fuente y otros sites alienos a él que extraen información de forma periódica y totalmente desasistida, ahora bien ¿Cómo lo hacen?

Existen varias formas, entre ellas la más obvia es que la empresa de origen te entregue la información mediante XML, RSS, o otra archivo descargable.

Una vez descargada serás tu mismo el que hagas esa información tuya, la reconstruyas o la dejes tal cual.

Pero el caso que nos ocupa es aquel en que la web de origen no ofrece ningún sistema para “snifarle” los contenidos… o bien los que necesitamos capturar de forma periódica no son ofrecidos en formato descargable, la solución no es otra que un chupón de datos en capa web, un programa que te instalas en tu máquina, le das una URL le describes un proceso, como si grabases una macro y ala, a chupar.

El programa que hemos visto se llama OpenKapow y existen versiones para y Linux. Nosotros no lo hemos podido probar todavía, pues somos más de , tendremos que virtualizar.

Aquí teneis un pantallazo de la web, donde muestra el proceso de tres pasos, bajarse RoboMaker para grabar las macros, crear robots y lanzarlos.

chupones_de_la_web_01

En la web del programa tienes varios ejemplos y tutoriales de uso, por ejemplo hay uno con el que puedes extraer las noticias del diario americano The New York Times pero con las fotografías de los artículos, pues los RSS este tan famoso diario no te ofrecen las fotos, otro extrae imágenes de Flickr

Enlace: http://openkapow.com/

Be Sociable, Share!

Escrito por un tal uvedobles.com

October 7th, 2009 a las 6:43 pm

Posteado como Aplicaciones de escritorio,Copy Paste

con las etiquetas de , , , ,

Deja aquí tu comentario, tu huella, o mejor ingrésame unos euros