Las nuevas técnicas para extraer datos de las webs
Una jornada organizada por el Grupo SPRI analiza el web scraping, una técnica utilizada mediante programas de software para extraer información de sitios web
Esta tecnología permite detectar cambios en sitios web, obtener precios para comparadores, aplicaciones para business intelligence, o incluso se usa en el periodismo de investigación
Los datos se están convirtiendo en el recurso más valioso del mundo y la obtención de información es cada vez más codiciada. Una jornada organizada por el Grupo SPRI, la agencia vasca de desarrollo empresarial, se ha centrado en analizar el web scraping, una técnica utilizada mediante programas de software para extraer información de sitios web. “Obtener datos, información y contenido es relativamente fácil con la tecnología actual que tenemos”, ha afirmado el experto Juan Riaza en una conferencia celebrada en el Polo de Innovación Garaia, en Mondragón,
Riaza ha expuesto numerosos ejemplos de las posibilidades de esta técnica, como detección de cambios en sitios web, obtención de precios para comparadores, aplicaciones para business intelligence, o incluso el periodismo de investigación. “Por ejemplo, cuando alguien quiere alquilar un piso y has recibido 500 emails de gente interesada. Utilizas el web scraping para priorizar las personas a las que quieres alquilar el piso”. El experto se ha referido a infinidad de negocios que trabajan con este modelo. “Hay gente que se dedica a ver si las personas tienen deudas”.
O casos como Strava, una empresa que comercializa pulseras para correr que indican los datos de kilómetros recorridos, pulsaciones o rendimiento personalizado, que pudo conocer el funcionamiento de instalaciones militares a través de los miembros del Ejército que hacían footing.
¿Y cómo protegerse de un web scraping? “Podemos bloquearlo, aunque es costoso”. Riaza ha recomendado, para utilizar esta técnica, que también se tengan en cuenta los costes de mantenimiento.
Ha comentado que, si el uso de los datos es interno, no hay problemas. “Pero hay empresas que se dedican a revender los datos y las cuestiones legales y éticas dependen de cada país y de cada uno”.
Jorge Campanillas, también de la empresa Iurismática, se ha referido a los aspectos legales del uso del web scraping. “El Tribunal Europeo ha dictaminado que el poseedor de una base de datos puede negarse a que se use por terceros”. Y en España, ha revelado, el Tribunal Supremo también ha dictado dos sentencias contrarias a empresas que usaron datos de precios de vuelos de compañías aéreas. “Ha señalado que el simple hecho de navegar por internet no es un contrato. Pero otra cosa es el acceso a la zona privada y no puedes utilizar esa información”.
La ley, ha asegurado, dictamina que los datos se protegen y el coste que ha generado al propietario. “Lo que no puedes prohibir es extraer partes de esos datos con un fin privado, pero no con ánimo de lucro ni tampoco desde una empresa”.
En Estados Unidos la privacidad de datos no tiene ni siquiera anclaje constitucional, a diferencia de Europa, donde se exige el consentimiento expreso. “Se acabaron los consentimientos por silencio o tácitos”.
Campanillas ha recomendado, para evitar problemas legales, “leer la letra pequeña” de los portales en los que se va a utilizar el web scraping y solicitar el consentimiento si hay datos personales.
Noticias relacionadas

KPMG destaca que “las empresas vascas tienen en sus manos una oportunidad única para fortalecer su competitividad y liderazgo en la era de la IA”
En la jornada también participó Elixabete García Caballero, directora de Transformación Digital del Gobierno Vasco, quien destacó “el compromiso de la administración con una transición digital ética y sostenible”.

Desarrolla un plan de formación digital en tu empresa con el programa Competencias Digitales Profesionales
La nueva edición del programa Competencias Digitales Profesionales aumenta su presupuesto hasta los 2 millones de euros, con el objetivo de seguir impulsando la competitividad de las empresas vascas a través del fortalecimiento de las competencias digitales de sus plantillas.

Aumenta un 64% las personas asistentes a la formación en TIC del Gobierno Vasco a través de SPRI
La iniciativa Enpresa Digitala se lleva a cabo en cinco espacios físicos en los 3 Territorios, el último en abrirse en el Campus de Abanto en Ezkerraldea

Irudi B2B: 7 años analizando el marketing digital industrial a través de su blog
El objetivo es compartir conocimiento útil para que la industria aproveche al máximo el potencial del canal digital

Las ayudas Industria Digitala te abren el camino hacia la transformación digital de tu negocio
La nueva edición del programa de ayudas Industria Digitala 2025 cuenta con un presupuesto de 7,5M€. Las empresas interesadas en transformar digitalmente su negocio, podrán presentar sus solicitudes a partir del 18 de marzo y hasta el 31 de octubre.