Viendo en la Transparencia

A comienzos del 2007 tuve el inmenso privilegio de asistir a un curso único: Visualización de Información enseñado por Ben Fry (creador de Processing) y Golan Levin, reconocido artista digital. Este curso (único e irrepetible en su especie), se centró en el proceso de generar visualizaciones a partir de grandes cuerpos de datos. El énfasis no estaba puesto en el despliegue técnico —o la proeza del código— sino la capacidad de poder urdir narrativas interesantes a partir de un montón amorfo de data. La metodología de trabajo fue la siguiente, siguiendo la propuesta por Ben Fry en su tesis doctoral, Computational Information Design.
  1. Adquisición de datos: Recolección y catastro de datos dinámicos y cambiantes
  2. Análisis de datos: (eng: Parsing) Formateo de datos de acuerdo al uso, conexión de la data a la aplicación propia.
  3. Filtración de datos: Automatización de procesos manuales que tienden a ser altamente tediosos
  4. Data mining: Estracción de datos significativos
  5. Representación: Elección y diseño del lenguaje visual, prototipado
  6. Refinación: Cambio o ajuste de las leyes de representación
  7. Interacción: Transición contínua entre los diversos estados o puntos de vista alternativos, navegación y adaptación por parte del usuario.
Claramente la parte más sucia del proceso es la adquisición de datos porque generalmente hay que sacarlos de lugares donde no los quieren prestar. Hay que construir robots que roben sistemáticamente los datos de determinado sitio web (pero no tan sistemáticamente, para que no te pillen y bloqueen tu IP) buscar y escarbar en tablas HTML, lipiar tags inútiles, etc.

2 thoughts on “Viendo en la Transparencia

  1. Hay un libro muy chulo en el que Ben Fry explica todo esto con detalle:

    http://oreilly.com/catalog/9780596514556

    Yo ahora estoy con un robot que navega y extrae datos de recaudación de películas del sitio del MCU y, en efecto, es bastante pesado. Pero por ahora no me han bloqueado 🙂

    Pero yo diría que la tendencia es hacia el Open Data, a facilitar la explotación de los datos. Ya lo han hecho en EEUU, Reino Unido, Nueva Zelanda, etc. y empiezan a arrancar las primeras iniciativas en España.

Responder a DamagedGoods Cancelar respuesta

Su dirección de correo no se hará público.