RSS

Linked Open Data: qué es y ejemplos en el mundo

Enviado por Rodrigo Mazzo el 01/12/2011 a las 2:56 AM

Texto bajo licencia Creative Commons de http://www.bcn.cl/de-que-se-habla/open-data-link-data

Escribí este artículo mientras trabajaba en la Biblioteca del Congreso Nacional.


OpeData es una forma de publicar datos de organizaciones públicas y privadas, en formatos quesean reutilizables por personas e instituciones. Ya hay ejemplos de su aplicación en Europa yEstados Unidos.

En su planteamiento, OpeData se asemeja al movimiento Open Source, pero a diferencia de éste no apunta a desarrollar software sino a posibilitar el acceso y reutilización de datos.

OpeData plantea que la publicación de datos desagregados, “crudos”, permitirá múltiples y sorprendentes formas de análisis, comparaciones, relaciones, formatos gráficos, etc.

El valor generado al acceder y manipular esos datos puede ser tan grandeque nos sorprenda, tal como le pasó a quienes vieron saltar a la web desde espacios académicos y militares hacia el mundo de las comunidadesciviles, el mercado, los medios de comunicación, etc.

“Si la gente coloca sus datos en la web, datos gubernamentales, científicos, los de la comunidad, serán usados por otras personas en formas en que nunca podrían haber imaginado” dice Tim Berners-Lee, creador del lenguaje HTML, en el que están hechos los sitios web.

 

src="http://rodmazzo.bligoo.com/static/58.000/js/plugins/flash/img/trans.gif" title="http://video.ted.com/assets/player/swf/EmbedPlayer.swf" alt="http://video.ted.com/assets/player/swf/EmbedPlayer.swf" class="mceFlash mceItem" />> 

Experiencias de OpeData en el mundo

 

Banco Mundial y OpeData

Hay varias experiencias alrededor del mundo, como los datos sobre indicadores de desarrollo que provee el Banco Mundial. No sólo permite visualizar gráficos y mapas sobre educación, salud y varias otras variables.

Las personas también pueden seleccionar los datos que quieren visualizar y ver cómo cambian las curvas de los diagramas en pocos segundos. Y, además de poder descargarlos, los mismos pueden ser leídos por otros sitios web mediante APIs.

En el sitio podemos cruzar a voluntad varios datos en el mismo sitio del Banco Mundial.

Abajo tenemos cómo esa misma información fue tomada y aplicada al Explorador de Datos Públicos de google.

 

The Times y Directgov

Otro ejemplo es el mostrado por el Tim Berners-Lee, quien en una de sus conferencias TED mostró cómo el diario británico The Times utilizó información pública del gobierno británico (datos “crudos”) para generar un tipo de información que no existía antesun mapa de accidentes de bicicletas.

El medio británico colocó los datos en un mapa de Google, permitiendo a los lectores saber las zonas donde hay más accidentes de bicicletas o, si lo prefieren, saber donde ocurrió cada uno de forma individual.

¿De dónde obtuvo los datos The Times? Pues del sitio web del gobierno británico Directgov. El mismo gobierno liga la transparencia con el acceso a datos locales y nacionales de manera libre y reusable. También entrega una serie de aplicaciones basadas en los mismos, como una hecha para calcular de impuestos,  y otra que da a conocer el rating de higiene de locales de comida del país.

En la misma página se invita a crear más aplicaciones o a dar ideas para desarrollar nuevas.

Mapa de accidentes de bicicletas de The Times

 

El gobierno Vasco

El gobierno Vasco también está trabajando en OpeData, promoviendo a través de un sitio web el descubrimiento y la construcción de aplicaciones basadas en datos públicos, para crear “valor y riqueza”, apoyar la transparencia y facilitar la interoperatibilidad entre administraciones.

Un ejemplo es el mapa de recursos turísticos que ponen a disposición de la comunidad.

Tim Berners Lee

Junto con el lenguaje HTML (o hipertexto) Tim Berners-Lee creó también el protocolo HTTP para la comunicación en la web, y el URL, para las direcciones.

 

Italia

En Italia también han lanzado un sitio web que ofrece datos de uso libre para las personas e instituciones. Se pueden encontrar casos de uso,iniciativas pedagógicas y secciones destinadas a recibir ideas y propuestas acerca de informaciones aún no liberadas.

 

OpeData en Chile

En el contexto de la Ley de Transparencia, nació la Iniciativa Chile Datosque promueve prácticas y estándares de publicación de datos públicos. La idea de la organización es que las personas puedan acceder tanto a los datos como a aplicaciones para procesarlos.

Actualmente no existen ejemplos del nivel del Reino Unido o de la plataforma que ofrece Estados Unidos, pero sí hay ciertos avances en cuanto a colocar a disposición del público información, aunquetodavía no como datos puros reutilizables.  Es el caso del sitio Gobierno Transparente.

También la Biblioteca del Congreso tiene avances en esta materia, estimando que tiene nivel 3 en laclasificación de 1 a cinco de estrellas que se está proponiendo para evaluar el nivel de avance en la implementación.

Subir >>

 

 

OpeData, Link Data y la Web

 

Cuando Tim Berners-Lee trabajaba en un centro de estudios nucleares de Europa (CERN), se sentía frustrado. A pesar de ser un lugar muy interesante para un licenciado en física como él, su trabajo como ingeniero de software se complicaba.

Llegaban personas de todo el mundo con nuevas ideas, pero también con sus propios computadores, y sobre todo, con distintos formatos de datos y de documentación.

Cuando era necesario hacer interactuar esos datos tenía que aprender los códigos de diferentessistemas sólo para poder acceder a la información, y recién entonces poder trabajar con ella. Al parecer era una situación bastante común.

La solución: diseñó el lenguaje en el que están hechas las páginas web, el famoso HTML, que permite saltar de un documento a otro con un simple click, y que es la forma más usada de entregar contenido a través de la web: documentos HTML.

Actualmente este lenguaje es uno de los pilares de la web y permite compartir información a personas e instituciones alrededor de todo el mundo. Y cuando hablamos de “información” nos referimos a trabajos académicos, noticias, direcciones físicas, teléfonos, ofertas de trabajo, precios de productos, opiniones personales, redes de contacto, mensajes entre personas y organizaciones, listas de correo, manifestaciones virtuales, etc.

El uso de HTML en Internet ha llevado a la web a un potencial que Tim Berners-Lee nunca imaginó. Y probablemente ninguno de quienes participaron en los inicios de Internet sospechó el alcance ni la forma que tomarían sus esfuerzos.

Aunque HTML está hecho para que lleve cierta información agregada, como códigos para indicar quecierta frase es un título más importante que otro, sigue siendo un formato limitado cuando se quiere hurgar un poco más detalladamente en los datos que nos trae.

 

Documentos y datos

Es el mismo Tim Berners-Lee quien dice que a este invento que es la web se le puede dar una vuelta de tuerca más para obtener más beneficios.

El reconocido director de la W3C (World Wide Web Consortium) dice que gran parte del valor de la web se trata de compartir “sólo” documentos, y es el primero en reconocer la utilidad de esta forma de distribuirlos y enlazarlos.

Pero esto no es obstáculo para que defienda la idea de que ahora las organizaciones compartan los datos de manera directa, los datos crudos: “Raw Data Now” es su eslogan.

Esto no implica dejar de usar HTML, que sigue siendo una forma muy eficiente de transmitir información, pero sí dar un paso más allá y ofrecer, además, los datos para su uso libre.

Subir >>

 

Web Semántica y OpeData

 

Al poder tener los datos desagregados, permitir su acceso y conexión, se da un paso más en lo quees la web semántica, y su carga extra de información relacionada y descriptiva del contenido.

Por ejemplo, Tim Berners-Lee colocó en Google:

¿Qué proteínas están implicadas en la transducción de señales y también relacionadas con las neuronas piramidales? (“What proteins are involved in signal transduction and also related to pyramidal neurons?” en inglés), obteniendo más de 200 mil resultados, y probablemente ninguna respuesta exacta.

Pero cuando lo hizo usando una plataforma que trabajaba con Linked Data, llegó a 32 respuestas, lasque sí podía revisar con más atención y probablemente con más posibilidades de éxito.

 

Los acuerdos necesarios para OpeData

OpeData y LinkedData en Twitter

Estos son los hashtag usados en Twitter paraestos temas:

- #opendata

- #linkeddata

 

El concepto de OpeData se relaciona con el de Linked Data (Datos Vinculados), que busca crear una base de datos común mediante la publicación en la web de bases de datos, para lo que se está trabajando tanto en los estándares técnicos como en lograr los acuerdos que lo hagan posible alrededor del mundo.

Es conveniente aclarar que ambos términos no son sinónimos: Linked Dataes un paso más allá y para funcionar requiere los datos que proporcionaOpeData.

Tanto OpeData como Link Data van de la mano con el desarrollo de la web semántica, que no sólo traerá documentos, sino información relacionada que describe el contenido, su significado y la relación de los datos. Como corolario, se espera poder hacer preguntas “inteligentes”, más complejas que las que pueden responder los buscadores con la tecnología tradicional.

Ambos requieren acuerdos técnicos en cuanto a la forma en que se guardarán los datos, laestandarización del formato, así como decisiones políticas de gobiernos, organizaciones y personas respecto a qué datos serán o no públicos, definiciones de privacidad,  etc.

OpeData y Link Data tienen aún un camino largo por recorrer, y su potencial es inmenso.

Subir >>

 

Las cinco estrellas del Open Linked Data

  • Aunque no está oficializado, hay una propuesta de clasificación respecto a qué tan abiertos y usables son los datos que puede ofrecer una institución. Se basa en ofrecer estrellas, de una a cinco:
  • Una estrella: ofrecer los datos en cualquier formato, aunque sean difíciles de manipular no desagregar, como un pdf por ejemplo o una imagen escaneada..
  • Dos estrellas: entregar los datos de manera estructurada, como en un archivo excel con extension xls.
  • Tres estrellas: entregar los datos en un formato que no sea propietario, como csv en vez de excel, xml, rdf, etc.
  • Cuatro estrellas: usar URL para identificar cosas y propiedades, de manera que se pueda apuntar a los datos. Requiere usar un estándar: RDF.
  • Cinco estrellas: vincular sus datos con los de otras personas, entregando su contexto. En la práctica, a que la información entregada también apunte a otras fuentes de datos. Por ejemplo, si coloco un país dentro de mis datos, en mi esquema debe ir una url que apunte a los datos de ese país en Dbpedia, por ejemplo.

Links sobre el tema

OpeData

Linked Data

Open Source

Propuesta de las cincoestrellas

Tim Berners-Lee

World Bank Data

Tim Berners Lee: El año en que OpeData se volvió mundial (varios diomas)

Tim Berners Lee: la próxima web (subtítulos en varios idiomas)

Explorador de datos públicos de Google Labs

Mapa de The Timessobre accidentes de bicicletas

Sitio de OpeData del gobierno italiano

Sitio de OpeData del gobierno británico

Sitio de OpeData deEstados Unidos

Sitio de OpeData del gobierno vasco

Mapa turístico con datos del gobierno vasco

Iniciativa Chile Datos

Gobierno Transparente

CERN

World Wide Web Consortium: W3C

Traductor universal basado en Linked Data

Informe de PricewaterhouseCoopers sobre OpeData y Web Semántica (en PDF)

 

Publicidad por Bligoo.com

Escribe un comentario

¿Quieres usar tu foto? - Inicia tu sesión o Regístrate gratis »
Comentarios de este artículo en RSS