Formación en minería de textos para periodismo de datos

Este post es una adaptación del libro: PASTOR SÁNCHEZ, Juan Antonio (coord.). Construcción de servicios de información digital. Murcia: DM, 2010.

La Web 3.0 se refiere a un entorno en el que aplicaciones y agentes de usuario intercambian datos, procesan datos, realizan inferencias de datos, etc. para generar nueva información.

El W3C, organismo que lleva la iniciativa de la Web 3.0, emplea las acepciones web de datos y web semántica, para hacer referencia a la web de datos enlazados/datos vinculados (Linked Data) y las tecnologías semánticas que emplea para hacerla efectiva.

La Web Semántica nace de la confluencia de la inteligencia artificial y las tecnologías web. Para ello se proponen nuevos paradigmas para la representación del conocimiento que faciliten la localización, integración y compartición de recursos a través de la Web.

Los objetivos de la Web Semántica pueden resumirse en:

  • Uso de metadatos para describir el contenido semántico de los documentos.
  • Reutilización, localización e integración de recursos web usando datos estructurados/información estructurada mediante especificaciones normalizadas.
  • Intercambio de información entre usuarios y máquinas.
  • Separación entre estructura, contenido, relaciones y formato de visualización de la información.
  • Desarrollo de herramientas de inferencia de información para crear aplicaciones y agentes inteligentes.

La representación de la información en la Web Semántica se fundamenta en: METADATOS y ONTOLOGÍAS.

  • En la Web actual se utilizan los metadatos para designar los registros producidos a partir de una serie de estándares creados específicamente para la descripción de recursos electrónicos.
  • En la Web actual se utilizan las ontologías para describir los objetos definiendo clases, propiedades, relaciones y axiomas. Las ontologías permitirán desarrollar estructuras complejas para simplificar tareas de comunicación entre personas y máquinas con la intermediación de aplicaciones informáticas.

La arquitectura de la Web Semántica se basa en 3 tecnologías: URI, HTTP y XML. Esto difiere un poco de la arquitectura inicial de la Web basada en 3 tecnologías: URLs, HTTP y HTML.

Actualmente, la Web Semántica consta de diferentes tecnologías con un grado de abstracción cada vez mayor: XML, RDF y OWL.

  • El XML (eXtensible Markup Language) es un metalenguaje para la definición de lenguajes que permiten el intercambio de datos estructurados correctamente con independencia de la plataforma en la que se ejecuten las aplicaciones.
  • El RDF (Resource Description Framework) es un modelo para la representación de información estructurada en forma de metadatos con el objetivo de describir recursos disponibles en Internet o de otro tipo. Los RDFS (RDF Schema) que es un vocabulario para describir las propiedades y las clases de los recursos RDF.
  • El OWL (Web Ontology Language) es un lenguaje desarrollado por el W3C Web-Ontology Working Group (grupo cerrado) para publicar y compartir ontologías en la Web.

La imagen muestra una visión de la infraestructura de la Web: en el lado izquierdo, la Web inicial, y en el lado derecho, la actual Pila Tecnológica del W3C.

Pila Tecnológica del W3C

Fuente: http://www.w3c.es/Consorcio/tecnologia.html#techstack

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Responsable de los datos: Nuria Portillo Poblador.
Finalidad: Controlar el spam, gestión de comentarios.
Legitimación: Tu consentimiento expreso.
Destinatario: Nuria Portillo Poblador. No se cederán datos a terceros, salvo obligación legal.
Derechos: Acceso, rectificación, supresión, anonimato, portabilidad y olvido de sus datos.