Social Media: Web Semántica vs Búsqueda Semántica

sábado, 9 de abril de 2011

Web Semántica vs Búsqueda Semántica

Eunice Kanenstenhawi WilliamsImage via WikipediaLa Web Semántica es una Web extendida, dotada de mayor significado en la que cualquier usuario en Internet podrá encontrar respuestas a sus preguntas de forma más rápida y sencilla gracias a una información mejor definida. Al dotar a la Web de más significado y, por lo tanto, de más semántica, se pueden obtener soluciones a problemas habituales en la búsqueda de información gracias a la utilización de una infraestructura común, mediante la cual, es posible compartir, procesar y transferir información de forma sencilla. Esta Web extendida y basada en el significado, se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semántica en la que, en ocasiones, el acceso a la información se convierte en una tarea difícil y frustrante.


La Web ha cambiado profundamente la forma en la que nos comunicamos, hacemos negocios y realizamos nuestro trabajo. La comunicación prácticamente con todo el mundo en cualquier momento y a bajo coste es posible hoy en día. Podemos realizar transacciones económicas a través de Internet. Tenemos acceso a millones de recursos, independientemente de nuestra situación geográfica e idioma. Todos estos factores han contribuido al éxito de la Web. Sin embargo, al mismo tiempo, estos factores que han propiciado el éxito de la Web, también han originado sus principales problemas: sobrecarga de información y heterogeneidad de fuentes de información con el consiguiente problema de interoperabilidad.

La Web Semántica ayuda a resolver estos dos importantes problemas permitiendo a los usuarios delegar tareas en software. Gracias a la semántica en la Web, el software es capaz de procesar su contenido, razonar con este, combinarlo y realizar deducciones lógicas para resolver problemas cotidianos automáticamente.

Dos de los ejemplos más conocidos de aplicación de Web Semántica son RSS y FOAF.
  • RSS es un vocabulario RDF basado en XML que permite la catalogación de información (noticias y eventos) de tal manera que sea posible encontrar información precisa adaptada a las preferencias de los usuarios. Los archivos RSS contienen metadatos sobre fuentes de información especificadas por los usuarios cuya función principal es avisar a los usuarios de que los recursos que ellos han seleccionado para formar parte de esa RSS han cambiado sin necesidad de comprobar directamente la página, es decir, notifican de forma automática cualquier cambio que se realice en esos recursos de interés seleccionados. Un ejemplo de la aplicación de RSS se puede encontrar en las Noticias de la Oficina Española del W3C como canal RSS.
  • FOAF es un proyecto de Web Semántica, que permite crear páginas Web para describir personas, vínculos entre ellos, y cosas que hacen y crean. Se trata de un vocabulario RDF, que permite tener disponible información personal de forma sencilla y simplificada para que pueda ser procesada, compartida y reutilizada. Dentro de FOAF podemos destacar FOAF-a-Matic, que se trata de una aplicación Javascript que permite crear una descripción FOAF de uno mismo. Con esta descripción, los datos personales serán compartidos en la Web pasando a formar parte de un motor de búsqueda donde será posible descubrir información a cerca de una persona en concreto y de las comunidades de las que es miembro de una forma sencilla y rápida.
La búsqueda semántica busca mejorar la precisión de la búsqueda mediante la comprensión de buscador de intención y el significado contextual de los términos que aparecen en el espacio de datos de búsqueda, ya sea en la Web o dentro de un sistema cerrado, para generar resultados más relevantes. El autor Seth Grimes lista "11 enfoques que se unen a la búsqueda semántica" (referencia 1) y Hildebrand et al. (referencia 2) ofrece un panorama general que muestra los sistemas de búsqueda semántica y se identifican otros usos de la semántica en el proceso de búsqueda.

Guha et al. (referencia 3) distingue dos formas principales de búsqueda: la navegación y la investigación. En busca de navegación, el usuario está utilizando el motor de búsqueda como herramienta de navegación para desplazarse a un documento destinado en particular. La búsqueda semántica no es aplicable a las búsquedas de navegación. En la investigación de la búsqueda, el usuario proporciona al motor de búsqueda con una frase que se destina para denotar un objeto sobre el cual el usuario está tratando de reunir información de la investigación. No hay ningún documento en particular que el usuario sabe que él está tratando de llegar. Por el contrario, el usuario está tratando de localizar una serie de documentos que en conjunto le darán la información que está tratando de encontrar. La búsqueda semántica se presta muy bien aquí.

En lugar de utilizar algoritmos de clasificación como el PageRank de Google para predecir la relevancia, los usos de búsqueda semántica, o la ciencia del significado en el lenguaje, para producir resultados de búsqueda de la mayor relevancia. En la mayoría de los casos, el objetivo es entregar la información consultada por un usuario en lugar de tener un tipo de usuario a través de una lista de resultados de palabras clave vagamente relacionadas.

Otros autores sobre todo respecto de la búsqueda semántica hablan de un conjunto de técnicas para recuperar el conocimiento de la rica estructura de fuentes de datos como ontologías como se encuentran en la Web Semántica. Estas tecnologías permiten la articulación formal de área del conocimiento a un alto nivel de expresividad y podría permitir que el usuario especifique sus intenciones con más detalle en el momento de la consulta.

Para entender lo que un usuario está buscando,  debe ocurrir la desambiguación del sentido de la palabra. Cuando un término es ambiguo, lo que significa que puede tener varios significados (por ejemplo, si se considera el lema "corteza", puede ser entendido como" el sonido de un perro "," la piel de un árbol ", o" un velero de tres palos "), el proceso de desambiguación se ha iniciado, gracias a lo cual el significado más probable es elegido entre todos las posibles.

Estos procesos hacen uso de otro tipo de información presente en un sistema de análisis semántico y tiene en cuenta el significado de las palabras en la oración y en el resto del texto. La determinación de cada sentido, en sustancia, influye en la desambiguación de los demás, hasta que una situación de máxima plausibilidad y coherencia se llega a la frase. Toda la información fundamental para el proceso de desambiguación, es decir, todo el conocimiento utilizado por el sistema, se representa en forma de una red semántica, organizada sobre una base conceptual.

En una estructura de este tipo, todos los conceptos léxicos coinciden, por tanto, con un nodo de red semántica y está vinculado a otros por determinadas relaciones semánticas en una estructura jerárquica y hereditaria. De esta manera, cada concepto se enriquece con las características y el significado de los "nódulos" cercanos.

Cada nodo de la red (llamado Synset) agrupa un conjunto de sinónimos que representan el mismo concepto léxico (llamados synsets) y pueden contener:
  • lemas simples ('silla', 'vacaciones', 'trabajo', 'rápida', 'rápidamente', 'más', etc)
  • compuestos ('Non-stop', 'abat-jour "," policeman ")
  • colocaciones ("Tarjeta de crédito", "título universitario", "acciones propias", "seguir adelante", etc.)
Las relaciones semánticas (enlaces), identifican las relaciones semánticas entre los synsets, son los directores para la organización de los conceptos de la red semántica.

Portales de búsqueda semántica

Empresas con motores de búsqueda semántica

Referencias:
  1. ^ Breakthrough Analysis: Two + Nine Types of Semantic Search
  2. ^ Semantic Search Survey
  3. ^ www2003.org/cdrom/papers/refereed/p779/ess.html
  4. ^ http://www.aifb.uni-karlsruhe.de/WBS/pha/publications/ontology-ir-ictir07.pdf
  5. ^ Survey of Semantic Search Research

Más información sobre Web Semántica

Actividad de Web Semántica
Toda la información sobre la Actividad en Web Semántica del W3C.
Visión General del Lenguaje de Ontologías Web (OWL)
Recomendación del W3C.
Página principal de RDF
Toda la información sobre la Infraestructura de Descripción de Recursos.
Preguntas frecuentes sobre RDF
Respuestas a las dudas más frecuentes sobre RDF.
SPARQL
Página principal del Grupo de Trabajo de Acceso a Datos en RDF.
Página principal de OWL
Toda la información sobre el Lenguaje de Ontologías Web.
Preguntas frecuentes sobre OWL. Disponible una versión en español
Respuestas a las dudas más comunes sobre el Lenguaje de Ontologías Web.
Implementaciones de OWL
Amplia lista de implementaciones de OWL existentes.
Grupo de Trabajo de GRDDL
Página principal del Grupo de Trabajo de GRDDL.
Introducción a RDFa
Introdución a RDFa: Introduciendo datos estructurados en Páginas Web.

Wiki de Web Semántica del W3C
Wiki de Web Semántica, con información práctica sobre tecnologías, herramientas, casos de uso, etc.
SemWebSpain
Wiki de Proyectos y Documentos en español o de España sobre la Web Semántica.
SIMILE
Proyecto SIMILE: Ejemplos basados en tecnologías de Web Semántica.
SchemaWeb y DAML
Repositorios de Ontologías.
Swoogle
Buscador temático sobre Web Semántica.
Herramientas de Desarrollo de la Web Semántica
Herramientas de Desarrollo de la Web Semántica (validadores, buscadores, librerías de desarrollo, etc.).
Artículos relacionados:  
las 10 mejores web semánticas de 2010
Cloud Computing+Web Semántica+Datos Abiertos (I): Linked Data Cloud
Cloud Computing+Web Semántica+Datos Abiertos (II): Linked Data Cloud
Cloud Computing+Web Semántica+Datos Abiertos (III): Linked Data Cloud
La Web 3.0: ¿Hablamos de algo que no existe?
Enhanced by Zemanta