Por tanto, las ontologías juegan un papel muy importante en la Web Semántica como medio para capturar conocimiento de un dominio de una manera genérica, así como para proporcionar un entendimiento comúnmente consensuado de un dominio, que podría reutilizarse y compartirse a través de aplicaciones y grupos.
Por otra parte, los recientes trabajos relacionados con la generación de dichas anotaciones usan la extracción de información (IE) para ayudar a los usuarios a anotar automáticamente los documentos con contenidos semánticos. El usuario entrena las herramientas de extracción de información anotando algunas páginas manualmente, hasta que el sistema pueda comenzar a sugerir anotaciones automáticamente. Entonces el usuario puede continuar entrenando el sistema mediante la corrección de errores y/o anotando la información que falta.
Dentro de los componentes identificados por Knowledge Web, una red de excelencia financiada por la Unión Europea, como parte de la anotación de contenidos caben destacar: editores de instancias, anotadores automáticos, semi-automáticos y manuales, pobladores de ontologías, repositorios de ontologías y repositorios de datos.
Finalmente, se han de tener en cuenta herramientas dependientes del contexto para el acceso al conocimiento semánticamente anotado. Por herramientas dependientes del contexto se entienden herramientas que tendrán en cuenta las actividades actuales, intereses y acceso a dispositivos de un usuario.
Al principio de los años 90, las ontologías se construían principalmente utilizando técnicas de representación del conocimiento basadas en marcos, lógica de primer orden y lógica descriptiva. En 1993, Gruber (Gruber, 1993) identificó cinco tipos de componentes: clases, relaciones, funciones, axiomas e instancias. En los últimos años, las técnicas de representación basadas en lógica descriptiva (Crachman y Schnolze, 1985) se han consolidado en el contexto de la Web semántica, creándose nuevos lenguajes como OIL (Horrocks et al., 2000), DAML+OIL (Horrocks y van Harmelen, 2001) y OWL (Dean y Schreiber, 2003). Los componentes que se utilizan para modelar ontologías en lógica descriptiva son: conceptos, roles e individuos.
En 1997 apareció la metodología METHONTOLOGY (Fernández-López et al., 1997), que fue extendida en otros artículos (Gómez-Pérez, 1998; Fernández-López et al., 1999) y recomendada por la FIPA. En el mismo año surgió un método (Swartout et al., 1997) para construir ontologías, basado en la poda de la ontología SENSUS. Y años más tarde hizo su aparición la metodología On-To-Knowledge (Staab et al., 2001).
De todas ellas, sólo METHONTOLOGY y On-To-Knowledge aportan un conjunto de técnicas y métodos detallados para realizar algunas de las actividades más importantes, son las únicas que establecen relaciones (de precedencia, co-ocurrencia, etc.) entre las actividades y especifican las entradas y salidas que se deben obtener en cada una de ellas.
El gran auge de Internet hizo que se crearan lenguajes de implementación de ontologías para poder explotar las características de la Web. A estos lenguajes se les conoce normalmente como lenguajes de la Web Semántica o lenguajes de ontologías de marcado, dado que su sintaxis se basa en la sintaxis de los lenguajes de marcado existentes, como HTML (Raggett et al., 1999) y XML (Bray et al., 2000), cuyo objetivo es la presentación y el intercambio de datos, respectivamente. Los ejemplos más sobresalientes de dichos lenguajes son: SHOE, XOL, RDF, RDF Schema, OIL, DAML+OIL, y OWL. De todos ellos sólo RDF y RDF Schema, cuya combinación se conoce normalmente como RDF(S), y OWL, están recibiendo respaldo de forma activa, por parte del consorcio de la World Wide Web (W3C), y son recomendaciones (estándares) de dicho consorcio.
En la actualidad existen varias propuestas para la descripción y anotación semántica de servicios web, entre las cuales destacan SAWSDL, FLOWS, OWL-S (Martin, 2004) y WSMO (Roman et al, 2005; Fensel y Bussler, 2002). De estas propuestas, las dos últimas han sido las que han merecido una mayor atención por parte de la comunidad investigadora.
Por una parte, OWL-S describe la semántica de las propiedades funcionales y no funcionales de un servicio, así como la interacción entre cliente y proveedor a través de la coreografía de servicios que tiene lugar entre ellos. Esta descripción tiene lugar a través del lenguaje OWL, cuyas capacidades de razonamiento constituyen la base para el desarrollo de técnicas de correspondencia semántica (semantic matching) con las que se lleva a cabo el descubrimiento de un servicio y la composición de coreografías de servicios (OWL-S no soporta orquestación) (Paolucci et al., 2003 ; Sycara et al., 2003).
Por otra parte, WSMO no sólo modela todas las características de un servicio web, sino que también describe semánticamente todos los elementos que forman parte de la infraestructura necesaria para la publicación, el descubrimiento, la composición y la invocación de un servicio. En este sentido, WSMO también formaliza los objetivos que tienen los clientes (o usuarios) a la hora de invocar la ejecución de un servicio, así como los mediadores que constituyen el pegamento con el que se engarzan todos los componentes de la infraestructura de servicios. Haciendo uso de la descripción de los servicios, de los mediadores y de los objetivos se han propuesto técnicas para el descubrimiento de servicios web (matching entre sus características funcionales y los objetivos del cliente) (Sarbu et al., 2006; Keller et al., 2005).
Para dar soporte al marco conceptual de WSMO y en el contexto de los proyectos europeos DIP (FP6-507483), InfraWebs (FP6-511723), SemanticGov (FP6-027517) y SUPER (FP6-026850) entre otros, se han propuesto y desarrollado implementaciones de referencia del marco conceptual, como WSMX o IRS-III, (Haller et al., 2005; Zaremba y Bussler, 2005) o IRS-III (Cabral et al., 2006), cuyo objetivo consiste en cubrir todas las facetas del ciclo de vida de un servicio semántico, desde su definición hasta su descubrimiento e invocación. En la actualidad esta infraestructura aún está siendo implementada y en especial se está centrando la atención en la coreografía y el descubrimiento de los servicios semánticos.
A pesar del esfuerzo realizado en WSMO y OWL-S, actualmente no se han propuesto técnicas con soporte tecnológico que permitan el descubrimiento y la composición de servicios a partir del análisis de redes sociales y de las características (o perfil) de los usuarios que demandan la invocación de un servicio.
En un destacado artículo de 2005, Tim O'Reilly define lo que vienen a ser los principios básicos de la Web 2.0 (O'Reilly, 2005):
Web 2.0
Hoy en día, una de las tendencias que va tomando cada vez más fuerza es la aplicación de estos principios a la empresa. Obviamente, la portabilidad de este nuevo enfoque no es directo, ya que las restricciones dentro de las empresas son mayores pero existen casos reales del uso de de aplicaciones o tecnologías habituales de la Web 2.0 en organizaciones. En el caso de las aplicaciones, un ejemplo es la "Innovation Factory" de IBM para la gestión de ideas a través de herramientas colaborativas como wikis (entre otras) y en el caso de las tecnologías, el "Proyecto Muse" llevado a cabo en SAP que ha empleado AJAX para mejorar la interfaz de usuario para las herramientas de gestión empresarial.
La web 2.0 supone un nuevo paradigma o evolución de la web que engloba un conjunto de tendencias, técnicas y metodologías que han surgido en los últimos años. Hay que distinguir dos visiones o perspectivas de la web 2.0: aquella que plantea una nueva web por y para las personas, y aquella que considera la web no ya como un servicio, sino como una plataforma para desarrollar nuevas aplicaciones. En la primera visión, la web 2.0 enfatiza la participación de las personas a la hora de aportar: (1) recursos, (2) información, y (3) anotación de recursos e información. Bajo la segunda visión, la web debe construirse a partir de APIs interoperables y de modelos de confianza para fomentar la libre participación y utilización de tecnologías de libre acceso. Los principios clave que caracterizan la web 2.0 son:
En el ámbito español tenemos una actividad importante en el ámbito de la Web 2.0, tanto en la visión de la web para las personas, como de la web como plataforma. En la línea de la web social tenemos la propuesta de TRACTIS, que ofrece servicios jurídicos en la red, de forma abierta y participativa, y que utiliza servicios web para integrar a diferentes participantes del ámbito; Au D'asti que realiza un seguimiento de las conversaciones realizados en la blogosfera y analiza el flujo de información entre blogs; compareBlogs es una herramienta que permite comparar la similitud entre blogs y su objetivo es ofrecer estadísticas y recomendaciones a empresas o a usuarios de blogs basadas en estas comparativas; MusicStrands, finalmente, es quizá la iniciativa más madura, y ofrece un servicio para compartir listas de canciones, visitar las de los demás usuarios, votar sus listas y hasta, recomienda, a partir de los gustos y preferencias del usuario, canciones de otros usuarios puedan interesar. En la línea de la web como plataforma destacamos EyeOS es un sistema operativo web, que permite acceder a aplicaciones y datos desde cualquier navegador; y Tanzania es un servicio que integra los mapas de Google Maps y las etiquetas de del.icio.us para anotar localizaciones geográficas. Por último, comentar el proyecto iCamp que está construyendo un entorno educativo virtual, abierto y participativo, constituido por una red de herramientas, plataformas y repositorios educativos.
En el ámbito internacional tenemos que destacar iniciativas muy relevantes en el campo de la web 2.0:
Utilizar lenguajes para la representación de modelos de usuario como UserML o UserOL (Heckmann y Krueger, 2003) tiene la ventaja de que se pueden utilizar en Internet, al estar basados en XML. El objetivo de estos lenguajes, pensados inicialmente para ser utilizados en el ámbito de la computación ubicua, consiste en compartir y reutilizar información de usuarios en distintos sistemas.
Una red social se configura como un conjunto de nodos unidos entre sí por vértices que representan las relaciones entre ellos. Sobre esa red se pueden estudiar múltiples parámetros que definen sus características (Scott, John P. 2001). Entre los más importantes se encuentran el grado de un nodo -el número de enlaces que tiene con los demás nodos-, la centralidad -que indica la importancia de un nodo dentro de la red-, el alcance -el grado en que cualquier miembro de la red puede llegar a otros miembros-, o la cercanía -el grado en el que un individuo se encuentra cerca de todos los otros miembros de la red.
En general, el análisis de redes sociales se realiza sobre comunidades preexistentes. Pero el mismo análisis puede realizarse para crear comunidades y relaciones sociales, empleando los resultados del análisis de redes sociales como guía para su evolución.
FOAF (Friend of a Friend) es el lenguaje más empleado para el modelado de redes sociales. FOAF está basado en RDF y se define empleando OWL. Fue diseñado para ser extensible y facilitar que sistemas informáticos diversos pudiesen compartir datos. FOAF permite definir a una persona e indicar a qué otras personas conoce (Matsuo et al, 2001).
Existen dos tipos principales de algoritmos de FC (Sarwar et al, 2001): (1) algoritmos basados en memoria, y (2) algoritmos basados en modelo. Los primeros generan recomendaciones basadas en selecciones de aquellos usuarios que son más similares al usuario actual. Los segundos trabajan a partir de modelos de clasificación o clustering, que dividen la base de datos de usuarios en varias categorías o grupos. Con esta estructura, los algoritmos se encargan de buscar el grupo al que pertenece al usuario y finalmente se presentan los ítems seleccionados previamente por los otros usuarios del grupo.
Por esta razón surgen los wikis semánticos, como herramientas colaborativas que ocultan a los usuarios la complejidad de la tecnología subyacente y dan soporte al proceso de creación de conocimientos, permitiendo crear conocimientos en un lenguaje formal además de texto estructurado e hiperenlaces.
Wikis semánticos más relevantes. Del mismo modo que ocurre con los wikis, en la actualidad existe una gran cantidad de tecnologías distintas (más de veinte) que dan soporte a la creación de wikis semánticos, todas ellas desarrolladas por distintos grupos de investigación. Se deben destacar las siguientes tecnologías como las más relevantes en este campo:
Rhizome es una de las primeras aplicaciones de este tipo que aparece, orientada a desarrolladores expertos en XML y XSLT, pero desarrollada de tal manera que todos los conocimientos incluidos en un portal generado con esta aplicación están disponibles en RDF. Está orientado a la creación de wikis donde los usuarios pueden crear recursos RDF de cualquier tipo, y donde la lógica de la aplicación decidirá cómo presentarlos e interactuar con ellos, y también para la gestión de notas y anotaciones personales, foros de discusión estructurados basados en anotaciones, etc.
Otras herramientas como IkeWiki, SemanticMediaWiki, SemPerWiki, SweetWiki, o WikSAR, permiten la edición de páginas utilizando texto e incluyendo algunos códigos especiales, sencillos de utilizar, para incluir información que será transformada en RDF. Estos wikis semánticos utilizan ontologías en RDFS y OWL para realizar inferencias sobre los contenidos introducidos por los usuarios cuando reciben consultas y exportan todas las anotaciones que contienen en RDF. De todas estas herramientas la más popular (se está utilizando en más portales Web) es SemanticMediaWiki, y sólo SweetWiki proporciona funcionalidades especiales para editar folksonomías. Herramientas como OntoWiki o COW son herramientas mucho más sencillas, donde los usuarios pueden navegar por las clases y propiedades de una ontología como si se tratase de wikis tradicionales, pero utilizando realmente una ontología descrita formalmente. Con este wiki semántico se pueden crear instancias de clases y relaciones, así como añadir su documentación, pero no integra la posibilidad de combinar texto en lenguaje natural con anotaciones basadas en ontologías, como hacen la mayor parte de los demás wikis semánticos.
Enfoques de e-mail semántico más representativos. Algunas de las iniciativas más notables en esta área son las que se describen a continuación:
En la Universidad de Washington se está explorando la noción de e-mail semántico en el contexto del proyecto Mangrove. En este proyecto se han identificado y clasificado algunos tipos de tareas que normalmente se realizan por e-mail y cuyo procesamiento se puede automatizar fácilmente, como recoger información tipo formulario de un conjunto de personas, coordinación de reuniones, rifas, o poner a disposición de un conjunto de personas un conjunto de productos.
Otro trabajo interesante sobre e-mail semántico pertenece a un conjunto de estudiantes de la Universidad de Georgia, en el que se utilizan conocimientos sobre los receptores de un mensaje y sobre los contenidos del mismo en el contexto de la preparación de una reunión (lugar y hora) para poder predecir si la reunión podrá tener lugar. Este sistema también puede gestionar distintos tipos de excepciones: cuando uno de los participantes no puede asistir a la reunión y hay que cambiarla de fecha, cuando algún participante no responde, etc.
Otros enfoques para el e-mail semántico consideran la anotación manual o automática de los mensajes de correo electrónico. Por ejemplo, el descrito en el contexto de la herramienta SMORE, donde se propone la anotación manual de los e-mails recibidos por una persona, con el objetivo de mejorar la búsqueda, ordenación y filtrado de mensajes. Esto también es lo que se hace en cierta medida en el tratamiento del e-mail recibido a través de Gmail, donde se introducen anuncios relacionados con el contexto del mensaje recibido por un usuario, o en los smart-tags propuestos por Microsoft en su paquete Office, donde hay un reconocedor automático de tipos de datos como nombres, fechas y números de teléfono, que determina que un trozo de texto se refiere a una de estas entidades y asocia un conjunto de acciones al mismo, que se pueden acceder a través del menú contextual de ese elemento (por ejemplo, enviar un e-mail, introducir en la libreta de direcciones, llamar, chatear, etc.).
Además de los sistemas de e-mail semántico descritos en la sección anterior, existen otros sistemas que se han desarrollado en este campo, y que tienen distintas características de las enunciadas anteriormente. Los sistemas más relevantes son: Haystack del MIT, Gnowsis del DFKI, D-BIN de SEMEDIA y OpenIris de SRI.
Portales semánticos más representativos. Algunos de los portales más descriptivos que utilizan tecnologías de la web semántica se describen a continuación:
El portal OntoWeb esta orientado a compartir conocimiento sobre tecnologías de la Web Semántica entre comunidades académicas e industriales. Este portal ha sido desarrollado desde el proyecto europeo OntoWeb (IST-2000-29243). Además presenta algunas de las principales características de los portales semánticas (e.g. navegación y búsquedas basadas en ontologías).
El portal Mindswap, es otro claro ejemplo de introducción de tecnologías de la Web Semántica en la explotación de portales. Aunque en este caso no se presentan los principales beneficios (e.g. búsqueda semántica, navegación adaptable, etc.)
Asimismo también caben destacar otros portales como el desarrollado por iSOCO, cuyo objetivo era el de la diseminación del proyecto europeo SWWS (Semantic Web Enabled Web Services) y que explota una ontología para la descripción de los miembros del proyecto, el consorcio y el plan de trabajo. Además del portal asociado al proyecto europeo Esperonto.