Tecnologías

A continuación, se muestra el estado de la cuestión de los pilares sobre los que se basa PLATA: La Web Semántica, la Web 2.0 y los primeros avances en la convergencia de ambas aproximaciones.

Tecnologías semánticas

La Web Semántica (Berners-Lee, 1999), en inglés Semantic Web, se define como una extensión de la Web actual en la que se anota o marca con una semántica bien definida (proporcionada por las ontologías) la información disponible en la red. Estas anotaciones permiten que aplicaciones heterogéneas descubran, integren, razonen y utilicen la información existente en la Web, y resuelvan los problemas de encontrar, extraer, representar, mantener e interpretar contenidos Web. En la Web Semántica se pretende describir los recursos disponibles en la red de forma que sean comprensibles por una máquina, con independencia del idioma en el que se encuentren escritos.

Por tanto, las ontologías juegan un papel muy importante en la Web Semántica como medio para capturar conocimiento de un dominio de una manera genérica, así como para proporcionar un entendimiento comúnmente consensuado de un dominio, que podría reutilizarse y compartirse a través de aplicaciones y grupos.

Por otra parte, los recientes trabajos relacionados con la generación de dichas anotaciones usan la extracción de información (IE) para ayudar a los usuarios a anotar automáticamente los documentos con contenidos semánticos. El usuario entrena las herramientas de extracción de información anotando algunas páginas manualmente, hasta que el sistema pueda comenzar a sugerir anotaciones automáticamente. Entonces el usuario puede continuar entrenando el sistema mediante la corrección de errores y/o anotando la información que falta.

Dentro de los componentes identificados por Knowledge Web, una red de excelencia financiada por la Unión Europea, como parte de la anotación de contenidos caben destacar: editores de instancias, anotadores automáticos, semi-automáticos y manuales, pobladores de ontologías, repositorios de ontologías y repositorios de datos.

Finalmente, se han de tener en cuenta herramientas dependientes del contexto para el acceso al conocimiento semánticamente anotado. Por herramientas dependientes del contexto se entienden herramientas que tendrán en cuenta las actividades actuales, intereses y acceso a dispositivos de un usuario.

Definición de ontología

Una ontologia (Studer et al., 1998, página 185) es una especificación formal y explícita de una conceptuacion compartida. La conceptuación describe un modelo abstracto de un fenómeno que ocurre en el mundo al identificar los conceptos importantes de ese fenómeno. "Explícito" significa que los conceptos, relaciones, funciones, axiomas que se utiilzan para describir el modelo y sus restricciones de uso están claramente definidos. El término "formal" describe el hecho de que la ontología tiene que ser ejecutable por la computadora. Y el término "compartida" refleja la noción de que una ontología recoge conocimento consensuado, es decir, que no es privativo de una persona sino que está aceptado por todo un grupo.

Al principio de los años 90, las ontologías se construían principalmente utilizando técnicas de representación del conocimiento basadas en marcos, lógica de primer orden y lógica descriptiva. En 1993, Gruber (Gruber, 1993) identificó cinco tipos de componentes: clases, relaciones, funciones, axiomas e instancias. En los últimos años, las técnicas de representación basadas en lógica descriptiva (Crachman y Schnolze, 1985) se han consolidado en el contexto de la Web semántica, creándose nuevos lenguajes como OIL (Horrocks et al., 2000), DAML+OIL (Horrocks y van Harmelen, 2001) y OWL (Dean y Schreiber, 2003). Los componentes que se utilizan para modelar ontologías en lógica descriptiva son: conceptos, roles e individuos.

Metodologías y métodos

Existen varios métodos y metodologías para desarrollar ontologías. En 1990, Lenat y Guha (Lenat y Guha , 1990) publicaron el proceso seguido en el desarrollo de la ontología Cyc. Algunos años más tarde, en 1995, Uschold y King (Uschold y King, 1995) publicaron el método utilizado para construir la Enterprise Ontology, y Grüninger y Fox (Fox, 1995) hicieron lo mismo para la ontología TOVE (TOronto Virtual Enterprise). Un año más tarde, Uschold y Grüninger (Uschold y Grüninger , 1996) refinaron sus métodos. También en el año 1996, Bernaras y colegas (Bernaras et al., 1996) presentaron un método de construcción de ontologías a partir de bases de conocimientos.

En 1997 apareció la metodología METHONTOLOGY (Fernández-López et al., 1997), que fue extendida en otros artículos (Gómez-Pérez, 1998; Fernández-López et al., 1999) y recomendada por la FIPA. En el mismo año surgió un método (Swartout et al., 1997) para construir ontologías, basado en la poda de la ontología SENSUS. Y años más tarde hizo su aparición la metodología On-To-Knowledge (Staab et al., 2001).

De todas ellas, sólo METHONTOLOGY y On-To-Knowledge aportan un conjunto de técnicas y métodos detallados para realizar algunas de las actividades más importantes, son las únicas que establecen relaciones (de precedencia, co-ocurrencia, etc.) entre las actividades y especifican las entradas y salidas que se deben obtener en cada una de ellas.

Lenguajes de ontologías

Al comienzo de los años 90, se crearon un conjunto de lenguajes de ontologías basados en paradigmas de representación del conocimiento. Algunos estaban basados en lógica de primer orden con algunas extensiones, como KIF (Genesereth y Fikes, 1992), otros combinaban los marcos con la lógica de primer orden (CycL (Lenat y Guha, 1990), Ontolingua (Gruber, 1993), OCML (Motta, 1999) y Flogic (Kifer et al., 1995)), y otros utilizaban lógicas descriptivas (LOOM (MacGregor, 1991)). También en este periodo se creó el protocolo OKBC (Chaudhri et al., 1998) para acceder a ontologías implementadas en diferentes lenguajes basados en marcos.

El gran auge de Internet hizo que se crearan lenguajes de implementación de ontologías para poder explotar las características de la Web. A estos lenguajes se les conoce normalmente como lenguajes de la Web Semántica o lenguajes de ontologías de marcado, dado que su sintaxis se basa en la sintaxis de los lenguajes de marcado existentes, como HTML (Raggett et al., 1999) y XML (Bray et al., 2000), cuyo objetivo es la presentación y el intercambio de datos, respectivamente. Los ejemplos más sobresalientes de dichos lenguajes son: SHOE, XOL, RDF, RDF Schema, OIL, DAML+OIL, y OWL. De todos ellos sólo RDF y RDF Schema, cuya combinación se conoce normalmente como RDF(S), y OWL, están recibiendo respaldo de forma activa, por parte del consorcio de la World Wide Web (W3C), y son recomendaciones (estándares) de dicho consorcio.

Arquitecturas de referencia

En el contexto de la red de excelencia europea Knowledge Web, cuyo objetivo es el de fomentar la cohesión y movilidad de un gran número de grupos de investigación de Universidades, centros de investigación y empresas europeas que están trabajando en el área de la Web Semántica, se ha propuesto una arquitectura de referencia para la Web Semántica. Esta arquitectura sirve para clasificar los distintos tipos de tecnologías que se pueden encontrar para dar soporte a esta visión, describe las funcionalidades de cada una de ellas y las dependencias entre ellas. Esta arquitectura tiene el nombre de Semantic Web Framework y está descrita con detalle en (García-Castro et al., 2006).

Infraestructura tecnológica

Las primeras herramientas de desarrollo de ontologías se crearon a principios de los años noventa proporcionando interfaces de usuario que ayudaban a desarrollar ontologías en lenguajes basados en lógica. A finales de la década de los noventa el número de herramientas se incrementó en gran medida y la funcionalidad de las mismas se diversificó, distinguiéndose los siguientes grupos en la literatura (Gómez-Pérez, 2002) (que están relacionados con los grupos identificados en la arquitectura de referencia anterior):

Herramientas de desarrollo de ontologías. Este grupo incluye herramientas y paquetes integrados que pueden ser utilizados para construir una nueva ontología desde cero. Las más relevantes son: KAON (Maedche et al., 2003), OilEd (Bechhofer et al., 2001), Ontolingua Server (Farquhar et al., 1997), OntoSaurus (Swartout et al., 1997), Protégé (Noy et al., 2000), SWOOP (Kalyanpur et al., 2005), Topbraid Composer, WebODE (Arpírez et al., 2003) y WebOnto (Domingue, 1998).
Herramientas de evaluación de ontologías. Son utilizadas para evaluar (aspectos de consistencia, corrección y redundancia) el contenido de las ontologías. Como herramientas de evaluación de ontologías más importantes podemos destacar (Gómez-Pérez, 2003): OntoAnalyser y OntoGenerator, ODEClean, y ONE-T.
Herramientas de alineamiento y fusión de ontologías. Estas herramientas son utilizadas para resolver el problema de fusión y alineamiento de diferentes ontologías pertenecientes al mismo dominio. Dentro de este grupo, se destacan: PROMPT (Noy y Musen, 2000) que está integrado en Protégé-2000, Chimaera (McGuinness et al., 2000), FCA-Merge (Stumme y Maedche, 2001), GLUE (Doan et al., 2002), y los módulos de fusión de ontologías de OBSERVER (Mena et al., 2000).
Herramientas de anotación basadas en ontologías. Con estas herramientas el usuario puede insertar instancias de conceptos y de relaciones en ontologías y mantener (semi)automáticamente la anotación de páginas Web basada en ontologías. Muchas de estas herramientas han aparecido recientemente en el contexto de la Web Semántica. En este grupo, las herramientas más importantes son: AeroDAML (Kogut y Holmes, 2001), COHSE (Bechhofer et al., 2002), la suite KAcess, MnM (Vargas-Vera et al., 2001), OntoAnnotate (Handschuh et al., 2001), OntoMat-Annotizer, y SHOE Knowledge Annotator (Heflin y Hendler, 2001).
Herramientas de consulta de ontologías y motores de inferencia. Éstas permiten la consulta de ontologías de manera sencilla y llevan a cabo inferencias con ellas. Normalmente están muy relacionadas con el lenguaje utilizado en la implementación de las ontologías. En (Gómez-Pérez, 2003) se describen y comparan: ICS-FORTH RDFSuite, Sesame, Jena, KAON API, TRIPLE, Cerebra y Ontopia Knowledge Suite.
Herramientas de aprendizaje de ontologías. Estas herramientas pueden obtener ontologías desde textos en lenguaje natural, así como desde fuentes semi-estructuradas y bases de datos, utilizando para ello técnicas tanto del campo de aprendizaje automático como del procesamiento de lenguaje natural, pero actualmente no utilizan técnicas integradas. Destacan las siguientes herramientas: ASIUM (Faure y Nedelled, 1999), DODDLE (Yamaguchi, 1999), OntoBuilder (Monica et al., 2001), OntoLearn (Velardi et al., 2002), SVETLAN (Chaelandar y Grau, 2000), TERMINAE (Biébow et al., 1999; Szulman et al., 2002) y Text-To-Onto (Maedche y Volz, 2000; Maedche y Staab, 2003).

Servicios Web semánticos

Los servicios web en la web semántica, también llamados servicios web semánticos, ofrecen una descripción semántica de sus características a través de ontologías (Payne y Lassila, 2004). Esta descripción permite aplicar diversas técnicas de razonamiento semántico basadas en el formalismo lógico de los lenguajes usados para su representación que facilitan su descubrimiento, composición (orquestación de servicios) e invocación (coreografía de servicios).

En la actualidad existen varias propuestas para la descripción y anotación semántica de servicios web, entre las cuales destacan SAWSDL, FLOWS, OWL-S (Martin, 2004) y WSMO (Roman et al, 2005; Fensel y Bussler, 2002). De estas propuestas, las dos últimas han sido las que han merecido una mayor atención por parte de la comunidad investigadora.

Por una parte, OWL-S describe la semántica de las propiedades funcionales y no funcionales de un servicio, así como la interacción entre cliente y proveedor a través de la coreografía de servicios que tiene lugar entre ellos. Esta descripción tiene lugar a través del lenguaje OWL, cuyas capacidades de razonamiento constituyen la base para el desarrollo de técnicas de correspondencia semántica (semantic matching) con las que se lleva a cabo el descubrimiento de un servicio y la composición de coreografías de servicios (OWL-S no soporta orquestación) (Paolucci et al., 2003 ; Sycara et al., 2003).

Por otra parte, WSMO no sólo modela todas las características de un servicio web, sino que también describe semánticamente todos los elementos que forman parte de la infraestructura necesaria para la publicación, el descubrimiento, la composición y la invocación de un servicio. En este sentido, WSMO también formaliza los objetivos que tienen los clientes (o usuarios) a la hora de invocar la ejecución de un servicio, así como los mediadores que constituyen el pegamento con el que se engarzan todos los componentes de la infraestructura de servicios. Haciendo uso de la descripción de los servicios, de los mediadores y de los objetivos se han propuesto técnicas para el descubrimiento de servicios web (matching entre sus características funcionales y los objetivos del cliente) (Sarbu et al., 2006; Keller et al., 2005).

Para dar soporte al marco conceptual de WSMO y en el contexto de los proyectos europeos DIP (FP6-507483), InfraWebs (FP6-511723), SemanticGov (FP6-027517) y SUPER (FP6-026850) entre otros, se han propuesto y desarrollado implementaciones de referencia del marco conceptual, como WSMX o IRS-III, (Haller et al., 2005; Zaremba y Bussler, 2005) o IRS-III (Cabral et al., 2006), cuyo objetivo consiste en cubrir todas las facetas del ciclo de vida de un servicio semántico, desde su definición hasta su descubrimiento e invocación. En la actualidad esta infraestructura aún está siendo implementada y en especial se está centrando la atención en la coreografía y el descubrimiento de los servicios semánticos.

A pesar del esfuerzo realizado en WSMO y OWL-S, actualmente no se han propuesto técnicas con soporte tecnológico que permitan el descubrimiento y la composición de servicios a partir del análisis de redes sociales y de las características (o perfil) de los usuarios que demandan la invocación de un servicio.

Web 2.0

No se puede decir que exista una única definición del término Web 2.0 acuñado por O'Reilly Media en 2004. Sin embargo, está generalmente aceptado que el término Web 2.0 hace referencia a una nueva generación de aplicaciones o servicios en la web que fomentan la participación de los usuarios y la colaboración entre los mismos.

En un destacado artículo de 2005, Tim O'Reilly define lo que vienen a ser los principios básicos de la Web 2.0 (O'Reilly, 2005):

La web como plataforma
Aprovechamiento de la inteligencia colectiva
La importancia de los datos como fuente de ventajas competitivas
La versión "beta" perpetua (el fin de los ciclos de lanzamientos de nuevos paquetes software)
Modelos ligeros de programación
Ubicuidad del software
Interfaces ricas para los usuarios

Alrededor de esta serie de principios se sitúan otra serie de ideas, aplicaciones o tecnologías propias de la Web 2.0 como se muestra en la siguiente figura.

Web 2.0

Hoy en día, una de las tendencias que va tomando cada vez más fuerza es la aplicación de estos principios a la empresa. Obviamente, la portabilidad de este nuevo enfoque no es directo, ya que las restricciones dentro de las empresas son mayores pero existen casos reales del uso de de aplicaciones o tecnologías habituales de la Web 2.0 en organizaciones. En el caso de las aplicaciones, un ejemplo es la "Innovation Factory" de IBM para la gestión de ideas a través de herramientas colaborativas como wikis (entre otras) y en el caso de las tecnologías, el "Proyecto Muse" llevado a cabo en SAP que ha empleado AJAX para mejorar la interfaz de usuario para las herramientas de gestión empresarial.

La web 2.0 supone un nuevo paradigma o evolución de la web que engloba un conjunto de tendencias, técnicas y metodologías que han surgido en los últimos años. Hay que distinguir dos visiones o perspectivas de la web 2.0: aquella que plantea una nueva web por y para las personas, y aquella que considera la web no ya como un servicio, sino como una plataforma para desarrollar nuevas aplicaciones. En la primera visión, la web 2.0 enfatiza la participación de las personas a la hora de aportar: (1) recursos, (2) información, y (3) anotación de recursos e información. Bajo la segunda visión, la web debe construirse a partir de APIs interoperables y de modelos de confianza para fomentar la libre participación y utilización de tecnologías de libre acceso. Los principios clave que caracterizan la web 2.0 son:

Los datos y la información son el motor de las nuevas aplicaciones web.
Efectos emergentes creados por arquitecturas de participación
Nuevos modelos de negocios basados en la sindicación de servicios
Aprovechar el valor de la Larga Cola, el conjunto de empresas y usuarios de poca relevancia pero que constituyen el mayor número de participantes de la red.

A continuación describimos los ejemplos más representativos de la web 2.0:

Web como plataforma: Google maps, que ofrece un API para integrar y anotar mapas en cualquier aplicación web; Google Adsense que presenta una arquitectura de publicación-subscripción que ejerce de mediador entre un pool de empresas publicitarias y un pool de webs donde se presentan los anuncios; BitTorrent, que permite la distribución de ficheros de gran tamaño en aplicaciones P2P y que es la base para la Internet TV y otras aplicaciones basadas en contenido audiovisual; y por último, Amazon Web Services que aporta un conjunto de servicios web que resuelven funcionalidades relevantes para aplicaciones de comercio electrónico.
Web para el usuario: Flickr, es un famoso repositorio de fotos e imágenes que pueden ser anotadas y compartidas por todos los usuarios registrados en el sistema; Del.icio.us es un repositorio compartido de URLs que se basa en los enlaces proporcionados por los usuarios; Amazon.com facilita recomendaciones a partir de las valoraciones y preferencias de los usuarios; Wikipedia, es el paradigma de la construcción colaborativa de conocimiento a partir de un sistema abierto de edición de páginas web; y por último la blogosfera, donde cada usuario aporta noticias y recursos en su diario personal o blog.

La web 2.0 también está asociada a la aparición de un conjunto de tecnologías que son clave tanto para facilitar la participación de las personas como para construir APIs interoperables: AJAX, que permite la construcción de interfaces gráficos ricos, RSS, el lenguaje clave para sindicación y agregación de datos y noticias, folksonomias, los vocabularios generados por la agregación de anotaciones de los usuarios, SOAP y REST, los protocolos básicos para crear la web como plataforma, y los Mashups, la tecnología que permite construir nuevas miniaplicaciones a partir de la integración de APIs externos.

En el ámbito español tenemos una actividad importante en el ámbito de la Web 2.0, tanto en la visión de la web para las personas, como de la web como plataforma. En la línea de la web social tenemos la propuesta de TRACTIS, que ofrece servicios jurídicos en la red, de forma abierta y participativa, y que utiliza servicios web para integrar a diferentes participantes del ámbito; Au D'asti que realiza un seguimiento de las conversaciones realizados en la blogosfera y analiza el flujo de información entre blogs; compareBlogs es una herramienta que permite comparar la similitud entre blogs y su objetivo es ofrecer estadísticas y recomendaciones a empresas o a usuarios de blogs basadas en estas comparativas; MusicStrands, finalmente, es quizá la iniciativa más madura, y ofrece un servicio para compartir listas de canciones, visitar las de los demás usuarios, votar sus listas y hasta, recomienda, a partir de los gustos y preferencias del usuario, canciones de otros usuarios puedan interesar. En la línea de la web como plataforma destacamos EyeOS es un sistema operativo web, que permite acceder a aplicaciones y datos desde cualquier navegador; y Tanzania es un servicio que integra los mapas de Google Maps y las etiquetas de del.icio.us para anotar localizaciones geográficas. Por último, comentar el proyecto iCamp que está construyendo un entorno educativo virtual, abierto y participativo, constituido por una red de herramientas, plataformas y repositorios educativos.

En el ámbito internacional tenemos que destacar iniciativas muy relevantes en el campo de la web 2.0:

La web como plataforma para aplicaciones de altas prestaciones. Las dos últimas iniciativas de Amazon Web Services, Amazon Storage Service y Amazon Computing Cloud, ofrecen servicios de almacenamiento de datos y computación de altas prestaciones, lo que continúa y afianza la visión de la web como plataforma. HousingMaps es otro servicio que integra las APIs de Craiglist y GoogleMaps para ofrecer información de alquiler y compra de vivienda.
La web como plataforma para la personalización de portales. Ejemplos de Mashups como GoogleIG, NetVibes, Live.com, o YouOS, ilustran las tendencias de cómo acceder a contenidos y servicios de forma personalizada y avanzan en el concepto del sistema operativo en la web.
La web como arquitectura de participación de las personas. Writely, NumSum, 37Signals y Google Calendar, son ejemplos de de web 2.0 orientada a las personas que se nutren de la aportación de los usuarios para añadir valor a sus servicios de edición de textos, hojas de cálculo, gestión de proyectos y gestión de calendarios, respectivamente.

En las próximas secciones se describen brevemente las técnicas y metodologías relacionadas con la web 2.0 en su vertiente de web para las personas que se utilizarán en el proyecto.

Lenguajes de modelado de usuarios

Las técnicas que se emplearán para definir el modelo de usuario se basan en construir un vocabulario de términos índice que caracterice la formación personal y la actividad de cada usuario. Fuentes de información relevantes y que deben explorarse para modelar estos aspectos son: la información que cada usuario publica en la blogosfera, la información que se deriva de la interacción del usuario con el sistema, la información que se deriva de producciones científicas, la participación en proyectos, etc.

Utilizar lenguajes para la representación de modelos de usuario como UserML o UserOL (Heckmann y Krueger, 2003) tiene la ventaja de que se pueden utilizar en Internet, al estar basados en XML. El objetivo de estos lenguajes, pensados inicialmente para ser utilizados en el ámbito de la computación ubicua, consiste en compartir y reutilizar información de usuarios en distintos sistemas.

Teoría de redes sociales

Una red social es la representación de una estructura de relaciones sociales entre individuos (Watts, Duncan J., 2003). La red social indica de qué forman están conectados los nodos (individuos) por medio de diversos indicadores de familiaridad, que van desde "conocidos" hasta "miembros de una misma familia". El análisis de redes sociales es hoy en día una técnica imprescindible de estudio social.

Una red social se configura como un conjunto de nodos unidos entre sí por vértices que representan las relaciones entre ellos. Sobre esa red se pueden estudiar múltiples parámetros que definen sus características (Scott, John P. 2001). Entre los más importantes se encuentran el grado de un nodo -el número de enlaces que tiene con los demás nodos-, la centralidad -que indica la importancia de un nodo dentro de la red-, el alcance -el grado en que cualquier miembro de la red puede llegar a otros miembros-, o la cercanía -el grado en el que un individuo se encuentra cerca de todos los otros miembros de la red.

En general, el análisis de redes sociales se realiza sobre comunidades preexistentes. Pero el mismo análisis puede realizarse para crear comunidades y relaciones sociales, empleando los resultados del análisis de redes sociales como guía para su evolución.

FOAF (Friend of a Friend) es el lenguaje más empleado para el modelado de redes sociales. FOAF está basado en RDF y se define empleando OWL. Fue diseñado para ser extensible y facilitar que sistemas informáticos diversos pudiesen compartir datos. FOAF permite definir a una persona e indicar a qué otras personas conoce (Matsuo et al, 2001).

Sistemas de recomendación con técnicas de filtrado colaborativo

Las técnicas de filtrado colaborativo (FC) se utilizan en sistemas de recomendación para aportar recomendaciones personalizadas a usuarios basándose en información obtenida en usuarios con preferencias e intereses similares (Adomavicius y Tuzhilin, 2005). Los datos utilizados normalmente en FC no están basados en las características de los ítems recomendados, si no en las preferencias de otros usuarios que han sido expresadas a través de valoraciones en los ítems disponibles (Breese et al, 1998). Este es un aspecto relevante en el proyecto porque pretendemos aportar recomendaciones personales basadas en el contexto del usuario (incluyendo sus preferencias, la localización donde se encuentre, su relación con otros usuarios a través de la red social, etc.).

Existen dos tipos principales de algoritmos de FC (Sarwar et al, 2001): (1) algoritmos basados en memoria, y (2) algoritmos basados en modelo. Los primeros generan recomendaciones basadas en selecciones de aquellos usuarios que son más similares al usuario actual. Los segundos trabajan a partir de modelos de clasificación o clustering, que dividen la base de datos de usuarios en varias categorías o grupos. Con esta estructura, los algoritmos se encargan de buscar el grupo al que pertenece al usuario y finalmente se presentan los ítems seleccionados previamente por los otros usuarios del grupo.

Web Semántica y Web 2.0

Wiki semántico

Aunque como se ha visto en las secciones anteriores, existe una gran cantidad de tecnologías asociadas a la Web Semántica y estas tecnologías se están utilizando en distintos tipos de aplicaciones, la cantidad de conocimientos disponibles en lenguajes como RDF, RDFS y OWL es todavía pequeña si se compara con los datos disponibles en la Web tradicional. Una de las razones principales es que los formalismos y las tecnologías de la Web Semántica requieren aún expertos en lógica y programación, no siendo fáciles de utilizar por otras personas. Asimismo, las herramientas de desarrollo o población de ontologías, que fueron descritas anteriormente, no soportan en general la edición colaborativa de ontologías, lo que hace difícil que los expertos de dominio y los ingenieros de conocimiento puedan trabajar juntos para modelar los conocimientos en un dominio.

Por esta razón surgen los wikis semánticos, como herramientas colaborativas que ocultan a los usuarios la complejidad de la tecnología subyacente y dan soporte al proceso de creación de conocimientos, permitiendo crear conocimientos en un lenguaje formal además de texto estructurado e hiperenlaces.

Wikis semánticos más relevantes. Del mismo modo que ocurre con los wikis, en la actualidad existe una gran cantidad de tecnologías distintas (más de veinte) que dan soporte a la creación de wikis semánticos, todas ellas desarrolladas por distintos grupos de investigación. Se deben destacar las siguientes tecnologías como las más relevantes en este campo:

Rhizome es una de las primeras aplicaciones de este tipo que aparece, orientada a desarrolladores expertos en XML y XSLT, pero desarrollada de tal manera que todos los conocimientos incluidos en un portal generado con esta aplicación están disponibles en RDF. Está orientado a la creación de wikis donde los usuarios pueden crear recursos RDF de cualquier tipo, y donde la lógica de la aplicación decidirá cómo presentarlos e interactuar con ellos, y también para la gestión de notas y anotaciones personales, foros de discusión estructurados basados en anotaciones, etc.

Otras herramientas como IkeWiki, SemanticMediaWiki, SemPerWiki, SweetWiki, o WikSAR, permiten la edición de páginas utilizando texto e incluyendo algunos códigos especiales, sencillos de utilizar, para incluir información que será transformada en RDF. Estos wikis semánticos utilizan ontologías en RDFS y OWL para realizar inferencias sobre los contenidos introducidos por los usuarios cuando reciben consultas y exportan todas las anotaciones que contienen en RDF. De todas estas herramientas la más popular (se está utilizando en más portales Web) es SemanticMediaWiki, y sólo SweetWiki proporciona funcionalidades especiales para editar folksonomías. Herramientas como OntoWiki o COW son herramientas mucho más sencillas, donde los usuarios pueden navegar por las clases y propiedades de una ontología como si se tratase de wikis tradicionales, pero utilizando realmente una ontología descrita formalmente. Con este wiki semántico se pueden crear instancias de clases y relaciones, así como añadir su documentación, pero no integra la posibilidad de combinar texto en lenguaje natural con anotaciones basadas en ontologías, como hacen la mayor parte de los demás wikis semánticos.

E-mail semántico

La noción de e-mail semántico es bastante reciente y se refiere a la gestión de la semántica asociada a distintos tipos e-mails, con el objetivo de mejorar la productividad de las personas cuando realizan tareas comunes (recolectar información de un grupo de personas, gestionar información de eventos y agenda, recordar a otras personas sobre e-mails que no han sido contestados, responder a preguntas comunes, etc.). Esta gestión de la semántica se refiere tanto a lo relacionado con los contenidos de los e-mails como a la realización de distintos tipos de tareas cuando se envía o recibe un e-mail. Algunas de estas tareas incluyen la predicción de respuestas posibles a un tipo concreto de e-mail por parte de un usuario, la interpretación de las respuestas de un conjunto de usuarios a un e-mail o la recomendación de distintos tipos de acciones a ejecutar.

Enfoques de e-mail semántico más representativos. Algunas de las iniciativas más notables en esta área son las que se describen a continuación:

En la Universidad de Washington se está explorando la noción de e-mail semántico en el contexto del proyecto Mangrove. En este proyecto se han identificado y clasificado algunos tipos de tareas que normalmente se realizan por e-mail y cuyo procesamiento se puede automatizar fácilmente, como recoger información tipo formulario de un conjunto de personas, coordinación de reuniones, rifas, o poner a disposición de un conjunto de personas un conjunto de productos.

Otro trabajo interesante sobre e-mail semántico pertenece a un conjunto de estudiantes de la Universidad de Georgia, en el que se utilizan conocimientos sobre los receptores de un mensaje y sobre los contenidos del mismo en el contexto de la preparación de una reunión (lugar y hora) para poder predecir si la reunión podrá tener lugar. Este sistema también puede gestionar distintos tipos de excepciones: cuando uno de los participantes no puede asistir a la reunión y hay que cambiarla de fecha, cuando algún participante no responde, etc.

Otros enfoques para el e-mail semántico consideran la anotación manual o automática de los mensajes de correo electrónico. Por ejemplo, el descrito en el contexto de la herramienta SMORE, donde se propone la anotación manual de los e-mails recibidos por una persona, con el objetivo de mejorar la búsqueda, ordenación y filtrado de mensajes. Esto también es lo que se hace en cierta medida en el tratamiento del e-mail recibido a través de Gmail, donde se introducen anuncios relacionados con el contexto del mensaje recibido por un usuario, o en los smart-tags propuestos por Microsoft en su paquete Office, donde hay un reconocedor automático de tipos de datos como nombres, fechas y números de teléfono, que determina que un trozo de texto se refiere a una de estas entidades y asocia un conjunto de acciones al mismo, que se pueden acceder a través del menú contextual de ese elemento (por ejemplo, enviar un e-mail, introducir en la libreta de direcciones, llamar, chatear, etc.).

Escritorio semántico

La visión de los escritorios semánticos se basa fundamentalmente en la utilización de tecnologías de la Web Semántica en aplicaciones que están instaladas en cualquier ordenador, y que están disponibles en su escritorio. Se prevé que el uso de ontologías, anotaciones de meta datos y protocolos procedentes de la Web Semántica, permitirá la integración de dichas aplicaciones con la Web, permitiendo una gestión de la información personal mucho más centrada e integrada, así como una mejor distribución de información y colaboración, más allá del e-mail.

Además de los sistemas de e-mail semántico descritos en la sección anterior, existen otros sistemas que se han desarrollado en este campo, y que tienen distintas características de las enunciadas anteriormente. Los sistemas más relevantes son: Haystack del MIT, Gnowsis del DFKI, D-BIN de SEMEDIA y OpenIris de SRI.

Portal semántico

Las tecnologías de la web semántica permiten una nueva concepción de los portales de información, conocida como portales de información semánticos (Reynolds D et al 2004) y que pueden ser definidos como (Laussen H et al. 2005):

Un sitio web que recoge información para un grupo de usuarios con un interés común.
Permite a una comunidad compartir e intercambiar información.
Está desarrollado en base a tecnologías de la web semántica.

Los portales semánticos se basan en la explotación de un conjunto de ontologías ricas del dominio que permiten describir los recursos accesibles desde el portal, tanto información (Norberto F et al. 2004,Hartmann J et al. 2004; Reynolds D et al. 2004) como servicios (Lin C et al. 2004). Las principales diferencias entre los portales tradicionales y los portales semánticos se recogen en la siguiente tabla (Reynolds D et al 2004):

Portales semánticos más representativos. Algunos de los portales más descriptivos que utilizan tecnologías de la web semántica se describen a continuación:

El portal OntoWeb esta orientado a compartir conocimiento sobre tecnologías de la Web Semántica entre comunidades académicas e industriales. Este portal ha sido desarrollado desde el proyecto europeo OntoWeb (IST-2000-29243). Además presenta algunas de las principales características de los portales semánticas (e.g. navegación y búsquedas basadas en ontologías).

El portal Mindswap, es otro claro ejemplo de introducción de tecnologías de la Web Semántica en la explotación de portales. Aunque en este caso no se presentan los principales beneficios (e.g. búsqueda semántica, navegación adaptable, etc.)

Asimismo también caben destacar otros portales como el desarrollado por iSOCO, cuyo objetivo era el de la diseminación del proyecto europeo SWWS (Semantic Web Enabled Web Services) y que explota una ontología para la descripción de los miembros del proyecto, el consorcio y el plan de trabajo. Además del portal asociado al proyecto europeo Esperonto.