Ontologías teoria introducción



Descargar 240,74 Kb.
Página1/3
Fecha de conversión08.06.2017
Tamaño240,74 Kb.
  1   2   3
ONTOLOGÍAS
TEORIA


  1. Introducción

La documentación de los datos para dotarlos de una semántica resulta fundamental a la hora de la búsqueda y recuperación de los mismos, y es uno de los fundamentos de lo que se conoce con el nombre de Web Semántica. Para poder llegar a lograr esto es que se utilizan las ontologías.

En la actualidad se habla mucho sobre las tecnologías Web que proponen nuevas técnicas y paradigmas para la representación de conocimiento que faciliten localizar, compartir e integrar recursos a través de la WWW. Estas nuevas técnicas se basan en la introducción de conocimiento semántico explícito que describe y estructura la información y servicios disponibles, y se conoce con el nombre de Web Semántica.

En esta lucha por mantener la semántica de la información es que se utilizan las ontologías. Sin embargo, como Fernández y Gómez comentan, la definición de una ontología no resulta una tarea fácil, ya que no existe una estandarización a la hora de modelar ontologías. Todo depende del punto de vista del diseñador. Además, el problema se agrava si se considera que no existe un lenguaje estándar para su especificación [FeGo02]. Por estos motivos, el esquema de estructuración y el lenguaje a utilizar para modelar ontologías depende de las características y condiciones que se necesiten.

Además, la especificación de ontologías debe restringirse a un dominio muy específico, ya que no existe “la ontología” que cubra todos los dominios, por lo que la investigación se basa en el dominio turístico.


  1. Definición y Características

El término ontología es tomando de la filosofía, donde ontología se refiere a existencia. Para la Inteligencia Artificial (IA), lo que “existe” es aquello que puede ser representado. Es más, se pueden encontrar varias definiciones de ontología en el campo de la IA; pero la definición más completa y utilizada para la investigación; convertida ya en estándar, es la propuesta por [Grub93, pp. 199] y extendida por [StBF98, pp.177-178],es la que describe una ontología como “una especificación explícita y formal de una conceptualización compartida”.

La interpretación de esta definición es que las ontologías definen conceptos y relaciones que describen algún dominio, de forma compartida y consensuada; y que esta conceptualización debe ser representada de una manera formal, legible y utilizable por las computadoras.

Según Honrubia, la definición de Gruber muestra que una ontología está especificando una forma de pensar, de actuar, de entender las cosas, que proporciona una forma de ver el conocimiento, de representarlo, de especificarlo, en definitiva, una forma de entendimiento. Esto se debe a que una conceptualización no es más que una visión abstracta y simplificada del mundo real. [Honr00]

Al tener claro que es una ontología se puede hablar de los componentes que servirán para representar el conocimiento de algún dominio [Grub93]:


  • Conceptos: son las ideas básicas que se intentan formalizar.

  • Relaciones: representan la interacción y enlace entre los conceptos del dominio. Suelen formar la taxonomía del dominio.

  • Funciones: son un tipo concreto de relación donde se identifica un elemento mediante el cálculo de una función que considera varios elementos de la ontología.

  • Instancias: se utilizan para representar objetos determinados de un concepto.

  • Axiomas: son teoremas que se declaran sobre relaciones que deben cumplir los elementos de la ontología.

Este último componente, los axiomas, permite junto con la herencia de conceptos, inferir conocimiento que no esté indicado explícitamente en la taxonomía de conceptos.

Por otra parte, el uso de las ontologías proporciona una serie de beneficios, entre ellos se pueden mencionar los siguientes [Honr00]:



  • Proporcionan una forma de representar y compartir el conocimiento utilizando un vocabulario común.

  • Permiten una reutilización del conocimiento.

  • Permiten usar un formato de intercambio de conocimiento.

  • Proporcionan un protocolo específico de comunicación.

Los dos primeros beneficios, el hecho de que puedan representar el conocimiento y, que este puede compartirse y reutilizarse en aplicaciones diferentes, explican el gran interés suscitado en los últimos años en la creación e integración de ontologías.

Las ontologías sirven como un vehículo para alcanzar un entendimiento entre las partes involucradas: usuarios, desarrolladores y programas de muy diverso perfil. Por lo tanto, beneficiará a todos los investigadores, laboratorios, empresas e instituciones de los cinco continentes que trabajan con agentes para la construcción de esta Web Semántica, y así mantener los principios que han hecho un éxito a la Web actual: descentralización, compartimiento, compatibilidad y crecimiento caótico.

De todas formas, aunque se siga alguna metodología se debe tener en cuenta los siguientes principios de construcción [VaSW96]:


  1. Claridad y Objetividad. Una ontología debe brindar al usuario el significado del término de forma clara y objetiva, y también, en lenguaje natural para su comprensión.

  2. Completitud. Las definiciones han de ser expresadas en términos necesarios y suficientes.

  3. Coherencia. Las inferencias realizadas deben asegurar consistencia con las definiciones.

  4. Máxima Extensibilidad Monótona. Las especializaciones o generalizaciones deben ser incluidas en la ontología de tal forma que no se requiera una revisión de las definiciones preexistentes.

  5. Principio de Distinción Ontológica. Las clases en una ontología deben ser disjuntas.

  6. Diversificación. Las jerarquías incluidas se deben diversificar para aumentar la potencia de los mecanismos de herencia múltiple.

  7. Modularidad. El acoplamiento se debe disminuir entre los módulos.

  8. Estandarización. Un estándar establecido de los nombres, siempre que esto sea posible.

  9. Minimización. La distancia semántica se debe minimizar entre conceptos emparentados, o sea, que los conceptos similares estarán agrupados y representados utilizando las mismas primitivas.




  1. Lenguajes

Los lenguajes para la construcción de ontologías van a permitir la representación de mismas, ya que garantizan que la ontología sea una especificación formal explícita. En la actualidad, al igual que pasaba con los datos y los metadatos, existen muchos lenguajes que van a permitir esa definición (RDF, OIL, DAML, DAML+OIL, SHOE, TopicMaps, OCLM, Ontilingua, OWL), sin embargo, no todos ellos van a permitir el mismo nivel de expresividad a la hora de definir ontologías.

Es importante, como expone Honrubia, elegir un lenguaje para la definición de ontologías, por lo cuál el lenguaje a utilizar debe tener los siguientes requisitos:


    • Debe poseer una sintaxis bien definida, para ser capaz de poder leer las ontologías que se definan mediante este lenguaje.

    • Debe tener semánticas bien definidas, para poder ser capaz de comprender las ontologías.

    • Debe tener suficiente expresividad, para poder capturar varias ontologías.

    • Debe ser fácilmente maleable desde/hacia otros lenguajes ontológicos.

    • Debe ser eficiente a la hora de realizar razonamiento. [Honr00]

Algunos de los lenguajes que cumplen con los requisitos expuestos anteriormente, son los que se utilizarán en esta investigación: RDF, DAML+OIL y OWL, los cuales se describen de forma breve en las siguientes secciones y se comprobará que cumplen con los requisitos presentados.


    1. RDF (Resource Description Framework)

RDF es una especificación propuesta por W3C que ofrece interoperatividad entre aplicaciones que intercambian información comprensible por la página web (Web Semántico), para proporcionar una infraestructura que soporte actividades de metadatos y se basa en XML.

La principal diferencia entre XML y RDF consiste en que XML y su esquema es un lenguaje para modelar datos, sin embargo, RDF es un lenguaje para especificar metadatos. Por lo tanto, cuando los metadatos1 necesitan ser especificados como datos, la sintaxis de XML es muy útil. Pero, al modelar metadatos en XML puro se restringe severamente su flexibilidad. [RDFConAbsSyn04]

Aunque pueda parecer que XML y RDF son lenguajes totalmente distintos, esto no es así, estos dos lenguajes son complementarios. RDF va a apoyarse en la sintaxis de XML para definir metadatos. Es decir, se utilizará RDF como lenguaje de especificación de metadatos y XML para su implementación, consiguiendo con esto la interoperatividad de la que se ha hablado.

Al mismo tiempo, RDF necesita la facilidad de XML Namespaces2 para asociar con precisión cada propiedad con el esquema que define dicha propiedad y, evitar confusiones entre definiciones independientes y posiblemente conflictivas del mismo término. [RDFConAbsSyn04]

En las secciones presentadas a continuación se detalla el modelo básico RDF, el modelo formal RDF y el Esquema RDF.




      1. Modelo Básico RDF

Según [RDFConAbsSyn04] y [DaOS03, pp. 88-89] el modelo de datos básico de RDF consta de 3 tipos básicos de objetos:



    • Recursos. Un recurso es cualquier cosa descrita por una expresión RDF. Un recurso puede ser una página web entera. Por ejemplo, http://www.w3.org/TR/2004/REC-rdf-primer-20040210.html es un documento HTML que puede considerarse como un recurso. Un recurso, también podría formar parte de la web, por ejemplo, un elemento HTML o XML dentro del documento anterior. Por último, un recurso, podría ser un objeto que no se encuentra accesible por la web, por ejemplo, un libro impreso. Los recursos siempre son nombrados por un URI (Uniform Resource Identifiers), que no es más que un identificador.

    • Propiedades. Una propiedad es un aspecto específico, una característica, un atributo o una relación usada para describir un recurso. Cada propiedad posee un significado diferente, define sus valores permitidos, los tipos de recursos que puede describir y sus relaciones con otras propiedades. Por ejemplo, siguiendo con el ejemplo anterior de la página web, una propiedad de la misma podría ser el creador de dicha página.

    • Declaraciones. Una declaración RDF es un recurso junto con una propiedad más el valor de la propiedad para ese recurso. Estas tres partes individuales de categoría es lo que se llama respectivamente el sujeto, el predicado y el objeto. El objeto de una categoría puede ser un recurso o un literal, por ejemplo, un recurso especificado por un URI, o bien un literal u otras primitivas de datos definidas por XML.

Por tanto, el modelo RDF puede considerarse como un recurso, presentado por un nodo, y pares asociados atributo/valor a los que apunta dicho recurso, o, de manera similar, por registros con tres campos (recurso, propiedad y valor).

Además de hacer declaraciones sobre los recursos Web, RDF puede usarse para crear declaraciones sobre otras declaraciones RDF; llamadas declaraciones de alto nivel (higher-order statements). Para realizar declaraciones sobre otras declaraciones, se tiene que construir un modelo de la declaración original; este modelo es un nuevo recurso al que se le pueden anexar propiedades adicionales. Este proceso se denomina formalmente reification3 en el contexto de la Representación del Conocimiento. Un modelo de declaración se denomina reified statement (declaración transformada de lo abstracto a lo concreto). [RDFConAbsSyn04]

En [RDFConAbsSyn04] se define las siguientes propiedades para modelar declaraciones (sentencias):


    • Sujeto (subject). La propiedad subject identifica el recurso que describe la declaración modelada; es decir, el valor de la propiedad subject es el recurso sobre el cual se hizo la declaración original.

    • Predicado (predicate). La propiedad predicate identifica la propiedad original en la declaración modelada. El valor de la propiedad predicate es un recurso que representa la propiedad específica en la declaración original.

    • Objeto (object). La propiedad object identifica el valor de la propiedad en la declaración modelada. El valor de la propiedad object es el objeto en la declaración original.

    • Tipo (type). El valor de la propiedad type describe el tipo del nuevo recurso. Todas las declaraciones transformadas (de lo abstracto a lo concreto) son instancias de RDF: declaraciones; es decir, tienen una propiedad type cuyo objeto es rdf:Statement. La propiedad type se usa comúnmente para declarar el tipo del recurso.

Un nuevo recurso con las cuatro propiedades anteriores representa la declaración original y, puede usarse como objeto de otras declaraciones como tener una declaración adicional sobre él. El recurso con estas cuatro propiedades no es un substituto de la declaración original, es un modelo de la declaración. Una declaración (sentencia) y sus correspondientes declaraciones transformadas (de lo abstracto a lo concreto) existen independientemente sin las otras. La representación gráfica RDF se presenta para contener el hecho de la declaración si y sólo si dicha declaración se presenta en forma gráfica, sin considerar si la declaración correspondiente transformada está presente. [RDFConAbsSyn04]

En la sección siguiente se describe el tratamiento formal de las sentencias de alto nivel y la transformación de lo abstracto a lo concreto (reification).




      1. Modelo Formal RDF

El modelo formal RDF se representa mediante tripletas. Una tripleta RDF está convencionalmente escrita en el siguiente orden: sujeto (recurso), predicado (propiedad) y objeto (valor de la propiedad: recurso o literal). La estructura subyacente de cualquier expresión en RDF es una colección de tripletas, las cuales conforma el modelo de datos gráfico (grafo). [RDFConAbsSyn04]



Un gráfico RDF es un conjunto de tripletas, esto puede ser ilustrado por un diagrama con nodos y arcos dirigidos en los que cada tripleta se representa como un link nodo-arco-nodo (ver Figura 3). Los nodos de un gráfico RDF son sus sujetos y sus objetos, y la dirección del arco es el predicado y siempre apunta hacia el objeto. [RDFConAbsSyn04]



Figura 3: Tripleta RDF [RDFConAbsSyn04].
En [RDFPrimer04] se describe que cada tripleta representa una declaración de una relación entre las cosas denotadas por los nodos que se unen, y consta de tres partes (como ya se mencionó antes):

    • El sujeto (también llamado recurso), puede ser una referencia URI o un nodo blank (blanco).

    • El predicado (también llamado propiedad), puede ser una referencia URI.

    • El objeto, puede ser una referencia URI, un literal o un nodo blank (blanco).

Como se puede observar de la enumeración anterior, un nodo puede ser una referencia URI, un literal o espacio en blanco (nodo blank) y los arcos (las propiedades) son referencias URI. Una referencia URI o un literal, usados como un nodo, identifica lo que ese nodo representa. Una referencia URI, usada como un predicado, identifica una relación entre las cosas representadas por los nodos que conecta; un predicado también puede ser un nodo en el gráfico. Un nodo con espacio en blanco es un nodo que no es una referencia URI o un literal, en RDF la sintaxis abstracta de un nodo con espacio en blanco es un único nodo que puede usarse en uno o más declaraciones de RDF, pero no tiene ningún nombre intrínseco. [RDFConAbsSyn04 y RDFSyn04]

La Figura 4 muestra la forma de representación de los elementos principales de una tripleta RDF.




  1   2   3


La base de datos está protegida por derechos de autor ©absta.info 2016
enviar mensaje

    Página principal