Aprendizaje ontológico para el marco ontológico dinámico semántico ontological learning fora dynamic semantics ontological framework



Descargar 1,01 Mb.
Página1/5
Fecha de conversión20.02.2017
Tamaño1,01 Mb.
  1   2   3   4   5

APRENDIZAJE ONTOLÓGICO PARA EL MARCO ONTOLÓGICO DINÁMICO SEMÁNTICO

ONTOLOGICAL LEARNING FORA DYNAMIC SEMANTICS ONTOLOGICAL FRAMEWORK

Taniana Rodríguez

Magíster en Computación, Administrativo-Docente-Investigador.

Centro de Estudios en Microelectrónica y Sistemas Distribuidos (CEMISID)

Universidad de Los Andes

Mérida, Estado-Mérida, Venezuela

Jose Aguilar

Doctor en Ciencias Computacionales, Docente-Investigador.

Centro de Estudios en Microelectrónica y Sistemas Distribuidos (CEMISID)

Universidad de Los Andes

Mérida, Estado-Mérida, Venezuela

Recibido para revisar 28-09-2013, aceptado D-M-A, versión final D-M-A.


RESUMEN: En este trabajo se propone una arquitectura de Aprendizaje Ontológico, que es uno de los componentes claves del Marco Ontológico Dinámico Semántico (MODS) para la Web Semántica. Esta arquitectura general soporta la adquisición automática de conocimiento léxico y semántico. En particular, permite la adquisición de conocimiento sobre términos (palabras), conceptos (taxonómicos, no taxonómicos), relaciones entre ellos, reglas de producción, etc. La arquitectura establece donde cada conocimiento adquirido debe ser incorporado en las estructuras del MODS, ya sea en su ontología interpretativa, ontología lingüística, o lexicón. Además, el trabajo presenta un ejemplo de uso de la arquitectura para el caso del aprendizaje semántica

PALABRAS CLAVE: Aprendizaje Ontológico, Procesamiento de Lenguaje Natural, Semántica Web.

ABSTRACT: In this paper we propose an Ontological Learning architecture, which is one of the key components of the Dynamic Semantic Ontological Framework (MODS) for the Semantic Web. This architecture supports the automatic acquisition of lexical and semantic knowledge. In particular, it allows the acquisition of knowledge of terms (words), concepts (taxonomic, not taxonomic) relations, production rules, etc. The architecture establishes where each acquired knowledge must be incorporated into the structures of MODS: its interpretive ontology, language ontology, or lexicon. Furthermore, the paper presents an example of use of architecture to the case of semantic learning

KEYWORDS: Natural Language Processing, Ontological Leaning, Semantic Web.




1. INTRODUCCIÓN

En este trabajo se describe la arquitectura del componente de Aprendizaje Ontológico utilizado en MODS. El MODS es un sistema que permite el procesamiento ontológico de consultas, expresadas en lenguaje natural, para la web [1]. Dicho marco está compuesto por una ontología lingüística del lenguaje español, una ontología para las tareas de procesamiento de la consulta, y una ontología interpretativa del perfil del usuario, además de un lexicón. El Marco Ontológico es dinámico, en el sentido que se actualiza a través de mecanismos de aprendizaje automático, para adaptarse a los cambios de la Web y al perfil de los usuarios. Algunos de los objetivos que se persiguen con MODS son: usar el lenguaje natural español para realizar consultas sobre la web, explotar el contenido semántico sobre la web en procesos de razonamiento automático con el fin de optimizar los procesos de búsqueda, aprender sobre el uso y el contenido de la web, entre otras cosas.

Para lograr el proceso de adaptación del MODS, se requiere de un componente de aprendizaje que permita el proceso de adquisición de conocimiento, el cual actualizará el contenido del resto de sus componentes. Sin este componente de aprendizaje, el MODS se reduce a un simple sistema de interpretación de consultas, usando un conocimiento inicialmente definido en sus componentes. Así, la importancia de este componente tiene que ver con la capacidad que se le confiere al MODS para adaptarse a su entorno (Web y usuarios). En este trabajo se presenta la arquitectura genérica del componente de aprendizaje. Además, se presenta los dos macro algoritmos, para el caso del aprendizaje morfosintáctico y del aprendizaje semántico.

A continuación se describen algunos trabajos previos, vinculados al problema de aprendizaje: DODDLE-OWL es un sistema que soporta el aprendizaje de relaciones taxonómicas y no taxonómicas, usando métodos estadísticos (análisis de co-ocurrencia),WordNet y textos específicos a un dominio dado [6]. Text2Onto es el oficial sucesor de Text ToOnto, el cual es una herramienta de aprendizaje de ontologías desde texto, capaz de identificar términos, sinónimos, conceptos, relaciones taxonómicas y axiomas. Además, tiene incorporado un modelo probabilístico ontológico, que permite registrar la evolución de una ontología (cambios en su corpus) [7]. CAMELEON es un sistema que encuentra relaciones léxicas taxonómicas y no taxonómicas en textos planos, por medio de patrones léxico-sintácticos [8]. Hasti es un sistema para la construcción automática de ontologías, usa como entrada información no- estructurada en la forma de texto en lenguaje natural persa. HASTI no usa conocimiento previo, es decir, construye las ontologías desde cero. Usa un lexicón que se encuentra inicialmente vacíó, y va creciendo incrementalmente en la medida que va aprendiendo nuevas palabras. HASTI aprende conceptos, relaciones conceptuales taxonómicas, no-taxonómicas, y axiomas. HASTI usa un enfoque simbólico hibrido (una combinación de lógica y métodos heurísticos, entre otros) [9]. ONTOLEARN, es un sistema que permite enriquecer una ontología de dominio con conceptos y relaciones. Usa aprendizaje de máquina, el cual ofrece algunas técnicas para el descubrimiento de conocimiento (patrones) basadas en cadenas de Markov [11]

Este trabajo se diferencia de los trabajos previos, en primer lugar, porque forma parte de un componente de aprendizaje donde otros aspectos se aprenden (léxicos, semánticos, coloquiales, etc.); en segundo lugar, porque el resultado de la adquisición de conocimiento alimenta a específicos componentes del MODS (en este caso, al lexicón ya la ontología interpretativa); y tercero, porque su fuente de aprendizaje es la consulta en lenguaje natural o el resultado arrojado por la Web Semántica por dicha consulta. Este trabajo está organizado de la siguiente manera, en la sección 1 se presenta el Marco Ontológico Dinámico Semántico, en la sección 2 se presenta el aprendizaje Ontológico, en la sección 3 se presentan algunos ejemplos de uso de esa arquitectura en MODS, específicamente para el caso de aprendizaje semántico, y finalmente, se presentan las conclusiones y trabajos futuros.

2. MARCO ONTOLÓGICO DINÁMICO SEMÁNTICO (MODS)


El MODS es una propuesta novedosa que permite el análisis y la realización de consultas en lenguaje natural en la Web Semántica. La consulta para el MODS, más que una petición de información, es un elemento cargado de información útil para formarse una idea del tipo de usuario, y aproximarse, de manera sucesiva, a una respuesta que cada vez más satisfaga las necesidades del mismo. MODS tiene el desafío de interpretar y formalizar la consulta realizada por el usuario en lenguaje natural, como refinar sus esquemas internos frente a la dinámica de la Web para tratar futuras consultas (para lo cual requiere de mecanismos de adaptación). Específicamente, en [1] se propone la arquitectura de MODS. A continuación presentamos dicha arquitectura (ver Figura. 1).



Figura 1. Marco Ontológico Semántico [1]
De manera general, MODS transforma la consulta a un lenguaje ontológico, utilizando sus diferentes componentes: el lexicón, la ontología lingüística, la ontología de tareas y la ontología de dominio. De esta manera, MODS utiliza mecanismos de la semántica ontológica y herramientas del procesamiento del lenguaje natural para el procesamiento de las consultas de los usuarios. Una descripción más detallada de la arquitectura (Figura 1) es la siguiente: la ontología de tareas modela las tareas de procesamiento de la consulta en lenguaje natural (análisis léxico-morfológico, análisis sintáctico-semántico, análisis pragmático); la ontología lingüística especifica la gramática del lenguaje español, y cuenta con una extensión de derivaciones coloquiales y con un lexicón para caracterizar al lenguaje español, que a su vez contiene un onomasticon (es una colección de nombres propios y/o términos especializados y/o coloquiales); la ontología interpretativa modela el conocimiento sobre el contexto específico del usuario (es una ontología de alto nivel, con especializaciones/extensiones basadas en ontologías de dominio externas al MODS), y entre otras cosas, tiene una ontología del usuario que describe el uso del sistema que va haciendo cada usuario, lo que permite incorporar a la consulta formal las características propias del usuario (contextualización) para intentar delimitar la respuesta de la web. Finalmente, otro componente clave para la adaptabilidad del MODS a la dinámica de la web y del usuario, es el componente de aprendizaje de ontologías que se propone en este trabajo, cuyo fin es permitir que las ontologías evolucionen a la par con la usabilidad del sistema.
  1   2   3   4   5


La base de datos está protegida por derechos de autor ©absta.info 2016
enviar mensaje

    Página principal