Capítulo II: estructura del analizador de estilos introduccióN



Descargar 163 Kb.
Fecha de conversión31.05.2017
Tamaño163 Kb.

CAPÍTULO II: ESTRUCTURA DEL ANALIZADOR DE ESTILOS


CAPÍTULO II: ESTRUCTURA DEL ANALIZADOR DE ESTILOS

1. INTRODUCCIÓN


Partimos de un analizador de estilos para textos en inglés científico-técnico realizado con anterioridad por Rogelio Vargas Sánchez [Vargas 1996]. Como introducción y para tener una idea de la estructura de éste, comentaremos, resumidamente, las distintas entradas y salidas de dicho analizador.
U
n posible esquema a continuación (figura 2.1):

Figura 2.1. Esquema del analizador de estilos.




  1. El fichero de configuración informa al programa de cuáles van a ser los ficheros de texto, control, preprocesado, diccionario y cuál será el directorio donde estarán los ficheros de reglas gramaticales y de aceptabilidad.




  1. El fichero de control es el núcleo del análisis y es fundamental para el funcionamiento del programa, ya que contiene la secuencia de acciones a ejecutar por éste.




  1. En los ficheros de reglas gramaticales se encuentran las reglas gramaticales de las variables que queremos analizar. Estas son las condiciones o patrones a buscar por el programa en el texto, que hacen incrementar el valor de las variables de análisis cada vez que son encontrados.




  1. Los ficheros de reglas de aceptabilidad contienen las reglas de aceptabilidad de las variables de aceptabilidad. Estas reglas se aplican después de haber calculado las variables auxiliares de aceptabilidad mediante unos cálculos aritmético-lógicos sobre las variables de análisis, calculadas anteriormente.




  1. En el fichero de diccionario está el diccionario que se tendrá que cargar para poder aplicar las reglas gramaticales.




  1. El fichero de preprocesado contiene el preprocesado a aplicar en el texto antes del análisis propiamente dicho. Este es un proceso en el cuál se eliminan o modifican aquellos elementos que puedan presentar ambigüedad en el análisis: se quitan los paréntesis de anotaciones, se transforman las cifras quitándole los puntos y comas intermedios...




  1. El fichero de salida es el que contendrá el resultado detallado del análisis después de la ejecución del programa, es decir, los nombres de las variables analizadas junto con su valor.

2. EL FICHERO DE CONTROL


El fichero de control es el fichero fundamental del analizador que contiene toda la secuencia de acciones que realizará éste. Tiene al menos una línea de instrucción por cada variable a analizar y su procesamiento es secuencial, empezando en la primera línea y acabando en la última. Comienza con un título entre dobles comillas ("FICHERO DE CONTROL") y a continuación va toda la secuencia de acciones. Las líneas que comienzan por dobles comillas son comentarios.
Un ejemplo de algunas instrucciones del fichero de control:


v4 = palabras

contar v5 fv5

v5 = %palabras

v12 = v8 # v11

v34 = v27 + v28 +v29 + v30 + v33

auxiliares fichaux

acepta directo fdirecto

conciso=(conciso>7)@(conciso-7)

global = directo + claro +conciso + conviccion + variado

Existen varios tipos de oraciones, y por tanto, varios tipos de instrucción:




  • Contar sobre el texto una variable de salida a base de datos.

  • Realizar alguna operación de tipo aritmético-lógico con las variables.

  • Calcular el valor de una variable auxiliar para las reglas de aceptabilidad.

  • Calcular el valor de una de las variables de aceptabilidad con salida a base de datos.

2.1. INSTRUCCIÓN DE CUENTA DE UNA VARIABLE


Esta instrucción es del tipo:


contar nombre_variable fichero_reglas_gramaticales

Un ejemplo es el siguiente:




contar v5 fv5

Esta instrucción le indica al programa que debe contar la variable v5 sobre el texto a analizar, con las reglas gramaticales contenidas en el fichero fv5.rgl (el programa pone automáticamente la extensión .rgl).


2.1.1. LOS FICHEROS DE REGLAS GRAMATICALES


Estos ficheros contienen las reglas gramaticales a buscar por el programa en el texto, de manera que, cada vez que encontremos alguno de estos patrones, se incrementa el valor de la variable que estemos analizando. Como ya dijimos, las líneas que comienzan por dobles comillas son comentarios y su función es informativa sobre las diferentes acciones que estamos realizando.
Por ejemplo, el fichero fv5.rgl es así:


"VOZ PASIVA"
=@there [vbe] -ed |

=@there [vbe] +53 |

=@there [vbe] [adverbio] -ed |

=@there [vbe] [adverbio] +53 |

=and [adverbio] -ed |

=and [adverbio] +53 |

=and -ed |

=and +53 |


"vbe= verbo to be en todos sus tiempos, en activa y pasiva, en afirmativa y

negativa"

"v5-0 = elementos que no pueden ir detrás de un participio en pasiva"

"porque presentan ambigüedad: +nombre +verbo y [adj-cad] +nombre +verbo"

"adverbio = +adverbio y -ly"

Estos ficheros se basan en un lenguaje de reglas extenso y complejo, descrito en detalle en el Proyecto de Fin de Carrera de Rogelio Vargas Sánchez [Vargas 1996], y no es nuestro objetivo estudiarlo aquí.


2.2. INSTRUCCIÓN DE OPERACIÓN ARITMÉTICO-LÓGICA


La estructura de este tipo de instrucción es:


Nombre_variable = expresión_aritmético_lógica

La expresión aritmético-lógica incluye nombres de variables y algunos de los operadores siguientes: + (sumar), - (restar), * (multiplicar), /(dividir), @ (si condicional), < (menor), <= (menor o igual), >(mayor), >= (mayor o igual), & (AND lógico), | (OR lógico), # (sumar un rango de variables), % (tanto por ciento), ( ) (paréntesis), = (asignación) y == (igualdad lógica).


Algunos ejemplos de instrucción de este tipo son:


1) v4 = palabras

2) v5 = %palabras

3) v12 = v8 # v11

4) v34 = v27 + v28 +v29 + v30 + v33

5) conciso=(conciso>7)@(conciso-7)


La primera instrucción es simplemente la asignación del valor que tiene palabras a la variable v4.

La segunda, calcula el porcentaje que la variables v5 representa respecto a la variable palabras, es decir se realiza la siguiente operación:


v5 = (v5/palabras) * 100

Con la tercera instrucción se suman las variables de un rango, desde la que está a la izquierda de la almohadilla hasta la que está a la derecha, ambas incluidas. En este caso lo que se realiza es la siguiente suma:




v12 = v8 + v9 + v10 + v11

La cuarta instrucción es la suma de una serie de variables.

Y la quinta, comprueba si la parte anterior de la instrucción es cierta, en ese caso se evalúa la parte siguiente y se asigna a la variable correspondiente. Es decir:


IF (conciso >7) THEN (conciso = conciso -7)



2.3. INSTRUCCIÓN DE CÁLCULO DE VARIABLES AUXILIARES PARA EVALUACIÓN DE VARIABLES DE ACEPTABILIDAD.


Dentro del fichero de control hay una sola instrucción de este tipo y es:


auxiliar fichaux

2.3.1. EL FICHERO Fichaux


El fichero Fichaux contiene las reglas aritmético-lógicas relativas a las variables auxiliares. Estas deberán contener un valor lógico "0" o "1" después de la evaluación. Las variables auxiliares son:


  • De estilo directo y personal: dp1, dp2, dp3, dp4, dp5 y dp6.

  • De estilo abstracto y personal: ai1, ai2, ai3, ai4, ai5 y ai6.

  • De estilo claro y confuso: cc1, cc2, cc3, cc4, cc5, cc6, cc7 y cc8.

  • De estilo confuso y difícil de leer: cd1, cd2, cd3, cd4, cd5, cd6, cd7 y cd8.

  • De estilo conciso vs perifrástico y telegráfico: cpt1, cpt2, cpt3, cpt4, cpt5, cpt6, cpt7 y cpt8.

  • De estilo perifrástico: pc1, pc2, pc3, pc4, pc5, pc6, pc7 y pc8.

  • De estilo telegráfico: tc1, tc2, tc3, tc4, tc5 y tc6.

  • De estilo de convicción vs reflexivo: cr1, cr2, cr3 y cr4.

  • De estilo reflexivo vs estilo de convicción: rc1, rc2, rc3 y rc4.

  • De estilo variado vs monótono: vm1, vm2, vm3, vm4 y vm5.

  • De estilo monótono vs variado: mv1,mv2,mv3,mv4 y mv5.

Estas variables auxiliares de aceptabilidad son los elementos lingüísticos analizados en cada tipología y se usarán posteriormente para el cálculo de las variables de aceptabilidad, que se obtienen de diferentes combinaciones de los valores de estas variables auxiliares.


Como ejemplo mostramos una parte del fichero Fichaux :


"FICHERO CON LAS REGLAS REFERENTES A LAS VARIABLES AUXILIARES NECESARIAS PARA

CALCULAR LAS VARIABLES DE ACEPTABILIDAD"


"*ESTILO DIRECTO Y PERSONAL

"-Equilibrio entre voz activa y pasiva

DP1 = {[V5] <= 2.5}

"-Predominio de la pronominalización I/we

DP2 = {(56 <= [A6/(A6+A7)*100]) & ([A6/(A6+A7)*100] <= 100)}

"-Uso moderado de nominalizaciones innecesarias

DP3 = {[V12] <= 1.3}

"-Uso moderado de la preposición of

DP4 = {[V13] <= 2.5}

"-Predominio de verbos dinámicos

DP5 = {(56 <= [A87/(A87+A86)*100]) & ([A87/(A87+A86)*100] <= 100)}

"-Predominio de nombres concretos

DP6 = {(56 <= [A17/(A17+A18)*100]) & ([A17/(A17+A18)*100] <= 100)}

El significado de esta sintaxis la explicamos con un par de ejemplos:




  • La instrucción:




DP1 = {[V5] <= 2.5}

equivale a la siguiente expresión:




IF (v5<=2.5) DP1=1 ELSE DP1=0




  • Y la línea:




DP2 = {(56 <= [A6/(A6+A7)*100]) & ([A6/(A6+A7)*100] <= 100)}

es equivalente a:




IF (56 <= (A17/(A18+A17)*100)) <= 100) DP2=1 ELSE DP2=0

Este fichero Fichaux es el que usa el programa para configurar el cuadro de diálogo de los resultados detallados:




  • Las líneas que comienzan con " son comentarios.

  • Si comienzan con "* definen el nombre de una tipologías de estilo. Esta línea pasará directamente al control estático de la Ventana de Resultados Detallados donde aparece el título de la tipología estudiada en ese momento. En el ejemplo será ESTILO DIRECTO Y PERSONAL.

  • Si la línea comienza con "-, se define el nombre de una variable a analizar. Esta línea será un elemento lingüístico de la tipología en la que estemos y aparecerá en un control estático de la Ventana de Resultados Detallados. Así los 6 elementos lingüísticos del ESTILO DIRECTO Y PERSONAL aparecen en este fichero de la siguiente manera:




"-Equilibrio entre voz activa y pasiva

"-Predominio de la pronominalización I/we

"-Uso moderado de nominalizaciones innecesarias

"-Uso moderado de la preposición of

"-Predominio de verbos dinámicos

"-Predominio de nombres concretos






  • Las líneas que comienzan con "# señalan el fin de una tipología y el inicio de su complementaria. Pero ésta no aparecerá en el cuadro de diálogo.

  • Y por último, las líneas que comienzan con "%% son los elementos lingüísticos de la tipología complementaria , que tampoco aparecen en la ventana.

El lenguaje aritmético del cálculo ha sido ampliado con respecto al analizador de textos del que partíamos, añadiéndose corchetes [ ] y llaves {}. Desde el punto de vista del cálculo equivalen a paréntesis, que es como estaba configurado anteriormente. Pero además nos permite configurar el cuadro de diálogo de usuario de la siguiente manera:




  • Lo que hay entre corchetes es el valor de las ocurrencias que deben aparecer en los controles de la ventana. Así, en el ejemplo:




DP1 = {[V5] <= 2.5}

el valor numérico calculado de v5 es el que aparece en el cuadro de resultados.




  • Y lo que hay entre llaves son los límites entre los cuáles debe estar la variable en un caso ideal, es decir, es la frecuencia recomendada que aparece en la Ventana de Resultados Detallados. En el ejemplo anterior, lo que muestra el cuadro es <= 2.5 en su casilla correspondiente.

2.4. INSTRUCCIÓN DE REGLAS DE ACEPTABILIDAD


La estructura de este tipo de instrucción es:


acepta variable_aceptabilidad fichero_reglas_gramaticales

Las variables de aceptabilidad y los ficheros de reglas de aceptabilidad asociadas a dichas variables son:



directo fdirecto

claro fclaro

conciso fconciso

convicción fconvic

variado fvariado

global fglobal


Estas variables de aceptabilidad nos dan las puntuaciones obtenidas en cada una de las tipologías de estilo, así como la puntuación global del estilo empleado, que aparecen en la Ventana de Resultados Finales.


2.4.1. LOS FICHEROS DE REGLAS DE ACEPTABILIDAD


Estos ficheros constan de un título entre dobles comillas y de instrucciones. Estas son las reglas de aceptabilidad y su estructura es:


Valor fichero _condiciones comentario

El valor numérico es el que tomará la variable de aceptabilidad en caso de que sean ciertas las condiciones del fichero de condiciones.


El fichero de condiciones contiene una serie de condiciones lógicas de las cuales alguna ha de cumplirse para que el valor numérico asociado pase a la variable de aceptabilidad.
El comentario asociado al valor numérico será utilizado por el entorno Windows para colocarlo en la Ventana de Resultados Finales junto con el valor numérico de la variable de aceptabilidad.
Un ejemplo de un fichero de reglas de aceptabilidad es el fdirecto, que se muestra a continuación:


"ESTILO DIRECTO, VIGOROSO, PERSONAL Y APROXIMATIVO"

"VERSUS ABSTRACTO, IMPERSONAL Y DISTANTE"


1 fdirecto.1 excesivamente abstracto e impersonal

2 fdirecto.2 bastante abstracto e impersonal

3 fdirecto.3 algo abstracto e impersonal

4 fdirecto.4 neutro

5 fdirecto.5 directo personal aceptable

6 fdirecto.6 directo personal bueno

7 fdirecto.7 directo personal excelente


El programa va evaluando las condiciones contenidas en los ficheros correspondientes a cada valor, en el momento en que se cumpla alguna condición acaba el proceso y el valor correspondiente al fichero donde estaba la condición pasa a las variables de aceptabilidad.
Un ejemplo de instrucción de aceptabilidad es:


acepta directo fdirecto

Esta instrucción le indica al programa que debe abrir el fichero fdirecto e ir procesando las reglas de aceptabilidad hasta que se cumpla alguna. Una regla de aceptabilidad se procesa abriendo el fichero de condiciones asociado al valor de la regla y comprobando las condiciones.


2.4.2. FICHERO DE CONDICIONES


Estos ficheros forman parte de las reglas de aceptabilidad y van asociados a un valor numérico. Están formados por un título, que es un comentario entre dobles comillas, y una serie de condiciones, que pueden ser de dos tipos:


  • Condiciones de variables auxiliares. Se comprueba que se cumple al menos una de las líneas de condiciones. Un ejemplo es el fichero fdirecto.6, que se muestra a continuación:




"ESTILO DIRECTO PERSONAL BUENO: 5 ELEMENTOS"
DP1 DP2 DP3 DP4 DP5

DP1 DP2 DP3 DP4 DP6

DP1 DP2 DP3 DP5 DP6

DP1 DP2 DP4 DP5 DP6

DP1 DP3 DP4 DP5 DP6

DP2 DP3 DP4 DP5 DP6


Como las variables auxiliares contiene valores lógicos "0" o "1", el resultado de cada uno de estos grupos o condiciones es "0" o "1".




  • Condiciones de valores numéricos. Este tipo de condición sólo se usa para la variable global y se comprueba que esta variable se encuentra entre dos valores dados. Mostramos los ficheros fglobal.6 y fglobal.5 como ejemplos:




"ESTILO GLOBAL BUENO"

28 a 32


"ESTILO GLOBAL EXCELENTE"

28 a 32

3. EL FICHERO DE CONFIGURACIÓN


Decíamos que el fichero de configuración es un fichero que indica al programa cuáles van a ser los ficheros de texto, control, preprocesado, diccionario y cuál será el directorio donde estarán los ficheros de reglas gramaticales y de aceptabilidad.
Este fichero se llama “entorno.ini” y se encuentra en el mismo directorio donde se ejecuta el programa. Un ejemplo podría ser el siguiente:


";fichero de configuración"

"[pordefecto]

nacionalidad: español

edad:81


numero: 200

texto: e:\usuarios\juancho\src\ingles\reglapfc\texto.txt

diccionario: e:\usuarios\juancho\src\ingles\analiza\webster.ord

control: e:\usuarios\juancho\src\ingles\reglapfc\control2.ctl

preprocesado: e:\usuarios\juancho\src\ingles\reglapfc\contracc.pre

directorio: e:\usuarios\juancho\src\ingles\reglapfc

"[ayuda]

"gunning=http://www-gth.die.die.upm.es/


El formato es el típico de un fichero .ini de MS Windows:




  • Un punto y coma ; inhabilita una línea, es un comentario.

  • Las secciones van entre corchetes (sólo se tiene en cuenta la sección [por defecto]).

  • Las variables de cada sección van seguidas del signo igual = y del valor que deseamos que se les asigne.

Si el usuario no entra en el sub-menú Análisis|Opciones del cuadro de diálogo principal para especificar el diccionario, los ficheros de control y preprocesado y el directorio de trabajo, el programa usa los datos que encuentra en este fichero.


4. FICHERO DE AYUDAS “Ayudhtml.ini”


Este fichero es una novedad con respecto al antiguo analizador de estilos. Tras el análisis de un texto aparece en pantalla la Ventana de Resultados Finales. En ella existen unos botones con los nombres de cada una de las tipologías y de los índices de Gunning y Flesch. Al pulsar el botón de Gunning o Flesch, el programa muestra en pantalla unas páginas de ayuda con la descripción de estos índices. El fichero “ayudhtml.ini” contiene las direcciones donde se encuentran estas páginas.
Si el usuario pulsa alguna de las tipologías, aparecerá una Ventana de Resultados Detallados. En ésta aparecen todos los elementos lingüísticos de dicha tipología y a su lado unos botones de Ayuda. Al ser pulsados mostrarán páginas de ayuda explicando con detalle el elemento escogido. Las direcciones de todos los ficheros de ayuda de cada uno de los elementos lingüísticos de las cinco tipologías se guardan en este fichero “ayudhtml.ini”.
El fichero de ayudas, al igual que “entorno.ini”, se divide en secciones, presentadas entre corchetes [ ], que serán el nombre del índice o de la tipología en la que estemos. Cada sección contiene una serie de parámetros, que serán los elementos lingüísticos, seguido del signo igual =, y de la ruta completa del fichero de ayuda que nos mostrará el analizador al pulsar el botón.
El contenido del fichero “ayudhtml.ini” se presenta a continuación:



[gunning]

gunning = ..\comprensibilidad7\2gunning.html

[flesch]

flesch = ..\comprensibilidad7\3flesh.html

[aceptabilidad]

aceptabilidad = ..\tipologias8\0indice.html

[directo]

DP1_0 = ..\conseguir_claridad4\voz_activa_pasiva3.html

DP2_0 = ..\conseguir_claridad4\ponombres_personales4.html

DP3_0 = ..\conseguir_claridad4\nominalizaciones5.html

DP4_0 = ..\conseguir_claridad4\preposicion_of6.html

DP5_0 = ..\conseguir_claridad4\verbos_dinamicos13.html

DP6_0 = ..\conseguir_claridad4\nombres_concretos_abstractos8.html




[claro]

CC1_0 = ..\conseguir_claridad4\oraciones_simples10.html

CC2_0 = ..\conseguir_claridad4\nombres_compuestos9.html

CC3_0 = ..\conseguir_claridad4\cohesion11\cohesion0.html

CC4_0 = ..\conseguir_claridad4\voz_activa_pasiva3.html

CC5_0 = ..\conseguir_claridad4\verbos_dinamicos13.html

CC6_0 = ..\conseguir_claridad4\abreviaciones15.html

CC7_0 = ..\conseguir_claridad4\preposicion_of6.html

CC8_0 = ..\conseguir_claridad4\longitud_oraciones14.html

[conciso]

CPT1_0 = ..\conseguir_concision5\4nominalizaciones.html

CPT2_0 = ..\conseguir_concision5\9palabras_innecesarias.html

CPT3_0 = ..\conseguir_concision5\12longitud_oraciones.html

CPT4_0 = ..\conseguir_concision5\13longitud_parrafos.html

CPT5_0 = ..\conseguir_concision5\14oraciones_abreviadas.html\

0oraciones_abreviadas.html

CPT6_0 = ..\conseguir_concision5\15participio_gerundio.html

CPT7_0 = ..\conseguir_concision5\18activa_pasiva.html

CPT8_0 = ..\conseguir_concision5\11preposiciones_compuestas.html

[convicción]

CR1_0 = ..\variedad_tono_colorido6\tono2\13certeza.html#modales

CR2_0 = ..\variedad_tono_colorido6\tono2\13certeza.html#lexicos

CR3_0 = ..\variedad_tono_colorido6\tono2\13certeza.html#nombres

CR4_0 = ..\variedad_tono_colorido6\tono2\13certeza.html#adverbios

[variado]

VM1_0 = ..\variedad_tono_colorido6\variedad1\7long_oraciones_parrafos.html

VM1_1 = ..\variedad_tono_colorido6\variedad1\7long_oraciones_parrafos.html

VM1_2 = ..\variedad_tono_colorido6\variedad1\7long_oraciones_parrafos.html

VM2_0 = ..\variedad_tono_colorido6\variedad1\7long_oraciones_parrafos.html

VM2_1 = ..\variedad_tono_colorido6\variedad1\7long_oraciones_parrafos.html

VM2_2 = ..\variedad_tono_colorido6\variedad1\7long_oraciones_parrafos.html

VM3_0 = ..\variedad_tono_colorido6\variedad1\4estructura.html

VM3_1 = ..\variedad_tono_colorido6\variedad1\4estructura.html

VM3_2 = ..\variedad_tono_colorido6\variedad1\4estructura.html

VM4_0 = ..\variedad_tono_colorido6\colorido3\20latinismos.html

VM5_0 = ..\variedad_tono_colorido6\colorido3\18verbos_dinamicos.html

VM5_1 = ..\variedad_tono_colorido6\colorido3\18verbos_dinamicos.html

VM5_2 = ..\variedad_tono_colorido6\tono2\13certeza.html

VM5_3 = ..\variedad_tono_colorido6\tono2\13certeza.html





CAPÍTULO II: ESTRUCTURA DEL ANALIZADOR DE ESTILOS 8

1. INTRODUCCIÓN 8

2. EL FICHERO DE CONTROL 10

2.1. INSTRUCCIÓN DE CUENTA DE UNA VARIABLE 10

2.1.1. LOS FICHEROS DE REGLAS GRAMATICALES 11

2.2. INSTRUCCIÓN DE OPERACIÓN ARITMÉTICO-LÓGICA 12

2.3. INSTRUCCIÓN DE CÁLCULO DE VARIABLES AUXILIARES PARA EVALUACIÓN DE VARIABLES DE ACEPTABILIDAD. 13

2.3.1. EL FICHERO Fichaux 13

2.4. INSTRUCCIÓN DE REGLAS DE ACEPTABILIDAD 17

2.4.1. LOS FICHEROS DE REGLAS DE ACEPTABILIDAD 17

2.4.2. FICHERO DE CONDICIONES 18

3. EL FICHERO DE CONFIGURACIÓN 19



4. FICHERO DE AYUDAS “Ayudhtml.ini” 20





Compartir con tus amigos:


La base de datos está protegida por derechos de autor ©absta.info 2019
enviar mensaje

    Página principal