IntroduccióN: conceptos previos



Descargar 0,76 Mb.
Página1/6
Fecha de conversión08.06.2017
Tamaño0,76 Mb.
  1   2   3   4   5   6


INTRODUCCIÓN: CONCEPTOS PREVIOS


Objetivos del módulo 1:

  1. Presentar la disciplina Estadística como ciencia y como ciencia auxiliar, resaltando su utilidad en los estudios empíricos de las ciencias sociales y en particular en el área de las relaciones laborales.




  1. Hacer una lectura global de los contenidos del curso, los alcances y límites del mismo, así como el fundamento de los temas que se van a tratar.




  1. Familiarizarse con algunos conceptos básicos de la estadística y la metodología cuya comprensión es fundamental para seguir el curso.




  1. Complementario: Repasar o incorporar algunos conocimientos matemáticos necesarios para una mejor comprensión de los contenidos del curso.


Conceptos clave del módulo 1:

    • Estadística

    • Estadística descriptiva y Estadística inferencial

    • Estadístico

    • Población y muestra

    • Unidades de análisis

    • Variables, sistema de categorías

    • Matriz de datos y estructura tripartita de los datos

    • Medición

    • Escalas de medición

    • Escala nomina,

    • Escala ordinal

    • Escala interval

    • Escala de razón



1.1 INTRODUCCION
Para muchos parece una materia lejana, pero la Estadística y muchas de sus herramientas nos acompañan diariamente, aunque no nos percatemos de ello. Durante el curso tendremos oportunidad de ver ejemplos muy familiares y entender algunos términos que escuchamos y manejamos diariamente.

Este primer módulo nos introducirá en el mundo de la estadística, particularmente la estadística descriptiva, aprendiendo el vocabulario y los conceptos fundamentales para poder abordar los próximos temas. También repasaremos algunos procedimientos matemáticos que usaremos durante todo el curso..



1.2 LA CIENCIA ESTADISTICA

¿Qué es la ESTADISTICA? Estadística, es algo más que la recolección y publicación (tal cual se ven en revistas y diarios) de hechos y datos numéricos. Es la aplicación del método científico de análisis de datos numéricos, con el fin de tomar decisiones racionales.

Estadística será tratada aquí como una Ciencia que trata de la recopilación, presentación, análisis e interpretación de datos numéricos (estadísticas) con el fin de realizar una toma de decisiones más efectiva.


Si quieres ver algunas definiciones adicionales, puedes acceder a:

Carrasco Arroyo, S (2005): Aproximación a la Estadística desde las Ciencias Sociales.Valencia, España.

http://www.uv.es/carrascs/PDF/aproximacion%20estadistica.pdf
Zavrostsky, A: Varias definiciones de la Estadística. Revista de Economía. Facultad de Ingeniería.Universidad de Los Andes, Venezuela.

http://iies.faces.ula.ve/Revista/Articulos/Revista_02/Pdf/Rev02Zavrotsky.pdf

Su origen en la historia… La estadística científica tal como se entiende actualmente tiene sus origenes en el SXIX, cada vez más vinculada a la teoría de la probabilidad. Dos puntos de referencia básicos son los trabajos de F. Galton, fundador de la biometría, y de K. Pearson que sentó las bases de la estadística moderna.

Sin embargo, los orígenes de las herramientas estadísticas pueden ser rastreados al menos hasta el antiguo Egipto y más atrás aún. El interés por el registro sistemático sobre la población y los recursos económicos y la elaboración de instrumentos matemáticos de resumen de la información aparecen desde la antigüedad vinculados con la administración y la política de los gobiernos.



Si te interesa conocer más sobre la historia de la estadística te recomendamos leer:
Ruiz Muñoz, David (2004):Manual de Estadística. Ediciones Eumed·net. Cap. 1. Historia de la estadística.

http://www.eumed.net/cursecon/libreria/drm/cap1.pdf


El origen de la palabra… La palabra "estadística" procede del latín statisticum collegium ("consejo de Estado") y de ella deriva el término italiano statista ("hombre de Estado" o "político"). A su vez, el término alemán Statistik es introducido por Gottfried Achenwall en 1749 al publicar su obra Compendio de la constitución política de los principales países y pueblos europeos, asociándolo con el análisis de datos del Estado, es decir, "la ciencia del Estado" . Sin embargo, recién a partir del siglo XIX el término comienza a ser utilizado en su acepción moderna.

Papel de la Estadística para las ciencias sociales

Para las ciencias sociales la estadística se ha convertido en una ciencia auxiliar fundamental, permitiendo:



  • Encontrar relaciones y características no previstas en una población, que permiten pensar en nuevas teorías e hipótesis.

  • Resumir los datos y extraer información relevante, esto es de las mediciones observadas

  • Ayudar en la búsqueda y evaluación de los modelos y pautas que ofrecen los datos, pero que se encuentran ocultos por la inherente variabilidad de los mismos.

  • Facilitar la comunicación entre los científicos, ya que siempre será más fácil comprender la referencia a un procedimiento estándar, sin necesidad de mayor detalle.



Estadística Descriptiva y Estadística Inferencial
Para entender el alcance que tiene el presente curso debemos en primer lugar entender los conceptos de ESTADISTICA DESCRIPTIVA y ESTADISTICA INFERENCIAL o INDUCTIVA.
Estadística Descriptiva: Consiste en un conjunto de instrumentos y temas relacionados con la descripción de colecciones de observaciones estadísticas, se refiere tanto al total de la población como a la muestra, y su finalidad es “resumir” un conjunto de datos numéricos.


Estadística Inferencial o Inductiva: Se ocupa de la lógica y el procedimiento para la inferencia y la inducción de propiedades de una población en bases a resultados obtenidos de una muestra conocida.
¿Porqué es importante esta distinción?
Nuestro curso, por la carga horaria y los objetivos que se ha planteado, va a realizar un recorrido básico por herramientas de estadística descriptiva.

Sin embargo, es necesario considerar que una parte fundamental de la disciplina estadística está dedicada a la INFERENCIA. En ella, se incorporan los conceptos de variable aleatoria, distribuciones de probabilidad, estimadores e intervalos de confianza, entre otros, que no utilizaremos en el curso.

Si el único propósito del investigador es describir los resultados de un experimento concreto, los métodos descriptivos pueden considerarse suficientes. No obstante, si lo que se pretende es utilizar la información obtenida para extraer conclusiones generales sobre todos aquellos objetos del tipo de los que han sido estudiados, entonces estos métodos constituyen sólo el principio del análisis, y debe recurrirse a métodos de inferencia estadística, los cuales implican el uso de la teoría de la probabilidad.La probabilidad constituye por sí misma un concepto básico que refleja su relación con la faceta del mundo exterior que pretende estudiar: los fenómenos aleatorios, que suponen unas ciertas reglas de comportamiento.

El nexo que une la teoría de la probabilidad y la estadística es la noción de variable aleatoria, mostrando de esta manera cómo puede emplearse la teoría de la probabilidad para extraer conclusiones precisas acerca de una población sobre la base de una muestra extraída de ella. Muchos de los análisis estadísticos son, de hecho, estudio de las propiedades de una o más variables aleatorias.”
Rodriguez, Mayte: Estadística aplicada a las Ciencias Sociales II.Licenciatura de Sociología. Curso 2001/02.Universidad autónoma de Madrid

http://www.uam.es/personal_pdi/ciencias/mayter/docencia/sociolog/apuntes.pdf

Con las herramientas estadísticas que vamos a trabajar durante este curso vamos a describir el comportamiento de conjuntos de individuos, instituciones, países, etc. pero no vamos a utilizarlas para generalizar los resultados a una población mayor. Esto lo veremos con detenimiento al hablar del concepto de POBLACION y MUESTRA.


Sin embargo, veremos que estos instrumentos y métodos nos habilitan a realizar análisis sumamente útiles, a partir de la descripción de nuestra población. Y, por otra parte, como plantea el texto de Mayte Rodríguez, constituyen el punto de partida para los procedimientos de la Estadística Inferencial.
Por ejemplo:

Cuando queremos conocer el perfil de los trabajadores de una empresa podemos averiguar las características de todos los empleados, con lo cual no necesitamos “inferir” ninguno de los resultados. Alcanza con generar formas de resumen de la información para describir el comportamiento de toda la plantilla de trabajadores. Es una aplicación de la estadística descriptiva.


Pero, si la empresa fuera muy grande, podríamos optar por encuestar o averiguar la información sólo de un subconjunto de esos trabajadores. En este caso, tendríamos que recurrir a la teoría de muestreo para tener mecanismos que me “garanticen” una elección al azar de los empleados entrevistar y a la teoría de la probabilidad para a partir de los resultados obtenidos para ese grupo, generalizar a toda la plantilla de trabajadores. En este caso, entonces, estaríamos frente a procedimientos propios de la Estadística Inferencial.
1.3 ¿ CUÁLES INSTRUMENTOS VEREMOS EN EL CURSO?
Por una parte, en lo que queda de este módulo veremos algunos conceptos fundamentales que nos permiten comenzar a trabajar con las herramientas estadísticas. Entender qué es una población y una unidad y cómo caracterizo a esas unidades a través de variables, que tienen un sistema de categorías y una escala de medición. A partir de estos conceptos podemos elaborar la idea de matriz de datos originales, que contiene toda la información que tengo sobre la población.
En los módulos 1, 2, 3 y 4 aprenderemos cómo describir una población en base a una de sus características (descripción univariada), sea a través de tablas, gráficos y medidas resumen (estadísticos).

En el módulo 5, veremos como describir una población en base a dos características simultáneamente.

Los últimos 3 módulos incluyen herramientas más específicas, que pueden ser de mucha utilidad para la investigación y los análisis en el ámbito de las relaciones laborales:

En el módulo 6, veremos una forma de medir y comparar el grado de concentración de recursos que se distribuyen en una población (por ejemplo, qué grado de desigualdad hay en la distribución del ingreso total del país, o la masa salarial de una empresa, entre todos los miembros de esa población).

El módulo 7 está dedicado a la presentación de algunos estadísticos que nos permiten analizar el comportamiento del mercado de trabajo. Los estadísticos que vamos a estudiar habitualmente se construyen en base a muestras y constituyen estimaciones de los valores de la población (parámetros), pero no vamos a profundizar en este aspecto sino que trataremos de entender su construcción y uso.

Finalmente, el módulo 8 presenta dos herramientas que están vinculadas al análisis temporal de datos. Veremos en primer lugar los números índice nos permiten analizar la evolución de una característica numérica en el tiempo. Algunos números índice tienen incidencia cotidiana en nuestra vida, como tendremos oportunidad de ver al llegar a ese módulo final del curso. También nos familiarizaremos con los conceptos de inflación, precios corrientes y precios constantes, y obtendremos una herramienta que nos permite comparar precios tomados en distintos momentos del tiempo.




1.4 TERMINOS Y CONCEPTOS BASICOS
Es importante que conozcamos algunos términos especializados de la disciplina estadística.

En primer lugar, muchas veces se confunden los términos “Estadística” con “estadísticas” o “estadísticos”.

Cuando hablamos de Estadística, nos estamos refiriendo a la disciplina científica.

Los estadísticos, en cambio, son medidas de resumen calculadas sobre los datos provenientes de una muestra, que en estadística inferencial se utilizan para estimar los valores correspondientes a nivel de la población (parámetros). Es decir, son herramientas que asumen determinados valores, construidas en base a los datos de observaciones. También podemos encontrarlas mencionadas como estadísticas.


En el curso aprenderemos a calcular varios estadísticos. No los veremos, sin embargo, en su “función” de estimación de los valores poblacionales, ya que no trabajaremos con la inferencia estadística.

Antes de seguir adelante, veamos el concepto de POBLACION Y MUESTRA.




POBLACIÓN o UNIVERSO: Es el conjunto de elementos sobre el que se realiza el estudio. Debe estar acotada en espacio y tiempo.


Ejemplos de poblaciones en estudios de ciencias sociales:

habitantes de un barrio o un país, alumnos de una escuela, empresas, organizaciones, partidos políticos, ciudades, países, etc.

Lo fundamental al definir una población es que sea acorde a los objetivos que nos planteamos en el estudio y que esté delimitada en el tiempo y en el espacio, de modo que sea identificable y podamos distinguir entre quienes componen la población y quienes no.
MUESTRA: Al recoger datos relativos a las características de una población muchas veces es difícil, costoso o poco práctico observar todo el grupo, sobre todo cuando se trata de conjuntos grandes.

En ese caso, se relevan los datos sólo para una parte de la población, a la cual se le llama MUESTRA.

Una muestra tomada con determinados criterios de aleatoriedad (para ello nos servimos de la teoría del muestro) puede considerarse representativa de la población y los estadísticos que construyamos a partir de ella permiten realizar estimaciones sobre lo que sucede con esas características en toda la población.

Como ya dijimos, estas estimaciones corresponden a la estadística inferencial, que se basa en la teoría de las probabilidades. Existe un margen de incertidumbre sobre las conclusiones que se sacan para la población y se trabaja bajo determinados supuestos sobre la pertinencia de generalizar a la población a partir de la información obtenida en al muestra. En estos casos, la estadística descriptiva se encarga de resumir la información y analizar solamente la muestra, sin inferir conclusiones sobre la población.


CENSO: Es un relevamiento de todos los elementos de la población. Puede considerarse un caso especial de muestra, cuando el tamaño de la misma coincide con el de la población.
Por ejemplo: para estudiar el mercado de trabajo en Uruguay periódicamente, no se entrevista a todos los habitantes del país sino que se toma una muestra de hogares e integrantes de los mismos, a los cuales se les aplica la Encuesta Continua de Hogares.

En cambio, cuando se realiza un Censo de Población, se entrevista a todas las personas que se encuentran en el país ese día. Dentro de los temas que releva el Censo de Población se incluye el del mercado de trabajo.



En el caso de la Encuesta de Hogares, obtenemos el número de desocupados de la muestra, el cual sirve para estimar la desocupación a nivel de toda la población (por lo cual hay una margen de error, una incertidumbre sobre en qué medida ese valor es el que corresponde a la población). En el caso del Censo, el número de desocupados nos indica (salvo errores de relevamiento) la desocupación en el país, sin esa “incertidumbre”.
Durante este curso vamos a trabajar bajo el supuesto que siempre estamos observando a todos los elementos de la población, es decir, realizando un CENSO.

Extraído de Bueno, Concepción y Escudero, Tomás: Apuntes de Estadística para profesores.Curso 2006/2007.Instituto de Ciencias de la Educación.Universidad de Zaragoza


La población está compuesta por las UNIDADES DE ANALISIS.

La UNIDAD DE ANALISIS es el elemento mínimo de una población y de una muestra, en tanto se lo considera como poseedor de ciertas propiedades, atributos o características denominadas variables. Por ejemplo: los estudiantes univesitarios son unidades de análisis si consideramos su año de ingreso, su centro de estudios o su edad. O, por ejemplo, los centros de estudio universitario son unidades de análisis si consideramos su número de estudiantes; cantidad de salones; números de docentes por materia. En nuestros estudios, nos interesará relevar las carácterísticas de la unidades de análisis y sacar conclusiones sobre la población en base a esta información.
Para obtener los datos de las unidades de análisis debemos relevar la información. Las herramientas para relevar la información pueden ser entrevistas (encuestas) pero también podemos obtener información de registros administrativos, documentos, artículos de prensa, observación directa.

La UNIDAD DE RELEVAMIENTO es la Unidad que aporta la información para la construcción del dato estadístico. Muchas veces coincide con la unidad de análisis, pero en otros casos no. Por ejemplo, si estamos interesados en estudiar características de los hogares (por ejemplo: los ingresos del hogar, el número de miembros que trabajan, etc.) nuestro relevamiento lo haremos sobre los miembros del hogar (les preguntaremos por sus ingresos y su condición laboral). Pero cuando construyamos los datos, tomaremos esa información y caracterizaremos con ella al hogar. En este caso, la unidad de relevamiento son los miembros del hogar pero la unidad de análisis (que es la que queremos estudiar) son hogares.


Hemos visto que nos interesa caracterizar a nuestra unidades de análisis. De ahora en adelante hablaremos de VARIABLES, como los instrumentos que nos permiten hacer esa caracterización. Una VARIABLE es una propiedad, atributo o característica de una unidad de análisis, susceptible de adoptar diferentes valores o categorías.

Los valores o categorías que adopta una variable constituyen un SISTEMA DE CATEGORIAS. Este sistema tiene dos propiedades fundamentales: sus categorías deben ser MUTUAMENTE EXCLUYENTES y el sistema debe ser EXHAUSTIVO para la población en estudio.

Sigamos con el ejemplo del estudio de los hogares de acuerdo a su nivel de ingresos y al número de miembros del hogar que trabajan.

Tenemos dos variables.

La primera podemos llamarla INGRESOS DEL HOGAR, y vamos a construir un sistema de categorías para ella. Supongamos que relevamos los ingresos de todos los miembros de un hogar. Con esta información podemos obtener el dato que corresponde a ese hogar. Deberemos hacer lo mismo con cada uno de los hogares que constituyen nuestra población en estudio.

Obtenidos nuestros datos para todos los hogares, queremos expresar el sistema de categorías de esta variable.

Un sistema de categorías posible podría ser cada uno de los valores obtenidos, por ejemplo: $2000, $4500, $ 7000, etc.

Para explicitar un sistema de categorías así (que tiene muchos valores posibles), lo mejor es buscar el valor más bajo y el más alto y expresarlo como:

$ 2000, ….., $ 70000.

Otro sistema de categorías posible, si no nos interesa tener tan desagregada la información, podría ser identificar a los hogares en esta variable en tramos de ingreso.

Por ejemplo: $ 2000 a $10000, $10001 a $40000, $40001 a 70000.

En este caso tendríamos tres categorías en nuestro sistema y los hogares tendrían como valor o categoría en esta variable su pertenencia a uno de los tres tramos (nos “olvidamos” de sus valores originales.

Pero nos interesa entender las propiedades del sistema de categorías. Supongamos que tenemos este segundo sistema.

Si hubiéramos armado los tramos de esta manera: $2000-10000, $10000-40000, $40000-70000, tendríamos dificultades para saber a qué categoría corresponde un hogar que tiene $10000 como ingreso. ¿En qué categoría lo coloco? ¿En la primera (2000 a 10000) o en la segunda (10000 a 40000)? A esto nos referimos con la idea que las categorías deben ser mutuamente excluyentes. Frente al sistema, no tengo que tener duda de cuál es la categoría que le corresponde a cada unidad.

Supongamos ahora que mi sistema es $ 5000 a $10000, $10001 a $40000, $40001 a 70000. ¿Cuál es la categoría que le corresponde al hogar que gana $2000? No tengo ninguna categoría que lo incluya. La idea de exhaustividad implica que mi sistema debe “cubrir” todos los valores posibles de la variable para mi población.

La exhausitividad de un sistema de categorías está relacionado con la población en estudio: si por ejemplo estamos estudiando el nivel educativo de un país, nuestro sistema de categorías para esa variable tendría que tener por ejemplo, las siguientes categorías:

Sin instrucción, Primaria, Secundaria-UTU, Terciaria y posterciaria.

Sin embargo si estoy estudiando el nivel educativo de una población de menores de 16 años, alcanza con tener el siguiente sistema: Sin instrucción, Primaria, Secundaria-UTU, ya que la educación terciaria no ha de aparecer como categoría para ninguna de las unidades de análisis de esta población por la edad que tienen.


La información sobre nuestra población la vamos organizar en una MATRIZ DE DATOS. Una matriz de datos contiene en sus filas a cada una de las unidades, en sus columnas a las variables que caracterizan a esas unidades. Y cada celda está compuesta por el valor que asume la variable de esa columan para la unidad de análisis de esa fila.

Un DATO, en el contexto de nuestra disciplina es el valor que toma una variable en una unidad de análisis. Por esta razón se dice que su estructura es “tripartita”: refiere simultáneamente a la unidad de análisis, a la variable y a la categoría o valor.


En la matriz de datos esta estructura tripartita se hace visible, al presentar las unidades en las filas, las variables en las columnas y el DATO como “cruce” de esos dos “vectores”.
Siguiendo nuestro ejemplo de los hogares, una matriz de datos podría ser:




Ingresos del hogar

Número de miembros que trabajan

Hogar 1

$2000

2

Hogar 2

$70000

4

Hogar 3

$ 4500

0

.






Que indica que el hogar uno tiene $ 2000 de ingreso y trabajan 2 de sus miembros, en el hogar 2, el ingreso es $ 70000 y trabajan 4 miembros, etc.

La matriz de datos tiene tantas filas como el tamaño de la población y tantas columnas como variables.
«MEDICIÓN Y ESCALAS DE MEDICIÓN»
¿Qué se mide?

Respecto a este problema encontramos referencias tales como:


«La medición es un método que permite establecer correspondencias entre magnitudes de un mismo género, y ciertas clases de números (integrales, racionales o reales)» en Russell (1938);
«Medir es asignar numerales a las propiedades de los sistemas materiales según las leyes que presiden esos atributos» (Campbell, 1938);
«Es la atribución de numerales a los objetos o sucesos conforme con leyes o reglas» (Stevens, 1951).
Lo que destaca de cualquiera de estas definiciones es que si bien la medición se realiza sobre los elementos u objetos (unidades de estudio) son las variables las que posibilitan la división en clases. Esto nos abre a la necesidad de conocer la naturaleza de las variables para conocer como medir sus propiedades.
2.1 Las Escalas y los Niveles de Medición

Comenzaremos con un ejemplo que nos introducirá en la idea de naturaleza distinta de las variables. Dada una población puede decirse cuáles de los individuos son solteros, casados, divorciados o cualquiera otra categoría de la variable "estado civil". Pero sobre estos mismos individuos se puede decir cuáles no tienen hijos y cuales sí. Sobre este segundo atributo de las unidades de registro se puede, además medir cuales no tienen hijos, cuales tienen un hijo, cuales dos, etc…. Ahora bien, si relevamos la característica “tener o no tener hijos” es diferente de si relevamos cuantos hijos tiene, a pesar que las característica de interés es la misma. Lo que difiere son las mediciones en los modos en que se manifiesta la variable.


En el caso de "tener hijos", el acto queda restringido a clasificar las unidades de registro y/o análisis que muestran la presencia o ausencia de un atributo; se le puede asignar un número a esta característica, pero no es cuantificable. Son características cualitativas. En el segundo caso, se puede estimar objetivamente no sólo la presencia o ausencia de determinado atributo (tener hijos), sino también la intensidad con que la propiedad se manifiesta, propiedad que se asume en cantidades.
Basándose en esta diferencia entre las formas de clasificar variables por referencia a este criterio de calidad-cantidad, la Estadística distingue, ya en un grado mayor de complejidad, la medición de acuerdo al tipo de escala o nivel de medición, en que se encuentran expresados los atributos que queremos medir.
Se trata de operaciones clasificatorias, o sea, ubicación de las unidades de análisis en clases, clases que tienen ciertas propiedades formales. De estas propiedades se deducen definiciones exactas de las características de la escala mucho más precisas de lo que pueden darse en términos verbales. Estas propiedades pueden formularse en forma más abstracta de lo hasta aquí expresado, mediante un conjunto de axiomas que delinean las operaciones para elaborar las escalas y las relaciones entre los objetos a que se aplican.
Se distinguen cuatro tipos de escala:

nominal


ordinal

interval

de razón



A. LA ESCALA NOMINAL  

Consiste en clasificar objetos o fenómenos, según ciertas características, tipologías o nombres, dándoles una denominación o símbolo, sin que implique ninguna relación de orden, distancia o proporción entre los objetos o fenómenos.


En la escala nominal los números sólo sirven para distinguir categorías, estos no poseen propiedades cuantitativas y sirven solamente para identificar las clases. Por lo tanto, los numerales utilizados en la clasificación no son cuantitativos. Ni siquiera se puede realizar un orden de las observaciones con sentido.
La medición se da a nivel elemental en estos casos (se dice que es el nivel más bajo de medición)
En una escala nominal, la operación de escalamiento consiste en partir de una característica dada y formar un subconjunto de clases que se excluyen mutuamente. La única relación implicada es la de equivalencia. Esto es, los miembros de cualquier clase deben ser equivalentes en la propiedad medida. La relación de equivalencia es reflexiva (x = x para todo x), simétrica (x = y luego y = x) y transitiva (x = y et y = z luego x = z).
Los símbolos que designan a los diferentes grupos en una escala nominal pueden intercambiarse sin alterar la información esencial de la escala; debido a esto, las estadísticas de tipo descriptivo admisibles son aquellas que no se alteran por este proceso: el modo, la frecuencia, el conteo, la proporción, etc. Se pueden desarrollar procesos analíticos acerca de la distribución de las categorías, así como la posible relación entre dos o más características clasificadas mediante este tipo de escala que llamaremos “variables cualitativas”.


Ejemplo de escala nominal: variable estado civil







  Otros ejemplos de escala nominal:



Sexo (1. masculino; 2. femenino)

Tipo de propiedad (1. oficial; 2. privada; 3. mixta; 4. cooperativa)

Departamento de origen (1. Artigas; 2. Canelones; 3. Colonia, etc….)

Conformidad (1. Si; 0. No)





B. LA ESCALA ORDINAL

Para las mismas personas también se pueden medir propiedades donde la clasificación debe seguir un orden jerárquico. Se trata de la escala ordinal. Con ella se establecen posiciones relativas de los objetos o fenómenos en estudio respecto a alguna característica de interés, sin que se reflejen distancias entre ellos.




Suponga que a los clientes en un negocio se les hace unas preguntas para valorar la calidad del servicio. Los clientes valoran la calidad de acuerdo a las siguientes respuestas: 1 (Muy satisfecho), 2 (satisfecho), 3 (Insatisfecho), 4 (Muy insatisfecho). Estos datos son ordinales. Note que una valoración de 1 no indica que el servicio es dos veces mejor que cuando se da una valoración de 2. Sin embargo podemos decir que la valoración de 1 es preferiblemente mejor que 2, y así en los demás casos.

Puede suceder que los objetos de una categoría de las escala no sean precisamente diferentes a los objetos de otra categoría de la escala, sino que están relacionados entre sí, guardan una relación de jerarquía. Los numerales empleados en las escalas ordinales no son cuantitativos, sino que indican exclusivamente la posición en la serie ordenada y no "cuantifican" la diferencia entre posiciones sucesivas de la escala.


Las relaciones entre los elementos en clasificación, pueden formularse con el signo >, mayor que, o sea que axiomáticamente la diferencia fundamental entre una escala nominal y una ordinal es que esta última incorpora no solamente la relación de equivalencia (=) sino también la relación ''mas grande que'' (>). Esta relación es irreflexiva (no es verdad para ninguna x tal que x > x), asimétrica ( x > y luego x < y ) y transitiva (x > y et y > z luego x > z ).
Puesto que cualquier transformación tendiente a conservar el orden no altera la información contenida en una escala ordinal, se dice que la escala es "única hasta una transformación monotónica". Esto es, no importa que números se den a una pareja de clases o a los miembros de esas clases, siempre que el número mayor sea dado a los miembros de la clase mayor o mas preferida. Por supuesto, pueden usarse números menores para grados mas preferidos (3. de primera clase, 2. de segunda clase, 1 de tercera clase); en tanto se sea consecuente, es indiferente el uso del número mayor o menor para denotar "mayor" o "mas preferido".
Fundamentalmente, las escalas ordinales se estudian en Estadística, con base en las llamadas "estadísticas de orden" o "estadísticas de rango": máximos, mínimos, mediana, percentiles, etc…


Ejemplo de escala ordinal: satisfacción con el resultado





















Muy Satisfecho

Satisfecho

Insatisfecho




Muy insatisfecho






  C. LA ESCALA DE INTERVALO  

Representa un nivel de medición más preciso, matemáticamente hablando, que las anteriores. No sólo se establece un orden en las posiciones relativas de los objetos o individuos, sino que se mide también la distancia entre los intervalos o las diferentes categorías o clases. En este caso, la medición se ejecuta en el sentido de una escala de intervalo; esto es, si la asignación de números a varias clases de objetos es tan precisa que se sabe la magnitud de los intervalos (distancias) entre todos los objetos de la escala, se ha obtenido una medida de intervalo. Una escala de intervalo está caracterizada por una unidad de medida común y constante que asigna un número real a todos los pares de objetos en un conjunto ordenado. En esta clase de medida, la proporción de dos intervalos cualesquiera es independiente de la unidad de medida y del punto cero. En una escala de intervalo, el punto cero y la unidad de medida son arbitrarios.


Axiomáticamente se puede ver que las operaciones y las relaciones en que se origina la estructura de una escala de intervalo son tales que las diferencias en la escala son isomórficas a la estructura de la aritmética. Los números pueden asociarse con las posiciones de los objetos de tal manera que las operaciones de la aritmética puedan realizarse significativamente con las diferencias entre los números.
La consecuencia de cualquier cambio de los números asociados con los objetos medidos en una escala de intervalo debe preservar no solamente el orden de los objetos sino también las diferencias relativas entre ellos. Esto es, la escala de intervalo es "única hasta una transformación lineal". La escala de intervalo es la primera escala verdaderamente cuantitativa. Las estadísticas paramétricas, son las aplicables a estudios en estas escalas.


Ejemplo de variable interval: etapas cronológicas



2050

2000

1950

1900

Suponga que se está interesado en algún período histórico específico y se están haciendo proyecciones demográficas. Se quiere conocer el crecimiento poblacional cada 50 años. Obviamente los datos pueden ser ordenados (semejante a los datos ordinales) en orden ascendente indicando pasado/s y futuro/s sucesivamente. Además , las diferencias entre los valores ordenados pueden ser comparadas. Aquí el intervalo entre los valores de los datos 1900 y 1950 representan un incremento en la historia de 50 años, y lo mismo en los demás intervalos. Hay que tener encuentra que en esta escala no hay un cero absoluto o real, el cero es arbitrario; depende del tipo de calendario que estemos usando.





La presente base de datos tiene por objeto presentar información detallada de la población de los 20 países de América Latina, desglosada por edades simples y años calendario, correspondiente al período 1950 - 2050. Estas estimaciones se generan a partir de las proyecciones nacionales utilizando un procedimiento diseñado en el Área de Demografía del Centro Latinoamericano y Caribeño de Demografía- División de Población (CEPAL/CELADE). Una parte de esta información (1995 - 2005) se publica en este Boletín Demográfico (No. 66) y corresponde a las estimaciones y proyecciones vigentes, sustituyendo así las publicadas en el Boletín Demográfico No. 60 de julio de 1997.

año

Población Total América Latina

1950

160.685.269


2000

507.932.043


2050

800.592.305






  D: LA ESCALA DE RAZON  

Cuando una escala tiene todas las características de una escala de intervalo y además un punto cero real en su origen, se llama escala de razón. Además de distinción, orden y distancia, ésta es una escala que permite establecer en que proporción es mayor una categoría de una escala que otra. El cero absoluto o natural representa la nulidad de lo que se estudia. Las operaciones y relaciones hechas con los valores numéricos en una escala de razón son correspondientes a una escala isomórfica de la estructura de la aritmética. Por consiguiente las operaciones de la aritmética son permisibles en los valores numéricos asignados a los objetos mismos, así como también en los intervalos entre los números como sucede en las escalas de intervalo. Implican que las relaciones de equivalencia, relación de mayor a menor, proporción conocida de dos intervalos y proporción conocida de dos valores de la escala, sean posibles de obtener operacionalmente. Los números asociados con los valores de la escala de razón son "verdaderos" números con un verdadero cero; solo la unidad de medida es arbitraria. Así la escala de razón es "única hasta la multiplicación por una constante positiva". Además de los procesos paramétricos básicos de las escalas de intervalo, en las de razón pueden utilizarse estadísticas como la media geométrica, el coeficiente de variación, las que requieren el conocimiento del verdadero valor cero

Ejemplo de variable de razón: número de miembros del hogar ocupados



3

2

1

0

Suponga que se quiere medir los ingresos percibidos por las distintas personas empleadas en una empresa de servicios. Los valores relevados han sido, 2, 1 – 2, 2 – 2,3 …… en miles de pesos. El orden (ordinal) y la diferencia (intervalo) en el ingreso percibido puede ser comparado, pero también el incremento de lo percibido de 2.0 a 2.1 es de 100 pesos (o 0,1 miles de pesos), el cual es el mismo que el que existe entre 2.2 y 2.3 miles de pesos. También, cuando comparamos los pesos de 2.0 a 2.2 miles de pesos, se encuentra una razón significativa, quien gana 2,2 gana 10 % más que quien gana 2, 0 miles de pesos.






El Número como Nombre, Orden o Medida (tomado de Bar; 2000)

Para Cohen y Nagel (1979), los números pueden tener por lo menos tres usos distintos, como rótulos o marcas de identificación; como signos que indican la posición de un grado en una serie de grados; o como signos que indican las relaciones cuantitativas entre cualidades. De lo dicho se desprende que sólo la última de las acepciones relaciona el número con la medición.

Esta forma de concebir los números conduce a una clasificación de variables o escalas en función de los atributos que presenta una serie numérica. Dichos atributos son, el orden, la distancia y el origen.

Las escalas nominales carecen de todas estas propiedades, y en este caso el número sólo puede adoptarse como nombre o identificación. Las escalas ordinales, como su nombre lo indica, sólo poseen orden, es decir que organizan sus datos a través de las relaciones de igualdad, mayor o menor. Las escalas interválicas poseen atributos de orden, y distancia o estimación precisa de las unidades. Pero carecen de origen, o cero natural, o ausencia de la propiedad. No obstante estas escalas acuden a la utilización del cero convencional. Las escalas proporcionales o racionales son las únicas que cuentan con las tres propiedades y, por lo tanto, se constituyen en verdaderas series numéricas. Las dos últimas clases de escalas son las que realmente miden, no obstante, al carecer las interválicas de cero natural, no pueden establecerse proporciones.








A menudo, datos provenientes de escalas ordinales numéricas son tratados como si fuera información verdaderamente cuantitativa, lo que constituye una falacia, pues no miden, aunque sí clasifican. En este caso se encuadran los tests psicométricos, (las evaluaciones de desempeño, las calificaciones de los alumnos en la facultad1), los cuales únicamente pueden estimar el orden de puntuación, pero nunca la distancia entre dos valores. Con mucha frecuencia, las puntuaciones de dichos procedimientos reciben tratamiento de variables interválicas y, consecuentemente, el cálculo de medidas de tendencia central y dispersión, además de otras operaciones derivadas de ellas. Dichas operaciones no son válidas por cuanto asignan a las escalas un status que en realidad no tienen.

EJERCICIOS
1. En este módulo es importante entender algunos conceptos básicos antes de seguir adelante. Responde las preguntas y realiza las actividades siguientes, que sintetizan los principales aspectos del módulo.
  1   2   3   4   5   6


La base de datos está protegida por derechos de autor ©absta.info 2016
enviar mensaje

    Página principal