Errores y dificultades en la comprensión de los conceptos estadísticos elementales



Descargar 135,92 Kb.
Página1/3
Fecha de conversión05.08.2017
Tamaño135,92 Kb.
  1   2   3
ERRORES Y DIFICULTADES EN LA COMPRENSIÓN DE LOS CONCEPTOS ESTADÍSTICOS ELEMENTALES

C. BATANERO, J. D. GODINO, D. R. GREEN, P. HOLMES y A. VALLECILLOS


[Errors and difficulties in understanding elementary statistical concepts. Internation Journal of Mathematics Education in Science and Technology, 25(4), 527-547]

1. INTRODUCCIÓN

La enseñanza de la Estadística ha cobrado gran desarrollo en los últimos años, debido a su importancia, ampliamente reconocida, en la formación general del ciudadano. Algunos países han dedicado grandes esfuerzos a diseñar curriculos y materiales específicos, como los elaborados en Inglaterra para el Schools Council Project on Statistical Education por Holmes y cols. (1980), el Quantitative Literacy Project en Estados Unidos (Landewehr y Watkins, 1986; Landewehr y cols., 1987; Gnanadesikan y cols., 1987) y Azar y Probabilidad en España (Godino y cols., 1987). El interés creciente hacia la enseñanza de la Estadística se manifiesta, asimismo, por la existencia de revistas especificas (Teaching Statistics; Induzioni; Stochastik in der Schule); por las conferencias internacionales sobre la Enseñanza de la Estadística (ICOTS I en 1982 en Sheffield ; ICOTS II en 1986 en Victoria e ICOTS III en 1990 en Otago); por la serie de Mesas redondas promovidas por el I.S.I. (la más reciente tuvo lugar en Lennoxville en 1992) y por la formación en 1992 de una asociación internacional IASE (International Association for Statistical Education). Este interés también se demuestra mediante el establecimiento de Centros para la Educación Estadística en Inglaterra, Italia y Estados Unidos; por la Newsletter del International Study Group for Research on Learning Probability and Statistics de la universidad de Granada y la revista The Journal of Statistics Education editados mediante correo electrónico.

El mayor énfasis dado a la Estadística en los diferente curriculos, como los Standards del N.C.T.M. (1989), el Curriculum Nacional para Inglaterra y Gales (D.E.S., 1991) y los nuevos Diseños Curriculares en España (M.E.C., 1988a y 1988b) requiere una intensa preparación de los profesores, para permitirles abordar con éxito los objetivos educativos correspondientes. Muchos profesores precisan incrementar su conocimiento, no sólo sobre la materia, sino también sobre los aspectos didácticos del tema. Esta preparación debería incluir también el conocimiento de las dificultades y errores que los alumnos encuentran en el aprendizaje de la Estadística.

El propósito de este artículo es contribuir a la difusión de los resultados de la investigación sobre estas dificultades y errores, que no son suficientemente conocidos por los profesores. Existen ya algunos “estados de la cuestión” sobre la investigación en educación estadística (Hawkins y Kapadia, 1984; Garfield y Alhgren, 1988; Scholz, 1991 y Shaughnessy, 1992), pero estos trabajos están dirigidos a investigadores más que a profesores y su fin principal ha sido identificar nuevas cuestiones de investigación. Además, se han enfocado especialmente hacia la probabilidad, porque la investigación en este área es mucho más extensa que la relacionada con los conceptos estadísticos, aunque una excepción relevante es el nuevo libro para profesores de estadística de Hawkins, Joliffe y Glickman (1992).

En este artículo analizamos las investigaciones sobre los principales conceptos estadísticos elementales que han sido incluidos en muchos diseños curriculares recientes en los niveles no universitarios. Este análisis muestra la complejidad de algunos de estos tópicos y puede proporcionar al profesor una comprensión mayor del razonamiento estocástico de sus alumnos. Consideramos necesario comenzar esta exposición resaltando la importancia de la investigación sobre errores y dificultades de los alumnos y definiendo algunos conceptos teóricos relacionados con la misma. Advertimos, sin embargo, al lector que:

a) la estadística ha recibido hasta la fecha menos atención que otras ramas de las

matemáticas;

b) la mayor parte de la investigación se ha llevado a cabo en situaciones experimentales, en lugar de en situaciones escolares;


  1. muchos estudios se centran en niños muy pequeños o en estudiantes de universidad, siendo escasa la investigación en las edades 11 a 16 años;

  2. las primeras investigaciones en el campo han sido efectuadas por psicólogos en

lugar de por educadores matemáticos, aunque este aspecto está empezando a cambiar.
2. 1NVESTIGACIÓN SOBRE ERRORES, CONCEPCIONES Y OBSTÁCULOS EN

DIDÁCTICA. ALGUNOS CONCEPTOS TEORICOS


Gran parte de la investigación teórica y experimental, que se está llevando a cabo actualmente en Didáctica de la Matemática, surge del hecho observable de que el alumno se equivoca cuando se le pide realizar ciertas tareas. El alumno proporciona respuestas erróneas, con respecto a una patrón de evaluación, o simplemente no es capaz de dar ninguna respuesta. En los casos en que no se trata de mera distracción se dice que tal tarea resulta demasiado difícil para el alumno en cuestión. Pero los errores y dificultades no se presentan de un modo aleatorio, imprevisible. Con frecuencia es posible encontrar regularidades, ciertas asociaciones con variables propias de las tareas propuestas, de los sujetos o de las circunstancias presentes o pasadas. La investigación didáctica trata de caracterizar estas regularidades y de construir modelos explicativos, en términos de relaciones entre las variables intervinientes. Algunos autores, como Radatz (1980), consideran el análisis de errores como “una estrategia de investigación prometedora para clarificar cuestiones fundamentales del aprendizaje matemático” (pag. 16). Asimismo, Borassi (1987) presenta el análisis de errores en educación matemática “como un recurso motivacional y como un punto de partida para la exploración matemática creativa, implicando valiosas actividades de planteamiento y resolución de problemas” (pag. 7).

Un principio ampliamente asumido en psicología educativa es el enunciado por Ausubel y cols. (1983): “el factor más importante que influye en el aprendizaje es lo que el alumno ya sabe. Averígüese esto y enséñese consecuentemente”. El interés reciente de los estudios de didáctica por las concepciones de los estudiantes (Confrey, 1990) sería una consecuencia del mencionado principio psicológico.

La problemática que se plantea para la didáctica es que algunas de estas concepciones, que permiten resolver un conjunto de tareas en términos adecuados, se muestran limitadas, inapropiadas cuando se aplican a casos más generales, y que el sujeto muestra una resistencia a su sustitución. En estas circunstancias se habla de la existencia de un obstáculo cognitivo que puede explicar la existencia de errores y dificultades especiales. Brousseau (1983) describe las siguientes características de los obstáculos:

*Un obstáculo es un conocimiento, no una falta de conocimiento. El alumno utiliza este conocimiento para producir respuestas adaptadas a un cierto contexto que encuentra con frecuencia. Cuando se usa este conocimiento fuera de este contexto genera respuestas incorrectas. Una respuesta universal exigirá un punto de vista diferente.

*El alumno resiste a las contradicciones que el obstáculo le produce y al establecimiento de un conocimiento mejor. Es indispensable identificarlo e incorporar su rechazo en el nuevo saber.

* Después de haber notado su inexactitud, continúa manifestándolo, de forma esporádica. Brousseau ha identificado tres tipos de obstáculos:


a) Obstáculos ontogénicos (a veces llamados obstáculos psicogenéticos): son debidos a las características del desarrollo del niño. Por ejemplo, para comprender la idea de probabilidad se requiere el razonamiento proporcional.

b) Obstáculos didácticos: resultan de las elecciones didácticas hechas para establecer la situación de enseñanza. Por ejemplo, la introducción de un nuevo simbolismo tal como:

(xi )/n

cuando los estudiantes necesitan trabajar con ejemplos concretos.



c) Obstáculos epistemológicos: Relacionados intrínsecamente con el propio concepto y conteniendo parte del significado del mismo. Por ejemplo, las circularidades que se presentan en las diferentes definiciones del significado de la probabilidad (clásica, frecuencial, subjetiva) que mostraron en su día la necesidad de una definición axiomática.
Encontrar estos obstáculos mediante un análisis histórico, y superarlos parece ser una condición necesaria para la construcción de una concepción adecuada. Finalmente, hacemos notar que otras dificultades experimentadas por los estudiantes se deben a una falta del conocimiento básico necesario para una comprensión correcta de un concepto o procedimiento dado. El propósito de la caracterización de concepciones y obstáculos es que ello permite delimitar los distintos componentes implicados en la comprensión de un concepto. La investigación reciente como, por ejemplo, el trabajo de Sierpinska (1991) sobre los “actos de comprensión” de la noción de limite de una sucesión numérica muestra la complejidad del significado de los objetos matemáticos
3. REPRESENTACIÓN GRÁFICA Y TABULACIÓN DE DATOS

Comenzamos nuestra exposición sobre errores y dificultades en el aprendizaje de la Estadística con los que se refieren al uso de representaciones gráficas y tablas de frecuencias.

La destreza en la lectura crítica de datos es un componente de la alfabetización cuantitativa y una necesidad en nuestra sociedad tecnológica. Curcio (1989) describe tres niveles distintos de comprensión de los gráficos:

(a) “Leer los datos”: este nivel de comprensión requiere una lectura literal del gráfico; no se realiza interpretación de la información contenida en el mismo.

(b) “Leer dentro de los datos”: incluye la interpretación e integración de los datos en el gráfico; requiere la habilidad para comparar cantidades y el uso de otros conceptos y destrezas matemáticas.

(c) “Leer más allá de los datos”: requiere que el lector realice predicciones e inferencias a partir de los datos sobre informaciones que no se reflejan directamente en el gráfico.

Por ejemplo, si analizamos las tareas que se requieren en la interpretación de una nube de puntos, “leer los datos” se refiere a cuestiones sobre la lectura de las escalas o encontrar el valor de una de las coordenadas de uno de los puntos, dado el valor de la otra coordenada. “Leer dentro de los datos” se refiere, por ejemplo, a cuestiones sobre la intensidad de la covariación, sobre si la relación podría ser representada o no mediante una función lineal o sobre si la dependencia es directa o inversa. Finalmente la predicción del valor de la coordenada y, para un valor de la coordenada x requeriría el trabajo en el nivel de “leer más allá de los datos”.

Curcio (1987) estudió, con alumnos de 4º a 7º, el efecto que, sobre la comprensión de las relaciones matemáticas expresadas en los gráficos, tienen los siguientes factores:



  • conocimiento previo del tema al que se refiere el gráfico; - conocimiento previo del contenido matemático del gráfico, esto es, los conceptos numéricos, relaciones y operaciones contenidas en el mismo;

  • conocimiento previo del tipo de gráfico empleado (gráfico de barras, pictograma, etc.).

Encontró que las principales dificultades aparecen en los dos niveles superiores (“leer dentro de los datos” y “leer más allá de los datos”). También mostró el efecto de la edad y el curso escolar sobre la comprensión de los gráficos.
Li y Shen (1992) muestran ejemplos de elección incorrecta del tipo de gráfico en los proyectos estadísticos realizados por los estudiantes de secundaria. Algunos alumnos utilizaron un polígono de frecuencias con variables cualitativas, o un diagrama de barras horizontal para representar la evolución del índice de producción industrial a lo largo de una serie de años. Este problema se agrava por la disponibilidad de “software” para la representación gráfica y el desconocimiento del modo correcto en que debe ser empleado por parte de los alumnos. Con frecuencia la elección de las escalas de representación son poco adecuadas para el objetivo pretendido. Los autores incluyen, además, una lista de errores de carácter técnico entre los cuales destacamos los siguientes:

- omitir las escalas en alguno de los ejes horizontal o vertical, o en ambos;

- no especificar el origen de coordenadas;

- no proporcionar suficientes divisiones en las escalas de los ejes.

Otras veces, el empleo inadecuado del “software” gráfico se debe a las concepciones incorrectas del estudiante, como al obtener un diagrama de sectores en los que éstos no son proporcionales a las frecuencias de las categorías. Li y Shen indican que es de sentido común no comparar 30 sillas y 50 kg. de carne. Sin embargo, presentan un ejemplo de proyecto realizado por los alumnos sobre la industria textil en que se comparan cantidades heterogéneas en un mismo gráfico.
4. CARACTERÍSTICAS ESTADÍSTICAS
4.1. LA MEDIA
Además de ser uno de los principales conceptos estadísticos, la media tiene muchas aplicaciones en cuestiones prácticas de la vida diaria. Este concepto es aparentemente simple, pero Pollatsek y cols. (1981) describen el error consistente en emplear la fórmula de cálculo (120+180)/2 = 150 para resolver la cuestión siguiente:
Hay 10 personas en un ascensor, 4 mujeres y 6 hombres. El peso medio de las mujeres es de 100 libras. y el de los hombres de 180. ¿Cuál es el peso medio de las 10 personas del ascensor?

Las situaciones en las cuales se debe calcular una media ponderada y la selección de los correspondientes pesos no son fácilmente identificados por los estudiantes. Li y Shen (1992) indican que cuando los datos se agrupan en intervalos, los estudiantes olvidan con frecuencia que cada uno de estos grupos debería ponderarse de modo distinto al calcular la media.

Otro ítem propuesto por Pollasek y cols. (1981), trata de determinar las concepciones de los alumnos universitarios sobre el valor esperado de una observación de una variable aleatoria, de la que se conoce su esperanza matemática:
La media en fluidez verbal de una clase de un colegio es de 400. Si extraemos una muestra aleatoria de 5 estudiantes y resulta que la puntuación de los 4 primeros es de 380. 420, 600, 400. ¿Cuál seria aproximadamente la puntuación esperada para el quinto estudiante?
La respuesta correcta a este ítem es 400, el valor esperado en la población. Sin embargo, algunos alumnos pensaban erróneamente que la puntuación del quinto sujeto debería ser tal que, sumada a las cuatro anteriores, diera una media de 400.

Mevarech (1983) observa que una explicación posible de los errores descritos por Pollasek y cols. (1981) es que los estudiantes suelen creer que un conjunto de números, junto con la operación media aritmética constituye un grupo algebraico, satisfaciendo los cuatro axiomas de clausura, asociatividad, elemento neutro y elemento inverso. En su investigación, llevada a cabo con 103 estudiantes de primer curso de universidad, encuentra un alto porcentaje de alumnos que atribuyen alguna de estas propiedades a la media aritmética.

Las investigaciones que hemos descrito se refieren a los aspectos computacionales de la media. Respecto a la comprensión de los aspectos conceptuales, Strauss y Bichler (1988) investigaron el desarrollo evolutivo de la comprensión de esta noción en alumnos de 8 a 12 años, distinguiendo las siguientes propiedades:

a) La media es un valor comprendido entre los extremos de la distribución.

b) La suma de las desviaciones de los datos respecto de la media es cero.

c) El valor medio es influenciado por los valores de cada uno de los datos.

d) La media no tiene por qué ser igual a uno de los valores de los datos.

e) El valor obtenido de la media puede ser una fracción (ello puede no tener sentido para la variable considerada).



  1. Hay que tener en cuenta los valores nulos en el cálculo de la media.

  2. La media es un “representante” de los datos a partir de los que ha sido calculada.

Para cada una de estas propiedades, los autores citados emplearon diversas tareas, variando el tipo de datos (continuos, discretos) y el medio de presentación (verbal, numérico y concreto). No encontraron efectos significativos respecto al tipo de datos o medio de presentación empleado. Sus resultados sugieren una mejora de la comprensión con la edad, y diferencias de dificultad en la comprensión de las propiedades, siendo más fáciles las a), c) y d) que las b), f) y g).

Como se sabe la media es un valor “típico o “representativo” de los datos. Campbell (1974) observa que, debido a ello, se tiende a situar la media en el centro del recorrido de la distribución, propiedad que es cierta para distribuciones simétricas. Pero cuando la distribución es muy asimétrica la media se desplaza hacia uno de los extremos y la moda o la mediana serían un valor más representativo del conjunto de datos.

La comprensión de la idea de “valor típico” implica, según Russel y Mokros (1991), tres tipos diferentes de capacidades:

- Dado un conjunto de datos, comprender la necesidad de emplear un valor central, y elegir el más adecuado.

- Construir un conjunto de datos que tenga un promedio dado.

- Comprender el efecto que, sobre los promedios (media, mediana o moda), tiene un cambio en todos los datos o parte de ellos.

Russell y Mokros estudiaron las concepciones que los alumnos de 4º a 8º de enseñanza primaria tienen sobre los valores de tendencia central, empleando para ello las tareas anteriores, de las cuales la más difícil fue la segunda. Este tipo de tarea ha sido también propuesta por Goodchild (1988), quien proporcionó a los estudiantes cajas de cerillas en las que se había impreso la frase “contenido medio 35 cerillas”. Una de sus preguntas, presentada mediante entrevista a 8 alumnos, requería que el alumno construyese una distribución hipotética del contenido de 100 cajas. El hecho más notable de estas distribuciones fue su falta de forma, ya que el gráfico no tenía en absoluto forma acampanada (como la distribución normal). Goodchild sugirió que ello se debe a la falta de comprensión de la media como medida de posición de la distribución obtenida a partir de un proceso estocástico.

Russell y Mokros también encontraron cuatro categorías generales en las que clasificaron las concepciones de los estudiantes sobre los promedios:

a) el “valor más frecuente” o moda;

b) el “valor razonable”;

c) el “punto medio”;

d) una “relación algorítmica”, es decir, una fórmula de cálculo.

Cada uno de estos aspectos puede ser cierto en un caso dado, pero puede ser inapropiado en otro. Finalizan el artículo señalando la necesidad de usar diferentes contextos y representaciones en la enseñanza de un concepto matemático. En nuestra opinión, los resultados de las investigaciones que hemos descrito sobre la media muestran también que el conocimiento de las reglas de cálculo por parte de los estudiantes no implica necesariamente una comprensión real de los conceptos subyacentes. Si los alumnos adquieren sólo el conocimiento de tipo computacional es probable que cometan errores predecibles, salvo en los problemas más sencillos.
4.2. CARACTERÍSTICAS DE DISPERSIÓN

El estudio de una distribución de frecuencias no puede reducirse al de sus promedios, ya que distribuciones con medias o medianas iguales pueden tener distintos grados de variabilidad. Para Campbell (1974) un error frecuente es ignorar la dispersión de los datos cuando se efectúan comparaciones entre dos o más muestras o poblaciones.

La desviación típica mide la intensidad con que los datos se desvían respecto de la media. Loosen y cols. (1985) hicieron notar que muchos libros de texto ponen mayor énfasis en la heterogeneidad entre las observaciones que en su desviación respecto de la posición central. Como señalan Loosen y cols., las palabras empleadas: variación, dispersión, diversidad, fluctuación, etc. están abierta a diferentes interpretaciones. Es claro para el profesor, pero no para el estudiante, cuándo estas palabras se refieren a una diversidad relativa a la media o en términos absolutos.

En un experimento, estos autores tomaron 154 estudiantes de primer curso de psicología, que no habían recibido ese curso una instrucción específica sobre la dispersión, mostrándoles dos conjuntos diferentes de bloques A y B. Las longitudes de los bloques en el conjunto A fueron 10, 20, 30, 40, 50 y 60 cm. y las longitudes de los bloques en el conjunto B fueron 10, 10, 10, 60, 60 y 60 cm. Al preguntar a los sujetos cuál de los dos conjuntos presentaba mayor variabilidad, se obtuvieron las siguientes respuestas: el 50 % pensó que el conjunto A era más variable, el 36% que era más variable el conjunto B y el 14% que los dos conjuntos presentaban igual variabilidad. Loosen y cols. interpretaron estas respuestas como prueba de que el concepto intuitivo de variabilidad se equipara al de “no semejanza”, es decir, cuánto varían unos valores respecto a otros, más que cuánto varían los valores respecto a un punto fijo. En este sentido el conjunto A ciertamente debe ser considerado mas variable que el B, aunque la desviación típica es mayor en el conjunto B.

Mevarech (1983) encontró en alumnos universitarios las mismas dificultades en el cálculo de la varianza que en el cálculo de la media. En particular, los estudiantes suponen que el conjunto de datos junto con la operación de cálculo de la varianza tiene una estructura de grupo.

Uno de los usos más comunes de la media y desviación típica es el cálculo de puntuaciones Z (o puntuaciones tipificadas). La mayoría de los estudiantes no tienen dificultad en comprender este concepto ni en calcular las puntuaciones Z para un conjunto de datos particular. Sin embargo, Huck y cols. (1986) han señalado dos concepciones erróneas ampliamente extendidas entre los estudiantes, referentes al rango de variación de las puntuaciones Z, cuando se calculan a partir de una muestra finita o una distribución uniforme.

Por un lado, algunos alumnos creen que todas las puntuaciones Z han de tomar un valor comprendido entre -3 y +3. Otros estudiantes piensan que no hay límite para los valores máximo y mínimo de las puntuaciones Z. Cada una de estas creencias está ligada a una concepción errónea sobre la distribución normal. Los alumnos que piensan que las puntuaciones Z siempre varían de -3 a +3, han usado frecuentemente una tabla o gráfico de la curva normal N(0,1) con este rango de variación. De igual modo, los estudiantes que creen que las puntuaciones Z no tienen límite superior ni inferior, han aprendido que las colas de la curva normal son asintóticas a la abcisa y hacen una generalización incorrecta. Por ejemplo, si consideramos el número de niñas entre diez recién nacidos, obtenemos una variable aleatoria X que sigue la distribución binomial con n=10 y p=0.5. La media de esta variable es np=5 y la varianza npq=2.5. Por ello, la puntuación Z máxima que puede obtenerse en esta distribución es Z =(10-5)/2.5=3.16 que es un limite finito pero mayor que 3.
4.3. ESTADÍSTICOS DE ORDEN

En la actualidad, el estudio de los estadísticos de orden toma una gran importancia por dos motivos:



  • El análisis exploratorio de datos, surgido a partir de los estudios de Tukey (1977), se basa en estos estadísticos, porque son “robustos”, esto es, menos sensibles a pequeños cambios en los datos y a los valores atípicos.

  • Son la base de los métodos no paramétricos, que requieren para su aplicación un menor número de hipótesis que la estadística paramétrica y pueden ser aplicados con mayor generalidad, aunque son menos potentes.

El estudio de los estadísticos de orden presenta dificultades, tanto a nivel procedimental como a nivel conceptual. En primer lugar, el cálculo de la mediana, percentiles y rango de percentiles se enseña empleando un algoritmo diferente para el caso de variables estadísticas agrupadas en intervalos o no agrupadas. Como sabemos, la opción de agrupar o no en intervalos se toma a juicio del que analiza los datos. Como indica Schuyten (1991), incluso los alumnos universitarios encuentran difícil aceptar que se pueda emplear dos algoritmos diferentes de cálculo para el mismo promedio y que puedan obtenerse valores distintos para el mismo parámetro, al variar la amplitud de los intervalos de clase.

Estepa (1990) observa las dificultades de los alumnos al interpretar la gráfica de frecuencias acumuladas de variables discretas, debido a que presenta discontinuidades de salto y su inversa no es una aplicación: en esta correspondencia un punto puede tener más de una imagen, o vanos puntos pueden tener la misma imagen.

  1   2   3


La base de datos está protegida por derechos de autor ©absta.info 2016
enviar mensaje

    Página principal