Loading

compartir

Ficha temática

Histogramas y polígonos

Histogramas

Un histograma es un método gráfico para mostrar la forma de una distribución. Es particularmente útil cuando hay un gran número de observaciones. Comenzamos con un ejemplo que consiste en las puntuaciones de los 642 estudiantes en una prueba de la psicología. La prueba consta de 197 artículos, cada uno calificado como "correcta" o "incorrecta". Puntajes de los estudiantes variaron 46-167.

El primer paso es crear una tabla de frecuencias. Desafortunadamente, una tabla de frecuencias simple sería demasiado grande, que contiene más de 100 filas. Para simplificar la mesa, nosotros los puntajes agrupar como se muestra en la Tabla 1.

Tabla 1. Datos agrupados. Puntajes en los exámenes de psicología.

ejemplo

 

Para crear esta tabla, el rango de calificaciones se divide en intervalos, denominados intervalos de clase. El primer intervalo es de 39.5 a 49,5, se contó el segundo a partir de 49,5 a 59,5, etc. A continuación, el número de puntuaciones que caen en cada intervalo para obtener las frecuencias de clase. Hay tres anotaciones en el primer intervalo, 10 en el segundo, etc.

Intervalos de clase de ancho 10 proporcionan suficientes detalles acerca de la distribución que se revela sin hacer la gráfica también "entrecortado". La colocación de los límites de los intervalos de clase a medio camino entre dos números (por ejemplo, 49,5) asegura que cada puntuación se reducirá en un intervalo en lugar de en el límite entre los intervalos.

En un histograma, las frecuencias de clase están representadas por barras. La altura de cada barra corresponde a su frecuencia de clase. Un histograma de estos datos se muestra en la Figura 1.

 

ejemplo

Figura 1. Histograma de las puntuaciones en una prueba de la psicología.

 

El histograma deja claro que la mayoría de las puntuaciones se encuentran en el centro de la distribución, con un menor número de puntuaciones en los extremos. También puede ver que la distribución no es simétrica: los resultados se extienden a la más correcta de lo que hacen a la izquierda. Por consiguiente, la distribución se dice que está sesgado.

En nuestro ejemplo, las observaciones son números enteros. Los histogramas también se pueden utilizar cuando las puntuaciones se miden en una escala más continua tal como la longitud de tiempo (en milisegundos) que se requieren para realizar una tarea. En este caso, no hay necesidad de preocuparse por los indecisos ya que son improbables. (Sería bastante una coincidencia para una tarea que requiere exactamente 7 segundos, medidos a la milésima de segundo.) Por tanto, estamos libres de elegir los números enteros como límites para nuestros intervalos de clase, por ejemplo, 4000, 5000, etc. La frecuencia de clase es entonces el número de observaciones que son mayores que o igual que el límite inferior, y estrictamente menor que el límite superior. Por ejemplo, un intervalo podría ser de 4.000 a 4.999 milisegundos. El uso de números enteros como límites evita un aspecto desordenado, y es la práctica de muchos programas informáticos que crean histogramas. Ten en cuenta también que algunos programas de computador etiquetan el medio de cada intervalo en lugar de los puntos extremos.

Los histogramas se pueden basar en frecuencias relativas en lugar de las frecuencias reales. Histogramas basados en frecuencias relativas muestran la proporción de las puntuaciones en cada intervalo en lugar del número de puntuaciones. En este caso, el eje Y se extiende desde 0 a 1 (o en algún punto intermedio, si no hay proporciones extremas). Puede cambiar un histograma basado en frecuencias a otra basada en frecuencias relativas de (a) dividir cada frecuencia de clase por el número total de observaciones, y luego (b) el trazado de los cocientes en el eje Y (etiquetado como proporción).

No hay más que decir acerca de las anchuras de los intervalos de clase, a veces llamados anchos de caja. Su elección de la anchura bin determina el número de intervalos de clase. Esta decisión, junto con la elección del punto de partida para el primer intervalo, afecta a la forma del histograma. Hay algunas "reglas de oro" que pueden ayudar a elegir una anchura apropiada. (Pero tenga en cuenta que ninguna de las reglas es perfecta.) Regla de Sturges es establecer el número de intervalos lo más cerca posible a 1 + Log2 (N), donde Log2 (N) es la base 2 de registro del número de observaciones. La fórmula también puede escribirse como 1 + 3,3 Log10 (N), donde log 10 (N) es el logaritmo en base 10 del número de observaciones. Según la regla de Sturges, 1.000 observaciones se grafican con intervalos de clase 11 ya que 10 es el número entero más cercano Log2 (1.000). Más sencilla es la conocida como la regla de arroz, que es para ajustar el número de intervalos de al doble de la raíz cúbica del número de observaciones. En el caso de 1000 observaciones, la regla de arroz produce 20 intervalos en lugar de los 11 recomendados por la regla de Sturges. Para el ejemplo de prueba psicología utilizado anteriormente, regla de Sturges recomienda intervalos de 10, mientras que el Estado Rice recomienda 17. Al final, llegamos a un acuerdo y elegimos 13 intervalos para la Figura 1 para crear un histograma que parecía más claro. El mejor consejo es experimentar con diferentes opciones de ancho, y para elegir un histograma de acuerdo con lo bien que se comunica la forma de la distribución.

 

Polígonos de frecuencia

Polígonos de frecuencia son un dispositivo gráfico para la comprensión de las formas de las distribuciones. Ellos tienen el mismo propósito que los histogramas, pero son especialmente útiles para comparar conjuntos de datos. Los polígonos de frecuencia son también una buena opción para la visualización de la distribución de frecuencias acumuladas.

Un polígono de frecuencia para 642 resultados de las pruebas psicología mostrados en la Figura 1 se construyó a partir de la tabla de frecuencias se muestra en la Tabla 1.

Tabla 1. Distribución de frecuencia de Psicología puntajes en los exámenes.

ejemplo

 

La primera etiqueta en el eje X es 35. Esto representa un intervalo que se extiende desde 29,5 a 39,5. Dado que la puntuación de la prueba más baja es 46, este intervalo tiene una frecuencia de 0. El punto marcado 45 representa el intervalo a partir de 39.5 a 49.5. Hay tres puntuaciones en este intervalo. Hay 147 puntuaciones en el intervalo que rodea 85

Se puede discernir fácilmente la forma de la distribución de la Figura 1. La mayoría de las puntuaciones son entre 65 y 115. Es evidente que la distribución no es simétrica en la medida en buenas puntuaciones (a la derecha) se apagara más gradual que puntajes pobres (a la izquierda).

ejemplo

Figura 1. polígono de frecuencia para los resultados de las pruebas de la psicología.

 

Un polígono de frecuencia acumulada para los mismos resultados de las pruebas se muestra en la Figura 2. El gráfico es el mismo que antes, excepto que el valor de Y para cada punto es el número de estudiantes en el intervalo de clase correspondiente, además de todos los números en intervalos inferiores. Por ejemplo, no hay resultados en el intervalo de la etiqueta "35", tres en el intervalo de "45", y 10 en el intervalo "55." Por lo tanto, el valor de Y que corresponde a "55" es 13. Desde 642 estudiantes tomaron la prueba, la frecuencia acumulada durante el último intervalo es 642.

ejemplo

Figura 2. Polígono de frecuencias acumulativas para los resultados de las pruebas de la psicología.

 

Polígonos de frecuencia son útiles para comparar distribuciones. Esto se logra mediante la superposición de los polígonos de frecuencia extraídas para diferentes conjuntos de datos. La Figura 3 proporciona un ejemplo. Los datos provienen de una tarea en la que el objetivo es mover un cursor de ordenador a un blanco en la pantalla lo más rápido posible. En 20 de los ensayos, el objetivo era un pequeño rectángulo; en el otro 20, el objetivo era un rectángulo grande. El tiempo para alcanzar el objetivo se ha grabado en cada ensayo. Las dos distribuciones (uno para cada objetivo) se representan juntos en la Figura 3. La figura muestra que, aunque existe un cierto solapamiento en los tiempos, por lo general tomó más tiempo para mover el cursor a la diana pequeña que a la grande.

ejemplo

Figura 3, polígonos de frecuencia superpuestos.

 

También es posible trazar dos distribuciones de frecuencias acumuladas en el mismo gráfico. Esto se ilustra en la Figura 4 utilizando los mismos datos de la tarea cursor. La diferencia en las distribuciones de los dos objetivos es de nuevo evidente.

ejemplo

Figura 4. Polígonos de frecuencia acumulada superpuestos.



Información

Técnica

Fecha de Modificación03/03/2016
IdiomaEspañol (ES)
Autoreducarchile
Fuenteeducarchile
Clasificación Curricular
NivelSectorUnidad o eje
4° medioMatemáticaGeometría
4° medioMatemáticaEstadística y Probabilidad

Queremos tu

Opinión