Saltar al contenido

Tipos de Distribución de Datos

¿Qué es una distribución de datos?
Te presento a Mia. Como parte de un curso de investigación universitaria, recopiló y organizó información sobre los estudiantes en el campus. Estaba tan orgullosa de la cantidad de información que recogió que Mia no podía esperar para compartirla con su profesor! Pero primero, tenía que organizar los datos de una manera útil y concisa. Para ello, Mia creó una distribución de datos.

Las distribuciones de datos se utilizan a menudo en las estadísticas. Son métodos gráficos para organizar y mostrar información útil. Existen varios tipos de distribuciones de datos. En esta lección, nos enfocaremos en gráficas de puntos, histogramas, gráficas de cajas y gráficas de conteo.

Parcelas de puntos
Los gráficos de puntos muestran valores numéricos trazados en una escala. Cada punto representa un valor en el conjunto de datos. En el siguiente ejemplo, las calificaciones del servicio de atención al cliente van de 0 a 9. Los puntos nos dicen la frecuencia, o tasa de ocurrencia, de los clientes que dieron cada calificación. Si se observa la calificación de 5, se puede ver que tres clientes dieron esa calificación, y si se observa una puntuación de 9, ocho clientes dieron esa calificación. También podemos ver que las calificaciones fueron proporcionadas por cincuenta clientes, un punto por cada cliente.

Ejemplo de un gráfico de puntos
datos1
Ahora imagínese que las calificaciones fueron proporcionadas por quinientos clientes. No sería práctico ni útil tener una distribución de quinientos puntos. Por esta razón, los gráficos de puntos se utilizan para datos que tienen un número relativamente pequeño de valores.

Histogramas
Los histogramas muestran los datos en rangos, con cada barra representando un rango de valores numéricos. La altura de la barra le indica la frecuencia de los valores que caen dentro de ese rango. En el ejemplo de abajo, la primera barra representa cerezos negros de entre 60 y 65 pies de altura. La barra sube hasta tres, así que hay tres árboles que están entre 60 y 65 pies.

Ejemplo de un histograma
datos2
Los histogramas son una excelente manera de mostrar grandes cantidades de datos. Si tiene un conjunto de datos que incluye miles de valores, puede simplemente ajustar el intervalo de frecuencia para acomodar una escala mayor, en lugar de sólo 0-10.

Parcela de buzones
Los gráficos de caja son representaciones rectangulares de datos. No dan la frecuencia de los valores, pero proporcionan otra información útil sobre un conjunto de datos. Debido a las marcas utilizadas, las parcelas en cajas se denominan a menudo parcelas en cajas y bigotes. Leer este tipo de representación de datos es fácil. La parte de la caja representa el 50% medio de los datos. La línea vertical del recuadro es la mediana o el valor medio del conjunto de datos. Los bigotes izquierdo y derecho que se extienden desde la caja representan el 25% inferior y superior de los datos, respectivamente.

En el siguiente ejemplo, la línea verde nos dice que el 25% de los estados de EE.UU. tienen entre 0 y 100,000 millas cuadradas de área. La línea roja representa el 25% de los estados de EE.UU. que tienen una superficie de aproximadamente 220.000 a 1.550.000 millas cuadradas. El cuadro muestra que el 50% medio está entre 100.000 y 220.000 millas cuadradas, con un valor medio de aproximadamente 150.000 millas cuadradas.

Ejemplo de un diagrama de caja
datos3
Mientras que los gráficos de caja proporcionan información estadística útil sobre un conjunto de datos, no proporcionan el número o la frecuencia de valores como lo hacen los histogramas o los gráficos de puntos.

Gráficos de recuento
Una tabla de recuento consiste en una tabla con marcas de recuento que muestran la frecuencia de ocurrencias en cada categoría. Se marca una línea para cada incidencia. Cada quinta línea se marca a través de las cuatro anteriores para designar un grupo de cinco marcas. Esto resulta útil al contar las marcas en cada categoría. En la tabla de recuento de abajo, los datos muestran la frecuencia de los problemas de pintura. Al contar el número de marcas de recuento, podemos ver que hubo trece ocurrencias de desprendimiento de pintura, tres ocurrencias de burbujas, etc.

Ejemplo de un gráfico de recuento
datos4
Los gráficos de recuento son una forma conveniente de organizar los datos a medida que se recopilan y se pueden utilizar para cualquier tipo de datos. Sin embargo, no sería útil para recopilar y organizar grandes cantidades de datos