¿Qué es la estadística?

La estadística es la rama de las matemáticas dedicada a la recopilación, el análisis, la interpretación y la presentación de datos empíricos, y se divide, a su vez, en dos áreas: la estadística descriptiva y la estadística inferencial.

La estadística descriptiva se encarga de la descripción de datos (es decir, de información recogida a partir de un estudio). Por ejemplo, en un estudio demográfico sobre los nacidos en 2019 en España, la estadística descriptiva se encargaría de extraer los datos de la edad media de las madres. La estadística inferencial, en cambio, se ocupa de extrapolar los datos extraídos de un estudio realizado sobre una muestra del conjunto total de datos para así aplicarlos al conjunto completo, ya que en ocasiones la población total de la que extraer información es demasiado grande e inabarcable. Por lo tanto, la estadística inferencial realiza un análisis a partir de la generalización de las muestras que estudia, mientras que la descriptiva no lo hace.

Cada una de las características de los objetos de estudio (por ejemplo, el peso y la edad de la población) de denomina variable. Las variables pueden tener una naturaleza muy variada, por lo que se establecen diferentes maneras de medirlas para trabajar con ellas en un estudio estadístico. Los datos que recoge una variable pueden ser de los siguientes tipos:

Discretos. Los datos cuantitativos son discretos si se tratan de un número finito o un número contable infinito de valores.

Continuos. Son continuos si los datos se recogen en forma de intervalo

Nominales. Este tipo de datos son cualitativos, es decir, son categorías como “hombre/mujer”. En este caso, lo habitual es atribuir un número identificativo a cada uno de los valores representados.

Ordinales. Una escala ordinal de medida representa una serie ordenada de relaciones o una posición dentro de un rango. Por ejemplo, “en una escala del 1 al 10, el nivel de dolor es de 6”.

Intervalos. Se trata de datos en escalas que representan cantidades y que contienen unidades entre las que el cero también representa un punto de medida.

Ratios. Una medida en escala de ratio es similar a la de un intervalo, con la diferencia de que no existen valores por debajo del cero.

Una vez que los datos se han recopilado y clasificado, se hace un análisis exploratorio de los mismos. Para llevarlo a cabo se observa la distribución de los datos, que nos proporcionará claves básicas para un primer acercamiento al estudio, como la media, la mediana, los cuartiles, la varianza y la desviación típica.

La media mide el centro de la distribución de los datos, y se calcula sumando cada uno de los valores y dividiendo esta suma entre el número total de valores.

La mediana se sitúa en la mitad de los datos. Ordenándolos de mayor a menor o de menor a mayor, la mediana deja la misma cantidad de valores a un lado y a otro, con lo que se sitúa en el valor central de los datos. Si los datos son pares, la mediana se encuentra en el punto medio entre los dos valores centrales; si son impares, la mediana es el valor de la muestra central.

Los cuartiles dividen la distribución en cuatro partes iguales, de manera que se crean cuatro segmentos con el mismo número de muestras. Se pueden obtener calculando la mediana de las muestras menores que la mediana y la mediana de las muestras mayores que la mediana. La mediana es el segundo cuartil.

Los cinco números resumen de una distribución son: el mínimo, el cuartil 1 (Q1), la mediana, el cuartil 3 (Q3) y el máximo. De esta manera observamos el rango de los valores (mín. y máx.), su valor central (mediana) y su dispersión (Q1, Q3).

La varianza es una medida de dispersión que nos ayuda a estudiar la desviación de las muestras con respecto a la media.

Calculando la raíz cuadrada de la varianza obtenemos la desviación típica, que mide la dispersión de un modo análogo a los cuartiles.

En la estadística inferencial, los resultados de estos cálculos pueden no coincidir con los datos reales (la media muestral puede no coincidir con la media poblacional real). Para ello, se calculan intervalos de confianza y errores de estimación que probarán si los datos obtenidos son generalizables y extrapolables al total de la población.

Los mecanismos estadísticos, por su productividad para el análisis y la interpretación de datos, son empleados en una gran variedad de campos de estudio, desde la física o la ingeniería hasta la sociología, la economía o la psicología. Supone, sin duda, una herramienta fundamental para la ciencia a día de hoy.