Introducción
En estadística, es común querer probar si un conjunto de datos sigue una distribución normal. En Python, existen varias formas de realizar esta prueba. En este artículo, te mostraré cómo probar la normalidad en Python utilizando diferentes métodos.
Prueba de Shapiro-Wilk
Una de las pruebas más utilizadas para verificar la normalidad es la prueba de Shapiro-Wilk. Esta prueba devuelve dos valores: el estadístico de prueba y el valor p. Un valor p menor a 0.05 indica que los datos no siguen una distribución normal.
«`python
import scipy.stats as stats
data = [0.1, 0.2, 0.3, 0.4, 0.5]
stat, p = stats.shapiro(data)
print(f»Estadístico de prueba: {stat}, Valor p: {p}»)
if p > 0.05:
print(«Los datos siguen una distribución normal»)
else:
print(«Los datos no siguen una distribución normal»)
«`
Prueba de Kolmogorov-Smirnov
Otra prueba común es la prueba de Kolmogorov-Smirnov, que compara la distribución acumulada de los datos con una distribución normal teórica. Un valor p menor a 0.05 indica que los datos no siguen una distribución normal.
«`python
stat, p = stats.kstest(data, ‘norm’)
print(f»Estadístico de prueba: {stat}, Valor p: {p}»)
if p > 0.05:
print(«Los datos siguen una distribución normal»)
else:
print(«Los datos no siguen una distribución normal»)
«`
Conclusión
En este artículo, hemos visto cómo probar la normalidad en Python utilizando las pruebas de Shapiro-Wilk y Kolmogorov-Smirnov. Estas pruebas son útiles para verificar si un conjunto de datos sigue una distribución normal, lo cual es importante en muchos análisis estadísticos. Espero que esta información te sea útil en tus proyectos de programación en Python.