La prueba Chi-cuadrado (χ2) es una técnica estadística utilizada para determinar si hay una diferencia significativa entre las frecuencias observadas y las frecuencias esperadas en una o más categorías de un conjunto de datos.
Es ampliamente utilizada en la investigación para probar hipótesis sobre relaciones entre variables categóricas y en el contexto de lo s testA/B para evaluar la efectividad de diferentes intervenciones o cambios.
Fundamentos de la Prueba Chi-cuadrado.
1. Tipo de Datos:
La prueba Chi-cuadrado se aplica a datos categóricos.
Esto significa que se utiliza para datos que se pueden contar y dividir en categorías, como (sí/no), (hombre/mujer), (rojo/azul/verde), etc.
2. Hipótesis:
– Hipótesis Nula (H0): No hay diferencia significativa entre las frecuencias observadas y las esperadas. Las variables son independientes.
– Hipótesis Alternativa (Ha): Hay una diferencia significativa entre las frecuencias observadas y las esperadas. Las variables no son independientes.
3. Cálculo:
– La fórmula para calcular el valor Chi-cuadrado es:
χ2=∑(Ei(Oi−Ei)2)
donde (Oi) es el valor observado para la categoría i, (Ei) es el valor esperado para la categoría i, y la suma se realiza sobre todas las categorías.
4. Valores Esperados:
– Los valores esperados se calculan bajo la suposición de que la hipótesis nula es cierta.
En un test A/B, por ejemplo, si no hubiera diferencia en la efectividad de dos versiones de una página web, los valores esperados para las conversiones se distribuirían uniformemente de acuerdo con el número total de pruebas dividido entre las categorías.
5. Distribución Chi-cuadrado:
– El valor calculado de χ2 se compara con un valor crítico de la distribución Chi-cuadrado.
Esta distribución es usada para determinar el p-valor asociado con el valor calculado de Chi-cuadrado, que indica la probabilidad de observar una estadística tan extrema como la calculada, bajo la suposición de que la hipótesis nula es cierta.
6. Grados de Libertad:
– Los grados de libertad para la prueba Chi-cuadrado en el contexto de una tabla de contingencia (como en los tests A/B) se calculan como .
7. Uso en Test A/B:
– En un test A/B, la prueba Chi-cuadrado podría usarse para determinar si la diferencia en las tasas de conversión entre dos variantes de una página web es estadísticamente significativa, comparando las conversiones y no conversiones observadas en cada variante con las que serían esperadas si no hubiese diferencia entre las variantes.
Un Ejemplo Práctico para poder entenderlo de forma mas clara.
Supongamos que una empresa realiza un test A/B para evaluar dos variantes de una página web, A y B.
Después de una semana, la Variante A recibe 200 visitas con 40 conversiones, y la Variante B recibe 200 visitas con 30 conversiones.
Queremos saber si esta diferencia en la tasa de conversión es significativa. Las frecuencias observadas y esperadas se organizan en una tabla de contingencia y se aplica la fórmula de Chi-cuadrado para calcular el valor de χ2 y el p-valor correspondiente.
Este proceso proporciona una forma rigurosa y estadísticamente válida para tomar decisiones basadas en los datos recopilados, lo que puede guiar a la empresa sobre si implementar o no la Variante A en lugar de la B basado en la evidencia de una mejora en la tasa de conversión.