Cuando vemos en acción a la máquina de Galton, lo primero que pensamos es que el inventor, estadístico y antropólogo tuvo suerte al no vivir en la Edad Media. El simple hecho de que todas las bolitas caen siguiendo una curva cada vez que se gira el aparato casi parece un acto de hechicería, pero en realidad es puro teorema del límite central. Sin embargo, eso no es todo: La máquina se vuelve aún más interesante al colocar sobre ella una copia del triángulo de Pascal, ya que de esa combinación surgen algunos recursos muy útiles.
Giramos, y se forma una curva. Otro giro, y una curva de nuevo. No importa cuántas veces lo intentemos, el resultado es (más o menos) el mismo: Miles de bolitas creando una curva en el fondo. La Máquina de Galton, diseñada por Sir Francis Galton, sirve como demostración de la distribución normal, y el teorema del límite central.
En términos muy muy relajados, ese teorema establece que cuando un número muy grande de muestras son tomadas de una población, la distribución del promedio de las muestras se acercará a una distribución normal. Es sin dudas uno de los conceptos más profundos y esenciales en el mundo de las estadísticas… y derrite cerebros con facilidad. Pero volvamos la máquina.
El tablero de Galton
Los postes de la máquina de Galton están posicionados como una pirámide. Cuando una bolita pega en el poste, tiene un 50 por ciento de probabilidades de ir hacia la izquierda o hacia la derecha. Al pasar a la segunda fila de postes, ese proceso se repite, conservando el 50 por ciento.
A través de un amplio número de intentos, el resultado esperado es que aquellas bolitas con una cantidad muy similar de movimientos a la izquierda y a la derecha sean las más comunes. En otras palabras, el número de bolitas en el centro será mayor.
La probabilidad de que una bolita caiga en una de las ranuras en la parte inferior sigue el concepto de distribución binomial, pero con la intervención del antes mencionado teorema, la distribución binomial se aproxima a una distribución normal.
La máquina de Galton gana una capa extra de complejidad al colocar una representación del triángulo de Pascal sobre los postes. En esencia, el número de cada celda en el triángulo nos dice la cantidad de caminos que una bolita puede tomar para llegar a ese poste.
Los números del triángulo son más grandes en el centro, o sea, una mayor cantidad de rutas disponibles para las bolitas. Mira esta copia del triángulo, y la celda del fondo, en el centro. Una bolita tiene 12.870 opciones para golpear allí.