LEMNISCATA
Matemàtiques, física, química…
L’aproximació de la distribució binomial per una distribució normal és una tècnica comuna en estadística, especialment quan el nombre d’observacions és gran. Aquesta aproximació es basa en el teorema central de límits i permet substituir la distribució binomial discreta per una distribució normal contínua, facilitant així el càlcul de probabilitats i altres estadístiques. A continuació, es presenta un desenvolupament més detallat i rigorós.### 1. **Definició de la distribució binomial**La distribució binomial \( B(n, p) \) modela el nombre d’èxits en **n** proves independents, on la probabilitat d’èxit en cada prova és **p** i la probabilitat de fracàs és **1 – p**. La funció de probabilitat de la distribució binomial és:\[P(X = k) = \binom{n}{k} p^k (1 – p)^{n – k}, \quad k = 0, 1, 2, \dots, n\]on **\( \binom{n}{k} \)** és el coeficient binomial i \( X \sim B(n, p) \).La **mitjana** (\( \mu \)) i la **desviació estàndard** (\( \sigma \)) de la distribució binomial són:- **Mitjana**: \( \mu = n \cdot p \)- **Desviació estàndard**: \( \sigma = \sqrt{n \cdot p \cdot (1 – p)} \)### 2. **Teorema central de límits**El teorema central de límits afirma que, per a una gran quantitat de proves \( n \), la suma de variables aleatòries independents i idèntiques (com les que es modelen amb una distribució binomial) tendeix a seguir una distribució normal, independentment de la distribució original de les variables. Així, quan **n** és gran, la distribució binomial es pot aproximar per una distribució normal.### 3. **Condicions per a l’aproximació normal**Perquè l’aproximació sigui adequada, cal que es compleixin les següents condicions:1. **n gran**: Quan el nombre de proves \( n \) és gran, la distribució binomial es pot aproximar per una distribució normal. Això es deu al fet que la distribució binomial és simètrica quan **n** és gran i \( p \) no és massa petit ni massa gran (per exemple, \( p \) ha de ser diferent de 0 o 1).2. Els productes \( n \cdot p \) i \( n \cdot (1 – p) \) han de ser grans (normalment, es requereix que siguin majors que 5). Això assegura que la distribució binomial no sigui massa asimètrica ni esquinçada, i que tingui una forma aproximadament simètrica que pugui ser ben modelada per una normal.### 4. **Aproximació normal de la distribució binomial**Quan es compleixen les condicions anteriors, podem aproximar la distribució binomial \( B(n, p) \) per una distribució normal \( N(\mu, \sigma^2) \), on:- **Mitjana** \( \mu = n \cdot p \)- **Desviació estàndard** \( \sigma = \sqrt{n \cdot p \cdot (1 – p)} \)Aquesta aproximació normal s’escriu com:\[X \sim N(n \cdot p, n \cdot p \cdot (1 – p))\]### 5. **Corregir l’error de continuïtat**L’aproximació normal és contínua, mentre que la distribució binomial és discreta. Això pot causar un petit error en l’aproximació, especialment per als valors de \( k \) propers als límits de l’interval. Per corregir aquest error, s’aplica una **correcció de continuïtat**, que consisteix a ajustar el valor de \( k \) per tenir en compte el salt de la distribució discreta a la contínua. Així, en lloc de calcular directament la probabilitat \( P(X = k) \) per una distribució binomial, es calcula la probabilitat en l’interval \( [k – 0.5, k + 0.5] \) utilitzant la distribució normal. Aquesta correcció millora la precisió de l’aproximació.Per exemple, per calcular \( P(X = k) \), es fa el següent:\[P(X = k) \approx P\left( k – 0.5 \leq Z \leq k + 0.5 \right)\]on **Z** és una variable aleatòria amb distribució normal \( N(n \cdot p, n \cdot p \cdot (1 – p)) \).### 6. **Càlcul de probabilitats amb l’aproximació normal**Suposem que tenim una distribució binomial amb paràmetres **n** i **p**, i volem calcular la probabilitat \( P(X \leq k) \), on **X** segueix una distribució binomial. Seguint l’aproximació normal, podem utilitzar la distribució normal \( N(n \cdot p, n \cdot p \cdot (1 – p)) \) per calcular la probabilitat. Per a això, utilitzarem el **procediment de normalització**, que consisteix a convertir la variable aleatòria binomial en una variable aleatòria normal estàndard.La normalització es fa mitjançant la fórmula:\[Z = \frac{X – \mu}{\sigma}\]on **Z** segueix una distribució normal estàndard \( N(0, 1) \).Per exemple, per calcular la probabilitat \( P(X \leq k) \), primer normalitzem:\[P(X \leq k) \approx P\left( Z \leq \frac{k – n \cdot p}{\sqrt{n \cdot p \cdot (1 – p)}} \right)\]on la probabilitat es calcula utilitzant taules de la distribució normal estàndard.### 7. **Exemple numèric**Suposem que tenim una distribució binomial amb \( n = 100 \) i \( p = 0.4 \). Volem calcular la probabilitat \( P(X \leq 40) \).1. **Mitjana**: \( \mu = n \cdot p = 100 \cdot 0.4 = 40 \)2. **Desviació estàndard**: \( \sigma = \sqrt{100 \cdot 0.4 \cdot 0.6} = \sqrt{24} \approx 4.9 \)Aproximant per la normal, tenim \( X \sim N(40, 24) \). Ara, utilitzant la normalització, calculem el valor de \( Z \) per \( X = 40 \):\[Z = \frac{40 – 40}{4.9} = 0\]La probabilitat associada a \( Z = 0 \) en una distribució normal estàndard és \( P(Z \leq 0) = 0.5 \). Així, \( P(X \leq 40) \approx 0.5 \).### ConclusióL’aproximació de la distribució binomial per una distribució normal és una tècnica valuosa quan el nombre de proves és gran i les condicions adequades es compleixen. Aquesta aproximació facilita el càlcul de probabilitats i altres estadístiques, especialment quan la distribució binomial és difícil de manejar directament. Amb l’aplicació de la correcció de continuïtat i la normalització, es poden obtenir resultats força precisos, fins i tot per valors de \( k \) relativament petits.