next up previous index
Next: Gaussiana campionata Up: Elementi di Statistica Previous: Media e Varianza   Indice analitico


La distribuzione Gaussiana

Figura 2.1: Distribuzione gaussiana
Image fig_gaussian

La distribuzione Gaussiana è una delle distribuzioni di probabilità più diffuse nei problemi pratici in quanto modella correttamente la maggior parte degli eventi reali. In questo documento in particolare è usata nei filtri (sezione 2.10) e nei classificatori Bayesiani (sezione 4.2), in LDA (sezione 4.4).

Definizione 3   La distribuzione gaussiana standard che si indica con il simbolo $ \mathcal{N}(0;1)$ , è quella di densità

$\displaystyle p(x) = \frac{1}{\sqrt{2\pi}} e ^ { \left( - \dfrac{1}{2}x^{2} \right) }$ (2.14)

Definizione 4   La distribuzione gaussiana generale $ \mathcal{N}(\mu;\sigma^{2})$ , con $ \mu,\sigma \in \mathbb{R}, \sigma^{2} \geqslant 0$ , è quella che si ottiene dalla distribuzione standard con la trasformazione $ x \mapsto \sigma x + \mu$ .

Nel caso univariabile (gaussiana univariata) la gaussiana ha la seguente funzione di distribuzione:

$\displaystyle p(x) = \frac{1}{\sigma \sqrt{2 \pi} } e^{ -\dfrac{1}{2} \left( \dfrac{x - \mu}{ \sigma } \right)^2}$ (2.15)

dove $ \mu$ è il valor medio e $ \sigma^2$ è la varianza. All'interno di $ \pm \sigma$ da $ \mu$ si concentra il 68% della probabilità, in $ \pm 2 \sigma$ il 95% e in $ \pm 3 \sigma$ il 99.7%.

La distribuzione gaussiana multivariabile (gaussiana multidimensionale) è data da un vettore $ \boldsymbol\mu$ di dimensione $ n$ , rappresentante il valor medio delle varie componenti, e da una matrice di covarianza $ \boldsymbol\Sigma$ di dimensioni $ n \times n$ :

$\displaystyle p(\mathbf{x}) = \frac{1}{ (2 \pi)^{\frac{n}{2}} \sqrt{\vert\bolds...
...} - \boldsymbol\mu)^{\top} \boldsymbol\Sigma^{-1} (\mathbf{x}-\boldsymbol\mu) }$ (2.16)

distribuzione normale di valor medio $ \boldsymbol\mu = \left[ \mu_1, \mu_2, \dots \mu_n \right]^{T}$ e covarianza $ \boldsymbol\Sigma = \begin{bmatrix}
\sigma_{11} & \cdots & \sigma_{1n} \\
\vdots & \ddots & \vdots \\
\sigma_{n1} & \cdots & \sigma_{nn} \\
\end{bmatrix}$ .

Si può anticipare che la quantità a esponente dell'equazione (2.16) è la distanza di Mahalanobis (sezione 2.4) tra $ \mathbf {x}$ e $ \boldsymbol\mu$ .

Quando le variabili aleatorie sono tra loro indipendenti e di varianza uguale, la matrice $ \boldsymbol\Sigma$ è una matrice diagonale con valori tutti uguali a $ \sigma^{2}$ e la distribuzione di probabilità normale multivariata si riduce a

$\displaystyle p(\mathbf{x}) = \frac{1}{ (2 \pi \sigma^{2} )^{n/2} } e^{ - \dfrac{ \vert \mathbf{x} - \boldsymbol\mu\vert^2}{2 \sigma^{2}} }$ (2.17)



Subsections
next up previous index
Next: Gaussiana campionata Up: Elementi di Statistica Previous: Media e Varianza   Indice analitico
Paolo Medici 2014-10-15