La distribuzione Gaussiana

Figura 2.1: Distribuzione gaussiana
Image fig_gaussian

La distribuzione Gaussiana è una delle distribuzioni di probabilità più diffuse nei problemi pratici in quanto modella buona parte della distribuzione di probabilità in eventi reali. In questo documento in particolare è usata nei filtri (sezione 2.12) e nei classificatori Bayesiani (sezione 4.2), in LDA (sezione 4.3).

Definizione 6   La distribuzione gaussiana standard che si indica con il simbolo $\mathcal{N}(0;1)$, è quella di densità
\begin{displaymath}
p(x) = \frac{1}{\sqrt{2\pi}} e ^ { \left( - \dfrac{1}{2}x^{2} \right) }
\end{displaymath} (2.14)

Definizione 7   La distribuzione gaussiana generale $\mathcal{N}(\mu;\sigma^{2})$, con $\mu,\sigma \in \mathbb{R}, \sigma^{2} \geqslant 0$, è quella che si ottiene dalla distribuzione standard con la trasformazione $x \mapsto \sigma x + \mu$.

Nel caso univariabile (gaussiana univariata) la gaussiana ha la seguente funzione di distribuzione:

\begin{displaymath}
p(x) = \frac{1}{\sigma \sqrt{2 \pi} } e^{ -\dfrac{1}{2} \left( \dfrac{x - \mu}{ \sigma } \right)^2}
\end{displaymath} (2.15)

dove $\mu$ è il valor medio e $\sigma^2$ è la varianza. All'interno di $\pm \sigma$ da $\mu$ si concentra il 68% della probabilità, in $\pm 2 \sigma$ il 95% e in $\pm 3 \sigma$ il 99.7%.

La distribuzione gaussiana multivariabile (gaussiana multidimensionale) è data da un vettore $\boldsymbol\mu$ di dimensione $n$, rappresentante il valor medio delle varie componenti, e da una matrice di covarianza $\boldsymbol\Sigma$ di dimensioni $n \times n$:

\begin{displaymath}
p(\mathbf{x}) = \frac{1}{ (2 \pi)^{\frac{n}{2}} \sqrt{\vert\...
...)^{\top} \boldsymbol\Sigma^{-1} (\mathbf{x}-\boldsymbol\mu) }
\end{displaymath} (2.16)

distribuzione normale di valor medio $\boldsymbol\mu = \left[ \mu_1, \mu_2, \dots \mu_n \right]^{T}$ e covarianza $\boldsymbol\Sigma = \begin{bmatrix}
\sigma_{11} & \cdots & \sigma_{1n} \\
\vdots & \ddots & \vdots \\
\sigma_{n1} & \cdots & \sigma_{nn} \\
\end{bmatrix}$.

Si può anticipare che la quantità a esponente dell'equazione (2.16) è la distanza di Mahalanobis (sezione 2.4) tra $\mathbf {x}$ e $\boldsymbol\mu$.

Quando le variabili aleatorie sono tra loro indipendenti e di varianza uguale, la matrice $\boldsymbol\Sigma$ è una matrice diagonale con valori tutti uguali a $\sigma^{2}$ e la distribuzione di probabilità normale multivariata si riduce a

\begin{displaymath}
p(\mathbf{x}) = \frac{1}{ (2 \pi \sigma^{2} )^{n/2} } e^{ - ...
...ac{ \vert \mathbf{x} - \boldsymbol\mu\vert^2}{2 \sigma^{2}} }
\end{displaymath} (2.17)



Subsections
Paolo medici
2025-10-02