La distanza di Mahalanobis [23] permette di ottenere una misura di una osservazione normalizzato rispetto alla varianza della stessa.
La distanza di un vettore
rispetto a una distribuzione di valor medio
e matrice di covarianza
è definita come
| (2.20) |
| (2.21) |
Quando la matrice di covarianza è diagonale si ottiene la distanza euclidea normalizzata, mentre se la matrice di covarianza fosse esattamente la matrice identità (ovvero le due distribuzioni fossero incorrelate) la formulazione sopra si riconduce alla distanza euclidea.
La distanza di Mahalanobis permette di misurare distanze su campioni di cui non si conosce effettivamente le unità di misura, assegnando di fatto un fattore di scala automatico ai dati.
Paolo Medici 2012-02-08