Valutazione del modello

Indipendentemente dalla tecnica scelta per rimuovere gli outlier rimangono come importanti questioni aperte sia quella di dare un giudizio su quanto è buono il modello ottenuto e allo stesso tempo capire quanto potrebbe essere questa stima distante dal modello vero, a causa degli errori sui dati in ingresso.

In questa sezione viene trattato ampiamente il caso non-lineare: il caso lineare è equivalente usando al posto dello jacobiano $ \mathbf{J}$ la matrice dei parametri $ \mathbf{X}$.

Uno stimatore intuitivo della bontà del modello è il root-mean-squared residual error (RMSE) o standard error of the regression:

$\displaystyle s = \sqrt{ \frac{ \sum^{n}_{i=1} \Vert \mathbf{y}_i - \hat{\mathbf{y}}_i \Vert^{2} } {n} } = \sqrt{\frac{S}{n}}$ (3.13)

con $ \hat{\mathbf{y}}_i = f(\mathbf{x}_i, \hat{\boldsymbol\beta} )$ punto stimato grazie al modello $ f$ da cui sono stati ricavati i parametri $ \hat{\boldsymbol\beta}$.

Questo tuttavia non è un indice della bontà della soluzione, ma solo come la trasformazione combacia con i dati in ingresso (si pensi che il residuo dell'omografia tra 4 punti è sempre zero, indipendentemente dalla quantità di rumore che agisce sui singoli punti).

La propagazione in avanti della covarianza (covariance forward propagation) è stata già mostrata nella sezione 2.6 e, ricordando, esistono 3 metodi per eseguire tale operazione. Il primo è basato sulla approssimazione lineare del modello e coinvolge l'uso dello Jacobiano, il secondo è basato sulla più generica tecnica della simulazione Monte Carlo, e infine una via moderna alternativa, media tra le prime due, è la Unscent Transformation (sezione 2.9.5) che permette stime fino al terzo ordine in caso di rumore gaussiano.

In questo caso il problema è all'opposto quello di valutare la propagazione all'indietro della varianza (backward propagation), ovvero capire la bontà dei parametri stimati data la covarianza del rumore stimata (Covariance Matrix Estimation). Attraverso la matrice di covarianza è possibile definire un intervallo di confidenza di $ \boldsymbol\beta$.

Tale bontà della stima dei parametri $ \hat{\boldsymbol\beta}$, nel caso non-lineare, può essere valutata in prima approssimazione attraverso la versione linearizzata del modello (ma anche in questo caso tecniche come la Montecarlo o la UT possono essere utilizzate per stime più rigorose).

È possibile individuare la matrice di covarianza associata alla soluzione proposta $ \hat{\boldsymbol\beta}$ nel caso in cui la funzione $ f$ sia biunivoca nell'intorno di tale soluzione. Se è possibile stimare il valor medio $ \bar{\mathbf{y}} = f(\hat{\boldsymbol\beta})$ e la matrice di covarianza $ \boldsymbol\Sigma_y$ allora la trasformazione inversa $ f^{-1}$ avrà valor medio $ \hat{\boldsymbol\beta}$ e covarianza

$\displaystyle \Sigma_{\boldsymbol\beta} = (\mathbf{J}^{\top} \Sigma_y^{-1} \mathbf{J})^{-1}$ (3.14)

con $ \mathbf{J}(\hat{\boldsymbol\beta})$ jacobiano del modello $ f$ calcolato nel punto $ \hat{\boldsymbol\beta}$:

$\displaystyle J_{ij} = \frac{\partial f}{\partial \beta_j } (\mathbf{x}_i, \hat{\boldsymbol\beta})$ (3.15)

Lo stimatore di covarianza di Eicker-White è leggermente differente.

Nel caso semplice in cui il rumore sulle uscite di $ f$ sia indipendente di varianza costante (homoskedasticity), la matrice di covarianza stimata asintoticamente (Asymptotic Covariance Matrix) si può scrivere in maniera più semplice con

$\displaystyle \Sigma_{\boldsymbol\beta} = ( \mathbf{J}^{\top}\mathbf{J})^{-1} \sigma^{2}$ (3.16)

con $ \sigma^2$, varianza del rumore di osservazione. Normalmente si pone $ \sigma = s$ calcolata empiricamente attraverso

$\displaystyle \sigma^{2} \approx \frac{S}{n-m}$ (3.17)

usando le statistiche a posteriori dell'errore sui dati $ r_i$. Il denominatore $ n-m$ rappresenta i gradi di libertà statistici del problema: in questo modo la varianza stimata è infinita quando il numero di incognite del modello equivale al numero di dati raccolti.

La trasformazione $ f$ potrebbe essere sovradeterminata: il rango dello jacobiano $ d$, con $ d<n$, è chiamato numero dei parametri essenziali (essential parameters). In caso di trasformazione $ f$ sovradeterminata la formula 3.14 non è invertibile, ma è possibile dimostrare che la migliore approssimazione della matrice di covarianza può essere ottenuta attraverso l'uso della pseudo-inversa:

$\displaystyle \Sigma_{\boldsymbol\beta} = (\mathbf{J}^{\top} \Sigma_y^{-1} \mathbf{J})^{+}
$

Alternativamente è possibile eseguire una decomposizione QR con Pivot dello jacobiano, individuare le colonne linearmente dipendenti (attraverso l'analisi della diagonale della matrice R) e rimuoverle durante l'inversione stessa della matrice.

Paolo Medici 2012-02-08