Studio e Analisi di Modelli

Uno dei problemi più diffusi all'interno della visione artificiale è quello di far adattare un insieme di misure affette da rumore (generalmente i pixel di un'immagine) a un modello predefinito.

Oltre alla presenza di rumore, che potrebbe essere sia gaussiano bianco ma anche con qualunque distribuzione statistica, c'è da considerare il problema dell'eventuale presenza di outlier, termine utilizzato in statistica per indicare dati troppo distanti dal modello per farne effetivamente parte.

In questo capitolo vengono presentate sia tecniche volte a ricavare i parametri $ \boldsymbol\beta$ del modello da un insieme di punti affetti da rumore (attraverso diverse tecniche di regressione) sia tecniche per individuare e rimuovere gli outlier dai dati in ingresso.

Nel capitolo successivo verranno presentate invece tecniche di regressione più legate al tema della classificazione.

Per stimare i parametri di un modello alcune tecniche presenti in letteratura sono le seguenti:

Least Squares Fitting
Se i dati sono tutti inliers, non ci sono outliers e l'unico disturbo è rumore, la regressione ai minimi quadrati è la tecnica ottima (sezione 3.1);
M-Estimator
La presenza anche di pochi outlier sposta di molto il modello in quanto gli errori vengono pesati al quadrato [16]: pesare in maniera non quadratica i punti lontani del modello stimato produce miglioramenti nella stima stessa (sezione 3.5);
IRLS
iteratively reweighted least squares viene usata quando gli outliers sono molto distanti dal modello e in bassa quantità: in questa condizione si può eseguire una regressione iterativa, dove a ogni ciclo i punti con errore troppo elevato vengono rimossi (ILS) o pesati in maniera differente (IRLS);
Hough
Se i dati in ingresso sono sia affetti da errore, da molti outliers, e magari distribuzioni multi modali ma il modello è comunque formato da pochi parametri, la trasformata di Hough [15] permette di ottenere il modello più diffuso dal punto di vista statistico (sezione 3.6);
RANSAC
Se gli outliers sono comparabili con gli inliers e il rumore è molto basso (rispetto alla posizione degli outliers), il RANdom SAmpling and Consensus [9] permette di ottenere il miglior modello presente sulla scena (sezione 3.7);
LMedS
Il Least Median of Squares è un algoritmo, simile a RANSAC, che ordina i punti in base alla distanza del modello generato casualmente e sceglie fra tutti il modello con mediana dell'errore minore [26] (sezione 3.7.2);
Kalman
È possibile infine usare un filtro di kalman per ricavare i parametri di un modello (vedi 2.9.6) quando tale informazione è richiesta a run-time.

A parte RANSAC e la Trasformata di Hough, le altre tecniche non permettono di gestire ottimamente il caso in cui nella misura siano presenti due o più distribuzioni che contemporaneamente si avvicinano al modello.

Nulla impedisce di usare tecniche miste, per esempio un Hough abbastanza grossolano (pertanto veloce) per rimuovere gli outliers e successivamente una regressione ai minimi quadrati per avere un valore più preciso.



Subsections
Paolo Medici 2012-02-08