Uno dei problemi fondamentali nell'analisi di sistemi reali è quello del risolvere sistemi lineari sovradimensionati affetti da rumore.
L'importanza di questo argomento é evidente: quando si eseguono osservazioni di un sistema reale questo risulta normalmente affetto da rumore di osservazione (ed eventualmente di processo) ma allo stesso tempo è possibile raccogliere molti più dati che incognite ottenendo normalmente un sistema sovradimensionato. In questa situazione per ottenere una soluzione del problema e allo stesso tempo minimizzare l'errore è richiesto l'utilizzo di una regressione numerica, per esempio ai minimi quadrati.
Si abbia pertanto un sistema lineare sovradimensionato (overdetermined)
Definiamo, per esempio, come metrica di errore il modulo del residuo:
Trovare la soluzione ottima del sistema 1.1 nei sensi di una regresione ai minimi quadrati equivale a trovare il minimo di tale funzione errore al variare di
.
Va subito fatto notare che nel minimizzare 1.2 non si fa comunque nessuna ipotesi della distribuzione del rumore all'interno dei componenti. La soluzione ottenuta con questa minimizzazione è una soluzione algebrica che minimizza un errore algebrico (algebraic error).
Nel capitolo di statistica si affronterà il caso in cui si conosce come l'errore entra nel sistema.
Si può dimostare che una soluzione
, che minimizza la funzione 1.2, esiste e vale:
Per costruzione
è una soluzione del sistema 1.1 ed è anche il vettore che minimizza la funzione 1.2.
Viene indicata con
la matrice pseudoinversa (pseudoinverse matrix) di
e vale
Questa soluzione del sistema è detta pseudoinversa di Moore-Penrose.
La pseudoinversa ha le seguenti proprietà
È possibile cercare di migliorare la soluzione in presenza di rumore conosciuto in quanto è possibile assegnare alle equazioni del sistema pesi diversi e questi possono essere rappresentati in una matrice diagonale di precondizionamento della matrice
. Allo stesso modo visto che si minimizza la distanza euclidea della soluzione è possibile moltiplicare ogni riga del sistema per un opportuno peso in modo da pesare in maniera differente ogni dato acquisito.
In lettura è possibile trovare la risoluzione di sistemi sovradimensionati indicata anche come tecnica delle equazioni perpendicolari (normal equations):
La soluzione proposta in equazione 1.5 tuttavia è numericamente instabile in quanto
cond
.
Dettagli ulteriori sul condizionamento delle matrici e sulla propagazione dei disturbi nella soluzione dei sistemi lineari ben dimensionati o sovradimensionati saranno presentati in sezione 2.7.
Se il sistema è ben condizionato, la tecnica più stabile per risolvere un problema alle normal equations è la fattorizzazione di Cholesky.
Esistono invece delle tecniche stabili che permettono di ricavare la soluzione partendo direttamente dalla matrice
.
La matrice pseudoinversa si può ottenere, oltre che eseguendo il procedimento mostrato nell'equazione 1.4, anche utilizzando la Singular Value Decomposition (SVD) o la fattorizzazione QR.
Per quanto riguarda la fattorizzazione QR della matrice
il problema originale 1.1 si trasforma in
e la soluzione si può ricavare da
.
Attraverso invece la decomposizione ai valori singolari, la matrice sovradimensionata
viene scomposta in diverse altre matrici con proprietà molto interessanti.
Sia
la decomposizione ai valori singolari (SVD) di
.
è una matrice unitaria di dimensioni
(a seconda del formalismo usato, complete SVD o economic SVD, le dimensioni delle matrici possono cambiare, e
diventare
),
è una matrice diagonale che contiene i valori singolari (gli autovalori della matrice psudoinversa di dimensioni, a seconda del formalismo ,
o
) e
è una matrice ortonormale, trasposta coniugata, di dimensioni
.
Attraverso un procedimento puramente matematico si ottiene che la pseudoinversa di
equivale a
dove la pseudoinversa di una matrice diagonale
equivale alla sua inversa ovvero una matrice diagonale costituita dai reciproci dei rispettivi valori.
Dalla SVD si ottiene immediatamente la soluzione
Attraverso la decomposizione SVD è anche possibile trovare lo spazio delle soluzioni di un sistema omogeneo sovradimensionato. Un sistema lineare omogeneo ha la forma
| (1.7) |
| (1.8) |
Gli autovalori nulli della matrice
rappresentano pertanto il kernel della matrice stessa.
Il numero di autovalori nulli rappresenta la dimensione del kernel stesso.
Va notato come nell'equazione 1.6 la presenza di zeri nella matrice
fosse problematica ma tale presenza è comunque sintomo del fatto che una delle componenti del problema è totalmente uncorrelata con la soluzione e, in quanto tale, può essere trascurata (tale risultato sarà utilizzato in seguito nella trattazione della PCA).
La decomposizione SVD risulta una delle tecniche più stabili e versatili sviluppata negli ultimi anni per la risoluzione di sistemi lineari e di fatto in tutto questo libro si farà larghissimo uso di tale tecnologia.
Dettagli ulteriori sulla pseudoinversa di Moore-Penrose possono essere trovati in molti libri, per esempio in [5] o nel testo fondamentale di calcolo numerico [12].
Paolo Medici 2012-02-08