Quando si analizzano immagini risulta necessario passare da un sistema di riferimento solidale con la camera, dove il punto
coincide con il fuoco (pin-hole) del sistema, a un sistema di riferimento più generico, che meglio si adatta alle esigenze dell'utilizzatore, dove la camera è posizionata in un punto del mondo e orientata rispetto ad esso in modo arbitrario.
Allo stesso modo risulta comodo usare un sistema cartesiano dove l'asse
rappresenta l'altezza del punto dal suolo piuttosto che la distanza dal pin-hole come in coordinante camera.
Per arrivare all'equazione definitiva della pin-hole camera si parte dall'equazione 6.4 da cui si considera che il pin-hole non sia nel punto
ma in un
generico punto
espresso in coordinate mondo,
che la camera possa essere ruotata in maniera arbitraria e non coincidere con gli assi del sistema e
infine si siano cambiati di segno e di orientazione gli assi.
Il cambiamento degli assi è dettata dalle esigenze delle coordinate omogenee per cui, in coordinate camera, la coordinata
deve rappresentare la distanza dal pin-hole (la quantità da dividere nella proiezione prospettica) mentre, in coordinate mondo ISO 8855, la coordinata
rappresenta invece l'altezza
6.1.
Sia
un punto in coordinate mondo, e
il medesimo punto nelle coordinate camera.
La relazione che lega questi due punti si può scrivere come
Va ricordato che le matrici di rotazione hanno determinante 1, conservano distanze e aree, e l'inversa di una matrice di rotazione è la sua trasposta.
La matrice
e il vettore
possono venire accorpati in forma di matrice
(sfruttando l'omogeneità delle coordinate).
Grazie a questa rappresentazione, è possibile scrivere in maniera estremamente compatta la proiezione di un punto in coordinate mondo
in coordinate immagine
:
Da questa equazione risulta abbastanza esplicito che a ogni punto dell'immagine
sono associati infiniti punti del mondo
che vivono su una retta al variare del parametro
.
Sottointendendo
e raccogliendo le matrici si ottiene l'equazione finale della pin-hole camera (che non tiene ne deve tener conto della distorsione):
È da sottolineare che ponendo un vincolo aggiuntivo sui punti, per esempio
, la matrice
si riduce a una matrice
, invertibile, che è esattamente la matrice omografica (vedi sezione 6.3) della trasformazione prospettica dei punti del suolo.
La matrice
è un esempio di trasformazione IPM (Inverse Perspective Mapping) per ottenere una vista dall'alto (Bird eye view) della scena inquadrata [30].
Per quanto riguarda l'inversione, se si considera il sistema di partenza (6.13), si possono mettere in evidenza i due contributi spaziali che determinano la proiezione: