Un Algorithme Multirésolution de Recalage

de Signaux et d'Images

Martin Lefébure et Laurent D. Cohen



lefebure@ceremade.dauphine.fr, Laurent Cohen
CEREMADE, URA CNRS 749,
Universite Paris IX Dauphine
Place du Marechal de Lattre de Tassigny
75775 Paris cedex 16, France


Résumé

                      Le recalage d'images est maintenant un problème fondamental en analyse d'images médicales (voir par exemple [1]). Le problème trouve son origine dans l'utilisation de techniques dynamiques en imagerie médicale: la diversité des formes de crane des différents patients, ou encore leur mouvement au cours d'une séquence d'images, rend délicate l'utilisation des données recueillies pour le diagnostic et l'élaboration de statistiques. Dans le premier cas, où il faut recaler des images sur une image de référence, on demande un recalage non rigide. Quand le but est d'analyser l'évolution des niveaux de gris dans une séquence dynamique d'images, il n'est pas possible d'éviter un léger mouvement du patient. Il est donc nécessaire d'opérer un recalage affine sur la séquence d'images pour comparer les bons pixels dans les images successives.

                       Bien que notre algorithme puisse s'appliquer à toute sorte de signal ou d'image, notre objectif initial était de réaliser le recalage d'images 3-D en IRM fonctionnelle. Ces images permettent d'explorer les liens entre les structures du cerveau et leurs fonctions. Afin de tenir compte d'un grand nombre d'expérimentations, il est fondamental de développer des algorithmes automatiques de traitement d'images destinés à extraire l'information utile. Un recalage affine est donc nécessaire pour suivre l'évolution des images et détecter les activations dans celles-ci.

                        Des méthodes générales de recalage [2,3] ont été mises en oeuvre en vision par ordinateur ou en imagerie médicale pour l'ajustement de surfaces 3-D, prenant en compte diverses contraintes géométriques ou différentielles [4,5,6]. Nous donnons ici une bonne formulation mathématique du problème, dans le sens où nous garantissons la convergence de l'algorithme multirésolution. Le recalage de deux images u et v est obtenu par une transformation T(X) minimisant une énergie :
 

                    Une première utilisation de ce type d'énergie avec des modèles déformables a été présentée dans [7]. Notre contribution concerne deux points. Premièrement, nous avons introduit un algorithme multirésolution, basé sur une approche de flot optique de Odobez et Bouthemy [8]. Cela nous permet de trouver la bonne transformation entre deux images 3-D (cf figure 3). Nous supposons que la transformation est une combinaison linéaire de fonctions de base. Ceci représente une connaissance a priori en termes de localisation, de régularité ou d'oscillation sur la solution. Comme deuxième contribution, nous montrons, pour des cas particuliers, que notre algorithme converge. Ceci suppose que certaines hypothèses sur la variation et l'amplitude du mouvement soient vérifées.

                    L'idée principale est de considérer la pyramide multirésolution pour les signaux ou images engendrée par les premiers éléments de la base de Fourier. Sous certaines hypothèses sur la variation et l'amplitude du mouvement, nous prouvons que l'algorithme converge rapidement vers les paramètres réels du mouvement. On peut interpréter ce résultat comme un lissage de la fonction d'énergie, qui garantit la convergence de la descente de gradient vers l'unique minimum global (cf figures 1 et 2). Cette idée existe déjà sous une forme différente dans des travaux antérieurs [9,10,11,12].

                     Lorsqu'on choisit une résolution suffisamment basse, l'hypothèse est satisfaite et la minimisation peut etre appliquée. Ensuite, l'algorithme multirésolution recherche le minimimum global en estimant les paramètres puis en recalant, et en ajoutant les termes successifs dans la décomposition de Fourier. Voici un schéma général de l'algorithme:

  1. Trouver la résolution la plus grande j pour laquelle l'hypothèse est satisfaite.
  2. Minimiser l'énergie sur les signaux à la résolution j, par itération des moindres carrés dans l'espace des paramètres définissant la transformation T (nous supposons cet espace de dimension finie).
  3. Tant que j est plus petit que la résolution maximale, raffiner le résultat en augmentant la résolution et en minimisant la nouvelle énergie
                   Pour l'exemple test donné dans la figure 1, le paramètre de translation exact est trouvé. Nous montrons également un exemple de recalage affine d'images 3-D en IRM fonctionnelle (voir commentaires sur la figure 3).

Figure 1: Signal Test a gauche. Le second signal est le meme translaté de 200. A droite, l'énergie en fonction du paramètre de translation. Il y a de nombreux minima locaux autour du mimimum global en x=200.

Figure 2: Fonction d'énergie obtenue à partir des signaux à l'échelle 2 et 3. Elle doit etre comparée à celle de droite dans la figure précédente, où elle est obtenue à pleine résolution (échelle 8). A l'échelle 2, la solution est l'unique minimum local.}

Figure 3: Recalage affine d'images 3-D en IRM fonctionnelle: nous le visualisons ici sur des coupes sagittales. L'image du haut est donc une coupe sagittale extraite d'une première image 3-D. En dessous, nous montrons la meme section, extraite de l'image 3-D suivante dans la séquence temporelle, après un léger mouvement du patient, avant et après recalage 3D. Comme il est difficile d'apprécier visuellement la différence entre les deux images fixes, nous montrons plus bas les bords détectés à l'aide d'un filtre de Canny-Deriche avant puis après recalage. Les contours noirs représentent la forme originale. Remarquer la précision du recalage sur la petite région à l'extrémité droite (i.e. le sinus longitudinal supérieur).}

References