Symposium

Transport Optimal et
Géométrie de l'information

Le GdR MSPC organise le 10 Février 2012 à l'IHP, Paris, une journée sur le thème "Transport Optimal et Géométrie de l'information". Cette journée sera composée d'exposés la fois théoriques, numériques et applicatifs à l'interface entre la géométrie de l'information et le transport optimal. Cette journée est organisée avec le soutien de Thales et du séminaire interdisciplinaire Léon Brillouin sur les Sciences géométriques de l'Information.

Date

Vendredi 10 Février 2012

Localisation

Institut Henri Poincaré (Paris, France)
Amphitheatre Darboux

Comité d'organisation

Frédéric Barbaresco (Thales)
Gabriel Peyré (CNRS et Université Paris-Dauphine)

Inscription: gratuite mais obligatoire

Inscription en ligne.

Participants

Liste des participants.

Programme.

09:30-10:00Quentin Mérigot (Grenoble)Inférence géométrique et bruit Wasserstein (résumé) (slides)
10:00-10:30Olivier Schwander (Polytechnique)Simplification de modèles de mélange issus d'estimateurs par noyau (résumé) (slides)
10:30-11:00Pause Café
11:00-11:30Michel Broniatowski (UPMC)Echantillonnage pondéré, divergences entre lois de probabilité et critères statistiques (résumé) (slides)
11:30-12:00Yann Brenier (Nice)Transport optimal dynamique (résumé) (slides)
12:00-12:30Marc Arnaudon (Poitier)Médianes et moyennes en géométrie riemannienne : existence, unicité, et calcul (résumé) (slides)
12:30-13:45Pause déjeuner (cafétéria IHP)
14:00-14:30Yann Ollivier (Paris Sud)Discrete Ricci curvature with applications (résumé) (slides)
14:30-15:00Arshia Cont et Arnaud Dessein (INRIA)Applications de la géométrie de l'information au traitement du signal audio (résumé) (slides)
15:00-15:30Guillaume Carlier (Paris-Dauphine)On geodesics in the Wassertsein space (résumé) (slides)
15:30-16:00Pause Café
16:00-16:30Michel Boyom (Montpelier)Convexité locale des connexions de Chentsov localement plates (résumé) (slides)
16:30-17:00Julie Delon (Telecom Paristech)Indicateurs d'appariement locaux pour le transport en coût concave (résumé) (slides)
17:00-17:30Alexis Decurninge et Frédéric Barbaresco (Thales)Géométrie de l'Information versus Géométrie du transport optimal des matrices de covariance dans le cas Gaussien complexe circulaire (résumé) (slides)

Résumés.

Quentin Mérigot (Grenoble)
Inférence géométrique et bruit Wasserstein
Résumé : La problématique de l'inférence géométrique est d'estimer la géométrie (courbure, normales) et la topologie (nombres de Betti, type d'homotopie) d'un objet géométrique inconnu à partir d'un échantillonnage discret. La notion de fonction distance joue un rôle très important dans ce domaine, notamment par ses avatars discrets que sont la triangulation de Delaunay et les diagrammes de Voronoi. Dans cet exposé, nous verrons comment la définition d'une notion de fonction distance à une mesure de probabilité permet (entre autres) de retrouver la topologie d'une surface plongée dans un espace Euclidien à partir d'un échantillon fini, même si celui-ci contient des erreurs de mesures (outliers). Travail en commun avec F. Chazal et D. Cohen-Steiner

Olivier Schwander (Polytechnique)
Simplification de modèles de mélange issus d'estimateurs par noyau
Résumé : Les modèles de mélange gaussien sont un outil universel pour modéliser des densités de probabilités complexes et variées. Du fait de ce succès, énormément d'algorithmes ont été proposés, les plus connus étant l'Espérance-Maximization (EM) ou les estimateurs par noyau (aussi connus sous le nom de fenêtres de Parzen). EM est un algorithme itératif cherchant à maximiser la vraisemblance du modèle et donnant des mélanges avec peu de composantes mais ne convergeant que vers un minimum local. Au contraire, les fenêtres de Parzen construisent des modèles précis de façon rapide mais avec autant de composantes que d'observations. Nous proposons ici des méthodes de simplification de modèles de mélange de façon à construire des mélanges petits à partir de mélanges très grands, tout en préservant la qualité du modèle. Ces méthodes reposent sur des algorithmes de partitionnement utilisant par exemple les divergences de Bregman et de Kullback-Leibler ou la métrique de Fisher-Rao. Les différentes méthodes sont évaluées dans le cadre d'une application de bio-informatique.

Michel Broniatowski (UPMC)
Echantillonnage pondéré, divergences entre lois de probabilité et critères statistiques
Résumé : Dans cet exposé on s'intéressera aux liens existant entre le principe de maximum de vraisemblance et les divers critères statistiques issus des divergences entre lois de probabilité. L'outil principal est le théorème de grandes déviations pour des mesures empiriques pondérées, qui généralise le théorème de Sanov. Le fait essentiel est qu'à tout critère statistique de type divergence correspond un échantillonnage pondéré, de type bootstrap, sous lequel l'estimateur du maximum de vraisemblance coincide avec la minimisation de la divergence entre la mesure empirique de l'échantillon et le modèle. Ceci est en lien avec une interprétation des divergences comme transformées de Legendre de fonctions génératrices de moments, et à une analyse de ces transformées dans les familles exponentielles naturelles. Le cadre retenu est celui des modèles statistiques paramétriques. On développera divers points de vue sur les formes duales des divergences entre lois de probabilité et leurs approximations.

Yann Brenier (Nice)
Transport optimal dynamique
Résumé : Malgré son nom, la théorie du transport optimal est avant tout une théorie statique (permettant de comparer deux mesures de probabilité, deux images etc..), liée à des équations aux dérivées partielles elliptiques (Monge-Ampère, en particulier). On peut en élargir le cadre en introduisant le temps comme variable supplémentaire (où il s'agit de comparer deux mouvements, deux films etc...) et on établira un lien avec des équations hyperboliques, comme celles de l'électromagnétisme non-linéaire de Born et Infeld (le transport optimal "classique" correspondant alors plutôt à l'électrostatique).

Marc Arnaudon (Poitier)
Médianes et moyennes en géométrie riemannienne : existence, unicité, et calcul
Résumé : On considèrera les problèmes d'existence, d'unicité et de calcul de médianes et moyennes de mesures de probabilités dans des variétés ayant des bonnes propriétés de convexité. Des algorithmes déterministes et stochastiques seront donnés. Puis on s'intéressera au cas des variétés compactes. On donnera des résultats de localisation des médianes pour des mesures suffisamment concentrées. On donnera enfin un résultat d'unicité pour la médiane et la moyenne d'un nuage de points en position générique.

Yann Ollivier (Paris Sud)
Discrete Ricci curvature with applications
Résumé : We define a notion of discrete Ricci curvature for a metric measure space by looking at whether "small balls are closer than their centers are". In a Riemannian manifold this gives back usual Ricci curvature up to scaling. This definition is very easy to apply in a series of examples such as graphs (eg the discrete cube has positive curvature). We are able to generalize several Riemannian theorems in positive curvature, such as concentration of measure and the log-Sobolev inequality. This definition also allows to prove new theorems both in the Riemannian and discrete case: for example improved bounds on spectral gap of the Laplace-Beltrami operator, and fast convergence results for some Markov Chain Monte Carlo methods.

Arshia Cont et Arnaud Dessein (INRIA)
Applications de la géométrie de l'information au traitement du signal audio
Résumé : Cet exposé présente quelques applications des méthodes de la géométrie de l'information à l'analyse et au traitement des flux audio, notamment dans des contextes musicaux temps-réel. Nous introduisons tout d'abord le cadre général des problèmes d'extraction de données audio. Ce cadre repose sur la définition d'une notion de similarité entre entités sonores, qui sert ensuite de base à l'extraction d'informations de haut-niveau à partir du signal sonore physique de bas-niveau. Nous proposons ensuite un cadre géométrique reposant sur la bijection entre les familles exponentielles et les divergences de Bregman afin d'approcher un espace de similarité métrique, nous permettant ainsi de considérer des séries temporelles en tant qu'entités d'information dans un espace riemannien. Nous montrons finalement des exemples applicatifs afi n de démontrer la pertinence de ce type d'abstraction pour résoudre des problèmes souvent considérés comme complexes dans le domaine de l'extraction de données audio. En particulier, nous nous intéressons à des outils temps-réel pour la segmentation automatique, la découverte de structures temporelles et la recherche dans des bases de données.

Guillaume Carlier (Paris-Dauphine)
On geodesics in the Wassertsein space
Résumé : Recently, Dolbeault, Nazaret and Savaré introduced a class of distances in the space of probability measures which interpolate between the 2-Wasserstein distance and the H^{-1} distance. In this talk we will focus on the characterization of geodesics for such distances and in the first place on the existence and properties of the adjoint state (joint with P. Cardaliaguert and B.Nazaret).

Michel Boyom (Montpelier)
Convexité locale des connexions de Chentsov localement plates
Résumé : Les connexions de Chentsov sont des invariants de modèles statistiques. Ce sont des déformations à un paramètre $\alpha$ de la connexion de Levi-Civita $\nabla$ de l'information de Fisher. On discutera de nombre des connexions de Chentsov localement plates qui habitent la même droite des connexions linéaires passant par $\nabla$.

Julie Delon (Telecom Paristech)
Indicateurs d'appariement locaux pour le transport en coût concave
Résumé : L'utilisation de coûts concaves est la plus réaliste dans les applications du transport optimal en économie (ils traduisent une notion d'économie d'échelle) et dans certains problèmes de vision par ordinateur, mais ce cas a curieusement été assez peu étudié d'un point de vue théorique et numérique, en dehors des travaux de McCann. Nous introduisons une classe d'indicateurs locaux qui permettent de calculer efficacement des plans de transport optimaux entre des distributions discrètes arbitraires sur la ligne. Ces indicateurs locaux ont le bon goût de révéler certaines propriétés sur la structure locale des solutions, dépendant de la concavité plus ou moins forte de la fonction de coût considérée. Notre méthode vient compléter celle suggérée par [McCann, 99], tout en étant proche de la démarche purement combinatoire d'[Aggarwal et al., 92], qui ne s'intéressait qu'à une fonction de coût élémentaire (la distance sur la ligne). Travail fait avec J. Salomon et A. Sobolevskii)

Alexis Decurninge et Frédéric Barbaresco (Thales)
Géométrie de l'Information versus Géométrie du transport optimal des matrices de covariance dans le cas Gaussien complexe circulaire
Résumé : Nous étudions la géométrie des matrices de covariance dans le cadre de la géométrie de l'information de Rao-Chentsov [14]; La métrique de Fisher nous permet d'introduire la notion de barycentre median [4,5,6,17,21] dans l'espace métrique de Fréchet associé [7]. Le cas des matrices Toeplitz de signaux stationnaires est solutionné via la décomposition d'Iwasawa partielle dans le disque de Poincaré par décomposition polaire, et celui des matrices Toeplitz-Bloc-Toeplitz dans les domaines classiques bornés homogènes de Cartan-Siegel par décomposition de Mostow [19] (fibration de Berger du disque de Siegel). Nous appliquons ces outils pour définir de nouveaux traitements Doppler robustes radar (algorithme OS-HDR-CFAR) et spatio-temporels (OS-STAP) [21,23]. Dans le cas Doppler, nous comparons les performances avec une approche utilisant la géométrie du transport optimal [8,11,15,20] (distance et barycentre de Wasserstein pour une loi multivariée gaussienne complexe circulaire de moyenne nulle). Nous soulignons les liens entre la métrique de Rao [14], la métrique hessienne [9] de l'entropie (métrique de Ruppeiner en physique) et la métrique de Bergman de l'espace de Kähler associé [12,13]. Dans le cas Gaussien, la géométrie induite est intimement liée à la géométrie des espaces symétriques d'Elie Cartan [3,10] et leurs extensions par Carl Ludwig Siegel [22]. Dans notre cas applicatif, les propriétés de convergence et d'unicité du barycentre [16,18] sont liées à un résultat de Cartan [2] pour les variétés de Cartan-Hadamard [1] (variétés complètes, simplement connectées à courbure sectionnelle non-positive), et pour le barycentre médian à des résultats récents de Le Yang [22]. [References]