Fonctionnelle de Minkowski

En géométrie, la notion de jauge généralise celle de semi-norme. À toute partie C d'un -espace vectoriel E on associe sa jauge, ou fonctionnelle de Minkowski pC, qui est une application de E dans [0, +∞] mesurant, pour chaque vecteur, par quel rapport il faut dilater C pour englober ce vecteur. Dès que C contient l'origine, pC est positivement homogène ; si C est étoilée par rapport à 0, pC possède d'autres propriétés élémentaires. Si C est convexe — cas le plus souvent étudié — pC est même sous-linéaire, mais elle n'est pas nécessairement symétrique et elle peut prendre des valeurs infinies. Sous certaines hypothèses supplémentaires, pC est une semi-norme dont C est la boule unité.

Cette notion intervient en analyse fonctionnelle (démonstration de la forme analytique du théorème de Hahn-Banach), en optimisation (problème de recouvrement par jauge, optimisation conique), en apprentissage automatique, en géométrie des nombres (second théorème de Minkowski), etc.

Dans tout cet article, E désigne un espace vectoriel réel, qu'on supposera topologique chaque fois que nécessaire.

Jauge d'une partie quelconque

modifier

Définition — La « jauge, ou fonctionnelle de Minkowski[1] » d'une partie de est l'application définie par :

[2].
Exemple
Soient et tel que . Pour tout , et pour tout , inf(∅) = +∞.
Premières remarques
  • [note 1]. En particulier, si , et l'on a :

Condition suffisante de finitude —  Si est absorbante alors est à valeurs finies.

  • est décroissante : pour toutes parties et ,
    .
  • Les ensembles de sous-niveau de sont homothétiques :
    ou, ce qui est équivalent : pour tout vecteur , .
  • Par conséquent, est :
  • (donc si est symétrique par rapport à 0 alors ).
  • .
  • Si alors donc est positivement homogène, c'est-à-dire que l'équation fonctionnelle précédente est vérifiée non seulement pour mais aussi pour [note 2] :

    .

    La section suivante montre que réciproquement, toute fonction positivement homogène de dans est une jauge (c'est-à-dire : est la jauge d'une partie de [note 3]).

Jauge d'une partie étoilée

modifier

Avant d'affiner l'étude dans le cas particulier plus utile d'un convexe contenant 0, considérons[3] une partie étoilée (par rapport à 0, ce qui sera désormais implicite), c'est-à-dire une partie contenant 0 et telle que

.

Propriétés algébriques

modifier

On sait déjà que et que est positivement homogène. La nouvelle hypothèse permet de préciser la situation :

Caractérisation — La jauge d'une partie étoilée vérifie :
.

Réciproquement, pour toute fonction positivement homogène (au sens défini ci-dessus), les parties étoilées de jauge sont les ensembles compris entre et .

En outre :

  • pour toutes parties étoilées et , (ce qui est plus précis que la simple décroissance de ) ;
  • [note 4] donc , ce qui fournit la première des deux équivalences ci-dessous ;
  • la condition suffisante de finitude trouvée précédemment pour une partie quelconque devient nécessaire (seconde équivalence).

Conditions nécessaires et suffisantes de non dégénérescence et de finitude — Soit une partie étoilée.

  • ne s'annule qu'en 0 si et seulement si ne contient aucune demi-droite issue de l'origine.
  • est à valeurs finies si et seulement si est absorbante.

Ces deux conditions seront reformulées plus loin, dans le cas d'un convexe en dimension finie.

Propriétés topologiques

modifier

L'une des deux inclusions de la caractérisation ci-dessus est parfois une égalité :

  • si S est ouvert alors  ;
  • si S est fermé alors .

Jauge d'un convexe

modifier

Si une jauge nulle en 0 est convexe alors les deux ensembles et sont non seulement étoilés mais convexes, et est la jauge de ces deux convexes. Les jauges de ce type sont caractérisées par la propriété suivante.

Une application est dite sous-linéaire si elle est :

Toute application sous-linéaire est convexe et pour une jauge nulle en 0, ces deux notions sont équivalentes :

Jauge d'un convexe — Si une partie contenant 0 est convexe alors sa jauge est sous-linéaire[4].

La réciproque est fausse, comme le montre l'exemple suivant.

Exemple

modifier

La fonction sous-linéaire sur qui, en , vaut si et si , est la jauge des deux convexes et , ainsi que de tous les ensembles intermédiaires (tous étoilés, mais pas tous convexes).

Jauges sous-linéaires ne prenant pas la valeur +∞

modifier

On a déjà remarqué que la jauge d'une partie étoilée est à valeurs finies si et seulement si est absorbante.

Tout voisinage de 0 est absorbant ; en dimension finie, on vérifie facilement que réciproquement, tout convexe absorbant C est un voisinage de 0 — on peut le faire assez élégamment en remarquant qu'en tant que fonction convexe à valeurs finies et définie partout, est alors continue, et que l'ensemble (contenant 0 et inclus dans C) est donc ouvert. En résumé :

Proposition — Soit C un convexe contenant 0 dans un espace de dimension finie. Alors, sa jauge est à valeurs finies si et seulement si 0 est intérieur à C.

Lorsque 0 est intérieur à C, on peut se faire une image mentale simple de la jauge via ses surfaces de niveau : l'ensemble des points où elle prend la valeur 1 est exactement la frontière du convexe ; les surfaces de niveau pour les autres valeurs strictement positives sont les homothétiques de cette frontière ; en les éventuels points restant non couverts par la réunion de ces surfaces de niveau, la jauge prend la valeur 0.

On peut enfin remarquer que (pour un espace vectoriel réel), si C est symétrique par rapport à 0 avec une jauge évitant la valeur +∞, la jauge est alors une semi-norme ; il en est de même pour un espace vectoriel complexe si l'on exige une version améliorée de la symétrie, à savoir l'invariance sous multiplication par n'importe quel complexe de module 1.

Jauges sous-linéaires ne s'annulant qu'en l'origine

modifier

On a déjà remarqué que la jauge d'une partie étoilée ne s'annule qu'en l'origine si et seulement si ne contient aucune demi-droite issue de l'origine.

Si est bornée (dans un espace vectoriel normé ou plus généralement, dans un espace vectoriel topologique séparé) alors elle ne contient aucune telle demi-droite.

La réciproque est vraie pour un convexe fermé en dimension finie, et se démontrerait en exploitant la compacité de la sphère de rayon 1 (la seule hypothèse « convexe » ne suffit pas ici : cf. § « Exemple » ci-dessus) :

Proposition — Soit C un convexe fermé contenant 0 dans un espace de dimension finie. Alors, sa jauge ne s'annule qu'en l'origine si et seulement si C est borné.

Exemples d'utilisation

modifier
  • Dans la théorie des espaces vectoriels topologiques, c'est par l'introduction d'une collection appropriée de jauges qu'on peut caractériser les espaces localement convexes en termes de semi-normes[5].
  • En géométrie des convexes, la jauge est un outil intéressant pour ramener un problème purement géométrique (recherche d'un hyperplan) à un problème analytique (recherche d'une équation de l'hyperplan). Ainsi dans la preuve de la « forme géométrique » du théorème de Hahn-Banach — fondement de toute la théorie de la séparation des convexes et des hyperplans d'appui —, un pas essentiel est la constatation qu'exiger de l'hyperplan d'équation f(x) = 1 qu'il évite un convexe donné C (ouvert et contenant 0), c'est la même chose que de demander à f de majorer pC.

Aspects calculatoires

modifier

Dans cette section[6], il s'agira exclusivement de jauges sous-linéaires sur un espace euclidien , dont le produit scalaire est noté .

Pour une telle jauge , nous noterons son ensemble de sous-niveau  :

.

Rappelons que l'adhérence d'une partie de est notée et que le polaire de est le convexe fermé contenant l'origine, noté et défini par

On peut donner une autre expression du polaire de  :

.

Adhérence

modifier

L'adhérence ou la fermeture de est la jauge telle que .

Par conséquent :

  • est la plus grande jauge fermée minorant  ;
  • les épigraphes de et sont reliés par .

Polaire

modifier

La polaire de est la jauge telle que .

Propriétés
  • est fermée.
  • [7].
  • La bipolaire de est égale à son adhérence : (car , d'après les propriétés de l'ensemble bipolaire).
  • La polaire de est égale à la fonction d'appui[note 5] de , donc à la conjuguée[note 6] de la fonction indicatrice[note 7] de .
  • Si est une norme, est sa norme duale[note 8] (en particulier si est la norme euclidienne, ).
  • Inégalité de Cauchy-Schwarz généralisée :[note 1],[8] donc (en remplaçant par ),ce qui renforce l'inégalité précédente puisque .

Sous-différentiel

modifier

Le sous-différentiel de en un point vérifie

(en particulier, et si , ).

On en déduit :

argmax, avec égalité si est fermée.

Quelques remarques sur le résultat ci-dessus.

  • Il existe des jauges et des points pour lesquels l'inclusion ci-dessus est stricte.
    C'est le cas, dans le plan euclidien, pour la jauge du § « Exemple » ci-dessus et le point  : , tandis que donc .
  • est sous-différentiable[note 9] en tout point de si, et seulement si, 0 est intérieur à .
    En effet (voir supra) 0 est intérieur à si et seulement si ne prend que des valeurs finies. Or si ne prend que des valeurs finies alors elle est sous-différentiable en tout point (puisqu'elle est convexe), et réciproquement (puisque ).

Notes et références

modifier
  1. a et b Le domaine effectif d'une fonction à valeurs dans est l'ensemble des points où elle ne prend pas la valeur .
  2. Par convention, (cf. par exemple Rockafellar 1970, p. 24 ou Schechter 1997, p. 313).
  3. Cette précision, redondante dans cet article, sera dorénavant implicite. Noter cependant que (en) H. G. Eggleston, Convexity, Cambridge University Press, (lire en ligne), p. 47 appelait « fonctions jauges » les applications sous-linéaires (à valeurs dans ) ; (en) A. Wayne Roberts et Dale E. Varberg, Convex Functions, Academic Press, (lire en ligne), p. 216, nommaient ainsi celles à valeurs dans  ; et Rockafellar 1970, p. 128, celles à valeurs dans , car il excluait de son étude les jauges d'ensembles non convexes.
  4. Ce cône est noté dans l'article « Cône asymptotique », où est supposé convexe.
  5. La fonction d'appui d'une partie de est définie par .
  6. La conjuguée d'une fonction est définie par .
  7. En analyse convexe, la fonction indicatrice d'une partie d'une partie de est la fonction qui s'annule sur et prend la valeur sur le complémentaire de .
  8. Pour le voir, on peut par exemple utiliser la relation précédente.
  9. On dit que est sous-différentiable en si .

Références

modifier
  1. Aliprantis et Border 2006. De nombreux auteurs ne la définissent que pour un convexe contenant 0 :
    • Claude Berge, Espaces topologiques : fonctions multivoques, Dunod, , chap. VII, § 5 ;
    • Laurent Schwartz, Analyse hilbertienne, Hermann, , p. 44 ;
    • A. Badrikian, « Remarques sur les théorèmes de Bochner et P. Lévy », dans Symposium on Probability Methods in Analysis, Springer, coll. « Lecture Notes in Math. » (no 31), , p. 1-19, p. 3 : « V un voisinage de zéro convexe équilibré ouvert et PV sa jauge (ou « fonctionnelle de Minkowski ») » ;
    • Gilbert Demengel et Françoise Demengel, Espaces fonctionnels : Utilisation dans la résolution des équations aux dérivées partielles, EDP Sciences (lire en ligne), p. 51, exercice 1. 7 : « un ensemble convexe, équilibré et absorbant d'un espace vectoriel topologique X, contenant 0. On définit la fonctionnelle de Minkowski p, ou encore jauge du convexe » ;
    • etc.
  2. Dans le cas d'une partie étoilée par rapport à 0, ceci équivaut à la définition par Schechter 1997 de sa « fonctionnelle de Minkowski » : est la borne inférieure de l'intervalle , qui contient .
  3. Schechter 1997, Aliprantis et Border 2006.
  4. Nawfal El Hage Hassan, Topologie générale et espaces normés, Dunod, (1re éd. 2011) (lire en ligne), p. 428.
  5. Cédric Villani, « Analyse II : cours donné à l'École normale supérieure de Lyon », 2003-2004, § I.2.
  6. Les résultats de cette section sont repris de Rockafellar 1970, Hiriart-Urruty et Lemaréchal 2004, Friedlander, Macêdo et Pong 2014 et Gilbert 2016.
  7. Cette propriété tient lieu de définition de dans Rockafellar 1970, p. 128.
  8. Rockafellar 1970, p. 130.

Bibliographie

modifier
  • (en) Charalambos D. Aliprantis et Kim C. Border, Infinite Dimensional Analysis: A Hitchhiker's Guide, Springer, , 3e éd. (1re éd. 1994) (lire en ligne), chap. 5.8 (« Sublinear functions and gauges »), p. 190-194
  • (en) M. Friedlander, I. Macêdo et T. K. Pong, « Gauge optimization and duality », SIAM Journal on Optimization, vol. 24, no 4,‎ , p. 1999-2022 (DOI 10.1137/130940785, arXiv 1310.2639)
  • (en) J. Ch. Gilbert, « On the solution uniqueness characterization in the L1 norm and polyhedral gauge recovery », Journal of Optimization Theory and Applications, vol. 1, no 1,‎ , p. 1-32 (DOI 10.1007/s10957-016-1004-0)
  • (en) Jean-Baptiste Hiriart-Urruty et Claude Lemaréchal, Fundamentals of Convex Analysis, Berlin Heidelberg New York, Springer, coll. « Grundlehren Text », (1re éd. 2001) (lire en ligne), p. 128-130
  • (en) R. Tyrrell Rockafellar, Convex Analysis, Princeton, New Jersey, Princeton University Press, coll. « Princeton Mathematical Series » (no 28), (lire en ligne)
  • (en) Eric Schechter, Handbook of Analysis and Its Foundations, Academic Press, (lire en ligne), « Minkowski Functionals », p. 315-317