Fonction convexe

En mathématiques, et surtout en analyse, une fonction convexe est une fonction numérique vérifiant une propriété de sous-additivité vis-à-vis de la barycentration.



Catégories :

Analyse convexe

Page(s) en rapport avec ce sujet :

  • Remarque : il existe des fonctions convexes non continues. (Mais les points de discontinuité sont localisés sur . Fr (I) ). Par exemple la fonction ƒ définie sur ... (source : pagesperso-orange)
  • en fonction de 955;, y1 et y2 l'ordonnée du point de D d'abscisse 955;a + (1 8722; 955;) b. 1 Propriétés des fonctions convexes. 1.1 Définition des fonctions convexes... (source : stephane.gonnord)

En mathématiques, et surtout en analyse, une fonction convexe est une fonction numérique vérifiant une propriété de sous-additivité vis-à-vis de la barycentration. Graphiquement, cela correspond à un graphe dont la «partie bombée est tournée vers le bas», ce qui peut s'interpréter en termes de partie convexe du plan.

À l'inverse, une fonction dont le graphe a sa «partie bombée tournée vers le haut» est une fonction concave. Elle vérifie une propriété de sur-additivité vis-à-vis de la barycentration. Une fonction est concave si et uniquement si son opposée est une fonction convexe.

L'intérêt des fonctions convexes est de produire la plupart d'inégalités remarquables, dites inégalités de convexité, et d'apporter des facilités pour la recherche d'extrema.

Convexité pour une fonction d'une variable réelle

Función convexa.png

Dans cette première section, on va supposer que la totalité de départ est un intervalle I de \mathbb{R}. Cette restriction sert à apporter une première initiation aux fonctions convexes en premier lieu plus aisée et parce que la possibilité de tracer des représentation graphiques planes favorise sans doute la tâche, ensuite et en particulier parce que les concepts de continuité ou dérivabilité sont significativement plus maniables pour les fonctions d'une seule variable. Cette approche montre tout de même vite ses limites, surtout parce qu'elle n'est guère pertinente pour appliquer la théorie des fonctions convexes à l'optimisation qui en est probablement la principale motivation.

Le lecteur qui recherche la définition d'une fonction convexe de plusieurs variables, ou définie sur un ensemble convexe d'un espace vectoriel ou affine est invité à se rendre directement à la section suivante.

Définitions

Définition — Une fonction f d'un intervalle I de \mathbb{R} vers \mathbb{R} est dite convexe quand, pour tous x1 et x2 de I et tout λ dans [0, 1] on a :

 f(\lambda\, x_1+(1-\lambda)\, x_2) \leq \lambda\, f(x_1)+(1-\lambda)\, f(x_2)

Cela veut dire que pour tout x1 et x2 de I, le segment \ [A_1, A_2] de \ \Rˆ2, où \ A_1 = (x_1 , f(x_1)) et \ A_2 = (x_2 , f(x_2)), est localisé au-dessus de la courbe représentative de f.

Une fonction concave est une fonction dont la fonction opposée est convexe.

On vérifie aussitôt ce qui suit, reliant les notions d'ensemble convexe et de fonction convexe :

Remarque — La fonction f est convexe sur I si et uniquement si \ \{(x,\, y) \in I \times \R\, | y \geq f(x)\} est un sous-ensemble convexe de \ \Rˆ2.

Cet ensemble est nommé l'épigraphe de f.

Exemple : la fonction x\,\colon\, \mapsto |x| est convexe, parce que son épigraphe est un quart de plan (lui-même convexe comme intersection de deux demi-plans). Il est fréquemment malcommode de vérifier la convexité d'une fonction définie par une formule concrète à partir de l'unique définition, on attendra par conséquent quelques paragraphes pour donner d'autres exemples, quand on disposera d'un critère de convexité plus utilisable en pratique.

Possibilité de n'utiliser que des milieux

La définition de la convexité fait apparaître des barycentres où les cœfficients sont des réels arbitraires de [0, 1]. Il est envisageable de n'utiliser que des milieux, mais il est alors indispensable d'ajouter une hypothèse supplémentaire de régularité portant sur f[1].

Proposition — Une fonction f continue sur I est convexe sur I si et uniquement si quels que soient les éléments x1 et x2 de I :

f\left(\frac{x_1+x_2}{2}\right) \leq \frac{f(x_1)+f(x_2)}{2}.

Extension à des barycentres de plus de deux points

Article détaillé : Inégalité de Jensen.

L'inégalité de la définition couvre comme suit (on peut le démontrer par récurrence sur l'entier p). On dénomme quelquefois cette version l'inégalité de Jensen :

Proposition — Si f est convexe sur I et si x_1,\, \dots,\, x_p sont des points de I et \lambda_1,\, \dots,\, \lambda_p des réels positifs ou nuls tels que \lambda_1 + \cdots + \lambda_p = 1, alors :

f(\lambda_1\, x_1 + \cdots + \lambda_p\, x_p) \leq \lambda_1\, f(x_1) + \cdots + \lambda_p\, f(x_p).

Géométrie du graphe d'une fonction convexe

On nomme quelquefois «lemme des trois cordes» le résultat suivant[2] :

Proposition — Si f est convexe sur I, pour tous points x1, x2, x3 de I avec x1 < x2 < x3

\frac{f(x_2)-f(x_1)}{x_2-x_1}\leq \frac{f(x_3)-f(x_1)}{x_3-x_1}\leq \frac{f(x_3)-f(x_2)}{x_3-x_2}.

Réciproquement, si l'une des trois inégalités est vérifiée pour tous x1, x2, x3 de I avec x1 < x2 < x3, alors f est convexe.

Régularité des fonctions convexes

Le «lemme des trois cordes» sert à montrer que[3] :

Théorème — Si f est convexe sur un intervalle ouvert I

  • f est continue en tout point ;
  • f est dérivable à gauche ainsi qu'à droite en tout point, et les fonctions \ f\,'_g\,,\, f\,'_d sont croissantes sur I ;
  • la totalité des points xf n'est pas dérivable (c'est-à-dire tels que \ f\,'_g(x) \neq  f\,'_d(x)) est au plus dénombrable.

Cas des fonctions dérivables

On dispose des caractérisations suivantes :

Proposition — Soit f une fonction dérivable sur un intervalle I.

  • f est convexe si et uniquement si sa courbe représentative est au-dessus de chacune de ses tangentes ;
  • f est convexe si et uniquement si sa dérivée est croissante sur I.

d'où on tire le corollaire immédiat fort pratique pour vérifier sans mal la convexité d'exemples spécifiques :

Corollaire — Soit f une fonction deux fois dérivable sur un intervalle I.

f est convexe si et uniquement si sa dérivée seconde f'' est à valeurs positives ou nulles.

Ainsi on peut désormais aisément ajouter à sa collection de fonctions convexes (ou concaves) les exemples suivants :

Stricte convexité

En faisant intervenir des inégalités strictes, on dispose d'une variante de la convexité, la stricte convexité.

Définition — Une fonction f d'un intervalle I de \mathbb{R} vers \mathbb{R} est dite strictement convexe quand, pour tous x1 et x2 différents dans I et tout λ dans ]0, 1[ on a :

 f(\lambda\, x_1+(1-\lambda)\, x_2) < \lambda\, f(x_1)+(1-\lambda)\, f(x_2)

Les résultats énoncés plus haut pour des fonctions convexes s'adaptent le plus souvent sans mal aux fonctions strictement convexes. On prendra garde à une nuance : de même que les fonctions dérivables convexes sont celles qui ont une dérivée croissante, les fonctions dérivables strictement convexes sont celles qui ont une dérivée strictement croissante. Par contre, il ne faudrait pas croire que la dérivée seconde d'une fonction dérivable strictement convexe est obligatoirement une fonction à valeurs strictement positives : la dérivée d'une fonction strictement croissante peut s'annuler dans certains cas , ou plus précisément peut s'annuler sur un ensemble de points d'intérieur vide. Penser à f\,\colon\, x\mapsto xˆ4 pour un exemple de fonction strictement convexe dont la dérivée seconde s'annule.

Le cas général

Définitions

On peut donner au moins deux définitions un peu différentes d'une fonction convexe, qui reviennent principalement au même mais ne fournissent néanmoins pas précisément les mêmes fonctions. On prendra par conséquent garde au contexte lors d'une invocation d'une de ces définitions pour comprendre s'il s'agit ou non de fonctions susceptibles de prendre des valeurs illimitées.

Définition 1 — Une fonction f d'un convexe C d'un espace vectoriel (ou affine) réel vers \mathbb{R} est dite convexe quand, pour tous x1 et x2 de C et tout λ dans [0, 1] on a :

 f(\lambda\, x_1+(1-\lambda)\, x_2) \leq \lambda\, f(x_1)+(1-\lambda)\, f(x_2).

Définition 2 — Une fonction f d'un espace vectoriel (ou affine) réel E vers \mathbb{R}\cup\{+\infty\} est dite convexe quand, pour tous x1 et x2 de E et tout λ dans [0, 1] on a :

 f(\lambda\, x_1+(1-\lambda)\, x_2) \leq \lambda\, f(x_1)+(1-\lambda)\, f(x_2).

Étant donnée une fonction convexe au sens de la définition 1, on peut lui associer une fonction convexe au sens de la définition 2 en la prolongeant hors de C par la valeur +\infty ; réciproquement étant donnée une fonction convexe f au sens de la définition 2, il est immédiat de vérifier que la totalité des points où elle prend une valeur finie est un convexe C et la restriction de f à ce convexe est alors une fonction convexe au sens de la définition 1. Les deux transformations sont réciproques l'une de l'autre : les deux définitions, bien que techniquement différentes, décrivent bien la même notion.

Certaines sources requièrent de plus que C soit non-vide (dans la définition 1) ou que f ne soit pas la constante +\infty (dans la définition 2) pour prévenir certaines exceptions désagréables dans quelques énoncés[4].

Propriétés élémentaires

Une proportion significative de résultats valables pour des fonctions convexes d'une variable se reproduisent comme une copie conforme pour des fonctions convexes sur une partie d'un espace vectoriel, soit qu'on se ramène pour les prouver à considérer la restriction de la fonction à une droite, soit que la démonstration soit une simple révision de la version à une variable. En voici quelques unes :

Fonctions affines minorantes

La technique de minoration des fonctions convexes par des fonctions affines est une variante adaptée à l'analyse de l'utilisation des hyperplans d'appui en géométrie convexe. La forme analytique du théorème de Hahn-Banach permettrait de minorer directement une fonction convexe définie (et à valeurs finies) sur la totalité de son espace de départ. Par contre, dès que la fonction n'est pas définie partout, il faut poser quelques restrictions techniques[5].

Proposition — Soit E un espace vectoriel topologique, f une fonction convexe et continue définie sur un ouvert convexe non vide U de E et x0 un point de U. Il existe alors une fonction affine continue qui minore f et qui coïncide avec elle en x0.

On verra légèrement plus bas que l'hypothèse de continuité est superflue en dimension finie (c'est une conséquence de la convexité). Par contre, la condition topologique sur U est indispensable, même en une seule variable : pour la fonction convexe f(x) = -\sqrt{1-xˆ2} sur [ − 1, 1] (dont le graphe est un demi-cercle) et x0 = 1, on ne peut trouver de fonction affine minorante au sens de la proposition précédente.

Fonctions convexes en dimension finie

Problèmes de continuité

Continuité sur un ouvert

Comme en dimension 1, une fonction convexe définie sur un ouvert de \Rˆn est nécessairement continue en tout point de l'ouvert. La démonstration va nous donner une information plus précise[6] :

Théorème — Une fonction convexe définie (et à valeurs finies) sur un ouvert de \Rˆn est localement lipschitzienne, et par conséquent continue.

Discontinuités au bord

À une variable, sur un intervalle non ouvert, on a vu qu'une fonction convexe n'était pas obligatoirement continue.

Néanmoins il est envisageable de la rendre continue par un procédé simple : si f est convexe sur un intervalle [a, b], alors obligatoirement la limite à gauche f + (a) de f en a existe et est inférieure ou égale à la valeur f (a) . La discontinuité de f en la limite a se produit alors dans le cas où f + (a) < f (a) . On peut s'en démêler en modifiant simplement la valeur de f en ce point : il suffit de la diminuer et la remplacer par f + (a) [7].

Dès la dimension 2, les choses ne sont pas aussi confortables, comme le montre l'exemple suivant :

Soit C le disque-unité fermé de \Rˆ2 ; considérons la fonction f définie sur C par :

\left\{\begin{matrix}f(x,y)&=&\displaystyle{xˆ2\over{y+1}}&\mbox{si }(x,y)\not=(0,-1)\\ f(0,-1)&=&0&\\ \end{matrix}\right.

Cette fonction f est convexe. Elle est cependant discontinue au point (0, − 1) mais ici la discontinuité ne peut être levée par une simple modification de la valeur f (0, − 1) . On constate en effet que si on tend radialement vers ce point, la fonction étant nulle sur le rayon, f (0, y) tend vers 0 ; mais un calcul facile sert à constater que, si on tend vers (0, − 1) le long du cercle frontière de C, f (x, y) tend vers 2. L'ensemble des valeurs comprises entre 0 et 2 sont d'ailleurs valeurs d'adhérence de f au point (0, − 1) et il est définitivement illusoire d'espérer rendre cette f continue en modifiant ses valeurs sur le bord[8].

Cependant, si la totalité de définition est un polytope, les choses se passent comme sur les intervalles de \R, comme on peut le voir en appliquant le théorème suivant[9] :

Théorème — Une fonction convexe bornée définie sur l'intérieur d'un polytope admet un prolongement convexe continu au polytope.

Fermeture d'une fonction convexe

Une fois qu'on a compris qu'il est vain de vouloir modifier une fonction convexe f sur la frontière de son domaine de définition jusqu'à la rendre continue, on peut néanmoins choisir un jeu de valeurs sur cette frontière plus remarquable que les autres, en strict que le prolongement soit à la fois semi-continu inférieurement (ce qui nécessite de choisir des valeurs faibles) et convexe (ce qui nécessite de les prendre fortes).

Pour écrire l'énoncé assez confortablement, il est ici spécifiquement approprié d'utiliser des fonctions définies sur tout \Rˆn et prenant peut-être la valeur +\infty ; on appellera domaine de définition d'une telle fonction convexe la totalité des points où elle prend une valeur finie.

Théorème — Soit f une fonction convexe de domaine de définition D_f\subset \Rˆn. On note \overline f la fonction définie sur \Rˆn par :

Pour tout x dans \Rˆn, \overline f(x):=\liminf_{y\to x} f(y).

La fonction \overline f est alors caractérisée par l'une au choix des trois propriétés suivantes :

(1) \overline f coïncide avec f en les points qui ne sont pas sur la frontière relative de D_f\, ; elle est convexe et semi-continue inférieurement ;

(2) \overline f coïncide avec f en les points qui ne sont pas sur la frontière relative de Df et , pour tout point x de la frontière relative de Df et tout segment semi-ouvert ]x, z] inclus dans l'intérieur relatif de Df, f(x)=\lim_{\stackrel{y\to x}{y\in]x,z]}}f(y) ;

(3) \overline f a pour épigraphe l'adhérence de l'épigraphe de f.

La fonction \overline f est nommée la fermeture de f. Les fonctions convexes identiques à leur fermeture sont nommées des fonctions convexes fermées ; dit autrement ce sont les fonctions convexes dont l'épigraphe est fermé, ou encore c'est à dire ce sont les fonctions convexes semi-continues inférieurement. [10].

Applications en physique

L'analyse convexe trouve la plupart d'applications en physique, quand les potentiels énergétiques sont localement convexes (existence de solutions stables, de changements de phase). En homogénéisation, par exemple, les théories de type variationnel permettent d'estimer les solutions d'équations aux dérivées partielles elliptiques grâce à la représentation des potentiels énergétiques par transformée de Legendre. La transformée de Legendre, formulation mathématique qui représente une fonction convexe par la totalité de ses tangentes, permet le développement de méthodes de linéarisation. [11]

Références

Les ouvrages mentionnés par des lettres entre crochets dans ces références sont ceux cités dans la section bibliographique.

  1. Ce résultat est mentionné par [NP] p. 10, qui l'attribuent à Johan Jensen et renvoient à son article «Sur les fonctions convexes et les inégalités entre les valeurs moyennes», Acta Mathematica vol. 30 (1906), p. 175-193. La seconde preuve ci-dessous est celle apportée dans [N-P].
  2. Ce résultat est cité par [N-P], p. 20-21, qui l'attribuent à L. Calvani, renvoyant à son article «Sulle funzioni converse di una o due variablili definite in aggregate qualunque», Rend. Circ. Mat. Palermo, vol. 41 (1916), p. 103-134.
  3. Voir [N-P], p. 21. Cet ouvrage attribue le théorème de dérivabilité à gauche ainsi qu'à droite à Otto Stolz, renvoyant à son traité Grundzüge der Differential und Integralrechnung, vol. 1, Teubner, Leipzig, 1893.
  4. Pour la totalité de cette sous-section, voir [H-L], p. 74 à 76.
  5. La proposition qui suit est énoncée dans [N-P], p. 114 (sous l'hypothèse d'un espace E normé, qui ne joue pas un rôle essentiel dans la preuve).
  6. [H-L], p. 102-104, la minoration de la fonction convexe ayant été adaptée au vu de [N-P], p. 119.
  7. Ces remarques sont disponibles, avec leurs preuves et quelques détails, dans [N-P], p. 22.
  8. L'exemple figure dans [H-L] p. 105, avec l'explication de la convexité de f.
  9. Ce théorème est cité sans démonstration par [N-P], p. 123, qui renvoie à D. Gale, V. Klee et R. T. Rockafellar, «Convex functions on convex polytopes», Proceedings of the American Mathematical Society, vol. 19 (1968), p. 867-873.
  10. Pour la totalité de cette sous-sous-section, voir [H-L], p. 79-80. [N-P], p. 122, mentionne aussi ces résultats en les attribuant à Werner Fenchel, renvoyant à Convex cones, sets and fucnctions, Princeton University Press, 1951.
  11. Voir pour un aperçu § 4 in Ivar Ekeland, Roger Temam, SIAM, 1999, Convex Analysis and Variational Problems, ISBN 0-89871-399-4.

Bibliographie

[H-L] - Jean-Baptiste Hiriart-Urruty et Claude Lemaréchal, Fundamentals of convex analysis, coll. «Grundlehren Text Editions», Springer, 2001 (ISBN 3540422056) R. Tyrrell Rockafellar, Convex Analysis, Princeton University Press, 1970, ISBN 0-691-01586-4.

[N-P] - Constantin Nicolescu et Lars-Erik Persson, Convex Functions and their Applications : A Contemporary Approach, coll. «Ouvrages de mathématiques de la Société mathématique du Canada», vol. 23, Springer, 2006 (ISBN 978-0387243009)

Recherche sur Amazon (livres) :



Ce texte est issu de l'encyclopédie Wikipedia. Vous pouvez consulter sa version originale dans cette encyclopédie à l'adresse http://fr.wikipedia.org/wiki/Fonction_convexe.
Voir la liste des contributeurs.
La version présentée ici à été extraite depuis cette source le 10/03/2010.
Ce texte est disponible sous les termes de la licence de documentation libre GNU (GFDL).
La liste des définitions proposées en tête de page est une sélection parmi les résultats obtenus à l'aide de la commande "define:" de Google.
Cette page fait partie du projet Wikibis.
Accueil Recherche Aller au contenuDébut page
ContactContact ImprimerImprimer liens d'évitement et raccourcis clavierAccessibilité
Aller au menu