Sur l’estimation de probabilités de queues multivariées

Théorie des extrêmes

En théorie des valeurs extrêmes on s’intéresse aux grandes valeurs d’un échantillon de variables aléatoires. Cette pratique vient en complément de la statistique classique où il est généralement question d’étudier le comportement de variables aléatoires autour de leur espérance. Une théorie dédiée à l’étude de ces valeurs particulières a été développée depuis quelques décennies et suscite l’intérêt de nombreux statisticiens, ingénieurs et scientifiques tant le champ d’applications qu’elle touche est vaste. Il s’agit de caractériser le comportement des queues de distribution à l’aide de modèles spécifiques permettant un bon ajustement au delà du maximum de l’échantillon. On s’intéresse alors à des événements dont les probabilités d’occurrence sont très faibles, on parle d’événements rares. La théorie des extrêmes offre une classe d’outils permettant une extrapolation dans les queues de distribution, à partir des valeurs maximales observées, afin de prédire l’apparition de valeurs non observées. Cette théorie est fondée sur un théorème équivalent au théorème central limite mais pour les queues de distribution. En effet l’analyse des valeurs extrêmes repose principalement sur les distributions limites des maxima et les domaines d’attraction des maxima. Ces distributions apparaissent comme les seules distributions limites possibles du maximum d’un échantillon de variables aléatoires indépendantes et identiquement distribuées. Nous allons, sans pour autant se vouloir exhaustif,

Au delà du max-stable

L’absence d’un cadre paramétrique exhaustif pour les extrêmes multivariés constitue un obstacle majeur pour l’étude de la dépendance des extrêmes. En effet sous l’hypothèse de max-stabilité, les questions liées à la dépendance asymptotique sont relativement bien résolues aux travers des modèles max-stables mais ces derniers sont assez restrictifs en ce qui concerne les aspects d’indépendance asymptotique des réalisations les plus extrêmes puisqu’ils se limitent à la seule notion usuelle d’indépendance stricte. Ceci n’offre pas la flexibilité souhaitée pour modéliser des données asymptotiquement indépendantes. Plusieurs travaux proposent d’autres classes de modèles plus générales, qui décrivent le comportement des queues de distributions tout en englobant les modèles existants. Dans la suite, en se basant sur les travaux de Ledford et Tawn (1996, 1997), Resnick (2002), Ramos et Ledford (2009, 2011), Wadsworth et Tawn (2013) et de Haan et Zhou (2011), on se propose d’explorer et analyser ces nouveaux modèles plus flexibles et appropriés aux cas de l’indépendance asymptotique.

Variation régulière cachée : Resnick (2002)

En se basant sur les travaux de Ledford et Tawn (1996, 1997), un raffinement de la classe des distributions multivariées variant régulièrement dans le cas de l’IA est introduit par Resnick (Resnick, 2002) sous le nom de variation régulière cachée. La notion de variation régulière cachée désigne une sous-famille semi-paramétrique de la famille complète des distributions possédant une variation régulière multivariée dans le cas de l’IA. L’idée est de mettre en avant des outils permettant de capturer les résidus de dépendance négligés par la mesure µ de la variation régulière relative à la théorie des valeurs extrêmes. En quelque sorte, par le biais d’une nouvelle mesure plus précise, on va zoomer sur la région (0, ∞] d dans le cas d’une indépendance asymptotique. Bien sûr on n’aura pas besoin de le faire dans le cas de la dépendance asymptotique.

Existence d’une direction d’extrapolation meilleure que celle de WT

Dans ce paragraphe on détaille la méthode de simulation permettant de trouver des couples (α1, a) donnant une direction d’extrapolation meilleure que celle de Wadsworth et Tawn (2013). Les données simulées englobent un large spectre de dépendance extrémale. Les distributions bivariées considérées sont les suivantes : (a) la distribution bivariée normale avec une corrélation ρ = 0.5; (b) la distribution bivariée inverse max-stable avec une structure de dépendance logistique; (c) la loi de queue inférieure de Clayton avec paramètre m = 1.4; (d) la distribution bivariée normale avec une corrélation ρ = −0.3. Pour permettre de comparer au mieux notre approche avec celle de Wadsworth et Tawn (2013), les paramètres des distributions (a) et (b) sont choisis d’une telle façon que η = 0.75, ce qui correspond à des cas d’indépendance asymptotique avec des fonctions à variation lente ray-indépendantes. La distribution (c) correspond à la dépendance asymptotique (η = 1) avec une fonction à variation lente ray-dépendante. La dernière distribution (d) correspond à l’indépendance asymptotique (η = 0.35), avec une association négative. Nous nous plaçons dans le même contexte que celui utilisé par Wadsworth et Tawn : pour chaque distribution considérée, nous avons généré 5000 points avec des marges exponentielles et nous avons gardé 10% des données à des fins d’estimation. Ce processus a été répété 500 fois. On rappelle que pour évaluer la performance de leur procédure d’estimation dans le premier quadrant positif tout entier, Wadsworth et Tawn ont considéré des intervalles de la forme y(α/(1−α), ∞)×(y, ∞), en fixant y = 1.5 log 5000 et en multipliant y par α/(1−α) pour obtenir la valeur de l’abscisse x et ceci pour la séquence des valeurs du pseudo angle α = 0.5, 0.45, . . . , 0, 05. En particulier α = 1/2 correspond à la stratégie d’extrapolation classique suivant des lignes parallèles à la diagonale (Ledford et Tawn (1997)). Pour estimer les probabilités des intervalles considérés par Wadsworth et Tawn, on a utilisé (4.20).

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela rapport-gratuit.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

Remerciements
Introduction générale
1 Résumé de la thèse
2 Organisation des différents chapitres
1 Préambule
1.1 Distributions de même type / loi stable
1.2 Variation régulière
1.2.1 Variation lente
1.2.2 Représentation de Karamata
1.2.3 Propriétés des fonctions à variations lente
1.3 Variation régulière
1.3.1 Variation régulière univariée des queues de distributions
1.3.2 Propriétés des fonctions à variation régulière
1.4 Variation régulière multivariée
1.4.1 Notation vectorielle
1.4.2 Coordonnées pseudo-polaires et mesure spectrale
1.5 Processus ponctuels
1.5.1 Processus ponctuel
2 Théorie des extrêmes
2.1 Introduction
2.2 Approche univariée
2.2.1 Approche des maxima par bloc faisant intervenir le modèle GEV
2.2.2 Caractérisation des extrêmes univariés par un processus ponctuel
2.2.3 Lois max-stables
2.2.4 Modèles de dépassements GPD
2.3 Lien entre les modélisations GEV et GPD
2.3.1 Du modèle GEV au modèle GPD
2.3.2 Du modèle GPD au modèle GEV
2.4 Approche multivariée
2.4.1 Caractérisation des extrêmes multivariés par des processus ponctuels
2.4.2 Distribution des extrêmes multivariée
2.4.3 Ajustement des modèles multivariés
2.5 Insuffisance du cadre max-stable
3 Au delà du max-stable
3.1 Introduction
3.2 Caractérisation de l’(in)dépendance asymptotique par les mesures χ et χ¯
3.3 Modèles de Ledford et Tawn (1996-1997)
3.4 Relation entre η et L et les mesures de dépendances χ et χ¯
3.5 Quelques modèles pour l’indépendance asymptotique
3.5.1 Variation régulière cachée : Resnick (2002)
3.5.2 Dépendance résiduelle extrémale : De Haan et Zhou (2011)
3.5.3 Modèle paramétrique de Ramos et Ledford (2009)
3.5.4 Modèle de maxima de Ramos et Ledford (2011)
3.6 Modèle de Wadsworth et Tawn (2013)
4 Nouvelle représentation de queue de distributions bivariées
4.1 Introduction
4.1.1 Exemples pour lesquels la condition de Wadsworth et Tawn n’est pas valide
4.1.2 Modification de la condition de Wadsworth et Tawn (2013)
4.2 Nouvelle représentation de queue de distributions bivariées
4.2.1 Exemples
4.3 Nouvelle mesure exponent
4.4 Inférence statistique
4.4.1 Estimation de la fonction κ
4.4.2 Estimation de la fonction g1,∗(β,γ)
4.4.3 Une nouvelle stratégie d’extrapolation
4.5 Simulations
4.5.1 Existence d’une direction d’extrapolation meilleure que celle de WT
4.5.2 Choix pratique pour les rayons d’extrapolation
4.6 Conclusion
5 Vers une représentation paramétrique des queues de distributions multivariées
5.1 Introduction
5.2 Approche semi-paramétrique
5.3 Modèles de dépendance pour les extrêmes multivariés
5.3.1 Distribution des maxima : cas bivarié
5.3.2 Extension au cas multivarié
5.4 Modèles paramétriques pour Hκ(α)
5.4.1 Construction de Hκ(α) à partir d’une mesure positive quelconque
5.4.2 Exemples
5.5 Inférence et simulation
5.5.1 Simulation de (Sβ, Tγ) satisfaisant (5.27)
5.5.2 Vraisemblance
5.6 Conclusion
6 Conclusion et perspectives