Les modèles de survie basés sur SVM

La maladie pulmonaire obstructive chronique est une maladie respiratoire chronique causée principalement par le tabagisme et touchant le plus souvent des personnes âgées de plus de quarante ans. Parce qu’elle est responsable presque partout dans le monde du plus haut taux de réadmission ainsi que de la troisième cause de décès, les chercheurs et cliniciens s’intéressent à prédire le risque auquel les patients font face, de sorte à améliorer les soins et les traitements tout en optimisant les prestations des services de santé. Dans le domaine de l’analyse de survie, on s’intéresse à prédire le temps avant qu’un événement particulier ne survienne, savoir une éventuelle ré-hospitalisation ou un décès dans le cas de la maladie pulmonaire obstructive chronique.

Cet article présente des preuves empiriques de l’utilisation technique d’apprentissage automatique pour l’estimation du non linéarité des modelés de transformation pour l’analyse de survie.

Il faut noter que l’analyse de survie, ou la prédiction de survie intervient dans des domaines variés pour examiner le risque qu’un événement se produise au cours d’une période d’observation fixée. Bien que ce type de prédiction soit surtout utilisé dans le milieu médical, on l’utilise aussi dans beaucoup de domaine en particulier en économie (prédiction de faillite), en mécanique (panne de moteur) ,en électricité (temps de vie des composante électronique) ,en science sociales (estimation du temps entre les mariages et les divorces) ainsi que dans divers autres domaines.

La tâche d’estimer un modèle de transformation basé sur un ensemble de donnée reflétant la survie des patients a été intégrée dans un contexte d’apprentissage et de machine à vecteur de support (Svms). L’objectif ici, est de reformuler la tâche en tant que problème de classement via l’index de concordance, un problème qui peut être résolu efficacement dans un contexte de risque structure et technique de minimisation et d’optimisation convexe. Pour établir le classement souhaité chaque observation est comparée à son proche voisin. Un avantage principal de cette approche est l’utilisation de noyaux non linéaires implémentant automatiquement les effets non paramétriques des variables. L’objectif de cet article est alors doublé :

➤ Nous présenterons des données empiriques supplémentaires (matériel supportant cette technique basée sur six cliniques liées au cancer). Et discuterons de la pertinence de la technique actuelle par rapport aux approches classiques pour de telles données
➤ Et nous étudierons de manière empirique, comment la technique basée sur svm peut être renforcée pour inclure ce qu’on appelle : régressions contraintes interpolant la méthode et la prédiction ponctuelle. Un inconvénient de la formulation de classement de tels modèles est que le classement est établi sur un choix arbitraire d’observations. On cherche donc à savoir si la performance augmente en divisant les observations en fonction d’intervalles sur les temps d’évènement ; une technique qui peut être mise en œuvre qu’en utilisant des observations factices.

Les modèles de survie basés sur le noyau 

Cette section commence par une discussion brève des modèles de survie existants basées sur la svms. Dans une deuxième sous-section, deux nouvelles méthodes sont proposées. De plus le résultat de ce type de modèle de survie ne peut généralement pas être interprété comme un échec temps ; nous désignerons le résultat du modèle par l’indice de pronostic µ(x) aulieu de la prédiction du modèle.

Modèles de survies existants basés sur svm 

Les excellentes performances des machines à vecteurs de support pour la classification et la régression ont conduit à se demander si ce type de modèle pouvait être étendu à un autre problème statistique. Lors de l’analyse des données de survie, on s’intéresse au temps entre un certain point de départ et la survenu d’un évènement prédéfini. Une première approche à laquelle on pourrait penser est d’utilisé des modèles de régression pour modéliser le temps de récurrence. Cependant, les données de survie contiennent généralement des points de données avec des informations incomplètes (information appelées données censurées). Bien qu’il existe différents type de censures ; nous limiterons notre attention à la censure de droite dans ce travail. Les véritables informations censurées sont les informations pour lesquelles l’heure exacte de l’évènement n’est pas connue, mais, où une limite inférieure de ce type est connue. Seulement l’incorporation des informations pour lesquelles le temps exact d’échec connu conduirait à une sous-estimation du temps de survie.

Le problème de l’utilisation de la régression vectorielle de support pour les données censurées réside dans l’incertitude sur les résultats y . Les premières approches des données censurées en utilisant des stratégies de régression, soit en omettant les observations censurées, ce qui dans des temps d’échec sous-estimés, ou à traiter les observations censurées comme des non événements résultant en des modèles biaisés. Pour utiliser toutes les informations disponibles (les observations censurées donnent des informations sur l’intervalle dans lequel l’événement se produit) Shivaswamy [12] a proposé une approche de régression vectorielle de support pour les données censurées (svcr). Pour les observations non censurées, les mêmes contraintes sont prises en compte modèle de régression svm standard. Pour les observations censurées à droite, il est connu que l’échec ne s’est pas produit avant l’heure de la censure.

La différence entre les deux modèles réside dans la peine appliquée ou perte d’indices pronostiques incorrects , ce qui peut être interprété comme les temps d’échec prévus pour les approches de régression. La méthode svcr pénalise les prédictions incorrectes mêmes si la prédiction était supérieure ou inférieure au temps d’échec observé et pénalise les prédictions incorrectes pour le droit censuré données uniquement si la prédiction est inférieure au temps de censure observé. Le raisonnement étant donné qu’il est seulement connu que le temps d’échec est supérieur à celui observé du résultat. De plus, la pénalité pour les mauvaises prédictions est la même, elle consiste en une prévision des temps de défaillance censurés ou observés.

Prise en charge des machines à vecteurs sur la base de contraintes Quand on n’utilise pas les modèles de régression, les problèmes de survie sont souvent traduits en classification des problèmes pour répondre à la question de savoir si le patient survivra à un certain prédéfini temps (par exemple, survivant 5 ans après la chirurgie). Cependant, pour pouvoir inclure autant d’événements que possible, ce délai prédéfini doit être pris très tard.

Au contraire, on souhaiterait un délai précoce, afin de retenir autant de patients que possible, puisque tous les patients censurés avant cette heure seront perdus pour l’analyse. Un autre problème de cette approche est que la validité de la méthode diminue quand de plus en plus de patients sont censurés plus tôt. Pour surmonter les problèmes décrivent ci-dessus, il a été proposé de formuler le problème de la survie comme un classement problème dans [9,11] et une simplification informatique a été proposée dans [10].

L’idée de formuler le problème de la survie en tant que problème de classement est que dans les applications cliniques, on s’intéresse souvent à la définition des groupes à risque. L’un n’est pas principalement intéressé par une prédiction de la durée de survie, mais si le patient a un risque élevé ou faible que l’événement se produise, de sorte qu’un traitement approprié peut être donné. Pour atteindre cet objectif, une méthode de classement svm est utilisée, similaire au modèle rankSVM pour l’apprentissage par classement ou par préférence [20]. La méthode proposée par [9] et [11] implique une régularisation comme d’habitude et une pénalisation pour chaque paire comparable de points de données pour lesquels l’ordre dans l’indice de pronostic diffère de l’ordre observé.

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela rapport-gratuit.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

I) Introduction
II) Modèle Tm
1) Modèle de transformation
2) Les modèles de survie basés sur SVM
a) Modèle de survie existant basés sur SVM
b) Nouveaux modèles sur SVM
3) Mesures et performances
a) Jeux de données
b) Mesures de performances
c) Expériences
III) Conclusion
Annexe 1 : Référence
Annexe 2 : Tableau 1
Annexe 3 : Tableau 2
Annexe 4 : Légende des figures
Annexe 5 : Modèle 1
Annexe 6 : Modèle 2
Annexe 7 : Modèle 3
Annexe 8 : Figures

Lire le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *