Problème de la pertinence et de l’utilité des règles d’association

La lecture assistée par ordinateur

Le développement de l’intelligence artificielle et du traitement et de l’analyse des textes ont permis de résoudre de nombreuses difficultés liées à la recherche scientifique. Ces technologies facilitent le travail en permettant de réduire le temps consacré aux traitements des textes. La lecture assistée par ordinateur a évolué grâce aux nouvelles technologies et en s’adaptant aux besoins de l’utilisateur. L’ordinateur ne peut pas remplacer le raisonnement et la pensée humaine, mais avec le temps, la capacité atteinte et sa flexibilité permettent d’ offrir de plus en plus d’options à l’utilisateur. Les avancées de la recherche se manifestent par l’amélioration des lecteurs, par leurs fonctionnalités et par leurs ergonomIes. Il arrive parfois que nous soyons forcés d’imprimer un texte au lieu de le lire à l’ écran de l’ordinateur afin de souligner les mots clés et d’y effectuer des opérations manuelles qu’on ne peut pas exécuter automatiquement. Ces inconvénients sont causés par le manque de fonctionnalités offertes par certains lecteurs. Pour pallier à ces lacunes, il est important d’améliorer les systèmes existants.

Travaux récents Meunier a présenté l’ importance de l’interface du lecteur du texte. Il y mentionne les techniques du soulignement et de la mise en forme des paragraphes qui simplifient la lecture et la compréhension du texte. Il nous indique également d’autres fonctionnalités permettant de sauvegarder les mots clés, d’ exporter un texte sous d’autres formats afin de le modifier ou de le réorganiser. Aussi, il existe des fonctions qui permettent de segmenter le texte afin de faciliter son analyse basée sur des méthodes de classification. Ce travail permet de produire des lexiques et offre des méthodes qui facilitent la production de résumés. L’affichage des courbes ou graphes statistiques permet également une interprétation générale du texte. D’autre part, l’ utilisateur peut modifier son texte en se basant sur des notes enregistrées. Meunier a développé un lecteur de texte. Il emploie des annotations qui facilitent la compréhension et l’analyse du texte. Ce lecteur est dédié aux utilisateurs experts. Ainsi, il facilite la manipulation du texte, la production de résumé, l’extraction des mots clés, la modification ou la suppression de passages du texte, etc. D’autre part, Lucas et al. [40] décrivent la façon de compter le nombre d’occurrences des mots dans un texte et expliquent comment la réduction des occurrences facilite l’analyse du texte. L’ analyse du texte est traitée selon une des deux méthodes suivantes; la méthode supervisée ou la méthode non supervisée. La méthode supervisée représente un outil qui permet de reproduire une tâche faite sur un petit échantillon, et répétée à la grandeur du document. La classification représente un moyen de l’apprentissage supervisé. Cette méthode facilite la vérification de la performance du fonctionnement. Par exemple, elle vérifie l’ existence d’un spam ou non dans un courriel, c’est une tâche difficile, mais donne 70% de bons résultats. La méthode non supervisée organise le texte d’une autre manière. Pour structurer le texte, cette méthode se base sur l’analyse des résultats obtenus. La méthode non supervisée exige de l’utilisateur un ajustement de la structure du travail.

Biskri et al. [2] présentent GRAMEXCO qui est une application d’analyse textuelle. Elle est basée sur les n-grammes, une unité d’information possible pour toutes les langues. Cette application nécessite l’ intervention de l’utilisateur pour ajuster certains paramètres lors du fonctionnement. Dans une autre étude, Brier et al. [6] présentent les façons et les techniques d’analyse du texte assistée par ordinateur en se basant sur l’analyse de contenus quantitatifs. Cette technique utilise des dictionnaires et permet de donner le nombre d’ apparitions des mots du texte. Les chercheurs ont utilisé des techniques hiérarchiques et non hiérarchiques de classification pour indiquer et identifier les liens entre la linguistique computationnelle et l’analyse des données relationnelles. Cette application contient une interface qui permet d’afficher graphiquement les groupes dérivés du texte sous trois catégories. Il y ad’ abord les mots rares qui ne se produisent pas assez fréquemment dans le texte. Viennent ensuite les mots les plus communs avec un taux d’occurrence de 500 fois et finalement le troisième groupe comprend les mots dont la fréquence est supérieure à celle de la moyenne de tous les mots contenus dans le texte.

Cette technique facilite la compréhension du texte, car les mots les plus présents dans le texte portent des informations sur le sens général du contenu. Les mots avec une faible occurrence dans le texte présentent un niveau d’ association faible par rapport à ceux qui ont un très grand nombre d’ apparitions. Cette méthode montre le choix des mots dans un discours ainsi que leur équilibre et leur utilisation. Reich et al. [38] décrivent les difficultés des étudiants dans la recherche des commentaires sur un texte à évaluer. En effet, les étudiants cherchent toujours à analyser leurs textes, à mettre des commentaires et à sauvegarder les mots clés. Les chercheurs ont proposé une méthode d’analyse de texte qui facilite le traitement des documents avec un temps d’exécution très rapide. L’analyse assistée par ordinateur est disponible avec des méthodes supervisées qui sont basées sur l’ intervention de l’ utilisateur.

Le rôle de l’utilisateur est de faire la lecture puis d’ étiqueter un ensemble de données. Le projet de Reich et al. se base sur une méthode d’analyse non supervisée appelée « sujet de modélisation ». Elle permet d’ extraire les relations sémantiques entre les cooccurrences des mots. S’ il y a deux mots qui se répètent dans plusieurs documents, alors ils font référence à un concept ou un thème similaire. Les méthodes non supervisées permettent de faciliter l’analyse avec des hypothèses a priori sur le contenu du texte. Mais l’ utilisateur a quand même la responsabilité des différentes interprétations et du jugement des résultats obtenus. A.Hearst et al. [20] présentent les façons d’ analyser un texte littéraire. Il s’ agit d’un système qui offre des outils de traitement du texte selon des algorithmes qui permettent l’ interprétation et l’exploration des données textuelles.

Ce système est basé sur la recherche grammaticale, la recherche de similarité contextuelle, la visualisation de modèles de contexte des mots, l’examen et l’organisation du texte pour effectuer une comparaison et construire des hypothèses. Il est orienté vers la littérature et l’étude de la langue. En effet, il facilite la collecte d’information et assure son organisation. Il explore les mots liés entre eux et il donne l’option d’écrire des notes. Ce système est utilisé actuellement par des groupes de chercheurs pour analyser le récit «The North American Slave», les écrits de Stephen Crane et de William Shakespeare. Le travail de Hearst et al. permet d’ afficher le nombre d’ apparitions des mots dans la liste des phrases où le mot cible s’ affiche au centre et les mots de contexte à sa gauche ou à sa droite. Il offre aussi des méthodes pour extraire des relations entre les mots en permettant à l’ utilisateur de choisir deux mots clés de même que la relation entre-eux à l’aide d’un menu déroulant. L’utilisateur a une interface qui permet de vou les résultats de la recherche grammaticale et de les évaluer. Ce système simplifie la détection automatique du lien et du rapport entre les phrases grâce à l’extraction des relations entre les mots.

Conclusion

Dans ce mémoire, nous présentons une nouvelle application d’édition et d’analyse des données textuelles. Comme plusieurs autres applications existantes, notre application offre un grand nombre de fonctionnalités de base de traitement du texte. Elle ajoute également de nouvelles fonctionnalités sur le texte. La contribution majeure de notre travail est l’affichage de tous les mots du texte avec le nombre de leurs apparitions, la sauvegarde des mots clés dans le texte, la suppression de ceux qui se ressemblent et l’affichage de tous les mots dans le texte. La fonctionnalité qui permet d’ extraire les données dans un autre fichier texte ou dans une autre interface de l’application facilite à l’utilisateur la rédaction de son résumé. En effet un utilisateur peut tout faire dans cette application sans avoir besoin d’utiliser un autre logiciel. Notre application a été testée par plusieurs utilisateurs. Nous pouvons les classer en deux grands types d’utilisateurs: utilisateurs simples et utilisateurs spécialisés. Les utilisateurs simples sont ceux qui se contentent de quelques fonctions de base comme la lecture simple. Les utilisateurs spécialisés sont ceux qui exploitent la grande majorité des fonctionnalités de l’application.

Les utilisateurs ont évalué notre application sur plusieurs aspects comme leurs avis sur le logiciel, leurs niveaux de satisfaction, leurs types d’utilisation en fonction de chaque fonctionnalité. L’évaluation de notre logiciel a été assurée par un questionnaire remis à chaque utilisateur. Il est demandé de le remplir à la suite de l’utilisation de l’application. Comme résumé dans le chapitre 4, nous avons obtenu une majorité de satisfactions sur différentes fonctions: la rédaction, l’ enregistrement et la comparaison des notes qui aide à mieux comprendre un texte. La majorité des utilisateurs ont trouvé que les fonctions d’enregistrement des notes et des commentaires ainsi que les tests de ressemblance entre les phrases sont très importants dans la lecture d’un texte. Pour résumer, dans le cadre de ce mémoire, nous avons présenté un logiciel de lecture de texte simple à utiliser, adéquat à différents types d’utilisateurs présentent plusieurs nouvelles fonctionnalités très intéressantes et utiles aux usagers. L’utilisation d’un dictionnaire dans cette application sera très intéressante pour les utilisateurs. Ce qui facilite l’affichage des synonymes et des antonymes pour les utilisateurs, créer des méthodes qui permettent de classifier les mots qui ont le même sens et de segmenter le texte.

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela rapport-gratuit.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

Chapitre 1 – Introduction
1.1 Introduction
Chapitre 2 – État de l’art
2.1 Introduction
2.2 Les analyseurs
2.2.1 Historique
2.2.2 Analyse de discours
2.2.3 Analyse syntaxique
2.2.4 Analyse sémantique
2.3 Fouille de texte
2.3.1 Historique
2.3.2 Domaine d’utilisation
2.4 La lecture assistée par ordinateur
2.4.1 Présentation
2.4.2 Travaux récents
2.5 Les règles de classification
2.5.1 Introduction
2.5.2 Définition
2.5.3 Principe
2.5.4 Méthodes de classification
2.5.1 Calcul de distance
2.5.2 Méthode de classification automatique
2.5.3 Méthodes d’ affectation
2.6 Les règles d’association
2.6.1 Présentation
2.6.1 Définition
2.6.1 Règle d’association positive et négative
2.6.2 L’ extraction des règles d’association
2.6.3 L’ algorithme Apriori
2.6.4 Problème de la pertinence et de l’utilité des règles d’ association
2.6.5 Méthodes de réduction
2.6.6 Règles d’association maximale
2.7 Conclusion
Chapitre 3 – Description du fonctionnement de notre application
3.1 Introduction
3.1 Principe
3.2 Création des interfaces graphiques
3.3 Fonctionnalité attendu
3.3.1 L’ affichage du texte
3.3.2 Mise en forme
3.3 .3 Enregistrement
3.3.4 La recherche
3.3.5 La sélection
3.3.1 Sommaire
3.3.2 Impression
3.4 Fonctionnalités non standards
3.4.1 Nombre d’occurrences des mots
3.4.2 Ajouter des notes
3.4.1 Tester la. similarité des paragraphes
3.4.2 Gestion des notes
3.5 Conclusion
Chapitre 4 – Expérimentation
4.1 Introduction
4.2 Calculer le nombre d’occurrence des mots
4.3 Ajouter des notes
4.4 Similarité des notes
4.4.1 Algorithme
4.5 Exportation
4.6 Questionnaire
4.7 Réponse aux questions
4.7.1 Analyse du questionnaire
4.8 Conclusion
Conclusion
Bibliographies
Webographie
Annexe A – Textes utilisés pour l’expérimentation

Rapport PFE, mémoire et thèse PDFTélécharger le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *