Hypertextualisation automatique de documents techniques

Hypertexte et Hypermédia

Genèse d’un concept

L’Hypertexte au même titre que les Bases de Données et l’Intelligence Artificielle se situe comme une tentative originale de représentation de l’information. Cette représentation, contrairement aux deux autres domaines, ne s’appuie pas sur une démarche rigoureuse et méthodologique. En effet, l’Hypertexte ne propose ni modélisation du monde réel ni organisation logique de la connaissance, il introduit ainsi une rupture dans la démarche algorithmique et arborescente : les possibilités d’association sont vastes, la rapidité d’accès assurée et la progression dans l’information personnalisée.

Alors que les définitions de l’I.A. et des Bases de Données sont claires et laissent peu de libertés quant à l’interprétation, celle de l’Hypertexte en revanche, restent plus difficiles à cerner. On trouve dans l’ensemble des travaux spécialisés dans le domaine de l’Hypertexte des tentatives de définition qui tournent autour :
– des éléments de base qui composent l’hypertexte et des objets qu’il manipule,
– des spécificités qu’un système hypertexte doit offrir (qui du même coup permettent de qualifier d’hypertexte ledit système),
– de comparaison avec les graphes,
– des avantages qu’il offre par rapport à la consultation essentiellement séquentielle des documents papier,
– des différences qui le distinguent des autres techniques de traitement de l’information (un hypertexte n’est pas un SGBD ni un système de recherche documentaire et moins encore un système de gestion de fichiers, etc…),

Cette difficulté à trouver une définition précise à l’hypertexte vient certainement du fait, que le terme lui-même se rattache à une réalité en perpétuelle mouvance. Alors qu’un regard sur l’histoire de l’hypertexte aurait pu être le moyen de stabiliser sa définition (éclairée en cela par les travaux de Bush, Engelbart et Nelson) les incessantes réalisations d’hypertextes introduisent constamment de nouveaux éléments qui perturbent cette définition. En effet, l’hyperdocument, l’hypermédia, le document multimédia interactif, les systèmes, produits et logiciels hypertextes, le livre électronique, l’aide en ligne hypertexte, les systèmes auteur, etc… dont on pressent bien le rapport avec le concept d’hypertexte, sont autant de notions rapportées qui justifient la perpétuelle révision des définitions proposées.

Des origines de l’Hypertexte

Trois visionnaires : Vannevar Bush, Douglas Engelbart et Theodor Nelson sont reconnus mondialement comme les pionniers de tous les travaux sur l’hypertexte [Daniel 90] [Nielsen 89] [Conklin 87]. Alors que Bush confronté à des problèmes de documentation scientifique imaginait un système fonctionnant comme le cerveau humain et lançait les bases de ce qu’un tel système devait être, Douglas Engelbart en réalisait le premier prototype et Theodor Nelson baptisait ce nouveau mode de représentation de l’information.

La version Vannevar Bush de l’Hypertexte

L’origine reconnue (le terme hypertexte n’existait cependant pas encore à cette époque !) de l’hypertexte remonte à Vannevar Bush (alors conseiller scientifique du Président F.D. Roosevelt) qui s’interrogeait sur la manière de « mécaniser » les systèmes de documentation scientifique devant les difficultés qu’il rencontrait pour manipuler un volume d’information de plus en plus important. Il imagine à l’époque, le système Memex qui imite les capacités associatives de l’esprit humain où possibilité est donnée d’explorer et d’annoter de l’information textuelle ou graphique (la citation ci-dessous est emprunté à [Nielsen 89], extrait de l’article de V.Bush, « As we may think », paru en Juillet 1945 dans Atlantic Monthly, pp 101-108) : « …The human mind (…) operates by association. With one item in its grasp, it snaps instantly to the next that is suggested by the association of thoughts, in accordance with some intricate web of trails carried by the cells of the brain. Selection by association, rather than indexing, may yet be mechanized. Man cannot hope fully to duplicate this mental process artificially, but he certainly ought to be able to learn from it. One cannot hope to equal the speed and flexibility with which the mind follows an associative trail, but it should be possible to beat the mind decisively in regard to the permanence and clarity of the items resurrected from storage… »

Compte tenu des médias de restitution de l’époque (papier, microfiches, photos…), V. Bush n’a pu proposer de prototype fonctionnel du système de consultation idéal que représentait son système Memex. Du reste, il admettait que seuls d’importants progrès technologiques pouvaient rendre son projet réalisable.

La version Douglas Engelbart de l’Hypertexte

C’est moins de 20 ans plus tard que Douglas Engelbart proposait une implémentation des idées de Vannevar Bush. Le système NLS (oN Line System) était né. Plus qu’une simple implémentation, Engelbart voulait montrer qu’une assistance de l’être humain par l’ordinateur en matière de manipulation de l’information pouvait aller vers l’amélioration des capacités intellectuelles de l’utilisateur. Il décrit NLS comme une réalisation expérimentale d’un outil répondant aux besoins de ses activités quotidiennes. Dans ce système se retrouve stocké tout son environnement de travail ; plans, programmes, rapports, documents, bibliographies, etc… qui lui permettent de créer, concevoir, planifier, corriger par l’intermédiaire d’un poste de travail informatique.

La version Theodor Nelson de l’Hypertexte

Theodor Nelson, alors lancé à cette même époque dans le projet Xanadu, invente les termes hypertexte et hypermédia. Xanadu est une sorte d’environnement de publication où des millions de personnes de par le monde pourraient se connecter à travers l’écrit, le son, l’image et coopérer dans leurs créations. Il y autorise certaines fonctionnalités telles que :
– avoir accès à l’historique d’un document particulier,
– pouvoir lier de façon explicite un document à ceux avec lesquels il entretient des rapports,
– pouvoir gérer dans un même et unique environnement réseau tous les documents,
– respecter le copyright et les royalties dans le cas de travail coopératif,
– etc…

Des visions complémentaires

De récents travaux tendent à préciser le fonctionnement des hypertextes, à élargir leurs champs d’action ou à leurs donner une réalité particulière. Nous présentons quelques aspects originaux (livre électronique, hypermédia, hyperdocument…) gravitant autour du concept hypertexte.

Livre électronique

Les travaux qui décrivent les systèmes à base de livre électronique [Savoy 88] [Pasquier 89] cherchent à montrer la spécificité du livre électronique en le distinguant fonctionnellement de l’hypertexte. Ainsi, J. Savoy appréhende l’hypertexte comme une alternative électronique permettant de rompre avec la linéarité des livres traditionnels. Il garde principalement à l’esprit l’essence même des travaux de V. Bush selon laquelle la structure linéaire et statique de l’écrit ne correspond pas aux processus mentaux humains. Il implémente le livre électronique EBOOK3 dédié à l’animation de textes par des traitements numériques, qui gère texte et image en permettant également l’exécution de programmes informatiques (pour présenter des résultats numériques, exercer les connaissances acquises par le lecteur, construire des graphiques complexes) dans les domaines des sciences telles que la recherche opérationnelle, l’économétrie, les statistiques, la physique, la chimie, etc… Dans ce projet, J. Savoy parle constamment de livres électroniques et non d’hypertextes. Il considère son système comme hypertexte dans le sens où celui-ci permet une exploration non séquentielle des documents (du reste cela représente pour lui, LA caractéristique fondamentale de l’hypertexte). J. Savoy distingue l’hypertexte du livre électronique dans le sens où ce dernier met en évidence les capacités d’apprentissage (et d’enseignement) du livre. Un livre est destiné à fournir de la connaissance, à l’expliciter au moyen d’exemples et à vérifier sa bonne assimilation par le lecteur (J. Savoy cite souvent à cette occasion l’étudiant) au moyen d’exercices particuliers. C’est ce qu’il a reproduit dans EBOOK3 en mettant à la disposition d’utilisateurs en situation d’apprentissage des connaissances brutes auxquelles il associe des exemples guidés, des exercices et leurs corrections avec un haut niveau d’interaction (cela est corroboré par le fait qu’EBOOK3 s’applique particulièrement bien aux disciplines scientifiques où on retrouve le triangle connaissances, exercices, corrections). Dans cet article J. Savoy prédispose le livre électronique à une utilisation de type Enseignement Assisté par Ordinateur.

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela rapport-gratuit.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

Introduction
Chapitre 1 Hypertexte et Hypermédia
1.1 Genèse d’un concept
1.1.1 Des origines de l’Hypertexte
1.1.1.1 La version Vannevar Bush de l’Hypertexte
1.1.1.2 La version Douglas Engelbart de l’Hypertexte
1.1.1.3 La version Theodor Nelson de l’Hypertexte
1.1.2 Des visions complémentaires
1.1.2.1 Livre électronique
1.1.2.2 Document Multimedia interactif
1.1.2.3 Hypermédia
1.1.2.4 Hyperdocument
1.2 Une définition fédérée
1.2.1 Noeuds et Liens
1.2.2 Système auteur et système lecteur
1.2.3 Navigation et Recherche
1.2.4 Les versions d’un hypertexte
1.2.5 Hypertexte coopératif
1.2.6 Modélisation des systèmes hypertextes
1.2.7 Hypertexte et Maintenance
1.4 Finalité de l’Hypertexte
1.5 Hypertexte et Utilisateur
1.5.1 Utilisateur et Lecture électronique
1.5.2 Méthodologie de conception et Ingénierie de l’hypertexte
1.5.3 Utilisateur et Désorientation
1.6 Texte et Hypertexte
Chapitre 2 Hypertexte, Bases de Données et Intelligence Artificielle
2.1 Synergie des techniques
2.2 Bases de données et hypertexte
2.2.1 L’hypertexte comme nouveau modèle de recherche d’information
2.2.2 Hypertexte et Bases de Données Relationnelles
2.2.3 Hypertexte et Bases de données Orienté Objet
2.3 Hypertexte et Intelligence Artificielle
2.3.1 Dynabook: le livre dynamique
2.3.2 GKBS : Un système hypermédia à base de connaissances
2.3.3 Ergolab
2.4 Indexation et recherche documentaire
2.5 Indexation manuelle ou indexation automatique
2.5.1 Indexation manuelle
2.5.2 Hypertextualisation automatique et indexation manuelle
2.5.3 Indexation automatique
2.5.3.1 Méthode par assignation
2.5.3.2 Méthodes statistiques
2.5.3.3 Méthodes syntaxiques
2.6 Hypertextualisation et indexation automatique
2.6.1 Intex
2.6.2 Lexter
2.6.3 Termino
2.6.4 Lexinet
2.6.5 Spirit
2.7 Éléments essentiels de la synergie
Chapitre 3 L’hypertextualisation par la structure des documents
3.1 Approche structurelle
3.2 Déterminer les noeuds
3.3 Structure des documents
3.4 La documentation technique à l’Electricité De France
3.5 Documents structurés
3.6 Les expériences d’hypertextualisation automatique
Chapitre 4 Le processus d’hypertextualisation automatique
4.1 Un format pivot : le Rich Text Format
4.2 Extraction des noeuds
4.3 Repérage des liens références
4.4 Grammaire de références croisées
4.5 Conclusion
Chapitre 5 Hypertextualisation et Actualisation Apport du modèle relationnel
5.1 Actualisation des documents hypertextualisés
5.2 Modèle relationnel versus modèle orienté objet
5.3 Représentation relationnelle de documents textuels
5.4 Schéma relationnel d’un réseau hypertexte
5.4.1 Attributs du schéma relationnel
5.4.2 Extension réduite des relations
5.4.3 Administration des relations
5.5 Validité des parcours de lecture
5.5.1 Schéma relationnel des parcours de lecture
5.5.2 Extension des relations supplémentaires
5.5.3 Administration des parcours
5.6 Index et normalisation relationnelle
5.7 Conclusion
Conclusion