Référencement spatial et sémantisation de sources iconographiques 

Le degré de certitude

Dans des domaines variés, diverses études sur la perception de l’incertitude ont été amenées afin d’évaluer les paramètres qui en conditionnent la présence, afin d’interagir avec elle et la rendre un support pour la prise de décisions [MacEachren A.M. et al., 2005; Thomson J. et al., 2005]. [Pang A.T. et al., 1997] parle d’incertitude à trois niveaux : dans le processus d’acquisition, d’analyse et de visualisation des données. En patrimoine historique, les facteurs d’incertitude d’une source sont liées à trois aspects : la qualité, la cohérence et l’objectivité. [Thomson J. et al., 2005] propose une classification plus détaillée de ces aspects basée sur 9 sous-catégories (Fidélité, Précision, Intégralité , Cohérence, Filiation, Pertinence, Crédibilité, Interdépendance) pour décrire l’incertitude en patrimoine historique.
De façon générale, il est impossible de définir un ordre absolu de fiabilité des sources. Trop de paramètres rentrent en jeu pour des sources ayant des objectifs trop variés. On peut affirmer que le niveau de certitude augmente en fonction de la richesse d’informations métriques et visuelles de chaque source ; mais l’évaluation réelle du niveau de certitude / incertitude doit être établie cas par cas, selon la spécificité de chaque source. De ce fait, le niveau de précision, de cohérence et l’objectivité est plus élevé pour les sources les plus riches en détails métriques, visuels ou descriptifs. Les sources sont donc ordonnées selon leur apport métrique et visuel croissant (des sources les plus imprécises aux sources les plus détaillées).
Quand l’on étudie des bâtiments historiques, les informations qui concernent ses états antérieurs sont souvent contradictoires, hétérogènes, incertaines et incomplètes. Chaque source est caractérisée par une certaine qualité, une cohérence et un niveau d’objectivité. Ces trois aspects dépendent d’une composante humaine et des moyennes physiques qui ont permis de représenter l’objet.
La qualité de la source dépend de son état de conservation, des outils de représentation employés et de l’objectif de la description. Premièrement, la qualité graphique des sources n’est pas souvent très élevée pour tirer des informations sur les proportions. Deuxièmement, dès que l’on a des informations métriques sur un objet, le niveau de fiabilité augmente immédiatement. Troisièmement, le niveau de fiabilité augmente encore plus si l’on analyse un relevé fait à l’aide d’un dispositif d’acquisition particulièrement précis et automatisé (c’est le cas du scanner laser par exemple).
Le niveau de cohérence dépend de la concordance des informations véhiculées par les sources. Il s’appuie sur la comparaison avec diverses sources.
Le niveau d’objectivité est lié à l’auteur de la source, car souvent il transfère graphiquement son propre point de vue par rapport à son contexte de vie, ou parfois il représente des architectures selon un projet pas encore réalisé.

Les types de projection

Le dessin de l’architecture a évolué au cours de l’histoire des méthodes de représentation en servant de différentes méthodes de construction et de contrôle géométrique de l’espace et des formes. Diffèrent types de projections ont été utilisée, au cours des siècles, comme principes sous-jacents aux pratiques de représentation de l’architecture.

Projection perspective

La projection perspective est la représentation d’une image telle qu’elle est perçue par l’œil. Le principe général de construction de ce type de représentations est l’utilisation de la distance entre l’objet et le point d’observation. Si l’objet est loin, il apparaît petit, et si l’objet est proche, il apparaît grand. La projection perspective est créé par des règles géométriques codifiées dans l’époque de la Renaissance.
II existe une forte relation entre la perspective et les mesures. En effet, si les techniques de relevé utilisées au Moyen Age sont impliquées dans les origines de la perspective, après son invention, cette dernière a rapidement été employée comme instrument de mesure.
Au XVe siècle, Filippo Brunelleschi introduit un procédé géométrique permettant de peindre avec exactitude une portion observée de l’espace réel. Dans son livre De pittura, il proposait une représentation de la perspective à un point de fuite principal pour simuler la vision humaine. Il s’agissait de la formalisation du passage entre la perspective «naturalis» (optique) et « artificialis » (géométrie) [Damisch H., 1994 ; Hyman I., 1974]. La définition de perspective donnée par Léonard de Vinci est : «la perspective n’est rien d’autre que voir un objet derrière une vitre plane et bien transparente, dont la surface contient toutes les choses qui sont derrière : elles peuvent être ramenées au point de l’œil par des pyramides et ces pyramides coupent la vitre mentionnée». D’autres principes, comme le rayon visuel ou la ligne de fuite, déjà présents dans la première formulation du procédé, furent ensuite repris par Jean-Henri Lambert pour développer les règles inverses de la géométrie projective consistant à déterminer la position de l’observateur, à trouver la ligne d’horizon et à estimer l’orientation des objets contenus dans un tableau. Lambert comprend que les points de fuite pouvaient être exploités comme support géométrique pour l’inversion de la perspective [Kemp M., 1992].

projection parallèle

La projection parallèle correspond à une projection perspective avec un point de vue hypothétique, se situant à une distance infinie de l’objet [McReynolds T. et al.,2005].
Projection orthogonale :La projection orthogonale est une représentation en deux dimensions d’un objet en trois dimensions. Cela correspond à une projection à l’infini [Maynard P., 2005].
C’est le type de projection le plus utilisé pour l’élaboration de dessins techniques. Dans les sources iconographiques relatives au patrimoine, ce type de projection est assez utilisé dans les dessins d’édifices (comme les plans, élévations et les coupes).Certains procédés de photogrammétrie permettent l’élaboration d’orthophotographie, c’est à dire de projection orthographique de photographies à partir d’une transformation géométrique appelée homographie. Les orthophotographies peuvent fournir des informations métriques avec une résolution et un niveau de précision important en intégrant des éléments de détail des surfaces.
Projection axonométrique :Axonométrie est un type de projection orthographique où le plan ou l’axe de l’objet représenté n’est pas parallèle au plan de projection [Godse A.P., 1980; Gary R. B. et al., 2002], de telle sorte que plusieurs côtés d’un objet sont visibles dans la même image [Maynard P., 2005]. La projection axonométrique peut être de trois différents types : isométrique, dimétrique et trimétrique, en fonction de l’angle formé entre l’axe et le point de vue orthogonal [McReynolds T. et al., 2005]. Une caractéristique typique des images axonométriques consiste en le fait que un des axes est généralement représenté en vertical. Il n’existe pas beaucoup d’images anciennes construites selon une projection axonométrique correcte. Normalement, c’est un type de construction géométrique dont la pratique s’est diffusée dans l’époque moderne. Si des images dont la construction se rapproche d’une axonométrie existent avant l’époque moderne, c’est d’habitude des images crées dans le but d’arriver à suggérer un point de vue perspectif. Ce type de représentation a une grande diffusion dans les dessins et les peintures de monuments ou de villes. Projection oblique :Dans les projections obliques les rayons de projection parallèle ne sont pas perpendiculaires au plan de visualisation comme dans le cas de la projection orthographique, mais orientés d’un angle qui diffère de 90 degrés [Maynard P., 2005]. Dans les projections orthographiques et obliques les lignes parallèles dans l’espace semblent parallèles sur l’image. Grâce à la simplicité de sa construction graphique, cette technique de représentation s’est particulièrement diffusée dans la période antécédente à l’introduction de la perspective. C’était d’ailleurs la volonté de figurer l’espace et sa perception, avant la codification de la perspective, qui a déterminé une utilisation des projections obliques. Ce n’est pas par hasard que les représentations d’époque médiévale basées sur des projections obliques sont aussi appelées (images en perspective gauche).

Méthodes d’annotation sémantique d’images

L’étiquetage du contenu sémantique des images au travers d’un ensemble de mots clés est une problématique connue sous le nom d’« annotation d’image ».
L’annotation est principalement utilisée pour la gestion de base de données d’images, notamment afin d’améliorer les possibilités de la recherche. Des images annotées peuvent habituellement être retrouvées en utilisant une recherche par mots-clés, alors que des images non-annotées peuvent être extrêmement difficiles à trouver dans une base de données. L’annotation d’images par mots clés permet également d’améliorer les processus d’indexation d’informations utilisés par les moteurs de recherche Web [Rodden K.,1999].
Aujourd’hui, Il y a approximativement trois manières pour enrichir d’un point de vue sémantique des images [Wenyin L. et al., 2001] : l’annotation manuelle ; annotation semi-automatique ; annotation automatique.
L’annotation sémantique n’est pas encore utilisé dans le domaine spécifique de l’architecture patrimoniale, par conséquent, nous présentons ici les travaux de recherche et les développements relatifs à un domaine d’application beaucoup plus large.

 Méthodes manuelles

La plupart des systèmes de base de données d’images utilisent aujourd’hui l’annotation manuelle [Gong Y. et al., 1994]. Il s’agit d’une méthode d’annotation qui permette aux utilisateurs d’associer des mots-clés descriptifs aux images conservée au sein d’un base de données. Deux types d’annotation différentes existent : celle basée sur les mots-clés et celle basée sur les ontologies. Dans le premier cas les utilisateurs sont libres d’étiqueter les ressources considérées avec n’importe quel mot-clé qu’ils retiennent, adéquat à la description du contenu de l’image ; dans le deuxième cas les mots à utiliser pour la description du contenu des images sont reliés à une structure de concept représentant un domaine de connaissances précis.
Dans le cas de l’annotation libre par mots-clés les utilisateurs ne sont pas forcés de suivre un arrangement formalisé. Puisque aucune conceptualisation partagée n’est prise en considération, l’association de l’étiquette à une interprétation sémantique précise peut seulement être accidentellement réalisée. Les exemples bien connus de ce genre d’annotation pour les images 2D sont [Flickr] et [Riya]. Ces systèmes se basent sur des interfaces permettant aux utilisateurs de tracer un rectangle autour d’un objet dans une photographie puis d’introduire quelques termes descriptifs.

Méthodes automatiques

Les méthodes automatiques d’annotation sémantique d’images se basent sur des techniques d’analyse d’image basées sur le contenu (content-based image  analysis techniques) [Flickner M. et al., 1995]. Normalement, ces processus sont composés de deux tâches, la segmentations d’image (détection automatique les forme d’éléments dans l’image) et l’identifications d’objets (la comparaison entre les formes détectées et des objets cohérents dans une bibliothèque).
L’identification des classes d’objets peut être réalisée en utilisant une combinaison des modèles particuliers [Winn J. et al., 2005 ; Fergus R. et al., 2003] . Plusieurs chercheurs ont considéré ces deux tâches séparément. Par exemple [Kumar S. et al., 2004] se sont concentrés seulement sur le problème de la segmentation. L’outil TextonBoost, proposé par [Shotton J. et al., 2006] combine la reconnaissance de formes et la segmentation d’images. Ils utilisent une combinaison de caractéristiques spécifiques appelé Texton pour encoder la forme, la texture et l’apparence de différentes classes d’objets. Bien que leur méthode a produit des résultats significatifs, les formes bruitées et les textures causent son échec sur les frontières des objets .

Méthodes semi-automatiques

Les méthodes semi-automatiques d’annotation sémantique d’images se basent sur des techniques combinant les solutions présentées précédemment (automatiques et manuelles). Des algorithmes sont utilisés pour le filtrage de la sémantique appropriée en utilisant les information textuelles liées à l’image ou par l’identification des contenus d’image (comme dans les méthodes complètement automatiques), puis l’utilisateur peut choisir manuellement les mots-clefs qui se rapportent à l’objet dans l’image. En employant le contrôle des utilisateurs, la sémantique obtenue est mises à jour de façon incrémentale. Intégrées à des interfaces appropriées, les méthodes d’annotation semi-automatique ont un grand potentiel en terme d’application à plusieurs domaines [Suh B. et al., 2004].
[Shen H.T. et al. 2000] ont employé une méthode dans laquelle les images sont utilisées pour indexer automatiquement d’autres images dans la même page Web. Ils emploient l’information textuelle riche de la page pour extraire des éléments de description potentielle des images. [Srihari R. et al., 2000] extraient du texte des entités textuelles (par exemple, les nom des gens, les nom des endroits et des choses, etc.) pour indexer automatiquement les images qui accompagnent le texte des pages web.

Une approche pour la caractérisation sémantique 2D/3D d’édifices patrimoniaux

Suite à l’analyse des méthodes actuelles d’annotation sémantique d’images, on peut retenir que les solutions actuelles, tout en donnant des résultats applicables à certains contextes, ne sont certainement pas encore au point pour aborder le problème plus complexe de la segmentation et annotation précise d’artefacts patrimoniaux. En effet, même si les méthodes semi-automatiques semblent offrir des résultats convenables, le domaine de la documentation du patrimoine reste particulièrement difficile à traiter au vu de l’élevée complexité et hétérogénéité des formes architecturales.
Les vrais problèmes dérivent probablement du fait que cette complexité et cette hétérogénéité (typique du contexte de l’architecture patrimoniale) oblige à traiter les problèmes de classification des formes non pas à partir d’un simple aperçu bidimensionnelle de leur aspect (sur les images), mais à partir d’une véritable analyse de leur forme (sur des modèles 3D).
Pour donner un exemple, la documentation photographique des artefacts se base, le plus souvent, sur la prise de multiples photographies, à partir de différents points de vue, avec différents niveaux de zoom des mêmes formes. Or, si l’on imagine d’utiliser des solutions d’annotation sémantique d’images telles que l’on vient d’analyser dans le chapitre précédent, il est évident qu’il serait particulièrement problématique de garder (sauf dans le cas de l’utilisation d’une solutions complètement manuelle) sur toutes les images un niveau cohérent de précision à la fois en termes de segmentation et en termes d’annotation sémantique. De plus, si l’on s’intéresse à une annotation particulièrement fine d’édifices patrimoniaux (c’est le cas dans les travaux menés pour des finalités de conservation et/ou de restauration), il sera probablement nécessaire de conduire l’annotation sémantique non pas seulement au niveau d’une segmentation générale du bâti (colonne, porte, mur, etc..), mais au niveau des éléments architecturaux (base, fut, chapiteau, etc.) ainsi que des sous éléments (tore, baquette, scotie, etc.).
Ceci indique bien, que dans ce domaine, l’étude et la description des éléments, doit nécessairement s’appuyer sur un support de représentation plus sophistiqué, capable d’expliciter la complexité morphologique d’un édifice (relation entre ses parties et l’ensemble) ainsi que les caractères formels spécifiques aux éléments qui le composent (aspects spécifiques reliés à l’apparence visuelle des surface).
Or, dans le domaine du relevé et de la documentation graphique du patrimoine architectural, des techniques et des outils (scanner laser 3D, photogrammétrie, photomodélisation, etc.) permettent aujourd’hui de collecter, de structurer et de traiter des informations acquises (réseaux de points, nuages de points, photographies, etc.) afin de construire des représentation tridimensionnelles d’édifices patrimoniaux. Ceci correspond à créer un modèle 3D des artefacts étudiés contenant le niveau d’information (morphologie, apparence visuelle) nécessaire à une analyse complète.

La reconstruction géométrique de la morphologie

Les procédures d’acquisition d’information ne prennent pas en compte habituellement les conditions géométriques de l’objet, il est donc nécessaire de transformer les nuages de points (aléatoirement) produits en structures polygonales ou en surfaces de haute qualité et sans perte d’informations importantes.
Aujourd’hui il y a plusieurs manières de créer un modèle 3D basé sur une architecture de monde réel. Par exemple un maillage automatique de nuage de point rassemblée par un outil de balayage laser ou modélisation photométrique créée des photos numériques ou de photo stéréo etc.

Reconstruction 3D à partir de nuage de points

Habituellement, les nuages de points ne sont pas suffisants comme résultat final de la documentation. Ils pourraient être considérés comme des moyens d’archiver la géométrie d’un objet en prévision d’exploitations futures. Dans ce but, beaucoup de techniques (automatiques, semi-automatiques et manuelles) existent aujourd’hui. Nous allons les présenter dans cette section en les regroupant en deux catégories principales :
La reconstruction automatique de surface: il s’agit de procédures d’interpolation ou d’instanciation automatique ou semi-automatique qui utilisent comme données d’entrée un nuage de points issu d’un balayage laser;
La modélisation interactive: il s’agit de techniques d’approximation manuelles qui décrivent les surfaces au travers de la manipulation d’un certain nombre de primitives géométriques et de fonctions de modélisation.

Reconstruction 3D basée sur image

La photographie est un support bien adapté à l’interprétation des formes. Les approches et les techniques basées sur ce principe peuvent potentiellement éliminer la phase laborieuse normalement requise par la modélisation de structures géométriques détaillées. En effet, un des bénéfices majeur de ces techniques réside dans leurs capacités à restituer de manière fine les effets de textures et les détails liés aux imperfections des objets réels, qui sont très difficiles à obtenir à l’aide des techniques conventionnelles de synthèse d’image [Foley J. et al., 2000]. La solution offerte par ces systèmes consiste à remplacer les modèles conventionnels avec des représentations géométriques approximatives enrichies par l’image [Shum H.Y. et al.,2000]. En fonction de la quantité d’informations géométriques utilisées pour la reconstruction et du nombre d’images nécessaires pour la reconstruction.
Ces techniques basent la procédure de reconstruction 3D à partir d’un bloc d’images non calibrées et en deux phases:
Dans une première phase, on établi les correspondances entre différentes prises de vue. Ces correspondances peuvent être des points (ImageModeler, Photomodeler) ou des lignes présumées perpendiculaires ou parallèles [Cipolla R. et al., 1999] sélectionnées sur les images. Certains systèmes utilisent des techniques éprouvées de vision par ordinateur afin d’automatiser le plus possible cette tache [Faugeras O., 1993]. De là, les matrices de projection des images peuvent êtres calculées à une transformation projective près grâce aux propriétés de la géométrie. Ces procédés permettent de déterminer les paramètres externes et internes des appareils photo. La deuxième phase consiste en une véritable reconstruction des éléments de la scène en utilisant des primitives géométriques et des fonctions de déformation.
Quelque solution commerciale exploite les propriétés des représentations par frontières (Brep) : les transformations simples (translation, rotation, changement d’échelle) peuvent alors être affectées à la primitive entière aussi bien qu’à une ou plusieurs de ses composantes (faces, arêtes, sommets) .

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela rapport-gratuit.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

1. INTRODUCTION 
1.1. CONTEXTE
1.2. OBJECTIF 
1.3. PORTEE, LIMITES, APPORTS PRINCIPAUX 
1.4. STRUCTURE DU DOCUMENT 
2. LES SOURCES ICONOGRAPHIQUES POUR LA DOCUMENTATION ET L’ETUDE DU PATRIMOINE BATI
2.1. CLASSIFICATION PAR L’ETAT DE L’EDIFICE 
2.1.1. L’état actuel
2.1.2. L’état historique
2.1.3. L’image hypothétique
2.2. LE DEGRE DE CERTITUDE
2.3. LES TECHNIQUES D’ELABORATION 
2.3.1. Photographies
2.3.2. Dessin
2.3.3. Document métrique
2.4. LES TYPES DE PROJECTION
2.4.1. Projection perspective
2.4.2. projection parallèle
2.4.3. Projection panoramique
3. METHODES D’ANNOTATION SEMANTIQUE D’IMAGES
3.1. METHODES MANUELLES
3.2. METHODES AUTOMATIQUES 
3.3. METHODES SEMI-AUTOMATIQUES 
4. UNE APPROCHE POUR LA CARACTERISATION SEMANTIQUE 2D/3D D’EDIFICES PATRIMONIAUX 
4.1. APPROCHE PROPOSE 
4.2. PROBLEMES A TRAITER
4.2.1. Acquisition de données 3D et reconstruction géométrique basés sur la réalité (chapitre 5)
4.2.2. Caractérisation sémantique de la représentation 3D (chapitre 5)
4.2.3. Référencement spatial de sources iconographiques (chapitre 6)
4.2.4. Indexation du contenu des sources iconographiques (chapitre 6)
4.2.5. Recherche visuelle de sources iconographiques basée sur critères spatiaux, morphologiques et sémantiques (chapitre 7)
4.3. DEVELOPPEMENT INFORMATIQUE 
4.3.1. Présentation du projet NUBES
4.3.2. Présentation de l’environnement de développement
4.3.3. L’architecture du système
5. RECONSTRUCTION 3D ET STRUCTURATION SEMANTIQUE D’EDIFICES PATRIMONIAUX
5.1. ACQUISITION INFORMATIONS SPATIALES
5.1.1. La photogrammétrie
5.1.2. L’acquisition par scanner laser 3D
5.2. LA RECONSTRUCTION GEOMETRIQUE DE LA MORPHOLOGIE 
5.2.1. Reconstruction 3D à partir de nuage de points
5.2.2. Reconstruction 3D basée sur image.
5.3. CARACTERISATION SEMANTIQUE DU MODELE 3D
5.3.1. Travaux relatifs
5.3.2. Solution retenue
6. REFERENCEMENT SPATIAL ET SEMANTISATION DE SOURCES ICONOGRAPHIQUES 
6.1. METHODES DE REFERENCEMENT SPATIAL 
6.1.1. Méthodes manuelles
6.1.2. Méthodes semi-automatiques
6.1.3. Méthodes automatiques
6.2. ANALYSE DES SOLUTIONS EXISTANTES 
6.3. SOLUTION RETENUE 
6.3.1. Téléchargement sur serveur des sources iconographiques
6.3.1. Superposition manuelle de sources à projection orthographique et pseudo-perspective 82
6.3.2. Résection spatiale de sources à projection perspective
6.3.3. Récupération directe des paramètres de photographies orientées
6.4. ANNOTATION SEMANTIQUE DES IMAGES PAR PROJECTION 
6.4.1. Présentation de l’environnement du développement
6.4.2. Développement de la procédure de sémantisation d’images
7. UN SYSTEME POUR LA RECHERCHE VISUELLE DE SOURCES ICONOGRAPHIQUES
7.1. ARCHITECTURE DU SYSTEME
7.1.1. Base de données
7.1.2. L’interface WEB du système de la consultation
7.1.3. Fonctions pour la recherche d’images
7.2. RECHERCHE D’IMAGES BASEE SUR CRITERES SPATIAUX
7.3. RECHERCHE D’IMAGES BASEE SUR CRITERES MORPHOLOGIQUES
7.4. RECHERCHE D’IMAGES BASEE SUR CRITERES SEMANTIQUES 
7.5. RECUPERATION DE POINT DE VUE IMAGE 
8. CONCLUSIONS ET PERSPECTIVES 
8.1. LIMITES
8.2. PERSPECTIVES DE RECHERCHE 
BIBLIOGRAPHIE 
LISTE DE PUBLICATIONS

Rapport PFE, mémoire et thèse PDFTélécharger le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *