Logo   Information, Signal, Images et ViSion C.N.R.S.   GdR   M.E.S.R.

 / Accueil / Kiosque 

Liste des Thèses et HDR Soutenues

[Soutenance de Thèse ou HdR]
Retour
ALLIEZ pierre : Etude de la représentation géométrique et texturelle de scènes 3D pour les services de visualisation dans un contexte télécommunicant
Thèse ou HDR soutenue le 07/07/2000 à ENST - salle B312 a 14h00, 46
Contact : schmitt@tsi.enst.fr
Manuscrit : http://www.tsi.enst.fr/publications/Schmitt/these_pierre_alliez.ps.gz (apre
JuryPrésident Didier ARQUES Rapporteurs Houman BOROUCHAKI Rémy PROST Examinateurs Nathalie LAURENT Francis LAZARUS Fabrice NEYRET Directeur Francis SCHMITT
DirectionFrancis Schmitt
LaboratoireLaboratoire de recherche de France Télécom R&D DIH
Résumé
La réalité virtuelle représente aujourd'hui une technologie à part entière puisqu'elle autorise la simulation, la navigation et l'interaction avec un univers sensoriel synthétisé de toutes pièces. Les potentialités offertes par la réalité virtuelle ont été très bien perçues lorsque les ordinateurs graphiques ont été capables d'assurer un rendu des images à une cadence interactive. De plus, l'augmentation des capacités des machines coïncide aujourd'hui avec un développement vertigineux des réseaux, ce qui décuple littéralement le champ d'application de la réalité virtuelle. Plusieurs difficultés subsistent toutefois pour développer les services de télécommunications associés : le volume des données est considérable, l'affichage est coûteux en calculs et la nature des données nécessite une prise en compte spécifique dans le contexte client-serveur. Si l'on ajoute à cela l'inégalité des capacités des terminaux et la variabilité des réseaux, on obtient une synthèse du triple challenge de la thèse : le stockage, la transmission et la visualisation de scènes 3D complexes. On pourrait aussi résumer la problématique en endossant le temps d'une phrase, le rôle d'un opérateur de télécommunication : "quels que soient : le terminal, le volume de données à transmettre et le débit du réseau, l'utilisateur doit pouvoir visualiser à tout moment une image attractive". Ce mémoire relève le défi sous la forme de briques technologiques susceptibles de s'assembler pour composer un moteur de transmission et d'affichage de scènes 3D en réseau. Il propose des solutions correspondant à un schéma courant en codage de l'information audiovisuelle : simplification, approximation, et codage échelonnable. Il reste cependant une spécificité propre à la 3D : la visualisation. En effet, il est d'une part plus coûteux de projeter un polygone à l'écran plutôt que d'afficher un pixel, et d'autre part le point de vue hautement variable d'une caméra influence sensiblement la pertinence des données transmises. Le premier chapitre, introductif, fournit une compréhension naturelle de la problématique et les trois autres suivent logiquement l'ordre des opérations appliquées sur les scènes 3D : la simplification et l'approximation, le codage et la visualisation. Plus précisément, les maillages composant les objets d'une scène sont simplifiés par fusion d'arête et approximés par minimisation de volume. Ils sont ensuite encodés par une technique de conquête sur les arêtes exploitant les valences des sommets. L'échelonnabilité est, quant à elle, obtenue sur les positions par une technique apparentée aux plans binaires de raffinement. Le codage des textures est adressé par intégration d'une technique développée au sein du laboratoire, cette dernière combinant la transformée en cosinus discrète et les éléments finis sur une hiérarchie de maillages triangulaires. Sur le terminal, la visualisation dépendant du point de vue est assurée par une technique de reconstruction adaptative des surfaces fonctionnant par subdivision successive des régions d'intérêt et des silhouettes. Nous montrons qu'une telle reconstruction s'applique en cours de transmission et s'adapte aisément à la puissance graphique d'un terminal.
Mots-Clefs3D, simplification de maillages, codage, compression, visualisation
Abstract
Virtual reality now represents a whole technology since it authorizes simulation, navigation and interaction with a fully synthesized universe. The potentialities offered by virtual reality were well understood when graphic computers were able to display synthetic images at an interactive rate. Moreover, the power growth of computers coincides now with a rapid development of networks, which increases tenfold the application field based on virtual reality. Nevertheless, a difficulty remains in developing these applications; the associated telecommunication services appear delicate to elaborate for various reasons: the data volume may be huge, the display is CPU-intensive and the graphic nature of data requires a specific development adapted to the client-server framework. And more, terminals are not equal in term of capacities, and networks have limited and variable flows. One thus obtains the triple challenge of the thesis: storage, transmission and visualization of 3D scenes. One could also summarize the problematics by endorsing during one sentence, the role of a telecommunication operator: whatever be: the terminal, the volume of data and the network flow, the user may be able to visualize an appealing image. This document takes on this challenge and describes technological elements suitable for transmission and the display of 3D scenes. Proposed solutions correspond to a standard scheme in the field of audio-visual information: simplification, approximation, and scaleable coding. The visualization remains however 3D-specific and even represents an essential part. Indeed, it is obviously more expensive to display a polygon rather than a pixel, and the variable camera point of view highly influences the relevance of transmitted data. The first chapter provides a natural understanding of the problematic and the three others logically follow the operations applied to 3D scenes : simplification and approximation, coding and visualization. The meshes composing the objects of a 3D scene are simplified by edge collapse and are approximated by volume minimization. They are then encoded by an edge conquest technique exploiting the vertex degrees distribution, the scalability being obtained onto the positions by a bitplane coding-like technique. Texture coding is addressed by integration of a technique developed within the laboratory, this one combining discrete cosinus transform and finite elements associated with a triangular mesh hierarchy. Visualization depending on the point of view of the client is ensured by successive subdivision of region of interest and silhouette areas. We show that such a technique also applies during transmission and reconstruction, and easily adapts geometric complexity to the graphic power of a client. Lastly, future work concerns the interlacing of coding with the adaptive subdivision technique, and the deviation control during mesh simplification.
KeyWords3D, mesh simplification, coding, compression, visualization


© GdR ISIS - Contact