next up previous
Next: Points à développer Up: Etat d'avancement Previous: Sujet de recherche

Principales étapes franchies

La majeure partie de la première année de thèse a été consacrée à la recherche bibliographique sur les thèmes suivants : modèles de versions, versions de schéma, prise en compte des versions dans le domaine multimédia. J'ai redigé, suite à cette étude, un document de travail (de 30 pages environ) comparant les différents modèles de versions, disponibles dans la littérature. J'ai ainsi pu m'apercevoir des besoins de ces modèles au niveau de la gestion des versions de collections d'objets. De cette constation est né un document de travail sur le versionnement d'ensembles. J'y ai notamment proposé plusieurs mécanismes de gestion de versions d'ensemble de petite taille. Par la suite, nous avons choisi, mon directeur de thèse et moi-même, d'orienter également nos recherches vers les versions d'index pour gérer les collections d'objets de forte cardinalité cette fois-ci.

Les travaux que j'ai menés jusqu'à présent ont fait l'objet de plusieurs exposés notamment au LAMSADE (Dauphine - équipe Bases de Données), au laboratoire LIP6 (Jussieu - équipe Bases de Données) et au CIES (dans le cadre de mon contrat de monitorat d'initiation à l'enseignement supérieur). En outre, je présenterai un poster aux assises nationales du GDR-PRC I3, en juin 1998.

J'ai présenté mes travaux à plusieurs chercheurs collaborant avec notre équipe, dont:

Anne Doucet et Stéphane Gançarski, professeur et maître de conférence au laboratoire LIP6 (Paris)

Wojciech Cellary, Jarogniew Rybowski et Waldemar Wieczerzycki, professeur et maîtres de conférence à l'Université de Poznan (Pologne)

Claudia Bauzer Medeiros, professeur à l'Université de Campinas (Brésil)

Marta Rukoz et Claudia Léon, professeur et chercheur à l'Univerité Centrale du Venezuela (Caracas)

Un article est en préparation avec Geneviève Jomier, mon directeur de thèse, sur notre proposition de versions d'index pour les versions de grandes collections d'objets. Nous espérons le finaliser et le soumettre cet été.

Afin d'approfondir mes connaissances, j'ai également participé à une Ecole Thématique de Jeunes Chercheurs en Bases de Données (en mars 1997), qui m'a permis de rencontrer des chercheurs du domaine et de connaître les divers recherches actuelles menées en Base de Données.

Les études bibliographiques ont permis d'orienter nos recherches de la façon suivante :

Les versions de collections d'objets dont le nombre d'éléments est assez restreint peuvent être gérées par un mécanisme de stockage différentiel.

En revanche, il est nécessaire de mettre en place des mécanismes d'accès aux éléments des versions de collection lorsque le nombre d'éléments est important. Ces mécanismes doivent permettre une recherche plus rapide des éléments et doivent éviter au maximum la redondance entre versions.

Les mécanismes mis en place pour les versions de collection peuvent être étendus aux objets digitaux ou gros objets binaires, comme les images. Les index utilisés dans les bases de données orienté-objet ont en effet été étendus aux entités multimédia (Ex. B-arbre positionnel, Quad-Tree ...) dans le cas monoversion. Nous souhaitons poursuivre cette extension dans le cas multiversion.

Le premier objectif que nous nous sommes fixés a été d'étendre les index classiques utilisés dans les bases de données traditionnelles (sans version) aux bases de données multiversions. Nous avons donc travaillé sur l'extension des algorithmes du B-arbre (index le plus connu) à la gestion des versions de collection d'objets. Un certain temps a été consacré à ce travail, car nous souhaitions une approche très générale pouvant s'adapter à tout type d'index.

Puis, lors de la visite de Marta Rukoz (professeur à l'Université Centrale du Venezuela) en 1997, nous avons remarqué que notre approche pouvait très bien s'appliquer au traitement d'images. En effet, dans le laboratoire de Marta Rukoz, des chercheurs traitent des images médicales par des séries de plusieurs algorithmes (segmentation, reconnaissance de formes, etc.). Ces algorithmes ne modifient que de toutes petites parties des images. La manière dont sont ordonnancés les algorithmes dans une série détermine le résultat obtenu sur l'image finale. Toutefois, par manque de place disque et par manque d'outils, seules les images originales et les images après traitement sont stockées. Ainsi, les images intermédiaires doivent être recalculées. Si deux séries ne diffèrent que de quelques algorithmes, les chercheurs sont néanmoins contraints d'exécuter à nouveau chaque algorithme (même commun aux deux séries) sur l'image originale. Cette contrainte impose en conséquence une perte de temps considérable aux chercheurs qui peuvent par là même difficilement comparer les résultats de plusieurs séries d'algorithmes. Notre idée est donc d'adapter notre approche de versions d'index aux Quad-Tree. Un Quad-Tree découpe une image en zones homogènes. Ceci permet de conserver les parties d'images modifiées par un algorithme, sans stocker toute l'image modifiée. Il est donc possible de réaliser rapidement des retours en arrière lors du traitement, puisque toute la série peut ne pas être rejouée.



next up previous
Next: Points à développer Up: Etat d'avancement Previous: Sujet de recherche

Maude Manouvrier
Tue Apr 28 11:42:05 MET DST 1998