Projet de Thèse de Monsieur Yakham NDIAYE

 

Titre:

Interopérabilité d'un Serveur de Structures de Données Distribuées et Scalables et d'un SGBD relationnel-objet.

Résumé:

Des avancées majeures ont été accomplies dans les performances des réseaux (standardisation de TCP/IP, Fast Ethernet, ATM, commutateurs larges bandes etc...). Un nouveau concept est apparu: celui de multi-ordinateur, offrant des capacités quasi illimités de calcul, de mémoire vive et de stockage[C94],[T95],[B97]. Les applications actuelles n'arrivent pas encore à tirer profit des capacités potentielles des multi-ordinateurs, d’où une recherche intensive[C94],[G96],[GW96],[ CACM97],...

Une nouvelle famille appelées Structures de Données Distribuées et Scalables (SDDS) est apparue en 1993 pour palier cette insuffisance dans le domaine de la gestion des fichiers. Les SDDSs sont conçues spécifiquement pour les multiordinateurs. Ces structures ont la potentialité d'offrir les performances de stockage et de temps de réponse impossibles à atteindre pour les structures de données traditionnelles. Plusieurs SDDSs ont été proposées[LNS93], [D93], [LNS94], [KW94],… Certaines sont déjà référencées dans la nouvelle édition du livre fondamental de D. Knuth "The Art of Computer Programming" paru cet été[K98]. Voir (http://hp_germ1.miage.dauphine.fr/ceria.html ) pour l’ensemble des réferences.

Des serveurs SDDS prototypes ont été également construits. A Paris 9 Dauphine notamment[S95],[B96],[P97] et à l'Université de Dakar[A97]; deux gestionnaires de SDDS sous Windows NT sont en cours d'implémentation.

Un type de SDDS bien connu dit RP* a été étudié dans le cadre de mon DEA à l'Université de Dakar[Y98]. Il s’agissait de proposer une architecture système Client/Serveur sous Windows NT de deux variantes de RP* dites RP*n et RP*c. Un tel système peut être utilisé par diverses applications. Une application particulièrement intéressante consiste en un couplage avec un SGBD de la nouvelle génération dite relationnel-objet. Le serveur SDDS permet alors au SGBD de gérer certains types de données, notamment spatiales et multimédia, potentiellement plus rapidement et en plus grande quantité que si elles avaient été dans les mémoires internes du SGBD. Un SGBD offre à l'usager une interface plus élaborée que celle du prototype SDDS RP*, notamment par son langage de requêtes. L'interopérabilité entre les deux systèmes peut être réalisée à travers les fonctions dites externes, caractéristiques d'un SGBD relationnel-objet. Les SGBD relationnels traditionnels n'ont pas de telles interfaces.

En partant de travaux du DEA, la Thèse a pour but la généralisation du serveur RP* pour une telle application. L'environnement est celui d’un multi-ordinateur réseau Ethernet 100 Mb/s sous Windows NT. Comme SGBD, on étudiera particulièrement le système relationnel-objet avancé et hautes performances bien connu, AMOS, développé par l'Université de Linkoping (Suède) [http://www.ida.liu.se/~torri/amos2/]. On étudiera aussi le couplage avec un SGBD relationnel-objet de grande diffusion DB2 d'IBM[D96]. Les choix techniques devront être validés par une application prototype et l’étude de performances. L'application pressentie est celle de données spécifiques à l'Afrique étudiée par le projet SIMES[http://www.simes.sn] à l'Université de Dakar.

La Thèse sera encadrée par Prof. Witold LITWIN. Elle est financée par la Bourse de thèse du Ministère Française de la Coopération. Cette Bourse prévoit une alternance de 6 mois entre l'Université Paris 9 d'une part, et l'Université de Dakar d'autre part. Le travail sera co-encadré à l'Université de Dakar par M. Samba Ndiaye (CESAG) et Tidiane Seck (U. Dakar). La durée de bourse prévue est de 3 ans.

 

 

Yakham NDIAYE

 

 

References

[A97] Aly, W., D. Organisation interne des SDDS (RP*). Mémoire de DEA. U. Dakar, 1998.

[B96] Bennour, F. Une Architecture pour un Gestionnaire des SDDS sous Windows NT. Mémoire de DEA. U. Paris 9, 1996.

[B97] Birnbaum, J. ACM97 Speakers Corner. Comm. of ACM, Jan. 1997.

[C94] Culler, D. NOW: Towards Everyday Supercomputing on a Network of Workstations. EECS Tech. Rep. UC Berkeley.

[CACM97] Comm. Of ACM. Special Issue on High-Performance Computing.(Oct. 1997).

[D93] Devine, R. Design and Implementation of DDH: Distributed Dynamic Hashing. Int. Conf. On Foundations of Data Organizations, FODO-93. Lecture Notes in Comp. Sc., Springer-Verlag (publ.), Oct. 1993.

 

[D96] Don Chamberlin, Using the new DB2,IBM’s Object-Relational Database System, 1996 Morgan Kaufmann Edition

[G96] Gray, J. Super-Servers: Commodity Computer Clusters Pose a Software Challemge. Microsoft, 1996. http://www.research.microsoft.com/

[GW96] Grimshaw, A, Wulf, W. The Legion Vision of a Worldwide Virtual Computer. Comm. of ACM, Jan. 1997.

[KW94] Kroll, B., Widmayer, P. Distributing a Search Tree Among a Growing Number of Processors. ACM-SIGMOD Int. Conf. On Management of Data, 1994.

[K98] Knuth D. The Art of Computer Programming. 3rd Ed. Addison Wesley, 1998.

[LNS93] Litwin, W. Neimat, M-A., Schneider, D. LH* : Linear Hashing for Distributed Files. ACM-SIGMOD Intl. Conf. On Management of Data, 1993.

[LNS94] Litwin, W., Neimat, M-A., Schneider, D. RP* : A Family of Order-Preserving Scalable Distributed Data Structures. 20th Intl. Conf on Very Large Data Bases (VLDB), 1994.

[P97] Pheng, P. Gestion d'une case de LH*. Mémoire de DEA. U. Paris 9, 1997.

 

[S95] Souleiman, R. Communication Protocol for the Scalable Distributed Data Structures. Tech. Rep. Univ. Paris 9, 1995 (in French)

[T95] Tanenbaum, A., S. Distributed Operating Systems. Prentice Hall, 1995, 601.

[Y98] Yakham B.A.K. Ndiaye. Architecture de communication pour les SDDS (RP*n et RP*c). Mémoire de DEA. U. Dakar, 1998.