Objectifs et principaux domaines d'activité pour les 5 années à venir
Bases de données spatiales
Notre expérience dans la modélisation conceptuelle et les interfaces visuelles servira au développement d'un prototype d'interfaces visuelles fondées sur le modèle MADS. Le but est de fournir aux utilisateurs des outils visuels de définition des données et de manipulation des données, qui soient aussi complets que possible et qui matérialisent notre paradigme conceptuel. Les outils visuels vont traduire les spécifications des utilisateurs en spécifications exécutables sur un ou plusieurs SIG ou SGBD sous-jacents. Ceci implique de développer et/ou de tester un certain nombre d'éléments:
- les traducteurs nécessaires pour transposer la définition des données MADS dans des définitions de données cibles (certains existent déjà). Selon le système cible, des méthodes (ou "triggers" ou procédures) seront générées automatiquement pour implémenter les spécifications MADS qui n'ont pas de correspondance immédiate dans ce système. Il s'agit ici essentiellement d'un travail de développement, avec des perspectives de recherche limitées. Nous chercherons à établir une collaboration avec les fournisseurs de SIG.
- un éditeur de schémas visuels: ce travail est en cours et devrait être achevé cette année. Dans une phase ultérieure, des mécanismes plus sophistiqués pourront être ajoutés (par exemple pour la personnalisation des icones, les interface en plusieurs langues, ...). Des projets d'étudiants pourront éventuellement y contribuer.
- un éditeur pour la manipulation visuelle des données au moyen d'une interaction multi-mode (croquis, texte, à partir du schéma, à partir d'une carte, etc. ). Il s'agit ici d'abord d'un travail de recherche, étant donné qu'à ce jour il n'existe aucun langage de manipulation de données (LMD) visuel qui donne satisfaction. Nous pensons que deux années de travail seront nécessaires pour implémenter une première solution multi-mode, notre souhait étant da coopérer dans ce but avec d'autres équipes de recherche intéressées à ce même sujet (en particulier. le projet sur les requêtes par croquis du prof. Egenhofer).
- étude d'un LMD algébrique pour bases de données spatiales, qui servira de base au LMD visuel. En alternative ou en complément à celui-ci (selon les ressources disponibles), un langage de type OQL (Object Query Langage: langage de requête par objet) pourrait être développé. Le langage algébrique doit servir de langage intermédiaire entre le langage visuel et les multiples systèmes cible (comme dans le prototype SUPER). Les expressions algébriques représentent une forme bien adaptée à la traduction vers différents langages cible. Le langage ODL (Object Definition Langage: langage de définition d'objets) mis au point par le groupe OMG (Object Management Group) pourrait devenir une cible privilégiée. Le langage de type OQL pourrait être utilisé comme interface par un utilisateur expert.
Par ailleurs, modèles et langages pour bases de données multi-échelle sont actuellement le sujet d'un travail de doctorat et doivent être développés ultérieurement à la suite de ce travail. Nos coopérations sur ce thème avec l'IGN à Paris et la Compagnie Vaudoise d'Electricité vont être poursuivies.
Nous prévoyons d'étendre notre recherche à de nouveaux sujets, dont la modélisation des contraintes d'intégrité topologique et le data mining ("extraction de connaissance") pour les données spatiales. Le but de cette extraction de connaissances sera de permettre à l'utilisateur d'interroger des données qui ne sont pas explicitement décrites dans le schéma de la base, mais qui sont néanmoims déductibles des données existantes. Nous comptons développer des outils qui assurent cette extraction, conduisant éventuellement à l'enrichissement du schéma avec les connaissances acquises. Une interface intelligente intégrant des mécanismes d'extraction de connaissances permettrait à l'utilisateur de demander des informations spatiales allant au delà des modèles classiques type noeud-ligne-surface: cela pourrait porter, par exemple, sur l'identification de distributions spatiale caractéristiques, telles un groupe d'immeuble formant un lotissement.
Nous espérons être en mesure d'expérimenter les outils d'interface visuelle dans des situations concrètes, grâce notamment à notre coopération avec l'Administration Cantonale.
L'ensemble de nos recherches sur les bases de données spatiales sera ainsi matérialisé par un jeu d'outils CASE allant de la définition de schémas à la formaulation de requêtes. L'étape suivante consiste en la recherche d'un partenariat industriel dans le but de commercialiser le produit de nos études. Nous pensons en particulier à l'implémentation des interfaces visuelles par dessus Geotask, produit développé au LBD qui a permis de fonder la société du même nom; ceci permettrait un transfert rapide et aisé des résultats de nos recherches vers le marché.
Archives sonores et recherche d'images
Le projet SIRANAU semble se dérouler de manière satisfaisante pour tous ses partenaires, c'est pourquoi nous nous attendons à son prolongement malgré le fait que sa principale source de financement, les fonds de la CTI, pourrait venir à manquer d'ici la fin de 1998.
Bien qu'il s'agisse essentiellement ici d'une activité de développement, un travail de recherche lié au projet a été démarré et une thèse de doctorat doit aborder les problèmes de mémoire cache pour les documents sonores. Une autre étude porte sur l'indexations des sons.
Notre espoir est de voir ce projet s'élargir dans le futur pour inclure les fonctionnalités d'archivage et de récupération d'images. Pourront alors être mis à profit les résultats de la thèse en cours sur la recherche d'images par le contenu. Une coopération avec d'autres laboratoires de l'EPFL travaillant sur les bases de données d'images (LCAV et IMT/ESI) sera bienvenue. La recherche sur la reconnaissance des empreintes sera poursuivie au moins jusqu'à la conclusion du travail de doctorat en cours. Idéalement, elle devrait trouver un prolongement dans une coopération avec les utilisateurs de l'application test. L'analyse et l'évaluation de différentes techniques d'indexation multi-dimensionnelle constitue une partie de ce projet.
Modélisation temporelle
Le projet MADS a montré que les applications spatiales doivent aussi être en mesure de gérer les données temporelles. En conséquence, l'intégration de la dimension temporelle au modèle MADS constituera sa principale avancée pour les prochaines années. La recherche sur ce thème est en cours et a dejà produit une première base précise pour l'approche de modélisation. La liste des sujets à explorer comprend:
- l'implémentation des spécifications conceptuelles, en termes de traduction vers des systèmes cible relationnels ou orientés-objet
- l'étude de questions ouvertes relatives à la gestion de granularités temporelles multiples, y compris la spécification du traitement du temps indéterminé
- l'étude de questions ouvertes relatives au traitement du temps futur et du temps alternatif ("branching time")
- la spécification et l'implémentation d'un LMD pour les données temporelles avec son algèbre sous-jacente.
Nous avons aussi developpé une proposition initiale pour la modélisation des processus spatio-temporels. Un ensemble de types élémentaires de ces processus a été identifié et une méthode pour leur description dans un schéma conceptuel a été proposée. Nous allons vraisemblablement poursuivre cette recherche en coopération avec nos partenaires académiques (Université de Laval, Québec et Nottingham Trent University, UK).
Modélisation conceptuelle
Nous prevoyons de consolider des solutions dejà esquissées pour pour certains problèmes ouverts de modélisation conceptuelle classique, en particulier pour les aspects de multi-instantiation. Ce sujet attire en ce moment l'attention de chercheurs toujours plus nombreux. Nous avons toutefois le sentiment que notre approche représente une alternative valable aux autres solutions existantes. L'idée de base consiste à introduire un lien de multi-instantiation (le lien "may-be") en complément au lien "is-a", et à modifier le mécanisme classique d'héritage (qui est actuellement l'objet de nombreuses interrogations).
Des résultats intéressants ont été obtenus dans le cadre de notre approche grâce aux thèses du Dr. Gentile et du Dr. Ye, mais ces résultats n'ont pas encore été diffusés assez largement. Un effort devrait être accompli pour vérifier la validité de ce travail en en exposant les résultats dans des publications majeures.
Une autre question essentielle est la définition d'un concept solide de "cluster" pour la gestion de schémas de grande taille. Ce concept est aussi d'importance fondamentale dans les bases de données spatiales multi-échelle. La plupart des travaux existants sur ce sujet sont essentiellement de nature diagrammatique, et il manque toujours une approche sémantique valable. Des aspects de cette recherche ont été abordés au LBD sous la forme de travaux de diplôme et constituent une partie de la thèse du dr. Auddino. Le travail reste néanmoins incomplet et nécessite de plus amples analyses et implémentations.
Intégration de bases de données pour ordinateurs portables
En dépit du fait que les résultats de notre recherche semblaient prometteurs, nous n'avons pas encore pu démarrer la phase d'application concrète de nos idées sur l'intégration de bases de données. Au-delà de l'investissement en temps considérable que cela demande, il s'agit de trouver les fonds extérieurs nécessaires pour un travail de développement de cette ampleur. Malheureusement, et bien que de nombreuses entreprises se heurtent à ce même problème de l'intégration et essayent de le traiter au cas par cas, il n'a pas été possible de mettre en route un projet de coopération. Dans le domaine des bases de données spatiales les perspectives semblent meilleures; en effet, le coût d'acquisition des données est si élevé, que la capacité de créer de nouveaux ensembles de données à travers l'intégration d'ensembles hétérogènes existants acquiert une réelle importance économique.
En même temps, en considérant l'évolution actuelle de l'utilisation de l'ordinateur, et en particulier la progression des ordinateurs portables, nous pensons qu'il y a là un cadre adéquat pour l'étude des problèmes d'intégration de bases de données dans un environnement mobile. Avec des ordinateurs portables il est possible de se connecter et se déconnecter dynamiquement à des bases de données différentes, selon la position géographique de l'ordinateur. A chaque connexion se pose le problème de savoir quelles données sont accessibles et d'intégrer les différentes sources disponibles, si possible aussi avec les bases de données qui se trouveraient sur le portable. Le contexte de mobilité nous semble ainsi très approprié pour tester des idées sur l'integration dynamique de bases de données.
De nombreux groupes de chercheurs s'intéressent à l'informatique mobile, mais s'attaquent pour la plupart aux problèmes de communication ou de protocoles de connexion. Nous croyons qu'il y a la place pour un projet traitant de questions de sémantique comme l'intégration des données. Il s'agit ici en premier lieu de faire le tour de la littérature actuellement disponible sur ce sujet, et de concrétiser ensuite une proposition pour un projet de recherche. Si cette idée peut se matérialiser, nous allons promouvoir une collaboration avec d'autres équipes (nous avons déjà établi un contact en Australie). Le nouvel Institut pour les Communications Informatiques et leurs Applications (ICA) créé dans notre département serait un partenaire idéal pour ce projet.
Bases de données pour objets mobiles
En alternative au projet exposé ci-dessus, notre expérience dans la définition et la gestion des données spatio-temporelles constitue une bonne base pour démarrer une recherche sur les bases de données pour le stockage d'objets mobiles, c'est à dire des objets dont la position varie rapidement et doit être contrôlable en continu. Les champs d'application pour cette catégorie de bases de données comprennent l'animation par ordinateur et les systèmes de réalité virtuelle. Un tel projet pourrait favoriser une coopération avec le Laboratoire d'Infographie dirigé par le prof. Thalmann, qui a une solide réputation dans ce domaine. Il n'existe pas à notre connaissance beaucoup de groupes travaillant sur ce sujet. Une coopération internationale avec des équipes japonaises est envisagée.
Bases de données pour le Web
Nous nous proposons d'étudier la façon dont les bases de données pourraient fournir un moyen efficace de développer de nouveaux sites Web basés sur une approche de type "template". Un template générique pour la représentation des données dans une application de développement sur le Web devra tout d'abord être mis au point. Nous projetons ensuite de voir comment les informations peuvent être dynamiquement mises en relation, groupées et classifiées. Nous nous concentrerons ensuite sur les mécanismes de propagation des mises à jour et de maintien de la cohérence. Des tests dans un environnement réel feront partie intégrante du projet. Une première réalisation est d'ailleurs en cours.
