Présentation de l'école thématique BDA
Grands axes du programme
Internet et le Web sont des facteurs majeurs de la globalisation de l'information et de la diversification de ses sources et de ses usages. La croissance des volumes, les multiples formes d'acquisition et de codage, les demandes d'accès, d’analyse et de restitution à tout moment, de n’importe où, suivant des modalités matérielles et des médias différents soulèvent de nombreux défis pour le déploiement de systèmes d’information distribués à très large échelle. Les sciences, les activités industrielles, culturelles et administratives se révèlent fortement consommatrices et productrices d'information, requérant de nouveaux processus sophistiqués d’organisation, d'intégration et d'analyse des données, inexistants actuellement. Par ailleurs, l’interconnexion des sources d’information, le stockage et la mise en ligne d’un volume croissant de données sensibles, notamment personnelles, créent une menace concrète et sans précédent sur le respect de la vie privée des individus. Les enjeux scientifiques liés à l’exploitation de grandes masses de données distribuées se trouvent ainsi directement corrélés à des enjeux sociaux, économiques et culturels. Cette école thématique cible ces enjeux en s’articulant précisément autour de quatre axes majeurs :
- Administrer les données distribuées : architectures distribuées de gestion de données (clusters, réseaux Pair-à-Pair, réseaux de capteurs, …) ;
- Interroger et intégrer les données: modèles, langages, évaluation et optimisation de requêtes (ontologies, requêtes continues, approximatives, contextuelles, …) ;
- Analyser les données : modèles et algorithmes d’analyse et de fouille de données (entrepôts de données, requêtes cubes, classification, recherche d’associations, …) ;
- Protéger les données : politiques de sécurité, modèles de contrôle d’accès et d’usage, chiffrement de données, contrôle d’intégrité, ….
Modalités pédagogiques et aspects innovants
L’école propose des interventions suivant 3 modalités distinctes et complémentaires.
-
Diffusion des connaissances fondamentales : un cours de 3h30 sera proposé en matinée de chaque journée ; l’objectif de ce cours est bien sûr d’offrir une introduction au thème de la journée mais plus encore d’exposer les problèmes, l’état de l’art, les résultats fondamentaux ainsi que les défis; le cours sera dispensé par un ou plusieurs chercheurs confirmés. -
Ouverture / Approfondissement : l’objectif de cette session quotidienne est de proposer un regard sur les aspects pluridisciplinaires liés à la gestion de grandes masses de données, en lien avec le thème de la journée (par exemple intervention d’un juriste en lien avec le thème « protéger les données »); un exposé de 1h sera effectué par une personnalité extérieure à la communauté « bases de données » ou un intervenant spécialisé et sera suivi d’un débat. -
Intervention des participants : sous la forme d’un atelier privilégiant une forte interactivité, les participants seront sollicités (lors de leur inscription) pour présenter leurs travaux de recherche, qu’il s’agisse de doctorants présentant leur sujet de thèse ou des participants présentant un résultat récent; chaque atelier sera organisé en lien avec la thématique de la journée ; une certaine liberté sera laissée quant au calibrage des exposés (cela pourra aller d’un exposé classique de 20mn à une simple présentation d’un poster en 10mn) ; les exposés se feront en présence des organisateurs, des intervenants seniors de l’école.