Le thème 4 du
GDR
I3 intitulé "Masses
de données et l'accès à l'information" regroupe historiquement les
activités des équipes travaillant dans les domaines des Bases de
Données et de la Recherche d'Information, créant ainsi le "continuum"
depuis la donnée non-structurée (grand corpus de textes par exemple)
jusqu'aux collections distribuées de données (semi-)structurées.
Les présentes pages ont
pour objectif d'être un canal de diffusion des informations pour la
communauté.
Le développement de l'Internet et l'explosion des capacités de stockage
observé ces dernières années a facilité l’apparition de volumes de
données sans précédent. L’exploitation de ces masses de données et
l’accès à l’information dans ce contexte est aujourd’hui un enjeu
majeur considéré dans le thème 4 du GDR CNRS I3.
Les problématiques liées au passage à l’échelle et à la distribution
des sources sont bien sûr omniprésentes dans le thème 4. Par ailleurs,
celles-ci se trouvent aujourd'hui élargies avec les approches
émergentes, comme
celles liées à "l’ambiant", au "pervasif", ou encore au "cloud
computing".
Les principaux sujets de recherche du thème "Masses de données et Accès
à l'information" concernent :
- La fouille de données massives et complexes
- Les documents multimédias
- L'intégration de données et services
- La recherche d’information
- La gestion des données distribuées à grande échelle