Colloque 605 de l'ACFAS 2017

Analyser la science : les bibliothèques numériques comme objet de recherche

Thématique du colloque

À l'ère d'Internet l'accès à un volume conséquent de publications impacte le travail des chercheurs, leur positionnement dans la communauté internationale, l'évaluation de la recherche et les modèles économiques sous-jacents. Le développement des données en libre accès (OpenData), les bibliothèques, archives et musées en ligne ne sont que quelques exemples illustrant l'évolution de la notion de texte ou document, sa diversité et sa prolifération. Des collections issues de bibliothèques traditionnelles sont maintenant accessibles librement : Gallica, Digital Public Library of America. À ce type de bibliothèques numériques s’ajoutent les publications savantes, qui sont une part importante des publications numériques. Des acteurs francophones importants ont vu le jour aussi bien au Canada qu'en France (Persée, CAIRN, HAL, Erudit). De récentes initiatives nationales ont également permis le développement d'importantes archives scientifiques (ISTEX en France, SwissBib en Suisse, GBV en Allemagne, Scholars Portal en Ontario) ou muséales (Europeana, Musée virtuel du Canada).

Parallèlement les méthodes automatiques de traitement se diversifient et se spécialisent : fouille de texte, méthodes d'apprentissage profond (deep learning) pour traiter des données massives, transformation d’informations en données liées. Cependant, de nombreuses questions restent en suspens, notamment en ce qui concerne la gestion de gros corpus multithématiques. Pouvoir disposer d’outils d’analyse efficaces, capables de s’adapter à de gros volumes de données, souvent de nature hétérogène, pas toujours structurés, dans des langues variées et des domaines très spécialisés, reste un défi.

Le traitement des données numériques implique de multiples domaines (traitement automatique des langues, intelligence artificielle, linguistique, statistiques, informatique), permettant des applications diversifiées : recherche d'information, veille, évaluation de programmes de recherches, prospective…