Les bases de données comme outil de recherche

Body: 

Longtemps les bases de données, avec leur technicité et leur complexité, furent réservées au domaine des sciences dures, et chassées, par méconnaissance ou par méfiance, du champ des sciences sociales.

S’aventurer, individuellement ou en groupe, dans ce domaine inextricable, jalonné de risques et de difficultés, semble encore une gageure. La journée d'initiation aux manuscrits arabes 2010 avait pour objectif de dissiper ces idées largement répandues dans le milieu scientifique. C’est pourquoi les membres de la section arabe de l’Institut de Recherche et d’Histoire des Textes/IRHT, qui organisent chaque année une journée d’étude sur les manuscrits arabes, ont proposé une réflexion sur les  « bases de données comme outil de travail ».

Après une introduction générale par Anne-Marie Eddé, directrice de l’IRHT, les intervenants se sont succédé pour présenter leur expérience.

Au préalable, Christian Müller, a mis l’accent sur la diversité des bases de données et leur utilité croissante, à condition d’avoir à l’esprit trois « règles » fondamentales qu’il regroupe sous l’abréviation : U.F.R. :

●        s’interroger sur l’Utilité d’une base pour qu'elle ne devienne pas « une tombe pour les données ».

●        s’interroger ensuite sur sa Faisabilité

  ●        enfin évaluer sa Rentabilité.

Une première expérience a été exposée par Vanessa Van Renterghem, laquelle a créé une base dans le cadre d'un travail de thèse sur les élites bagdadiennes sous les Seldjoukides (ve-vie/xie-xiie siècles). Elle avait adopté une approche historiographique et méthodologique pour souligner les interrogations pertinentes  que suscite un tel milieu de lettrés. Elle a dû dépouiller les sources arabes relatives à la vie littéraire, et en particulier les quelques 2 000 notices biographiques du Tārīḫ Baġdād d’Ibn al-Ḥaṭīb al-Baġdādī. Il lui est très vite apparu que le traitement et l’analyse d’un tel nombre de données serait impossible sans recourir à une base de données. Sa réalisation technique s’est faite à l’aide du logiciel FileMaker Pro, convivial et facile d’emploi. Elle a pu se faire aider pour adapter le logiciel à ses besoins, et malgré les défauts d’une telle base « faite maison », cet outil lui a incontestablement permis de mener à terme sa thèse.

Cette expérience personnelle, « sans informatique ou presque », a suscité la curiosité des jeunes doctorants présents à cette journée. Ils ont ensuite pu découvrir comment se sont élaborées des bases de données dotées de moyens techniques et logistiques plus sophistiqués.

C’est avec le projet de base de données « à quatre vies », comme ont tenu à le dénommer ses concepteurs, que la séance de l’après-midi a débuté. Jacqueline Sublet, Muriel Rouabah et Zouhour Chaabane ont retracé l’histoire de cette entreprise internationale intitulée Onomasticon Arabicum, qui remonte aux débuts de l’informatique en 1966. L’idée de création d’une base de données commença  à germer lorsque le dépouillement des sources biographiques arabes s’intensifia avec l’engagement de nombreux collaborateurs dans le projet.

Jacqueline Sublet, spécialiste de l’onomastique arabe et initiatrice du projet, précise que l’équipe avait recensé et intégré dans une première base plus de 28 000 notices biographiques retraçant les vies d’éminents personnages dans divers domaines (savants, hommes de religion et lettrés de tous horizons, hommes de pouvoir etc..) des débuts de l’Islam jusqu’au xvie siècle. Mais le manque de moyens pour recruter les informaticiens et les jeunes chercheurs dans le domaine de la prosopographie arabe, fut une entrave à l’exécution de cette entreprise, en dépit du soutien de l’IRHT, et de l’engagement des chercheurs. La rapide évolution informatique de ces dernières années a néanmoins permis de transférer les données dans une base aujourd’hui entièrement en arabe sous Access, dans l’attente d’une mise en ligne prochaine d’une partie des données. Elle est pour le moment consultable à la section arabe de l’IRHT.

Une autre base de données récente a été conçue dans le cadre d’un projet européen novateur ILM (Islamic Law Materialized), qui a débuté en avril 2009 et se poursuivra jusqu’à la fin de l’année 2013. Contrairement au cas précédent, le déroulement du programme, les subventions, le groupe de recherche et les objectifs ont été fixés au préalable. La base de données CALD (Comparing Arabic Legal Documents), a donc été créée en moins d’un an avec pour objet l’étude et l’analyse de l’ensemble des actes légaux arabes de l’époque médiévale, dans une perspective comparative entre le droit légal et la pratique juridique dans le monde musulman.

Les trois intervenants (Christian Müller, Lahcen Daaif et Moez Dridi) ont voulu démontré l’efficacité qu’offre cette base pour la recherche, aussi bien pour confronter les documents entre eux que pour analyser chacun séparément.

L’élaboration de cette base a ouvert un vaste champ d’investigation entièrement dédié à la  pratique juridique. Chaque texte est en effet appréhendé comme « un discours » fini qui doit sa cohérence à sa raison juridique et dont dépendent ses éléments constitutifs. Aussi n’est-il qu’un prototype d’une pratique institutionnelle cohérente, dotée de sa propre logique interne. C’est pourquoi, les documents ont été découpés en séquences numérotées appelées SQN (Sequence Unity Number) dans le but d’en faciliter le repérage et d’en identifier le contenu.

Après une présentation technique de la base, Christian Müller a donné aux auditeurs un aperçu sur l’historique du projet et sur la phase analytique des séquences. Ainsi, en recourant à « une analyse par abstraction », il a montré comment on décortique les documents, pour qu’une fois traduits en chiffre, ils puissent être appréhendés différemment. À partir de ce démembrement du document en diverses unités séquentielles, la lecture comparative des actes juridiques sera en effet à la portée de tout chercheur grâce à cette base de données.

La journée d’étude a donné lieu à un débat très animé entre les participants et les auditeurs qui ont été très attentifs à leurs arguments. Le professeur Abdallah Cheikh Moussa qui a animé une table-ronde sur le thème « quel projet scientifique pour quelle solution technique ? » — ainsi que d’autres participants — ont exprimé leur méfiance vis-à-vis des bases de données, à la fois fascinantes par leurs promesses, et parfois décevantes quant aux résultats obtenus.

Même si les opinions concordent pour dire que la création d’une base de données est une mission difficile, qui nécessite une analyse précise des besoins et certaines compétences techniques, il n’en demeure pas moins que c’est un outil nécessaire et prometteur dans le cadre de certaines recherches.

 

Compte-rendu de Moez DRIDI