eScriptorium

eScriptorium : une aventure collective croisant humanités et IA

eScriptorium est un logiciel qui utilise Kraken, un moteur d’Intelligence Artificielle (IA), pour transcrire automatiquement des documents manuscrits et imprimés. L’avènement de cette plateforme est le fruit d’un long processus de maturation scientifique et humaine, nourri par les contributions diverses de l’EPHE - PSL. 

Dès l’origine, le projet s’inscrit dans le paysage singulier de l’EPHE - PSL, marqué par une culture de l’érudition, une ouverture interdisciplinaire et une méthode de recherche fondée sur la pratique en séminaire. C’est dans ce contexte qu’a émergé, à l’initiative de Daniel Stökl Ben Ezra, directeur d’études, titulaire de la Chaire de philologie et linguistique de l’hébreu et de l’araméen anciens, l’idée de créer un outil informatique à la fois sophistiqué mais simple d’usage, destiné aux chercheurs travaillant sur les sources écrites. Avec l’essor spectaculaire de l’IA et du deep learning, cette intuition – permettre la lecture automatique et l’analyse à grande échelle de documents historiques – a trouvé un écho favorable. Le président de l’EPHE de l’époque, Hubert Bost, puis son successeur, Denis Pelletier, ont soutenu avec conviction cette initiative, inscrite dans la volonté de promouvoir les humanités numériques (HN) au sein de l’Université PSL alors en pleine construction.

 

Des synergies institutionnelles fondatrices

C’est également dans le cadre de l’Initiative de Recherches Interdisciplinaires et Stratégiques Scripta-PSL, consacrée à l’histoire et aux pratiques de l’écrit, et pilotée par Andreas Stauder avec le soutien de Philippe Huyse, que le projet a pris forme et cette initiative a servi d’incubateur scientifique pour eScriptorium, tout en étant soutenue par la direction de l’école et de ses trois sections. Le projet a également bénéficié de l’appui déterminant du programme Biblissima+, dirigé par Anne-Marie Turcan-Verkerk. Grâce à ce soutien, à la fois financier et technique, eScriptorium a pu se développer dans un environnement favorable, en étant étroitement lié au laboratoire AOrOc.

 

Une aventure humaine et technologique

Au-delà de ces soutiens institutionnels, eScriptorium est avant tout une aventure humaine. La plateforme a permis de rassembler philologues, spécialistes des écritures rares et informaticiens dans un réseau scientifique d’une grande dynamique. Deux figures majeures du développement, Benjamin Kiessling et Robin Tissot, illustrent parfaitement cette rencontre entre les humanités et le monde de l’ingénierie. Le développement constant de la plateforme repose sur une interaction dynamique entre les chercheurs, les développeurs et la communauté d’utilisateurs, notamment autour de son moteur d’OCR Kraken. L’arrivée de Peter Stokes à l’EPHE - PSL comme directeur d’études en HN, a par ailleurs renforcé le pilotage scientifique et donné toute la dimension pédagogique d’eScriptorium, dans le paysage des formations de niveau Master en humanités.

 

Des collaborations notables

De nouvelles collaborations se sont nouées avec des partenaires du monde de la recherche et de la culture, notamment l’équipe Inria Almanach dirigée par Benoît Sagot, avec notamment Alix Chagué ou Laurent Romary, pour répondre à divers défis (développements, documentation) mais aussi de pérennité technologique de l’instance principale (infrastructures de calcul, stockage, en fin 2025) Le réseau inclut naturellement l’École nationale des chartes – PSL, en particulier via le Master Humanités numériques de PSL.

 

Une plateforme devenue référence internationale

Entrée dans sa maturité, eScriptorium est désormais au cœur de grands projets de recherche européens, notamment MiDRASH (hébreu), DeLiCaTe (arménien-géorgien) et PRIMA (italien). Ces projets démontrent la polyvalence de la plateforme, capable de traiter des écritures variées – jusqu’aux sinogrammes, qui posent de nouveaux défis scientifiques (voir l’article sur la loi de puissance et le chinois classique). Les initiatives OpenITI ou Syriac Transcribathon témoignent également du caractère vivant et collectif : la recherche y prend la forme d’événements collaboratifs et participatifs, où chercheurs et étudiants travaillent ensemble.

 

Un écosystème pour la science ouverte

Si Biblissima+ et les programmes de recherche de PSL ont servi d’incubateur, ce sont les grands projets ERC et la démarche de science ouverte qui ont assuré la visibilité internationale d’eScriptorium. Aujourd’hui, cette plateforme incarne un écosystème unique pour toutes celles et ceux qui s’intéressent à l’écrit, aux écritures et aux langues – qu’il s’agisse de philologie, de linguistique ou d’IA.

39 instances d’eScriptorium (20 institutions partenaires) ont été identifiées dans le monde, dont les plus importantes en nombre de pages sont celles de Paris, de Jérusalem, de Mannheim, de Leipzig et du Maryland.

 

Retrouvez dans Ephéméride un dossier complet sur cette réussite collective !