Portrait de Benjamin Kiessling

Benjamin Kiessling, l'architecte IA de l'EPHE - PSL

On doit à Benjamin Kiessling, aujourd’hui ingénieur de recherche à l’Inria, le module d’intelligence artificielle (IA) du logiciel eScriptorium : Kraken. Rencontre avec un ingénieur informatique (développeur principal) passionné par les humanités.

 

Portrait de Benjamin Kiessling et illustration du logiciel Kraken
Benjamin Kiessling et son module d'IA Kraken

 

Où vous est venue l’idée de Kraken ?

J’étais assistant de recherche (HiWi) en Allemagne, il y a tout juste dix ans. L’outil « Ocropus » était un logiciel déjà flexible mais faible en termes d’architecture logiciel. Il faut dire que ce type d’outils de recherche sont souvent très fragiles. Il était donc nécessaire de développer des modules facilement intégrables dans un chaine de traitement, tel que eScriptorium. Kraken reste un logiciel de recherche mais davantage proche des standards utilisés par le monde de l’archivistique.

 

Pourquoi avoir rejoint notre école ?

En 2018, Daniel Stoekl m’a approché pour rejoindre l’EPHE - PSL et le projet Scripta-PSL (Université PSL). C’était une belle opportunité pour développer Kraken ; je rêvais de changement à l’époque, même si le modèle de l’EPHE (enseignement de la recherche par la recherche), dérivé d’un modèle allemand, m’était familier. Je savais en tous les cas que l’EPHE était un haut lieu de recherche dans des langues et écritures rares et que Scripta-PSL s’inscrivait parfaitement dans cette tradition.

De surcroît, l’EPHE est une école dont la taille permet une certaine agilité et où un problème trouve toujours une solution. De fait, Kraken a énormément évolué et n’a plus grand-chose à voir avec ce qu’il était avant.

 

Et qu’est-ce que Kraken aujourd’hui ?

L’objectif de Kraken est de fournir un outil de numérisation, dît de transcription automatique pour les « matériaux » (textes) qui ne sont pas bien traités par les solutions OCR commerciales. Kraken est le seul logiciel qui est conçu comme étant agnostique (pas de biais culturel) par rapport à ces matériaux. Durant ces 7 années, notre équipe a pu implémenter une méthode entrainable automatique (méthode supervisée) pour toutes les tâches liées à l’OCR : trouver les lignes, leur ordre, leur hiérarchie et les transcrire ; les défis de la recherche et du développement étaient immenses à tel enseigne que les modules de la chaîne de reconnaissance de Kraken sont désormais entrainables.

Cette flexibilité en a fait un outil particulièrement utile et largement adopté dans les humanités numériques. Cette communauté se parle et tire, aussi, profit des proximités scripturales. J’ai conçu Kraken pour la transcription de l’arabe et cela a créé des opportunités pour la transcription de l’hébreu. Et les synergies entre projets peuvent être encore plus nombreuses et parfois invisibles. Aujourd’hui, je suis donc devenu le développeur principal du logiciel avec une communauté de plusieurs milliers d’utilisateurs. Il est probable que plusieurs centaines d’instances de kraken et des dizaines d’instances d’eScriptorium soient installées sans que nous n’ayons connaissance. Généralement c’est quand quelque chose ne fonctionne pas que nous interagissons via Github. Mais je préfère largement l’interaction dans la vie réelle lors des nombreuses formations ou transcribathons organisées en Europe et ailleurs.

 

Kraken continue-t-il d’évoluer et de quoi rêvez-vous ?

En 2017, je visais l’arabe, le grec et le latin. Aujourd’hui, je rêve d’une transcription universelle. Plus la communauté s’élargit plus ce rêve devient atteignable. Il y a quelques semaines, lors d’un colloque en Chine, j’ai par exemple appris que Kraken avait été utilisé pour des textes en écriture arabe et en langues sub-sahariennes utilisées au Congo, au Mozambique, au Ghana, au Sénégal et bien d’autres pays. Ces langues partagent des traces d’arabe liées à leurs échanges commerciaux avec l’Inde, Oman... Il s’agit d’un corpus de centaines de milliers de manuscrits pour lequel le projet OPEN ITI a apporté sa contribution. C’est très enthousiasmant et c’est aussi cela eScriptorium : un écosystème décentralisé et ouvert. 

Kraken reste toutefois limité s’agissant de la transcription des textes cunéiformes et hiéroglyphiques (Égypte et Amérique centrale) pour lesquels il n’y a souvent même pas une liste de signes. Outre les développements incrémentaux (écritures, logiciels, fonctionnalités...), Kraken continue d’évoluer notamment sous l’influence des LLM (modèles de langage). Aujourd’hui, le système reste très dépendant d’une détection précise des lignes. J’ai donc réutilisé LLAMA (le LLM de Meta, en adaptant et allégeant son architecture) pour déployer une reconnaissance plus robuste pour les ajouts marginaux et interlinéaires des textes. 

 

Kraken pourrait-il être utilisé en art, en astronomie ou en SVT ?

Bien sûr Kraken pourrait servir à bien d’autres choses. On pourrait imaginer qu’il identifie des peintres, des traces d’empreintes ou des galaxies, mais je ne suis pas certain que cela soit l’outil le plus adapté pour cela bien qu’il fasse de la classification. Cela n’empêche qu’il sert déjà à la numérisation d’archives (dossiers de patients) dans le domaine médical notamment. Mais je suis certain qu’il y aura toujours des gens pour trouver une application bizarre pour kraken que je n’aurais jamais imaginée.

 

Qu’est-ce que ce projet vous a apporté ?

Comme informaticien, je n’avais pas la formation en écriture historique. Avec le temps, mes ambitions sont devenues plus grandes, notamment pour être utile aux chercheurs en sciences humaines. J’ai trouvé extrêmement satisfaisant de travailler avec les sciences humaines car il y a une pratique de la nuance et la vision n’est pas binaire comme en informatique. Dans ce domaine, j’ai souvent constaté que « They don’t know what they don't know ». À l’inverse, en sciences humaines, le questionnement est permanent, riche et extrêmement intéressant. Le monde historique y est beaucoup plus vaste que ce qu’on apprend à l’école. Je n’ai qu’un seul regret, ne pas avoir appris l’arabe, mais j’espère le pouvoir dans le cadre de l’ILARA par exemple.

 

Plus d'infos sur Kraken