Environnement et contexte de travail
Notre établissement fait partie de l'Université PSL. Située au cœur de Paris, celle-ci fait dialoguer tous les domaines du savoir, de l'innovation et de la création. Classée parmi les 50 premières universités mondiales, elle forme au plus près de la recherche des chercheurs, artistes, ingénieurs, entrepreneurs ou dirigeants conscients de leur responsabilité sociale, individuelle et collective.
Structure d'accueil
Fondée en 1821, composante de l’Université PSL, membre du Campus Condorcet, partie prenant de l’espace Richelieu, l’École nationale des chartes - PSL est un grand établissement universitaire, qui forme des experts en sciences historiques et philologiques et en humanités numériques.
Fondé en 1834, installé sur le site du Campus Condorcet, le Comité des travaux historiques et scientifiques est un institut de l’École, coordonne plus de 3000 sociétés savantes et est un éditeur scientifique en SHS.
Mission
Contexte
L'ingénieur de recherche aura une position transversale au sein du projet. Il ou elle collaborera avec la plupart de ses acteurs, en particulier avec l'architecte de données et les deux doctorants, sous la supervision du chercheur principal.
Il ou elle travaillera dans une équipe très pluridisciplinaire, avec des chercheurs en philologie, en humanités numériques, en apprentissage
automatique et en mathématiques appliquées. Le projet et les collaborations au sein de l'équipe donneront au développeur de recherche la possibilité de développer ou d'acquérir de nouvelles compétences au cours du projet.
Tâches et work packages
Les missions se concentreront principalement sur les lots de travail suivants :
médiévaux
Dans le contexte de ces work packages, il ou elle sera chargée de développer, de documenter et de maintenir une chaîne de traitement fondée sur l'apprentissage profond, qui sera appliqué aux numérisations de manuscrits récoltés dans les bibliothèques numériques européennes. Cela comprendra l'analyse de la mise en page, la reconnaissance du texte manuscrit, la segmentation, la normalisation et l'annotation du texte, ainsi que la détection de la réutilisation du texte, l'alignement et la collation, dans un cadre multilingue (les langues envisagées par le projet sont les langues médiévales romanes, germaniques et celtiques).
En outre, il ou elle fournira un soutien d'ingénierie aux tâches des deux groupes de travail suivants :
En particulier en ce qui concerne la diffusion, la réutilisation et le développement durable du code des modèles développés par le post-doc (des connaissances spécifiques en modélisation stochastique ne sont pas requises).
Globalement, la personne recrutée sera responsable de la maintenance, de la documentation et de la publication durable des développements réalisés dans le cadre du projet (sous la forme de paquets Python et d'API). Il ou elle travaillera également en étroite collaboration avec l'architecte de données du projet, déjà recruté, qui est en charge de la publication des jeux de données réalisés au cours du projet, et de la politique d'ouverture des données.
Informations - Recherche
Centre Jean Mabillon
Jean-Baptiste [email protected]
Compétences attendues
Master ou doctorat en NLP ou en apprentissage automatique, avec des applications interdisciplinaires.
Master ou doctorat en philologie informatique ou en philologie, avec une expérience dans l'utilisation de méthodes informatiques.
de préférence, une expérience professionnelle préalable dans le domaine des projets de recherche et / ou du développement de la
recherche.