Contexte et atouts du poste
Dans le cadre de NeuroKnowAI, un projet de start-up deep tech issu de la recherche. Ce projet fait actuellement partie du programme d'accélération Inria Startup Studio. NeuroknowAI est une plateforme de traitement intelligent de documents axée sur la confidentialité et dotée de connaissances spécialisées dans divers secteurs.
L'objectif est de développer et d'intégrer des modèles d'IA et des pipelines de traitement de documents plus spécifiquement dédiés au traitement intelligent de documents multi-secteurs (assurance, santé, juridique, finance, médias, RH, marketing, immobilier) avec une architecture axée sur la confidentialité.
Aucun déplacement régulier n'est prévu pour ce poste. Le travail s'effectue principalement sur site (quelques jours de télétravail sont possibles).
Mission confiée
Missions :
Avec l'aide de l'équipe technique de NeuroKnowAI, la personne recrutée concevra, développera et optimisera des modèles d'apprentissage automatique pour le traitement intelligent de documents, notamment des modèles Transformer, la reconnaissance d'entités nommées (NER) et des algorithmes de confidentialité différentielle.
Collaboration :
La personne recrutée sera en contact avec l'équipe de R&D qui développe les produits NeuroDoc, NeuroShield et NeuroGuard afin d'assurer l'intégration des modèles d'apprentissage automatique dans l'infrastructure de production.
Responsabilités :
La personne recrutée sera chargée de concevoir et de mettre en œuvre des modèles d'apprentissage automatique spécifiques à l'industrie et prendra des initiatives pour améliorer les performances, la précision et l'efficacité des pipelines de traitement des documents.
Pilotage / gestion :
La personne recrutée sera chargée de documenter les développements techniques et de contribuer aux décisions architecturales en matière d'apprentissage automatique.
Principales activités
Activités principales :
1. Développer et former des modèles Transformer pour le traitement multimodal de documents (OCR, reconnaissance vocale, analyse de texte)
2. Concevoir des modèles NER spécifiques à certains secteurs (santé, droit, finance, assurance, etc.)
3. Mettre en œuvre des algorithmes de confidentialité différentielle pour NeuroShield
4. Optimiser les pipelines ML pour un traitement haute performance (multi-GPU, calcul à précision mixte)
5. Intégrer les modèles dans l'infrastructure de recherche sémantique
Activités complémentaires :
1. Rédiger la documentation technique et les rapports de performance
2. Tester, modifier et valider les modèles avant leur déploiement en production
3. Présenter l'avancement des travaux aux partenaires et à l'équipe
Compétences
Compétences techniques et niveau requis :
Langues :
Compétences relationnelles :
Autres valeurs appréciées :
Avantages
Rémunération
Selon le profil
En • Le Chesnay Cedex, FR, FR