Contexte :
L’intelligence artificielle est une passion et vous souhaitez contribuer à l’industrialisation de solutions IA à fort impact ?
Rejoignez CODRA en tant que Lead Data Scientist et participez à la conception, au déploiement et à la mise en production de systèmes d’ IA et d’ IA générative (LLM / RAG) à l’échelle de l’entreprise.
En collaboration étroite avec le Responsable du pôle Data & IA , vous jouerez un rôle clé dans la structuration et la montée en puissance de l’équipe Data & IA de CODRA.
vos Missions :
En tant que Lead Data Scientist , vous serez au cœur de la conception, du déploiement et de l’industrialisation de systèmes d’IA et d’IA générative à fort impact pour CODRA.
Conception & Développement
- Concevoir, entraîner et optimiser des modèles de machine learning (classification, régression, prévision, détection d’anomalies).
- Sélectionner les algorithmes et frameworks adaptés (XGBoost, Random Forest, CNN, LSTM…).
- Concevoir et mettre en production des architectures RAG / LLM robustes et scalables (FAISS, Weaviate, Pinecone, Chroma…).
- Intégrer et orchestrer les LLMs pour produire des réponses contextuelles et factuelles.
- Développer des mécanismes d’évaluation continue de la factualité et de la pertinence.
Préparation & Structuration des données
Collecter, nettoyer et enrichir des jeux de données structurées ou semi-structurées.Construire des pipelines de data engineering robustes et reproductibles.Ingestion, vectorisation et indexation de corpus textuels internes ou externes.Définir les stratégies d’embedding et de mise à jour des bases de connaissances.Évaluation, Industrialisation & Monitoring
Évaluer les performances via des métriques quantitatives (AUC, RMSE, F1-score…).Industrialiser les modèles via des pipelines MLOps (MLflow, Airflow, Docker…).Mettre en place un suivi de la performance et du comportement des LLMs (LangSmith, Traceloop, W&B).Diffusion de la culture IA
Participer à la définition les bonnes pratiques en conception, expérimentation et documentation.Accompagner les équipes métiers dans la transformation des besoins en modèles exploitables.Contribuer à la diffusion d’une culture data-driven et IA responsable au sein de l’entreprise.Assurer une veille active sur les nouvelles approches et technologies IA générative émergentes.Ce poste est fait pour vous si :
Vous avez un Bac+5 à Bac+8 en informatique, mathématiques, data science ou IA.Vous possédez 10 ans d’expérience dont 5 à 8 ans d’expérience minimum en data science .Vous disposez d’une expérience avérée dans la mise en production de modèles LLM à fort impact.Vous savez faire preuve d’esprit d’innovation, de rigueur et de curiosité.Compétences techniques :
Python (Pandas, NumPy, Scikit-learn, PyTorch, TensorFlow).Compétences en statistiques et modélisation prédictive.Environnements cloud / MLOps (AWS, GCP, Azure, MLflow, Docker, Kubernetes).Connaissances des architectures RAG / LLM , des bases vectorielles et outils de versioning (Git, CI / CD).Ce que vous trouverez chez nous :
Une passion communicative : nos collaborateurs sont tous passionnés par l’informatique scientifique et technique ; ils sont curieux de découvrir et partager de nouvelles technologies.La qualité et la rigueur : nous apportons une attention toute particulière à la qualité de ce que nous livrons. C’est une garantie pour nos collaborateurs d’être fiers de ce qu’ils produisent et le meilleur moyen de gagner leur confiance.Du collectif : pour créer du lien nous aimons partager des moments ensemble : run du midi, challenge sportif, soirée jeux et les fameux Codrapéro ! Notre CSE est aussi très actif et propose très régulièrement des activités : cinéma, escape game, activités sportives, il y en a pour tous les goûts !Un accompagnement : des équipes disponibles pour les nouveaux arrivants, c’est le point fort qui revient le plus dans nos rapports d’étonnement.