Talent.com
Data scientist
Data scientistCESI • Villeurbanne, Auvergne-Rhône-Alpes, France
Data scientist

Data scientist

CESI • Villeurbanne, Auvergne-Rhône-Alpes, France
Il y a 19 jours
Type de contrat
  • Stage
Description de poste

Entreprise :

CESI est une école d'ingénieurs qui fait de la promotion sociale par l'excellence un modèle de réussite. Rejoignez un environnement stimulant où l'esprit d'équipe, la diversité des projets et l'autonomie ne font qu'un. Découvrez une école qui a su développer un modèle unique et se donne les moyens au quotidien de relever les grands défis de l'époque. Nos 25 campus, 28 000 étudiants, 8000 entreprises partenaires et 106 000 alumni témoignent de l'impact de CESI au niveau national.

CESI accompagne ses étudiants en utilisant des méthodes innovantes de pédagogie active. L'établissement forme avec rigueur les futurs ingénieurs, techniciens et managers, dans les secteurs suivants : l'Industrie & l'Innovation, le BTP, l'Informatique et le Numérique et le Développement Durable. Parallèlement, CESI concrétise son engagement dans la Recherche à travers des activités menées au sein de son Laboratoire d'Innovation Numérique, CESI LINEACT.

Les partenariats établis avec 130 universités à travers le globe, attestent de l'engagement international de CESI. Ces liens privilégiés offrent aux élèves ingénieurs une mobilité sortante et entrante à l'échelle internationale, façonnée notamment par des stages obligatoires faisant partie intégrante de leur cursus.

Description du poste :

Title : Enhancing tool detection through data augmentation and transfer learning Strategies in Industry 5.0

Keywords : Affordance; Computer vision; Object detection; Data augmentation; Transfer learning; Industry 5.0.

Description

In industry 5.0 marks a new stage in the evolution of the industrial world, built on three key pillars : human-centricity, sustainability, and resilience. Rather than focusing solely on productivity, it emphasizes creating systems that respect human capabilities, reduce environmental impact, and remain robust in the face of disruptions.

Re-centering the human in industrial systems therefore introduces several challenges (Nahavandi, 2019), particularly the need to design workspaces that are more ergonomic and compatible with human capabilities. The notion of tool affordance (Gibson, 1979), borrowed from the social sciences, provides a key framework for understanding how operators perceive the objects in their environment and how they interact with them. By analyzing these interactions, it becomes possible to design technologies that are more intuitive, adapted, and genuinely human-centered.

To achieve this, an important component is the accurate detection of objects, especially tools used during industrial tasks. Modern approaches rely on deep learning techniques (Trigka & Dritsas, 2025), which typically require large amounts of annotated data to reach high performance. However, collecting and manually labelling real-world industrial datasets is costly, time-consuming, and often impractical due to production schedules, safety and confidentiality constraints. This lack of real-world data represents a major limitation for training robust detection models in industrial environments.

In this context, synthetic data generated through simulation environments offers a promising direction to enrich training datasets. Our previous work on real / synthetic data ratios has shown that combining even a limited amount of real data with larger volumes of synthetic samples can effectively compensate for the scarcity of real-world observations. By producing large, diverse, and perfectly annotated images at low cost, synthetic data can therefore mitigate data limitations and significantly improve model generalization.

Domain randomization techniques applied to synthetic data, such as variations in lighting, object poses, camera viewpoints, and background conditions, can further increase the diversity and realism of synthetic images, helping models become more robust to real-world variability. Traditional data augmentation methods (flip, crop, noise, etc.) can also contribute to improved generalization. Additionally, different transfer-learning strategies can help bridge the gap between synthetic and real-world data by leveraging pretrained models and adapting them to industrial scenarios.

As a continuation of the existing work on mixed real / synthetic datasets (Ouarab et al., 2025a; Ouarab et al., 2025b), this internship will explore these advanced techniques using multiple dataset configurations (real, synthetic, and augmented). The objective is to systematically study how domain randomization, data augmentation, and transfer-learning strategies impact the performance and robustness of industrial tool-detection models, and to compare all these methods with each other in order to identify which approaches offer the best performance and generalization in real industrial settings.

Work program

  • Step 1 : Literature Review (Weeks 2-3)

Review key concepts related to synthetic data generation in Unity, data augmentation, and transfer-learning strategies.

  • Step 2 : Dataset Preparation and Randomization (Weeks 4-6)
  • Prepare and organize the different datasets : real, synthetic, augmented, and mixed.

  • Step 3 : Training and Fine-Tuning Strategies (Weeks 7-14)
  • Train deep learning models for tool detection using different dataset configurations (real, augmented, etc.) and evaluate transfer-learning methods.

  • Step 4 : Experimental Evaluation and Analysis (Weeks 15-17)
  • Produce quantitative metrics (mAP@50, F1-score, etc.) under different variations of datasets and transfer-learning techniques, and identify which combinations offer the best generalization to real industrial environments.

  • S tep 5 : Reporting and Final Presentation (Weeks 18-20)
  • Prepare documentation, dataset summaries, a technical report, and a final oral presentation consolidating the methodology, experiments, and key insights.

    Lab presentation

    CESI LINEACT (UR 7527), Laboratory for Digital Innovation for Businesses and Learning to Support the Competitiveness of Territories, anticipates and accompanies the technological mutations of sectors and services related to industry and construction. The historical proximity of CESI with companies is a determining element for our research activities. It has led us to focus our efforts on applied research close to companies and in partnership with them. A human-centered approach coupled with the use of technologies, as well as territorial networking and links with training, have enabled the construction of cross-cutting research; it puts humans, their needs and their uses, at the center of its issues and addresses the technological angle through these contributions.

    Its research is organized according to two interdisciplinary scientific teams and several application areas.

    Team 1 'Learning and Innovating' mainly concerns Cognitive Sciences, Social Sciences and Management Sciences, Training Techniques and those of Innovation. The main scientific objectives are the understanding of the effects of the environment, and more particularly of situations instrumented by technical objects (platforms, prototyping workshops, immersive systems...) on learning, creativity and innovation processes.

    Team 2 'Engineering and Digital Tools' mainly concerns Digital Sciences and Engineering. The main scientific objectives focus on modeling, simulation, optimization and data analysis of cyber physical systems. Research work also focuses on decision support tools and on the study of human-system interactions in particular through digital twins coupled with virtual or augmented environments.

    These two teams develop and cross their research in application areas such as

    Industry 5.0,

    Construction 4.0 and Sustainable City,

    Digital Services.

    Areas supported by research platforms, mainly that in Rouen dedicated to Factory 5.0 and those in Nanterre dedicated to Factory 5.0 and Construction 4.0.

    Bibliography

    Shorten, C., & Khoshgoftaar, T. M. (2019). A survey on Image Data Augmentation for Deep Learning. Journal of Big Data, 6, 60. https : / / doi.org / 10.1186 / s40537-019-0197-0 .

    Man, M., Arabnia, H. R., & Rasheed, K. (2023). A Review of Deep Transfer Learning and Recent Advancements. Technologies, 11, 40. https : / / doi.org / 10.3390 / technologies11020040 .

    Nahavandi, S. (2019). Industry 5.0-A Human-Centric Solution. Sustainability, 11, 4371. https : / / doi.org / 10.3390 / su11164371.

    Ouarab, S., Garcia, D., Ragot, N., & Dupuis, Y. (2025). Improving Image-Based Tool Detection in Industrial Workstations using Data Augmentation. In Proceedings of the 51st Annual Conference of the IEEE Industrial Electronics Society (IECON 2025).

    Ouarab, S., Garcia, D., Ragot, N., & Dupuis, Y. (2025). Contribution à la caractérisation de l'affordance d'un environnement de travail industriel : une approche basée sur l'apprentissage profond combinant données réelles et synthétiques. In Conférence Nationale sur les Applications de l'Intelligence Artificielle (APIA 2025), Dijon, France. HAL…

    Créer une alerte emploi pour cette recherche

    Data Scientist • Villeurbanne, Auvergne-Rhône-Alpes, France

    Offres similaires
    Data Scientist Machine Learning - (H / F) - En alternance

    Data Scientist Machine Learning - (H / F) - En alternance

    OpenClassrooms • Lyon, Rhône, FR
    Temps plein
    Vos missions en tant que Data Scientist Machine Learning en alternance : .Participer à la conception et à l'évaluation de nouveaux outils numériques pour optimiser les processus de production.Contri...Voir plus
    Dernière mise à jour : il y a plus de 30 jours • Offre sponsorisée
    Data Engineer Senior F / H / X

    Data Engineer Senior F / H / X

    Eleven Labs • Lyon, FR
    Temps plein
    Nous recherchons quelqu’un d’expérimenté / e dans la mise en place de pipeline ETL / ELT et d''infra Data Cloud (GCP, AWS), capable de répondre au mieux aux problématiques qui lui seront soumises, pour...Voir plus
    Dernière mise à jour : il y a 9 heures • Offre sponsorisée • Nouvelle offre
    Data Engineer - Azure cloud

    Data Engineer - Azure cloud

    Dataworks • Lyon, FR
    Temps plein
    Data Engineer (Azure + Databricks).Azure, Fabric, Python, Spark, Databricks, SQL.Reconnue comme une des agences data Microsoft de référence, la société développe une expertise R&D sur les outils Mi...Voir plus
    Dernière mise à jour : il y a 9 heures • Offre sponsorisée • Nouvelle offre
    Data / AI Product Manager

    Data / AI Product Manager

    Upfluence • Lyon, Rhône, FR
    Temps plein
    Quick Apply
    Full-time position, 35 hours / week Based in Lyon, France, open to partial remote Salary depending on experience About Upfluence Upfluence helps brands tell their story with powerful influence...Voir plus
    Dernière mise à jour : il y a 3 jours
    Data Business Manager (H / F) en alternance

    Data Business Manager (H / F) en alternance

    Pigier Lyon • Lyon, FRANCE
    Temps plein
    Quick Apply
    Data Business Manager en alternance.Voir plus
    Dernière mise à jour : il y a plus de 30 jours • Offre sponsorisée
    Data Engineer

    Data Engineer

    LOOM CONSULTING • Lyon, FR
    Temps plein
    Loom est une société de conseil bordelaise en pleine croissance, reconnue pour son expertise en.Portée par une équipe de Loomers passionnés, l’entreprise place. Un accompagnement RH et opérationnel ...Voir plus
    Dernière mise à jour : il y a 9 heures • Offre sponsorisée • Nouvelle offre
    Data Engineer

    Data Engineer

    Innova Solutions • Lyon, FR
    CDI
    Innova Solutions accompagne ses clients dans leurs recrutements ciblés et exigeants.Pour ce poste, nous recherchons un(e) Data Ingénieur Talend répondant aux critères suivants : .Vous justifiez d’au...Voir plus
    Dernière mise à jour : il y a 9 heures • Offre sponsorisée • Nouvelle offre
    Data Engineer / Snowflake- F / H

    Data Engineer / Snowflake- F / H

    AIRVANCE GROUP • Beynost, Ain, France
    Temps plein
    Quick Apply
    Airvance : une entreprise où il fait bon respirer.Expert de la Qualité d'Air Intérieur, nous concevons et distribuons depuis 60 ans des produits et solutions de ventilation, pour traiter, purifier,...Voir plus
    Dernière mise à jour : il y a 19 jours
    Data Analyst confirmé(e) H / F

    Data Analyst confirmé(e) H / F

    AVISIA • Lyon, ARA, FR
    CDI
    Nous intervenons chez nos clients sur des missions 100% data qui allient des dimensions techniques et opérationnelles.Selon votre profil et vos affinités, vous aurez l'opportunité d’intervenir sur ...Voir plus
    Dernière mise à jour : il y a plus de 30 jours
    Teach Lead DATA H / F

    Teach Lead DATA H / F

    Smile Group • Villeurbanne, Auvergne-Rhône-Alpes, FR
    Temps plein
    Quick Apply
    Passionné(e) par la tech, le numérique et l’innovation ? Rejoignez les 1 800 collaborateurs de.L’esprit collaboratif et le partage de connaissances sont au cœur de notre ADN.Nos experts repoussent ...Voir plus
    Dernière mise à jour : il y a 1 jour
    Data Manager (H / F)

    Data Manager (H / F)

    APAVE • Saint-Priest, Auvergne-Rhône-Alpes, France
    CDI
    Et si vous vous engagiez dans un travail porteur de sens, au sein d'une entreprise dotée d'une forte notoriété, et reconnue pour son expertise technique et l'attention portée à ses salarié(e)s.En r...Voir plus
    Dernière mise à jour : il y a 25 jours • Offre sponsorisée
    Alternance Business developer - Lyon (F / H)

    Alternance Business developer - Lyon (F / H)

    iscod alternance • Lyon, France
    Stage
    L’ISCOD, spécialiste de la formation en Digital Learning, recherche pour son entreprise partenaire, son.Business Developer en contrat d'apprentissage. Etat de niveau 7 (Mastère / Bac+5).Optez pour l’a...Voir plus
    Dernière mise à jour : il y a plus de 30 jours • Offre sponsorisée
    Data scientist

    Data scientist

    CESI • Villeurbanne, Auvergne-Rhône-Alpes, France
    Stage
    CESI est une école d'ingénieurs qui fait de la promotion sociale par l'excellence un modèle de réussite.Rejoignez un environnement stimulant où l'esprit d'équipe, la diversité des projets et l'auto...Voir plus
    Dernière mise à jour : il y a plus de 30 jours • Offre sponsorisée
    Data Science Internship

    Data Science Internship

    Hireshire • Lyon, FR
    Stage
    We’re now expanding into the Data Science.This is a hands-on role where you’ll work on real business datasets to build production-ready analytics models and dashboards. Collect, clean, analyze, and ...Voir plus
    Dernière mise à jour : il y a 9 heures • Offre sponsorisée • Nouvelle offre
    Stage-Data Analyst H / F

    Stage-Data Analyst H / F

    La Banque Postale • Lyon, FR
    Stage
    Hub Paiements, tout en explorant des usages avancés en data science pour améliorer les opérations.Venez contribuer à la démarche ambitieuse de valorisation et de maîtrise des données liées aux moye...Voir plus
    Dernière mise à jour : il y a 9 heures • Offre sponsorisée • Nouvelle offre
    Data ingénieur confirmé - produits structurés H / F

    Data ingénieur confirmé - produits structurés H / F

    Canopee • Lyon, FR
    Temps plein
    Quelques mots sur l’Empowering Ecosystem.Nous sommes un cabinet de conseil multi-spécialiste.C’est dans le secteur financier que nous avons développé depuis 2009, notre agilité et nos compétences, ...Voir plus
    Dernière mise à jour : il y a 9 heures • Offre sponsorisée • Nouvelle offre
    Data Analyst F / H

    Data Analyst F / H

    EDF • Lyon 7e Arrondissement, France
    Stage
    Au sein du Centre de Services Partagés Comptabilité Conseil (CSP2C), ses 420 salariés ont pour mission de garantir la qualité comptable et fiscale d’EDF SA et de plus de 100 filiales du groupe EDF....Voir plus
    Dernière mise à jour : il y a 1 jour • Offre sponsorisée
    Data Product Owner

    Data Product Owner

    CENISIS Data Agency • Lyon, FR
    Temps plein
    Data et le développement national au cœur de sa stratégie.Dans un environnement en profonde transformation, nous offrons à nos consultants un cadre stimulant, riche en opportunités et propice à l’é...Voir plus
    Dernière mise à jour : il y a 9 heures • Offre sponsorisée • Nouvelle offre