- Recherche d'emploi
- Toulouse (31)
- data science
Data science Offres d'emploi - Toulouse (31)
Créer une alerte emploi pour cette recherche
Data science • toulouse 31
STAGE - Data Science Exploration d'applications d'embeddings géospatiaux
CLSRamonville-Saint-Agne- Offre sponsorisée
Life Science Business Analyst
wegaToulouse, FR- Offre sponsorisée
Data Analyst H / F
Lynx RHToulouse, Occitanie, FranceData Analyst
TechnoRightVija- Offre sponsorisée
Data Analyst
Eurofirms Group | People firstToulouse, Occitanie, France- Offre sponsorisée
Data Analyst Data Steward H / F
SafranBlagnac, Occitanie, France- Offre sponsorisée
Consultant Data Engineer - Big Data H / F
MP DataToulouse, Occitanie, FranceData Science Co-Founder CPTO (100 remote) (mfd)
EWOR GmbHToulouse, Haute-Garonne, FranceEVP Head of Global In Silico and AI (all genders)
Evotec SEToulouse- Offre sponsorisée
Data Engineer (H / F)
AIRBUSToulouse, Occitanie, FranceStage en Gestion de Projet (PMO) orienté Digital & Data Science (fh)
AirbusBlagnac, FranceSTAGE – Ingénieur Data Science, GPUs et conteneurs F / H
ThalesToulouse- Offre sponsorisée
Data Scientist
CapgeminiToulouse, Occitanie, France- Nouvelle offre
Data Specialist
TechBiz Global GmbHToulouse, OCC, FRData Engineer
DGTL PerformanceToulouse, HAUTE-GARONNE, MIDI-PYRENEES, FranceData Engineer Data Analyst (secteur aéronautique)
ALTENToulouse, Haute-Garonne, FranceData Analyst Colomiers
Sopra SteriaColomiers, France- Offre sponsorisée
Data Annotator
Innodata Inc.Toulouse, FRStage Ingénieur Business Analyst FM
NXP SemiconductorsToulouse, Haute-Garonne, FranceRecherches associées
STAGE - Data Science Exploration d'applications d'embeddings géospatiaux
CLSRamonville-Saint-Agne- Stage
Dans ce contexte, l’équipe Data de CLS recherche un(e) stagiaire souhaitant mettre en pratique ses compétences sur le sujet suivant :
«Exploration d’applications d'embeddings géospatiaux.»
Les modèles de fondation géospatiaux représentent une avancée majeure dans l’exploitation de données spatiales à grande échelle. Pré-entraînés sur des données massives et souvent multi-modales, ils permettent de créer des représentations riches et générales (les embeddings), de généraliser plus facilement sur différents territoires.
Ces technologies visent à démocratiser l'utilisation des données d'Observation de la Terre (EO), rendant l'analyse avancée accessible sans expertise spécialisée en apprentissage automatique ou en SIG
L’objectif du stage est de concevoir un prototype d’exploration de donnée géospatiales en utilisant les embeddings, afin d’évaluer la maturité, les difficultés et ls opportunités liées à cette nouvelle modalité dans les différentes métiers géospatiaux de CLS.
Au cours de ce stage, vous serez amené(e) à :
- Réaliser une étude bibliographique des approches des derniers modèles de fondation géospatiaux et des Vision Language Models, tels que SkyCLIP, RemoteCLIP, DescribeEarth,...
- Cadrer des premiers cas d’usage avec l’équipe Datalab et les équipes métier de CLS, parmi :
- La détection de changement sémantique : comparer les vecteurs dans le temps pour déterminer la nature du changement en langage naturel (par exemple, une forêt transformée en champ de culture)
- L'interrogation d’images EO : permet de rechercher des images satellites et leurs géolocalisations en utilisant des requêtes textuelles complexes.
- La recherche de similarité : permet de rechercher des images satellites ou de la recherche de similarité sémantique.
- Préparer une base de données vectorielle d’embeddings sur une zone d’intérêt
A partir d’embeddings existants,
A partir d’embeddings qui seront générés sur une petite zone d’intérêt
Concevoir, implémenter le prototype
Avec le foundation model ou VLM approprié,
Avec la pipeline de bout en bout,
Avec une IHM simple (notebook, gradio, streamlit..)
Evaluer les performances, limitations et axes d’améliorations
Présenter et documenter vos travaux au sein de l’équipe Data et aux équipes métier.
A propos du profil recherché
Etudiant(e) en école d’ingénieurs ou en Master 2 avec une spécialisation en Data Science, Intelligence Artificielle, Machine Learning ou Mathématiques Appliquées, vous souhaitez mettre en application vos connaissances à travers des projets dans un domaine stimulant et porteur de sens.
Compétences et connaissances souhaitées :
Solides bases en apprentissage automatique et profond (Machine Learning et Deep Learning) ;
Maîtrise des langages et bibliothèques de data science, en particulier Python, scikit-learn, PyTorch, pandas, numpy, geopandas, matplotlib, etc.
Connaissance des outils de versionnement et de développement collaboratif (Git, Jupyter notebooks, etc.),
Une familiarité avec les environnements GPU, Cloud (notamment AWS) serait appréciée.
Qualités attendues :
Curiosité scientifique et goût pour l’expérimentation
Esprit analytique, rigueur, sens de l’organisation et autonomie
Capacité à collaborer au sein d’équipes pluridisciplinaires
Bonnes capacités de communication écrite et orale pour présenter et valoriser vos résultats.