Data Engineer Python (H / F) - Toulouse
Contexte
Nous renforçons notre pôle data afin de structurer, développer et industrialiser nos pipelines de données.
Dans ce cadre, nous recherchons un Data Engineer Python capable de concevoir et maintenir des architectures data robustes, scalables et orientées performance.
Vous rejoindrez une équipe passionnée, travaillant en méthode Agile, au coeur d'un environnement technique moderne.
Missions
En tant que Data Engineer, vous interviendrez sur l'ensemble du cycle de vie de la donnée :
Architecture & Ingestion
- Concevoir, développer et maintenir des pipelines d'ingestion de données (batch & streaming)
- Intégrer des données provenant de sources variées (API, bases SQL / NoSQL, fichiers, événements)
Transformation & Traitement
Développer des workflows de traitement en Python, PySpark ou PandasGérer, optimiser et fiabiliser les pipelines dans un environnement Data Lake / Data WarehouseImplémenter des bonnes pratiques d'ingénierie : code propre, versioning, testsIndustrialisation & Production
Déployer des workflows via Airflow, Prefect ou équivalentOptimiser les performances, surveiller la qualité et garantir la fiabilité en productionAutomatiser les processus de CI / CD et participer aux bonnes pratiques DevOpsCollaboration & Méthodologie
Travailler avec les équipes Data Science, BI, Produit et DevOpsContribuer à la documentation technique et au partage de connaissancesParticiper aux cérémonies Agile / Scrum (daily, sprint planning, revue)Stack technique
Langages : Python (indispensable)Frameworks / Libs : Pandas, PySpark, FastAPI (apprécié), DBT (un plus)Orchestration : Airflow, Prefect, DagsterStockage & Bases de données : PostgreSQL, Snowflake, BigQuery, Redshift, Delta LakeCloud : AWS / GCP / AzurePipeline & DevOps : Docker, Kubernetes, GitLab CI / GitHub ActionsTools : Kafka / PubSub / Kinesis, Terraform, Grafana / PrometheusVous maîtrisez Python et ses bonnes pratiques d'ingénierieVous avez une solide expérience (+5 ans) en développement de pipelines de donnéesVous connaissez au moins une solution de cloud (AWS, Azure ou GCP)Vous êtes à l'aise avec les bases de données SQL et / ou NoSQLVous appréciez travailler en environnement AgileVous faites preuve de rigueur, d'autonomie et de sens du collectifUn réel intérêt pour l'optimisation de performances et l'industrialisation est un plus