Le poste
Ingénieur Data
Dans le cadre de l'appel à projet national pour la constitution d'entrepôts de données de santé (EDS), les 4 CHUs de la région AURA se sont associés pour co-construire la solution partagée interopérable EDS-D2H.
Missions
Pour participer au développement et à la mise en oeuvre d'EDS-D2H, nous recherchons un ingénieur data passionné par les données et la santé pour rejoindre l'équipe EDS du CHUGA. En tant qu'Ingénieur Data, vous serez responsable de la conception, du développement et de la maintenance de nos pipelines de données. Votre rôle consistera à collecter, nettoyer, transformer et stocker les données provenant de diverses sources, en veillant à leur qualité et à leur intégrité.
Vos missions seront les suivantes :
- Analyser les sources de données métier (système d'information d'imagerie, d'anesthésie, de réanimation et autres applicatifs du domaine de la santé) pour comprendre leurs spécificités et caractériser les contraintes d'intégration à l'EDS (utilisation de la donnée, format, volume, fréquence)
- Collaborer avec les équipes d'accompagnement de projets de recherche pour comprendre les besoins métiers en jeux de données et apporter une expertise technique sur les sources de données et la chaîne de traitement
- Concevoir, développer et documenter les chaînes de traitement de la donnée (collecte, modélisation, traitement, stockage) adaptées aux contraintes avec des outils de type ELT
- Maintenir les chaînes de traitement des données et optimiser leurs performances (optimisation des requêtes SQL, stratégie et orchestration des traitements)
- Assurer la sécurité et la confidentialité des données conformément aux réglementations en vigueur pour les données de santé
Profil recherché
Profil
Diplômé d'une formation bac + 3 / 5 en informatiqueExpérience de minimum 2 ans sur un poste d'ingénieur dataSavoir-faire requis
Bonne connaissance d'une solution de manipulation des données ELT (idéalement dbt) et d'orchestration (idéalement Dagster)Bonne connaissance des bases de données SQL (SQLServer, PostgreSQL, Oracle), colonne (ClickHouse) et des index de recherche textuelle (ElasticSearch, OpenSearch)Maîtrise de Python et ShellMaîtrise des systèmes d'exploitation (Unix, Windows)Maîtrise des méthodes de développement agile et de l'utilisation de solutions de gestion de version (gitlab, github)Connaissance de la réglementation concernant les données personnelles et des principes de cybersécuritéMaîtrise de l'anglais techniqueSavoir-faire apprécié
Expérience en software engineeringConnaissance en administration de bases de donnéesConnaissance du DevOps et de l'intégration continue et de livraison continue (CI / CD)Connaissance sur les clusters KubernetesAutres langages de programmation (R, Java, Scala)Savoir-être
Qualités relationnelles et travail en équipe, au sein de la structure et en lien avec le partenaire industriel et les data engineers des autres CHUsRigueur et organisationCapacité d'anticipation et prise d'initiativeAdaptabilité