Health Data Hub Is Hiring!

STAGE - ANALYSE DES TRACES H/F

À propos

Comment améliorer les dépistages et faire en sorte que les patients soient pris en charge le plus tôt possible ?
Comment leur proposer les meilleurs traitements sur le long cours ?
Comment appuyer les professionnels de santé dans un contexte clinique qui se complexifie ou en cas de crise sanitaire ?

L’Intelligence Artificielle et les données de santé font partie de la réponse. Elles sont incontournables pour la recherche et l’innovation en santé. Par exemple, pour prévenir des insuffisances cardiaques à partir de données issues d’appareils connectés, ou pour accélérer le dépistage du cancer du sein à partir d’analyses automatiques des examens de mammographies. Ou même pour réunir assez d’informations afin d’améliorer la prise en charge des maladies rares.

Et pour ça, la France a la chance de disposer de bases de données extrêmement riches !

Mais ces données sont souvent sous exploitées car dispersées. Grâce à des solutions innovantes telles que l’IA, l'objectif du Health Data Hub est justement de permettre d'accéder de manière facilitée; unifiée, transparente et sécurisée à un catalogue de bases de données de santé françaises.

Comment ?
Le Health Data Hub a mis en place une plateforme technologique qui met à disposition des porteurs de projets d’intérêt public, dans un environnement technologique sécurisé et à l’état de l’art, les données de santé pseudonymisées des français. Ces porteurs de projets vont mobiliser des sources de données très volumineuses, les croiser entre elles, et utiliser une puissance de calcul pour faire tourner des algorithmes de recherche complexes. Il s’agit par exemple de projets de start-up pour améliorer des logiciels d’aide au professionnel de santé, de projets permettant d’améliorer la prise en charge des patients en comparant l’efficacité de prise en charge, de projets portés par les administrations pour éclairer les politiques publiques.
Notre offre technologique, en constante évolution, peut être consultée ici.
Les défis sont de taille pour traiter ces données de santé sensibles, volumineuses de natures et formats variables. La plateforme doit être un levier d'innovation dans l'écosystème de la donnée de santé français.

En résumé, avec le Hub, nous accompagnons des porteurs de projets innovants qui contribuent à trouver les solutions de demain pour améliorer la santé de tous les citoyens.

Descriptif du poste

Direction des données :

Pour mener à bien les missions qui lui ont été confiées, le Health Data Hub a formé la direction des données dont les objectifs principaux sont de : 

  1. Soutenir les projets d’intérêt public que le HDH accompagne, aussi bien sur la compréhension des données de santé que sur leur exploitation via des experts des données de santé, des data scientists et des data engineers ;

  2. Gérer et mettre à disposition les données qui lui sont confiées aux porteurs de projet au sein de la plateforme technologique du Health Data Hub ;

  3. Partager et mutualiser les outils et les connaissances nécessaires à l’analyse des données de santé, dans le cadre d’une démarche open source ;

  4. Définir des stratégies novatrices sur la gestion, l’exploitation et le partage de données de santé, permettant de réaliser la vision du HDH.

Au sein de la Direction des données, vous serez rattaché au pôle “d’accompagnement des projets” et aurez la mission d’analyser les traces, ou “logs”, générées par les outils de la plateforme pour détecter certains scénarios d’utilisation d’intérêt.

Mission du stage :

L’une des missions principales du Health Data Hub est de mettre à disposition une plateforme technologique permettant de mettre à disposition des environnements fonctionnels et sécurisés à des équipes de recherche pour qu’elles puissent conduire des études avancées sur des données de santé. Ces études consistent en la réalisation d’analyses statistiques ou en l’entraînement de modèles d’apprentissage automatiques sur des données diverses (données tabulaires, images médicales, textes libres, etc.) et massives (plusieurs To de données).

Toute action ou manipulation de données sur la plateforme technologique produit des traces, ou “logs”. Ces traces sont riches d’informations sur la façon dont les outils sont utilisés, en particulier, elles peuvent permettre de détecter certains scénarios d’utilisation d’intérêt pour l’équipe d’administration de la plateforme. 

De manière plus générale, leur compréhension et leur analyse représentent un jeu de compétences structurant dans la maîtrise des systèmes d’information car c’est à travers la génération de traces que toute technologie indique son état, critique pour son maintien en condition opérationnelle, ou comment elle est utilisée, vitale pour s’assurer qu’il n’y ait pas de problème de sécurité.

L’objectif du stage est de : 

  • prendre connaissance des scénarios d’intérêt identifiés, les approfondir et les compléter le cas échéant suite à une étude de la littérature ;

  • prendre en main les traces générées par la plateforme technologique, les mettre en cohérence, les rendre exploitables et éventuellement mettre en place des dashboards pour favoriser leur exploration et leur exploitation au regard des scénarios d’intérêt ;

  • de développer des méthodes pour identifier les scénarios de façon automatique et lever des notifications le cas échéant. 

Les résultats produits lors du stage pourront être à terme intégrés dans les outils d’analyse de traces de la plateforme et utilisés opérationnellement par les équipes du Health Data Hub.

Les traces sont des données textuelles plus ou moins structurées pouvant être particulièrement volumineuses, leur manipulation requerra donc l’utilisation de techniques relevant du NLP et de logiques d’optimisation ou de distribution de calculs.

Le travail s’appuiera essentiellement sur des traces issues de logiciels comme Jupyter, Rstudio ou PostgreSQL et pourra s’inspirer des manipulations usuelles d’une base de données de référence et fréquemment utilisée dans la recherche en santé, le Système National des Données de Santé (SNDS).

Profil recherché

Compétences techniques

  • Analyse de données

  • Python, SQL

  • Notions en statistiques

  • Intérêt pour l’analyse de traces

Qualités relationnelles et personnelles

  • Motivation

  • Rigueur, clarté de présentation

  • Sens du travail en équipe

  • Force de proposition

  • Curiosité intellectuelle

POURQUOI CHOISIR LE HEALTH DATA HUB ?

Vous êtes motivé(e) à rejoindre une équipe impliquée dans un projet ambitieux, qui a du sens et une finalité d’intérêt public ? Rejoignez-nous !

Notre structure récente, d’une cinquantaine de collaborateurs/trices, a besoin de talents créatifs, autonomes et proactifs pour continuer de grandir !

Ensemble, nous nous sommes engagés à :

  • Accompagner les porteurs de projet visant à analyser les données de santé pour le bien commun.

  • Construire et opérer une plateforme technologique pour leur offrir les meilleurs outils avec un très haut niveau de sécurité à respecter.

  • Réunir et mettre en forme les données au plus grand potentiel pour la recherche et l’innovation.

  • Promouvoir le partage des connaissances, des expertises et du savoir et diffuser une culture de la donnée de santé auprès de tous.

Bon à savoir: 

💪 Rejoindre le HDH c’est surtout participer à un projet enrichissant humainement qui a du sens, avec un fort impact sociétal

🏆 Au HDH on favorise la prise d’initiative, dans une ambiance de challenge perpétuel

😎 Ici la bonne humeur et l’esprit d’équipe règnent

Process de recrutement

Après avoir postulé, le recrutement se déroulera de la manière suivante : 

  • Un premier entretien avec un membre de l’équipe (45 min)

  • Une mise en situation à réaliser chez soi et un compte rendu des échanges

  • Un entretien avec le manager basé sur la mise en situation (45 min)

  • Une rencontre RH

Informations complémentaires

  • Type de contrat : Stage (5 à 6 mois)
  • Lieu : Paris
  • Télétravail partiel possible

Vous êtes intéressé par cette offre ?