En 2021, l’Agence européenne du médicament (EMA) a lancé un appel à manifestation d'intérêt (AMI) pour constituer une base de données multicentriques documentées, avec une identification précise des médicaments consommés par les patients de la cohorte. Le Health Data Hub a répondu à cet AMI en collaboration avec quatre établissements de santé : les Hospices Civils de Lyon (HCL), le Centre Léon Bérard (CLB), le Centre Hospitalier Régional Universitaire (CHRU) de Nancy, le groupe hospitalier Paris Saint-Joseph, et deux partenaires scientifiques : l’université de Bordeaux (ISPED/BPE) et l’Agence du Numérique en Santé (ANS).
Ces établissements de santé produisent des données de structure et de nature différentes, c’est pourquoi il est essentiel de les standardiser pour pouvoir les analyser conjointement par la suite. Pour ce faire, le standard OMOP-CDM (Observational medical outcomes partnership - Common Data Model) sera utilisé lors de cette étude. Il s’agit d’un modèle relationnel de bases de données de santé maintenu par le consortium OHDSI (Observational Health Data Sciences and Informatics), qui a pour objectif de rendre interopérables différentes bases d'analyse en santé, qu'elles soient cliniques ou médico-administratives.
Cette interopérabilité se traduit concrètement par la possibilité de partage de données, d'outils, de méthodes, d'études et de programmes entre les centres disposant d'une base au format OMOP-CDM.
Ce modèle de données contient une trentaine de tables centrées autour d’une table patient, permettant de reconstruire facilement les parcours patients. Il recommande de plus l’emploi de nomenclatures standardisées pour décrire les diagnostics, les actes médicaux, les médicaments, les examens paracliniques, etc., ce qui permet de rendre les bases de données interopérables aussi bien au niveau syntaxique que sémantique.
Figure : Schéma relationnel du modèle OMOP-CDM v5.3
La standardisation d’une base de données au format OMOP-CDM comporte quatre étapes :
Établir des règles de correspondance entre les données sources et les tables et variables du modèle OMOP-CDM
Aligner les terminologies utilisées dans les données sources vers des terminologies reconnues comme standards par le modèle OMOP-CDM
Écrire les scripts transformant les données sources selon les règles établies précédemment
Vérifier la qualité de la standardisation
DESCRIPTIF DE LA MISSION
Dans la standardisation des données des hôpitaux vers le format OMOP-CDM, vous interviendrez à l’étape 2) d’alignement des terminologies sources vers des terminologies standards.
Les nomenclatures utilisées par les hôpitaux pour décrire leurs données cliniques et médico-administratives sont soit internes aux établissements, soit utilisées uniquement dans le système de santé français (ex : CCAM). Elles doivent alors être mappées vers des nomenclatures standards d’OMOP-CDM, telles que SNOMED-CT (diagnostics, procédures médicales, produits pharmaceutiques, dispositifs médicaux, etc.) ou RxNorm (médicaments).
Cela signifie que pour chaque code source, il faut trouver un code standard qui ait un sens équivalent, en comparant les libellés des codes concernés.
Par exemple, le code de procédure CCAM NBQK001 “Radiographie de la cuisse” peut être mappé vers le code SNOMED 204327002 “Radiography of thigh”.
Ainsi, pour les codes des nomenclatures utilisés par les hôpitaux participants au projet, vous devrez trouver une ou plusieurs correspondances dans une nomenclature standard.
Pour vous aider, vous utiliserez l’outil USAGI, développé par OHDSI, qui suggère une liste de codes standards correspondant à un code source, en se basant sur la ressemblance sémantique des libellés des codes. Ces propositions restent cependant une aide et induisent parfois en erreur, c’est pourquoi, il est aussi possible de chercher un code manuellement grâce à un moteur de recherche avec mots clés.
Vous serez aussi invités à revoir le travail d’alignement réalisé par vos collègues pour assurer la qualité du résultat final.
Concrètement, ce travail s’articule en 3 parties :
Traduction des libellés des codes sources en anglais. Les nomenclatures sources sont françaises, il est nécessaire de traduire les libellés des codes vers l’anglais
Mapping des codes sources vers des codes standards, avec l’aide de l’outil USAGI (un guide sera fourni)
Relecture de ces alignements par une deuxième personne
Pour cette mission, les terminologies que vous devrez aligner décrivent des médicaments et/ou des tests de biologie et/ou des procédures médicales.