Détection d’erreurs médicamenteuses par machine learning

Cette étude avait pour objectif de caractériser l’exactitude, la validité et l’utilité clinique d’alertes sur les médicaments établies par un logiciel utilisant le machine learning pour générer automatiquement des alertes à partir d’écarts par rapport à la norme. L’étude a été faite sur les données du Brigham and Women’s Hospital et du Massachusetts General Hospital aux États-Unis.

Le logiciel évalué était MedAware, un logiciel commercial. Ce logiciel utilise le machine learning pour créer 3 types d’alertes sur les médicaments:

  • Des données cliniques hors norme (par exemple prescription de contraceptif pour un enfant garçon).
  • Des données temporellement hors norme (par exemple une diminution des plaquettes chez un patient sous anticoagulant).
  • Un dosage hors norme (le dosage est à l’extrême de la distribution habituelle de dose pour ce médicament ou par rapport à l’histoire du patient).

Tous les patients ayant eu au moins une visite externe (les patients hospitalisés n’étaient pas inclus) entre le 1er janvier 2012 et le 31 décembre 2013 dans un de ces deux hôpitaux. Pour ces patients, les données rétrospectives de 5 ans ont été extraites. À noter, ces données étaient déjà encodées dans un dossier électronique de manière structurée, par exemple les données démographiques, les diagnostics, les listes de problèmes, les médicaments, les allergies, les signes vitaux et les résultats de laboratoires. Cependant, ces données comportaient bien sûr les failles habituelles des données cliniques, c’est-à-dire l’encodage de données en texte libre, dans les mauvais champs, de manière inconstante, etc.

Conformément aux principes du machine learning, les données ont été divisées en deux groupes, un groupe d’apprentissage et un groupe de test. Un échantillon de 300 dossiers a été utilisé pour une validation manuelle des alertes générées par le logiciel. Les paramètres évaluées étaient l’exactitude (l’alerte correspondait-elle réellement aux données encodées ?), la validité (l’alerte était elle adéquate compte tenu des données disponibles partout dans le dossier ?), et l’utilité clinique. Le codage de ces paramètres était effectué par consensus de l’équipe de recherche.

747 985 patients ont été inclus, ayant généré 15 692 alertes dans le groupe de 373 992 patients de test. 29,3% des alertes étaient liées aux données cliniques, 66,8% aux données temporelles et 3,9% au dosage. 23,8% des alertes n’étaient pas valides en raison de problèmes liées aux données, donc 76,2% des alertes étaient valides par rapport aux données encodées. De celles-ci, 56,2% étaient de valeur clinique élevée selon l’équipe de recherche et 18,8% de valeur moyenne.

Les auteurs soulignent dans la discussion la difficulté d’analyser un ensemble de données tiré d’un dossier électronique réel compte tenu de la grande variabilité dans la qualité, la disponibilité et l’encodage des données. La classification de la valeur clinique des alertes est aussi discutable car subjective. Néanmoins, le pourcentage d’alertes cliniquement utile est largement plus élevé que ce que l’on voit en pratique réelle, où la vaste majorité des alertes sont d’une utilité discutable. Il semble que le machine learning soit une avenue intéressante pour les systèmes d’aide à la décision du futur.

Laisser un commentaire

Entrer les renseignements ci-dessous ou cliquer sur une icône pour ouvrir une session :

Logo WordPress.com

Vous commentez à l’aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Google+

Vous commentez à l’aide de votre compte Google+. Déconnexion /  Changer )

Image Twitter

Vous commentez à l’aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l’aide de votre compte Facebook. Déconnexion /  Changer )

w

Connexion à %s

This site uses Akismet to reduce spam. Learn how your comment data is processed.