Biais cognitif lié à l’aide à la décision

Les systèmes d’aide à la décision gagnent en popularité avec l’informatisation croissante des dossiers médicaux, en particulier dans le contexte de la prescription électronique. Il existe également de tels outils intégrés aux systèmes d’information pharmacie, notamment pour la détection d’interactions médicamenteuses. Néanmoins, l’impact clinique de tels systèmes est sujet à débat, en particulier quand on constate à quel point les alertes générées peuvent être de pertinence clinique douteuse, ou bien lorsque des problèmes importants ne sont pas détectés.

Cette étude avait pour objectif d’évaluer la présence de biais cognitif induit par les systèmes d’aide à la décision, notamment l’omission de problèmes en absence d’alerte, les interventions inappropriées en présence d’alertes inexactes, et l’impact des interruptions et de la complexité des tâches sur ces éléments.

120 étudiants en médecine dans les deux dernières années de leur formation dans des universités australiennes ont participé à l’étude.  Chaque participant devait compléter des scénarios de simulation les exposant à neuf situations, soit une situation contrôle sans aide à la décision, une aide à la décision adéquate et une aide à la décision inadéquate, chacune en condition normale, en présence d’interruptions et en présence d’une tâche plus complexe. Durant chaque scénario, ils devaient prescrire des médicaments dans un logiciel simulé en présence d’un contexte clinique réaliste. Les scénarios ont été développés et révisés par plusieurs spécialistes, incluant des pharmaciens, afin de s’assurer que ceux-ci étaient adéquats. Notamment, les prescriptions à faire étaient représentatives des responsabilités des étudiants en médecine, et les erreurs à détecter étaient sans ambiguité et clairement à éviter. De plus, les participants étaient avisés que les alertes fournies par le système pouvaient être inexactes ou absentes.

4065 prescriptions ont été faites, comportant 1049 erreurs, incluant les non-prescriptions de médicaments requis. 70% de ces erreurs ont été induites par les scénarios, et 30% ont été jugées comme originant purement des participants. Tous les participants ont fait au moins une erreur.

Comparativement à la situation contrôle, l’aide à la décision adéquate a réduit les erreurs de prescription de 58,8%, alors que l’aide à la décision incorrecte a augmenté les erreurs de prescription de 86,6%. Fait intéressant, les interruptions et la complexité du scénario n’ont pas affecté significativement les biais cognitifs induits par l’aide à la décision. Les résultats complets sont bien plus détaillés, ça vaut la peine de lire le texte complet pour bien en comprendre toutes les nuances.

Les auteurs soulignent que les participants avaient de la difficulté à déterminer si les alertes d’aide à la décision étaient correctes ou non, et même si des omissions avaient lieu.

Je trouve l’article pertinent car il illuste comment l’aide à la décision peut avoir un impact positif si les alertes sont bien paramétrées et adéquates, et comment les effets de cette technologie peuvent être délétères en présence d’omissions ou d’alertes inadéquates. Bien sûr, la tâche de paramétrage d’un système d’aide à la décision est colossale. Bien souvent, la possibilité de personnaliser les alertes, d’en ajouter ou d’en désactiver est inexistante ou limitée, et le nombre d’alertes livrées avec le système est très grand, rendant la révision de celles-ci une par une irréaliste. Plusieurs articles ont décrit les problèmes liés à l’inclusion de nombreuses alertes pour des raisons légales ou administratives, et ont fait des recommandations pour filtrer ce contenu. Encore faut-il avoir les ressources et la capacité technique de le faire.

Surveillance des antimicrobiens à l’aide d’une stratégie électronique

Cet article décrit une stratégie de surveillance des antimicrobiens mise en place dans un hôpital de réadaptation français de 255 lits de courte durée et 108 lits de réadaptation ciblé sur les blessures à la moëlle épinière. Une équipe composée d’un pharmacien, d’un microbiologiste et d’un médecin spécialiste en maladies infectieuses a été mise en place pour surveiller la prescription d’antimicrobiens en ciblant certaines classes.

La stratégie de surveillance consistait en l’identification d’antimicrobiens de certaines classes prescrits pour plus d’une journée (par exemple piperacilline-tazobactam, carbapénèmes). Le prescripteur devait détailler l’indication dans le système de prescription électronique, puis effectuer un suivi au jour 3 de la prescription. Une requête d’extraction des données vers un chiffrier Excel a été mise en place, et permettait à l’équipe de surveillance d’effectuer un suivi des prescriptions. D’abord, un pharmacien vérifiait les doses prescrites et la présence d’interactions médicamenteuses, puis alertait le prescripteur selon la conformité de la prescription aux lignes directrices du centre. Ensuite, le microbiologiste validait la prescription en fonction des résultats de culture et de susceptibilité. Les prescriptions étaient classées en appropriées ou inappropriées pour une de trois raisons: l’absence de culture requise, la non susceptibilité à l’antibiotique prescrit, ou un spectre trop large. Les prescriptions jugées inappropriées et non cessées malgré l’alerte étaient transmises par courriel à l’infectiologue, qui effectuait une intervention directement auprès du prescripteur pour évaluer si la prescription était adéquate ou pour recommander une modification. Pour l’étude rapportée, les données de janvier 2012 à décembre 2014 ont été collectées.

2216 prescriptions ont été revues. Le microbiologiste a évalué 1224 (58.1%) prescriptions comme inappropriées, et de celles-ci 835 (68.2%) ont été modifiées sans intervention. 389 (31.8%) prescriptions ont mené à une alerte, pour lesquelles 293 interventions ont effectivement eu lieu. Dans 157 (53,6%) interventions, le traitement a été jugé adéquat en fin de compte, et dans 136 (46,4%), le traitement a été jugé inapproprié, puis modifié dans 132 de ces cas.

Le système décrit est relativement « low-tech », consistant en une simple extraction de données puis un suivi partagé à l’aide d’un chiffrier Excel. Ça a l’avantage d’offrir un suivi des antimicrobiens plus fin qu’à l’aide d’alertes complètement automatisées, mais il n’est pas clair si l’investissement de temps requis de la part de chacun des membres de l’équipe pour ce suivi manuel est vraiment rentable. Par ailleurs, dans le cadre de cette étude l’antibioprophylaxie chirurgicale et médicale était exclue, probablement en raison du volume, mais dans mon expérience beaucoup d’interventions de ce type sont nécessaires avec les prescriptions de prophylaxie.

Détection d’erreurs médicamenteuses par machine learning

Cette étude avait pour objectif de caractériser l’exactitude, la validité et l’utilité clinique d’alertes sur les médicaments établies par un logiciel utilisant le machine learning pour générer automatiquement des alertes à partir d’écarts par rapport à la norme. L’étude a été faite sur les données du Brigham and Women’s Hospital et du Massachusetts General Hospital aux États-Unis.

Le logiciel évalué était MedAware, un logiciel commercial. Ce logiciel utilise le machine learning pour créer 3 types d’alertes sur les médicaments:

  • Des données cliniques hors norme (par exemple prescription de contraceptif pour un enfant garçon).
  • Des données temporellement hors norme (par exemple une diminution des plaquettes chez un patient sous anticoagulant).
  • Un dosage hors norme (le dosage est à l’extrême de la distribution habituelle de dose pour ce médicament ou par rapport à l’histoire du patient).

Tous les patients ayant eu au moins une visite externe (les patients hospitalisés n’étaient pas inclus) entre le 1er janvier 2012 et le 31 décembre 2013 dans un de ces deux hôpitaux. Pour ces patients, les données rétrospectives de 5 ans ont été extraites. À noter, ces données étaient déjà encodées dans un dossier électronique de manière structurée, par exemple les données démographiques, les diagnostics, les listes de problèmes, les médicaments, les allergies, les signes vitaux et les résultats de laboratoires. Cependant, ces données comportaient bien sûr les failles habituelles des données cliniques, c’est-à-dire l’encodage de données en texte libre, dans les mauvais champs, de manière inconstante, etc.

Conformément aux principes du machine learning, les données ont été divisées en deux groupes, un groupe d’apprentissage et un groupe de test. Un échantillon de 300 dossiers a été utilisé pour une validation manuelle des alertes générées par le logiciel. Les paramètres évaluées étaient l’exactitude (l’alerte correspondait-elle réellement aux données encodées ?), la validité (l’alerte était elle adéquate compte tenu des données disponibles partout dans le dossier ?), et l’utilité clinique. Le codage de ces paramètres était effectué par consensus de l’équipe de recherche.

747 985 patients ont été inclus, ayant généré 15 692 alertes dans le groupe de 373 992 patients de test. 29,3% des alertes étaient liées aux données cliniques, 66,8% aux données temporelles et 3,9% au dosage. 23,8% des alertes n’étaient pas valides en raison de problèmes liées aux données, donc 76,2% des alertes étaient valides par rapport aux données encodées. De celles-ci, 56,2% étaient de valeur clinique élevée selon l’équipe de recherche et 18,8% de valeur moyenne.

Les auteurs soulignent dans la discussion la difficulté d’analyser un ensemble de données tiré d’un dossier électronique réel compte tenu de la grande variabilité dans la qualité, la disponibilité et l’encodage des données. La classification de la valeur clinique des alertes est aussi discutable car subjective. Néanmoins, le pourcentage d’alertes cliniquement utile est largement plus élevé que ce que l’on voit en pratique réelle, où la vaste majorité des alertes sont d’une utilité discutable. Il semble que le machine learning soit une avenue intéressante pour les systèmes d’aide à la décision du futur.