Revue systématique de l’effet de la prescription électronique sur les erreurs médicamenteuses

Je vous parlais au début 2019 d’une revue systématique sur les effets de la prescription électronique avec aide à la décision. Cette revue avait inclus des articles allant jusqu’à 2016. Une nouvelle revue systématique avec méta-analyse sur le même sujet a été publiée au mois d’août.

Les auteurs de cette nouvelle revue ont révisé la littérature de 2007 à 2017 (inclusivement) et ont inclus les études randomisées ou prospectives chez les patients hospitalisés, à l’urgence ou en soins de longue durée. Les études incluses devaient avoir comme intervention une « stratégie de prescription électronique », définie comme de l’aide à la décision seule ou de la prescription électronique avec ou sans aide à la décision, comparée à un contrôle sans intervention électronique. Je trouve que cette définition est très large, l’aide à la décision seule (« standalone ») est une chose très différente de la prescription électronique (« computerized provider order entry ») intégrée à un dossier électronique. Les études rétrospectives, comparant deux modalités électroniques, avec plusieurs interventions à la fois, ou ciblant les patients externes, ont été exclues. Les issues évaluées étaient les erreurs médicamenteuses et les événements indésirables touchant le patient (« patient harm »).

Une stratégie de recherche systématique, incluant la sélection des articles et l’extraction de leur contenu de façon indépendante par deux chercheurs, a été menée. Les recommandations GRADE ont été suivies pour coter les articles. En fonction de critères prédéterminés, certains articles ont été inclus dans une méta-analyse pour des issues choisies, avec évaluation de l’hétérogénéité et du biais de publication.

2832 études ont été retrouvées, desquelles 38 ont été incluses après tout le processus de sélection, provenant de 12 pays. Le tableau 1 de l’étude décrit les études incluses. À la lecture de ce tableau, on constate au premier coup d’œil que les articles inclus sont extrêmement disparates. Parmi 11 études randomisées, 7 avaient comme sujet le contrôle automatisé de la glycémie avec une perfusion d’insuline aux soins intensifs ou en post-chirurgie, une ciblait le contrôle glycémique chez les diabétiques de type 2, une était à propos du dosage de mycophénolate après une transplantation rénale, une visait le choix d’antibiotiques empiriques en sepsis et une était à propos de la réhydratation chez les enfants avec vomissements ou diarrhée. Aucune étude avec un devis randomisé n’était donc réellement à propos de l’effet de la prescription électronique comme tel, il s’agissait toutes d’études portant un outil d’aide à la décision électronique dans un contexte clinique très précis. Les 11 études randomisées ont rapporté des données sur les événements indésirables touchant le patient et aucune n’a rapporté de données sur les erreurs de médicaments.

De même, parmi les 27 études non randomisées, seules 6 études chez l’adulte et 4 en pédiatrie portaient réellement sur l’effet d’un système de prescription électronique. Les autres portaient sur des outils d’aide à la décision dans le choix d’antibiotiques (8), le contrôle de la douleur (2), la détection d’interactions médicamenteuses (1), l’ajustement en insuffisance rénale (1), les nausées et vomissements post-opératoires (2), le bilan comparatif des médicaments (1), le traitement de la pneumonie (1) et la sédation (1). 18 de ces études ont rapporté des données sur les événements indésirables et 13 des données sur les erreurs médicamenteuses.

Au total, 10 de 13 études ont rapporté une diminution des erreurs médicamenteuses. La méta-analyse de 11 de ces études a démontré une réduction du risque d’erreur avec un risque relatif de 0.24 (intervalle de confiance 95% 0.13-0.46) avec une grande hétérogénéité et un possible biais de publication. L’effet était plus prononcé dans les études récentes.

En ce qui a trait aux événements indésirables, les événements rapportés étaient la mortalité, la durée de séjour, l’hypoglycémie, l’échec de traitement, l’hospitalisation et la réadmission, le délai de traitement, le contrôle de la douleur, les nausées et vomissements post-opératoires et les infections. On voit donc qu’il s’agit d’issues précises tirées des contextes cliniques des études incluses et qu’il ne s’agit pas d’issues évaluées à travers un grand nombre d’études. Ceci compromet la capacité de tirer des conclusions généralisables à la prescription électronique ou à l’aide à la décision dans son ensemble à partir de ces données. Les auteurs ont quand même réalisé une méta-analyse sur les différentes catégories d’événements indésirables mais rien de particulier n’en n’est ressorti hormis une diminution des « adverse drug events » avec un risque relatif à 0,52 (intervalle de confiance 95% 0,40-0,68), mais sur la base de seulement deux études. La définition de précise de cette issue n’est pas bien décrite, les auteurs semblent se baser sur la catégorisation des études incluses telle quelle, laquelle n’est pas expliquée.

Je crois que cette étude, malgré une méthode très solide et une intention louable, souffre d’avoir mal défini le type d’intervention qu’elle souhaitait évaluer. On a l’impression que les auteurs souhaitaient examiner d’un seul coup l’effet de n’importe quelle intervention électronique touchant à la prescription de médicaments ou à l’aide à la décision. Malheureusement, comme les auteurs le mentionnent dans leur discussion, les publications sont hétérogènes. Beaucoup d’études se focalisent sur un contexte clinique précis avec une intervention spécifique à ce contexte, et ceci ne produit pas de données pouvant être mises en commun avec d’autres interventions ou d’autres contextes.

Dans le contexte de l’aide à la décision, je suis de l’opinion que « l’électronique » est un support pour exposer un clinicien à une intervention (par exemple une alerte, une recommandation, une liste de choix filtrée, etc.) et qu’on ne peut pas évaluer l’effet de n’importe quelle intervention amenée via ce support comme un tout, en tout cas pas pour une variété de situations cliniques en même temps. J’ai déjà parlé abondamment sur ce blogue de l’importance de bien paramétrer les systèmes d’aide à la décision et en particulier les alertes, et je crois que la recette gagnante demeure d’afficher la bonne information, à la bonne personne, au bon moment et par le bon support.

En ce qui a trait à la prescription électronique, je pense qu’il est assez clair que cette technologie permet de réduire certains types d’erreurs, et, comme d’autres revues sur le sujet ont montré, que d’autres types d’erreurs peuvent survenir en fonction des caractéristiques du système mis en place.

L’article présenté ajoute à la masse de données qui suggère un effet bénéfique des technologies d’aide à la décision et de prescription électronique sur les erreurs médicamenteuses, néanmoins il est difficile d’attribuer l’effet observé à l’un ou l’autre considérant l’hétérogénéité des études incluses et la définition trop large de l’intervention étudiée.

Fréquence de l’indication dans les ordonnances électroniques destinées à la communauté

Plusieurs articles parus dans les dernières années sont clairs sur la nécessité d’inclure l’indication dans les ordonnances afin de prévenir les erreurs liées à la dispensation du mauvais médicament. On peut facilement s’imaginer comment ceci peut survenir dans le cas d’ordonnances manuscrites, mais on constate le même problème avec les ordonnances électroniques, notamment dans le cas de médicaments ayant un nom similaire qui peuvent se retrouver côte à côte dans des menus déroulants.

Une nouvelle étude parue dans l’AJHP de juillet visait à quantifier la présence de l’indication dans les ordonnances électroniques rédigées à l’intention de patients en communauté.

Les auteurs ont extrait les instructions posologiques en texte libre des ordonnances émises en clinique ambulatoire d’une organisation de santé américaine sur une période de 5 ans, de 2011 à 2015 inclusivement. Une approche de traitement du langage a été utilisée pour extraire les indications de ce texte libre. Le programme utilisé est intéressant et a été initialement décrit en 2011. Il s’agit d’une approche prometteuse qui permet même d’interpréter les négations (ex: « ne pas prendre si… ») dans le texte. Un contrôle de qualité a été fait sur 10% des ordonnances pour valider l’extraction.

4 356 086 ordonnances ont été analysées. L’indication était présente dans 7,4% de celles-ci. Parmi les ordonnances incluant l’indication, 77% avaient été prescrites avec une posologie au besoin (« PRN »). Les auteurs détaillent le taux d’indications par spécialité médicale et par indication. De façon peu surprenante, les indications qui correspondent davantage à des prises au besoin (ex: douleur, anxiété, nausée, toux, prurit, insomnie) avaient davantage d’ordonnances incluant l’indication dans les instructions posologiques. Des résultats par classe et par molécule sont aussi présentés.

Je trouve cette étude intéressante car elle démontre qu’il y a encore beaucoup de chemin à faire pour inclure l’indication dans les ordonnances: la vaste majorité des ordonnances analysées ne la comportaient pas, quoique les données dataient quand même un peu. Les auteurs concluent que la recherche devrait examiner les designs des logiciels de prescription électronique qui favorisent l’inclusion de l’indication, et je suis d’accord avec cela.

Effets d’un système de préparations stériles avec gravimétrie sur la détection d’erreurs et le temps de préparation

Un nouvel article sur les systèmes d’assistance aux préparations stériles avec gravimétrie est paru dans l’AJHP du mois de juillet. Cet article vient du même centre ayant décrit en 2018 l’implantation du même système dans le contexte des produits stériles dangereux. Les auteurs affirment qu’il s’agit ici de la première étude sur un tel système dans le contexte des préparations stériles non dangereuses. Une méthode très similaire à leur autre étude a été utilisée. À noter, le dernier auteur est en conflit d’intérêts avec le manufacturier du système étudié, ce qui teinte négativement cette étude.

L’étude a eu lieu dans un centre académique américain de 803 lits avec des patients adultes et pédiatriques. Le centre a implanté le système avec gravimétrie pour remplacer une technique de préparation sans technologie. Les auteurs parlent d’un système « volumétrique » avant l’implantation. Ceci pourrait être mal interprété en croyant que le système remplacé était un logiciel avec prise de photos ou de vidéos. En réalité, le centre utilisait la méthode « syringe pull-back » (je n’ai pas de bonne traduction française), cette technique qui semble prévalente aux États-Unis (je n’ai jamais entendu parler de ça au Québec !) où le technicien préparateur ramène le piston de la seringue du produit injecté dans un contenant au volume pré-injection pour que le pharmacien vérifie le volume. On comprend donc ici le risque considérable d’erreurs de préparation. Il était donc facile pour cette étude de détecter une amélioration puisque le point de départ était loin d’être optimal.

Les temps de préparation des produits stériles en période pré ont été compilés sur des formulaires papier à l’aide d’un horodateur durant une période de 14 jours. Les données sur les taux d’erreurs durant la période pré ont été compilées lors d’une étude précédente réalisée en 2015, encore une fois avec des formulaires papier. Après l’implantation, les données étaient extraites du logiciel de préparation. Les taux d’erreurs de préparation ont été comparés entre la phase pré et les 90 jours post-implantation, et les temps de préparation ont été comparés entre la période pré et 90 jours et 180 jours post. Les erreurs ont été catégorisées en erreurs de dose et erreurs de produit/diluant. Point positif à noter, les erreurs de produits détectées par le système ont été exclues par les chercheurs si elles étaient sans conséquence, comme par exemple la sélection d’une fiole non ouverte du bon produit pour lequel une fiole ouverte était disponible (étais-ce ce genre de détection qui propulsait à la hausse les taux d’erreurs de sélection de produit dans d’autres études récemment publiées ?) Des opinions par rapport au produit et au flot de travail ont aussi été collectés.

Autre point important à noter, seulement 15 produits ont été inclus dans l’étude. On ignore combien de types de préparations sont faites dans cette unité de production stérile et on ignore quels sont ces 15 produits.

Pour les taux d’erreurs, selon les auteurs, en phase pré, 116 686 préparations ont été incluses, avec 0,12% d’erreurs de produit ou de diluant, et 0,13% d’erreurs de dose. En période post, 5195 préparations ont été incluses avec 6366 erreurs détectées par le logiciel dont 2176 incluses dans l’étude, avec 0,79% d’erreurs de produit et 41,23% d’erreurs de dose. Les différences de taux d’erreurs détectées sont statistiquement significatives.

J’ai de la difficulté à comprendre les chiffres présentés. Les auteurs affirment que seuls 15 produits ont été inclus en pré comme en post, et les deux périodes étaient de 90 jours pour la détection d’erreurs, alors comment est-il possible que 22 fois plus de préparations aient été compilées en pré ? L’article n’apporte pas de clarification sur ce point. Autre élément surprenant, le système a détecté en moyenne plus d’une erreur à chaque préparation ! Dans le contexte de l’aide à la décision, on parle sans cesse de alert fatigue. Si un système de ce type génère en moyenne plus d’une alerte à chaque dose, il me semble qu’il y a un risque de désensibilisation. Aussi, un taux d’erreurs de dose de 41% me semble tout simplement aberrant. Dans la discussion, les auteurs expliquent que certaines alertes catégorisées comme erreurs de dose dans le système n’en sont pas réellement. Ils parlent aussi du problème récurrent, rapporté dans toutes les études sur ce système à ma connaissance, de l’incapacité de bien mesurer les petits volumes par gravimétrie. Enfin, l’analyse statistique n’a tenté aucune évaluation ou correction pour le fait que près de 3 ans séparent les deux phases; d’autres changements dans la pratique ont-ils eu lieu qui pourraient expliquer ces différences ?

En ce qui a trait au temps, on constate une augmentation du temps nécessaire pour préparer le matériel requis et du temps de préparation avec le système, ainsi qu’une diminution du temps de vérification par le pharmacien, mais une augmentation du temps total par préparation. Évidemment, il est difficile d’interpréter ces chiffres puisque la durée d’une préparation dépend grandement de sa complexité et on ignore quelles préparations étaient incluses dans l’étude.

En bref, il s’agit d’une autre étude sur les systèmes d’assistance aux préparations stériles, et d’une autre sur les systèmes avec gravimétrie, mais ces études continuent d’être affectées par des problèmes de méthode et des résultats étranges rendent difficile la généralisation de leurs conclusions. En ce qui a trait à la gravimétrie, on n’offre toujours aucune solution au problème des petits volumes, et il n’y a toujours aucune donnée démontrant l’impact clinique du gain de précision dans les doses sensé être amené par un tel système.