Article scientifique très intéressant, publié dans une revue médicale qui démontre les fragilités des études standard dites randomisées, en double aveugle et multicentriques. Il revient sur les 10 essais les plus cités dans le monde de la science et indique quels sont leurs biais. Bien évidemment, la Doxa nous présente cette technique de recherche comme la seule et unique au monde qui puisse donner des résultats fiables. Bien sûr, cette technique extrêmement coûteuse va limiter la recherche aux grandes entreprises de Big Pharma, seules à disposer de budgets suffisants.
Pourtant, cette technique de recherche est aussi fragile que toute autre technique surtout si ceux qui la pratiquent sont des voyous et des mafieux dont certains ont d’ailleurs été pris à plusieurs reprises la main dans le sac et exposés dans des procès médiatiques. Ils se permettaient de cacher des effets secondaires graves afin de permettre la commercialisation de leurs molécules nocives qui ont d’ailleurs fini par être retirées du marché après avoir, hélas, tué un grand nombre de patients.


Contexte : Les essais contrôlés randomisés (ECR) sont généralement considérés comme la meilleure méthode de recherche pour éclairer la santé publique et la politique sociale. Ils sont généralement considérés comme fournissant les preuves les plus rigoureuses de l’efficacité d’un traitement sans hypothèses, biais et limitations solides.

Objectif : Il s’agit de la première étude à examiner cette hypothèse en évaluant les 10 études ECR les plus citées dans le monde.

Sources de données : Ces 10 études ECR avec le plus grand nombre de citations dans n’importe quelle revue ont été identifiées en recherchant Scopus (la plus grande base de données de revues à comité de lecture).

Résultats : Cette étude montre que ces ECR de renommée mondiale qui ont influencé les politiques produisent des résultats biaisés en illustrant que les caractéristiques de base des participants qui affectent les résultats sont souvent mal réparties entre les groupes d’essais, que les essais négligent souvent des facteurs alternatifs contribuant à leur principal résultat déclaré et , parmi de nombreuses autres questions, que les procès ne sont souvent que partiellement aveugles ou aveugles. L’étude ici identifie également un certain nombre d’hypothèses, de biais et de limitations nouvelles et importantes qui n’ont pas encore été examinées en détail dans les études existantes qui surviennent lors de la conception, de la mise en œuvre et de l’analyse des essais.

Conclusions : les chercheurs et les décideurs doivent mieux connaître l’ensemble plus large d’hypothèses, de biais et de limites dans les essais. Les revues doivent également commencer à obliger les chercheurs à les décrire dans leurs études. Nous devons en outre mieux utiliser les ECR avec d’autres méthodes de recherche.

  • Messages clés
  • Les ECR sont confrontés à une série d’hypothèses, de biais et de limites solides qui n’ont pas encore tous été discutés en profondeur dans la littérature.

  • Cette étude évalue les 10 ECR les plus cités dans le monde et montre, plus généralement, que les essais produisent inévitablement un biais.

  • Les essais impliquent des processus complexes – de la randomisation, l’aveuglement et le contrôle à la mise en œuvre de traitements, la surveillance des participants, etc. – qui nécessitent de nombreuses décisions et étapes à différents niveaux qui apportent leurs propres hypothèses et degré de biais aux résultats.

Afficher l’énoncé de correction :

Introduction

La façon dont un traitement donné peut fonctionner peut grandement influer sur nos vies. Mais avant de décider de prendre ou non un traitement, nous voulons généralement savoir à quel point il peut être efficace. Les essais contrôlés randomisés (ECR) sont généralement menés en répartissant au hasard les personnes dans les groupes de traitement et de contrôle pour tester si un traitement peut être efficace. Chercheurs dans des domaines comme la médecine [ 1–4 ], la psychologie [ 5 ] et l’économie [ 6 , 7] affirment souvent que cette méthode est le seul moyen fiable pour éclairer correctement les décisions médicales, sociales et politiques; c’est une référence ultime pour évaluer d’autres méthodes; et il est exempt d’hypothèses théoriques solides, de biais méthodologiques et de l’influence des chercheurs (ou aussi exemptés que possible) auxquels sont soumises les méthodes non randomisées.

Cette étude évalue l’hypothèse selon laquelle des expériences randomisées estiment les effets de certains traitements sans hypothèses, biais et limitations solides. Pour évaluer cette hypothèse, les 10 études ECR les plus citées dans le monde sont analysées. Il s’agit notamment d’expériences randomisées très influentes sur les thèmes de l’AVC [ 8 ], des patients gravement malades sous insulinothérapie [ 9 ], du cancer du sein et de la chimiothérapie [ 10 ], des œstrogènes et de la postménopause [ 11 ], du cancer colorectal [ 12 ], deux essais sur le cholestérol et les maladies coronariennes [ 13 , 14 ] et trois essais sur le diabète [ 15–17]. Bien que ces essais soient liés aux domaines de la médecine générale, de la biologie et de la neurologie, les idées présentées ici sont tout aussi utiles pour les chercheurs et les praticiens utilisant des ECR dans n’importe quel domaine, y compris la psychologie, les neurosciences, l’économie et, entre autres, l’agriculture.

Dans tout essai, un certain degré de partialité se produit parce qu’une partie des personnes recrutées refusent de participer à un essai (ce qui conduit à un biais d’échantillonnage), un certain degré d’aveuglement partiel ou de non-aveuglement des différentes personnes participant au procès se produit généralement dans tout essai (ce qui conduit à biais de sélection), les participants suivent généralement un traitement pour des durées et des dosages différents dans n’importe quel essai (ce qui conduit à un biais de mesure), entre autres. Les dix ECR les plus cités évalués ici souffrent de tels problèmes généraux. Mais ils souffrent également d’autres problèmes méthodologiques qui affectent également leurs résultats estimés: les caractéristiques de base des participants sont souvent mal réparties entre les groupes d’essai, les participants basculent parfois entre les groupes d’essai, les essais négligent souvent d’autres facteurs contribuant à leur principal résultat déclaré, entre autres . Certains de ces problèmes ne peuvent être évités dans les essais – et ils affectent la robustesse de leurs résultats et conclusions. Cette étude contribue ainsi à la littérature sur les biais méthodologiques et les limites des ECR [1 , 18–25 ], et un certain nombre de méta-analyses d’ECR indiquent également que les essais sont parfois confrontés à des biais différents, en utilisant des critères d’évaluation communs, y compris la randomisation, le double aveugle, les abandons et les retraits [ 20 , 21 , 26 ]. Pour aider à réduire les biais, les lignes directrices concernant les rapports d’essais [ 1 , 18 ] ont été importantes, mais elles doivent être considérablement améliorées.

Une préoccupation critique pour la qualité des essais est que seuls certains essais signalent les problèmes méthodologiques courants. Encore moins d’expliquer comment ces problèmes affectent les résultats de leur essai. Et aucun essai existant ne signale tous ces problèmes et n’explique comment ils influencent les résultats des essais. Exacerbant la situation, ce ne sont que quelques-uns des problèmes les plus connus. La principale contribution de cette étude décrit un ensemble plus large d’hypothèses, de biais et de limites importants auxquels sont confrontés les ECR qui n’ont pas encore tous été discutés en détail dans les études.

Une meilleure compréhension des limites des expériences randomisées est très importante pour la recherche, les politiques et la pratique. Les essais, bien que beaucoup aident à améliorer les conditions des personnes traitées, ont tous au moins un certain degré de biais dans leurs résultats estimés et prétendent parfois à tort établir des relations causales solides. Dans le même temps, certains essais fortement biaisés sont encore utilisés pour informer les praticiens et les décideurs et peuvent ainsi nuire aux patients traités.

Pour être clair, l’intention n’est pas d’isoler ou de critiquer des ECR particuliers. Il s’agit de souligner qu’il ne faut pas banaliser et simplifier à outrance la capacité de la méthode RCT à fournir des conclusions solides sur l’effet moyen d’un traitement. Arriver à de telles conclusions n’est possible que si les chercheurs examinent chaque hypothèse et biais, l’un après l’autre (comme indiqué dans cette étude), et font des efforts systématiques pour essayer de répondre à ces hypothèses et réduire autant que possible ces biais – tout en rapportant ces ils ne le peuvent pas.

Les méthodes

Cette étude a sélectionné des essais en utilisant le seul critère d’être l’une des 10 études ECR les plus citées. Ces 10 essais avec le plus grand nombre de citations dans le monde – jusqu’à juin 2016 – ont été identifiés en recherchant dans Scopus (la plus grande base de données de revues à comité de lecture) les termes «essai contrôlé randomisé», «essai contrôlé randomisé» et « RCT ». Ces essais (chacun avec plus de 6500 citations) ont été sélectionnés et chacun remplissait les conditions d’éligibilité d’être randomisé et contrôlé. Pour plus d’informations sur la stratégie de sélection des essais et sur les 10 essais les plus cités, voir l’ annexe Figure A1 et le tableau 1 .

Cette étude, tout en appliquant et en élargissant les critères d’évaluation communs pour les essais (tels que la randomisation, le double aveugle, les abandons et les retraits [ 20 , 21 , 26 ]), évalue les ECR en utilisant un éventail plus large d’hypothèses, de biais et de limitations qui émergent lors de la réalisation essais. Les termes que je crée pour ces hypothèses, biais et limitations sont placés en italique . En termes de structure de l’étude, les hypothèses, les biais et les limites sont discutés ensemble et dans l’ordre dans lequel ils surviennent lors de la conception, puis de la mise en œuvre, suivis d’une analyse des ECR.

Résultats et discussion

Hypothèses, biais et limites dans la conception des ECR

Pour commencer, une contrainte des ECR qui n’a pas encore été examinée en détail dans les études existantes est que la randomisation n’est possible que pour un petit ensemble de questions qui nous intéressent – à savoir la limitation du traitement simple au niveau individueld’essais. La randomisation est en grande partie impossible à réaliser pour de nombreuses questions scientifiques complexes, par exemple sur ce qui motive globalement une bonne santé physique ou mentale, une espérance de vie élevée, le fonctionnement des institutions de santé publique ou, en général, ce qui façonne tout autre phénomène complexe ou à grande échelle (de la dépression à l’anxiété sociale ). Les sujets ne se prêtent généralement pas à la randomisation qui sont liés à la génétique, l’immunologie, le comportement, les états mentaux, les capacités humaines, les normes et les pratiques. Le fait de ne pas avoir de contrefactuel comparable pour de tels sujets est souvent la raison de ne pas pouvoir randomiser. La méthode est limitée à l’étude des traitements des maladies rares, des interventions ponctuelles (telles que les réformes du système de santé) et des interventions à effets décalés (comme les traitements des maladies de longue durée). Les essais sont limités pour répondre aux questions sur la façon d’atteindre les résultats souhaités dans un autre contexte et cadre politique: sur quel type de praticiens de santé sont nécessaires dans quel type de cliniques dans quel environnement réglementaire, administratif et institutionnel pour fournir des services de santé efficaces dans la prestation du traitement . Cette méthode ne peut, pour de telles raisons, apporter des améliorations à grande échelle dans notre compréhension générale de la médecine. Dans les cas où les ECR bien menés sont cependant les plus utiles, il s’agit d’évaluer, pour un échantillon anonymisé, l’efficacité moyenne d’un traitement simple et simple supposé avoir peu de facteurs de confusion connus – comme le suggèrent les ECR publiés. Mais elles ne peuvent pas toujours être menées facilement dans de nombreux cas avec des traitements ou des résultats multiples et complexes simultanément qui reflètent souvent la réalité des situations médicales – par exemple dans les cas pour comprendre comment augmenter l’espérance de vie ou rendre les institutions de santé publique plus efficaces. Les chercheurs, s’ils considéraient les ECR comme le seul plan de recherche fiable, ne se concentreraient donc en grande partie que sur certaines questions liées aux traitements simples au niveau de l’individu qui correspondent au schéma quantifiable du traitement et des résultats (plus de détails à ce sujet plus tard). Ils laisseraient une méthode particulière influencer le type et la gamme de questions que nous étudions et négligeraient d’autres questions importantes (par exemple l’augmentation de l’espérance de vie ou l’amélioration des institutions de santé publique) qui sont étudiées en utilisant d’autres méthodes (par exemple, des études d’observation longitudinales ou des analyses institutionnelles). ainsi se concentrent en grande partie uniquement sur certaines questions liées à des traitements simples au niveau de l’individu qui correspondent au schéma quantifiable de traitement-résultat (plus à venir plus tard). Ils laisseraient une méthode particulière influencer le type et la gamme de questions que nous étudions et négligeraient d’autres questions importantes (par exemple l’augmentation de l’espérance de vie ou l’amélioration des institutions de santé publique) qui sont étudiées en utilisant d’autres méthodes (par exemple, des études d’observation longitudinales ou des analyses institutionnelles). ainsi se concentrent en grande partie uniquement sur certaines questions liées à des traitements simples au niveau de l’individu qui correspondent au schéma quantifiable de traitement-résultat (plus à venir plus tard). Ils laisseraient une méthode particulière influencer le type et la gamme de questions que nous étudions et négligeraient d’autres questions importantes (par exemple l’augmentation de l’espérance de vie ou l’amélioration des institutions de santé publique) qui sont étudiées en utilisant d’autres méthodes (par exemple, des études d’observation longitudinales ou des analyses institutionnelles).

Une autre contrainte à laquelle sont confrontés les ECR est que l’échantillon initial d’un essai, lorsque l’objectif est d’étendre ultérieurement un traitement, devrait idéalement être généré de manière aléatoire et choisi de manière représentative dans la population générale – mais les 10 ECR les plus cités utilisent parfois, lorsqu’ils sont déclarés, un échantillon sélectif qui peut limiter l’augmentation des résultats et peut conduire à un biais de sélection de l’échantillon initial . Certains de ces principaux essais, comme l’ indique le tableau 1 , ne fournissent pas d’informations sur la façon dont leur échantillon initial a été sélectionné avant la randomisation [ 8 , 10 ] tandis que d’autres indiquent seulement que des «dossiers de patients» ont été utilisés [ 13 ] ou qu’ils «ont recruté au 29 centres »[ 15]; mais aucune information critique n’est fournie, comme la qualité, la diversité ou l’emplacement de ces centres et des praticiens participants, comment les centres ont été sélectionnés, les types d’individus qu’ils ont tendance à traiter, etc. Cela signifie que nous n’avons pas de détails sur la représentativité des données utilisées pour ces ECR. De plus, l’essai sur le cholestérol par Shepherd et al. [ 14 ] a par exemple été menée dans un district du Royaume-Uni et l’essai sur l’insulinothérapie par Van Den Berghe et al. [ 9 ] dans une unité de soins intensifs en Belgique – alors que les deux visaient néanmoins à élargir ultérieurement le traitement à grande échelle.

Une hypothèse fondamentale et solide des ECR (une fois l’échantillon choisi) est l’ hypothèse de bonne randomisation . Une mauvaise randomisation – et donc une mauvaise répartition des caractéristiques de base des participants qui affectent les résultats entre les groupes d’essais [ 27 ] – remet en question le degré de robustesse des résultats de plusieurs de ces 10 ECR de premier plan. Le procès sur les coups [ 8], qui rapporte que la mortalité à 3 mois après le début de l’AVC était de 17% dans le groupe de traitement et de 21% dans le groupe placebo, attribue cette différence au traitement. Cependant, les données de base indiquent que d’autres facteurs qui affectent fortement les résultats de l’AVC et de la mortalité n’étaient pas répartis de manière égale: ceux recevant le traitement principal (par rapport à ceux avec le placebo) étaient 3% moins susceptibles d’avoir eu une insuffisance cardiaque congestive, 8% de moins susceptibles d’avoir fumé avant l’AVC, 14% plus susceptibles d’avoir suivi un traitement à l’aspirine, 3% plus susceptibles d’être d’origine ethnique blanche par rapport au noir, et 3% plus susceptibles d’avoir eu et survécu à un AVC précédent. Ces facteurs peuvent être à l’origine des principaux résultats de l’essai – en tout ou en partie. Mais l’étude ne traite pas explicitement de cette très mauvaise allocation de référence. Dans l’essai sur le cancer du sein [10 ], 73% des participants traités (recevant une chimiothérapie plus le traitement de l’étude) avaient une chimiothérapie adjuvante avant l’essai, contre 63% des participants contrôlés (recevant une chimiothérapie seule). Parce que la réponse à la chimiothérapie diffère pour ceux qui y sont déjà exposés par rapport à ceux qui la reçoivent pour la première fois, il est difficile de prétendre que le traitement de l’étude a uniquement façonné les résultats. De même, le principal résultat estimé de l’essai sur le cancer colorectal [ 12 ] – à savoir que les personnes sous traitement ont survécu 4,5 mois de plus – ne peut pas être considéré comme un résultat définitif étant donné que 4% de plus dans le groupe témoin avaient déjà une chimiothérapie adjuvante. Il est également peu probable que les résultats de l’essai sur le diabète par DCC [ 15] n’étaient pas biaisés par le groupe d’intervention principal, avec 5% d’hommes en moins, 2% de fumeurs en plus et 3% plus susceptibles de souffrir de lésions nerveuses. Certains chercheurs peuvent répondre en disant que «ce ne sont peut-être que des problèmes de conception d’étude». Mais le fait est que tous ces 10 ECR ont randomisé leur échantillon, montrant que la randomisation en elle-même n’assure pas une distribution équilibrée – car nous avons toujours des échantillons finis avec des randomisations finies. Tant qu’il existe des déséquilibres importants, nous ne pouvons pas interpréter les différents résultats entre les groupes de traitement et de contrôle comme reflétant simplement l’efficacité du traitement. Les chercheurs doivent donc mieux réduire le degré des déséquilibres connus – et donc les résultats biaisés – en utilisant mieux, par exemple, des échantillons plus grands et une randomisation stratifiée.

Une autre contrainte qui peut survenir dans les essais est qu’ils ne collectent pas de données de référence pour tous les influenceurs contextuels pertinents (mais seulement certains) qui sont connus pour influencer alternativement les résultats – c’est-à-dire une limitation incomplète des données de base . Ces ECR individuels de renommée mondiale indiquent par exemple que les maladies cardiaques ont diminué en prenant le médicament hypocholestérolémiant appelé simvastatine [ 13 ] ou le médicament appelé pravastatine [ 14 ], qu’une thérapie intensive du diabète a réduit les complications du diabète sucré insulino-dépendant [ 15 ], et que la durée de survie des patients atteints d’un cancer colorectal a augmenté en prenant le traitement appelé bevacizumab [ 12]. Mais ces mêmes essais ne collectent pas de données de référence – et donc évaluent – les différences entre les patients dans les niveaux de forme physique, d’exercice, de stress et d’autres facteurs alternatifs qui peuvent également affecter le résultat principal et les résultats de biais. L’affirmation commune, selon laquelle «un avantage des ECR est que personne n’a besoin de connaître tous les facteurs affectant le résultat, car la randomisation devrait garantir qu’il est dû au traitement», ne tient pas et nous ne pouvons pas échapper à un équilibre égal des facteurs d’influence.

Pour mieux assurer une répartition équilibrée des influenceurs de fond entre les groupes d’essai, et pour le faire sur la même période de temps et réduire d’autres facteurs de confusion possibles, nous randomisons généralement – dans des domaines comme l’économie et la psychologie – l’ensemble de l’échantillon en même temps avant de mener une procès. Cette approche pourrait également être menée pour des essais pertinents en médecine, y compris par exemple pour six des dix essais les plus cités qui ont testé des traitements pour des conditions de santé courantes comme le diabète et le cholestérol élevé, des choix de style de vie comme une augmentation de l’exercice et l’utilisation d’hormones chez les femmes ménopausées, comme de nombreux participants potentiels existent à tout moment et il ne faudrait pas nécessairement attendre que les participants s’inscrivent. Lorsque nous observons ensuite, après avoir randomisé l’échantillon pour les essais pertinents, différences dans les facteurs d’influence mesurables entre les groupes d’essai et si, par exemple, nous re-randomisons le même échantillon plusieurs fois (avant d’exécuter l’essai) jusqu’à ce que ces facteurs soient répartis de manière plus égale, nous réalisons que les résultats de l’essai sont néanmoins le résultat d’avoir randomisé une fois. Nous réalisons que les résultats des essais ne seraient pas identiques après chaque (re) randomisation de l’échantillon.

De plus, pour qu’un essai réduise le biais de sélection et soit complètement aveuglé, il est important (au-delà de la randomisation) que personne – pas seulement les expérimentateurs ou les patients mais aussi les collecteurs de données, les médecins, les évaluateurs ou toute autre personne – connaisse les répartitions des groupes. Ces 10 ECR ne fournissent cependant pas de détails explicites sur l’état d’aveuglement de toutes ces personnes clés du procès tout au long du procès.

Le tableau 1 montre que certains de ces 10 essais n’ont pas fait de double aveugle [ 9 , 10 , 12 ] tandis que d’autres initialement ont été en double aveugle mais ont ensuite été partiellement aveuglés [ 11 , 15 , 17 ] ou seulement partiellement aveuglés pour un bras de l’essai [ 16 ] – ce qui reflète dans les cas pertinents (bien que souvent inévitables) un parti pris aveugle . Dans le procès de Van Den Berghe et al. [ 9 ], par exemple, la modification des doses d’insuline nécessite de surveiller les niveaux de glucose des participants, ce qui rend impossible la réalisation d’une étude en aveugle. L’essai sur les œstrogènes [ 11] a aveuglé 40% des participants pour permettre la gestion des effets indésirables. L’essai sur le diabète de Knowler et al. [ 17 ] participants aveugles (bien que la part ne soit pas indiquée) lorsque leurs résultats cliniques dépassaient les seuils fixés et que le traitement devait être modifié. Certains patients sous placebo dans l’essai du SSSSG [ 13 ] ont arrêté le médicament à l’étude pour obtenir un traitement hypocholestérolémiant réel, ce qui montre que l’attribution du traitement était parfois aveugle par les participants eux-mêmes qui vérifiaient les taux de cholestérol en dehors de l’essai. Ces questions liées à l’aveuglement, bien que souvent non évitables, doivent être discutées plus explicitement dans les études et en particulier dans quelle mesure elles biaisent les résultats.

Au-delà de la randomisation et de l’aveuglement, une autre contrainte est que les essais se composent souvent de quelques centaines d’individus qui sont souvent trop restrictifs pour produire des résultats robustes – ce qui conduit souvent à un biais de petit échantillon . Parmi les 10 meilleurs ECR, les deux parties distinctes de l’essai sur le cancer du sein [ 10 ] ont des tailles d’échantillon de 281 et 188 participants; et les deux parties de l’essai de course [ 8 ] ont des tailles d’échantillon de 291 et 333 participants. Ces petits essais, associés à des critères d’inclusion et d’exclusion parfois stricts et à une mauvaise randomisation, entraînent souvent des déséquilibres importants dans les influenceurs contextuels et les résultats de biais (comme indiqué précédemment pour ces deux études) [ 21]. Les petits essais, lorsque la taille de l’effet est également faible, peuvent faire face à d’autres problèmes liés à des estimations moins précises. Un exemple est que le procès de l’AVC [ 8] avec 624 participants dans les rapports totaux qu’au bout de 3 mois après l’AVC, 54 patients traités sont décédés contre 64 patients sous placebo – le résultat principal n’étant ainsi qu’une différence de 10 décès. Dans l’ensemble, pour accroître la fiabilité des résultats estimés, les chercheurs ont idéalement besoin de grands échantillons (si possible, des milliers d’observations dans un large éventail de groupes différents avec des caractéristiques de fond différentes) qui estiment les effets importants dans différentes études. De plus, cela serait idéalement combiné avec plus d’études comparant différents traitements les uns contre les autres dans un seul essai – et testant (dans les cas pertinents) plusieurs traitements combinés à l’unisson [par exemple en comparant (i) une augmentation de l’exercice, (ii) une meilleure nutrition, (iii) ne pas fumer, (iv) un médicament particulier, etc. dans un essai avec différents traitements pour évaluer les avantages relatifs: (i),

Un autre problème auquel sont confrontés les ECR non encore discuté dans les études existantes est la limitation des variables quantitatives : les essais ne sont possibles que pour les phénomènes spécifiques pour lesquels nous pouvons créer des variables de résultats strictement définies qui s’inscrivent dans notre modèle expérimental et rendent possibles les allégations corrélationnelles ou causales. Les 10 ECR les plus cités utilisent donc tous une variable de résultat quantitative rigide. Certains utilisent la variable de traitement binaire (1 ou 0) selon que les participants sont décédés ou non [ 9 , 12 , 13 ]. Mais cette variable binaire peut négliger les multiples façons dont les participants perçoivent la qualité de leur vie pendant le traitement. Dans l’essai sur le cancer colorectal [ 12], par exemple, le résultat principal est une survie moyenne plus longue de 4,5 mois pour les personnes traitées; mais ils étaient également 11% plus susceptibles de souffrir d’événements indésirables de grade 3 ou 4, 5% plus susceptibles d’être hospitalisés pour de tels événements indésirables et 14% plus susceptibles de souffrir d’hypertension. Ces variables d’effets indésirables sont néanmoins des substituts et ne saisissent pas parfaitement la qualité de vie ou le niveau de douleur des patients qui, par leur caractère même, ne sont pas directement modifiables en analyse quantitative. En utilisant uniquement les variables saisies dans l’essai, nous ne disposons pas d’informations importantes sur la question de savoir si les participants qui ont vécu plusieurs mois de plus – mais qui ont également souffert plus intensément et plus longtemps – n’ont peut-être plus tard préféré aucun traitement. Un autre exemple de limitation quantitative variable est que l’essai sur le diabète de Knowler et al. [ 17] fixe le traitement comme objectif d’au moins 150 minutes d’activité physique par semaine. Ce traitement avec un seuil homogène néglige néanmoins les facteurs qui influencent les effets de 150 min d’exercice et donc les résultats estimés – des facteurs tels que la variation inévitable du niveau de condition physique des participants avant d’entrer dans l’essai et de leurs besoins physiologiques pour différents niveaux de condition physique activité qui dépend de leur âge, sexe, poids, etc. spécifiques. Cette variable quantitative bien définie (bien que souvent le caractère de la méthode RCT) ne reflète donc pas les besoins hétérogènes des patients et les décisions des praticiens. En fait, la plupart des phénomènes médicaux (de la dépression, du cancer et de la santé globale,

Hypothèses, biais et limitations dans la mise en œuvre des ECR

Une hypothèse dans la mise en œuvre des essais qui n’a pas encore été discutée en profondeur dans les études existantes est l’ hypothèse que toutes les conditions préalables sont pleinement remplies: qu’un traitement d’essai ne peut fonctionner que si un large ensemble de facteurs d’influence (au-delà du traitement) qui peuvent être difficiles à mesurer et à contrôler seraient simultanément présents. Un traitement – qu’il s’agisse de chimiothérapie ou d’un médicament contre le cholestérol – ne peut fonctionner que si les patients sont suffisamment nourris et en bonne santé pour que le traitement soit efficace, si l’observance est suffisamment élevée pour prendre la bonne dose, si les cliniques communautaires administrant le traitement ne sont pas de mauvaise qualité, si les praticiens sont formés et expérimentés pour la dispenser efficacement, si la capacité institutionnelle des services de santé à suivre et évaluer sa mise en œuvre est suffisante, entre autres. L’hypothèse sous-jacente est que toutes ces conditions et d’autres conditions préalables – les causes – seraient pleinement remplies pour tous les participants. Il peut être difficile de s’assurer qu’ils sont tous présents et équilibrés entre les groupes d’essai, même si l’échantillon est important, car ces facteurs sont parfois connus mais non observables ou inconnus. La variation de la mesure dans laquelle ces conditions préalables sont remplies conduit à une variation (biais) des effets moyens du traitement entre différents groupes de personnes. Pour accroître l’efficacité des traitements et l’utilité des résultats, les chercheurs doivent se concentrer davantage, lors de la conception des essais et de leur extrapolation, sur ce contexte plus large.

Tableau 1. Plans de recherche des dix ECR les plus cités dans le monde

Dans ces 10 ECR de premier plan, un certain degré de biais statistique apparaît lors de la mise en œuvre en raison de problèmes liés aux personnes initialement recrutées qui ont refusé de participer, aux participants qui changent de groupe d’essai, aux variations de la dose réelle prise, aux données manquantes pour les participants et autres. Le tableau 1 montre que pour les quelques essais dans lesquels la proportion de personnes refusant de participer après avoir été recrutées a été signalée, elle représentait parfois une part importante de l’échantillon éligible. Parmi toutes les femmes dépistées pour l’essai sur les œstrogènes [ 11], seulement 5% ont donné leur consentement à l’essai (et n’ont signalé aucune hystérectomie). Cela implique un biais de sélection parmi ceux qui ont du temps, sont disposés, le trouvent utile, voient un risque limité de participation et ont peut-être une plus grande demande de traitement. Parmi cette petite part, 88% ont ensuite été randomisés dans l’essai. Pendant la mise en œuvre, 42% dans le groupe de traitement ont cessé de prendre le médicament. Parmi tous les participants, 4% avaient un état vital inconnu (données manquantes) et 3% sont décédés. À mesure qu’un échantillon se rétrécit en raison du refus des gens, les personnes manquant de données, etc., les «participants moyens» ne sont probablement pas perdus, mais ceux qui peuvent différer fortement – des problèmes que l’analyse en intention de traiter ne peut pas nécessairement résoudre. Une contrainte dans l’interprétation des résultats de l’essai sur les œstrogènes est que 11% des participants au placebo sont passés dans le bras de traitement.

L’un des deux essais sur le cholestérol [ 14 ] a rapporté que 51% des recrutés pour participer étaient apparus pour le premier dépistage, après quoi seulement 4% de l’échantillon recruté a été randomisé dans l’étude – et plus tard environ 30% des participants ont abandonné. Dans l’autre essai sur le cholestérol [ 13 ], 8% des personnes éligibles n’ont pas consenti à participer, tandis que 12% ont par la suite arrêté le médicament en raison d’effets indésirables mais aussi d’une réticence à continuer. La non-conformité se produit également dans plusieurs de ces ECR. Dans l’un des essais sur le diabète [ 17 ], la part des participants prenant au moins 80% de la dose prescrite était de 72% pour ceux du groupe de traitement. Dans l’essai sur le cancer colorectal [ 12], 73% dans le groupe de traitement ont pris la dose prévue d’un des médicaments. Le fait que des parts importantes de participants à ces essais et à d’autres aient différents niveaux de conformité au traitement (voir le tableau 1 ) peut entraîner des variations (biais) dans l’estimation des résultats entre les participants (que ce soit en utilisant l’intention de traiter ou l’analyse per-protocole). De plus, plusieurs de ces essais n’ont pas fourni de données complètes sur les taux d’abandon ( tableau 1 ). Parmi eux, le procès de l’AVC [ 8] et pour tous les participants avec des données de résultats manquantes «le pire score possible a été attribué». Cette hypothèse n’est probablement pas correcte. Dans l’ensemble, les décisions que les chercheurs prennent pour faire face au refus des participants, au changement de groupe, aux données manquantes, etc. soulèvent des problèmes méthodologiques difficiles et un autre degré de biais dans les résultats que les chercheurs doivent discuter ouvertement dans les études.

Hypothèses, biais et limites dans l’analyse des ECR

Lors de l’évaluation des résultats après la mise en œuvre des essais, les ECR sont confrontés à un biais d’évaluation de la période unique qui n’a pas encore été examiné en détail dans les études existantes: qu’une allégation corrélationnelle ou causale concernant le résultat est, pour de nombreux essais, fonction du moment où un chercheur choisit de collecter les données de référence et points de données finaux et évalue ainsi un résultat moyen au lieu d’un autre. Le procès du SSSSG [ 13], par exemple, rapporte que l’effet du médicament hypocholestérolémiant semble commencer, en moyenne, après environ un an, puis diminuer par la suite. Les traitements ont généralement différents niveaux de rendements décroissants (ou parfois croissants). La variation des résultats estimés est donc généralement inévitable selon le moment où nous décidons d’évaluer un traitement – chaque mois, trimestre, année ou plusieurs années. Il n’y a pas deux points d’évaluation (ou plus) identiques et nous devons donc, pour la plupart des essais, toujours évaluer à plusieurs moments pour améliorer notre compréhension de la trajectoire d’évaluation et des décalages dans le temps (alors que ce problème affecte également d’autres méthodes statistiques).

Dans la moitié de ces 10 ECR, la durée totale du suivi était, compte tenu de la conception de l’essai, pas toujours identique mais parfois deux ou trois fois plus longue pour certains participants – bien que seuls les résultats moyens aient été rapportés [ 11 , 13 , 15–17 ]. Des durées et des quantités de doses différentes, cependant, entraînent des effets différents entre les participants à l’essai et conduisent à un biais de mesure. Dans l’essai sur le cancer du sein et la chimiothérapie [ 10 ] par exemple, les participants du groupe de traitement primaire sont restés dans l’étude entre 1 et 127 semaines (en moyenne 40 semaines) et les doses prises variaient entre 1 et 98 (en moyenne 36 doses) .

Une autre hypothèse forte émise dans l’évaluation des ECR qui n’a pas encore été discutée est l’ hypothèse de fond-traits-reste-constante– mais ceux-ci changent au cours de l’essai, nous devons donc les évaluer non seulement au départ mais aussi au final car ils peuvent également influencer les résultats et les résultats de biais. Plus le procès est long, plus ces influences deviennent souvent importantes. Mais ils sont également importants pour les essais plus courts: si ceux du groupe témoin reçoivent le traitement commun ou rien du tout et par exemple 3% de ceux du groupe de traitement décident de combiner le traitement médicamenteux testé avec d’autres formes de traitement telles que des traitements supplémentaires l’exercice ou une meilleure nutrition pour améliorer leurs conditions plus rapidement, mais nous ne collectons que des données de référence et non finales sur les niveaux d’exercice et de nutrition, alors nous ne savons pas si le traitement médicamenteux testé seul est à l’origine des résultats. À moins que nous puissions nous assurer que les participants à la ligne de fond ont les mêmes conditions de base et les mêmes caractéristiques cliniques qu’ils avaient au départ, nous ne pouvons pas affirmer que «le résultat est uniquement dû au traitement». Ce problème s’applique aux 10 ECR car ils n’incluent pas ces données finales.

Une autre contrainte est que les essais sont généralement conçus pour évaluer uniquement les effets moyens – c’est-à-dire la limitation des effets moyens du traitement . Cependant, les effets moyens peuvent parfois être positifs même si certains ou la majorité ne sont pas influencés ou même négativement influencés par le traitement, mais une minorité subit encore des effets importants.

La plupart de ces 10 meilleurs ECR, qui ont pour objectif d’utiliser le traitement dans une population plus large, n’évaluent pas pleinement comment les résultats peuvent s’appliquer à des personnes en dehors de l’essai [ 28 ] ( tableau 1 ) – c’est-à-dire la limite d’extrapolation . Quelques-uns cependant rapportent partiellement ces informations. Le procès de Shepherd et al. [ 14], par exemple, déclare que leurs résultats pourraient être «applicables aux hommes d’âge moyen typiques atteints d’hypercholestérolémie». Mais cela n’indique pas si les résultats ne s’appliqueraient qu’aux hommes typiques de la sous-population particulière de l’ouest de l’Écosse (où l’essai a été mené) compte tenu du mode de vie, de la nutrition et d’autres traits spécifiques des personnes dans cette région et de la capacité de cliniques participantes. Pour le procès de Van Den Berghe et al. [ 9 ], les participants ont été sélectionnés pour une insulinothérapie dans une unité de soins intensifs chirurgicaux. Cela implique que les résultats ne peuvent pas être appliqués à ceux des unités de soins intensifs médicaux ou à ceux souffrant de maladies non présentes dans l’échantillon (ce que les auteurs reconnaissent), mais aussi à ceux ayant des caractéristiques démographiques ou cliniques différentes. L’essai sur le diabète de Knowler et al. [ 17] fournit le plus de détails sur l’applicabilité de l’étude par rapport aux autres 10 principaux essais, concédant que: «La validité de la généralisation des résultats des études de prévention précédentes est incertaine. Les interventions qui fonctionnent dans certaines sociétés peuvent ne pas fonctionner dans d’autres, car les forces sociales, économiques et culturelles influencent [par exemple] l’alimentation et l’exercice ». Les auteurs de cet essai affirment que les résultats pourraient s’appliquer à environ 3% de la population américaine. En général, cependant, lorsque les chercheurs ne discutent pas explicitement de la portée potentielle de leurs résultats en dehors du contexte de l’essai, les praticiens ne savent pas exactement à qui s’adresser.

Un meilleur biais de résultats peut également exister dans la déclaration des effets du traitement, les bailleurs de fonds et les revues étant parfois moins susceptibles d’accepter des résultats négligeables ou négatifs. Sur ces 10 essais, les chercheurs indiquent parfois des explications alternatives possibles (au-delà du traitement) pour les effets indésirables du traitement (par exemple dans l’essai sur le cancer colorectal [ 12 ]). Mais ces 10 essais ne discutent pas explicitement d’autres facteurs de confusion mesurables ou non mesurables, comme les caractéristiques de fond déséquilibrées décrites ci-dessus, qui façonnent également le résultat principal (traitement) ( tableau 1 ). Un seul de ces essais (l’essai sur les œstrogènes [ 11 ]) a eu un effet de traitement principal négatif. Le procès de Van Den Berghe et al. [ 9] n’a pas discuté des effets indésirables de l’insulinothérapie, mais n’a signalé qu’une longue liste de ses avantages.

Une autre contrainte dans l’évaluation des essais est que les bailleurs de fonds peuvent avoir un intérêt inhérent aux résultats publiés, ce qui peut conduire à un biais de financement Cela a été démontré par un certain nombre de revues systématiques d’essais [ 29 , 30 ]. Parmi les dix ECR les plus cités, sept ont été financés par des sociétés biopharmaceutiques. L’essai sur le cancer colorectal [ 12 ] a été financé et conçu par la société de biotechnologie Genentech et a collecté et analysé les données, tandis que les chercheurs ont également reçu des paiements de la société pour des consultations, des conférences et des recherches. Ce fut également le cas pour l’essai sur le cancer du sein [ 10]. Cependant, les fournisseurs de médicaments ne devraient pas idéalement, en raison d’intérêts commerciaux, être impliqués de manière indépendante dans la conception, la mise en œuvre et l’analyse des essais – avec une source potentielle de biais émergeant à travers la sélection d’un comparateur inapproprié au traitement testé [ 29 , 30 ].

Une contrainte associée qui se pose dans l’interprétation des effets du traitement d’un essai est liée à une limitation du placebo uniquement ou du traitement conventionnel uniquement . Quatre des 10 essais comparent le traitement à l’étude uniquement avec un placebo [ 8 , 11 , 13 , 14 ], ce qui peut, dans les cas pertinents, rendre plus difficile l’élaboration des politiques car nous ne savons pas comment le traitement testé se compare directement avec le traitement actuel ou conventionnel. Cinq des 10 essais comparent le traitement uniquement aux traitements conventionnels [ 9 , 10 , 12 , 15 , 16] (et pas en plus avec un placebo), bien que le bénéfice rapporté d’un traitement puisse parfois être attribué au mauvais résultat dans le groupe conventionnel. Un seul de ces essais [ 17 ] a été conçu pour évaluer le bénéfice relatif des traitements testés et conventionnels par rapport à un placebo.

Un certain nombre d’autres biais et contraintes peuvent également survenir lors de la réalisation d’ECR. Celles-ci vont du calcul des erreurs types (le nombre de participants entre les groupes d’essais étant inégal dans les 10 essais, comme l’ illustre le tableau 1 ), des effets placebo [ 31 ], des variations dans la façon dont la taille des échantillons est déterminée, de la manière dont les différents enquêteurs collectent les données pour le même essai, et dans les méthodes utilisées pour créer la séquence d’allocation aléatoire, aux différences dans l’analyse, l’interprétation et la communication des données et des résultats statistiques, aux changements dans la conception ou les méthodes après le début des essais, tels que les critères d’exclusion, la réalisation d’analyses de sous-groupes (et exploration de données ex post) [ 32 ], contraintes éthiques [ 33 ], limitations budgétaires, etc.

Combiner l’ensemble des hypothèses, des biais et des limites auxquels sont confrontés les ECR

En rassemblant l’éventail des hypothèses et des biais qui surviennent lors de la conception, de la mise en œuvre et de l’analyse des essais ( figure 1 ), nous pouvons essayer d’évaluer la fiabilité des résultats d’un ECR. Cela dépend du degré auquel nous pouvons être en mesure de répondre à chaque hypothèse et de réduire chaque biais – ce qui est également la façon dont les chercheurs peuvent améliorer les essais.

Figure 1. Aperçu des hypothèses, des biais et des limites des ECR ( c’est-à-dire que l’amélioration des essais implique de réduire ces biais et de satisfaire ces hypothèses dans la mesure du possible ). Source: propre illustration. Remarque: Pour plus de détails sur toute hypothèse, biais ou limitation, voir la section respective tout au long de l’étude. Cette liste n’est pas exhaustive.

Mais est-il possible de toujours respecter cet ensemble d’hypothèses et de minimiser cet ensemble de biais? La réponse ne semble pas positive lors de l’évaluation de ces principaux ECR. L’étendue des hypothèses et des biais qui sous-tendent les résultats d’un essai peut augmenter à chaque étape: de la façon dont nous choisissons notre question de recherche et notre objectif, créons nos variables, sélectionnons notre échantillon, randomisons, aveugles et contrôlons, jusqu’à la façon dont nous effectuons les traitements et surveillons les participants, collecter nos données et effectuer notre analyse de données, interpréter nos résultats et faire tout le reste avant, entre et après ces étapes. En fin de compte, nos résultats ne peuvent être plus précis que les hypothèses que nous faisons et les biais que nous avons. D’une manière générale, il n’est pas possible de parler de ceux qui sont les plus importants.

Nous devons en outre utiliser les ECR avec d’autres méthodes qui présentent également des avantages. Lorsqu’un essai suggère qu’un nouveau traitement peut être efficace pour certains participants de l’échantillon, des études d’observation subséquentes, par exemple, peuvent souvent être importantes pour donner un aperçu de: la gamme plus large d’effets secondaires d’un traitement, la distribution des effets sur ceux de différents âges, l’emplacement et d’autres caractéristiques et, entre autres, si les personnes dans la pratique quotidienne avec des prestataires de services quotidiens dans des installations quotidiennes seraient en mesure d’atteindre des résultats comparables à ceux du participant moyen à l’essai. Des études de cas uniques et des méthodes à l’intérieur et à l’extérieur du laboratoire sont en outre des premières étapes essentielles qui fondent l’expérimentation ultérieure et permettent une évaluation ultérieure à l’aide d’ECR. De plus, pour atteindre certaines des connaissances les plus importantes de la communauté médicale,23 ].

Conclusions

Les expériences randomisées nécessitent bien plus qu’une simple randomisation d’une expérience pour identifier l’efficacité d’un traitement. Ils impliquent de nombreuses décisions et étapes complexes qui apportent leurs propres hypothèses et degré de biais avant, pendant et après la randomisation. Vu sous cet angle, la crise de reproductibilité peut également s’expliquer par le fait que le processus scientifique est un processus humain complexe impliquant de nombreux acteurs (concepteurs d’essais, tous les participants, collecteurs de données, praticiens / médecins, statisticiens d’essais, etc.) prenant de nombreuses décisions à plusieurs étapes lorsque concevoir, mettre en œuvre et analyser des études, avec un certain degré de biais inévitable au cours de ce processus. Le fait que les essais soient confrontés à un certain degré de biais est simplement le compromis pour que les études soient réellement menées dans le monde réel. Et remédier à un biais peut parfois signifier introduire un autre biais (par ex.

Nous devons alors toujours porter un jugement: les résultats biaisés des études sont-ils suffisamment bons pour éclairer nos décisions? Souvent, ils le sont – mais ce jugement dépend généralement de l’utilité des résultats dans la pratique et de leur niveau de robustesse par rapport à d’autres études utilisant la même méthode ou, parfois, d’autres méthodes. Pourtant, aucune étude ne devrait être la seule source faisant autorité pour éclairer les politiques et nos décisions. En général, cependant, l’impact des ECR serait plus important si les chercheurs examinaient systématiquement et visaient à réduire chaque biais et à satisfaire chaque hypothèse autant que possible – comme indiqué dans la figure 1 . Plus largement, quelles leçons les chercheurs peuvent-ils tirer pour améliorer les ECR?

Les revues doivent commencer à exiger que les chercheurs incluent une section autonome avec des tableaux supplémentaires dans leurs études sur les « hypothèses, biais et limites de la recherche » auxquels ils ont été confrontés lors de la réalisation de l’essai. Chaque essai devrait donc inclure un tableau séparé avec les informations énumérées dans les lignes directrices CONSORT qui doivent être considérablement étendues pour exiger également des informations non encore déclarées sur la part, les traits ainsi que les raisons des participants refusant de participer avant la randomisation, ne prenant pas dosages complets, manque de données, etc., sur l’état d’aveuglement de toutes les personnes clés de l’essai, sur les facteurs alternatifs (de base) qui peuvent affecter le résultat principal et sur la plus large gamme de questions discutées tout au long de cette étude ( Figure 1). Il doit également inclure un tableau avec des données finales (pas seulement des données de base) des traits de fond des participants et des caractéristiques de la clinique – ainsi que des informations plus détaillées sur «l’ applicabilité des résultats », y compris le plus large éventail d’influenceurs de fond des participants, étape par étape. – des informations détaillées sur la façon dont l’échantillon initial est généré exactement (pas seulement les critères d’éligibilité et l’emplacement de la clinique) et à qui les résultats de l’essai peuvent s’appliquer explicitement. Ces 10 ECR ne traitent pas de toutes ces informations essentielles et des hypothèses, biais et limitations particuliers ( tableau 1 ) – et n’incluent pas toutes les informations déjà contenues dans les lignes directrices CONSORT alors que la plupart de ces essais ont été publiés après que les lignes directrices internationales normalisées ont été convenues. [ 1]. Cette étude met donc en évidence, d’une part, des problèmes plus larges tels que la non-compréhension complète des lignes directrices concernant les rapports d’étude ou le non-respect total des lignes directrices pour les essais minimalement robustes. Cela soulève également la question importante de savoir pourquoi un certain nombre d’études de haut niveau qui ne correspondent pas à des normes de qualité minimales et dont les résultats biaisés continuent d’être fortement citées. D’un autre côté, cela montre que les directives CONSORT doivent être considérablement étendues pour refléter cet ensemble plus large d’hypothèses, de biais et de limitations. Si les revues commençaient à exiger ces tableaux et informations supplémentaires (par exemple, en tant qu’annexe supplémentaire en ligne en raison des limites de mots), les chercheurs apprendraient à mieux détecter et réduire les problèmes rencontrés par les essais dans la conception, la mise en œuvre et l’évaluation – et contribuer ainsi à améliorer les ECR. Sans ces informations essentielles dans les études, les lecteurs ne sont pas en mesure d’évaluer correctement la validité et les conclusions d’un essai. Certains chercheurs pourraient répondre en disant qu’ils connaissent peut-être déjà un certain nombre des biais décrits ici. Cependant, cela ne semble pas toujours être le cas, faute de quoi ces ECR influents ne souffriraient pas tous, dans une telle mesure, de certains de ces biais.

Les chercheurs doivent en outre mieux combiner les méthodes car chacune peut donner un aperçu des différents aspects d’un traitement. Celles-ci vont des ECR, des études observationnelles et des essais contrôlés historiquement, aux cas uniques riches et au consensus d’experts. Certains chercheurs peuvent répondre: «les ECR ne sont-ils pas encore plus crédibles que ces autres méthodes même s’ils peuvent avoir des biais?» Pour la plupart des questions qui nous intéressent, les ECR ne peuvent pas être plus crédibles car ils ne peuvent pas être appliqués (comme indiqué ci-dessus). D’autres méthodes (telles que des études d’observation) sont nécessaires pour de nombreuses questions non modifiables à la randomisation, mais aussi parfois pour aider à concevoir des essais, interpréter et valider leurs résultats, fournir un aperçu supplémentaire des conditions plus générales dans lesquelles les traitements peuvent fonctionner, entre autres raisons discutées précédemment .

Enfin, la randomisation n’égalise pas toujours tout bien à la ligne de base et elle ne peut pas contrôler les déséquilibres finaux chez les influenceurs d’arrière-plan. Les chercheurs doivent cependant faire des efforts pour assurer une répartition équilibrée des influenceurs de fond importants entre les groupes d’essai, puis contrôler également les changements de ces influenceurs de fond pendant l’essai en collectant des données finales. Bien que si les chercheurs continuent de croire que lancer une pièce nous rapproche de la rigueur et de la compréhension scientifiques plutôt que, par exemple, de garantir systématiquement une bonne répartition des participants à la ligne de base et à la fin, la compréhension scientifique sera compromise au nom de la randomisation assistée par ordinateur.

Remerciements

Je suis reconnaissant des commentaires de Stephan Guettinger, Corinna Peters, Richard Baxter, Alina Velias, Nicolas Friederici, Severin Pinilla, Ravi Somani, Gunnar Wegner, Adrián Garlati et des critiques de revues anonymes.

Déclaration de divulgation

Aucun conflit d’intérêts potentiel n’a été signalé par l’auteur.

Appendice

Figure A1. Organigramme PRISMA – sélection des études pour la revue. Source: propre illustration. Remarque: les études ECR sélectionnées en fonction du nombre de citations jusqu’en juin 2016.

Information additionnelle

Financement

Ce travail a été soutenu par l’Union européenne dans le cadre du programme Marie Sklodowska-Curie [subvention n ° 745447].

Journal « Annales de médecine » – Volume 50, 2018, n°4

Publié le 4 avril 2018


Les références
  • Andrew E , Anis A , Chalmers T , et al. Une proposition de rapport structuré des essais contrôlés randomisés . JAMA. 1994 ; 272: 1926 – 1931 . [Crossref],[PubMed],[Web of Science ®] ,  [Google Scholar] 
  • Sackett D , Rosenberg W , Gray J , et al. Médecine factuelle: ce qu’elle est et ce qu’elle n’est pas . BMJ. 1996 ; 312: 71 – 72 . [Crossref],[PubMed],[Web of Science ®] ,  [Google Scholar] 
  • Djulbegovic B , Kumar A , Glasziou P , et al. Recherche médicale: l’imprévisibilité des essais donne des gains thérapeutiques prévisibles . La nature. 2013 ; 500: 395 – 396 . [Crossref],[PubMed],[Web of Science ®] ,  [Google Scholar] 
  • Worrall J. Pourquoi il n’y a aucune raison de randomiser. Londres : London School of Economics ; Nov 2004 . (Rapport technique 24/4). [Google Scholar]
  • Seligman M. Science comme allié de la pratique . Suis Psychol. 1996 ; 51: 1072 – 1079 . [Crossref],[PubMed],[Web of Science ®] ,  [Google Scholar] 
  • Duflo E , Glennerster R , Kremer M. Utilisation de la randomisation dans la recherche en économie du développement: une boîte à outils . Dans: Handbook of development economics. Amsterdam : Elsevier ; 2007 . [Crossref] ,  [Google Scholar] 
  • Banerjee A. Faire fonctionner l’aide. Cambridge : MIT Press ; 2007 . [Google Scholar]
  • Marler J. Tissue activateur de plasminogène pour AVC ischémique aigu . N Engl J Med. 1995 ; 333: 1581 – 1588 . [Crossref],[PubMed],[Web of Science ®] ,  [Google Scholar] 
  • Van Den Berghe G , Wouters P , Weekers F , et al. Insulinothérapie intensive chez les patients gravement malades . N Engl J Med. 2001 ; 345: 1359 – 1367 . [Crossref],[PubMed],[Web of Science ®] ,  [Google Scholar] 
  • Slamon D , Leyland-Jones B , Shak S et al. Utilisation de la chimiothérapie et d’un anticorps monoclonal contre her2 pour le cancer du sein métastatique qui surexprime HER2 . N Engl J Med. 2001 ; 344: 783 – 792 . [Crossref],[PubMed],[Web of Science ®] ,  [Google Scholar] 
  • Rossouw J , Anderson G , Prentice R , et al. Risques et avantages des œstrogènes et des progestatifs chez les femmes ménopausées en bonne santé: principaux résultats de l’essai contrôlé randomisé de l’initiative pour la santé des femmes . JAMA. 2002 ; 288: 321 – 333 . [Crossref],[PubMed],[Web of Science ®] ,  [Google Scholar] 
  • Hurwitz H , Fehrenbacher L , Novotny W et al. Bevacizumab plus irinotécan, fluorouracile et leucovorine pour le cancer colorectal métastatique . N Engl J Med. 2004 ; 350: 2335 – 2342 . [Crossref],[PubMed],[Web of Science ®] ,  [Google Scholar] 
  • Groupe d’étude scandinave sur la survie de la simvastatine (SSSSG). Essai randomisé de réduction du cholestérol chez 4444 patients atteints de maladie coronarienne: l’étude de survie scandinave simvastatine . Lancette. 1994 ; 344: 1383 – 1389 . [PubMed],[Web of Science ®] ,  [Google Scholar] 
  • Shepherd J , Cobbe S , Ford I , et al. Prévention des maladies coronariennes avec la pravastatine chez les hommes atteints d’hypercholestérolémie . N Engl J Med. 1995 ; 333: 1301 – 1308 . [Crossref],[PubMed],[Web of Science ®] ,  [Google Scholar] 
  • Groupe de recherche sur le contrôle du diabète et les complications (DCC). L’effet du traitement intensif du diabète sur le développement et la progression des complications à long terme du diabète sucré insulino-dépendant . N Engl J Med. 1993 ; 329: 977 – 986 . [Crossref],[PubMed],[Web of Science ®] ,  [Google Scholar] 
  • Turner R. Contrôle intensif de la glycémie avec des sulfonylurées ou de l’insuline par rapport au traitement conventionnel et risque de complications chez les patients atteints de diabète de type 2 . Lancette. 1998 ; 352: 837 – 853 . [Crossref],[PubMed],[Web of Science ®] ,  [Google Scholar] 
  • Knowler W , Barrett-Connor E , Fowler S , et al. Réduction de l’incidence du diabète de type 2 avec intervention sur le mode de vie ou metformine . N Engl J Med. 2002 ; 346: 393 – 403 . [Crossref],[PubMed],[Web of Science ®] ,  [Google Scholar] 
  • Moher D , Hopewell S , Schulz K et al. CONSORT 2010 Explication et élaboration: lignes directrices mises à jour pour la notification des essais randomisés en groupe parallèle . BMJ. 2010 ; 340: c869 . [Crossref],[PubMed],[Web of Science ®] ,  [Google Scholar] 
  • Rennie D. CONSORT révisé – améliorant la notification des essais randomisés . JAMA. 2001 ; 285: 2006 – 2007 . [Crossref],[PubMed],[Web of Science ®] ,  [Google Scholar] 
  • Moher D , Pham B , Jones A et al. La qualité des rapports d’essais randomisés affecte-t-elle les estimations de l’efficacité des interventions rapportées dans les méta-analyses? Lancette. 1998 ; 352: 609 – 613 . [Crossref],[PubMed],[Web of Science ®] ,  [Google Scholar] 
  • Chan A , Altman D. Épidémiologie et rapports d’essais randomisés publiés dans des revues PubMed . Lancette. 2005 ; 365: 1159 – 1162 . [Crossref],[PubMed],[Web of Science ®] ,  [Google Scholar] 
  • Vandenbroucke J. Recherche observationnelle, essais randomisés et deux vues de la science médicale . PLoS Med. 2008 ; 5: e67 . [Crossref],[PubMed],[Web of Science ®] ,  [Google Scholar] 
  • Black N. Pourquoi nous avons besoin d’études observationnelles pour évaluer l’efficacité des soins de santé . BMJ. 1996 ; 312: 1215 – 1218 . [Crossref],[PubMed],[Web of Science ®] ,  [Google Scholar] 
  • Dwan K , Altman D , Arnaiz J et al. Examen systématique des preuves empiriques du biais de publication de l’étude et du biais de notification des résultats . PLoS One. 2008 ; 3: e3081 . [Crossref],[PubMed],[Web of Science ®] ,  [Google Scholar] 
  • Goldacre B. Faire en sorte que les journaux rapportent correctement les essais cliniques . La nature. 2016 ; 530: 7 . [Crossref],[PubMed],[Web of Science ®] ,  [Google Scholar] 
  • Lawler P , Filion K , Eisenberg M. Efficacité de la réadaptation cardiaque basée sur l’exercice post-infarctus du myocarde: une revue systématique et une méta-analyse d’essais contrôlés randomisés . Am Heart J. 2011 ; 162: 571 – 584.e2 . [Crossref],[PubMed],[Web of Science ®] ,  [Google Scholar] 
  • Altman D . Comparabilité des groupes randomisés . Le statisticien. 1985 ; 34: 125 – 136 . [Crossref] ,  [Google Scholar] 
  • Cartwright N . Les ECR sont-ils l’étalon-or? Biosociétés. 2007 ; 2: 11 – 20 . [Crossref] ,  [Google Scholar] 
  • Bekelman J , Li Y , Gross C. Portée et impact des conflits d’intérêts financiers dans la recherche biomédicale: une revue systématique . JAMA. 2003 ; 289: 454 – 465 . [Crossref],[PubMed],[Web of Science ®] ,  [Google Scholar] 
  • Lexchin J , Bero L , Djulbegovic B , et al. Sponsoring de l’industrie pharmaceutique et résultats et qualité de la recherche: revue systématique . BMJ. 2003 ; 326: 1167 – 1170 . [Crossref],[PubMed],[Web of Science ®] ,  [Google Scholar] 
  • Allison M. Réinventer les essais cliniques . Nat Biotechnol. 2012 ; 30: 41 – 49 . [Crossref],[PubMed],[Web of Science ®] ,  [Google Scholar] 
  • Yusuf S , Wittes J. Interpréter les variations géographiques dans les résultats des essais contrôlés randomisés . N Engl J Med. 2016 ; 375: 2263 – 2271 . [Crossref],[PubMed],[Web of Science ®] ,  [Google Scholar] 
  • Pfeffer M , McMurray J. Leçons d’incertitude et d’humilité – essais cliniques impliquant l’hypertension . N Engl J Med. 2016 ; 375: 1756 – 1766 . [Crossref],[PubMed],[Web of Science ®] ,  [Google Scholar]