| Lecture critique des études relatives au tabagisme |
|
|
|
|
Professeur Jacques PRIGNOT - UCL Reproduit avec l'aimable autorisation de l'auteur A l'heure où chacun tente de mettre en œuvre une « evidence based medicine » c. à d. une pratique s'inspirant de données bien démontrées, et alors que foisonnent les publications scientifiques, il importe de faire un choix éclairé dans ses lectures et de les aborder avec un regard critique. En ce qui concerne les problèmes-santé liés au tabagisme, deux grands thèmes sont abordés dans la littérature: - Le rapport entre l'exposition au tabagisme actif et passif et le développement d'une pathologie (morbidité) et la mortalité qui en résulte. Le thème est traité essentiellement par des enquêtes épidémiologiques portant sur de grandes populations, souvent pendant de nombreuses années - L'efficience comparative des diverses techniques d'aide à l'arrêt, qui consiste à observer leurs résultats dans des groupes de sujets plus limités et pour des durées plus courtes. Ce cours apportera quelques éléments de base pour l'appréciation de la qualité des travaux. 1. La revue où le travail est publié A. La préférence va aux revues médicales qui font appel à des "relecteurs" (peer reviewers) anonymes, compétents sur le sujet et indépendants des auteurs et de leurs sponsors. Ces lecteurs critiquent et font amender les articles par leurs auteurs avant même leur publication; leur avis négatif peut entraîner le refus par les éditeurs; le taux de refus peut atteindre un tiers ou davantage. Il en résulte en moyenne une qualité satisfaisante des travaux. C'est le cas des revues "Tobacco Control" et "Nicotine & Tobacco Research" qui sont les deux principales sources d'information spécifique en matière de tabagisme. B. Les travaux exposés lors de symposiums et regroupés dans les numéros spéciaux de revue ou dans des livres, ont souvent une moindre valeur et peuvent être "inspirés" par des sponsors pharmaceutiques ou liés à l'industrie du tabac. Ce fut le cas pour un certain nombre de publications consacrées aux effets-santé du tabagisme passif où les contributions sponsorisées par l'industrie du tabac (où la conclusion est le plus souvent négative) et celles produites par des chercheurs indépendants sont mélangées et entretiennent la confusion. ; six de 11 symposiums sur la fumée environnementale étaient sponsorisés par l'industrie du tabac. La forte proportion d'articles avec conclusions négatives dans les symposiums provient de l'inclusion de 22 revues générales et de 19 articles originaux dépourvus d'études statistiques, ce qui n'est pas le cas pour les articles originaux revus par les lecteurs (Bero et al 1994). C. Les auteurs de revues générales peuvent être influencés par le "sponsorship", provenant tantôt de l'industrie du tabac qui favorise les articles à résultat négatif concernant la fumée environnementale (L'odds ratio de conclure à l'absence d'effet de la fumée environnementale par un auteur affilié versus un non affilié à l'industrie du tabac est de 88.4 !!! [Barnes, 1998]). Ils peuvent être liés à l'industrie pharmaceutique qui favorise les articles à résultats positifs concernant les effets des médicaments. D. Les méta-analyses sont un type de revue générale qui, bien conduites, échappent aux griefs cités plus haut (Hughes et al, 2002). Elles veillent : - à une recherche systématisée des articles indexés par exemple dans Medline, Embase, Sci Search, Psyclit, ainsi que les articles cités dans des symposiums ou autres sources; (par exemple, la bibliographie d'autres articles) - à la sélection des articles retenus en fonction de critères préétablis (par ex. uniquement essais contrôlés, double anonymat, répartition des cas au hasard) souvent par deux lecteurs indépendants; comparaison de deux produits dans une même étude plutôt que dans deux études différentes (Bucher et al. 1997 - au regroupement des résultats provenant d'études comparables, permettant de quantifier la donnée recherchée sur un plus grand nombre de cas, ce qui augmente le degré de certitude de l'odds ratio et rétrécit ainsi l'intervalle de confiance. 2. Les auteurs et leur indépendance La notoriété d'un auteur et surtout d'une équipe n'est pas un élément absolu de sélection, mais un facteur important d'orientation: ce qui vient de l'équipe de Benowitz à San Francisco ou de Changeux à Paris aura plus de poids qu'une publication provenant d'une obscure faculté provinciale... Les grandes revues comme le British Medical Journal (BMJ) incluent actuellement à la fin des articles un paragraphe systématique "Conflicts of Interest" où les auteurs ont à signaler leurs sources de financement (industrie, fondations privées, gouvernements) et leurs attaches éventuelles à des entreprises qui pourraient avoir intérêt à un type donné de résultats. Au cours des dernières années, l'industrie pharmaceutique recourt davantage pour ses recherches à des "Contact Research Organizations" c. à d. à des groupes privés non académiques de recherche: ceux-ci ont recueilli en 2000 aux Etats-Unis 60% des subsides de recherche de l'industrie pharmaceutique (Davidoff et al 2001). L'influence du sponsor apparaît dans une méta-analyse des effets du bupropion (Wagena, 2003) Le cas "Rylander" est un exemple typique de l'influence des cigarettiers sur un auteur apparemment indépendant mais dont les liens occultes avec l'industrie du tabac ont influencé largement le travail "scientifique" concernant le tabagisme passif (Diethelm et al, 2004). 3. L'article lui-même 3.1. La question posée Dans la recherche des causes d'une maladie, il peut s'agir de la relation entre cette maladie et un facteur causal (microbien, environnemental, alimentaire, tabagique, etc.). Dans le cadre des essais thérapeutiques, il peut s'agir d'établir l'efficacité d'un produit ou d'une intervention et son innocuité, de choisir la dose adéquate dans divers types de population, de préciser la durée optimale du traitement, etc.. 3.2. Les types d'étude 3.2.1. Etudes expérimentales Essais thérapeutiques prospectifs : Essais randomisés contrôlés par placebo ou par comparaison avec un autre médicament - par ex. nicotine versus placebo ou nicotine versus bupropion
-
par ex. Lung Health Study: intervention vs. non-intervention chez les fumeurs
atteints 3.2.2. Etudes non expérimentales - Enquêtes transversales par ex. le pourcentage de fumeurs aux différents stades dans le processus d'initiation ou de cessation tabagique à un moment donné qui donne un cliché à un moment donné et ne permet pas de préciser l'évolution d'une cohorte. - Etude prospective de cohorte longitudinale : le point de départ est l'exposition ou non à un agent. par ex. étude de Doll et Hill sur le tabagisme et le décès par cancer du poumon Risque attribuable = IE - IC (IE = incidence essai; IC = incidence contrôle) 0.96/1 000/an - 0.07/1 000/an = 0.89/1 000/an (Fletcher et al., 1996) - Etudes avant-après, non contrôlées (souvent préliminaires) - Etudes cas-contrôle Le point de départ est une maladie déterminée. On compare l'exposition dans un groupe de malades à celle dans un groupe de non-malades ou atteints d'autres maladies - Etude d'un ou plusieurs cas (On parle aussi à ce propos d'études préliminaires ou qualitatives cherchant à débroussailler un problème avant d'élaborer un protocole d'études quantitatives). Par ex. Fagerström: effet de la réduction tabagique sur les paramètres respiratoires.
Lorsqu'il s'agit d'établir une relation de causalité entre un agent et un effet, il est particulièrement important de mettre l'effet en étroite relation avec l'importance de l'agent (étude dose/effet), de déterminer la vraisemblance biologique de l'effet et d'établir la réversibilité de l'effet par suppression de l'agent causal.
La contribution de divers types d'études à la réponse à une question clinique est bien illustrée par le graphique de Fletcher (1996). 3.3. Détermination du nombre de cas nécessaires pour échapper à un résultat faussement positif (erreur de type I ou a) ou faussement négatif (erreur de type II ou b) Ce nombre dépend de 4 facteurs: - L'importance prévue de la différence Si l'on s'attend grâce à un essai ouvert préalable, à une différence importante entre groupe-intervention et groupe-contrôle, le nombre de cas nécessaires à détecter une différence significative sera plus faible. - La valeur choisie pour pa C'est à dire le risque accepté d'un résultat faussement positif. En général, le pa est fixé à 0.05. - La valeur choisie pour pb C'est à dire le risque accepté d'un résultat faussement négatif. On accepte souvent un pb de 0.20 parce que les conséquences d'un essai faussement négatif sont habituellement moins graves que celles d'un essai faussement positif. - La fréquence des événements dans la population à risque. Plus la fréquence est élevée, plus grande sera la puissance statistique de l'étude (1- pb) pour un nombre déterminé de sujets concernés. C'est à dire que le nombre de cas à étudier sera plus petit pour éviter un faux négatif quand il y a un nombre absolu d'événements plus élevé. Par exemple, si les abstinences sont très fréquentes dans les deux groupes, le nombre de cas nécessaires sera moins élevé. Des tables ou des programmes informatiques permettent de calculer le nombre souhaité de patients pour une étude déterminée. Le nombre d'observations influence notoirement la précision des résultats. Si l'on étudie la prévalence des fumeurs adultes dans une population où il y a environ 30% de fumeurs, la précision n'est que de ± 10% pour un échantillon de 100 personnes, de ± 3% pour 1.000 personnes et de ± 1% pour 10.000 personnes. (Hill C., 2005) 3.4. Constitution des groupes de cas étudiés Dans le cas particulier du tabac, il faut préciser les caractéristiques des sujets concernés, qui peuvent différer entre eux notamment par leur degré de dépendance et leur degré de motivation à l'arrêt (mais aussi par l'âge, le sexe, la catégorie socio-économique, etc..). Il faut préciser aussi le cadre de l'étude. Certains travaux portent sur la population générale non sélectionnée ou sur une fraction de celle-ci. C'est le cas de l'étude de England et al (2001) portant sur les femmes enceintes fréquentant les consultations prénatales de 3 Etats des Etats-Unis. Les essais thérapeutiques recourant au recrutement de volontaires à l'arrêt par voie de presse ou par Internet sélectionnent au départ des sujets motivés à l'arrêt, à des niveaux variés de dépendance. C'est le cas du travail de Bolliger et al (2000 et 2002) consacré à la réduction tabagique assistée par une substitution nicotinique incomplète. Les résultats qui en ressortent ne peuvent pas être généralisés à l'ensemble des fumeurs, dont beaucoup ne sont pas motivés sérieusement à l'arrêt. Les essais thérapeutiques conduits dans des centres spécialisés (CAF ou consultations de tabacologie) portent sur des sujets généralement très dépendants mais motivés à arrêter (dans la mesure où il s'agit de consultations directes et non de transferts). Finalement, dans les essais conduits par exemple par des médecins généralistes ou chez des patients hospitalisés, à qui le médicament d'aide à l'arrêt est proposé en raison de leur état de santé, affecté par une maladie liée ou non au tabac, la motivation à l'arrêt est souvent peu marquée (sauf en cas de pathologie sévère et aiguë comme l'infarctus du myocarde) et la dépendance nicotinique marquée. Il faut veiller à ce que les critères d'inclusion de l'étude soient bien précisés: les résultats seront souvent plus favorables si l'on accepte les fumeurs tout venant que si l'on se limite à ceux dont le score de Fagerström est égal ou supérieur à 7, si l'on s'adresse à des adultes plutôt qu'à des adolescents, à des sujets de classe socio-économique aisée plutôt qu'à des marginaux, à des sujets motivés à l'arrêt plutôt qu'à n'importe quel fumeur. Les critères d'exclusion sont eux aussi importants; les résultats seront plus favorables si l'on exclut les sujets atteints de co-morbidité (dépression ou antécédents de dépression, alcoolisme, intoxication aux drogues dures), les récidivistes etc.. L'étude peut aussi porter sur un groupe bien défini de fumeurs, par ex. les femmes enceintes et ne peut être généralisée à l'ensemble des fumeurs. Plus les critères d'inclusion et d'exclusion sont sévères, et plus les résultats sont valables pour le groupe étudié, mais aussi moins ils sont généralisables à l'ensemble des fumeurs. Pour éviter tout biais de sélection, il est important que tous les sujets répondant aux critères d'inclusion soient admis successivement dans l'étude, sans qu'il n'y ait d'exception pour des amis ou parents, etc.. 3.5. Répartition des sujets entre groupe-intervention et groupe-contrôle, Anonymat Celle-ci doit être faite strictement au hasard, par un système d'enveloppes (prénumérotées et à l'intérieur de l'enveloppe, l'indication du groupe auquel le fumeur doit être affecté), ou encore par un système informatique. Ceci permet de constituer pour l'intervention et le contrôle des groupes comparables par leurs données démographiques et autres. Une vérification de cette similitude s'impose surtout quand le nombre de sujets est peu élevé. Quand c'est possible, il est préférable d'adopter la technique "en double aveugle", c. à d. celle où ni le thérapeute, ni le fumeur ne connaissent le groupe auquel ce dernier est attribué. Ceci est relativement aisé pour des médicaments pour lesquels il faut veiller à une apparence et un goût similaires pour le produit actif et le placebo. La distribution des produits est alors confiée à un tiers, par exemple le pharmacien hospitalier, qui est le seul à connaître le code et n'intervient ni dans le recueil ni dans l'interprétation des résultats. Malgré les précautions d'usage le patient peut parfois distinguer le produit actif du placebo à cause des effets directs ou collatéraux du médicament actif. En cas de simple anonymat, seul le patient ignore le type de produit qu'il absorbe; le thérapeute risque alors d'interpréter le résultat dans le sens qu'il souhaite; la méthode est beaucoup moins sûre. Lorsque l'intervention est de type psycho-comportemental plutôt que médicamenteux, il est bien plus difficile, voire impossible d'assurer l'anonymat (études dites ouvertes), d'où une possibilité de biais par le patient (s'il souhaite faire plaisir au thérapeute) ou par le thérapeute qui souhaite démontrer un effet déterminé. On se souviendra que certaines études concernant l'intérêt de l'acupuncture avaient recouru à une acupuncture placebo pratiquée à côté des points considérés comme actifs par la médecine chinoise et ignorés du fumeur: c'est l'équivalent d'un simple anonymat. Le contrôle par placebo (c. à d. un produit inactif) est particulièrement important, car le seul fait de prendre un produit même inactif entraîne souvent des effets thérapeutiques: cet effet placebo concerne souvent un tiers des patients pour des symptômes tels que douleurs, nausées, prurit. Dans certaines études, on introduit un troisième groupe (absence de toute intervention) qui correspond à l'évolution naturelle du comportement ou de la maladie. L'objet d'un essai clinique est de déterminer l'effet spécifique d'une intervention, c. à d. celui qui dépasse l'effet placebo, même si le clinicien est intéressé lui par l'effet total (spécifique plus placebo plus évolution naturelle) dont bénéficie son patient. Pour connaître l'effet spécifique, il faut déterminer la différence de résultat entre le groupe-intervention et le groupe-contrôle (placebo ou autre médicament) en s'assurant que tout est égal par ailleurs sauf l'intervention, notamment le type de soutien psycho-comportemental. Il n'est pas possible d'extrapoler sans réticence les résultats d'un essai clinique contrôlé randomisé vers ceux qu'on peut attendre sur le terrain; en effet les sujets ont tendance à modifier leur comportement par le simple fait qu'ils font l'objet d'une attention spéciale dans le cadre d'une étude médicale: c'est ce qu'on appelle l'effet Hawthorne, qui trouve sans doute son origine dans le désir des patients de plaire à leur thérapeute et de fournir de "bons résultats". Le thérapeute lui aussi apporte parfois une plus grande attention aux patients repris dans un essai clinique. C'est la raison pour laquelle les résultats obtenus sur le terrain sont souvent un peu moins bons que dans les essais thérapeutiques. Dans la pratique clinique, on peut s'attendre à un effet égal à la somme de l'effet spécifique + placebo auquel s'ajoute l'évolution spontanée (qu'on appelle aussi l'histoire naturelle) (Fletcher et al., 1996). Dans le cas de l'arrêt du tabagisme, on sait que 2 à 5% des fumeurs décidés à arrêter réussissent à le faire sans aucune intervention. 3.6. Mesures de résultats et leur timing Elles doivent être précisées à l'avance dans le protocole d'étude pour éviter au maximum les erreurs de classement lors du dépouillement ("misclassification"). En ce qui concerne la cessation du tabagisme, on peut recourir à un classement dichotomique c. à d. en deux catégories: fumeurs versus non-fumeurs. On se base sur les déclarations du fumeur (qui risquent d'être trop optimistes lorsque le consensus social est antitabac ou chez les patients BPCO [52% de fausses abstinences dans un essai avec contact minimal] (Monninkhof et al. 2004), que l'on a intérêt à valider par des contrôles biologiques grâce aux marqueurs (CO-E, de préférence en fin de journée, si traitement par nicotine, cotinine si thérapeutique non nicotinique). Les mesures de résultat doivent être faites au minimum en début de traitement, à la fin du traitement (résultats précoces) et 6 et 12 mois après la fin du traitement. Souvent on fait ces mesures 6 et 12 mois après le début du traitement, ce qui risque de créer un biais vu la durée variable des traitements d'un sujet à l'autre. Le suivi des effets collatéraux doit être assuré au moins jusqu'à la fin de la prise des médicaments. Les résultats peuvent s'exprimer en taux d'abstinence continue stricte c. à d. l'absence totale de fume depuis le jour de l'arrêt jusqu'à la fin de la période d'observation. On se base ici sur les déclarations du sujet et sur les validations biologiques réalisées à chaque visite. Ce critère est le plus strict mais dépend partiellement de la véracité des déclarations. L'autre mesure est le taux d'abstinence ponctuelle c. à d. le fait de n'avoir pas fumé dans les 7 jours qui précèdent chaque visite, chaque fois avec validation biologique. Cette mesure est moins sévère car elle permet des rechutes temporaires et inclut également les arrêts tardifs. Mais d'un autre côté, elle est plus indépendante de la véracité des déclarations des patients car elle est validée à chacune des étapes. Il est particulièrement important lorsqu'on compare les résultats dans différentes études d'utiliser les mêmes critères (abstinence continue ou abstinence ponctuelle ) si l'on veut tirer des conclusions valables. Dans certains travaux, on étudie le problème de la cessation avec des variables continues, incluant dans l'étude le nombre de cigarettes consommées à chaque visite: ceci permet de prendre en compte non seulement les arrêts mais aussi les diminutions de consommation de tabac qui peuvent parfois correspondre à une réduction des risques. Un traitement statistique différent s'impose pour ce type d'étude. Comme le "syndrome de privation" est un facteur causal essentiel des nombreuses rechutes observées, l'effet des interventions sur ce syndrome mérite d'être mesuré. Vu le caractère subjectif du syndrome, sa quantification impose le recours à des scores souvent cumulés où le fumeur est invité à indiquer par des chiffres de 0 à 10 l'intensité des divers symptômes qui le constituent. Le syndrome étant précoce (premières semaines), le suivi doit lui aussi être précoce. D'autre part, dans les études portant sur des fumeurs malades (par ex. BPCO) on peut étudier l'effet de l'arrêt sur la qualité de vie, en employant entre autres le "St Georges Respiratory Questionnaire" de Jones et al.(1992). 3.7. Suivi de la cohorte - Si l'on veut apprécier l'efficacité d'une intervention, il faut s'assurer de l'adhésion thérapeutique dans les deux groupes étudiés. On questionnera régulièrement les sujets sur la prise des médicaments et on leur demandera d'apporter les produits résiduels à chacune des visites. L'adhésion thérapeutique est souvent un peu meilleure dans le groupe intervention que dans le groupe témoin. - L'interprétation d'un résultat négatif sera évidemment différente si le sujet a pris ou non correctement les produits prescrits. La non-observance peut résulter entre autres des effets collatéraux du produit. L'adhésion est souvent moins bonne en ambulatoire que dans un contexte hospitalier. - Si l'étude vise aussi à déterminer l'innocuité du produit actif, Il y a lieu d'interroger à chaque occasion les sujets sur les effets collatéraux. Un problème spécifique à l'arrêt du tabac provient de la similitude de certains symptômes liés au sevrage avec ceux de co-morbodités sous-jacentes et avec les effets collatéraux dus aux médicaments. la comparaison entre groupe-témoin et groupe-intervention trouve ici toute sa valeur. La valeur des estimations d'innocuité étant liée aux critères d'exclusion, la surveillance après mise sur le marché (pharmacovigilance) est aussi très utile pour préciser les complications rares et celles survenant dans les cas de co-morbidité (souvent exclus des essais cliniques). - En cours de suivi, un certain nombre de patients cessent de collaborer à l'étude (abandon) ou sont perdus de vue pour d'autres raisons. Ce taux de perte ("attrition rate") doit être précisé à chaque étape, et les causes d'abandon et de perte doivent être relevées lorsqu'elles sont déterminables, surtout si ces événements sont nombreux.
Il est essentiel de concentrer ses efforts pour réduire autant que possible le nombre d'abandons et de perdus de vue, afin d'améliorer la validité des résultats, compromise par ces pertes. 3.8. Etude statistique des résultats 3.8.1. Pour les études dichotomiques, on calcule dans quelle mesure les différences des résultats entre le groupe-intervention et le ou les groupes-contrôle (placebo et parfois absence totale d'intervention) sont statistiquement significatives, c à d qu'elles ont très peu de chances d'être dues au hasard. Quand on fixe la limite de signification à pα = 0.05, cela signifie que le risque de résultats faussement positifs est de 5% ou encore que la différence observée a 95% de chances de ne pas être due au hasard. Si la limite de signification est à pα = 0.01, les chiffres correspondants seront 1% et 99%. Pour ce qui est de l'arrêt du tabagisme, on peut calculer 3 données: 1. La différence en % du taux d'arrêt c à d le pourcentage d'abstinents dans le groupe-intervention moins le pourcentage d'abstinents dans le groupe-contrôle 2. La différence de risque en valeur absolue DR Le nombre ou le taux d'abstinents du groupe intervention moins le nombre d'abstinents du groupe-contrôle divisé par le nombre total de l'échantillon 3. Le nombre de traitements nécessaires pour obtenir un arrêt supplémentaire (number needed to treat: NNT). NNT = 1/ DR Une autre expression des résultats consiste à déterminer le Risque Relatif (RR) de succès dans le groupe-intervention par rapport au groupe-placebo: le RR correspond au nombre d'arrêts dans le groupe-intervention divisé par le nombre d'arrêts dans le groupe-placebo. Il y a lieu de calculer, en plus du RR, l'intervalle de confiance (IC) à 95% c à d l'écart des valeurs dans lesquelles se situerait le RR avec un pα= 0.05. Comme on peut le voir à la dernière page du texte, lorsque le RR et son IC sont inférieurs à 1, on conclut à un effet négatif d'autant plus marqué que la valeur du RR est plus basse (A sur le graphique). Quand le RR est supérieur ou inférieur à 1 mais que les intervalles de confiance chevauchent la ligne de 1, on ne peut pas conclure avec 95% de sécurité que la valeur obtenue ne soit pas due au hasard (B et D sur le graphique). Lorsque le résultat est supérieur à 1, en l'absence de chevauchement de la ligne 1, l'effet est positif, d'autant plus que la valeur de RR est plus élevée. (C sur le graphique) Plus large est l'intervalle de confiance et plus grande est la chance qu'un résultat soit influencé par l'insuffisance du nombre de cas étudiés (D sur le graphique). L'intérêt d'un traitement en matière de santé publique est mieux exprimé par le NNT que par le RR, car ce dernier peut être élevé même si la différence en valeur absolue est très faible. Exemples de résultats d'une thérapeutique vs. le placebo: 40% vs. 20% RR = 0.40/0.20 = 2 mais le NNT = 1/0.40-0.20 = 1/0.20 = 5 4% vs. 2% RR = 0.04/0.02 = 2 mais le NNT = 1/0.04-0.02 = 1/0.02 = 50 Il est clairement plus intéressant de ne devoir traiter que 5 patients pour avoir un succès additionnel, plutôt que de devoir en traiter 50. Les mêmes considérations valent pour les Odds Ratios qui vont être exposées ci-après. On calcule parfois aussi l'Odds Ratio ou rapport de cotes plutôt que le risque relatif notamment quand les données nécessaires au calcul de ce dernier font défaut, c'est-à-dire dans les études cas-contrôle où l'expérimentateur choisit le nombre de cas pathologiques et le nombre de cas normaux que l'on compare pour l'exposition au risque. L'Odds ratio entre un groupe-intervention et un groupe-placebo est le rapport entre les Odds de ces deux groupes. Les Odds (chances ou "cotes") sont constituées par le rapport entre le nombre de cas chanceux de l'échantillon et son complément (c à d le nombre de cas non chanceux de l'échantillon). Avec des chances de succès de 40% après traitement et de 20% après placebo, l'Odds du groupe-intervention est de 40/60 et l'Odds du groupe-placebo de 20/80. L'Odds Ratio est de 0.66/0.25 = 2.64. On constate qu'ici l'OR (2.6) est supérieur au RR (2). Avec des chances de succès de 4% après traitement et de 2% après placebo, l'Odds du groupe-intervention est de 4/96 (0.04) et celui du groupe-placebo de 2/98 (0.02). L'Odds Ratio est de 0.04/0.02 = 2. Le RR est lui aussi de 2 (4/2). L'OR est très proche du RR lorsque les Odds sont faibles, mais il augmente plus rapidement lorsqu'ils sont élevés (≥ 0.20), ce qui peut donner une vision plus optimiste des choses, notamment en ce qui concerne l'effet des médicaments. L'OR est très fréquemment utilisé actuellement plutôt que le RR et l'on est enclin à y recourir pour permettre la comparaison avec des études l'ayant utilisé ainsi que la méta-analyse. Dans une publication récente consacrée aux résultats d'un traitement de sujets atteints de BPCO par la nicotine sublinguale associée à un soutien psycho-comportemental assez intensif par des infirmières, Tonnessen (2006) observe une OR vs. placebo d'abstinence continue à un an de 2.88 qui paraît très intéressante, mais néanmoins le NNT est de 23.25 pour un cas supplémentaire d'arrêt, ce qui reste assez élevé. 3.8.2. Traitement des données manquantes 3.8.2.1. Technique "intention to treat " On considère ici les données manquantes (abandons ou perdus de vue) comme des échecs, que ce soit dans le groupe-traitement ou dans le groupe-placebo. Cette façon de traiter les abandons et les perdus de vue est la plus prudente ("conservative"), mais peut sous-estimer l'effet de l'intervention On garde ici dans le dénominateur l'ensemble de l'échantillon initial. Cette supposition (abandon = échec) n'est pas nécessairement exacte car certains sujets peuvent avoir quitté l'essai pour d'autres raisons et le taux de perdus de vue être très élevé (jusqu'à 50%) et être différent dans le groupe-contrôle et dans le groupe-intervention. Les données obtenues ne sont vraîment valables que dans la mesure où le pourcentage de non-répondeurs est le même dans le groupe-intervention et dans le groupe-contrôle. (Twardella et Brenner, 2008) 3.8.2.2. Technique des "courbes de survie" de Kaplan Meyer Appliquée initialement aux survies après divers traitements d'une maladie, elle peut aussi s'appliquer à n'importe quel autre événement, par exemple l'abstinence du tabagisme. Dans cette cohorte théorique, figurent en abscisse les mois de survie et en ordonnée la probabilité de cas d'abstinence persistante (en %). A la fin de chaque période, on prend comme numérateur le nombre de cas d'abstinence persistante et comme dénominateur, le nombre de cas dont l'état était connu à la fin de la période précédente, en excluant du dénominateur les rechutes (qui ne sont plus susceptibles d'être encore abstinents), les abandons et les perdus de vue (censored). On peut aussi calculer l'intervalle de confiance de ces pourcentages: celui-ci va en croissant au fil des mois vu la décroissance du nombre de cas considérés. Cette méthode est moins sûre que la précédente car il n'est pas certain que les abstinences persistantes soient d'une fréquence égale parmi les abandons ou perdus de vue que parmi ceux qui sont suivis jusqu'à la fin de la période d'observation. Sur 100 cas ayant commencé un traitement, s'il y a 60 rechutes, abandons ou pertes de vue à 6 semaines (fin du traitement), la probabilité de rechutes, abandons ou pertes de vue pour la période de 0-6 semaines est de 60%. S'il y a 10 rechutes, abandons ou pertes de vue, pendant la période 6-8 semaines, la probabilité de rechutes, abandons ou pertes de vue sera de 10/40, soit 25%. S'il y a 15 rechutes, abandons, pertes de vue pendant la période 6-52 semaines, la probabilité de rechutes, abandons ou pertes de vue sera de 15/40 soit 37.5%. Dans le même groupe, pour la période 0-52 semaines, cette probabilité sera de 85/100 soit 85% (Hughes et al.,2006) Pour l'étude de l'importance de facteurs multiples sur un résultat (biais confondants), on recourt aux méthodes de régression. 3.9. Les biais en observation clinique Définition: Ce sont des processus qui à n'importe quel stade de développement tendent à produire des résultats s'écartant systématiquement de la réalité. Types de biais : - Biais de sélection (au moment du recrutement) : comparaison entre groupes différant par autre chose que les déterminants étudiés - Biais de mesure (au moment de l'étude): application de mesures différentes aux groupes étudiés - Biais confondants (au moment de l'étude des résultats): association de deux (ou plusieurs) facteurs dont l'un déforme ou fait confondre les résultats de l'autre (emploi des méthodes de répression) - Biais de publication 109 essais d'efficacité dans 2 groupes d'expérimentation ( 43.708 patients; 1986-1996)
(Joannidis 1998) - Biais de mémoire 4. Conclusions Les conclusions doivent prendre en compte l'ensemble des données, comporter de préférence NNT et RR (ou OR) et éviter la généralisation à des groupes différents de ceux constituant la population étudiée. West et al (2005) ont proposé de standardiser l'étude des résultats des traitements des essais d'arrêt du tabagisme, afin de faciliter la comparaison entre les diverses études. Ils ont créé ainsi le 'Russel Standard" en hommage aux importantes contributions de Russel dans ce domaine, et principalement à sa rigueur. Ce standard est à considérer comme un minimum applicable aux essais comportant un contact personnel du fumeur et du professionnel de la santé, ainsi que la fixation d'une date d'arrêt. En voici les critères: 1. Durée de l'abstinence Elle est de 6 ou de 12 mois à dater de la date fixée de l'arrêt avec éventuellement une "période de grâce" prédéfinie, par exemple de 3 semaines après le "quit day"; le recueil des données peut être retardé jusqu'à 4 semaines après cette date. Il ne faut pas mixer les résultats de 6 et de 12 mois. Le standard récuse l'idée de fixer la durée à partir de la fin du traitement, ce qui désavantagerait les traitements de longue durée. 2. Abstinence Lors du contrôle final, déclaration personnelle de n'avoir pas fumé plus de 5 cigarettes depuis le "quit day", biologiquement validée. (l'absence de données à certains contrôles intermédiaires ne suffit pas à classer le sujet comme fumeur) 3. Validation biochimique - Contrôle par ECO < 10 ppm lors du contrôle final Si valeur ≥ 10 ppm au contrôle final est due aux 5 cigarettes tolérées, le sujet est malgré tout classé comme fumeur - ou contrôle par cotinine < 15 ng par mL de salive < 50 ng par mL d'urine non valable sous NRT; complété par ECO afin d'éviter cet écueil 4. Intention to treat (mitigée) Introduction de tous les cas initiaux dans les dénominateurs à l'exception des décès et de ceux dont on sait qu'ils ont déménagé vers une adresse inconnue. 5. Violations du protocole A classer en fonction de leur statut tabagique final (critères 2 + 3) Biais si on les exclut 6. Suivi en aveugle Les données du suivi doivent être recueillies à l'insu du groupe auquel appartient le sujet. Les taux de suivi doivent être calculés séparément pour les deux groupes: Intervention et Contrôle ou Traitement A et Traitement B.
Cette standardisation est proposée pour l'avenir mais il est clair qu'elle n'a pas été appliquée dans de nombreuses études antérieures, qui diffèrent souvent l'une de l'autre par les critères appliqués. Un exemple fourni dans les diapositives reprend la présentation d'une étude antérieure de Russel (1993) avec des données fictives. Bibliographie 1. Barnes DE, Bero L.A., Scientific quality of original research articles on envoronmental tobacco smoke, Tobacco Control 1997; 6: 19-26 2. Barnes DE, Bero L.A., Why review articles on the health effects of passive smoking reach different conclusions? JAMA 1998; 279: 1566-70 3. Bero L.A., Glantz S.A., Rennie D., Publication bias and public health policy on environmental tobacco smoke, JAMA 1994; 272: 133-6 4. Bolliger C.T., Zellweger J.P., Danielsson T., van Biljon X., Robidou A., Westin A. , Perruchoud A.P., Sawe U., Smoking reduction with oral nicotine inhalers: double blind, randomised clinical trial of efficacy and safety, BMJ 2000; 321: 329-33 5. Bolliger C.T., Zellweger J.P., Danielsson T et al, Influence of long-term smoking reduction on health risk markers and quality of life, Nicotine & Tobacco Research 2002; 4: 433-40 6. Bucher HC et al. The results of direct and indirect treatment comparisons in meta-analysis of clinical randomized trials. J Clin Epidemiol 1997; 50: 683-91 7. Davidoff F., DeAngelis C.D., Drazen J.M. et al, Sponsorship, authorship and accountability, N Engl J M 2001; 245: 825-7 8. Diethlem P. Rielle J-C. Funding of the scientific work by tobacco transnationals: l'affaire Rylander Int J Tub Lung Dis 2004 8 suppl1 S33-34 9. Doll R et al. Mortality in relation with smoking: 20 years observations in male British doctors. Brit med J 1976; 2: 1525-36 10. England L.J., Kendrick J.S., Wilson H.G., Merritt R.K., Gargiullo P.M., Zahniser S.C., Effects of smoking reduction during pregnancy on the birth weight of term infants, Am J Epidemiol 2001; 154: 694-701 11. Fletcher R.H., Fletcher S.W., Wagner E.H., Clinical Epidemiology: The essentials, Ed Williams & Wilkins 1996; 276 pp 12. Fox G.N. ,Crawley L.V., Evidence-based medicine : a new paradigm, JAMA 1993; 269 1253-4 13. Hill AB. The environment and disease: association and causation. Proc Royal Soc Med 1965; 58: 295-300 14. Hill C. Les indicateurs du tabagisme. Bull Epid Hebdom (BEH) 2005; n° 21-22: 105-107 15. Huges J.R., Stead L.F., Lancaster T., Antidepressants for smoking cessation (Cochrane Review) 16. In: The Cochrane Library 1, 2002. Oxford : Update Software 17. Hughes J. R., Collas P.W. Errors in interpreting abstinence curves in studies of smoking cessation. Nicotine Tobacco Research 2006; 8: 7-12 18. Jones P.W., Quisk F.H., Baveystock C.M. et al. A self completed measure of health status for chronic airflow obstruction. Am rev Respir Dis 1992;145: 1321-27 19. Jorenby D.E., Leishow S.J., Rennard S.I. et al, A controlled trial of sustained-release bupropion, a nicotine patch, or both for smoking cessation, N Engl J M 1999; 340: 685-91 20. Ioannidis J.P.A., Effect of the statistical significance of results on the time to completion and publication of randomiezd efficacy trials, JAMA 1998; 279: 281-6 21. Mc Allister FA et al. Users guide to medical literature. JAMA 1999; 282: 1371-7 22. Monninkhof E., VanderValck P., Vander Palen J. et al. The effect of minimal contact smoking cessation programme in out-patients with COPD: a pre-post-test study. Patients Educ Couns 2004; 52: 231-6 23. Prochaska JO 1995 Why do we behave the way we do? Can J Cardiol. 1995;11 Suppl A: 20A-25A. Review. 24. Russell M.A.H., Stapleton J.A., Feyerabend C. et al, Targeting heavy smokers in general practice: randomised controlled trial of transdermal nicotine patches, BMJ 1993; 306: 1308-12 25. Sasco AJ. In: Passive smoking: the health impact. A European Report 26. Twardella D, Brenner H. Implications of nonresponse patterns in the analysis of smoking cessation trials. Nicotine & Tobacco Research 2008; 10: 891-6 27. Tonnessen et al. Nurse-conducted smoking cessation in patients with COPD using nicotine sublingual tablets and behavioural support. Chest 2006; 130: 334-42 28. Wagena E. European Congress of SRNT Padova 2003 (Abstracts) 29. West R., Hajek P., Stead L., Stapleton J. Outcome criteria in smoking cessation trials: proposal for a common standard. Addiction 2005; 100: 299-303 30. Wyndner et al. Tobacco smoking as a possible etiologic factor in bronchogenic carcinoma. JAMA 1950; 143: 329-36
Source : Lecture critique des études relatives au tabagisme [extrait du cours de la formation en tabacologie] / Jacques Prignot. -UCL/FARES, 2009. |
|||||||||||||||||||||||||||
| Dernière mise à jour : ( 25-06-2009 ) | |||||||||||||||||||||||||||
|
||
|
Ce site est protégé par le droit d'auteur © FARES ASBL - Le site du FARES donne accès simultanément à des pages d'information (html) et à des documents PDF (Acrobat Reader). Si Acrobat n'est pas installé, cliquez ici pour accéder à la page de téléchargement de Adobe.
|