Distingerea între „lipsa dovezilor de efect” și „dovezi ale lipsei de efect” în studiile controlate randomizate și alte comparații | Archives of Disease in Childhood

Dacă o instanță nu reușește să condamne un acuzat din cauza unor probe incomplete, se stabilește astfel nevinovăția acestuia dincolo de orice îndoială? Nu neapărat. Într-adevăr, în Scoția, dacă rămâne suficientă incertitudine, instanța poate da un verdict de „neprobat” în loc de „nevinovat”. Dacă un studiu randomizat controlat (RCT) nu reușește să arate o diferență semnificativă între tratament și grupul de control, dovedește acest lucru că tratamentul nu are niciun efect clinic util? Din nou, nu neapărat. Este posibil ca tratamentul să funcționeze, dar este posibil ca studiul să nu fi fost în măsură să demonstreze acest lucru.1 În ciuda acestui fapt, multe astfel de studii „negative „12 , inclusiv multe dintre cele publicate în această revistă, pot fi considerate în mod eronat drept dovezi că tratamentul nu este util din punct de vedere clinic.

De exemplu, într-un RCT la femeile cu risc de naștere prematură, care nu a fost publicat ca raport complet,3 sindromul de detresă respiratorie (RDS) a apărut la trei din 23 de copii născuți în grupul tratat și la trei din 22 de copii născuți în grupul netratat. Diferența nu este semnificativă (2p > 0,9). Dacă acesta ar fi fost primul și singurul studiu al acestui tratament, multe persoane ar fi putut decide că nu este eficient și astfel și-ar fi pierdut interesul. De fapt, analizele de ansamblu ale acestui studiu3 și ale cel puțin altor 14 studii au arătat în cele din urmă că tratamentul – steroizii antenatali – este extrem de eficient, deoarece a redus la aproximativ jumătate SDR și mortalitatea neonatală la peste 3 500 de nou-născuți prematur.45 Rețineți că rezultatele studiului unic au fost destul de consistente cu această constatare.3 Concluzia corectă a acestui studiu unic nu este că steroizii antenatali nu funcționează, ci că studiul nu a avut suficientă putere pentru a detecta altceva decât cel mai spectaculos efect al tratamentului. Aproximativ jumătate din toate RCT-urile raportate în Archives of Disease in Childhood între 1982 și 1996 au recrutat mai puțin de 40 de copii în total.6 Studiilor atât de mici le lipsește puterea de a detecta efectele moderate ale tratamentului și prezintă un risc semnificativ de rezultate fals negative.6

Acest lucru este mai ușor de observat dacă datele studiului sunt prezentate cu o estimare punctuală a efectului, cum ar fi un risc relativ sau un odds ratio, și o măsură a preciziei, cum ar fi un interval de încredere (IC). Dacă un tratament nu are cu adevărat niciun efect, probabilitatea unui rezultat slab ar trebui să fie aceeași pentru pacienții tratați și netratați, astfel încât riscul relativ și raportul de șanse vor tinde fiecare să fie în jur de 1. În exemplul care tocmai a fost citat3, raportul de șanse pentru RDS vs. lipsa RDS între grupurile tratate și netratate este de 0,95 (3/20 împărțit la 3/19), iar IC de 95% în jurul acestuia variază între 0,17 (o reducere de 83%) și 5,21 (o creștere de 421%). Astfel, deși raportul de probabilitate este aproape de 1, acest studiu particular nu exclude nici un efect substanțial benefic, nici un efect substanțial dăunător, deoarece IC este larg. O trecere în revistă a tuturor celor 15 studii oferă un odds ratio pentru efectul steroizilor prenatali asupra SDR de 0,53,5, cu un IC de 95% mult mai restrâns (0,44 – 0,63). Cu alte cuvinte, aceasta sugerează că este probabil ca tratamentul cu steroizi antenatali să reducă șansele de apariție a SDR între 37% și 56%, un beneficiu substanțial fără echivoc, care este foarte semnificativ.

Când ar trebui cititorii să concluzioneze că un tratament chiar nu este util din punct de vedere clinic? Din nou, un IC este de ajutor și poate fi nevoie de numere surprinzător de mari. În cel de-al patrulea studiu internațional privind supraviețuirea infarctului (ISIS-4), 58 050 de pacienți cu suspiciune de infarct miocardic au fost repartizați în mod aleatoriu la sulfat de magneziu intravenos sau la placebo.7 Au existat 2216 decese și 26 795 de supraviețuitori în grupul tratat și 2103 decese și 26 936 de supraviețuitori în grupul placebo, o diferență care dă un odds ratio pentru o mortalitate crescută cu magneziu de 1,06, cu un IC 95% de la 1,00 la 1,13 (2p = 0,07). Cu alte cuvinte, magneziul, cel puțin așa cum a fost administrat în acest studiu particular, nu a fost eficient, deoarece era puțin probabil să reducă mortalitatea (și poate chiar să o fi crescut cu până la 13%). În mod similar, cititorii pot concluziona în mod fiabil că două tratamente active sunt echivalente – sau că orice diferență între ele este prea mică pentru a fi importantă din punct de vedere clinic – doar atunci când eșantionul este suficient de mare.8

Cum pot cercetătorii să conceapă RCT-uri suficient de puternice pentru a demonstra că nu există diferențe importante din punct de vedere clinic între tratament și placebo sau între două tratamente active? Acest lucru necesită o estimare prealabilă a dimensiunilor adecvate ale eșantioanelor, care poate necesita consultarea unui statistician, dar care poate fi realizată cu ușurință pentru rezultatele dihotomice (de exemplu, supraviețuire sau deces) cu ajutorul unui software precum Epi Info.9 Acest pachet software permite calcularea riscurilor relative, a rapoartelor de probabilitate și a IC 95% și poate fi descărcat gratuit de pe internet (http://www.soton.ac.uk/∼medstats/epiinfo/). Calcularea dimensiunilor eșantioanelor atunci când rezultatul este o variabilă continuă (de exemplu, tensiunea arterială sau durata șederii) este mai complicată și va necesita, aproape sigur, consultarea unui statistician. Se poate adăuga faptul că „ipoteza nulă”, în sensul că o diferență de tratament este exact egală cu 0 sau un risc relativ sau un odds ratio exact egal cu 1, nu este adesea nici plauzibilă, nici interesantă. Mult mai importantă este întrebarea dacă mărimea efectului tratamentului este suficient de mare pentru a fi de interes clinic sau suficient de mică pentru a fi ignorată. Un test de semnificație convențional (valoarea p) nu poate furniza această informație; numai un interval care acoperă valoarea reală a diferenței de tratament cu un grad de încredere cunoscut poate face acest lucru.

Mulți cercetători raportează în tabelele lor de rezultate două coloane de medii sau procente pentru brațele de control și tratate ale studiului. În primul caz, sunt incluse în mod obișnuit abaterile standard, erorile standard sau limitele de încredere pentru fiecare coloană. De fapt, mărimile de interes pentru cititor sunt diferențele dintre cele două coloane (sau cotele de probabilitate pentru procente), iar acestea ar trebui să fie întotdeauna prezentate cu erorile lor standard sau limitele de încredere. Acest lucru este deosebit de important atunci când datele implică împerecherea sau potrivirea subiecților tratați și a celor de control, ca în studiile crossover, deoarece atunci precizia diferenței nu poate fi derivată din abaterile standard individuale.

Prezentarea rezultatelor studiilor are implicații importante pentru cititori, autori, editori, referenți și pacienți. Reducerea eronată a tratamentelor ca fiind ineficiente îi va priva pe pacienți de o îngrijire mai bună. Acceptarea eronată a tratamentelor ca fiind eficiente expune pacienții la riscuri inutile și risipește resurse. Putem contribui cu toții la soluționarea acestor probleme așteptând și incluzând în mod obișnuit, în rezumatele și rapoartele studiilor, IC sau alte măsuri de precizie a estimărilor rezultatelor și precizând dacă și cum a fost calculată în prealabil dimensiunea eșantionului.10 Aceste măsuri au fost recomandate în declarația CONSORT,11 pe care Archives of Disease in Childhood a aprobat-o (a se vedea nota editorilor în referința 6). Putem, de asemenea, să proiectăm și să sprijinim studii mai mari, cu puterea de a detecta efecte moderate în mod realist, mai degrabă decât efecte prea mari în mod optimist, ale tratamentului.612 Din ce în ce mai mult, astfel de studii vor necesita o colaborare multicentrică și ar trebui să fie simple, astfel încât centrele ocupate să poată contribui fără a prelua o povară prea mare de muncă suplimentară.

Nota autorilor

Solicitarea din liniile directoare CONSORT11 ca rapoartele studiilor clinice să numere și să caracterizeze toți pacienții care nu au fost incluși în studiu impune o muncă suplimentară participanților ocupați și a fost criticată ca fiind frecvent lipsită de valoare și adesea imposibilă.13 Pare mai important să se descrie caracteristicile cheie ale pacienților atunci când sunt randomizați în studiu și să se raporteze rezultatele în subgrupuri prestabilite, astfel încât rezultatele să poată fi generalizate la alți pacienți cu caracteristici similare.

Recunoștințe

Le mulțumim lui Richard Peto și arbitrului anonim pentru comentariile utile. Grupul de Epidemiologie Perinatală face parte din Medical Research Council Health Services Research Collaboration.

    1. Chalmers I

    (1985) Propunere de scoatere în afara legii a termenului „trial negativ”. BMJ 290:1002.

    1. Altman DG,
    2. Bland MJ

    (1995) Absența dovezilor nu este o dovadă a absenței. BMJ 311:485.

  1. Parsons MT, Sobel D, Cummiskey K, Constantine L, Roitman J.Steroizi, antibiotice și tocolitice versus nici un tratament cu steroizi, antibiotice și tocolitice la pacientele cu PROM prematur la 25-32 săptămâni. Las Vegas: Proceedings of 8th annual Meeting of the Society of Perinatal Obstetricians, 1988:44:4432..

    1. Crowley PA

    (1995) Terapia antenatală cu corticosteroizi: o meta-analiză a studiilor randomizate, 1972 până în 1994. Am J Obstet Gynecol 173:322-335.

  2. Crowley P. Corticosteroizi înainte de nașterea prematură. În: A: Neilsen JP, Crowther CA, Crowther CA, Hodnett ED, Hofmeyr GJ, eds. Pregnancy and childbirth module of the Cochrane database of systematic reviews. (Biblioteca Cochrane). Update Software, 1998 (actualizat trimestrial).

    1. Campbell H,
    2. Surry SAM,
    3. Royle EM

    (1998) O analiză a studiilor controlate randomizate publicate în arhivele de boli în copilărie din 1982-96. Arch Dis Child 79:192-197.

    1. ISIS-4 (Fourth International Study of Infarct Survival) Collaborative Group

    (1995) ISIS-4: a randomised factorial trial assessing early oral captopril, oral mononitrate, and intravenous magnesium sulphate in 58 050 patients with suspected acute myocardial infarction. Lancet 345:669-685.

    1. Jones B,
    2. Jarvis P,
    3. Lewis JA,
    4. Ebbutt AF

    (1996) Trials to assess equivalence: the importance of rigorous methods. BMJ 313:36-39.

    1. Organizația Mondială a Sănătății

    (1996) Epi Info 6. (OMS, Geneva).

    1. Grant JM

    (1995) Randomised trials and the British Journal of Obstetrics and Gynaecology. Cerințe minime pentru publicare. Br J Obstet Gynaecol 102:849-850.

    1. Begg C,
    2. Cho M,
    3. Eastwood S,
    4. Horton R,
    5. Moher D,
    6. Olkin I,
    7. et al.

    (1996) Îmbunătățirea calității raportării studiilor controlate randomizate: declarația CONSORT. JAMA 276:637-639.

    1. Tarnow-Mordi WO,
    2. Brocklehurst P

    (1997) Randomised controlled trials in perinatal medicine: I. Necesitatea unor studii de mortalitate și morbiditate majoră cu o putere adecvată. Br J Obstet Gynaecol 104:763-765.

    1. Peto R

    (1996) Clinical trial reporting. Lancet 348:894-895.

Leave a Reply

Lasă un răspuns

Adresa ta de email nu va fi publicată.