Rozlišování mezi „žádnými důkazy o účinku“ a „důkazy o žádném účinku“ v randomizovaných kontrolovaných studiích a jiných srovnáních | Archives of Disease in Childhood

Pokud soud neodsoudí obžalovaného kvůli neúplným důkazům, zakládá to jeho nevinu nade vší pochybnost? Ne nutně. Ve Skotsku totiž platí, že pokud přetrvává dostatečná nejistota, může soud místo rozsudku „nevinen“ vynést rozsudek „neprokázáno“. Pokud randomizovaná kontrolovaná studie (RCT) neprokáže významný rozdíl mezi léčbou a kontrolní skupinou, dokazuje to, že léčba nemá žádný užitečný klinický účinek? Opět ne nutně. Léčba může fungovat, ale studie to nemusela prokázat.1 Přesto může být mnoho takových „negativních“ studií,12 včetně mnoha publikovaných v tomto časopise, mylně považováno za důkaz, že léčba není klinicky užitečná.

Například v RCT u žen s rizikem předčasného porodu, která nebyla publikována jako úplná zpráva,3 se syndrom dechové tísně (RDS) vyskytl u tří z 23 dětí narozených v léčené skupině a u tří z 22 dětí narozených v neléčené skupině. Tento rozdíl není významný (2p > 0,9). Kdyby se jednalo o první a jedinou studii této léčby, mohlo by mnoho lidí usoudit, že není účinná, a ztratit tak zájem. Ve skutečnosti přehledy této3 a nejméně 14 dalších studií nakonec ukázaly, že léčba – prenatální steroidy – je vysoce účinná, protože snížila RDS a novorozeneckou úmrtnost u více než 3500 předčasně narozených dětí přibližně o polovinu.45 Všimněte si, že výsledky jediné studie byly s tímto zjištěním zcela konzistentní.3 Správný závěr z této jediné studie není, že prenatální steroidy nefungují, ale že studie neměla dostatečnou sílu k tomu, aby zjistila cokoli jiného než nejmarkantnější efekt léčby. Přibližně polovina všech RCT uvedených v Archives of Disease in Childhood v letech 1982-1996 zahrnovala celkem méně než 40 dětí.6Tak malé studie nemají dostatečnou sílu k odhalení mírných účinků léčby a nesou s sebou značné riziko falešně negativních výsledků.6

To je snadněji vidět, pokud jsou údaje ze studie prezentovány s bodovým odhadem účinku, jako je relativní riziko nebo poměr šancí, a mírou přesnosti, jako je interval spolehlivosti (CI). Pokud léčba skutečně nemá žádný účinek, pravděpodobnost špatného výsledku by měla být stejná pro léčené i neléčené pacienty, takže relativní riziko a poměr šancí budou mít tendenci být přibližně 1. V právě citovaném příkladu3 je poměr šancí pro RDS vs. žádný RDS mezi léčenou a neléčenou skupinou 0,95 (3/20 děleno 3/19) a 95% CI kolem něj se pohybuje mezi 0,17 (snížení o 83 %) a 5,21 (zvýšení o 421 %). Ačkoli se tedy poměr šancí blíží 1, tato konkrétní studie nevylučuje ani podstatně příznivý, ani podstatně škodlivý účinek, protože CI je široký. Přehled všech 15 studií uvádí poměr šancí pro účinek předporodních steroidů na RDS 0,53,5 s mnohem užším 95% CI (0,44 až 0,63). Jinými slovy z toho vyplývá, že léčba antenatálními steroidy pravděpodobně snižuje pravděpodobnost výskytu RDS o 37 % až 56 %, což je jednoznačně podstatný přínos, který je vysoce významný.

Kdy by měli čtenáři dojít k závěru, že léčba skutečně není klinicky užitečná? Opět je užitečný CI a může být zapotřebí překvapivě velkých čísel. Ve čtvrté mezinárodní studii přežití po infarktu (ISIS-4) bylo 58 050 pacientům s podezřením na infarkt myokardu náhodně přiděleno intravenózní podávání síranu hořečnatého nebo placeba.7 V léčené skupině bylo 2216 úmrtí a 26 795 přeživších a v placebové skupině 2103 úmrtí a 26 936 přeživších, což je rozdíl, který dává poměr šancí pro zvýšenou úmrtnost s hořčíkem 1,06 s 95% CI 1,00 až 1,13 (2p = 0,07). Jinými slovy, hořčík, alespoň tak, jak byl podáván v této konkrétní studii, nebyl účinný, protože pravděpodobně nesnížil úmrtnost (a dokonce ji mohl zvýšit až o 13 %). Podobně mohou čtenáři spolehlivě dojít k závěru, že dvě aktivní léčby jsou rovnocenné – nebo že jakýkoli rozdíl mezi nimi je příliš malý na to, aby byl klinicky významný – pouze tehdy, když je vzorek dostatečně velký.8

Jak mohou výzkumníci navrhnout RCT dostatečně silné, aby prokázaly, že mezi léčbou a placebem nebo mezi dvěma aktivními léčbami neexistují žádné klinicky významné rozdíly? To vyžaduje předchozí odhad vhodné velikosti vzorku, což může vyžadovat konzultaci se statistikem, ale lze to snadno provést pro dichotomické výsledky (například přežití nebo úmrtí) pomocí softwaru, jako je Epi Info.9 Tento softwarový balík umožňuje výpočet relativních rizik, poměrů šancí a 95% CI a lze jej zdarma stáhnout z internetu (http://www.soton.ac.uk/∼medstats/epiinfo/). Výpočet velikosti vzorku, pokud je výsledkem spojitá proměnná (například krevní tlak nebo délka pobytu), je složitější a téměř jistě bude vyžadovat konzultaci se statistikem. Lze dodat, že „nulová hypotéza“ v tom smyslu, že rozdíl v léčbě je přesně roven 0 nebo relativní riziko či poměr šancí přesně roven 1, není často ani věrohodná, ani zajímavá. Daleko důležitější je otázka, zda je velikost léčebného účinku dostatečně velká, aby byla klinicky zajímavá, nebo dostatečně malá, aby se ignorovala. Běžný test významnosti (hodnota p) tuto informaci poskytnout nemůže; může ji poskytnout pouze rozsah, který pokrývá skutečnou hodnotu rozdílu v léčbě se známou spolehlivostí.

Mnoho zkoušejících uvádí ve svých tabulkách výsledků dva sloupce průměrů nebo procent pro kontrolní a léčenou část studie. V prvním případě se běžně uvádějí směrodatné odchylky, směrodatné chyby nebo meze spolehlivosti pro každý sloupec. Ve skutečnosti jsou pro čtenáře zajímavé rozdíly mezi oběma sloupci (nebo poměry šancí pro procenta) a ty by měly být vždy uvedeny se standardními chybami nebo mezemi spolehlivosti. To je důležité zejména v případě, že údaje zahrnují párování nebo porovnávání léčených a kontrolních subjektů, jako je tomu u křížových studií, protože pak nelze přesnost rozdílu odvodit z jednotlivých směrodatných odchylek.

Prezentace výsledků studií má důležité důsledky pro čtenáře, autory, editory, recenzenty a pacienty. Nesprávné znehodnocení léčby jako neúčinné připraví pacienty o lepší péči. Nesprávné přijetí léčby jako účinné vystavuje pacienty zbytečnému riziku a plýtvá zdroji. Všichni můžeme přispět k řešení těchto problémů tím, že budeme očekávat a rutinně uvádět CI nebo jiné míry přesnosti odhadů výsledků v souhrnech a zprávách o studiích a předem uvádět, zda a jak byla vypočtena velikost vzorku.10 Tato opatření byla doporučena v prohlášení CONSORT,11 které Archives of Disease in Childhood schválilo (viz poznámka editorů v odkazu 6). Můžeme také navrhovat a podporovat větší studie, které mají sílu odhalit spíše realisticky mírné než příliš optimisticky velké účinky léčby.612 Takové studie budou stále častěji vyžadovat spolupráci více center a měly by být jednoduché, aby zaneprázdněná centra mohla přispět, aniž by na sebe vzala příliš velkou zátěž práce navíc.

Poznámka autorů

Požadavek v pokynech CONSORT11 , aby zprávy o klinických studiích počítaly a charakterizovaly všechny pacienty, kteří nebyli do studie zahrnuti, ukládá zaneprázdněným účastníkům další práci a byl kritizován jako často málo přínosný a často nemožný.13 Zdá se, že důležitější je popsat klíčové charakteristiky pacientů při randomizaci do studie a uvést výsledky v předem specifikovaných podskupinách, aby bylo možné výsledky zobecnit na další pacienty s podobnými charakteristikami.

Poděkování

Děkujeme Richardu Petovi a anonymnímu recenzentovi za užitečné připomínky. Perinatální epidemiologická skupina je součástí Medical Research Council Health Services Research Collaboration.

    1. Chalmers I

    (1985) Proposal to outlaw the term „negative trial“. BMJ 290:1002.

    1. Altman DG,
    2. Bland MJ

    (1995) Absence důkazu není důkazem absence. BMJ 311:485.

  1. Parsons MT, Sobel D, Cummiskey K, Constantine L, Roitman J. Steroidní, antibiotická a tokolytická léčba versus žádná steroidní, antibiotická a tokolytická léčba u pacientek s předčasně narozeným PROM ve 25.-32. týdnu. Las Vegas: Proceedings of the 8th annual Meeting of the Society of Perinatal Obstetricians, 1988:44:4432.

    1. Crowley PA

    (1995) Antenatal corticosteroid therapy: a meta-analysis of the randomized trials, 1972 to 1994. Am J Obstet Gynecol 173:322-335.

  2. Crowley P. Corticosteroids prior to preterm delivery. In: Zprávy o porodu: Neilsen JP, Crowther CA, Hodnett ED, Hofmeyr GJ, eds. Pregnancy and childbirth module of the Cochrane database of systematic reviews [Těhotenství a porod – modul Cochranovy databáze systematických přehledů]. (Cochrane library). Update Software, 1998 (aktualizováno čtvrtletně).

    1. Campbell H,
    2. Surry SAM,
    3. Royle EM

    (1998) Přehled randomizovaných kontrolovaných studií publikovaných v archivech dětských nemocí v letech 1982-96. Arch Dis Child 79:192-197.

    1. ISIS-4 (Fourth International Study of Infarct Survival) Collaborative Group

    (1995) ISIS-4: randomizovaná faktorová studie hodnotící časný perorální kaptopril, perorální mononitrát a intravenózní síran hořečnatý u 58 050 pacientů s podezřením na akutní infarkt myokardu. Lancet 345:669-685.

    1. Jones B,
    2. Jarvis P,
    3. Lewis JA,
    4. Ebbutt AF

    (1996) Trials to assess equivalence: the importance of rigorous methods. BMJ 313:36-39.

    1. Světová zdravotnická organizace

    (1996) Epi Info 6. (WHO, Ženeva).

    1. Grant JM

    (1995) Randomised trials and the British Journal of Obstetrics and Gynaecology. Minimální požadavky na publikaci. Br J Obstet Gynaecol 102:849-850.

    1. Begg C,
    2. Cho M,
    3. Eastwood S,
    4. Horton R,
    5. Moher D,
    6. Olkin I,
    7. et al.

    (1996) Zlepšení kvality podávání zpráv o randomizovaných kontrolovaných studiích: prohlášení CONSORT. JAMA 276:637-639.

    1. Tarnow-Mordi WO,
    2. Brocklehurst P

    (1997) Randomised controlled trials in perinatal medicine: I. Potřeba studií mortality a závažné morbidity s odpovídající silou. Br J Obstet Gynaecol 104:763-765.

    1. Peto R

    (1996) Clinical trial reporting. Lancet 348:894-895.

Leave a Reply

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.