Randomizowane i podwójnie zaślepione… o co chodzi?
Zalewani jesteśmy informacjami typu: mleko może powodować raka (bo komórki pewnych nowotworów w laboratorium rosną na mleku jak na drożdżach), wynaleziono lek na raka (bo wiele myszy wyleczono, podając im pewną substancję). Te newsy mają źródło w badaniach naukowych, ale zachowajmy ostrożność w formułowaniu kategorycznych sądów. Trzeba wiedzieć, jak odczytać doniesienia naukowe.
Język nauk biomedycznych jest na tyle trudny, że mało kto bez specjalistycznego przygotowania jest w stanie zrozumieć artykuł opublikowany w medycznym czasopiśmie naukowym.
I nie wynika to wyłącznie z faktu, że w większości przypadków najlepsze czasopisma wydawane są w języku angielskim. Autorzy publikacji posługują się tak skomplikowanym słownictwem, że artykuł przedstawiający wyniki ich pracy przypomina zaszyfrowaną wiadomość. Laikowi trudno jest ocenić, czy autor miał rację, czy też nie, oraz czego w istocie dowiódł.
Ważne jest by od początku pamiętać, że uzyskanie określonego rezultatu w laboratorium na hodowlach komórkowych nie oznacza, podobnych wyników badań na zwierzętach, a nawet jeśli tak, to nie znaczy to automatycznie, że takie same będą u ludzi. Co więcej, nawet jeśli dana substancja działa w małej grupie ludzi, nie zawsze będzie wykazywała taki sam efekt u większej. To dlatego w olbrzymiej liczbie publikacji naukowych autorzy piszą, że odkryli pewne zjawisko, które trzeba nadal badać, i to w wielu kierunkach oraz na wiele sposobów.
Jest jeszcze kilka innych czynników, na które warto zwracać uwagę, czytając wyniki badań naukowych w dziedzinie nauk biomedycznych, a także artykuły popularno-naukowe, które powstały na bazie naukowych doniesień.
Poprawność metodologiczna
Poprawność metodologiczna badania, czyli to, w jaki sposób je zaprojektowano i przeprowadzono, ma fundamentalny wpływ na rzetelność i wiarygodność otrzymanych wyników. W przypadku artykułu popularno-naukowego wprowadzone skróty i uproszczenia nie dadzą nam szansy na samodzielną ocenę, czy próba była przeprowadzona poprawnie pod względem wymagań naukowych i etycznych.
Warto jednak pamiętać, że wszystkie szanujące się czasopisma, które publikują oryginalne prace badawcze, korzystają z pomocy recenzentów, czyli specjalistów w danej dziedzinie, którzy oceniają publikację bez znajomości jej autora lub ośrodka, z którego pochodzi. Takie postępowanie daje rękojmię, że prezentowana publikacja jest wolna od błędów mogących zafałszować wyniki.
Popularno-naukowy artykuł przygotowany na podstawie recenzowanej publikacji będzie zatem zawierał równie wiarygodne i rzetelne informacje, tyle, że przedstawione w bardziej przystępny sposób.
Wykluczenie przypadkowości
W badaniach biomedycznych ogromną rolę przypisuje się kwestii wykluczenia przypadkowości otrzymanych wyników. W wielu sytuacjach sprowadza się to do konieczności powtórzenia próby, najlepiej przez inny zespół badawczy, i otrzymania takich samych lub co najmniej podobnych wyników.
Może się bowiem okazać (i tak się wiele razy zdarzało), że dane uzyskane przez jednego badacza były pod względem losowym zupełnie wyjątkowe i nie odpowiadały wynikom badań na całej populacji.
Z czego to wynika? Przecież o tym, że łabędzie są białe, wiemy tylko dlatego, że nie udało się znaleźć żadnego, który miałby inny kolor. A co by było, gdybyśmy nie wiedząc, jak wyglądają te ptaki, trafili na brzydkie kaczątko? Czy na tej podstawie mielibyśmy uznać, że wszystkie łabędzie są szare? W przypadku prób klinicznych związanych z nowymi metodami diagnostyki i terapii taka generalizacja może drogo kosztować.
Dlatego dopiero spójne wyniki otrzymane przez inny zespół, a najlepiej - zespoły badaczy - pozwalają na wyciągnięcie wniosków zmieniających sposób leczenia czy postępowania diagnostycznego. Zanim to nie nastąpi, nowe doniesienie jest traktowane jak pierwsza jaskółka, która wszakże wiosny nie czyni.
Badania z udziałem ludzi, prowadzone na zwierzętach i próby laboratoryjne
Czytając artykuły naukowe dotyczące leczenia i diagnozowania chorób powinniśmy zwracać baczną uwagę, jak prowadzone były badania i kto lub co w nich uczestniczyło. W niektórych przypadkach nawet badania przeprowadzone w laboratoryjnych próbówkach mogą dostarczyć ciekawych danych dotyczących sposobu leczenia ludzi, jednak generalna zasada mówi, że w przypadku leków najbardziej wiarygodne są badania przeprowadzone na grupie chorych. Mniejszą wagę przypisuje się wynikom prób, w których uczestniczyli zdrowi ochotnicy.
Badania prowadzone na zwierzętach stanowią nieodzowny element programu badań i rozwoju nowych leków, ale należy pamiętać, że jedynie około 70 proc. danych uzyskanych w testach na zwierzętach potwierdza się później u człowieka. Ogromna część pozostałych wyników to informacje fałszywie negatywne – badany lek albo nie działa u zwierząt lub też działa szkodliwie, a tym samym nigdy nie będzie podany ludziom. Gdybyśmy podjęli jednak takie ryzyko, nie da się wykluczyć, że u ludzi lek nie tylko byłby skuteczny, ale też nie powodowałby żadnych efektów ubocznych.
Niektóre wyniki mogą być fałszywie pozytywne – badany produkt leczy zwierzęta laboratoryjne i nie powoduje u nich działań niepożądanych, ale jego podanie ludziom wcale nie potwierdza tych obserwacji. Innymi słowy: leczy myszy, ale nie ludzi.
Badacze do testów z udziałem ludzi podchodzą bardzo ostrożnie, by nie narazić uczestników badań na zbyt duże ryzyko. Zatem jeśli przeczytamy, że naukowcy odkryli nowy lek, który rzekomo stanowi przełomową terapię, ale do tej pory nie zaczęli badań z udziałem ludzi, to bądźmy sceptyczni wobec takiego doniesienia. To, czy jest to rzeczywiście przełomowa terapia, okaże się po kilku latach badań prowadzonych najpierw na zdrowych ochotnikach, a potem na osobach chorujących na dolegliwość.
Jeszcze mniejsze zaufanie do „przełomowości” jakiejś substancji miejmy w odniesieniu do sytuacji, gdy została sprawdzona wyłącznie na hodowlach komórek.
Hierarchia ważności doniesień naukowych
Ze względu na ogromną liczbę różnego rodzaju metod badawczych, zarówno eksperymentalnych jak i tych o typie analitycznym czy opisowym, powstało wiele klasyfikacji określających hierarchię ważności doniesień naukowych na kształtowanie się zaleceń dotyczących diagnostyki i terapii. Najbardziej wiarygodne dowody płyną z systematycznej analizy wyników otrzymanych z kilku wcześniej przeprowadzonych badań eksperymentalnych o następujących kryteriach:
- z losowym doborem metody leczenia (randomizacją), kiedy prowadzący badanie naukowiec nie może wpływać na decyzję, czy dany uczestnik otrzyma leczenie standardowe, czy testowany produkt;
- odpowiednim porównaniem między grupami (odpowiednia grupa kontrolna, nie otrzymująca testowanej substancji, i eksperymentalna – otrzymująca badaną substancję);
- ukryciem informacji o stosowanym typie terapii zarówno przed badaczem, jak i uczestnikiem badania (podwójnie ślepa próba: innymi słowy ani badacz nie wie, która z badanych osób dostaje lek testowany, ani badany nie wie, czy dostaje testowany lek, czy np. placebo czy inny lek stosowany w danej chorobie).
Mniej wiarygodne są pojedyncze badania, szczególnie, jeśli były przeprowadzone na niewielkich grupach chorych, oraz próby, które prowadzone były bez randomizacji i/lub bez zaślepienia metody leczenia. Udowodniono bowiem, że np. wiedza badanego i badacza o tym, jaką substancję otrzymuje konkretna osoba, zafałszowuje wyniki.
Jeszcze mniejszą wagę przywiązuje się do badań obserwacyjnych typu analitycznego oraz badań opisowych, gdzie jedynie opisuje się historię nowatorskiego zastosowania leku u jednego pacjenta lub nawet serię takich przypadków, ale bez porównania z grupą chorych leczonych inną metodą.
Tego typu próby nie pozwalają bowiem na wyciągnięcie ostatecznych wniosków, która metoda leczenia jest lepsza.
Najmniej zaś wiarygodne są opinie ekspertów niepoparte żadnymi dowodami płynącymi z przeprowadzonych badań, a jedynie oparte na teoretycznej ocenie działania leku wynikającej z doświadczeń klinicznych autora.
Natrafiając na doniesienia naukowe, które wydają się być ze sobą sprzeczne, zwracajmy uwagę, w jaki sposób autorzy uzyskali przedstawiane wyniki. Dla przykładu: małe badania prowadzone bez randomizacji czy zaślepienia wykazują niekiedy skuteczność homeopatii, magnetoterapii czy refleksoterapii szczególnie w odniesieniu do placebo. Jednak w dużych próbach klinicznych prowadzonych według najwyższych standardów nigdy nie udało się udowodnić, że którakolwiek z metod alternatywnej terapii jest skuteczniejsza niż leczenie oparte na standardach medycyny zachodniej.
Ruch antyszczepionkowy: wybiórcze podawanie informacji
Inaczej rzecz się ma w przypadku szczepień. Istnieje ogromna liczba doniesień z poprawnie przeprowadzonych badań klinicznych, które wskazują na jednoznacznie pozytywny stosunek korzyści wynikających ze szczepień w stosunku do ryzyka, jakie może się z nimi wiązać. Przeciwnicy szczepień posługują się zaś zwykle incydentalnymi opisami zachorowań, które według nich zostały wywołane przez szczepionki, ale dla których naukowymi metodami nie można znaleźć związku przyczynowo-skutkowego.
Choć nikt w wiarygodny sposób nie udowodnił, że istnieje związek między szczepieniami a wystąpieniem autyzmu, to wiele osób jest o tym przekonanych tylko dlatego, że widziała wypowiedzi zrozpaczonych rodziców wiążących pierwsze objawy autyzmu ze szczepieniem, jakie przeszło ich dziecko. Z punktu widzenia hierarchii ważności dowodów, na podstawie których można zmieniać sposób postępowania, takie stwierdzenia znajdują się niezmiernie nisko.
Fazy badania klinicznego
Jeśli w doniesieniu dotyczącym skuteczności i bezpieczeństwa nowej terapii podana jest faza badania klinicznego, to ogólna zasada mówi, że im późniejsza faza, tym większy jest wpływ wyników badania na kształtowanie zaleceń dotyczących leczenia.
Wynika to z prostej zależności, że w I fazie badań klinicznych zazwyczaj uczestniczą zdrowi ochotnicy, a w fazie II stosunkowo niewielka liczba osób chorych. Dopiero III faza badań klinicznych prowadzona jest na tyle dużych grupach, by można było wyciągnąć wnioski dla całej populacji osób dotkniętych daną chorobą.
Punkty końcowe badania
Punkty końcowe badania określają, w jaki sposób oceniano skuteczność danej terapii czy interwencji medycznej.
Badacze mają szereg możliwości sprawdzenia, czy dany lek jest skuteczny i bezpieczny. Najbardziej wiarygodne są te, które w bezdyskusyjny sposób wskazują, czy lek działa, czy nie (jak np. policzenie osób, które zostały wyleczone i od zakończenia terapii przeżyły pięć lat bez nawrotów choroby w porównaniu do tych, którym się to nie udało). Tego typu punkty końcowe nazywamy twardymi.
Miękkie punkty końcowe także wskazują na powodzenie terapii, ale nie muszą się one przekładać na przedłużenie życia lub zwiększenie odsetka wyleczeń. Dla przykładu: ustąpienie gorączki może być objawem skuteczności leczenia antybiotykiem, ale gorączka jest tylko jednym z objawów rozwijającego się zakażenia bakteryjnego i jej ustąpienie wcale nie musi świadczyć o zupełnym wyleczeniu, niewątpliwie jednak poprawia jakość życia chorego.
Porównując wyniki dwóch badań zawsze warto zwrócić uwagę, które z nich wiązało się z obserwacją twardych punktów końcowych, jak śmierć osób leczonych, zachorowania lub wyleczenia, jakość życia podczas terapii czy wystąpienie działań niepożądanych badanego produktu leczniczego.
Długość badania i porównanie (z placebo lub standardem terapii)
Ogólna zasada mówi, że im dłuższe badanie, tym bardziej rzetelnych dowodów dostarcza na temat ocenianej terapii. Co do porównania, to nikogo chyba nie zdziwi fakt, że o wiele bardziej wiarygodna jest ocena bezpieczeństwa i skuteczności danej terapii w porównaniu do standardowo stosowanego leczenia niż w odniesieniu do placebo. Ponieważ zakładamy, że placebo nie jest skuteczne w leczeniu, to nowy lek, który jest niewiele lepszy od placebo, jest też tyle samo warty, co kapsułki zawierające wyłącznie cukier.
Istotność statystyczna i istotność kliniczna
Naukowcy umówili się, że uznają za wiarygodne badania, w których wartość p była mniejsza niż 0,05. Oznacza to 5 proc. ryzyko, że otrzymane wyniki zostały uzyskane zupełnie przypadkowo i na liczbę uzyskanych wyleczeń miała wpływ np. specyficzna pogoda, konstelacja gwiazd lub inne zdarzenie, które się może nie powtórzyć.
W wielu badaniach postawiona teza zostaje udowodniona z pewnością przewidującą jedynie 1 promil ryzyka, że otrzymane wyniki zostały uzyskane przypadkowo. Takie wyniki są pewne pod względem statystycznym.
Ważne natomiast jest, by były również istotne pod względem klinicznym. Cóż bowiem po leku na nadciśnienie, który pod względem statystycznym udowodnił swoją skuteczność (tzn. badanie osiągnęło wartość p<0,05), ale w grupie 100 chorych badany produkt obniżył średnie ciśnienie tętnicze zaledwie o 0,7 mm Hg. Taki efekt jest zupełnie nieistotny pod względem klinicznym, gdyż obniżenie ciśnienia o taką wartość nie przekłada się na zmniejszenie liczby udarów, zawałów czy przypadków niewydolności serca. Z klinicznego punktu widzenia stosowanie takiego leku nie ma zatem żadnego uzasadnienia.
Dr n. med. Wojciech Masełbas
Specjalista farmakologii klinicznej