Testowanie hipotez w statystyce medycznej (cz. 2)
Z racji na poruszanÄ… problematykÄ™, statystyka medyczna koncentruje siÄ™ na ogóÅ‚ na testowaniu hipotez skupiajÄ…cych siÄ™ na porównywaniu zbiorowisk ludzi, które narażone sÄ… na różne czynniki chorobotwórcze. Hipotezy nawiÄ…zujÄ… zatem do efektów czy wyników leczenia - np. hipoteza zerowa H0 stwierdza brak efektów danej terapii, zaÅ› przeciwna do niej hipoteza alternatywna H1 podkreÅ›la wystÄ…pienie pewnych efektów kuracji.
Jak wiadomo, testowanie hipotez to podejmowanie decyzji - odrzucimy hipotezÄ™ H0 na korzyść H1 lub nie. Każda decyzja niesie ze sobÄ… jednak pewne ryzyko omyÅ‚ki, nawet mimo zachowania dokÅ‚adnoÅ›ci procedury testowej czy doboru optymalnych parametrów testu. Każdy taki błąd niesie pewne nastÄ™pstwa - analityka statystyki medycznej nawiÄ…zuje wszak do, jak akcentowano na wstÄ™pie, problematyki zdrowia czy życia ludzkiego.
Wyróżnia siÄ™ dwa rodzaje błędów, jakie popeÅ‚nić może analityk:
- błąd pierwszego rodzaju - jest to sytuacja odrzucenia prawdziwej hipotezy H0;
- błąd drugiego rodzaju - nieodrzucenie nieprawdziwej hipotezy H0.
|
Odrzuć H0 |
Nie odrzucaj H0 |
H0 prawdziwa |
Błąd I rodzaju |
Brak błędu |
H0 fałszywa |
Brak błędu |
Błąd II rodzaju |
Błąd pierwszego rodzaju
Błąd pierwszego rodzaju to taki, który wiąże siÄ™ z odrzucenie hipotezy zerowej (H0) w sytuacji, gdy tak naprawdÄ™ jest ona prawdziwa - przyjÄ™ta zostaje wtedy nieprawdziwa hipoteza alternatywna H1.
Maksymalne prawdopodobieństwo omyłki pierwszego rodzaju określa się symbolem alfa, tj. poziomem istotności testu.
Statystyka medyczna, jak każda inno formuła analityki statystycznej, zakłada przyjęcie wielkości alfa jeszcze przed zgromadzeniem danych - z reguły jest to wartość na poziomie 0,05 (bardziej restrykcyjne są wartości niższe, a mniej - niższe).
Co istotne, odwoÅ‚ujÄ…c siÄ™ do zasad testowania hipotez zauważyć należy, że odrzucenie hipotezy H0 nastÄ™puje gdy wartość „p” naszego testu jest niższa niż przyjÄ™ty poziom istotnoÅ›ci ów testu - tylko ta sytuacja stwarza zatem szanse na popeÅ‚nienie błędu pierwszego rodzaju.
Błąd drugiego rodzaju
Błąd drugiego rodzaju to z kolei taki, który wiąże siÄ™ z nie odrzuceniem hipotezy zerowej (H0) w sytuacji, gdy tak naprawdÄ™ jest ona faÅ‚szywa - odrzucona zostaje wtedy prawdziwa hipoteza alternatywna H1.
Maksymalne prawdopodobieÅ„stwo omyÅ‚ki pierwszego rodzaju okreÅ›la siÄ™ symbolem beta, które powiÄ…zane jest z tzw. mocÄ… testu. Moc testu, okreÅ›lana jako 1 - beta, stanowi prawdopodobieÅ„stwo odrzucenia faÅ‚szywej hipotezy H0 i rzadko przyjmuje wartość 100%.
Moc testu
Moc testu jest wielkoÅ›ciÄ…, którÄ… silnie powiÄ…zana jest z problematykÄ… testowania hipotez, a którÄ… można kontrolować - statystyka medyczna wyróżnia bowiem czynniki, które ksztaÅ‚tujÄ… moc stosowanych w niej testów.
ZwiÄ™kszanie mocy testu warto rozpocząć od ustalenia jej poziomu już na etapie planowania samej analizy statystycznej - uważa siÄ™, ze warto podjąć siÄ™, gdy wiemy, ze moc testu jest duża (80%), gdyż za nieodpowiedzialne i nieekonomiczne uznaje siÄ™ podejmowanie kuracji w sytuacji, gdy sama szansa na wykrycie jego efektów jest nikÅ‚a.
Czynniki warunkujÄ…ce moc testu, a zatem zasadność samej analizy, to w szczególnoÅ›ci:
- wielkość badanej próby - szacuje siÄ™, ze moc testu roÅ›nie wraz z liczebnoÅ›ciÄ… próby, tj. dostÄ™pnoÅ›ciÄ… danych do analizy;
- zmienność obserwacji - przyjmuje się, że moc testu wzrasta, gdy zmienność obserwacji maleje, tj. gdy obserwacje wykazują stosunkowo stały charakter;
- wielkość pożądanego efektu - test ma wiÄ™ksze szanse wykrycia wiÄ™kszych efektów, zatem przyjmuje siÄ™, że im wiÄ™kszy jest efekt, którego oczekujemy tym wiÄ™ksza jest tez moc testu;
- poziom istotnoÅ›ci - moc testu wzrasta wraz z poziomem jego istotnoÅ›ci, przy czym wiÄ™ksze szanse na wykrycie poszukiwanego efektu daje przyjÄ™cie w realizowanej statystyce medycznej jako znaczÄ…cej wartoÅ›ci „p” na poziomie 0,05 niż 0,01.
Ocena czy dana moc testu jest wystarczajÄ…ca odbywa siÄ™ poprzez badanie przedziaÅ‚ów ufnoÅ›ci dla rozpatrywanych wyników - niewielka wielkość próby i/lub duża zmienność obserwacji sprzyjajÄ… poszerzeniu przedziaÅ‚ów ufnoÅ›ci, tj. obniżeniu mocy testu.
Wielokrotność testów
Niejednokrotnie na jednym zbiorze danych prowadzi siÄ™ wiÄ™kszÄ… liczbÄ™ testów istotnoÅ›ci. Przyjmuje siÄ™, że liczba porównaÅ„ zwiÄ™ksza szanse na popeÅ‚nienie błędu pierwszego stopnia - zaleca siÄ™ zatem, by skupić siÄ™ na realizacji niewielkiej liczby testów, odnoszÄ…cych siÄ™ do pierwotnych i ustalonych „a priori” celów.