Testowanie hipotez w statystyce medycznej (cz. 2)

Testowanie hipotez w statystyce medycznej (cz. 2)

Z racji na poruszaną problematykę, statystyka medyczna koncentruje się na ogół na testowaniu hipotez skupiających się na porównywaniu zbiorowisk ludzi, które narażone są na różne czynniki chorobotwórcze. Hipotezy nawiązują zatem do efektów czy wyników leczenia - np. hipoteza zerowa H0 stwierdza brak efektów danej terapii, zaś przeciwna do niej hipoteza alternatywna H1 podkreśla wystąpienie pewnych efektów kuracji.

 

Jak wiadomo, testowanie hipotez to podejmowanie decyzji - odrzucimy hipotezę H0 na korzyść H1 lub nie. Każda decyzja niesie ze sobą jednak pewne ryzyko omyłki, nawet mimo zachowania dokładności procedury testowej czy doboru optymalnych parametrów testu. Każdy taki błąd niesie pewne następstwa - analityka statystyki medycznej nawiązuje wszak do, jak akcentowano na wstępie, problematyki zdrowia czy życia ludzkiego.

 

Wyróżnia się dwa rodzaje błędów, jakie popełnić może analityk:

  • błąd pierwszego rodzaju - jest to sytuacja odrzucenia prawdziwej hipotezy H0;
  • błąd drugiego rodzaju - nieodrzucenie nieprawdziwej hipotezy H0.

 

 

Odrzuć  H0

Nie odrzucaj H0

H0 prawdziwa

Błąd I rodzaju

Brak błędu

H0 fałszywa

Brak błędu

Błąd II rodzaju

 

Błąd pierwszego rodzaju

Błąd pierwszego rodzaju to taki, który wiąże się z odrzucenie hipotezy zerowej (H0) w sytuacji, gdy tak naprawdę jest ona prawdziwa - przyjęta zostaje wtedy nieprawdziwa hipoteza alternatywna H1.

Maksymalne prawdopodobieństwo omyłki pierwszego rodzaju określa się symbolem alfa, tj. poziomem istotności testu.

 

Statystyka medyczna, jak każda inno formuła analityki statystycznej, zakłada przyjęcie wielkości alfa jeszcze przed zgromadzeniem danych - z reguły jest to wartość na poziomie 0,05 (bardziej restrykcyjne są wartości niższe, a mniej - niższe).

 

Co istotne, odwołując się do zasad testowania hipotez zauważyć należy, że odrzucenie hipotezy H0 następuje gdy wartość „p” naszego testu jest niższa niż przyjęty poziom istotności ów testu - tylko ta sytuacja stwarza zatem szanse na popełnienie błędu pierwszego rodzaju.

 

Błąd drugiego rodzaju

Błąd drugiego rodzaju to z kolei taki, który wiąże się z nie odrzuceniem hipotezy zerowej (H0) w sytuacji, gdy tak naprawdę jest ona fałszywa - odrzucona zostaje wtedy prawdziwa hipoteza alternatywna H1.

 

Maksymalne prawdopodobieństwo omyłki pierwszego rodzaju określa się symbolem beta, które powiązane jest z tzw. mocą testu. Moc testu, określana jako 1 - beta, stanowi prawdopodobieństwo odrzucenia fałszywej hipotezy H0 i rzadko przyjmuje wartość 100%.

 

Moc testu

Moc testu jest wielkością, którą silnie powiązana jest z problematyką testowania hipotez, a którą można kontrolować - statystyka medyczna wyróżnia bowiem czynniki, które kształtują moc stosowanych w niej testów.

 

Zwiększanie mocy testu warto rozpocząć od ustalenia jej poziomu  już na etapie planowania samej analizy statystycznej - uważa się, ze warto podjąć się, gdy wiemy, ze moc testu jest duża (80%), gdyż za nieodpowiedzialne i nieekonomiczne uznaje się podejmowanie kuracji w sytuacji, gdy sama szansa na wykrycie jego efektów jest nikła.

 

Czynniki warunkujące moc testu, a zatem zasadność samej analizy, to w szczególności:

  • wielkość badanej próby - szacuje się, ze moc testu rośnie wraz z liczebnością próby, tj. dostępnością danych do analizy;
  • zmienność obserwacji - przyjmuje się, że moc testu wzrasta, gdy zmienność obserwacji maleje, tj. gdy obserwacje wykazują stosunkowo stały charakter;
  • wielkość pożądanego efektu - test ma większe szanse wykrycia większych efektów, zatem przyjmuje się,  że im większy jest efekt, którego oczekujemy tym większa jest tez moc testu;
  • poziom istotności - moc testu wzrasta wraz z poziomem jego istotności, przy czym większe szanse na wykrycie poszukiwanego efektu daje przyjęcie w realizowanej statystyce medycznej jako znaczącej wartości „p” na poziomie 0,05 niż 0,01.

 

Ocena czy dana moc testu jest wystarczająca odbywa się poprzez badanie przedziałów ufności dla rozpatrywanych wyników - niewielka wielkość próby i/lub duża zmienność obserwacji sprzyjają poszerzeniu przedziałów ufności, tj. obniżeniu mocy testu.

 

Wielokrotność testów

Niejednokrotnie na jednym zbiorze danych prowadzi się większą liczbę testów istotności. Przyjmuje się, że liczba porównań zwiększa szanse na popełnienie błędu pierwszego stopnia - zaleca się zatem, by skupić się na realizacji niewielkiej liczby testów, odnoszących się do pierwotnych i ustalonych „a priori” celów.

Biostat. More than statistics.

ul. Kowalczyka 17
44-206 Rybnik

Tel: (+48) 32 42 21 707
Tel. kom.: (+48) 668 300 664
e-mail: biuro@biostat.com.pl

24h Sondaż Profesjonalne analizy statystyczne