Tag: testy statystyczne

Trafność testu oraz narzędzia

 

Podstawowym w statystyce zagadnieniem trafnoÅ›ci treÅ›ciowej jest zdefiniowanie badanej sfery zachowaÅ„ oraz wskazanie, iż pozycje włączone do testu stanowiÄ… faktycznie próbÄ™ reprezentatywnÄ…. Trafność teoretyczna natomiast pokazuje zwiÄ…zki narzÄ™dzia pomiarowego z konstruktem teoretycznym, zaczerpniÄ™tym z danej teorii. Badania trafnoÅ›ci teoretycznej testu wymagajÄ… licznych analiz.

 

Metody ustalania trafności

Meehl oraz Cronbach zaproponowali pięć procedur ustalania trafnoÅ›ci teoretycznej: analiza różnic miÄ™dzygrupowych, analiza macierzy korelacji i analiza czynnikowa, analiza struktury wewnÄ™trznej testu, analiza procesu rozwiÄ…zywania testu, analiza zmian nieprzypadkowych wyników testu. [1] W zwiÄ…zku ze znacznym rozbudowaniem zagadnieÅ„ poruszanych w ramach  analizy trafnoÅ›ci, poniżej skupiono siÄ™ szerzej na jednym aspekcie, mianowicie na trafnoÅ›ci czynnikowej.

 

Analizując trafność narzędzia badawczego jakim jest kwestionariusz należy mieć na uwadze cztery aspekty trafności:

  • Trafność kryterialna, dzieli siÄ™ ona na trafność diagnostycznÄ… (concurent validity)  i prognostycznÄ… (predictive validity)
  • Trafność treÅ›ciowa (content validity)
  • Trafność teoretyczna (construct validity)
  • Trafność fasadowa (face validity)[2]

Najmniejsze znaczenie z punktu widzenia własności psychometrycznych ma trafność fasadowa.

 

Czy istnieje „zÅ‚oty standard”?

DiagnostycznÄ… trafność kryterialnÄ… możemy ocenić porównujÄ…c wyniki testu do tak zwanego „zÅ‚otego standardu”. Jest to zagadnienie o tyle skomplikowane, że w niektórych dziedzinach, szczególnie tych do tej pory nie zbadanych, trudno o wskazanie tak zwanego „zÅ‚otego standardu” czyli testu sprawdzonego i wzorcowego.

 

Kiedy zasadne jest wdrożenie nowego narzędzia?

W przypadku natomiast gdy taki test już istnieje, należy poważnie rozważyć sens wprowadzania nowego narzÄ™dzia, gdyż powinno ono w pewnie sposób być lepsze od stosowanego do tej pory. Nowy test powinien być zarazem taÅ„szy lub szybszy do przeprowadzenia od wyznaczonego testu wzorcowego.

 

Analiza korelacji

W literaturze zagadnienie trafnoÅ›ci kryterialnej jest rozpatrywane (szczególnie przez psychologów) za pomocÄ… analizy korelacji pomiÄ™dzy testem wzorcowym a nowym narzÄ™dziem. W przypadku poszukiwania testu bardziej trafnego od „zÅ‚otego standardu” poszukuje siÄ™ umiarkowanej istotnej korelacji. Jest to kryterium nieformalne, w trakcie analizy literaturowej nie znaleziono bowiem sztywnego kryterium wskazujÄ…cego dokÅ‚adnÄ… regułę decyzyjnÄ….

 

[1] Tomasz Szafrański Skala Calgary do oceny depresji w schizofrenii. w Postępy Psychiatrii i Neurologii. Tom 6. 1996. Zeszyt 3. Instytut Psychiatrii I Neurologii.str. 337.

[2] Brzeziński Jerzy Metodologia badań psychologicznych. PWN Warszawa 1999. str.516

Trafność czynnikowa

 

Zasadniczym zagadnieniem tego typu trafności jest weryfikacja hipotezy o homogenności narzędzia badawczego. Od podstawowej skali (układu zmiennych) oczekuje się rozwiązania jednoczynnikowego. Analizę czynnikowa można podzielić na dwie grupy:

  • Analiza gÅ‚ównych skÅ‚adowych i klasyczna analiza czynnikowa
  • Konfirmacyjna analiza czynnikowa

 

Czym jest czynnikowa analiza danych?

Analiza czynnikowa jest to zbiór metod redukcji liczby zmiennych do kilku niezależnych czynników w oparciu o dekompozycjÄ™ macierzy wspóÅ‚czynników korelacji pomiÄ™dzy pierwotnymi pozycjami. Uzyskane w ten sposób czynniki majÄ… merytorycznÄ… interpretacjÄ™ reprezentujÄ…c zmienne, które nie sÄ… obserwowalne bezpoÅ›rednio.[1]

 

Zagadnienia analizy gÅ‚ównych skÅ‚adowych oraz klasycznej, czynnikowej analizy statystycznej sÄ… opisywane przez wielu autorów. Na uwagÄ™, poza metodami szacowania modelu analizy czynnikowej, zasÅ‚ugujÄ… zagadnienia wyboru liczby czynników oraz metody rotacji.

 

Jak dokonuje siÄ™ wyboru liczby czynników?

Wybór liczby czynników nastÄ™puje zgodnie z jednym z dwóch kryteriów: kryterium osypiska lub kryterium wartoÅ›ci wÅ‚asnej Kaizera. Po zidentyfikowaniu liczby czynników w praktyce badaÅ„ czÄ™stym zjawiskiem jest wstÄ™pna przynależność jednej pozycji (zmiennej) do kilku czynników, co utrudnia w dużym stopniu identyfikacjÄ™ ich przynależnoÅ›ci, a co za tym idzie interpretacjÄ™ czynników nowopowstaÅ‚ych.

 

Proces rotacji czynników

RozwiÄ…zaniem w takiej sytuacji jest wykonanie rotacji czynników. Jej celem jest ustalenie takiego ukÅ‚adu, aby każda pozycja miaÅ‚a wysokie Å‚adunki (w praktyce powyżej 0,5 lub 0,6) tylko w zakresie jednego czynnika. Metody rotacji dzielÄ… siÄ™ na dwie grupy:

  • Rotacje ortogonalne: Varimax, Quatrimax, Equimax. W wyniku tych rotacji zachowana zostaje niezależność czynników.
  • Rotacje ukoÅ›ne: Oblimin (Quatrimin, Biquatrimin, Covarmin), Oblimax, Promax. W wyniku rotacji ukoÅ›nej nie musi być zachowana niezależność czynników [2]

 

Model konfirmacyjnej analizy

Alternatywą do modelu klasycznego jest model konfirmacyjnej analizy czynnikowej. W metodzie tej używane są dwie grupy zmiennych: obserwowalne (czyli zmienne lub pozycje obserwowane przez badacza i odpowiednio kodowane) oraz zmienne latentne (czynniki będące konstruktami hipotetycznymi).

 

PodstawowÄ… różnicÄ… pomierzy modelem eksploracyjnej (EFA) i konfirmacyjnej analizy czynnikowej (CFA) jest to, że konfirmacyjna analiza czynnikowa to procedura hipotetyczna sÅ‚użąca gÅ‚ównie do testowania hipotez na temat relacji pomiÄ™dzy czynnikami wspólnymi. W metodzie tej (w przeciwieÅ„stwie do klasycznej analizy czynnikowej) decyzje, co do liczby czynników podejmuje siÄ™ przed rozpoczÄ™ciem ich wyodrÄ™bniania.

 

Metoda ta jest powszechnie stosowana wÅ‚aÅ›nie wtedy, gdy istniejÄ… podstawy do formuÅ‚owania hipotez na temat zwiÄ…zków pomiÄ™dzy badanymi zmiennymi. Wynik klasycznej analizy czynnikowej stanowi wÅ‚aÅ›nie ukÅ‚ad czynnikowy, który nie jest zadany przed przystÄ…pieniem do badania. W przypadku analizy psychometrycznej kluczowa jest hipoteza homogennoÅ›ci (czyli rozwiÄ…zanie jednoczynnikowe) podstawowej skali sumarycznej.[3]

 

Test chi-kwadrat

Celem zbadania, czy pojedynczy model konfirmacyjnej analizy czynnikowej jest dobrze dopasowany można posÅ‚użyć siÄ™ wskaźnikami dobroci dopasowania. Podstawowym testem dopasowania modelu do danych jest test chi-kwadrat. Test ten jest jednak silnie uzależniony od liczebnoÅ›ci próby.

 

Zastosowanie wskaźnika GFI

UzupeÅ‚niajÄ…co stosuje siÄ™ psychometryczny wskaźnik GFI (goodness of fit index) oraz jego korektrÄ™ AGFI (adjusted goodness of fit index). Wskaźniki te przyjmujÄ… wartość z przedziaÅ‚u 0-1 oraz nie sÄ… zależne od wielkoÅ›ci próby. Trudno w przypadku tych mierników (podobnie jak w przypadku wspóÅ‚czynnika determinacji dla funkcji regresji) o jednoznaczne okreÅ›lenie jakie zakresy wartoÅ›ci tych mierników sÄ… akceptowalne.

 

Wskaźnik RMR

Kolejnym miernikiem jest RMR (root mean square residual). Wysokie wartości tego wskaźnika reszt są niekorzystne dla jakości modelu (analogicznie jak odchylenie standardowe reszt modelu regresji).

 

Miernik RMSEA

Jednym z najczęściej podawanych mierników dopasowania modelu konfirmacyjnej analizy czynnikowej jest RMSEA (root mean square error of approximation). Jest to wskaźnik pojawiajÄ…cy siÄ™ na diagramie Å›cieżek po dopasowaniu modelu. Miara ta szacuje wielkość popeÅ‚nianego błędu aproksymacji w populacji. Dobre dopasowanie modelu cechuje siÄ™ wskaźnikiem RMSEA poniżej 0,05.

 

Indeksy modyfikacyjne

Dodatkowymi miernikami pomocnymi w procesie poprawy modelu są indeksy modyfikacyjne (modification indices). Pozwalają one zmierzyć o ile obniży się wartość chi-kwadrat w wyniku uwolnienia konkretnego parametru i ponownego oszacowania modelu.[4]

 

Na zakończenie

PodsumowujÄ…c syntetyczne rozważania nad możliwoÅ›ciami zastosowania oraz podstawowymi zagadnieniami zwiÄ…zanymi z modelami analizy czynnikowej należy zauważyć, iż sÄ… to metody powszechnie stosowane w naukach spoÅ‚ecznych i medycznych oraz doskonale nadajÄ… siÄ™ do badania wÅ‚asnoÅ›ci psychometrycznych skal sumarycznych. Nie podajÄ… – tak jak powszechnie stosowana metoda alfa Cronbacha – tylko pojedynczego wyniku, ale pozwalajÄ… na analizÄ™ ukÅ‚adu pozycji (zmiennych) wewnÄ…trz skali oraz odrzucenie zbÄ™dnych pytaÅ„ w kwestionariuszu.

 

[1] Gatnar E. Statystyczne modele struktury przyczynowej zjawisk ekonomicznych. AE Katowice 2003. str. 102.

[2] Gatnar E. Statystyczne modele struktury przyczynowej zjawisk ekonomicznych. AE Katowice 2003. str. 116 - 118

[3] Jerzy BrzeziÅ„ski  Metodologia badaÅ„ psychologicznych. Wybór tekstów. PWN Warszawa 2004. str. 443

[4] Jerzy BrzeziÅ„ski  Metodologia badaÅ„ psychologicznych. Wybór tekstów. PWN Warszawa 2004. str. 460-462

 

Statystyka... czyli... weryfikujemy hipotezy

Hipotetyczne zaÅ‚ożenia, a także różnego rodzaju tezy towarzyszÄ… nam na co dzieÅ„. One same jednak w swym teoretycznym aspekcie nie stanowiÄ… tak naprawdÄ™ rzetelnego źródÅ‚a informacji. Pewnych rzeczy siÄ™ domyÅ›lamy. Jeszcze inne sÄ… tylko mglistÄ… wizjÄ…. Dlatego tak ważne miejsce w naszej codziennoÅ›ci zajmuje statystyka. Nic nie weryfikuje hipotez tak skutecznie, jak ona.

 

Hipotezy nie tylko w pracach naukowych

SÅ‚yszÄ…c sÅ‚owo hipoteza najczęściej myÅ›limy o pracy naukowej. Przecież to przyszli magistrzy czy doktoranci zawierajÄ… jÄ… w swojej pracy. Tymczasem hipoteza towarzyszy nam na każdej pÅ‚aszczyźnie, która w swojej dynamice ulega ciÄ…gÅ‚emu rozwojowi. To wÅ‚aÅ›nie hipotezy, a wraz z nimi kolejne pytania sprawiajÄ…, że czÅ‚owiek szuka odpowiedzi – rozwija siÄ™ i tworzy nowe perspektywy. Hipotezy stanowiÄ… ważny czynnik rozwoju gospodarki, psychologii, medycyny, socjologii czy nawet demografii.

 

Jak zbadać hipotezę?

Hipoteza to nie choroba, którÄ… bada siÄ™ w gabinecie lekarskim i leczy za pomocÄ… odpowiednich terapii. Hipoteza to stwierdzenie, które wymaga dogłębnej analizy danych. Aby jej jednak dokonać, dane te trzeba wczeÅ›niej zebrać. A do tego sÅ‚użą odpowiednie metody statystyczne. OczywiÅ›cie na metodach tych doskonale znajÄ… siÄ™ pracownicy firm badawczych, którzy potrafiÄ… zawsze dobrać optymalne narzÄ™dzia.

 

Analiza zebranych danych

Analizy statystyczne to kolejny, po zbieraniu danych, etap badania. Gdy zbiór danych jest już gotowy, można przejść do wyciÄ…gniÄ™cia z niego konkretnej wiedzy. A to staje siÄ™ możliwe wÅ‚aÅ›nie dziÄ™ki analizom statystycznym. Ich zadaniem jest wyciÄ…gniÄ™cie wniosków i zweryfikowanie faktów oraz hipotez. Tym samym stajÄ… siÄ™ one odpowiedziÄ… na pytania odnoÅ›nie naszych zaÅ‚ożeÅ„ i stawianych na co dzieÅ„ tez.

 

Statystyka a biznes

MówiÄ…c o statystyce i jej wpÅ‚ywie na różne dziedziny naszego życia, nie możemy udawać, że nie dostrzegamy możliwoÅ›ci, jakie otwiera przed biznesem. Tutaj wykorzystywana jest ona do osiÄ…gania celów biznesowych, gÅ‚ównie zwiÄ™kszania obrotu i maksymalizacji zysku. DziÄ™ki analizom danych zebranych w trakcie badania firmy weryfikujÄ… rynek, poznajÄ… nastawienie klientów, a także ich potrzeby. Tym samym zdobywajÄ… odpowiedź na pytanie odnoÅ›nie zmian, jakie należy wprowadzić w koncepcji sprzedaży, czy kierunków, jakie należy obrać, by ostatecznie odnieść sukces.

 

Hipotezy są po to, by je weryfikować. Tylko wtedy istnieje sens ich tworzenia. A prawdziwym mistrzem w weryfikowaniu jest statystyka. Ta nauka nie pozostawia wątpliwości, ani pytań bez odpowiedzi.

Testy parametryczne i nieparametryczne

Aby uogólnić na całą populacjÄ™ wyniki badania statystycznego przeprowadzonego na próbie losowej, takiego jak np. badania Å›wiadomoÅ›ci marki, należy postawić hipotezÄ™, a nastÄ™pnie jÄ… zweryfikować. SÅ‚użą do tego testy statystyczne, które dzielimy na parametryczne i nieparametryczne.

 

Ogólnie o testach

Testów parametrycznych używa siÄ™ do oceny wartoÅ›ci parametrów dla danego rozkÅ‚adu populacji, z którego losowana jest próba. Parametrami tymi mogÄ… być Å›rednia, wariancja czy odchylenie standardowe.

Testy nieparametryczne nie wymagają założeń dotyczących rozkładu zmiennej losowej populacji. Najczęściej wykorzystywaną w nich metodą jest uporządkowanie danych i zastąpienie ich rangami.

Zazwyczaj testy parametryczne majÄ… swoje odpowiedniki wÅ›ród testów nieparametrycznych. Niektóre z nich prezentuje poniższa tabela.

 

test parametryczny

test nieparametryczny

test t-Studenta dla prób zależnych

test Wilcoxona

test t-Studenta dla prób niezależnych

test Manna-Whitney’a

jednoczynnikowa analiza wariancji

test Kruskala-Wallisa

 

Często stosowane są także inne testy nieparametryczne, takie jak test Chi kwadrat oraz test Shapiro-Wilka.

 

Charakterystyka testów parametrycznych

Parametryczne testy pozwalajÄ… na dokÅ‚adniejsze analizy i ich wyniki sÄ… Å‚atwiejsze do interpretowania. WymagajÄ… jednak speÅ‚nienia wiÄ™kszej iloÅ›ci zaÅ‚ożeÅ„. Najczęściej wymaga siÄ™ miÄ™dzy innymi, by próba pochodziÅ‚a z populacji o rozkÅ‚adzie normalnym. Symulacje pokazaÅ‚y jednak, że niespeÅ‚nienie tego warunku nie musi dyskwalifikować testu. Co wiÄ™cej w przypadku wielu badaÅ„ statystycznych zaÅ‚ożenie to jest speÅ‚nione. Testy parametryczne sÄ… także mniej odporne na obserwacje odstajÄ…ce.

 

Charakterystyka testów nieparametrycznych

Dla testów nieparametrycznych nie jest wymagane speÅ‚nienie zaÅ‚ożenia o rozkÅ‚adzie normalnym. Gdy liczność próby jest niewielka lub grupy nie sÄ… równoliczne, to testy nieparametryczne lepiej siÄ™ sprawdzajÄ…. Nie sÄ… też tak wrażliwe na obserwacje odstajÄ…ce. Warto z nich korzystać, gdy mediana jest wielkoÅ›ciÄ… lepiej reprezentujÄ…cÄ… Å›rodek danych niż Å›rednia. WÅ›ród testów nieparametrycznych znajdziemy takie, które pozwalajÄ… analizować cechy niemierzalne. Wygoda ich użycia okupiona jest mniejszÄ… efektywnoÅ›ciÄ….

 

Podsumowanie

Prowadzenie badaÅ„ statystycznych w medycynie czy naukach spoÅ‚ecznych bardzo czÄ™sto sprowadza siÄ™ do wykonania testu istotnoÅ›ci – parametrycznego lub nieparametrycznego. Od prawidÅ‚owego wyboru zależeć może poprawność i dokÅ‚adność wnioskowania. Niestety, decyzja nie zawsze jest Å‚atwa do podjÄ™cia.

Testowanie hipotez w statystyce medycznej (cz. 1)

Analityka statystyczna sprzyja weryfikacji, tj. potwierdzaniu lub obalaniu, pewnych przyjÄ™tych hipotez. Nie inaczej jest także w zakresie statystyki medycznej - tutaj również proces analiz pozwala odnosić siÄ™ do brzmienia rozpatrywanych hipotez, a jego ogólny schemat przedstawić można nastÄ™pujÄ…co, w postaci 5 kluczowych etapów:

  • formuÅ‚owanie hipotezy zerowej oraz przeciwnej do niej hipotezy alternatywnej, która podlegać bÄ™dzie badaniu i weryfikacji;
  • gromadzenie danych do analizy;
  • oszacowanie wartoÅ›ci okreÅ›lonej dla hipotezy zerowej tzw. statystyki testu;
  • porównanie uzyskanej wartoÅ›ci statystyki testu z wartoÅ›ciami wykazanymi w znanych rozkÅ‚adach prawdopodobieÅ„stwa;
  • interpretacja wyników i wyciagniÄ™cie wniosków.

 

Podstawowe kwestie z dziedziny statystyki, z których to czerpie statystyka medyczna w zakresie testowania hipotez omówione zostanÄ… pokrótce w dalszej części opracowania.

 

Definiowanie hipotez

Jak podczas typowych badaÅ„ statystycznych, tak i analizy o charakterze medycznym sprowadzajÄ… siÄ™ do testu hipotezy zerowej (H0), która zakÅ‚ada na ogóÅ‚ brak oddziaÅ‚ywania/zachodzenia rozpatrywanego zjawiska w badanej populacji. Gdy hipoteza ta nie jest prawdziwa - siłą rzeczy zachodzi hipoteza alternatywna (H1) - odnosi siÄ™ one co do zasady bezpoÅ›rednio do teorii, która zamierzamy objąć badaniem i jest przeciwieÅ„stwem hipotezy H0.

 

Uzyskiwanie statystyki testowej i wartoÅ›ci „p”

Weryfikacja hipotez wymaga uzyskania dla nich tzw. statystyki testu - odbywa się to w oparciu o zgromadzone dane liczbowe i podstawienie ich do wzoru zdefiniowanego dla używanego testu. Odzwierciedla on co do zasady siłę zawartego w zabranych danych dowodu statystycznego przeciwko przyjętej hipotezie zerowej (H0) - większą wartość utożsamia się zwykle z silniejszym dowodem.

 

Co istotne, dostÄ™pne statystyki testowe wpisujÄ… siÄ™ w powszechnie stosowane rozkÅ‚ady czÄ™stoÅ›ci. Pole w ogonach rozpatrywanego/rozpatrywanych rozkÅ‚adów prawdopodobieÅ„stwa, łączÄ…ce w swoisty sposób wartość uzyskanej ze statystyki testu z samym rozkÅ‚adem, jest tzw. wartość „p”. Definiuje siÄ™ jÄ… jako prawdopodobieÅ„stwo otrzymania wyników w sytuacji, gdy zaÅ‚ożona hipoteza zerowa jest prawdziwa.

 

Z reguÅ‚y im  mniejsza wartość „p”, tym silniejszy jest dowód za odrzuceniem hipotezy zerowej - za dowód wystarczajÄ…cy przyjmuje siÄ™ wartość „p” na poziomie niższym niż 0,05, co daje wyniki o istotnoÅ›ci rzÄ™du 5% (wartość „p” wiÄ™ksza lub równa 0,05 nie stanowi powodu do odrzucenia hipotezy zerowej - wyniki okreÅ›lamy jednak jako nieistotne na poziomie 5%). Należy jednak mieć na uwadze, że wybór puÅ‚apu 5% (0,05) uważa siÄ™ za arbitralny - w sytuacji groźnych nastÄ™pstw odrzucenia/przyjÄ™cia hipotezy zerowej (mowa wszak o problematyce medyczne i zdrowiu oraz życiu ludzkim), możemy domagać siÄ™ by statystyka medyczna opieraÅ‚a siÄ™ o silniejsze dowody, tj. ustalenia wartoÅ›ci „p” na poziomie 0,01 lub 0,001.

 

Testowanie nieparametryczne

Korzystanie z znanych rozkÅ‚adów prawdopodobieÅ„stwa, któremu podlegajÄ… zebrane dane,  okreÅ›la siÄ™ jako testowanie parametryczne. W sytuacji, gdy zadane dane nie speÅ‚niajÄ… zaÅ‚ożeÅ„ tego typu testów, odwoÅ‚ać siÄ™ należy do testów nieparametrycznych, które majÄ… zastosowanie niezależnie od postaci rozkÅ‚adu. Ten typ testów jest szczególnie ważny w przypadku prób maÅ‚o licznych lub ujÄ™cia danych w postaci „kategorialnej”.

 

MajÄ…c do wyboru nie tylko różne formy test, ale i same testy, warto przemyÅ›leć, który z nich użyć - wybór uzależnia siÄ™ zasadniczo o od projektu badawczego, typu zadanej me innej i samego rozkÅ‚adu czÄ™stoÅ›ci.

 

Przedział ufności

Kolejnym ważnym zagadnieniem w testowaniu hipotez, jakie uwzglÄ™dnia statystyka medyczna w procesie analiz, jest kwestia przedziaÅ‚u ufnoÅ›ci. SÄ… one nierozerwalnie złączone z testowaniem hipotez, gdyż kwantyfikujÄ… interesujÄ…ce analityka wyniki i pozwalajÄ… na uzyskanie ich klinicznych aplikacji. W swoisty sposób przedziaÅ‚y ufnoÅ›ci okreÅ›lajÄ… wiarygodność uzyskanych wyników - jeżeli hipotetyczna wartość wyniku wykracza poza przyjÄ™ty przedziaÅ‚ ufnoÅ›ci, Å›wiadczy to o jego niskiej wiarygodnoÅ›ci i prowadzi do odrzucenia hipotezy zerowej H0.

 

Błędy w testowaniu hipotez

TytuÅ‚em podsumowania, nawiÄ…zujÄ…c do przedziaÅ‚ów ufnoÅ›ci czy przyjÄ™cia wartoÅ›ci „p”, zasygnalizować należy, że przyjÄ™cie lub odrzucenie hipotezy zerowej/alternatywnej może być błędne. WÄ…tek ten omówiony zostanie w odrÄ™bnym opracowaniu, warto jednak wskazać, że błędy takie mogÄ… wykazywać kilka rodzajów:

  • błąd pierwszego rodzaju to odrzucenie hipotezy zerowej, gdy w rzeczywistoÅ›ci jest on a prawdziwa;
  • błąd drugiego rodzaju to nieodrzucenie hipotezy zerowej w sytuacji, gdy jest ona nieprawdziwa.

 

Każdy z tych błędów wymaga odpowiedniej procedury postÄ™powania w sytuacji jego wykrycia.

Czytaj część drugą artykułu

Testowanie hipotez w statystyce medycznej (cz. 2)

Z racji na poruszanÄ… problematykÄ™, statystyka medyczna koncentruje siÄ™ na ogóÅ‚ na testowaniu hipotez skupiajÄ…cych siÄ™ na porównywaniu zbiorowisk ludzi, które narażone sÄ… na różne czynniki chorobotwórcze. Hipotezy nawiÄ…zujÄ… zatem do efektów czy wyników leczenia - np. hipoteza zerowa H0 stwierdza brak efektów danej terapii, zaÅ› przeciwna do niej hipoteza alternatywna H1 podkreÅ›la wystÄ…pienie pewnych efektów kuracji.

 

Jak wiadomo, testowanie hipotez to podejmowanie decyzji - odrzucimy hipotezÄ™ H0 na korzyść H1 lub nie. Każda decyzja niesie ze sobÄ… jednak pewne ryzyko omyÅ‚ki, nawet mimo zachowania dokÅ‚adnoÅ›ci procedury testowej czy doboru optymalnych parametrów testu. Każdy taki błąd niesie pewne nastÄ™pstwa - analityka statystyki medycznej nawiÄ…zuje wszak do, jak akcentowano na wstÄ™pie, problematyki zdrowia czy życia ludzkiego.

 

Wyróżnia siÄ™ dwa rodzaje błędów, jakie popeÅ‚nić może analityk:

  • błąd pierwszego rodzaju - jest to sytuacja odrzucenia prawdziwej hipotezy H0;
  • błąd drugiego rodzaju - nieodrzucenie nieprawdziwej hipotezy H0.

 

 

Odrzuć  H0

Nie odrzucaj H0

H0 prawdziwa

Błąd I rodzaju

Brak błędu

H0 fałszywa

Brak błędu

Błąd II rodzaju

 

Błąd pierwszego rodzaju

Błąd pierwszego rodzaju to taki, który wiąże siÄ™ z odrzucenie hipotezy zerowej (H0) w sytuacji, gdy tak naprawdÄ™ jest ona prawdziwa - przyjÄ™ta zostaje wtedy nieprawdziwa hipoteza alternatywna H1.

Maksymalne prawdopodobieństwo omyłki pierwszego rodzaju określa się symbolem alfa, tj. poziomem istotności testu.

 

Statystyka medyczna, jak każda inno formuła analityki statystycznej, zakłada przyjęcie wielkości alfa jeszcze przed zgromadzeniem danych - z reguły jest to wartość na poziomie 0,05 (bardziej restrykcyjne są wartości niższe, a mniej - niższe).

 

Co istotne, odwoÅ‚ujÄ…c siÄ™ do zasad testowania hipotez zauważyć należy, że odrzucenie hipotezy H0 nastÄ™puje gdy wartość „p” naszego testu jest niższa niż przyjÄ™ty poziom istotnoÅ›ci ów testu - tylko ta sytuacja stwarza zatem szanse na popeÅ‚nienie błędu pierwszego rodzaju.

 

Błąd drugiego rodzaju

Błąd drugiego rodzaju to z kolei taki, który wiąże siÄ™ z nie odrzuceniem hipotezy zerowej (H0) w sytuacji, gdy tak naprawdÄ™ jest ona faÅ‚szywa - odrzucona zostaje wtedy prawdziwa hipoteza alternatywna H1.

 

Maksymalne prawdopodobieÅ„stwo omyÅ‚ki pierwszego rodzaju okreÅ›la siÄ™ symbolem beta, które powiÄ…zane jest z tzw. mocÄ… testu. Moc testu, okreÅ›lana jako 1 - beta, stanowi prawdopodobieÅ„stwo odrzucenia faÅ‚szywej hipotezy H0 i rzadko przyjmuje wartość 100%.

 

Moc testu

Moc testu jest wielkoÅ›ciÄ…, którÄ… silnie powiÄ…zana jest z problematykÄ… testowania hipotez, a którÄ… można kontrolować - statystyka medyczna wyróżnia bowiem czynniki, które ksztaÅ‚tujÄ… moc stosowanych w niej testów.

 

ZwiÄ™kszanie mocy testu warto rozpocząć od ustalenia jej poziomu  już na etapie planowania samej analizy statystycznej - uważa siÄ™, ze warto podjąć siÄ™, gdy wiemy, ze moc testu jest duża (80%), gdyż za nieodpowiedzialne i nieekonomiczne uznaje siÄ™ podejmowanie kuracji w sytuacji, gdy sama szansa na wykrycie jego efektów jest nikÅ‚a.

 

Czynniki warunkujÄ…ce moc testu, a zatem zasadność samej analizy, to w szczególnoÅ›ci:

  • wielkość badanej próby - szacuje siÄ™, ze moc testu roÅ›nie wraz z liczebnoÅ›ciÄ… próby, tj. dostÄ™pnoÅ›ciÄ… danych do analizy;
  • zmienność obserwacji - przyjmuje siÄ™, że moc testu wzrasta, gdy zmienność obserwacji maleje, tj. gdy obserwacje wykazujÄ… stosunkowo staÅ‚y charakter;
  • wielkość pożądanego efektu - test ma wiÄ™ksze szanse wykrycia wiÄ™kszych efektów, zatem przyjmuje siÄ™,  że im wiÄ™kszy jest efekt, którego oczekujemy tym wiÄ™ksza jest tez moc testu;
  • poziom istotnoÅ›ci - moc testu wzrasta wraz z poziomem jego istotnoÅ›ci, przy czym wiÄ™ksze szanse na wykrycie poszukiwanego efektu daje przyjÄ™cie w realizowanej statystyce medycznej jako znaczÄ…cej wartoÅ›ci „p” na poziomie 0,05 niż 0,01.

 

Ocena czy dana moc testu jest wystarczajÄ…ca odbywa siÄ™ poprzez badanie przedziaÅ‚ów ufnoÅ›ci dla rozpatrywanych wyników - niewielka wielkość próby i/lub duża zmienność obserwacji sprzyjajÄ… poszerzeniu przedziaÅ‚ów ufnoÅ›ci, tj. obniżeniu mocy testu.

 

Wielokrotność testów

Niejednokrotnie na jednym zbiorze danych prowadzi siÄ™ wiÄ™kszÄ… liczbÄ™ testów istotnoÅ›ci. Przyjmuje siÄ™, że liczba porównaÅ„ zwiÄ™ksza szanse na popeÅ‚nienie błędu pierwszego stopnia - zaleca siÄ™ zatem, by skupić siÄ™ na realizacji niewielkiej liczby testów, odnoszÄ…cych siÄ™ do pierwotnych i ustalonych „a priori” celów.

Czytaj część pierwszą artykułu

Biostat. More than statistics.

ul. Kowalczyka 17
44-206 Rybnik

Tel: (+48) 32 42 21 707
Tel. kom.: (+48) 668 300 664
e-mail: biuro@biostat.com.pl

Sondaże Analizy danych