Czy warto bać się wirusa ebola, ptasiej grypy lub choroby szalonych krów?

Leave a Comment


Załóżmy, że obawiasz się, że możesz mieć rzadką chorobę . Decydujesz się zrobić test. Poprawność wyników badań dla tej choroby jest na poziomie 99% (innymi słowy, jeśli masz chorobę , to test potwierdzi to z 99% prawdopodobieństwem , a jeśli nie masz, test również ujawni ten fakt z prawdopodobieństwem 99%). Załóżmy, że choroba ta występuje dość rzadko – statystycznie ma ją 1 na 10 000 osób.
Jeśli wynik Twojego testu okaże się pozytywny, jakie jest prawdopodobieństwo, że rzeczywiście masz tę chorobę?



a) 0.99,
b) 0.90,
c) 0.10,
d) 0.01?

Zaskakujące, ale odpowiedź d), czyli mniej niż 1%, jest odpowiedzią prawidłową!

Jak to możliwe?

Powodem otrzymania tak niespodziewanego wyniku jest fakt, że choroba ta jest niezwykle rzadka i liczba fałszywie pozytywnych testów znacznie przewyższa liczbę osób, które rzeczywiście są chore. Żeby lepiej dostrzec, w czym rzecz, rozważmy przypadek zbiorowości miliona osób. Wtedy, około 100 osób będzie cierpiało na omawianą chorobę, zaś 99 osób spośród nich zostanie poprawnie zdiagnozowanych. Z drugiej strony, 999 900 osób okaże się zdrowych, jednak około 9999 z nich uzyska fałszywie pozytywne wyniki testów. Zatem, jeśli Twój test dał wynik pozytywny, prawdopodobieństwo, że rzeczywiście jesteś chory, wynosi 99/(99+9999), czyli około 0,0098 – mniej niż 1%!

Nieco matematyki

Ten niezwykły wynik można w dość prosty sposób wyjaśnić za pomocą Twierdzenia Bayesa. Pozwolę je sobie zacytować za Wikipedią:
„Twierdzenie Bayesa (od nazwiska Thomasa Bayesa) to twierdzenie teorii prawdopodobieństwa, wiążące prawdopodobieństwa warunkowe zdarzeń  A|B  oraz B|A. Na przykład jeśli A jest zdarzeniem „u pacjenta występuje wysoka gorączka”, a Bjest zdarzeniem „pacjent ma grypę”, twierdzenie Bayesa pozwala przeliczyć znany odsetek gorączkujących wśród chorych na grypę P(A|B) i znane odsetki gorączkujących P(A) i chorych na grypę P(B) w całej populacji, na prawdopodobieństwo, że ktoś jest chory na grypę, gdy wiemy, że ma wysoką gorączkę P(B|A).”
Istotne jest także, że P(A|B)=P(A)P(B|A) / P(B).

W naszym przypadku, zdarzenie A będzie opisywało sytuację, gdy masz wspomnianą chorobę, zaś zdarzenie B – że wynik Twojego testu jest pozytywny. Zatem P(B|~A) jest prawdopodobnieństwem testu fałszywie pozytywnego, czyli stwierdzającego, że masz chorobę, podczas gdy faktycznie jesteś zdrowy.

Policzmy:
P(B|A)=0.99,
P(A)=0.0001,
zaś P(B) policzymy z następującego wzoru:

P(B)=P(B|A)P(A)+P(B|~ A)P(~ A)
Po podstawieniu wartości otrzymamy:

or 0.99*0.0001+0.01*0.9999. Stąd otrzymane prawdopodobieństwo jest mniejsze niż 1%.
 

0 komentarze:

Prześlij komentarz