Załóżmy, że obawiasz się, że możesz
mieć rzadką chorobę . Decydujesz się zrobić test. Poprawność wyników badań dla
tej choroby jest na poziomie 99% (innymi słowy, jeśli masz chorobę , to test
potwierdzi to z 99% prawdopodobieństwem , a jeśli nie masz, test również ujawni
ten fakt z prawdopodobieństwem 99%). Załóżmy, że choroba ta występuje dość
rzadko – statystycznie ma ją 1 na 10 000 osób.
Jeśli wynik
Twojego testu okaże się pozytywny, jakie jest prawdopodobieństwo, że
rzeczywiście masz tę chorobę?
a) 0.99,
b) 0.90,
c) 0.10,
d) 0.01?
Zaskakujące,
ale odpowiedź d), czyli mniej niż 1%, jest odpowiedzią prawidłową!
Jak to możliwe?
Powodem
otrzymania tak niespodziewanego wyniku jest fakt, że choroba ta jest niezwykle
rzadka i liczba fałszywie pozytywnych testów znacznie przewyższa liczbę osób,
które rzeczywiście są chore. Żeby lepiej dostrzec, w czym rzecz, rozważmy
przypadek zbiorowości miliona osób. Wtedy, około 100 osób będzie cierpiało na
omawianą chorobę, zaś 99 osób spośród nich zostanie poprawnie zdiagnozowanych.
Z drugiej strony, 999 900 osób okaże się zdrowych, jednak około 9999 z nich
uzyska fałszywie pozytywne wyniki testów. Zatem, jeśli Twój test dał wynik
pozytywny, prawdopodobieństwo, że rzeczywiście jesteś chory, wynosi 99/(99+9999),
czyli około 0,0098 – mniej niż 1%!
Nieco matematyki
Ten
niezwykły wynik można w dość prosty sposób wyjaśnić za pomocą Twierdzenia
Bayesa. Pozwolę je sobie zacytować za Wikipedią:
„Twierdzenie Bayesa (od nazwiska Thomasa
Bayesa) to twierdzenie teorii prawdopodobieństwa, wiążące prawdopodobieństwa warunkowe zdarzeń A|B oraz B|A.
Na przykład jeśli A jest zdarzeniem „u pacjenta występuje wysoka
gorączka”, a Bjest
zdarzeniem „pacjent ma grypę”, twierdzenie Bayesa pozwala przeliczyć znany
odsetek gorączkujących wśród chorych na grypę P(A|B) i
znane odsetki gorączkujących P(A) i chorych na grypę P(B)
w całej populacji, na prawdopodobieństwo, że ktoś jest chory na grypę, gdy
wiemy, że ma wysoką gorączkę P(B|A).”
Istotne jest
także, że P(A|B)=P(A)P(B|A) / P(B).
W naszym
przypadku, zdarzenie A będzie
opisywało sytuację, gdy masz wspomnianą chorobę, zaś zdarzenie B – że wynik Twojego testu jest
pozytywny. Zatem P(B|~A) jest
prawdopodobnieństwem testu fałszywie pozytywnego, czyli stwierdzającego, że
masz chorobę, podczas gdy faktycznie jesteś zdrowy.
Policzmy:
P(B|A)=0.99,
P(A)=0.0001,
zaś P(B)
policzymy z następującego wzoru:
P(B)=P(B|A)P(A)+P(B|~ A)P(~ A)
Po podstawieniu wartości otrzymamy:
or 0.99*0.0001+0.01*0.9999.
Stąd otrzymane prawdopodobieństwo jest mniejsze niż 1%.
0 komentarze:
Prześlij komentarz