Wiele nieporozumień, interpretacji wyników wynika z braku zrozumienia korelacji i przyczyny.
Korelacja to związek między dwiema zmiennymi losowymi X i Y.
Brzmi strasznie, ale spokojnie.
To oznacza, że jeśli znasz jedną wartość (np. X) to możesz przewidzieć tą drugą (np. Y).
Ale to może być przypadek!
Dziwna korelacja
Gdy spojrzymy na poniższy wykres ewidentnie widzimy, że gdy jedna zmienna maleje to i druga. gdy jedna rośnie to i druga – jest korelacja (0,6).
Tak się składa, że dane przedstawiają ilość filmów w których grał Nicolas Cage w danym roku oraz ilość osób która utonęła w basenach w USA.
Czy naprawdę myślisz, że Nicolas Cage jest odpowiedzialny?
A taka?
Ciekawe.
Mam nadzieję, że już zapamiętasz, że zależność (korelacja) nie musi oznaczać przyczyny!
Różne zaskakujące wykresy korelacji znajdzisz na www.tylervigen.com. (Polecam)
Czy to silna zależność?
Współczynnik korelacji występuje w zakresie od -1 przez 0 do +1.
- 0 – oznacza brak korelacji,
- 1 – idealna dodatnia korelacja:
gdy jedna zmienna rośnie, to druga również, gdy maleje, to druga również, - -1 idealna negatywna korelacja:
gdy jedna zmienna rośnie to druga – odwrotnie – maleje
To wartości idealne, ale jaka wartość oznacza silną korelację?
To pytanie w stylu: Ile pieniędzy to dużo. To znaczy: ile badaczy – tyle opini.
Jedni uważają, ze silna koralacja zaczyna się od 0,5 inni, że od 0,6 jeszcze inni 0.79.
Zazwyczaj przyjmuje się wartości;
- 0,0 – 0,2 brak korelacji
- 0,2 – 0,4 słaba, można powiedzieć, że bez związku,
- 0,4 – 0,6 korelacja umiarkowana (zależność istotna),
- 0,6 – 0,8 – korelacja wysoka (zależność znaczna),
- 0,8 – 0,9 korelacja bardzo wysoka (zależność bardzo duża),
- 0,9 – 1,0 praktycznie pełna zależność.
Gdy wartość jest ujemna, to po prostu zależność jest odwrotna.
Ale pamiętaj:
Sila korelacja nie oznacza, że jeden czynnik wpływa na drugą!
Gdy mamy silną korelację
Faktycznie: zmienna A zmienia na zmienną B
Jak nie masz taryfy 'no-limit’, to im dłużej gadasz przez telefon tym wyższy masz rachunek.
Zmienna B wpływa na zmienną A (druga zmienna wpływa na pierwszą).
Zauważyłe, że gdy ludzie chodzą z parasolami to pada deszcze.
Mamy korelację, jednak fakt, że ludzie otwierają parasole nie wpływa na to, że pada deszcze.
Jednak deszcz wpływa na to czy ludzie wezmą i użyją parasolu czy nie.
Zmienna A wpływa na B i B na A
Większy budżet na reklamę (A) zwiększa sprzedaż (B), większa sprzedaż (B) większy budżet na reklamę (A).
Istnieje inna zmianna C która wpływa na A i B
Wyobraź sobie: Jest lato, ludzie jedzą lody (zmianna A) i częściej wchodzą do wody (zmienna B).
Można by pomyśleć, że im więcej ludzie będą jedli lodów tym częściej będą wchodzić do wody.
Faktycznie zimą mniej jedzą lodów i mniej osób wchodzi do wody (korelacja).
Jednak naszą rozwiązaniem naszej korelacji jest inna zmienna: C – temperatura.
Gdy jest ciepło ludzie chętniej jedzą lody i wchodzą do wody.
Gdy jest zimno mniej chętnie jedzą lody i niechętnie wchodzą do wody.
Korelacja jest przypadkowa
Ilość osób które utonęły w .. kontra ilość filmów w których grał Nicolas Cage.
Konsekwencje
Załóżmy, że amerykańscy naukowcy odkryli, korelację jasności w pokoju od zużycia prądu.
Myśląc logicznie. Jeśli podłączymy więcej żarówek, które zużywają prąd, wtedy jest jaśniej w pokoju.
Czyli ewidentnie jasność w pokoju zależy od ilości prądu.
ALE,
korelacja nie oznacza przyczyny
Czyli jeśli zasłonisz czymś żarówki, to w pomieszczeniu będzie ciemniej, jednak faktycznie nie zmniejszy to zużycia prądu!
Czasem trzeba zweryfikować, czy coś faktycznie jest przyczyną, czy podąża?
Czasem testująć zmieniamy jednak wiele zmiennych, przez co możemy dojść do błędnego wniosku.
Realne konsekwencje
Interesuje mnie tematyka zdrowia.
Uznanie czegoś za przyczynę, może mieć złe konsekwencje!
Sen
Badania wskazują, że osoby śpące krócej, żyją dłużej.
W takiej sytuacji, wpadasz na pomysł 'będę spać krócej’.
Super, jednak uważam, że po prostu ludzi zdrowi potrzebują mniej snu!
Tu nie chodzi o przeziębienie, ale o różnego rodzaju obciążenia od stanów zapalnych, po np grzybicę :D.
Mam kolegę który potrzebował spać po 10h i dalej był zmęczony. Po pewnych zmianach okazało się, że 6h wystarczy.
A z kolei deprywacja snu wiąże się ze zwiększeniem ryzyka wielu chorób.
Ops nie znaleziono artykułuZły cholesterol
Chyba każdy wie, że cholesterol jest zły.
Jednak czy na pewno?
By zapobiec chorobom sercowo naczyniowym, używa się czasem statyn (leków obniżających cholesterol).
Jednak cholesterol nie jest przyczyną.
Dlatego obniżanie nie pomaga, co sugerują np. badania: [1] [2] [3] [4] [5].
Współzależność – to nie takie proste
Zaobserwowane przez naukowcow korelacja, może być przyczyną, ALE nie jedyną.
Zazwyczaj dany cel (efekt) można osiągnąć różnymi metodami.
Czasem kilka warunków musi wystąpić, by dane zjawisko wystąpiło!
Korelacja: wilgoć – śnieg
Gdy jest sucho – nie ma deszczu ani śniegu.
Gdy jest wilgotno – może padać deszcz, może padać śnieg.
Korelacja: zimno – śnieg
Gdy jest ciepło – może padać deszcze lub nie.
Gdy jest zimno – może padać śnieg lub nie.
Jednak by spadł śnieg – musi być zimno i wilgotno!
Przyczyna, to czasem więcej niż jedno zdarzenie/czynnik
Współzależność – realnie
DNA
Odkryto DNA, w mediach mówiono kiedyś o sklonowanej owcy, teraz się mówi o GMO, czy metodzie CRISPR.
W międzyczasie wydano miliardy na zbadanie ludzkiego genomu i … okazało się, że niewiele z tego wynika.
Wiele osób wierzy przecenia istotę genów.
Uważa, że jeśli mamy niepożądaną mutację danego genu w DNA, to już koniec.
Dlatego są osoby które np. są w stanie amputować sobie zdrową pierś, bo statystycznie mają większe ryzyko choroby.
Skoro mówię już o nowotworach, to np. badania na adoptowanych dzieciach mówią, że występuje większa korelacja nowotworów z prawnymi opiekunami niż z rodzicami biologicznymi! (co sugeruje, że bardziej chodzi o środowisko, nawyki, niż samo biologiczne predyspozycje w tym nasze DNA)
Warto jednak wiedzieć, że DNA ma znaczenie, ale może odpowiada za 20% potencjalnych problemów, na resztę mamy wpływ!
Warto wiedzieć, że gen, jest jak plik na komputerze.
Dopóki go nie uruchomisz nic się nie dzieje. To znaczy musi dość do tak zwanej ekspresji genu. A za ekspresję genu odpowiadają czynnik środowiskowe na które często masz wpływ!
Tym zajmuje się tak zwana epigenetyka.
Podsumowanie
Korelacja i przyczyna to nie to samo.
Korelacja może sugerować, przyczynę, ale nie musi
Pamiętaj o współzależności