Kada iš koreliacijos galime spręsti apie priežastingumą?

April 2, 2021

Tęsiame ciklą, kur paprastais pavyzdžiais paaiškiname kertines duomenų analizės sąvokas. Šįkart kalbėsime apie koreliaciją ir priežastingumą.

Įrašas ilgas, ir susideda iš šių dalių:

Priežastiniai teiginiai
Klausimas, kurį reikėtų užduoti pamačius priežastinį teiginį
Metodai ir jų pagrįstumas
Norintiems paskaityti plačiau

Priežastiniai teiginiai

Teiginiai apie priežastingumą skiriasi nuo tiesiog „aprašomųjų“ teiginių (angliškai: causal vs descriptive statement).

Dažniausiai iš duomenų norime gauti priežastines įžvalgas, nes pagal jas galime imtis kažkokių veiksmų. Tuo pačiu, tokie teiginiai reikalauja gerokai daugiau prielaidų.

Palyginkime šiuos teiginius:

Vaikai, kurių namuose daugiau knygų, turi geresnius mokslo pasiekimus
Pasikeitė kompanijos vadovas ir pagerėjo rodikliai
Įmonės, kurios sprendimus priima remdamosis duomenimis, turi geresnius rodiklius
Dienomis, kai geriu daugiau kavos, būnu geresnės nuotaikos

Su šiais teiginiais:

Jeigu nupirksim daugiau knygų, vaiko mokslo pasiekimai pagerės
Rodikliai pagerėjo, dėl to, kad pasikeitė kompanijos vadovas
Jeigu sprendimus priimsime remdamiesi duomenimis, įmonės rezultatai pagerės
Kava pagerina nuotaiką

Pirmos grupės teiginiai yra tiesiog „aprašomieji“. Jiems didelių prielaidų nereikia: ar vidurkiai skiriasi ar ne, tiesiog galima palyginti iš duomenų. Tiesa, prieš darant net ir „aprašomąjį“ teiginį, reikėtų patikrinti ar skirtumai yra didesni nei imties matavimo paklaida, tai yra - ar jie statistiškai reikšmingi (žr. praeitą straipsnį).

Antros grupės teiginiai yra daug „stipresni“. Juos vadiname „priežastiniais teiginiais“. Priežastiniai teiginiai visada turi „kas būtų, jei kažką darytume kitaip“ elementą.

Priežastinis teiginys: „rodikliai pagerėjo DĖL vadovo pakeitimo“, yra tapatus teiginiui: „jei vadovas nebūtų pasikeitęs, nebūtų pagerėję“. Tai yra, kad būtent vadovo pakeitimas buvo lemiantis veiksnys, o ne kažkokie išoriniai faktoriai.

Praktikoje, priežastiniai teiginiai (jeigu jie pagrįsti!) yra daug vertingesni, nes jie gali atsakyti, ką turime daryti, kad kažkas pasikeistų į norimą pusę. Tačiau vien iš duomenų savaime priežastinių išvadų daryti negalime.

Duomenys visada yra aprašomieji, o priežastinėms išvadoms reikia papildomų prielaidų. Toliau pakalbėsime, kada tokios išvados daugiau arba mažiau pagrįstos.

Klausimas prieš darant priežastinę išvadą

Prieš darant priežastinę išvadą, tai yra, iš teiginio:

Vaikai, kurių namuose daugiau knygų, turi geresnius mokslo pasiekimus

Pereinant prie teiginio:

Jeigu nupirksim daugiau knygų, vaiko mokslo pasiekimai pagerės

Universalus klausimas, kurį visada reikėtų užduoti yra:

Ar yra kitų veiksnių, kurie gali paaiškinti stebimą koreliaciją?

Šiam pavyzdy, knygų turėjimas gali būti susijęs su kitais veiksniais, pavyzdžiui, tėvų išsilavinimu. Labiau išsilavinę tėvai turi daugiau knygų. Jeigu iš tiesų tėvų išsilavinimas (o ne knygos) yra geresnių vaiko rezultatų priežastis, tai tiesiog „nupirkus daugiau knygų“ rezultatai nepagerės (nesvarbu, kad buvo koreliacija).

Kuo lengviau sugalvoti kitus koreliaciją paaiškinančius veiksnius, tuo mažiau tikėtinas „priežastinis teiginys“. Koreliacija gal ir yra, bet priežastinio ryšio tarp kintamųjų gali ir nebūti.

Vien iš iš to, kad yra koreliacija, negalime atsakyti, kuris veiksnys lemia kurį, ir ar išvis yra priežastinis ryšys (galbūt abu kintamuosius lemia kiti susiję veiksniai).

Vaikai ir knygos

Metodai ir jų pagrįstumas

Metodų pagrįstumas susijęs su prieš tai minėtu klausimu. Kuo labiau metodas užtikrina, kad nėra kitų skirtumų, kurie paaiškintų sąryšį, tuo jis pagrįstesnis.

Aptarsime:

Kontroliuojamus eksperimentus
„Natūralius“ eksperimentus
Neeksperimentinius metodus

Randomizuoti kontroliuojami eksperimentai

Pradėkim nuo mokslinio „aukso standarto“. Tai yra randomizuotų kontroliuojamų eksperimentų. Šiuo atveju, turėdami grupę žmonių, ją atsitiktinai padaliname į dvi dalis ir priskiriame skirtingas kintamojo, kurio efektą norime išmatuoti, reikšmes.

Šis metodas plačiai taikomas medicinoje. Jeigu norime nustatyti vaisto įtaką sveikatai, grupę žmonių atsitiktinai padaliname į dvi - vienai duodame vaistą su veikliąja medžiaga, kitai be. Jeigu grupėje su veikliąja medžiaga sergamumas mažesnis (daugiau nei matavimo paklaida!) - žinom, kad vaistas veikia.

Kadangi žmones į grupes suskirstėm atsitiktinai, atsakymas į klausimą „ar yra kiti veiksniai, kurie gali paaiškinti skirtumus tarp grupių?“ visada yra „ne, nėra“. Tiesa, šiokių tokių prielaidų vis tiek yra.

Randomizuoti eksperimentai yra itin plačiai taikomi interneto platformų. Kai naudojamės Facebook ar Google, kiekvienas iš mūsų gaunam truputį skirtingą produkto versiją, nes pastoviai vykdomi eksperimentai. Skirtingi žmonės patenka į skirtingas eksperimentines grupes. Prieš darant produkto pakeitimus kompanijos taip patikrina, kokia pakeitimų įtaka verslo metrikoms.

Idealiu atveju į visus klausimus atsakytume darydami eksperimentus, tačiau praktikoje dažnai tai padaryti yra brangu, ne visada etiška, o kartais ir neįmanoma. Tarkim, klimato kaitos klausimams toks metodas netinkamas, nes turim vieną Žemę (su viena susijusia klimato sistema), ir negalim jos suskaidyti į „tiriamą“ ir „kontrolinę“ grupę.

Natūralūs ir kvazi-eksperimentai

Kaip minėjome, kontroliuojamus eksperimentus atlikti dažnai yra brangu ir ne visada etiška. Tačiau moksle siekti priežastinių teiginių vis tiek norime - nes tai gali padėti mums priimant sprendimus ar tiesiog geriau suprasti pasaulį.

Jeigu negalime atlikti kontroliuojamo eksperimento, kartais galime pasinaudoti vadinamais „natūraliais eksperimentais“. „Natūralus eksperimentas“ įvyksta tada, kai dėl kažkokių išorinių (ir tam tikra prasme atsitiktinių) veiksnių gaunam skirtingas kintamojo, kurį tiriam, reikšmes.

Kartais „natūralus eksperimentas“ įvyksta, nes iš tikrųjų vyksta loterija. Pavyzdžiui, valstybė atsitiktinai išrenka, kam teks eiti į armiją, o kam ne - tokiu atveju galima nustatyti „tarnavimo“ įtaką vėlesniems gyvenimo veiksniams. Kartais „loterija“ vyksta tik iš dalies, bet tai irgi gali padėti įvertinti tam tikrų veiksnių įtaką. Pavyzdžiui, jeigu valstybė atstiktinai skiria, pas kokį teisėją keliaus byla, ir vieni teisėjai yra griežtesni už kitus, galima bandyti nustatyti bausmės griežtumo įtaką vėliasniam įsitvirtinimui visuomenėje.

Jeigu tiesiog lygintume žmones, kurie gavo griežtas bausmes, su tais, kurie ne tokias griežtas, ir rastume, kad gavę griežtesnes bausmes po 10 metų sunkiau įsitvirtina visuomenėje - negalim daryti išvados, kad „griežtesnių bausmių skyrimas neigiamai veikia įsitvirtinimą visuomenėj“. Galbūt neigiamą įtaką įsitvirtinimui turėjo ne bausmė, bet gilesnės priežastys dėl ko žmogus gavo griežtesnę bausmę. Tačiau, jeigu lyginam, kaip sekasi įsitvirtinti patekusiems pas „griežtą teisėją“ ir „mažiau griežtą“, - kitų veiksnių, paaiškinančių koreliaciją, sugalvoti sunkiau, jeigu teisėjai priskirti atsitiktinai.

Atsitiktinis kintamasis („koks teisėjas buvo priskirtas“), kuris padeda įvertinti kito kintamojo įtaką (šiuo atveju, „bausmės griežtumo“), dar vadinamas „instrumentiniu kintamuoju“.

Praktikoje, tyrėjas turi įtikinti, kad nėra kitų „natūralaus eksperimento“ ar „instrumentinio kintamojo“ paveiktų veiksnių, kurie gali paveikti rezultatą. Taip pat, dažna problema, kad „instrumentas“ silpnai koreliuoja su kintamuoju, kurio įtaką norim išmatuoti. Nors teoriškai „teisėjų griežtumas“ padeda įvertinti „bausmės griežtumo“ įtaką, bet jeigu „griežtumo“ skirtumai tarp teisėjų labai maži, bus sunku gauti reikšmingus rezultatus.

Plačiau apie natūralius eksperimentus ir instrumentinius kintamuosius galite paskaityti čia.

Neeksperimentiniai metodai

Atmetus „kontroliuojamus eksperimentus“ (aukso standartą) ir „natūralius eksperimentus“ (patikimus, bet reikalaujančius prielaidų), lieka „neeksperimentiniai“ metodai. Jie reikalauja daug stipresnių prielaidų, ir daugelis mokslininkų mano, kad taikant juos priežastiniai teiginiai retai kada yra pagrįsti.

Į šią kategoriją įeina regresinės analizės arba „panašių atvejų atrinkimo“ (angl. matching) metodai. Metodų principas yra toks:

Lygindami grupes, bandome atsižvelgti į vis daugiau „kitų veiksnių“, kurie gali paaiškinti koreliaciją. Jeigu atsižvelgus į visus kitus veiksnius „sąryšis“ dar lieka - labiau tikėtina, kad jis priežastinis.

Grįžkim prie knygų skaičiaus namie ir vaiko pasiekimų pavyzdžio. Jeigu įtariam, kad knygų skaičius susijęs ir su tėvų išsilavinimu, galim paiimti tėvus su tuo pačiu išsilavinimu ir pažiūrėti, ar vis dar lieka koreliacija tarp knygų skaičiaus ir pasiekimų.

Problema, kad neeksperimentinių metodų atveju galime atsižvelgti tik į „išmatuojamus“ veiksnius. O dažnai skirtumai tarp grupių gali būti sukelti ir lengvai neišmatuojamų veiksnių, pavyzdžiui, „vaiko žingeidumo“.

Į „neišmatuojamus“ veiksnius gerai atsižvelgia tik eksperimentiniai (įskaitant kai kuriuos natūralius eksperimentus) metodai. Dažniausiai, tik jie laikomi pakankamai „pagrįstais“, jei kalbame apie priežastinio ryšio parodymą. Tuo tarpu „neeskperimentiniai“ (kaip tiesinė regresija), labiau tinka daryti „aprašomosiom įžvalgom“, bet ne priežastinėm.

Geras šių metodų taikymo pavyzdys yra naujos Britiškos atmainos plitimo greičio matavimas. Prie išvados, kad „nauja atmaina lengviau užkrečiama“ buvo prieita taikant neeksperimentinius metodus. Lyginta, kad „tam pačiam regione“ ir „tą pačią savaitę“, naujos atmainos augimo greitis iš esmės visuose regionuose ir visomis savaitėmis yra didesnis.

Nors pats straipsnis pabrėžė, kad spartesnį atmainos plitimą gali lemti ir kiti veiksniai, nebūtinai didesnis užkrečiamumas.

Apibendrinimas

Šiek tiek supaprastinta diagrama, apibendrinanti, ką aptarėm:

diagrama

Norintiems paskaityti plačiau

Ši tema yra mažiau apibrėžta, negu prieš tai buvusi apie „statistinį reikšmingumą“.

„Statistinio reikšmingumo“ atveju yra aiškus sąvokos apibrėžimas ir visada yra objektyvus atsakymas, ar rezultatai jį tenkina, ar ne. Visais atvejais, išskyrus atliekant kontroliuojamą eksperimentą, tam, kad iš duomenų spręstume apie priežastingumą, reikia daryti prielaidas, kurių negalime patikrinti duomenimis. Ar prielaidos pagrįstos ar ne, yra subjektyvumo elemento - kada jau „įtikinama“, kad nėra „kitų veiksnių, kurie gali paaiškinti koreliaciją“.

Skirtingose mokslo srityse, nusistovi šiek tiek skirtingos praktikos, kiek priimtina naudoti neeksperimentinius metodus - ir tai susiję su tuo, kaip lengva toje srityje atlikti eksperimentą.

Pateikiam kelias ištraukas iš Kolumbijos universiteto (Niujorke) statistikos profesoriaus A. Gelman trijų knygų apie priežastingumą recenzijos:

Jis išdėlioja skirtingas mokslo sritis pagal tai, kaip „griežtai“ jos žiūri į priežastingumo įrodymo kartelę, ir pabrėžia, kad nors ir yra konsensusas dėl „eksperimentų“ kaip aukso standardo, bet nėra konsensuso, kiek (ir ar) galima daryti priežastines išvadas tik iš stebimų duomenų (naudojant „kvazi-eksperimentinius“ ir neeksperimentinius metodus).
- Žr. Attitudes towards causal inference skyrių.
Gelman taip pat pabrėžia, kad jam pačiam aktualesnis atrodo „ryšio stiprumo išmatavimo“ klausimas, o ne tik „ar ryšys yra“. Ypač socialiniuose moksluose beveik visi veiksniai turi kažkokią įtaką vienas kitam, tik klausimas - kada „efektas“ yra pakankamai didelis, kad rūpėtų praktikoje.

Iš kitos perspektyvos, NUS verslo mokyklos profesoriaus ir NBER tyrėjo straipsnis apie tai, kad mąstydami apie priežastingumą ekonomistai gali nemažai pasimokyti iš istorijos disciplinos.

Jie kalba apie „konkuruojančius naratyvus“, ir kad iškylant naujiem faktam ar vykstant naujiem įvykiam, geri naratyvai vis dar sugeba „sujungti taškus“ ir juos paaiškinti, o blogi išnyksta.
Autoriai siūlo ekonomistams išmokti vertinti „konkuruojančius naratyvus“ naudojant panašius standartus kaip istorijos moksle.

Pabaiga

Mintys, kurias pateikiau, yra labiau iš statistiko perspektyvos. Jeigu blogą skaito kitų mokslo sričių atstovai, būtų įdomu išgirsti - ar rezonavo, kokie standartai priežastingumo įrodymui taikomi pas jus?

Facebook įrašas, jei norite palikti komentarą