Lineaarne korrelatsioonikordaja

Allikas: testwiki
Mine navigeerimisribale Mine otsikasti

Mall:ToimetaAeg Lineaarne korrelatsioonikordaja ehk Pearsoni korrelatsioonikordaja r kasutab hajuvusdiagrammi informatsiooni ning on kõige levinum kordaja. Excel'is r = CORREL(X,Y)

Korrelatsioonikordaja r omab tähendust vaid pidevatele ja normaaljaotusega tunnustele.

Mida lähemal on r absoluutväärtus ühele, seda tugevamalt on tunnused omavahel seotud.

Matemaatiline definitsioon

Lineaarne korrelatsioonikordaja r avaldub kujul[1]ː

r=(xix)(yiy)nσXσY,

kus n on juhuslike suuruste X ja Y väärtuste xi ja yi paaride arv (valimi maht), x ja y aritmeetilised keskmised ning σX ja σY vastavad standardhälbed.

Omadused

  • Väärtus asub lõigus –1 kuni 1 -1≤r≤1.
  • Kui tunnused on kasvavalt seotud on r>0.
  • Kui tunnused on kahanevalt seotud, on r<0.
  • Kui tunnused on sõltumatud, siis r =0.
  • Nõrk seos: kordaja |r|< kui 0.3
  • Keskmine seos: kordaja 0.3< |r| < 0.7.
  • Tugev seos: kordaja |r|> 0.7.

Puudused

  • Mõjutub erinditest (paar erindit võivad “venitada” kordaja suureks, kuigi tegelikult on seos nõrk) – erind välja jätta
  • Mõjutub kolmandast tunnusest ehk punktid moodustavad mingi kolmanda tunnuse suhtes tõusva (langeva) pilve – uurida kordajaid kolmanda tunnuse väärtuste kaupa
  • Tunneb ära vaid lineaarse seose, muu seose korral (ruutfunktsionaalne seos vms) võib anda tulemuseks nõrga või olematu sõltuvuse.

Kõigil juhtudel on üldjuhul probleem nähtav hajuvusdiagrammilt.

Vaata ka

Viited

Mall:Viited ru:Корреляция#Линейный коэффициент корреляции