Multinomiaalne logistiline regressioon

Allikas: testwiki
Mine navigeerimisribale Mine otsikasti

Multinomiaalne logistiline regressioon (ingl multinomial logistic regression) on klassifitseerimismeetod enam kui kahe võimaliku diskreetse tulemuse jaoks. See on binaarse logistilise regressiooni üldistus, kus olemasolevate andmete põhjal luuakse mudel selleks, et hinnata erinevatesse võimalikesse klassidesse kuulumise tõenäosust.[1]

Multinoomjaotus

Multinoomjaotus on binoomjaotuse üldistus, kus igas üksikus katses on enam kui kaks võimalikku katsetulemust. Olgu võimalikud katsetulemused 1,,k ning nende esinemise tõenäosused vastavalt π=(π1,,πk), kusjuures π1++πk=1 ja i{1,,k}πi[0,1]. Tõenäosus, et n sõltumatus katses sündmused 1,,k toimuvad vastavalt 𝐲T=(y1,,yk) korda, avaldub valemiga

Pn(y1,y2,,yk)=n!y1! y2!  yk!π1y1 π2y2  πkyk

Kuna i=1kyi=n, siis on ühe sündmuse toimumiste arv avaldatav teiste kaudu ning kasutusele saab võtta lühema vektori 𝐲T=(y1,,yk1). Siis avaldub tõenäosusfunktsioon valemiga

Pn(y1,,yk1)=n!y1!  yk1!(ny1yk1)!π1y1  πk1yk1(1π1πk1)ny1yk1.

Multinoomjaotuse liikmete 𝐲T=(y1,,yk1) keskväärtus ja dispersioon avalduvad vastavalt E(yi)=nπi ja D(yi)=nπi(1πi) iga i=1,,k1 korral.[2][3]

Multinomiaalne logit mudel

Olgu võimalikud katsetulemused 1,,k ning seletavate tunnuste arv m. Binaarse logit-mudeli korral hinnatakse uuritava sündmuse toimumise ja vastandsündmuse toimumise šansi logaritmi

ln(P(Y=1)P(Y=0))=β0+β1x1++βmxm.

Multinomiaalse mudeli korral vaadeldakse k1 logit-mudelit, kus igas mudelis hinnatakse sündmuse toimumise ehk mingile kindlale tasemele kuulumise ja baastasemele kuulumise šansi logaritmi.

Valides baastasemeks taseme k, avaldub r-ndale tasemele vastav logit-mudel järgmiselt

ln(P(Y=r)P(Y=k))=βr0+βr1x1++βrmxm,

kus r=1,,k1. Siinkohal tasub tähele panna, et parameetrid βr0,,βrm sõltuvad tasemest r ning baastaseme k võib valida vabalt tasemete 1,,k hulgast. [2]

Olgu N kõikide võimalike populatsioonide arv nii et ni on vaatluste arv i-ndas populatsioonis ja i=1Nni=n, kus n on kõigi vaatluste arv. Suurus πir tähistab siis iga i-nda populatsiooni vaatluse tõenäosust kuuluda tasemele r. Multinomiaalsest logit-funktsioonist saame siis

ln(πirπik)=βr0+βr1xi1++βrmxim.

Avaldades eelnevast πir ning võttes, et iga i=1,,N korral xi0=1, saame

πir=ej=0mβrjxij1+r=1k1ej=0mβrjxij,

kus r=1,,k1 ja

πik=1πi1πi(k1)=11+r=1k1ej=0mβrjxij.[4]

Parameetrite hindamine suurima tõepära meetodil

Olgu 𝐲iT=(yi1,,yiq)M(ni,πi),i=1,,N multinoomjaotusest, mille võimalike tasemete arv on k=q+1.

Pni(𝐲𝐢)=ni!yi1!  yiq!(niyi1yiq)!πi1yi1  πiqyiq(1πi1πiq)niyi1yiq.

Kuna jagatises ni!yi1!  yiq!(niyi1yiq)! ei ole hinnatavaid tõenäosusi πir, siis võib seda vaadelda konstandina ja suurima tõepära funktsioon on

L(β)i=1Nπi1yi1  πiqyiq(1πi1πiq)niyi1yiq=i=1Nr=1q(πirπik)yirπikni.

Asendades πir ja πik, saame

i=1Nr=1qeyirj=0mβrjxij(1+r=1qej=0mβrjxij).

Suurima tõepära hinnangute leidmiseks on vaja eelnev funktsioon maksimeerida. Kuna logaritm on monotoonne funktsioon, siis piisab selleks leida log-tõepära funktsiooni maksimumkohad. Suurima tõepära funktsioonist naturaallogaritmi võtmisel saame log-tõepära funktsiooni

l(β)=i=1Nr=1q(yirj=0mβrjxij)niln(1+r=1qej=0mβrjxij).

Funktsiooni maksimeerimiseks β suhtes, piisab meil leida funktsiooni osatuletised l(β)βrj ning iga βrj jaoks nullkohad.[4]

Viited