Suurima tõepära meetod

Allikas: testwiki
Redaktsioon seisuga 20. august 2024, kell 06:45 kasutajalt imported>EdgarsBot (korduvviidete ühendamine)
(erin) ←Vanem redaktsioon | Viimane redaktsiooni (erin) | Uuem redaktsioon→ (erin)
Mine navigeerimisribale Mine otsikasti

Mall:Keeletoimeta Suurima tõepära meetod on statistikas laialt kasutatav meetod hinnangute leidmiseks. Suurima tõepära meetod on üldjuhul efektiivsem kui muud levinud meetodid.[1]

Põhikomponendid

Olgu antud valim x1,x2,...,xn jaotusest F(x;θ), mis võib olla kas pidev või diskreetne. Tõepärafunktsiooniks nimetame avaldist

L(θ)={f(x1;θ)f(x2;θ)...f(xn;θ),pideval juhul,p(x1;θ)p(x2;θ)...p(xn;θ),diskreetsel juhul,

kus f(x;θ) tähistab jaotuse F tihedusfunktsiooni (pideval juhul) ja p(x;θ) tähistab F tõenäosusfunktsiooni (diskreetsel juhul), θA.[1]

Olgu X=(X1,X2,...,Xn),Xi sõltumatud suurused ja XiF(x;θ), siis L(θ) on valimi x=(x1,x2,...,xn) saamise tõenäosus (diskreetsel juhul) või juhusliku vektori X tihedusfunktsiooni väärtus punktis x (pideval juhul) antud θ korral. Realiseerunud valimi x korral on suurused x1,x2,...,xn teadaolevad arvud ja L(θ) on üksnes parameetri θ funktsioon. Eesmärgiks on leida niisugune θ väärtus parameeterruumist A, et L(θ) oleks maksimaalne. Ütleme, et vastav θ väärtus on kõige tõepärasem vaadeldava valimi jaoks (st ka vastav üldkogumi jaotus on kõige tõepärasem vaadeldava valimi jaoks).

Suurima tõepära printsiip – kõige tõepärasema üldkogumijaotuse määramine antud valimi jaoks.

Väärtust θ^, mida maksimeeritakse parameeterruumis A (L(θ) saavutab maksimaalse väärtuse), nimetatakse parameetri θ suurima tõepära hinnanguks:

L(θ^)=maxθA L(θ).

Kui tahta leida suurima tõepära hinnangut praktiliselt, on tihti lihtsam kasutada tõepärafunktsiooni logaritmi. Logaritmi monotoonsuse tõttu saavutavad L(θ) ja lnL(θ) maksimumi samas punktis, st määravad sama suurima tõepära hinnangu.

Logaritmiline tõepärafunktsioon on

l(θ;x)=lnL(θ;x){i=1nlnf(xi;θ),pideval juhul,i=1nlnp(xi;θ),diskreetsel juhul,[1]

Näited

Näide 1: Mündivise. Üldkogumijaotuseks on mündi visketulemuse (vapp, kiri) jaotus, kus vapi tulemise tõenäosuseks on p ja kirja tulemise tõenäosuseks 1p. Olgu eelnevalt teada, et p{12;14} Olgu meil kaks vaatlust: x1 = vapp ja x2 = vapp. Kumb on tõepärasem hinnang parameetrile p, kas 12 või 14 Kirjutame välja tõepärafunktsiooni:

L(p)=P(X=x1)P(X=x2)=p2,

millest saame, et L(12)=14,L(14)=116.

Kuna L(12)>L(14), siis p^=12 on suurima tõepära hinnang p-le.[1]

Näide 2: Olgu üldkogumijaotus eksponentjaotusest Exp(λ) parameetriga λ=1θ . Jaotusele vastav tihedusfunktsioon on

f(x;θ)=1θexθ,x0.

Olgu parameeter θ tundmatu. Pole raske näidata, et θ on antud jaotuse keskväärtus. Olgu meil n=4 vaatlust jaotusest:

0.322,0.879,0.222,0.012.

Leiame tõepärafunktsiooni

L(θ)=i=1nf(xi;θ)=1θnei=1nθ=1θ4e1.435θ

ja logaritmilise tõepärafunktsiooni:

l(θ)=lnL(θ)=4lnθ1.435θ

Paneme tähele, et tõepärafunktsioonid on θ funktsioonid. Mõlemad funktsioonid saavutavad maksimumi samal kohal, kuna logaritmfunktsioon on monotoonselt kasvav. Maksimumi leidmiseks leiame tuletise,

ddθl(θ)=4θ+1.435θ2.

Tuletise võrdsustamisel nulliga saame logaritmilise tõepärafunktsiooni maksimumpunkti, mis on ühtlasi parameetri θ suurima tõepära hinnanguks, θ^=0.358.[1]

Hinnang logistilise regressiooni korral

Logistilise regressiooni korral avaldub suurima tõepära hinnang järgmiselt:

LF=i=1n{PiYi*(1Pi)1Yi},

kus LF on tõepära hinnang, Yi on vaadeldav väärtus i-l juhul ja Pi on ennustatud tõenäosus i-l juhul. Pi väärtused tulevad logistilise regressiooni mudelist ja valemist Pi=1/(1+eLi), kus Li on log-šansid, mis on määratud vabaliikme ja parameetri väärtuste β poolt. Eesmärk on leida β väärtused, mille tulemusel saadakse Li ja Pi väärtused, mis maksimeerivad LF-i.[2]

Viited

Mall:Viited

  1. 1,0 1,1 1,2 1,3 1,4 Lepik, Natalja. (2017). Tõenäosusteooria ja statistika II. Loengukonspekt. Kasutatud 19.03.2018.
  2. Mall:Raamatuviide