• ലക്ഷ്യം
  • ഉദാഹരണം: അജ്ഞാത $\boldsymbol{\mu}$
  • ഹോം
  • പോസ്റ്റുകൾ
  • കുറിപ്പുകൾ
  • പുസ്തകശാല
  • രചയിതാവ്
🇺🇸 en 🇫🇷 fr 🇨🇳 zh

Nathaniel Thomas

പരമാവധി സാധ്യതാ എസ്റ്റിമേഷൻ

2024, നവംബർ 24

ലക്ഷ്യം

നമുക്ക് ഒരു ഡാറ്റാസെറ്റ് D നൽകിയിട്ടുണ്ട്, അതിൽ ഫീച്ചർ വെക്ടറുകൾ xk​ ഉം ക്ലാസ് ലേബലുകൾ ωk​ ഉം അടങ്ങിയിരിക്കുന്നു. Di​ എന്നത് ωi​ ക്ലാസിലെ ഫീച്ചറുകളുടെ സെറ്റ് ആയി സൂചിപ്പിക്കുക. ഇനിപ്പറയുന്നവ ഞങ്ങൾ അനുമാനിക്കുന്നു:

  1. p(x∣ωj​)∼N(μj​,Σj​). അതായത്, ഒരു ക്ലാസ് ലേബൽ നൽകിയാൽ, ആ ക്ലാസിൽ ഉൾപ്പെടുന്ന ഫീച്ചറുകളുടെ വിതരണം μj​ മീൻ ഉം Σj​ കോവേറിയൻസ് ഉം ഉള്ള ഒരു ഗോസിയൻ ആയിരിക്കും.
  2. Di​ ലെ സാമ്പിളുകൾ x ഈ അനുമാനിച്ച ഗോസിയൻ വിതരണം അനുസരിച്ച് സ്വതന്ത്രവും സമാനമായി വിതരണം ചെയ്യപ്പെട്ടവ (i.i.d.) ആണ്.

MLE പരിഹരിക്കാൻ ശ്രമിക്കുന്ന പ്രശ്നം എന്നത്, ഡാറ്റ നൽകിയിരിക്കുന്നതിന് ഏറ്റവും സാധ്യതയുള്ള പാരാമീറ്ററുകളായ μj​,Σj​ കണ്ടെത്തുക എന്നതാണ്. ഞങ്ങൾ സൂചിപ്പിക്കുന്നത്

θ=(μ,Σ)

ഇതിൽ ഓരോ ക്ലാസിനും മീനുകളും കോവേറിയൻസുകളും ഉൾപ്പെടുന്നു. θ ന്റെ സാധ്യത

l(θ)=p(D∣θ),

ഉം θ ന്റെ MLE, θ^, ആണ്

θ^=argθmax​l(θ).

പ്രായോഗികമായി, കണക്കുകൂട്ടൽ ലളിതമാക്കാൻ ഞങ്ങൾ ലോഗ്-സാധ്യത ഉപയോഗിക്കുന്നു:

l(θ)=logp(D∣θ),

കാരണം ലോഗ്-സാധ്യതയെ പരമാവധി ചെയ്യുന്നത് സാധ്യതയെ പരമാവധി ചെയ്യുന്നതിന് തുല്യമാണ്. വാക്കുകളിൽ പറഞ്ഞാൽ, സാധ്യത എന്നത് θ നിർവചിച്ച വിതരണത്തിൽ നിന്ന് ഓരോ ഡാറ്റാപോയിന്റും സ്വതന്ത്രമായി വരച്ചാൽ നമ്മുടെ ഡാറ്റാസെറ്റ് ഉണ്ടാകാനുള്ള സാധ്യതയാണ്. ഈ സാധ്യത പരമാവധി ചെയ്യുന്ന θ^ ആണ് D വരച്ച യഥാർത്ഥ വിതരണം നിർവചിക്കുന്നത്.

l(θ) ന്റെ ഗ്രേഡിയന്റ് 0 ആയി സജ്ജമാക്കി പരിഹാരം പരമാവധി ആണെന്ന് പരിശോധിച്ചുകൊണ്ട് θ^ കണ്ടെത്താൻ ശ്രമിക്കാം. എന്നിരുന്നാലും, ഇത് ഒരു ഗ്ലോബൽ മാക്സിമം ഉറപ്പാക്കുന്നില്ല.

ഉദാഹരണം: അജ്ഞാത $\boldsymbol{\mu}$

നമുക്ക് അനുമാനിക്കാം, ഡാറ്റാസെറ്റ് D ലെ ഓരോ ഘടകവും xk​ അറിയപ്പെടുന്ന കോവേറിയൻസ് Σ ഉള്ള ഒരു മൾട്ടിവേറിയേറ്റ് ഗൗസിയൻ ഡിസ്ട്രിബ്യൂഷനിൽ നിന്ന് വരുന്നു, പക്ഷേ മീൻ μ അജ്ഞാതമാണ്. μ ന്റെ MLE എന്താണ്?

μ^​=argμmax​p(D∣μ).

μ ന്റെ MLE കണ്ടെത്താൻ, ലൈക്ലിഹുഡ് ഫംഗ്ഷൻ മാക്സിമൈസ് ചെയ്യുന്നു. ഒരു മൾട്ടിവേറിയേറ്റ് ഗൗസിയൻ ഡിസ്ട്രിബ്യൂഷനായി:

p(xk​∣μ)=(2π)d/2∣Σ∣1/21​exp(−21​(xk​−μ)⊤Σ−1(xk​−μ)),

ഇവിടെ d എന്നത് xk​ ന്റെ ഡൈമെൻഷൻ ആണ്.

സാമ്പിളുകൾ സ്വതന്ത്രമാണെന്ന് അനുമാനിച്ചതിനാൽ, ഡാറ്റാസെറ്റ് D ന്റെ ലൈക്ലിഹുഡ് ഓരോ xk​ ന്റെ ലൈക്ലിഹുഡുകളുടെ ഗുണനഫലമാണ്. ഇത് ലോഗ്-സ്പേസിൽ ഒരു തുകയായി മാറുന്നു:

logp(D∣μ)​=k=1∑n​logp(xk​∣μ)=−2nd​log(2π)−2n​log∣Σ∣−21​k=1∑n​(xk​−μ)⊤Σ−1(xk​−μ).​

ഗ്രേഡിയന്റ് എടുത്ത് പൂജ്യത്തിന് തുല്യമാക്കുമ്പോൾ:

∇μ​logp(D∣μ^​)=k=1∑n​Σ−1(xk​−μ^​)=0.
ഗ്രേഡിയന്റിന്റെ ഡെറിവേഷൻ

ക്വാഡ്രാറ്റിക് ഫോം പരിഗണിക്കുക, ഇവിടെ x∈Rd×1, Σ∈Rd×d:

f(x)=x⊤Σx=i=1∑d​j=1∑d​xi​Σij​xj​.

ഗ്രേഡിയന്റ് കണക്കാക്കുമ്പോൾ:

∂xk​∂f​=j=1∑d​Σkj​xj​+i=1∑d​xi​Σik​.

ഇവിടെ ആദ്യത്തെ പദം i=k എന്നതിൽ നിന്നും രണ്ടാമത്തെ പദം j=k എന്നതിൽ നിന്നും വരുന്നു. നമുക്ക് ശ്രദ്ധിക്കാം:

∂xk​∂f​=(Σx)k​+(Σ⊤x)k​

അതിനാൽ,

∇x​(x⊤Σx)=(Σ+Σ⊤)x.

ഇവിടെ, μ യുമായി ബന്ധപ്പെട്ട് ഡിഫറൻഷിയേറ്റ് ചെയ്യുമ്പോൾ, സബ്സ്റ്റിറ്റ്യൂട്ട് ചെയ്യുമ്പോൾ ഒരു നെഗറ്റീവ് ചിഹ്നം വരുന്നു. Σ−1 സമമിതിയാണെന്നതും (കോവേറിയൻസ് മാട്രിക്സ് ആയതിനാൽ) മുകളിലെ ഫലവും ഉപയോഗിച്ച്:

∇μ​((xk​−μ^​)⊤Σ−1(xk​−μ^​))=−2Σ−1(xk​−μ^​).

Σ കൊണ്ട് ഇരുവശവും ഗുണിച്ചാൽ:

k=1∑n​xk​=k=1∑n​μ^​=nμ^​,

ഇത് സൂചിപ്പിക്കുന്നത്:

μ^​=n1​k=1∑n​xk​,

ഇതാണ് സാമ്പിൾ മീൻ! ഈ ഫലം ഏറ്റവും അർത്ഥവത്താണ്.


←
മാക്സിമം എ പോസ്റ്റീരിയോറി (MAP) എസ്റ്റിമേഷൻ
ഹാരിയോ V60 പാചകക്കുറിപ്പുകൾ
→

back to top