Intuīcija aiz L1-L2 regulēšanas

Izmēģiniet Mūsu Instrumentu Problēmu Novēršanai

Regulizācija ir process, kurā paredzēšanas funkcija tiek mazāk piemērota apmācības datiem, cerot, ka tā labāk vispārinās jaunos datus. Tā ir ļoti vispārīga legalizācijas definīcija. Šodien mēs ļoti dziļi iedziļināsimies divās slavenajās mašīnmācīšanās regulācijās, ti, L1 un L2 Regulēšana ar tīru matemātisku aci.

Pirms iedziļināties regulēšanas paņēmienos, mēs izveidosim pamatu, un pirmā lieta, par ko varam padomāt, ir hipotēzes telpa. Lai uztvertu mācīšanos no X līdz Y (_f: X → Y) _ML, mēs parasti izvirzām dažas hipotēzes h1,…, hn kur h∈H. H

Attēls ziņai



kura no šīm nav mašīnmācīšanās vai dziļās mācīšanās bibliotēka python?

1. attēls. Dažādi sarežģītības mērījumi

Ņemot vērā hipotēzes telpu F, apsveriet visas funkcijas F ar sarežģītību ne vairāk kā r:

Fr = Ω (f) ≤r

Fr ir hipotēzes telpas apakškopa F ar sarežģītību ≤ r. Šeit r ir hipertuninga parametrs, ko mēs varam mācīties krusteniskās validācijas stadijā un vislabāk izmantot mūsu prognozēšanas funkciju.

Tagad mēs pārejam pie pirmās ierobežotās regulēšanas formas, ko sauc par Ivanovu regulēšana.In zemāk esošo vienādojumu mēs samazinām empīrisko risku, kas ir mūsu zaudējumu funkcija, kas ierobežota hipotēzes telpā un kuras sarežģītība nav lielāka par r.

Attēls ziņai

2. attēls: Ivanova regulēšanas forma

kur es varu nopirkt vienradzi

Otro soda sankciju veidu sauc par Tihonova regulēšanu, kur mēs pievienojam mūsu prognozēšanas funkcijas sarežģītību, kas reizināta ar hiperparametru 𝝀, mūsu objektīvajai funkcijai.

Attēls ziņai

3. attēls: Tihonova regulēšanas forma

reaģēt vietējā bezmaksas veidne

Mēs varam intuitīvi redzēt, ka tad, kad mēs iegūstam hipotēzi ar lielu sarežģītību, tā izvirzīs augstāku mērķa funkciju, kuras galvenais mērķis ir samazināt līdz minimumam. 𝝀 lielums līdzsvaro kompromisu starp hipotēzes sarežģītību, ko mēs meklēsim, un to, kā labi, ja mēs atbilstam datiem vai cik mazs ir empīriskais risks. Galvenā atšķirība starp ierobežoto un sodīto legalizācijas veidu ir pirmajā, mēs jau ierobežojam hipotēzes telpu, kas optimizācijas funkcijai atvieglo zaudējumu samazināšanu, bet vēlāk mums ir jāiziet daudzas partijas, lai to regulētu un samazinātu. Mēs varam teikt, ka abas formas ir līdzvērtīgas, ja visas iespējamās vērtības, ko iegūstam, noskaņojot r, ir vienādas ar visām iespējamām vērtībām, ko iegūstam, noskaņojot 𝝀.

#datu zinātne #mašīnmācīšanās #regulēšana #datu analīze

medium.com

Intuīcija aiz L1-L2 regulēšanas

Regulizācija ir process, kurā paredzēšanas funkcija tiek mazāk piemērota apmācības datiem, cerot, ka tā labāk vispārinās jaunos datus. Tā ir ļoti vispārīga legalizācijas definīcija.

Skatīt Arī: