Tento tutoriál pokrýva nasledujúce témy:
- Čo je to prediktívna neistota a prečo by vás to malo zaujímať?
- Aké sú dva zdroje neistoty?
- Ako odhadnúť neistotu pre regresné problémy pomocou knižnice na zvýšenie gradientu CatBoost
Všetky kroky môžete vykonať pomocou tento notebook Jupyter .
Čo je neistota?
Strojové učenie sa široko používa v mnohých úlohách. V niektorých vysoko rizikových aplikáciách, ako je autonómna jazda, lekárska diagnostika a finančné prognózy, však chyba môže viesť buď k smrteľnému výsledku, alebo k veľkým finančným stratám. V týchto aplikáciách je dôležité zistiť, kedy systém urobil chybu, a prijať bezpečnejšie opatrenia. Ďalej je tiež žiaduce zozbierať tieto scenáre zlyhania, označiť ich a naučiť systém správne predpovedať prostredníctvom aktívneho učenia sa.
Na detekciu chýb je možné použiť prediktívny odhad neistoty. V ideálnom prípade model naznačuje vysokú mieru neistoty v situáciách, kde je pravdepodobné, že urobí chybu. To nám umožňuje odhaliť chyby a podniknúť bezpečnejšie opatrenia. Rozhodujúce je, že výber akcie môže závisieť od prečo model je neistý. Existujú dva hlavné zdroje neistoty: neistota údajov (tiež známy ako aleatorická neistota) a znalostná neistota (tiež známy ako epistemická neistota). Ak je naším cieľom odhaliť chyby, nie je potrebné tieto dve neistoty oddeľovať. Ak je však naším cieľom aktívne učenie, chceli by sme odhaliť nové vstupy a na to možno použiť _neistotu znalostí _.
Neistota údajov vzniká v dôsledku inherentnej komplexnosti údajov, ako je napríklad aditívny šum alebo prekrývajúce sa triedy. V týchto prípadoch model vie, že vstup má atribúty viacerých tried alebo že cieľ je hlučný. Čo je dôležité, neistotu údajov _ nemožno znížiť _ zhromaždením ďalších údajov o školení.
javascript json reťazec do poľa
Neistota vo vedomostiach vzniká vtedy, ak je modelu poskytnutý vstup z regiónu, ktorý je buď riedko pokrytý údajmi o výcviku, alebo ďaleko od údajov o výcviku. V týchto prípadoch model vie o tomto regióne veľmi málo a pravdepodobne urobí chybu. Na rozdiel od neistoty údajov je možné neistotu znalostí znížiť zhromaždením väčšieho množstva údajov o odbornej príprave zo zle pochopeného regiónu.
Tento tutoriál popisuje, ako kvantifikovať neistotu údajov a znalostí v CatBoost.
#posilnenie gradientu #strojové učenie #catboost #neistota #veda o dátach
smerom kdatascience.com
Tutorial: Odhad neistoty pomocou CatBoost
Pochopte, prečo je váš model neistý a ako odhadnúť mieru neistoty. Tento tutoriál popisuje, ako kvantifikovať neistotu údajov a znalostí v CatBoost.