Jak se učíme vytvářet prediktivní modely, které fungují
- Propojujeme teoretické koncepty s praktickými aplikacemi v reálných datech
- Každý projekt vychází z konkrétních scoring úloh s měřitelnými výsledky
- Učíme přesně ty techniky, které dnes používají analytici v bankách a fintechech
Proč jsme tady a čím se lišíme
Začali jsme v roce 2019, kdy jsme viděli, jak těžké je najít kvalitní vzdělání zaměřené přímo na scoring modely. Kurzy byly buď příliš teoretické, nebo pokrývaly machine learning obecně bez konkrétního zaměření na kreditní riziko, fraud detection nebo customer churn.
Naše webináře jsou postavené tak, aby každý absolvent dokázal vzít dataset, vyčistit ho, vybrat relevantní features, vytvořit a vyhodnotit model podle standardních metrik používaných v praxi. Nepracujeme s předpřipravenými datovými sadami – simulujeme reálné situace, kde data nikdy nejsou perfektní.
Všechny příklady vycházejí z finančních institucí, telekomunikací nebo e-commerce. Učíme, jak vysvětlit model regulátorům, jak sledovat jeho stabilitu v čase a co dělat, když začne degradovat. To není jen o kódu – je to o procesu, který musí fungovat i po dvou letech.
Materiály jsou dostupné online, takže můžete studovat z domova v Ústí nad Labem nebo odkudkoliv jiného. Žádné cestování, žádné problémy s dopravou – jenom vy, váš počítač a konkrétní problémy ke řešení.
Co vedlo k tomu, jak dnes učíme
Několik principů, které definují náš přístup ke vzdělávání v prediktivní analýze
Reálná data, reálné problémy
Nepracujeme s akademickými příklady. Každý dataset obsahuje missing values, outliers, class imbalance – přesně to, s čím se setkáte v praxi. Učíme řešit problémy, ne demonstrovat ideální situace.
Od nástroje k výsledku
Algoritmus je jen část procesu. Ukazujeme, jak strukturovat projekt od business requirements přes feature engineering až po monitoring v produkci. Model musí být reprodukovatelný a vysvětlitelný.
Metriky, které dávají smysl
Accuracy nestačí. Učíme pracovat s precision-recall trade-off, Gini coefficient, KS statistikou, lift curves – všechno závislé na tom, jaký business problém řešíte a jaké jsou náklady false positives versus false negatives.
Praktická komunikace výsledků
Dokázat vytvořit model je jedna věc. Vysvětlit ho stakeholderům, kteří nerozumí p-values a ROC curves, je úplně jiná dovednost. Procvičujeme prezentaci výsledků tak, aby rozhodnutí mohla být učiněna bez technického pozadí.