Webinář ZDARMA – 24. 4. 2024

Jak získat 82% příspěvek na školení statistiky přes MPSV

Naučte se pomocí aplikace Statistica odhalit důležité informace ve svých datech data miningovými metodami.

Na kurzu pro vědce, statistiky a datové analytiky vám na praktických příkladech ukážeme, jak data vytěžovat s pomocí pokročilých lineárních (regresních) i nelineárních modelů, neuronových sítí, klasifikačních stromů, metod strojového učení a dalších metod. Probereme také způsoby prezentace získaných výsledků (viz názory spokojených účastníků).

2denním kurzem vás provede vás provede doc. RNDr. Ing. Marcel Jiřina, Ph.D., děkan Fakulty informačních technologií Českého vysokého učení technického, který se věnuje výzkumu data-miningových metod, zejména zpracování textu a obrazu (viz profil lektora).

Procvičování probíhá v české verzi aplikace TIBCO Statistica v modulu Data Miner.

Počítač vám zapůjčíme na místě, není třeba nosit vlastní.

Kodaňská 1441/46
Praha 10

Adresa konání kurzu

Zvýhodněné balíčky kurzů

Zakupte si balíček 2 nebo více vybraných kurzů a ušetřete

2 dny

Délka kurzu

Z kurzu budete mít největší užitek, pokud:

Jaké vstupní znalosti jsou potřeba?

Co se v kurzu naučíte?

Úvod

  • Základní informace o softwaru Statistica
  • Výukové zdroje pro software a možnosti nápovědy

Úvod do vytěžování dat, produkt

  • Princip, možnosti, využití

Práce s Recepty (wizardem)

  • Příprava dat (načtení, výběr proměnných, transformace, vzorkování dat, odstranění duplicitních vzorů, filtrace odlehlých hodnot, oprava chybějících údajů)
  • Detekce a případné odstranění podobných vstupních příznaků (prediktorů)
  • Výběr důležitých prediktorů pro požadovanou úlohu
  • Vytváření klasifikačních a regresních modelů
  • Vyhodnocení kvality vytvořeného modelů
  • Nasazení modelu v praxi

Klasifikační a regresní stromy

  • Princip, možnosti, využití
  • CART stromy
  • CHAID stromy
  • Vytváření klasifikačních a regresních stromů v interaktivním režimu (generování stromu, prořezávání stromu, výběr rozhodovacích proměnných, výběr mezí)
  • Generované stromy (Boosted Trees)
  • Náhodné lesy (Random Forests)

Lineární modely

  • Princip regrese
  • (Obecné) lineární modely
  • Zobecněné lineární modely
  • Zobecněné aditivní modely
  • MARSplines

Metody shlukování

  • K-průměrů (k-means)
  • Hierarchické a EM shlukování

Automatizované neuronové sítě

  • Princip umělých neuronových sítí, základní typy (MLP, RBF, Kohonenova síť)
  • Automatizovaný a vlastní návrh sítě

Metody strojového učení

  • Bayesův klasifikátor
  • SVM
  • k-NN klasifikátor

Analýza nezávislých komponent (ICA)

Text Mining

  • Účel, princip a zdroje Text Miningu
  • Vytvoření a práce s indexovým souborem
  • Asociační pravidla a sekvence

Nasazení modelů na reálná data z praxe

Kvalita získaných modelů

  • Korelační analýza
  • ROC křivka
  • Grafy zisku a navýšení (Gains/Lift Cart)

Metody výběru vhodných příznaků

Sdružování rozsáhlých skupin hodnot příznaků (Binning)

Základy práce v pracovní ploše (Workspaces)

  • Práce s uzly
  • Využití přednastavených úloh (zejména pro klasifikaci a regresi)

Názory spokojených účastníků

“S kurzem Data mining jsem byl nadmíru spokojený. Probírané matematické metody byly velice zajímavé a lektor prokázal kromě svých odborných kvalit i výbornou schopnost je srozumitelným způsobem vysvětlit. Jednotlivá témata jsme si ukázali na příkladech a pracovali s nimi v programu Statistica. Je samozřejmě nutné mít k dispozici software odpovídající kvality, nicméně podle mého názoru byla orientace na Statisticu až příliš velká. Sám k ní přístup nemám a mnohem více bych ocenil materiály týkající se vlastního obsahu školení a nikoliv návody na používaní konkrétního softwaru.”

Mgr. Marek Daniel, Ph.D., RWE Supply&Trading CZ, a.s.

“Kurz byl přínosný. Naučil jsem se v něm ovládat jednotlivé přístupy k metodám Data miningu. Lektoři byli fundovaní.”

Mgr. Vladimír Hofman, Odbor kontrol na místě IACS a SOT, Státní zemědělský intervenční fond

Jaké školící materiály obdržíte?

Jak dlouho kurz trvá?

Kdo vás bude školit?

Kurzem vás provede doc. RNDr. Ing. Marcel Jiřina, Ph.D., docent děkan Fakulty informačních technologií Českého vysokého učení technického. Zaměřuje se na výzkum metod data miningu, zejména pak na klasifikaci, detekci anomalii, regresi, zpracování textu (text mining) a zpracování obrazu.

Vedle toho vede tým analytiků a programátorů, který se věnuje vývoji vlastního data miningového softwaru a metod strojového zpracování textu s ohledem na české prostředí.

Kolik kurz stojí, kde probíhá a jaké jsou možnosti platby?

Kurz probíhá v našem školícím středisku na adrese Kodaňská 1441/46, Praha 10.

Cena kurzu je 13 900 Kč bez DPH. Součástí ceny je kromě zajištění pomůcek a školících materiálů také občerstvení v průběhu kurzu a oběd.

Platba probíhá převodem oproti vystavené faktuře.

Nezávazná přihláška na kurz

Stačí, když vyplníte formulář níže. Do 3 pracovních dnů se vám ozveme a probereme, zda kurz splňuje vaše představy a jaký bude další postup. Bez jakýchkoliv závazků z vaší strany.

Want to receive push notifications for all major on-site activities?

Zvýhodněné balíčky kurzů

Zakupte si balíček 2 nebo více vybraných kurzů a ušetřete

[24. 4. 2024] Webinář ZDARMA: Jak získat 82% příspěvek na školení statistiky přes MPSV

Pod vedením zakladatele Datové akademie Dávida Tkáče mj. zjistíte: