Bez statistiky se věda dělat nedá. Když ale na analýzu dat skutečně přijde, tápeme, jakou metodu zvolit, nebo vybraný test nedokážeme správně použít. Nejprve si proto ujasněte, čeho chcete na našich kurzech dosáhnout.
Chcete porozumět základům statistiky? Zvýšit svou šanci na publikaci rukopisu? Nebo je vaším cílem spravovat data z výzkumu podle moderních standardů?
Následně postupujte při výběru kurzu následujícím způsobem:
Zvolte vhodný software
Všechna naše školení probíhají v jedné z několika populárních analytických aplikací. Důvod je prostý – jen málokdo už dnes vyhodnocuje svůj výzkum na papíře, a stejně tak naprostou většinu vědeckých redakcí zajímá, s jakým programem jste k předkládaným závěrům výzkumu došli.
Většina našich kurzantů volí software, který (alespoň na základní úrovni) ovládají. Ne každá aplikace je ovšem pro každý druh datové analýzy vhodná. Např. u logistické regrese vám MS Excel bohatě postačí, s modelováním neuronových sítí vám ale příliš nepomůže.
V jakém softwaru tedy kurz absolvovat? Jednoduše řečeno, pokud je vaším cílem:
Zakupte si balíček 2 nebo více vybraných kurzů a ušetřete
- porozumět základům statistiky či správě výzkumných dat a provádět jednoduché testování hypotéz, vystačíte si s MS Excel,
- používat pokročilé metody statistiky (vícerozměrné metody, logistická regrese, časové řady a predikce ad.) a datové analýzy (text mining, data mining ad.), zvolte TIBCO Statistica, RStudio nebo Python,
- tvořit špičkové datové vizualizace, vyberte MS Power BI.
Jaké jsou přednosti a nevýhody jednotlivých aplikací?
MS Excel
MS Excel je komerční tabulkový procesor od společnosti Microsoft pro vytváření tabulek dat a jejich zpracování, analýzu a vizualizaci.
Výhody ✔️ rozšířená aplikace s jednoduchým ovládáním, ✔️ dostupný v češtině, ✔️ vhodný pro základní statistiku, pro zpracování dat a jejich správu dle FAIR Data Principles, ✔️ dostupný v desktopové i cloudové variantě (podle zakoupené licence). |
Nevýhody ❌ bez rozšíření není vhodný pro pokročilou statistiku a datovou analýzu, ❌ obtížné zpracování velkých datasetů, ❌ nemá validované statistické funkce – u některých výpočtů nemusí poskytnout přesné výsledky, ❌ některá vědecká periodika nepřijímají rukopisy s daty zpracovanými v MS Excel. |
Prohlédnout kurzy v MS Excel →
TIBCO Statistica
TIBCO Statistica je software pro statistickou a datovou analýzu, ve kterém výsledky výzkumu zpracovává např. Harvard University, Massachusetts Institute of Technology, University of Cambridge nebo Yale University. Pro monitorování kvality výroby jej používá např. řada farmaceutických společností.
Výhody ✔️ uživatelsky přívětivé prostředí (podobné Excelu) a snadné ovládání, ✔️ dostupný v češtině, ✔️ více než 17 tisíc funkcí – vhodný pro základní statistiku i pokročilou datovou analýzu (regresní analýza, časové řady a predikce, neparametrické metody, neuronové sítě ad.), ✔️ validovaný dle ISO 9001 a dalších standardů – zvyšuje šanci na přijetí rukopisu. |
Nevýhody ❌ vyšší náklady na pořízení licence, ❌ neexistuje v cloudové variantě, ❌ neobsahuje některé moderní statistické funkce. |
Prohlédnout kurzy v TIBCO Statistica →
Programovací jazyk R (RStudio)
Programovací jazyk R je zaměřený na statistickou a datovou analýzu. Pro jeho ovládání se často používá aplikace RStudio, která plní roli tzv. integrovaného vývojového prostředí (IDE).
Výhody ✔️ zcela zdarma (open-source produkt) a s velkou komunitou uživatelů, ✔️ více než 19 000 knihoven pro snadné ovládání a základní i pokročilé statistické funkce (vícerozměrné statistické metody nebo časové řady a predikce), ✔️ možnost tvorby vlastních skriptů (účastníkům kurzů zasíláme vyladěné skripty pro vlastní použití), ✔️ dostupný v desktopové i cloudové variantě. |
Nevýhody ❌ dostupný pouze v angličtině, ❌ neexistuje oficiální podpora, ❌ v základní verzi (bez tzv. tidyverse knihoven) obtížnější na pochopení a ovládání, ❌ použité metody a rozšíření je třeba validovat pomocí tzv. riskmetric balíčku. |
Prohlédnout kurzy v programovacím jazyce R →
Python
Python je obecný programovací jazyk, vhodný mj. pro pokročilou datovou analýzu.
Výhody ✔️ zcela zdarma (open-source produkt) a s velkou komunitou uživatelů, ✔️ rychlé ovládnutí základů programování, ✔️ množství knihoven pro základní statistiku i pokročilé zpracování a vyhodnocení dat pomocí strojového učení (machine learning) a umělé inteligence (AI). ✔️ možnost tvorby vlastních skriptů a funkcí, ✔️ dostupný v desktopové i cloudové variantě. |
Nevýhody ❌ dostupný pouze v angličtině, ❌ neexistuje oficiální podpora, ❌ obtížné zpracování velkých datasetů, ❌ použité metody a rozšíření je třeba validovat pomocí balíčku PyVal. |
Kurzy v programovacím jazyce Python jsou v přípravě
MS Power BI
MS Power BI je aplikace společnosti Microsoft pro zpracování dat a jejich pokročilou vizualizaci.
Výhody ✔️ v základní verzi zdarma, ✔️ dostupný v češtině, ✔️ jednoduché ovládání, ✔️ možnost základní a vizuální explorativní analýzy a tvorby pokročilých vizualizací(včetně dashboardů), ✔️ dostupný v desktopové i cloudové variantě. |
Nevýhody ❌ nevhodný pro pokročilou statistiku a datovou analýzu, ❌ obtížné zpracování velkých datasetů, ❌ nemá validované statistické funkce – u některých výpočtů nemusí poskytnout přesné výsledky, ❌ některá vědecká periodika nepřijímají rukopisy s daty zpracovanými v MS Power BI. |
Prohlédnout kurzy v MS Power BI →
Vyberte metody, které se chcete naučit
V tabulce níže najdete jednotlivé oblasti, které v našich kurzech pokrýváme, a jejich přínos pro výzkum. Tabulka zároveň slouží jako vodítko pro ty, kteří chtějí do statistické analýzy proniknout hlouběji.
Žlutě označené kurzy slouží prerekvizita pro navazující školení v daných osnovách.
Všechny kurzy v naší nabídce jsou prezenční (konají se v našem pražském školícím centru), trvají 1 až 2 dny a vedou je zkušení lektoři, kteří s daty sami dennodenně pracují.
Osnova kurzů s MS Excel
Tento soubor kurzů je vhodný pro vědce ze všech oborů, kteří pracují v prostředí MS Excel a chtějí se orientovat v naprostých základech zpracování a statistické analýzy dat.
Kurz |
Co po absolvování kurzu zvládnete? |
Příprava výzkumných dat pro statistické vyhodnocení v MS Excel |
Načíst, zpracovat a uložit v MS Excel data z výzkumu ve formátu vhodném pro jejich vyhodnocení. |
Vyhodnotit v MS Excel data zpracovaná základními statistickými metodami a výsledky analýzy zobrazit a správně interpretovat. |
|
Uložit a zpřístupnit v MS Excel data z výzkumu podle zásad FAIR Data Principles a Open Access. Kurz je vhodný i pro vědce, kteří data vyhodnocují v jiných aplikacích. |
Osnova kurzů s TIBCO Statistica – základní a mírně pokročilé vyhodnocování dat
Tento soubor kurzů je vhodný pro vědce ze všech oborů, kteří se chtějí naučit základy zpracování a statistickou analýzu dat v aplikaci TIBCO Statistica.
Kurz |
Co po absolvování kurzu zvládnete? |
Ovládat aplikaci TIBCO Statistica, načíst do ní data, zpracovat je a uložit ve formátu vhodném pro jejich vyhodnocení. Tento kurz je prerekvizitou pro všechna školení v TIBCO Statistica. |
|
Chápat principy vyhodnocování hypotéz. Použít v TIBCO Statistica metody popisné statistiky a vyhodnotit data pomocí základních parametrických (t-test, ANOVA) a neparametrických testů (Wilcoxnovy testy, Kruskal-Wallisova ANOVA). Tento kurz je prerekvizitou pro všechna školení v TIBCO Statistica. |
|
Vyhodnotit v TIBCO Statistica data pomocí korelační a regresní analýzy a ANOVA pro opakovaná měření. Pochopit základy vícerozměrných statistických metod a časových řad. Tento kurz je prerekvizitou pro všechna školení v TIBCO Statistica. |
|
Využívat v TIBCO Statistica analýzu rozptylu (ANOVA) pro jednofaktorová, vícefaktorová a opakovaná měření. Používat metody ANCOVA (analýzu kovariance), MANOVA (multivariační analýzu rozptylu) a neparametrické ANOVA (Kruskal-Wallisova a Friedmannova). |
|
Třídit v TIBCO Statistica data podle určitých pravidel a využít vícerozměrné statistické metody k vyhodnocení a vizualizaci datových souborů s více jak 3 proměnnými. Používat analýzu hlavních komponent, faktorovou analýzu, vícerozměrné škálování, korespondenční analýzu, shlukovou analýzu, diskriminační analýzu a a další vícerozměrné statistické metody. |
|
Využívat v TIBCO Statistica testy normality, pracovat s metodami odlehlých pozorování a identifikovat odlehlé hodnoty. Zvolit a použít správný neparametrický test (alternativy k t-testům, neparametrická ANOVA, testy pro kontingenční tabulky, Spearmanův korelační koeficient). |
|
Zpracovat v TIBCO Statistica data metodami lineární a nelineární regrese a korelační analýzy. Rozumět multilinearitě a koeficient determinace. Sestavit jednoduché, vícenásobné a polynomální regresní modely. |