Webinář ZDARMA [18. 1. 2024]

Nejčastější chyby v popisné statistice (a jak se jim vyhnout)

[PRŮVODCE] Jak vybrat správný kurz statistiky a datové analýzy?

Váháte, jaké školení si z naší nabídky zvolit? Žádný strach – jednotlivé oblasti kurzů spolu projdeme a ukážeme vám, v čem pro vás budou přínosné.

Obsah


Bez statistiky se věda dělat nedá. Když ale na analýzu dat skutečně přijde, tápeme, jakou metodu zvolit, nebo vybraný test nedokážeme správně použít. Nejprve si proto ujasněte, čeho chcete na našich kurzech dosáhnout.

Chcete porozumět základům statistiky? Zvýšit svou šanci na publikaci rukopisu? Nebo je vaším cílem spravovat data z výzkumu podle moderních standardů?

Následně postupujte při výběru kurzu následujícím způsobem:


Zvolte vhodný software

Všechna naše školení probíhají v jedné z několika populárních analytických aplikací. Důvod je prostý – jen málokdo už dnes vyhodnocuje svůj výzkum na papíře, a stejně tak naprostou většinu vědeckých redakcí zajímá, s jakým programem jste k předkládaným závěrům výzkumu došli.

Většina našich kurzantů volí software, který (alespoň na základní úrovni) ovládají. Ne každá aplikace je ovšem pro každý druh datové analýzy vhodná. Např. u logistické regrese vám  MS Excel bohatě postačí, s modelováním neuronových sítí vám ale příliš nepomůže.

V jakém softwaru tedy kurz absolvovat? Jednoduše řečeno, pokud je vaším cílem:

Zvýhodněné balíčky kurzů

Zakupte si balíček 2 nebo více vybraných kurzů a ušetřete

  • porozumět základům statistiky či správě výzkumných dat a provádět jednoduché testování hypotéz, vystačíte si s MS Excel,
  • používat pokročilé metody statistiky (vícerozměrné metody, logistická regrese, časové řady a predikce ad.) a datové analýzy (text mining, data mining ad.), zvolte TIBCO Statistica, RStudio nebo Python,
  • tvořit špičkové datové vizualizace, vyberte MS Power BI.

Jaké jsou přednosti a nevýhody jednotlivých aplikací?


MS Excel

MS Excel je komerční tabulkový procesor od společnosti Microsoft pro vytváření tabulek dat a jejich zpracování, analýzu a vizualizaci.

Výhody

✔️ rozšířená aplikace s jednoduchým ovládáním,

✔️ dostupný v češtině,

✔️ vhodný pro základní statistiku, pro zpracování dat a jejich správu dle FAIR Data Principles,

✔️ dostupný v desktopové i cloudové variantě (podle zakoupené licence).

Nevýhody

❌ bez rozšíření není vhodný pro pokročilou statistiku a datovou analýzu,

❌ obtížné zpracování velkých datasetů,

❌ nemá validované statistické funkce – u některých výpočtů nemusí poskytnout přesné výsledky,

❌ některá vědecká periodika nepřijímají rukopisy s daty zpracovanými v MS Excel.

Prohlédnout kurzy v MS Excel


TIBCO Statistica

TIBCO Statistica je software pro statistickou a datovou analýzu, ve kterém výsledky výzkumu zpracovává např. Harvard University, Massachusetts Institute of Technology, University of Cambridge nebo Yale University. Pro monitorování kvality výroby jej používá např. řada farmaceutických společností.

Výhody

✔️ uživatelsky přívětivé prostředí (podobné Excelu) a snadné ovládání,

✔️ dostupný v češtině,

✔️ více než 17 tisíc funkcí – vhodný pro základní statistiku i pokročilou datovou analýzu (regresní analýza, časové řady a predikce, neparametrické metody, neuronové sítě ad.),

✔️ validovaný dle ISO 9001 a dalších standardů – zvyšuje šanci na přijetí rukopisu.

Nevýhody

❌ vyšší náklady na pořízení licence,

❌ neexistuje v cloudové variantě,

❌ neobsahuje některé moderní statistické funkce.

Prohlédnout kurzy v TIBCO Statistica


Programovací jazyk R (RStudio)

Programovací jazyk R je zaměřený na statistickou a datovou analýzu. Pro jeho ovládání se často používá aplikace RStudio, která plní roli tzv. integrovaného vývojového prostředí (IDE).

Výhody

✔️ zcela zdarma (open-source produkt) a s velkou komunitou uživatelů,

✔️ více než 19 000 knihoven pro snadné ovládání a základní i pokročilé statistické funkce (vícerozměrné statistické metody nebo časové řady a predikce),

✔️ možnost tvorby vlastních skriptů (účastníkům kurzů zasíláme vyladěné skripty pro vlastní použití),

✔️ dostupný v desktopové i cloudové variantě.

Nevýhody

❌ dostupný pouze v angličtině,

❌ neexistuje oficiální podpora,

❌ v základní verzi (bez tzv. tidyverse knihoven) obtížnější na pochopení a ovládání,

❌ použité metody a rozšíření je třeba validovat pomocí tzv. riskmetric balíčku.

Prohlédnout kurzy v programovacím jazyce R


Python

Python je obecný programovací jazyk, vhodný mj. pro pokročilou datovou analýzu.

Výhody

✔️ zcela zdarma (open-source produkt) a s velkou komunitou uživatelů,

✔️ rychlé ovládnutí základů programování,

✔️ množství knihoven pro základní statistiku i pokročilé zpracování a vyhodnocení dat pomocí strojového učení (machine learning) a umělé inteligence (AI).

✔️ možnost tvorby vlastních skriptů a funkcí,

✔️ dostupný v desktopové i cloudové variantě.

Nevýhody

❌ dostupný pouze v angličtině,

❌ neexistuje oficiální podpora,

❌ obtížné zpracování velkých datasetů,

❌ použité metody a rozšíření je třeba validovat pomocí balíčku PyVal.

Kurzy v programovacím jazyce Python jsou v přípravě


MS Power BI

MS Power BI je aplikace společnosti Microsoft pro zpracování dat a jejich pokročilou vizualizaci.

Výhody

✔️ v základní verzi zdarma,

✔️ dostupný v češtině,

✔️ jednoduché ovládání,

✔️ možnost základní a vizuální explorativní analýzy a tvorby pokročilých vizualizací(včetně dashboardů),

✔️ dostupný v desktopové i cloudové variantě.

Nevýhody

❌ nevhodný pro pokročilou statistiku a datovou analýzu,

❌ obtížné zpracování velkých datasetů,

❌ nemá validované statistické funkce – u některých výpočtů nemusí poskytnout přesné výsledky,

❌ některá vědecká periodika nepřijímají rukopisy s daty zpracovanými v MS Power BI.

Prohlédnout kurzy v MS Power BI


Vyberte metody, které se chcete naučit

V tabulce níže najdete jednotlivé oblasti, které v našich kurzech pokrýváme, a jejich přínos pro výzkum. Tabulka zároveň slouží jako vodítko pro ty, kteří chtějí do statistické analýzy proniknout hlouběji.

Žlutě označené kurzy slouží prerekvizita pro navazující školení v daných osnovách.

Všechny kurzy v naší nabídce jsou prezenční (konají se v našem pražském školícím centru), trvají 1 až 2 dny a vedou je zkušení lektoři, kteří s daty sami dennodenně pracují. 


Osnova kurzů s MS Excel

Tento soubor kurzů je vhodný pro vědce ze všech oborů, kteří pracují v prostředí MS Excel a chtějí se orientovat v naprostých základech zpracování a statistické analýzy dat.

Kurz

Co po absolvování kurzu zvládnete?

Příprava výzkumných dat pro statistické vyhodnocení v MS Excel

Načíst, zpracovat a uložit v MS Excel data z výzkumu ve formátu vhodném pro jejich vyhodnocení.

Základy statistického zpracování dat v MS Excel pro vědce

Vyhodnotit v MS Excel data zpracovaná základními statistickými metodami a výsledky analýzy zobrazit a správně interpretovat.

Správa a řízení vědeckých dat dle FAIR Data Principles

Uložit a zpřístupnit v MS Excel data z výzkumu podle zásad FAIR Data Principles a Open Access.

Kurz je vhodný i pro vědce, kteří data vyhodnocují v jiných aplikacích.


Osnova kurzů s TIBCO Statistica – základní a mírně pokročilé vyhodnocování dat

Tento soubor kurzů je vhodný pro vědce ze všech oborů, kteří se chtějí naučit základy zpracování a statistickou analýzu dat v aplikaci TIBCO Statistica.

Kurz

Co po absolvování kurzu zvládnete?

Ovládání programu TIBCO Statistica

Ovládat aplikaci TIBCO Statistica, načíst do ní data, zpracovat je a uložit ve formátu vhodném pro jejich vyhodnocení.

Tento kurz je prerekvizitou pro všechna školení v TIBCO Statistica.

Základní kurz statistiky I v TIBCO Statistica

Chápat principy vyhodnocování hypotéz.

Použít v TIBCO Statistica metody popisné statistiky a vyhodnotit data pomocí základních parametrických (t-test, ANOVA) a neparametrických testů (Wilcoxnovy testy, Kruskal-Wallisova ANOVA).

Tento kurz je prerekvizitou pro všechna školení v TIBCO Statistica.

Základní kurz statistiky II v TIBCO Statistica

Vyhodnotit v TIBCO Statistica data pomocí korelační a regresní analýzy a ANOVA pro opakovaná měření.

Pochopit základy vícerozměrných statistických metod a časových řad.

Tento kurz je prerekvizitou pro všechna školení v TIBCO Statistica.

Analýza rozptylu v TIBCO Statistica

Využívat v TIBCO Statistica analýzu rozptylu (ANOVA) pro jednofaktorová, vícefaktorová a opakovaná měření.

Používat metody ANCOVA (analýzu kovariance), MANOVA (multivariační analýzu rozptylu) a neparametrické ANOVA (Kruskal-Wallisova a Friedmannova).

Vícerozměrné statistické metody v TIBCO Statistica

Třídit v TIBCO Statistica data podle určitých pravidel a využít vícerozměrné statistické metody k vyhodnocení a vizualizaci datových souborů s více jak 3 proměnnými.

Používat analýzu hlavních komponent, faktorovou analýzu, vícerozměrné škálování, korespondenční analýzu, shlukovou analýzu, diskriminační analýzu a a další vícerozměrné statistické metody.

Neparametrické metody v TIBCO Statistica

Využívat v TIBCO Statistica testy normality, pracovat s metodami odlehlých pozorování a identifikovat odlehlé hodnoty.

Zvolit a použít správný neparametrický test (alternativy k t-testům, neparametrická ANOVA, testy pro kontingenční tabulky, Spearmanův korelační koeficient).

Regresní analýza v TIBCO Statistica

Zpracovat v TIBCO Statistica data metodami lineární a nelineární regrese a korelační analýzy.

Rozumět multilinearitě a koeficient determinace. Sestavit jednoduché, vícenásobné a polynomální regresní modely.


Osnova kurzů s TIBCO Statistica – pokročilé vyhodnocování dat

Tento soubor školení je zaměřený pro vědce ze všech oborů, kteří se chtějí naučit metody pokročilého zpracování dat (včetně metod strojového učení) v aplikaci TIBCO Statistica.

Kurz

Co po absolvování kurzu zvládnete?

Časové řady a predikce v TIBCO Statistica

Zpracovat a vyhodnocovat v TIBCO Statistica časově zatížená data a odhadovat trendy.

Využívat stacionární procesy, exponenciální vyrovnávání a nestacionární, sezonní a ARMA modely.

Data mining v TIBCO Statistica

Připravit a zpracovat v TIBCO Statistica velké balíky dat pomocí klasifikačních a regresních stromů, lineárních modelů a metod shlukování či strojového učení.

Sestavit predikční modely, vyhodnotit jejich kvalitu a získané výsledky správně interpretovat. Nasadit modely na reálná data a celý analytický proces automatizovat.

Neuronové sítě v TIBCO Statistica

Porozumět základům modelování neuronových sítí a připravit vstupní data k analýze.

Sestavit v TIBCO Statistica vlastní i automatizované algoritmy pro klasifikační, regresní a shlukovou analýzu, analýzu časových řad a vyhodnotit kvalitu získaných výstupů.


Osnova kurzů s TIBCO Statistica – vyhodnocování dat pro pracovníky v biologii a lékařství

Tento soubor kurzů je vhodný pro vědce z lékařství a biomedicíny, kteří se chtějí naučit základní a pokročilé zpracování a analýzu dat v aplikaci TIBCO Statistica.

Kurz

Co po absolvování kurzu zvládnete?

Základní kurz biostatistiky I v TIBCO Statistica

Chápat principy vyhodnocování hypotéz.

Použít metody popisné statistiky a vyhodnotit data pomocí základních parametrických (t-test, ANOVA) a neparametrických testů (Wilcoxnovy testy, Kruskal-Wallisova ANOVA).

Tento kurz je prerekvizitou pro všechna školení pro pracovníky v biologii a lékařství v TIBCO Statistica.

Základní kurz biostatistiky II v TIBCO Statistica

Vyhodnotit data pomocí korelační a regresní analýzy, MANOVA a ANOVA pro opakovaná měření.

Pochopit základy vícerozměrných statistických metod a časových řad.

Tento kurz je prerekvizitou pro všechna školení pro pracovníky v biologii a lékařství v TIBCO Statistica.

Pokročilé modely v biostatistice v TIBCO Statistica

Používat v TIBCO Statistica metody pokročilé statistiky (vícenásobnou regresi, zobecněné lineární modely či základy analýzy přežití).

Správně interpretovat výsledky statistických analýz a medicíny založené na datech (evidence-based medicine) a psát lepší vědecké články.


Osnova kurzů s R (RStudio) – základní a mírně pokročilé vyhodnocování dat

Tento soubor kurzů je vhodný pro vědce ze všech oborů, kteří se chtějí naučit základy zpracování a statistickou analýzu dat v programovacím jazyce R (aplikace RStudio).

Kurz

Co po absolvování kurzu zvládnete?

Ovládání programovacího jazyka R

Ovládat programovací jazyk R v aplikaci RStudio s pomocí funkcí, které práci s jazykem R výrazně zjednodušují.

Načíst data, zpracovat je a uložit ve formátu vhodném pro jejich vyhodnocení.

Tento kurz je prerekvizitou pro všechna školení v jazyce R.

Základní kurz statistiky I v programovacím jazyce R

Chápat principy vyhodnocování hypotéz.

Použít v jazyce R (RStudio) metody popisné statistiky a vyhodnotit data pomocí základních parametrických (t-test, ANOVA) a neparametrických testů (Wilcoxnovy testy, Kruskal-Wallisova ANOVA).

Tento kurz je prerekvizitou pro všechna školení v jazyce R.

Základní kurz statistiky II v programovacím jazyce R

Vyhodnotit v jazyce R (RStudio) data pomocí korelační a regresní analýzy a ANOVA pro opakovaná měření.

Pochopit základy vícerozměrných statistických metod a časových řad.

Tento kurz je prerekvizitou pro všechna školení v jazyce R.

Analýza rozptylu v jazyce R

Používat v jazyce R (RStudio) analýzu rozptylu (ANOVA) pro jednofaktorová, vícefaktorová a opakovaná měření.

Používat metody ANCOVA (analýzu kovariance), MANOVA (multivariační analýzu rozptylu) a neparametrické ANOVA (Kruskal-Wallisova a Friedmannova).

Vícerozměrné statistické metody v programovacím jazyce R

Třídit v jazyce R (RStudio) data podle určitých pravidel a využít vícerozměrné statistické metody k vyhodnocení a vizualizaci datových souborů s více jak 3 proměnnými.

Používat analýzu hlavních komponent, faktorovou analýzu, vícerozměrné škálování, korespondenční analýzu, shlukovou analýzu, diskriminační analýzu a a další vícerozměrné statistické metody.

Regresní analýza v jazyce R

Zpracovat v jazyce R (RStudio) data metodami lineární a nelineární regrese a korelační analýzy.

Rozumět multilinearitě a koeficient determinace. Sestavit jednoduché, vícenásobné a polynomální regresní modely.

Základy R Markdown pro výzkumné pracovníky

Psát vědecké články a vytvářet atraktivní výstupy v R Markdown – populárním rozšíření programovacího jazyka R.

Vytvořit dokumenty ve formátech vyžadovaných různými periodiky, importovat do nich výzkumná data a ta vhodným způsobem vizualizovat.


Osnova kurzů s R (RStudio) – pokročilé vyhodnocování dat

Tento soubor školení je zaměřený pro vědce ze všech oborů, kteří se chtějí naučit metody pokročilého zpracování dat (včetně metod strojového učení) v programovacím jazyce R (aplikace RStudio).

Kurz

Co po absolvování kurzu zvládnete?

Časové řady a predikce v programovacím jazyce R

Zpracovat a vyhodnocovat v jazyce R (RStudio) časově zatížená data a odhadovat trendy.

Využívat stacionární procesy, exponenciální vyrovnávání a nestacionární, sezonní a ARMA modely.




Zvýhodněné balíčky kurzů

Zakupte si balíček 2 nebo více vybraných kurzů a ušetřete