Ovládání programovacího jazyka R
- webinář ZDARMA -

Přesvědčte se, že nemusíte mít IT geny, abyste pracovali s datovými podklady, vytvářeli grafy, efektní reporty…

čtvrtek 23. 04. 2026 od 15:00
Prohlédnout

Nový formát vzdělávání: Letní škola statistiky 2026
Za 5 dní ovládnete statistiku v R, JASP, nebo Jamovi. Napořád.

20. - 24. 7. 2026
Prohlédnout

Objevte nové možnosti využití statistiky pro svou praxi.

Podívejte se na ZÁZNAM WEBINÁŘE Biostatistika v R
Prohlédnout

Obsah

Modus: definice, využití a výpočet


Modus je míra polohy vyjadřující nejčastější hodnotu (frekvenci výskytu) zkoumané proměnné. Při výskytu jednoho modu označujeme datový soubor jako unimodální, u dvou modů jako bimodální a u více modů jako multimodální.

Modus lze spočítat u různých typů proměnných:

  • nominální data – např. nejčastější vedlejší účinek u experimentálního léku na gliom,
  • ordinální data – nejčastější stádium gliomu, se kterým pacienti přicházejí k lékaři,
  • diskrétní proměnné – nejčastější počet léčebných cyklů podaný pacientovi,
  • spojité proměnné – nejčastější koncentrace experimentálního léku v krvi hodinu po podání.

U nominálních, ordinálních a diskrétních dat jej zjistíte spočítáním četnosti jednotlivých hodnot (viz příklad níže):

modus nominální hodnoty

Příklad modu u nominální proměnné.

Pro spojité proměnné lze navíc konkrétní hodnotu vypočítat vzorcem tzv. aproximace módu v intervalových datech (viz příklad níže):

\[\text{Mo} = L + \frac{f_1 – f_0}{2f_1 – f_0 – f_2} \times h\]

\(L \) označuje dolní hranici modálního intervalu (intervalu s nejvyšší četností), \(f_1 \) četnost modálního intervalu, \(f_0 \) četnost intervalu před modálním intervalem, \(f_2 \) četnost intervalu za modálním intervalem a \(h \) šířku intervalů.

Pozor – aplikace pro statistickou analýzu, jako je Excel a jazyk R, nevyužívají pro získání výsledku aproximaci v intervalových datech, ale složitější postupy. Výsledky se proto mohou od ručního výpočtu lišit.

modus spojité proměnné

Příklad modu u spojité proměnné, která nabývá v určitém rozsahu libovolných hodnot – pro účely vizualizace se proto zobrazuje počet hodnot v rámci určitých intervalů.

V praxi se medián nepočítá ručně, ale s pomocí statistických programů.

Zvýhodněné balíčky kurzů

Zakupte si balíček 2 nebo více vybraných kurzů a ušetřete

Poznámka: pro výpočet modu v jazyce R budete potřebovat knihovny rstatix DescTools, které nainstalujete následujícím příkazem:

# instalace knihoven
install.packages(c("rstatix", "DescTools"))


Využití modu

Na rozdíl od průměru a mediánu lze modus použít i pro nečíselné proměnné v různých oborech:

  • zdravotnictví – nejčastější typu určitých příznaků onemocnění nebo vedlejších účinků studovaného léku,
  • sociologie – nejčastější dosažené vzdělání,
  • ekonomie – nejvíce kupovaná značka určitého druhu zboží,
  • geografie – nejčastější typ půdy v oblasti.

Spojité kvantitativní proměnné jsou při určování modu citlivé na šířku intervalu. Je proto třeba zvolit vhodnou metodu pro výpočet této šířky – často se využívá např. Sturgesovo pravidlo (viz níže).



Příklad výpočtu modu – ordinální proměnná

Vaším úkolem je určit modus stádia gliomu, se kterým pacienti poprvé přijdou do ordinace. K dispozici máte vzorek 20 nemocných, u kterých lékař diagnostikoval stádium nádoru:

Pořadí pacienta 1 2 3 4 5 6 7 8 9 10
Stádium gliomu III II IV II III IV I II III IV
Pořadí pacienta 11 12 13 14 15 16 17 18 19 20
Stádium gliomu II I III IV II I III IV I II

Nejprve hodnoty seřadíme: I, I, I, I, II, II, II, II, II, II, II, II, III, III, III, III, III, III, IV, IV, IV, IV

Poté určíme jejich četnost výskytu:

  • Stádium I: 4×,
  • Stádium II: 8×,
  • Stádium III: 6×,
  • Stádium IV: 4×.

Modus datového souboru je stádium II.


Výpočet modu v Excelu

V Excelu můžete pro nalezení modu použít dvě funkce:

  • Funkce MODE je vhodná v situaci, kdy soubor hodnot obsahuje pouze jeden modus; v opačném případě vrátí pouze první nalezený modus.
  • Funkce MODE.MULT vrátí všechny nalezené mody; je tedy ideální pro situace, kdy počet očekávaný modů neznáte nebo jich očekáváte více.
# buňky A1 až A100 obsahují naměřené hodnoty

# funkce pro výpočet prvního modu
=MODE(A1:A100)

# funkce pro výpočet všech modů
=MODE.MULT(A1:A100)


Výpočet modu v jazyce R

Pro nalezení modu v jazyce R můžete využít tyto funkce:

  • get_mode z balíčku rstatix vrátí hodnoty všech modů,
  • Mode z balíčku DescTools vrátí 1) hodnoty všech modů, 2) početní zastoupení těchto hodnot.
# načtení knihoven
library(rstatix)
library(DescTools)

# naměřené hodnoty
data <- c("Male", "Female", "Female", "Female", "Male")

# funkce pro výpočet modu
get_mode(data)

# funkce pro výpočet modu a početního zastoupení modu
Mode(data)


Příklad výpočtu modu – spojitá proměnná

Máte za úkol vypočítat modus koncentrace nádorových markerů v krvi pacienta s gliomem. Datová sada obsahuje následujících 20 hodnot:

Pořadí pacienta 1 2 3 4 5 6 7 8 9 10
Koncentrace markerů (ng/ml) 5,2 6,9 5,5 6,0 5,9 7,1 6,5 5,8 6,3 7,0
Pořadí pacienta 11 12 13 14 15 16 17 18 19 20
Koncentrace markerů (ng/ml) 5,7 6,6 5,4 6,1 7,2 6,4 5,6 6,7 5,3 6,9

Pracujeme se spojitými proměnnými, proto je nejprve třeba určit počet intervalů a jejich šířku. K tomu slouží Sturgesova pravidlo:

\[ k = 1 + (3.3 \times \log n) \]

\(k \) vyjadřuje počet intervalů a \(n \) počet hodnot (pozorování) v datovém souboru. Pokud hodnota \(k \) není celočíselná, zaokrouhlíme ji nahoru. Po dosazení vychází:

\[ k = 1 + (3.3 \times \log 20) \] \[ k = 5.29 \]

Po zaokrouhlení nahoru se tedy \(k \) rovná 6 – hodnoty našeho souboru zobrazíme v 6 intervalech.

Pro určení šířky intervalu (\(h\)) spočítáme rozpětí hodnot v datovém souboru (\(R\)) a vydělíme jej počtem intervalů (\(k\)).

Víme, že nejnižší hodnota (\(x_{\text{min}}\)) je 5,2 ng/ml a nejvyšší hodnota (\(x_{\text{max}}\)) je 7,2 ng/ml:

\[ R = x_{\text{max}} – x_{\text{min}} \] \[ R = 7.2 – 5.2 \] \[ R = 2.0 \]

Rozpětí (\(R\)) je tedy 2,0 ng/ml. Dosadíme získané hodnoty do vzorce pro výpočet šířky intervalu:

\[ h = \frac{R}{k} \] \[ h = \frac{2.0}{6} \] \[ h = 0.33 \]

Jednotlivé intervaly mají tedy přibližně tento rozsah:

Pořadí intervalu 1 2 3 4 5 6
Rozsah koncentrace (ng/ml) 5,2–5,53 5,53–5,86 5,86–6,19 6,19–6,52 6,52–6,85 6,85–7,2

Nakonec spočítáme četnost výskytu hodnot v jednotlivých intervalech:

  • 1. interval (5,2–5,53 ng/ml) – 5,2 ng/ml, 5,3 ng/ml, 5,4 ng/ml, 5,5 ng/ml (4 hodnoty),
  • 2. interval (5,53–5,86 ng/ml) – 5,6 ng/ml, 5,7 ng/ml, 5,8 ng/ml (3 hodnoty),
  • 3. interval (5,86–6,19 ng/ml) – 5,9 ng/ml, 6,0 ng/ml, 6,1 ng/ml (3 hodnoty),
  • 4. interval (6,19–6,52 ng/ml) – 6,3 ng/ml, 6,4 ng/ml, 6,5 ng/ml (3 hodnoty),
  • 5. interval (6,52–6,85 ng/ml) – 6,6 ng/ml, 6,7 ng/ml (2 hodnoty),
  • 6. interval (6,85–7,2 ng/ml) – 6,9 ng/ml, 6,9 ng/ml, 7,0 ng/ml, 7,1 ng/ml, 7,2 ng/ml (5 hodnot).

Modální interval datového souboru je 6,85–7,2 ng/ml. Datový soubor je tedy unimodální.

Přesnou hodnotu modu spočítáme metodou aproximace (viz výše).

Dolní hranice modálního intervalu (\(L \)) je 6,85 ng/ml, četnost modálního intervalu (\(f_1 \)) je 5, četnost intervalu před modálním intervalem (\(f_0 \)) je 2, četnost intervalu za modálním intervalem (\(f_2 \)) je 0 (za modálním intervalem žádný další interval nemáme) a zmiňovaná intervalu (\(h \)) je 0,33.

Dosadíme tedy do vzorce:

\[\text{Mo} = L + \frac{f_1 – f_0}{2f_1 – f_0 – f_2} \times h\] \[\text{Mo} = 6.85 + \frac{5 – 2}{(2 \times 5) – 2 – 0} \times 0.33\] \[\text{Mo} = 6.97\]

Modus koncentrace nádorových markerů je tedy 6,97 ng/ml.



Výpočet modu spojité proměnné v jazyce R

Modus spojité proměnné v R zjistíte výpočtem maxima tzv. kernelové hustoty:

# naměřené hodnoty
data <- c(5.2, 6.9, 5.5, 6.0, 5.9, 7.1, 6.5, 5.8, 6.3, 7.0)

# funkce pro odhad kernelové hustoty
dens <- density(data)

# funkce pro nalezení maxima kernelové hustoty
mode_value <- dens$x[which.max(dens$y)]

# výstup modu
mode_value


Mohlo by vás zajímat

Články
Analýza dat ve vědě a výzkumu

Statistická analýza je klíčem ke kvalitnějším výsledkům a publikaci v prestižních vědeckých časopisech. Jak ji dělat správně?

Naše kurzy

Regresní analýza v TIBCO Statistica

Přihlásit na kurz Lektor: Mgr. Patrik Galeta, PhD. Naučte se v aplikaci Statistica zpracovávat svoje data pomocí lineární a nelineární regrese – jedné z nejvyužívanějších statistických metod. Na kurzu vás provedeme vás různými modely regresní analýzy, metodami vyhodnocení a naučíme vás data správně vizualizovat (viz názory spokojených účastníků). 1denním kurzem vás provede Mgr. Patrik Galeta, PhD., odborný asistent katedry antropologie Západočeské univerzity v Plzni, který se statistice věnuje v rámci demografických studií (viz profil lektora). Procvičování probíhá v české verzi aplikace TIBCO Statistica. Počítač vám zapůjčíme na místě, není třeba nosit vlastní. Chci se přihlásit Adresa konání kurzu Délka kurzu Z kurzu budete mít největší užitek, pokud: potřebujete rychle a efektivně zpracovávat data z výzkumu, vývoje či obchodu (vědečí pracovníci, datoví nebo finanční analytici), chcete prohloubit své znalosti v oblasti regresní analýzy. Jaké vstupní znalosti jsou potřeba? Pro absolvování tohoto kurzu je vhodné mít znalosti v rozsahu kurzů: Základní kurz statistiky I v TIBCO Statistica a Základní kurz statistiky II v TIBCO Statistica. Co v kurzu naučíte? jaké regresní modely existují a jak správně ověřit předpoklady pro jejich použití, co je logistická regrese, jak sestavit regresní model a změřit jeho kvalitu, podle čeho hodnotit model jako celek, jaký je význam korelační analýzy (především multikolinearity), jakým způsobem data vhodně vizualizovat na co si dat při tvorbě regresních modelů pozor a čemu se vyhnout. Chci vidět podrobný sylabus kurzu Úvod Úvod do regresní analýzy Princip regresní analýzy Korelační analýza Význam korelace Multikolinearita Koeficient determinace Lineární regresní modely Ověření předpokladů Jednoduchá regrese Vícenásobná regrese Polynomiální regrese (určení stupně polynomu) Nelineární regresní modely Úvod do logistické regrese Názory spokojených účastníků Chci vidět další názory účastníků kurzu Jaké školící materiály obdržíte? na kurzu obdržíte tištěné prezentace probírané látky, které vám následně zašleme v elektronické verzi Jak dlouho kurz trvá? 1 pracovní den Kdo vás bude školit? Kurzem vás provede Mgr. Patrik Galeta, PhD., odborný asistent katedry antropologie Západočeské univerzity v Plzni. Statistickým metodám se věnuje v rámci demografických studií, na ZČU vede také kurz zpracování dat. Vedle stovek studentů proškolil ve statistických metodách také stovky účastníků našich kurzů. Kolik kurz stojí, kde probíhá a jaké jsou možnosti platby? Kurz probíhá v našem školícím středisku na adrese Kodaňská 1441/46, Praha 10. Cena kurzu je 7 900 Kč bez DPH. Součástí ceny je kromě zajištění pomůcek a školících materiálů také občerstvení v průběhu kurzu a oběd. Zvýhodněné balíčky kurzů Zakupte si balíček 2 nebo více vybraných kurzů a ušetřete Prohlédnout

Ovládání R Markdown pro výzkumné pracovníky

Naučte se psát vědecké články a vytvářet atraktivní výstupy v R Markdown – populárním rozšíření programovacího jazyka R.
Po absolvování kurzu zvládnete v R Markdown vytvořit dokumenty ve formátech vyžadovaných různými periodiky, vložit do nich výzkumná data a ta vhodným způsobem vizualizovat.

Kompletní biostatistická analýza v jazyce R

Ovládání jazyka R + Kurz biostatistiky I v jazyce R + Kurz biostatistiky II v jazyce R Přihlásit na kurz Lektoři: Mgr. Patrik Galeta, PhD. a Mgr. Bc. Silvie Bělašková, PhD. Trvání kurzu: 5 dnů Naučte se od úplné nuly vyhodnocovat klinická a biologická data základními a pokročilými metodami v jazyce R – a výrazně zvyšte kvalitu svých výzkumných publikací. Balíček za zvýhodněnou cenu kombinuje: A/ Ovládání programovacího jazyka R (1 den) – orientace v prostředí R a aplikace RStudio, importování dat z Excelu a dalších aplikací, transformace a zpracování proměnných a vytváření grafů. B/ Kurz biostatistiky I v jazyce R (2 dny) – design vědeckého experimentu, testování medicínských a biologických hypotéz pomocí parametrických (t-test, ANOVA, lineární regrese ad.) a neparametrických metod (Wilcoxnovy testy, Kruskal-Wallisova ANOVA), využívání kontingenčních tabulek. C/ Kurz biostatistiky II v jazyce R (2 dny) – vyhodnocení dat pomocí korelační analýzy, logistické regrese a dalších metod, základy vícerozměrných statistických metod a časových řad, metodiky servival a risk analysis. Procvičování příkladů probíhá v anglické verzi aplikace RStudio. Počítač vám zapůjčíme na místě, není třeba nosit vlastní. Chci se přihlásit Spokojených absolventů Adresa konání kurzu Délka kurzu Z kurzů budete mít největší užitek, pokud: nemáte se zpracováním dat v jazyce R žádné zkušenosti a potřebujete datovou analýzu využívat ve své práci (výzkumní a technologičtí pracovníci, ad.). se chcete naučit vyhodnocovat klinická a biologická data základními a pokročilými metodami v programovacím jazyce R, chcete výrazně zvýšit svou šanci na publikování v prestižním periodiku. Jaké vstupní znalosti jsou potřeba? Pro absolvování balíčků kurzů nejsou potřeba žádné specifické znalosti – začneme od základů. Co vše se naučíte? A/ Ovládání programovacího jazyka R jak se orientovat v prostředí aplikace RStudio a balíčku tidyverse , jak lehce importovat data různých formátů do R, proč data zpracovávat pomocí na sebe navazujících algoritmických sekvencí (tzv. pipelines), jak použít knihovnu dplyr pro snadnou úpravu proměnných a práci s nimi, možnosti úprav textových proměnných a faktorů pomocí knihoven stringr a forcats, jak hromadně upravit proměnné, jak vytvořit krásné a přehledné grafy v knihovně ggplot2. Ovládání programovacího jazyka R – podrobný sylabus Prostředí RStudia Jednotná syntax funkcí skupiny knihoven tidyverse Úsporné psaní kódu pomocí „pipeline“ Načtení dat do R z formátu MS Excel (knihovna readxl) a SAS, SPSS, Stata (knihovna haven) Práce s daty (knihovna dplyr) Výběr proměnných a případů Přejmenování proměnných Úprava proměnných (jednotlivě i hromadně) Spojení více tabulek pomocí společné proměnné Práce s daty v rámci skupin Úprava textových proměnných (knihovna

Správa a řízení vědeckých dat dle FAIR Data Principles

Přihlásit na kurz Lektor: Ing. Jan Červený, Ph.D. Spravujte svá experimentální data tak, abyste s nimi vy i vědecká komunita mohli dlouhodobě pracovat – a vytěžit z nich další poznatky. Publikováním výsledků životnost nasbíraných dat nekončí. V kurzu pro vědecké pracovníky vás krok po kroku naučíme, jak data z experimentů uložit a zpřístupnit podle zásad FAIR Data Principles. Díky tomu s nimi budete moci opakovaně pracovat a hledat v nich nové souvislosti. 2denním kurzem vás provede Ing. Jan Červený, PhD., vedoucí výzkumný pracovník oddělení adaptivních a chytrých biotechnologií na Ústavu výzkumu globální změny AV ČR (viz profil lektora).  Procvičování probíhá v české verzi aplikace MS Excel 365 . Počítač vám zapůjčíme na místě, není třeba nosit vlastní Chci se přihlásit Adresa konání kurzu Délka kurzu Z kurzu budete mít největší užitek, pokud: chcete zvýšit své šance na získání výzkumných grantů, potřebujete zorganizovat a propojit data z různých projektů (a zpřístupnit je), publikujete vědecké články a potřebujete mít data v excelentní kvalitě, chcete zlepšit úroveň vědeckých výstupů své organizace. Jaké vstupní znalosti jsou potřeba? Pro absolvování kurzu jsou vhodné znalosti v rozsahu: MS Excel na základní uživatelské úrovni (základní operace a funkce), základní terminologie zpracování a ukládání informací (databázové principy, elementární matematické operace s daty), povědomí o existenci globálních systémů identifikace digitálních objektů (DOI apod.) Co se v kurzu naučíte? jak s daty systematicky pracovat a co to vašemu výzkumu přinese, jak se ke správě dat staví čtyři základní pilíře konceptu FAIR Data Principles (Findability – dohledatelnost, Accessibility – dostupnost, Interoperability – interoperabilita, Reuse – opakované použití), principy správného ukládání a popisování datových setů, jak propojit data z různých zdrojů (např. laboratorních zařízení či úložišť), jaké technologie jsou dostupné a které vybrat, jak data efektivně vyhodnotit s pomocí statistické analýzy. Chci vidět podrobný sylabus kurzu    Úvod:  Co jsou FAIR Data Principles a proč je důležité je dodržovat.  Dohledatelnost (Findability) – Jak zajistit nalezení dat včetně použití metadat a identifikátorů. Dostupnost (Accessibility) – Jak umožnit přístup k datům a zajistit jejich dostupnost pro výzkum. Interoperabilita (Interoperability) – Jak zajistit, aby data byla srozumitelná a čitelná pro různé systémy a aplikace. Opakované použití (Reuse) – Jak zajistit opakované využití dat v rámci výzkumné organizace i mimo ní.   Jaké jsou důvody potřeby systematického zpracovávání dat nejen kvůli naplňování požadavků na Open Science. Zvýhodněné balíčky kurzů Zakupte si balíček 2 nebo více vybraných kurzů a ušetřete Prohlédnout balíčky kurzů Jaký je přístup EU a

Zvýhodněné balíčky kurzů

Zakupte si balíček 2 nebo více vybraných kurzů a ušetřete

[24. 4. 2024] Webinář ZDARMA: Jak získat 82% příspěvek na školení statistiky přes MPSV

Pod vedením zakladatele Datové akademie Dávida Tkáče mj. zjistíte: