Ovládání programovacího jazyka R
- webinář ZDARMA -

Přesvědčte se, že nemusíte mít IT geny, abyste pracovali s datovými podklady, vytvářeli grafy, efektní reporty…

čtvrtek 23. 04. 2026 od 15:00
Prohlédnout

Nový formát vzdělávání: Letní škola statistiky 2026
Za 5 dní ovládnete statistiku v R, JASP, nebo Jamovi. Napořád.

20. - 24. 7. 2026
Prohlédnout

Objevte nové možnosti využití statistiky pro svou praxi.

Podívejte se na ZÁZNAM WEBINÁŘE Biostatistika v R
Prohlédnout

Obsah

Medián: definice, využití a výpočet


Medián je důležitým ukazatelem míry polohy. Vyjadřuje prostřední hodnotu ve vzestupně seřazeném souboru dat a dělí jej na dvě poloviny. Odděluje tedy 50 % spodních hodnot od 50 % horních hodnot. Z tohoto pohledu jde o typ kvantilu, někdy označovaný Q0,5.

Spolu s dalšími kvantily spočítáte medián u ordinálních proměnných a kvantitativních proměnných. U druhé skupiny je výpočet možný za předpokladu rovnoměrného rozložení dat a dostatečného počtu pozorování v každé kategorii (např. u školních známek, kde předpokládáme stejný rozdíl mezi jednotlivými stupni známkování).

medián

U normálního rozdělení dat se hodnota mediánu rovná hodnotě aritmetického průměru a modu:

Na rozdíl od aritmetického průměru medián neovlivňují extrémní hodnoty. V jejich přítomnosti se hodnota mediánu, průměru a modu liší:

U lichého počtu hodnot se medián počítá jako prostřední hodnota seřazených dat (viz příklad níže):

\[\tilde{x} = x_{\frac{n+1}{2}} \]

V případě sudého počtu hodnot se medián rovná aritmetickému průměru dvou prostředních hodnot (viz příklad níže):

Zvýhodněné balíčky kurzů

Zakupte si balíček 2 nebo více vybraných kurzů a ušetřete

\[\tilde{x} = \frac{1}{2}(x_{\frac{n}{2}} + x_{\frac{n}{2}+1}) \]

V obou případech vyjadřuje \( n \) počet prvků v souboru dat, zatímco \( x_{i} \) pořadí dané hodnoty při ve vzestupném seřazeném souboru hodnot. V praxi se medián nepočítá ručně, ale s pomocí funkcí statistických programů.


Využití mediánu

Medián je obzvláště užitečný ve výzkumech a analýzách, kde je důležité identifikovat střední hodnotu datové sady, která není ovlivněna extrémními hodnotami. To z něj činí ideální nástroj např. pro hodnocení:

  • příjmu v sociologických studiích, kde extrémní hodnoty (např. velmi vysoké příjmy) mohou zkreslit průměrné výsledky,
  • středových hodnot v environmentálních studiích, jako je kvalita vzduchu nebo vody, kde extrémní hodnoty způsobené neobvyklými událostmi (např. znečištění) nemusí odpovídat obvyklé kvalitě,
  • střední délky přežití v klinických studiích.


Kdy medián nepoužívat?

Přestože je medián užitečný v řadě aplikací, existují situace, kdy jeho použití není ideální. Jde zejména o případy, kdy:

  • je potřeba zohlednit všechny hodnoty v datové sadě, včetně extrémů (např. při studiu maximální možné efektivity nebo odolnosti materiálů),
  • data mají rovnoměrnou distribuci bez extrémních hodnot – střední hodnotu stejně dobře určí aritmetický průměr.
  • chybí některá data (vzorec bere v potaz pořadí hodnot).

Před využitím mediánu je nezbytné určit původ odlehlých hodnot ve vašich datech. Jejich přítomnost může totiž značit i chybu v měření. Použití mediánu by v takovém případě vedlo k mylné interpretaci získaných výsledků a celé vědecké studie.



Příklad výpočtu mediánu – lichý počet hodnot

Při zkoumání průměrné délky přežití pacientů po aplikaci experimentální léčby jste u jednotlivých dobrovolníků naměřili tyto hodnoty: 22, 3, 14, 8, 12, 10, 5, 15 a 17 měsíců.

Abychom medián nalezli, hodnoty vzestupně seřadíme:

Pořadí hodnoty 1 2 3 4 5 6 7 8 9
Hodnota (měsíce) 3 5 8 10 12 14 15 17 22

Máme 9 hodnot, použijeme tedy vzorec pro výpočet mediánu při lichém počtu hodnot. Po dosazení do rovnice vychází:

\[\tilde{x} = x_{\left(\frac{n+1}{2}\right)}\] \[\tilde{x} = x_{\left(\frac{9+1}{2}\right)}\] \[\tilde{x} = x_{5}\] \[\tilde{x} = 12\]

Medián je 5. hodnota v seřazeném souboru dat. Mediánová délka přežití (\(\tilde{x}\)) se tedy rovná 12 měsícům .

Pokud bychom u tohoto soubor spočítali aritmetický průměr, vyjde nám 11,8 měsíce. Data tedy nemají normální rozložení.



Příklad výpočtu mediánu – sudý počet hodnot

Máte za úkol vypočítat medián mzdy u následujícího (již seřazeného) souboru hodnot:

Pořadí hodnoty 1 2 3 4 5 6 7 8 9 10
Měsíční příjem (tisíce Kč) 15 15 20 22 25 33 36 45 58 112
Pořadí hodnoty 1 2 3 4 5 6 7 8 9 10
Měsíční příjem (tisíce Kč) 15 15 20 22 25 33 36 45 58 112

Při sudém počtu hodnot (10) dosadíme jejich počet do následujícího vzorce:

\[\tilde{x} = \frac{x_{\left(\frac{n}{2}\right)} + x_{\left(\frac{n}{2}+1\right)}}{2}\] \[\tilde{x} = \frac{x_{\left(\frac{10}{2}\right)} + x_{\left(\frac{10}{2}+1\right)}}{2}\] \[\tilde{x} = \frac{x_{5} + x_{6}}{2}\] \[\tilde{x} = \frac{25 + 33}{2}\] \[\tilde{x} = \frac{55}{2}\] \[\tilde{x} = 29000\]

Medián mzdy je tedy 29 000 Kč, zatímco její aritmetický průměr 38 100 Kč. Rozložení dat j opět nerovnoměrné – průměr zvyšuje zejména poslední (extrémní) hodnota 112 000 Kč.



Výpočet mediánu v Excelu

# buňky A1 až A100 obsahují naměřené hodnoty

# funkce pro výpočet mediánu
=MEDIAN(A1:A100)


Výpočet mediánu v jazyce R

# naměřené hodnoty
data <- c(3, 5, 6, 7, 8)

# funkce pro výpočet mediánu
median(data)


Pro hromadný výpočet mediánu a dalších charakteristik popisné statistiky v jazyce R slouží příkaz summary(), resp. describe()podrobnosti najdete zde.



Mohlo by vás zajímat

Naše kurzy

Základní biostatistická analýza v jazyce R

Kurzy Ovládání programovacího jazyka R + Kurz biostatistiky I v jazyce R Přihlásit na kurz Lektoři: Mgr. Patrik Galeta, PhD. a Mgr. Bc. Silvie Bělašková, PhD. Trvání kurzu: 3 dny Naučte se od základů zpracovat a vyhodnotit klinická a biologická data základními statistickými metodami v jazyce R – i když jste s R nikdy nepracovali. Balíček za zvýhodněnou cenu kombinuje: A/ Ovládání programovacího jazyka R (1 den) – orientace v prostředí R a aplikace RStudio, importování dat z Excelu a dalších aplikací, transformace a zpracování proměnných a vytváření grafů. B/ Kurz biostatistiky I v jazyce R (2 dny) – design vědeckého experimentu, testování medicínských a biologických hypotéz pomocí parametrických (t-test, ANOVA, lineární regrese ad.) a neparametrických metod (Wilcoxnovy testy, Kruskal-Wallisova ANOVA), využívání kontingenčních tabulek. Procvičování příkladů probíhá v anglické verzi aplikace RStudio. Počítač vám zapůjčíme na místě, není třeba nosit vlastní. Chci se přihlásit Spokojených absolventů Adresa konání kurzu Délka kurzu Z kurzů budete mít největší užitek, pokud: se chcete naučit ovládat programovací jazyk R pro vyhodnocování dat ze svého klinického či biologického výzkumu, nemáte se zpracováním dat v jazyce R žádné zkušenosti a potřebujete datovou analýzu využívat ve své práci (výzkumní a technologičtí pracovníci, ad.). Jaké vstupní znalosti jsou potřeba? Pro absolvování balíčků kurzů nejsou potřeba žádné specifické znalosti – jde o školení pro úplné začátečníky. Co vše se naučíte? A/ Ovládání programovacího jazyka R jak se orientovat v prostředí aplikace RStudio a balíčku tidyverse , jak lehce importovat data různých formátů do R, proč data zpracovávat pomocí na sebe navazujících algoritmických sekvencí (tzv. pipelines), jak použít knihovnu dplyr pro snadnou úpravu proměnných a práci s nimi, možnosti úprav textových proměnných a faktorů pomocí knihoven stringr a forcats, jak hromadně upravit proměnné, jak vytvořit krásné a přehledné grafy v knihovně ggplot2. Ovládání programovacího jazyka R – podrobný sylabus Prostředí RStudia Jednotná syntax funkcí skupiny knihoven tidyverse Úsporné psaní kódu pomocí „pipeline“ Načtení dat do R z formátu MS Excel (knihovna readxl) a SAS, SPSS, Stata (knihovna haven) Práce s daty (knihovna dplyr) Výběr proměnných a případů Přejmenování proměnných Úprava proměnných (jednotlivě i hromadně) Spojení více tabulek pomocí společné proměnné Práce s daty v rámci skupin Úprava textových proměnných (knihovna stringr) Najít a nahradit řetězec Rozdělit a spojit řetězce Vyčistit řetězce Práce s faktory (knihovna forcats) Nastavit pořadí úrovně faktorů podle různých kritérií Přidat a odstranit úrovně Spojení úrovní více faktorů Práce s formátem datum (knihovna lubridate) Převedení data na formát datum Extrakce orku, měsíce, dne

Data mining v TIBCO Statistica

Přihlásit na kurz Lektor: doc. RNDr. Ing. Marcel Jiřina, Ph.D. Trvání kurzu: 2 dny Naučte se pomocí aplikace Statistica odhalit důležité informace ve svých datech data miningovými metodami. Na kurzu pro vědce, statistiky a datové analytiky vám na praktických příkladech ukážeme, jak data vytěžovat s pomocí pokročilých lineárních (regresních) i nelineárních modelů, neuronových sítí, klasifikačních stromů, metod strojového učení a dalších metod. Probereme také způsoby prezentace získaných výsledků (viz názory spokojených účastníků). 2denním kurzem vás provede vás provede doc. RNDr. Ing. Marcel Jiřina, Ph.D., děkan Fakulty informačních technologií Českého vysokého učení technického, který se věnuje výzkumu data-miningových metod, zejména zpracování textu a obrazu (viz profil lektora). Procvičování probíhá v české verzi aplikace TIBCO Statistica v modulu Data Miner. Počítač vám zapůjčíme na místě, není třeba nosit vlastní. Chci se přihlásit Adresa konání kurzu Délka kurzu Z kurzu budete mít největší užitek, pokud: potřebujete rychle a efektivně zpracovávat velké objemy dat (analytici z oblasti bankovnictví, pojišťovnictví a průmyslu, vědci), se chcete seznámit s modulem Data Miner a prohloubit své znalosti aplikace TIBCO Statistica. Jaké vstupní znalosti jsou potřeba? pro účast na kurzu je vhodné mít znalosti v rozsahu Základního kurzu statistiky I v TIBCO Statistica. Co se v kurzu naučíte? z jakých principů data miningu vychází a jak k němu přistupovat, připravit a zpracovat velké datové balíky pomocí klasifikačních a regresních stromů, lineárních modelů, metody shlukování či strojového učení, využívat techniky vytěžování textu a analýzy nezávislých komponent (ICA), sestavit predikční modely, vyhodnotit jejich kvalitu a získané výsledky správně interpretovat, nasadit modely na reálná data z praxe, automatizovat celý analytický proces, na co si dat při tvorbě modelů pozor a čemu se vyhnout. Chci vidět podrobný sylabus kurzu Úvod Základní informace o softwaru Statistica Výukové zdroje pro software a možnosti nápovědy Úvod do vytěžování dat, produkt Princip, možnosti, využití Práce s Recepty (wizardem) Příprava dat (načtení, výběr proměnných, transformace, vzorkování dat, odstranění duplicitních vzorů, filtrace odlehlých hodnot, oprava chybějících údajů) Detekce a případné odstranění podobných vstupních příznaků (prediktorů) Výběr důležitých prediktorů pro požadovanou úlohu Vytváření klasifikačních a regresních modelů Vyhodnocení kvality vytvořeného modelů Nasazení modelu v praxi Klasifikační a regresní stromy Princip, možnosti, využití CART stromy CHAID stromy Vytváření klasifikačních a regresních stromů v interaktivním režimu (generování stromu, prořezávání stromu, výběr rozhodovacích proměnných, výběr mezí) Generované stromy (Boosted Trees) Náhodné lesy (Random Forests) Lineární modely Princip regrese (Obecné) lineární modely Zobecněné lineární modely Zobecněné aditivní modely MARSplines Metody shlukování K-průměrů (k-means) Hierarchické a EM

Analýza rozptylu v TIBCO Statistica

Přihlásit na kurz Lektor: Mgr. Patrik Galeta, Ph.D. Naučte se v TIBCO Statistica správně používat funkce základní a pokročilé analýzy rozptylu a získané výsledky správně interpretovat. Na reálných příkladech vám ukážeme, jak pracovat s post-hoc testy i s různými ANOVA metodami pro porovnávání dvou a více skupin. 1denním kurzem vás provede Mgr. Patrik Galeta, Ph.D., odborný asistent katedry antropologie Západočeské univerzity v Plzni, který se statistice věnuje v rámci demografických studií (viz profil lektora). Procvičování probíhá v české verzi aplikace TIBCO Statistica. Počítač vám zapůjčíme na místě, není třeba nosit vlastní. Chci se přihlásit Adresa konání kurzu Délka kurzu Z kurzu budete mít největší užitek, pokud: chcete zjistit, jaké faktory (a v jaké míře) ovlivňují chování pozorovaných veličin (výzkumní pracovníci, datoví analytici a vědci), potřebujete svá data kvůli přesnosti vyhodnocovat pokročilejšími metodami analýzy rozptylu. Jaké vstupní znalosti jsou potřeba? pro účast na kurzu je vhodné mít znalosti v rozsahu základního kurzu statistiky I v TIBCO Statistica a základního kurzu statistiky II v TIBCO Statistica Co se na kurzu naučíte? jakým způsobem správně ověřovat předpoklady pro použití analýzy rozptylu, jak v TIBCO Statistica vhodně přeskupit data pro analýzu rozptylu, z kterých principů vycházejí metody ANOVA (pro jednofaktorová, vícefaktorová a opakovaná měření), ANCOVA, MANOVA a neparametrické ANOVA (Kruskal-Wallisova a Friedmannova), pochopit specifika jednotlivých metod, jaký typ analýzy pro daný úkol použít a jak výsledky správně interpretovat, jaké jsou rozdíly mezi jednotlivými post-hoc testy a jak je použít. Chci vidět podrobný sylabus kurzu Úvod Úvod do analýzy rozptylu Zopakování principu testování hypotéz Testy pro dva výběry (nepárové, párové a neparametrické) Metody analýzy rozptylu Ověřování předpokladů ANOVA Jednofaktorová ANOVA ANOVA pro opakovaná měření Analýza kovariance Vícerfaktorová ANOVA Vícerozměrná analýza rozptylu (MANOVA) Neparametrické metody analýzy rozptylu Kruskal-Wallisův test Friedmanova ANOVA Post-hoc testy Fisherův, Scheffého, atd. Názory spokojených účastníků Jaké školící materiály obdržíte? na kurzu obdržíte tištěné prezentace probírané látky, které vám následně zašleme v elektronické verzi Po kurzu Vám zašleme elektronickou verzi prezentace včetně příkladů. Jak dlouho kurz trvá? 1 pracovní den Kdo vás bude školit? Kurzem vás provede Mgr. Patrik Galeta, Ph.D., odborný asistent katedry antropologie Západočeské univerzity v Plzni, který se statistice věnuje v rámci demografických studií. Kolik kurz stojí, kde probíhá a jaké jsou možnosti platby? Kurz proběhne v prostorách Mendelovy univerzity v Brně. Cena kurzu je 7 900 Kč bez DPH. Součástí ceny je kromě zajištění pomůcek a školících materiálů také občerstvení v průběhu kurzu a oběd. Platba probíhá převodem oproti vystavené faktuře. Nezávazná přihláška na

Zvýhodněné balíčky kurzů

Zakupte si balíček 2 nebo více vybraných kurzů a ušetřete

[24. 4. 2024] Webinář ZDARMA: Jak získat 82% příspěvek na školení statistiky přes MPSV

Pod vedením zakladatele Datové akademie Dávida Tkáče mj. zjistíte: