Ovládání programovacího jazyka R
- webinář ZDARMA -

Přesvědčte se, že nemusíte mít IT geny, abyste pracovali s datovými podklady, vytvářeli grafy, efektní reporty…

úterý 12. 05. 2026 od 15:00
Prohlédnout

Nový formát vzdělávání: Letní škola statistiky 2026
Za 5 dní ovládnete statistiku v R, JASP, nebo Jamovi. Napořád.

20. - 24. 7. 2026
Prohlédnout

Objevte nové možnosti využití statistiky pro svou praxi.

Podívejte se na ZÁZNAM WEBINÁŘE Biostatistika v R
Prohlédnout

Obsah

Medián: definice, využití a výpočet


Medián je důležitým ukazatelem míry polohy. Vyjadřuje prostřední hodnotu ve vzestupně seřazeném souboru dat a dělí jej na dvě poloviny. Odděluje tedy 50 % spodních hodnot od 50 % horních hodnot. Z tohoto pohledu jde o typ kvantilu, někdy označovaný Q0,5.

Spolu s dalšími kvantily spočítáte medián u ordinálních proměnných a kvantitativních proměnných. U druhé skupiny je výpočet možný za předpokladu rovnoměrného rozložení dat a dostatečného počtu pozorování v každé kategorii (např. u školních známek, kde předpokládáme stejný rozdíl mezi jednotlivými stupni známkování).

medián

U normálního rozdělení dat se hodnota mediánu rovná hodnotě aritmetického průměru a modu:

Na rozdíl od aritmetického průměru medián neovlivňují extrémní hodnoty. V jejich přítomnosti se hodnota mediánu, průměru a modu liší:

U lichého počtu hodnot se medián počítá jako prostřední hodnota seřazených dat (viz příklad níže):

\[\tilde{x} = x_{\frac{n+1}{2}} \]

V případě sudého počtu hodnot se medián rovná aritmetickému průměru dvou prostředních hodnot (viz příklad níže):

Zvýhodněné balíčky kurzů

Zakupte si balíček 2 nebo více vybraných kurzů a ušetřete

\[\tilde{x} = \frac{1}{2}(x_{\frac{n}{2}} + x_{\frac{n}{2}+1}) \]

V obou případech vyjadřuje \( n \) počet prvků v souboru dat, zatímco \( x_{i} \) pořadí dané hodnoty při ve vzestupném seřazeném souboru hodnot. V praxi se medián nepočítá ručně, ale s pomocí funkcí statistických programů.


Využití mediánu

Medián je obzvláště užitečný ve výzkumech a analýzách, kde je důležité identifikovat střední hodnotu datové sady, která není ovlivněna extrémními hodnotami. To z něj činí ideální nástroj např. pro hodnocení:

  • příjmu v sociologických studiích, kde extrémní hodnoty (např. velmi vysoké příjmy) mohou zkreslit průměrné výsledky,
  • středových hodnot v environmentálních studiích, jako je kvalita vzduchu nebo vody, kde extrémní hodnoty způsobené neobvyklými událostmi (např. znečištění) nemusí odpovídat obvyklé kvalitě,
  • střední délky přežití v klinických studiích.


Kdy medián nepoužívat?

Přestože je medián užitečný v řadě aplikací, existují situace, kdy jeho použití není ideální. Jde zejména o případy, kdy:

  • je potřeba zohlednit všechny hodnoty v datové sadě, včetně extrémů (např. při studiu maximální možné efektivity nebo odolnosti materiálů),
  • data mají rovnoměrnou distribuci bez extrémních hodnot – střední hodnotu stejně dobře určí aritmetický průměr.
  • chybí některá data (vzorec bere v potaz pořadí hodnot).

Před využitím mediánu je nezbytné určit původ odlehlých hodnot ve vašich datech. Jejich přítomnost může totiž značit i chybu v měření. Použití mediánu by v takovém případě vedlo k mylné interpretaci získaných výsledků a celé vědecké studie.



Příklad výpočtu mediánu – lichý počet hodnot

Při zkoumání průměrné délky přežití pacientů po aplikaci experimentální léčby jste u jednotlivých dobrovolníků naměřili tyto hodnoty: 22, 3, 14, 8, 12, 10, 5, 15 a 17 měsíců.

Abychom medián nalezli, hodnoty vzestupně seřadíme:

Pořadí hodnoty 1 2 3 4 5 6 7 8 9
Hodnota (měsíce) 3 5 8 10 12 14 15 17 22

Máme 9 hodnot, použijeme tedy vzorec pro výpočet mediánu při lichém počtu hodnot. Po dosazení do rovnice vychází:

\[\tilde{x} = x_{\left(\frac{n+1}{2}\right)}\] \[\tilde{x} = x_{\left(\frac{9+1}{2}\right)}\] \[\tilde{x} = x_{5}\] \[\tilde{x} = 12\]

Medián je 5. hodnota v seřazeném souboru dat. Mediánová délka přežití (\(\tilde{x}\)) se tedy rovná 12 měsícům .

Pokud bychom u tohoto soubor spočítali aritmetický průměr, vyjde nám 11,8 měsíce. Data tedy nemají normální rozložení.



Příklad výpočtu mediánu – sudý počet hodnot

Máte za úkol vypočítat medián mzdy u následujícího (již seřazeného) souboru hodnot:

Pořadí hodnoty 1 2 3 4 5 6 7 8 9 10
Měsíční příjem (tisíce Kč) 15 15 20 22 25 33 36 45 58 112
Pořadí hodnoty 1 2 3 4 5 6 7 8 9 10
Měsíční příjem (tisíce Kč) 15 15 20 22 25 33 36 45 58 112

Při sudém počtu hodnot (10) dosadíme jejich počet do následujícího vzorce:

\[\tilde{x} = \frac{x_{\left(\frac{n}{2}\right)} + x_{\left(\frac{n}{2}+1\right)}}{2}\] \[\tilde{x} = \frac{x_{\left(\frac{10}{2}\right)} + x_{\left(\frac{10}{2}+1\right)}}{2}\] \[\tilde{x} = \frac{x_{5} + x_{6}}{2}\] \[\tilde{x} = \frac{25 + 33}{2}\] \[\tilde{x} = \frac{55}{2}\] \[\tilde{x} = 29000\]

Medián mzdy je tedy 29 000 Kč, zatímco její aritmetický průměr 38 100 Kč. Rozložení dat j opět nerovnoměrné – průměr zvyšuje zejména poslední (extrémní) hodnota 112 000 Kč.



Výpočet mediánu v Excelu

# buňky A1 až A100 obsahují naměřené hodnoty

# funkce pro výpočet mediánu
=MEDIAN(A1:A100)


Výpočet mediánu v jazyce R

# naměřené hodnoty
data <- c(3, 5, 6, 7, 8)

# funkce pro výpočet mediánu
median(data)


Pro hromadný výpočet mediánu a dalších charakteristik popisné statistiky v jazyce R slouží příkaz summary(), resp. describe()podrobnosti najdete zde.



Mohlo by vás zajímat

Naše kurzy

Zpracování geodat v programovacím jazyce R

Přihlásit na kurz Lektor: Mgr. Ondřej Ledvinka, PhD. Trvání kurzu: 2 dny Naučte se od základu vyhodnocovat geoprostorová data (geodata) v programovacím jazyce R pomocí funkcí, které jejich hromadné zpracování zjednodušují a urychlují. V kurzu pro vědecké pracovníky z oblasti geověd vás naučíme, jak geodata zpracovat a transformovat na tzv. tidy formát i jak je analyzovat a vizualizovat (tvořit mapy). Po absolvování školení tak zvládnete rychle vytvořit analytické skripty pro geodata. 2denním kurzem vás provede Mgr. Ondřej Ledvinka, PhD., specialista Oddělení hydrofondu a bilancí ČHMÚ a odborný asistent Katedry fyzické geografie a geoekologie Univerzity Karlovy, který se zpracování geodat věnuje v oblasti hydrologie a klimatologie (viz profil lektora). Procvičování probíhá v anglické verzi aplikace RStudio. Počítač vám zapůjčíme na místě, není třeba nosit vlastní. Po skončení kurzů navíc získáte přes 40 skriptů, které použijete k analýze vlastních dat. Chci se přihlásit 60 minutový webinář jako OCHUTNÁVKA ZDARMA Adresa konání kurzu Délka kurzu Z kurzu budete mít největší užitek, pokud: se chcete naučit ovládat programovací jazyk R pro vyhodnocování dat, jejichž nedílnou součástí je geometrie (vektorová geodata, rastrová geodata), nemáte se zpracováním geodat v jazyce R žádné zkušenosti a potřebujete jejich analýzu využívat ve své práci (výzkumní pracovníci z oblasti geografie, geologie, hydrologie, klimatologie, ochrany životního prostředí, dálkového průzkumu Země a dalších geověd), máte s jazykem R zkušenosti, ale potřebujete své znalosti adaptovat pro zpracování geodat, potřebujete zefektivnit analýzu geodat ve své organizaci. Jaké vstupní znalosti jsou potřeba? Pro účast na kurzu je vhodné mít znalosti v rozsahu kurzu Ovládání programovacího jazyka R. Co se na kurzu naučíte? jak se orientovat v prostředí aplikace RStudio (zejm. pokud jde o specifické vlastnosti geodat v prostředí RStudia), jak importovat geodata různých formátů do R z různých zdrojů (souborů, serverových služeb a prostřednictvím specifických funkcí v R balíčcích), jak naopak efektivně ukládat geodata do souborů, aby nedocházelo ke ztrátě pracně vytvořených výsledků nebo meziproduktů, proč geograficky zatížená data zpracovávat pomocí na sebe navazujících algoritmických sekvencí (tzv. pipelines), jak využívat ekosystém balíčků tidyverse vzhledem ke zpracování vektorových geodat (především funkce balíčku sf), jak tvořit nová vektorová a rastrová geodata se specifikací souřadnicového referenčního systému – jak z existujících souřadnic, tak ze zcela nově definovaných souřadnicových párů (funkce balíčků sf, sfheaders) či rozsahu a horizontálního rozlišení (funkce balíčku terra), jak při zpracování geodat pomáhá funkcionální programování v R s definicemi anonymních funkcí, jak v R tvořit statické (tematické) mapy prostřednictvím funkcí balíčku ggplot2 a jemu podobných (např. tidyterra, ggspatial) nebo

Základy MS Power BI

Naučte se data z obchodu, financí či logistiky zpracovat do přehledných reportů – a naplánujte podle nich své další kroky.

Zvýhodněné balíčky kurzů

Zakupte si balíček 2 nebo více vybraných kurzů a ušetřete

[24. 4. 2024] Webinář ZDARMA: Jak získat 82% příspěvek na školení statistiky přes MPSV

Pod vedením zakladatele Datové akademie Dávida Tkáče mj. zjistíte: