Ovládání programovacího jazyka R
- webinář ZDARMA -

Přesvědčte se, že nemusíte mít IT geny, abyste pracovali s datovými podklady, vytvářeli grafy, efektní reporty…

úterý 12. 05. 2026 od 15:00
Prohlédnout

Nový formát vzdělávání: Letní škola statistiky 2026
Za 5 dní ovládnete statistiku v R, JASP, nebo Jamovi. Napořád.

20. - 24. 7. 2026
Prohlédnout

Objevte nové možnosti využití statistiky pro svou praxi.

Podívejte se na ZÁZNAM WEBINÁŘE Biostatistika v R
Prohlédnout

Obsah

Medián: definice, využití a výpočet


Medián je důležitým ukazatelem míry polohy. Vyjadřuje prostřední hodnotu ve vzestupně seřazeném souboru dat a dělí jej na dvě poloviny. Odděluje tedy 50 % spodních hodnot od 50 % horních hodnot. Z tohoto pohledu jde o typ kvantilu, někdy označovaný Q0,5.

Spolu s dalšími kvantily spočítáte medián u ordinálních proměnných a kvantitativních proměnných. U druhé skupiny je výpočet možný za předpokladu rovnoměrného rozložení dat a dostatečného počtu pozorování v každé kategorii (např. u školních známek, kde předpokládáme stejný rozdíl mezi jednotlivými stupni známkování).

medián

U normálního rozdělení dat se hodnota mediánu rovná hodnotě aritmetického průměru a modu:

Na rozdíl od aritmetického průměru medián neovlivňují extrémní hodnoty. V jejich přítomnosti se hodnota mediánu, průměru a modu liší:

U lichého počtu hodnot se medián počítá jako prostřední hodnota seřazených dat (viz příklad níže):

\[\tilde{x} = x_{\frac{n+1}{2}} \]

V případě sudého počtu hodnot se medián rovná aritmetickému průměru dvou prostředních hodnot (viz příklad níže):

Zvýhodněné balíčky kurzů

Zakupte si balíček 2 nebo více vybraných kurzů a ušetřete

\[\tilde{x} = \frac{1}{2}(x_{\frac{n}{2}} + x_{\frac{n}{2}+1}) \]

V obou případech vyjadřuje \( n \) počet prvků v souboru dat, zatímco \( x_{i} \) pořadí dané hodnoty při ve vzestupném seřazeném souboru hodnot. V praxi se medián nepočítá ručně, ale s pomocí funkcí statistických programů.


Využití mediánu

Medián je obzvláště užitečný ve výzkumech a analýzách, kde je důležité identifikovat střední hodnotu datové sady, která není ovlivněna extrémními hodnotami. To z něj činí ideální nástroj např. pro hodnocení:

  • příjmu v sociologických studiích, kde extrémní hodnoty (např. velmi vysoké příjmy) mohou zkreslit průměrné výsledky,
  • středových hodnot v environmentálních studiích, jako je kvalita vzduchu nebo vody, kde extrémní hodnoty způsobené neobvyklými událostmi (např. znečištění) nemusí odpovídat obvyklé kvalitě,
  • střední délky přežití v klinických studiích.


Kdy medián nepoužívat?

Přestože je medián užitečný v řadě aplikací, existují situace, kdy jeho použití není ideální. Jde zejména o případy, kdy:

  • je potřeba zohlednit všechny hodnoty v datové sadě, včetně extrémů (např. při studiu maximální možné efektivity nebo odolnosti materiálů),
  • data mají rovnoměrnou distribuci bez extrémních hodnot – střední hodnotu stejně dobře určí aritmetický průměr.
  • chybí některá data (vzorec bere v potaz pořadí hodnot).

Před využitím mediánu je nezbytné určit původ odlehlých hodnot ve vašich datech. Jejich přítomnost může totiž značit i chybu v měření. Použití mediánu by v takovém případě vedlo k mylné interpretaci získaných výsledků a celé vědecké studie.



Příklad výpočtu mediánu – lichý počet hodnot

Při zkoumání průměrné délky přežití pacientů po aplikaci experimentální léčby jste u jednotlivých dobrovolníků naměřili tyto hodnoty: 22, 3, 14, 8, 12, 10, 5, 15 a 17 měsíců.

Abychom medián nalezli, hodnoty vzestupně seřadíme:

Pořadí hodnoty 1 2 3 4 5 6 7 8 9
Hodnota (měsíce) 3 5 8 10 12 14 15 17 22

Máme 9 hodnot, použijeme tedy vzorec pro výpočet mediánu při lichém počtu hodnot. Po dosazení do rovnice vychází:

\[\tilde{x} = x_{\left(\frac{n+1}{2}\right)}\] \[\tilde{x} = x_{\left(\frac{9+1}{2}\right)}\] \[\tilde{x} = x_{5}\] \[\tilde{x} = 12\]

Medián je 5. hodnota v seřazeném souboru dat. Mediánová délka přežití (\(\tilde{x}\)) se tedy rovná 12 měsícům .

Pokud bychom u tohoto soubor spočítali aritmetický průměr, vyjde nám 11,8 měsíce. Data tedy nemají normální rozložení.



Příklad výpočtu mediánu – sudý počet hodnot

Máte za úkol vypočítat medián mzdy u následujícího (již seřazeného) souboru hodnot:

Pořadí hodnoty 1 2 3 4 5 6 7 8 9 10
Měsíční příjem (tisíce Kč) 15 15 20 22 25 33 36 45 58 112
Pořadí hodnoty 1 2 3 4 5 6 7 8 9 10
Měsíční příjem (tisíce Kč) 15 15 20 22 25 33 36 45 58 112

Při sudém počtu hodnot (10) dosadíme jejich počet do následujícího vzorce:

\[\tilde{x} = \frac{x_{\left(\frac{n}{2}\right)} + x_{\left(\frac{n}{2}+1\right)}}{2}\] \[\tilde{x} = \frac{x_{\left(\frac{10}{2}\right)} + x_{\left(\frac{10}{2}+1\right)}}{2}\] \[\tilde{x} = \frac{x_{5} + x_{6}}{2}\] \[\tilde{x} = \frac{25 + 33}{2}\] \[\tilde{x} = \frac{55}{2}\] \[\tilde{x} = 29000\]

Medián mzdy je tedy 29 000 Kč, zatímco její aritmetický průměr 38 100 Kč. Rozložení dat j opět nerovnoměrné – průměr zvyšuje zejména poslední (extrémní) hodnota 112 000 Kč.



Výpočet mediánu v Excelu

# buňky A1 až A100 obsahují naměřené hodnoty

# funkce pro výpočet mediánu
=MEDIAN(A1:A100)


Výpočet mediánu v jazyce R

# naměřené hodnoty
data <- c(3, 5, 6, 7, 8)

# funkce pro výpočet mediánu
median(data)


Pro hromadný výpočet mediánu a dalších charakteristik popisné statistiky v jazyce R slouží příkaz summary(), resp. describe()podrobnosti najdete zde.



Mohlo by vás zajímat

Naše kurzy

Ovládání Pythonu pro datovou analýzu

Přihlásit na kurz Lektor: Mgr. Bc. Silvie Bělašková, Ph.D. Trvání kurzu: 2 dny Naučte se ovládat programovací jazyk Python pro účely analýzy analýzy dat – s pomocí knihovny pandas a aplikace Jupyter Notebook, které práci v Pythonu výrazně zjednodušují. Po absolvování kurzu zvládnete v Pythonu data načíst, zpracovat, analyzovat, vizualizovat a a získané výsledky sdílet se svými kolegy. Získané znalosti ihned uplatníte ve své vědecké práci. Kurzem vás provede vás provede… (viz profil lektora). Všechny prezentované postupy si vyzkoušíte na praktických příkladech v anglické verzi Pythonu a aplikace Jupyter Notebook. Počítač vám zapůjčíme na místě, není třeba nosit vlastní.   Chci se přihlásit Adresa konání kurzu Délka kurzu Z kurzu budete mít největší užitek, pokud: se chcete naučit ovládat programovací jazyk Python pro vyhodnocování dat ze svého výzkumu, máte s Pythonem zkušenosti, ale potřebujete si oživit základy nebo se chcete k výsledkům dostat rychleji. Jaké vstupní znalosti jsou potřeba? pro absolvování kurzu nejsou potřeba žádné specifické znalosti Co se na kurzu naučíte? orientovat se v prostředí Pythonu, knihovny pandas a aplikace Jupyter Notebooks a importovat do nich vlastní datové soubory, pracovat v pandas s datovými tabulkami (dataframes), spojit je a vyhledat v nich potřebná data, filtrovat data, upravit je (včetně doplnění chybějících hodnot) a vyhodnotit, vizualizovat data v knihovně pandas, tvořit vlastní datové modely a testovat je. Chci vidět podrobný sylabus kurzu Základy Pandas a Jupyter notebooku Seznámení s Pythonem Seznámení s knihovnou Pandas Seznámení s Jupyter notebookem Instalace Pythonu, Jupyter notebooku a knihovny Pandas Seznámení s dalšími Python knihovnami Ukázka práce s knihovnou Pandas Základní práce s datovou tabulkou Pandas Seznámení s knihovnou Pandas Vysvětlení pojmů dataframe Vytvoření a načtení dataframe Praktické metody pro zobrazení dataframu Hledání dat a filtrování Grupování a filtrování Práce s daty Datové typy Chybějící data Přejmenování dat Spojování tabulek Vizualizace dat v prostředí Pandas Tvorba základních grafů Tvorba základních grafů Seznámení s vizualizačními knihovnami Investigace vlastních dat Import vlastního datasetu Metody investigace dat Vizualizace a interpretace dat Experimentování Pomoc Pandas dokumentace Pomoc ChatGPT Tvorba modelu nad vlastními daty Import vlastního datasetu Definování use case Příprava dat Volba modelu Testování modelu Názory spokojených účastníků „Lékaři zabývající se praktickou medicínou věříí, že argumentace pocházející z oblasti tzv. medicíny založené na důkazech obsahuje úplné informace z přesného a správného zpracování dat definovaných zdrojů. Každý z nás se musí vyrovnat s interpretací těchto dat. K tomu je velmi užitečné umět posoudit vztah mezi statistickou významností a praktickou důležitostí

Správa a řízení vědeckých dat dle FAIR Data Principles

Přihlásit na kurz Lektor: Ing. Jan Červený, Ph.D. Spravujte svá experimentální data tak, abyste s nimi vy i vědecká komunita mohli dlouhodobě pracovat – a vytěžit z nich další poznatky. Publikováním výsledků životnost nasbíraných dat nekončí. V kurzu pro vědecké pracovníky vás krok po kroku naučíme, jak data z experimentů uložit a zpřístupnit podle zásad FAIR Data Principles. Díky tomu s nimi budete moci opakovaně pracovat a hledat v nich nové souvislosti. 2denním kurzem vás provede Ing. Jan Červený, PhD., vedoucí výzkumný pracovník oddělení adaptivních a chytrých biotechnologií na Ústavu výzkumu globální změny AV ČR (viz profil lektora).  Procvičování probíhá v české verzi aplikace MS Excel 365 . Počítač vám zapůjčíme na místě, není třeba nosit vlastní Chci se přihlásit Adresa konání kurzu Délka kurzu Z kurzu budete mít největší užitek, pokud: chcete zvýšit své šance na získání výzkumných grantů, potřebujete zorganizovat a propojit data z různých projektů (a zpřístupnit je), publikujete vědecké články a potřebujete mít data v excelentní kvalitě, chcete zlepšit úroveň vědeckých výstupů své organizace. Jaké vstupní znalosti jsou potřeba? Pro absolvování kurzu jsou vhodné znalosti v rozsahu: MS Excel na základní uživatelské úrovni (základní operace a funkce), základní terminologie zpracování a ukládání informací (databázové principy, elementární matematické operace s daty), povědomí o existenci globálních systémů identifikace digitálních objektů (DOI apod.) Co se v kurzu naučíte? jak s daty systematicky pracovat a co to vašemu výzkumu přinese, jak se ke správě dat staví čtyři základní pilíře konceptu FAIR Data Principles (Findability – dohledatelnost, Accessibility – dostupnost, Interoperability – interoperabilita, Reuse – opakované použití), principy správného ukládání a popisování datových setů, jak propojit data z různých zdrojů (např. laboratorních zařízení či úložišť), jaké technologie jsou dostupné a které vybrat, jak data efektivně vyhodnotit s pomocí statistické analýzy. Chci vidět podrobný sylabus kurzu    Úvod:  Co jsou FAIR Data Principles a proč je důležité je dodržovat.  Dohledatelnost (Findability) – Jak zajistit nalezení dat včetně použití metadat a identifikátorů. Dostupnost (Accessibility) – Jak umožnit přístup k datům a zajistit jejich dostupnost pro výzkum. Interoperabilita (Interoperability) – Jak zajistit, aby data byla srozumitelná a čitelná pro různé systémy a aplikace. Opakované použití (Reuse) – Jak zajistit opakované využití dat v rámci výzkumné organizace i mimo ní.   Jaké jsou důvody potřeby systematického zpracovávání dat nejen kvůli naplňování požadavků na Open Science. Zvýhodněné balíčky kurzů Zakupte si balíček 2 nebo více vybraných kurzů a ušetřete Prohlédnout balíčky kurzů Jaký je přístup EU a

Zvýhodněné balíčky kurzů

Zakupte si balíček 2 nebo více vybraných kurzů a ušetřete

[24. 4. 2024] Webinář ZDARMA: Jak získat 82% příspěvek na školení statistiky přes MPSV

Pod vedením zakladatele Datové akademie Dávida Tkáče mj. zjistíte: