Ovládání programovacího jazyka R
- webinář ZDARMA -

Přesvědčte se, že nemusíte mít IT geny, abyste pracovali s datovými podklady, vytvářeli grafy, efektní reporty…

úterý 12. 05. 2026 od 15:00
Prohlédnout

Nový formát vzdělávání: Letní škola statistiky 2026
Za 5 dní ovládnete statistiku v R, JASP, nebo Jamovi. Napořád.

20. - 24. 7. 2026
Prohlédnout

Objevte nové možnosti využití statistiky pro svou praxi.

Podívejte se na ZÁZNAM WEBINÁŘE Biostatistika v R
Prohlédnout

Obsah

Kvartily: definice, využití a výpočet


Kvartil je statistická míra polohy, která rozděluje uspořádaný datový soubor do čtyř stejně velkých částí. Existují tři kvartily:

  • první kvartil (Q1, také Q0,25) odděluje první čtvrtinu dat od zbytku souboru,
  • druhý kvartil (Q2 / Q0,5) rozděluje data na dvě poloviny (v zásadě jde tedy o medián),
  • třetí kvartil (Q3 / Q0,75) odčleňuje poslední čtvrtinu dat.

Spolu s dalšími kvantily jej můžete spočítat u kvantitativních proměnných a ordinálních proměnných. U druhé skupiny je výpočet možný za předpokladu rovnoměrného rozložení dat a dostatečného počtu pozorování v každé kategorii (např. u školních známek, kde předpokládáme stejný rozdíl mezi jednotlivými stupni známkování).

Kvartily se počítají podle následujícího vzorce (viz příklad níže):

\[ Q_k = \frac{(n+1) \cdot k}{4} \]

\( Q_k \) označuje pořadí hodnoty k-tého kvartilu v souboru vzestupně seřazených dat (k = 1 pro první kvartil, k = 2 pro medián a k = 3 pro třetí kvartil).

\( n \) je počet hodnot v datovém souboru. V praxi se kvartily nepočítají ručně, ale s pomocí statistických programů.

V případě, že výsledkem není celé číslo, je potřeba výsledek upravit lineární interpolací mezi dvěma sousedními hodnotami v uspořádaném datovém souboru. Její vzorec je následující (viz příklad níže):

\[ y = y_1 + \left( \frac{x – x_1}{x_2 – x_1} \right) \cdot (y_2 – y_1) \]

\( x_1 \) a \( x_2 \) je menší, resp. větší pořadí hodnoty, pro které provádíme interpolaci. \( y_1 \) a \( y_2 \) je pak menší, resp. větší hodnota, které interpolujeme.

Zvýhodněné balíčky kurzů

Zakupte si balíček 2 nebo více vybraných kurzů a ušetřete

Pozor – aplikace pro statistickou analýzu, jako je Excel a jazyk R, nevyužívají pro získání výsledku lineární interpolaci, ale složitější postupy. Výsledky se proto mohou od ručního výpočtu lišit.


Využití kvartilů

Kvartily se využívají zejména při vizualizaci dat pomocí boxplotu (krabicového grafu), který poskytuje přehled o rozložení hodnot s ohledem na jejich variabilitu. U datové sady vám pomohou určit střed (medián).

První a třetí kvartil zároveň definuje tzv. mezikvartilové rozpětí (IQR), které udává rozsah prostředních 50 % dat a používá se k detekci odlehlých hodnot.

Existují však situace, kdy kvartily nejsou vhodným nástrojem pro analýzu dat. Zvažte jejich použití, zejména pokud:

  • jsou data extrémně variabilní, resp. obsahují mnoho odlehlých hodnot (přestože se právě kvartily používají k jejich identifikaci; příliš mnoho extrémních hodnot výrazně zkresluje i rozložení kvartilů) – potom je třeba zvážit odstranění určitého procenta nejnižších a nejvyšších hodnot
  • pracujete s malým datovým souborem (10 a méně hodnot) – v takovém případě zvolte pro interpretaci dat průměr, medián a rozptyl,
  • potřebujete podrobnější informace o rozložení hodnot v datově sadě – zvolte decily či percentily.


Příklad výpočtu kvartilů

Mějme data o dojezdovém čase 19 zaměstnanců do práce (v minutách): 2, 11, 18, 21, 22, 30, 33, 38, 39, 40, 42, 45, 48, 49, 61, 67, 88, 100, 111.

Pro nalezení kvartilů hodnoty nejprve vzestupně seřadíme:

Pořadí hodnoty 1 2 3 4 5 6 7 8 9 10
Dojezdová doba (min) 2 11 18 21 22 30 33 38 39 40
Pořadí hodnoty 11 12 13 14 15 16 17 18 19
Dojezdová doba (min) 42 45 48 49 61 67 88 100 111

Pro výpočet 1. kvartilu dosadíme tyto hodnoty do výše uvedené rovnice:

\[ Q_k = \frac{(n+1) \cdot k}{4} \] \[ Q_1 = \frac{(19+1) \cdot 1}{4} \] \[ Q_1 = 5 \]

Q1 odpovídá 5. hodnotě, tedy 22 minutám.

Stejným způsobem spočítáme i 2., resp. 3. kvartil:

\[ Q_k = \frac{(n+1) \cdot k}{4} \] \[ Q_2 = \frac{(19+1) \cdot 2}{4} \] \[ Q_2 = 10 \] \[ Q_3 = \frac{(19+1) \cdot 3}{4} \] \[ Q_3 = 15 \]

Q2 odpovídá 10. hodnotě (40 min), Q3 odpovídá 15. hodnotě (61 min).



Příklad výpočtu kvartilů s lineární interpolací

Vyjdeme ze stejných dat jako v předchozím příkladu, pouze přidáme navíc jednu hodnotu:

Pořadí hodnoty 1 2 3 4 5 6 7 8 9 10
Dojezdová doba (min) 2 11 18 21 22 30 31 33 38 39
Pořadí hodnoty 11 12 13 14 15 16 17 18 19 20
Dojezdová doba (min) 40 42 45 48 49 61 67 88 100 111

Opět dosadíme hodnoty do vzorce pro výpočet prvního kvartilu:

\[ Q_k = \frac{(n+1) \cdot k}{4} \] \[ Q_1 = \frac{(20+1) \cdot 1}{4} \] \[ Q_1 = 5.25 \]

Pořadí číslo 5,25 (\( x \)) samozřejmě neexistuje. Proto musíme provést lineární interpolaci mezi hodnotami na 5. a 6. místě (\( x_1 \) a \( x_2 \)). Tyto hodnoty (22 a 30 minut, tedy \( y_1 \) a \( y_2 \)) dosadíme do příslušného vzorce (viz výše):

\[ y = y_1 + \left( \frac{x – x_1}{x_2 – x_1} \right) \cdot (y_2 – y_1) \] \[ y = 22 + \left( \frac{5.25 – 5}{6 – 5} \right) \cdot (30 – 22) \] \[ y = 24 \]

Hodnota 1. kvartilu se tedy rovná 24 minutám. Stejným postupem se u 2. a 3. kvartilu dostaneme k následujícímu pořadí hodnot:

\[ Q_2 = 10.5 \] \[ Q_3 = 15.75 \]

Po použití lineární interpolace pak vychází hodnota 2. kvartilu 40 minut a 3. kvartilu 58 minut.



Výpočet kvartilů v Excelu

# buňky A1 až A100 obsahují naměřené hodnoty

# funkce pro výpočet kvartilů
=QUARTILE(A1:A100, 1)  # pro výpočet Q0,25
=QUARTILE(A1:A100, 2)  # pro výpočet Q0,5 (medián)
=QUARTILE(A1:A100, 3)  # pro výpočet Q0,75


Výpočet kvartilů v jazyce R

# naměřené hodnoty
data <- c(3, 5, 6, 7, 8)

# funkce pro výpočet kvartilů
quantile(data, probs = c(0.25, 0.50, 0.75))

# funkce pro výpočet kvartilů lineární interpolací
quantile(data, probs = c(0.25, 0.50, 0.75), type = 6)

Mohlo by vás zajímat

Webináře
Webinář – Ovládání programovacího jazyka R

Máte zájem využívat vizualizaci a analýzu dat v programovacím jazyce R? Webinář vám významně usnadní první kroky a vy si odpustíte týdny zbytečného brouzdání po internetových návodech.

Naše kurzy

Správa a řízení vědeckých dat dle FAIR Data Principles

Přihlásit na kurz Lektor: Ing. Jan Červený, Ph.D. Spravujte svá experimentální data tak, abyste s nimi vy i vědecká komunita mohli dlouhodobě pracovat – a vytěžit z nich další poznatky. Publikováním výsledků životnost nasbíraných dat nekončí. V kurzu pro vědecké pracovníky vás krok po kroku naučíme, jak data z experimentů uložit a zpřístupnit podle zásad FAIR Data Principles. Díky tomu s nimi budete moci opakovaně pracovat a hledat v nich nové souvislosti. 2denním kurzem vás provede Ing. Jan Červený, PhD., vedoucí výzkumný pracovník oddělení adaptivních a chytrých biotechnologií na Ústavu výzkumu globální změny AV ČR (viz profil lektora).  Procvičování probíhá v české verzi aplikace MS Excel 365 . Počítač vám zapůjčíme na místě, není třeba nosit vlastní Chci se přihlásit Adresa konání kurzu Délka kurzu Z kurzu budete mít největší užitek, pokud: chcete zvýšit své šance na získání výzkumných grantů, potřebujete zorganizovat a propojit data z různých projektů (a zpřístupnit je), publikujete vědecké články a potřebujete mít data v excelentní kvalitě, chcete zlepšit úroveň vědeckých výstupů své organizace. Jaké vstupní znalosti jsou potřeba? Pro absolvování kurzu jsou vhodné znalosti v rozsahu: MS Excel na základní uživatelské úrovni (základní operace a funkce), základní terminologie zpracování a ukládání informací (databázové principy, elementární matematické operace s daty), povědomí o existenci globálních systémů identifikace digitálních objektů (DOI apod.) Co se v kurzu naučíte? jak s daty systematicky pracovat a co to vašemu výzkumu přinese, jak se ke správě dat staví čtyři základní pilíře konceptu FAIR Data Principles (Findability – dohledatelnost, Accessibility – dostupnost, Interoperability – interoperabilita, Reuse – opakované použití), principy správného ukládání a popisování datových setů, jak propojit data z různých zdrojů (např. laboratorních zařízení či úložišť), jaké technologie jsou dostupné a které vybrat, jak data efektivně vyhodnotit s pomocí statistické analýzy. Chci vidět podrobný sylabus kurzu    Úvod:  Co jsou FAIR Data Principles a proč je důležité je dodržovat.  Dohledatelnost (Findability) – Jak zajistit nalezení dat včetně použití metadat a identifikátorů. Dostupnost (Accessibility) – Jak umožnit přístup k datům a zajistit jejich dostupnost pro výzkum. Interoperabilita (Interoperability) – Jak zajistit, aby data byla srozumitelná a čitelná pro různé systémy a aplikace. Opakované použití (Reuse) – Jak zajistit opakované využití dat v rámci výzkumné organizace i mimo ní.   Jaké jsou důvody potřeby systematického zpracovávání dat nejen kvůli naplňování požadavků na Open Science. Zvýhodněné balíčky kurzů Zakupte si balíček 2 nebo více vybraných kurzů a ušetřete Prohlédnout balíčky kurzů Jaký je přístup EU a

Geospatial Data Processing in R

Learn how to analyze and interpret geospatial data from scratch using R, with practical functions designed specifically to simplify and accelerate batch processing.

Kompletní biostatistická analýza v jazyce R

Ovládání jazyka R + Kurz biostatistiky I v jazyce R + Kurz biostatistiky II v jazyce R Přihlásit na kurz Lektoři: Mgr. Patrik Galeta, PhD. a Mgr. Bc. Silvie Bělašková, PhD. Trvání kurzu: 5 dnů Naučte se od úplné nuly vyhodnocovat klinická a biologická data základními a pokročilými metodami v jazyce R – a výrazně zvyšte kvalitu svých výzkumných publikací. Balíček za zvýhodněnou cenu kombinuje: A/ Ovládání programovacího jazyka R (1 den) – orientace v prostředí R a aplikace RStudio, importování dat z Excelu a dalších aplikací, transformace a zpracování proměnných a vytváření grafů. B/ Kurz biostatistiky I v jazyce R (2 dny) – design vědeckého experimentu, testování medicínských a biologických hypotéz pomocí parametrických (t-test, ANOVA, lineární regrese ad.) a neparametrických metod (Wilcoxnovy testy, Kruskal-Wallisova ANOVA), využívání kontingenčních tabulek. C/ Kurz biostatistiky II v jazyce R (2 dny) – vyhodnocení dat pomocí korelační analýzy, logistické regrese a dalších metod, základy vícerozměrných statistických metod a časových řad, metodiky servival a risk analysis. Procvičování příkladů probíhá v anglické verzi aplikace RStudio. Počítač vám zapůjčíme na místě, není třeba nosit vlastní. Chci se přihlásit Spokojených absolventů Adresa konání kurzu Délka kurzu Z kurzů budete mít největší užitek, pokud: nemáte se zpracováním dat v jazyce R žádné zkušenosti a potřebujete datovou analýzu využívat ve své práci (výzkumní a technologičtí pracovníci, ad.). se chcete naučit vyhodnocovat klinická a biologická data základními a pokročilými metodami v programovacím jazyce R, chcete výrazně zvýšit svou šanci na publikování v prestižním periodiku. Jaké vstupní znalosti jsou potřeba? Pro absolvování balíčků kurzů nejsou potřeba žádné specifické znalosti – začneme od základů. Co vše se naučíte? A/ Ovládání programovacího jazyka R jak se orientovat v prostředí aplikace RStudio a balíčku tidyverse , jak lehce importovat data různých formátů do R, proč data zpracovávat pomocí na sebe navazujících algoritmických sekvencí (tzv. pipelines), jak použít knihovnu dplyr pro snadnou úpravu proměnných a práci s nimi, možnosti úprav textových proměnných a faktorů pomocí knihoven stringr a forcats, jak hromadně upravit proměnné, jak vytvořit krásné a přehledné grafy v knihovně ggplot2. Ovládání programovacího jazyka R – podrobný sylabus Prostředí RStudia Jednotná syntax funkcí skupiny knihoven tidyverse Úsporné psaní kódu pomocí „pipeline“ Načtení dat do R z formátu MS Excel (knihovna readxl) a SAS, SPSS, Stata (knihovna haven) Práce s daty (knihovna dplyr) Výběr proměnných a případů Přejmenování proměnných Úprava proměnných (jednotlivě i hromadně) Spojení více tabulek pomocí společné proměnné Práce s daty v rámci skupin Úprava textových proměnných (knihovna

Zvýhodněné balíčky kurzů

Zakupte si balíček 2 nebo více vybraných kurzů a ušetřete

[24. 4. 2024] Webinář ZDARMA: Jak získat 82% příspěvek na školení statistiky přes MPSV

Pod vedením zakladatele Datové akademie Dávida Tkáče mj. zjistíte: