Nový webinář ZPRACOVÁNÍ GEODAT V PROGRAMOVACÍM JAZYCE R.

Prakticky, srozumitelně a pro všechny, kdo chtějí porozumět datům v prostoru.

středa 28. 01. 2026 od 15:00
Prohlédnout

Objevte nové možnosti využití statistiky pro svou praxi.

Podívejte se na ZÁZNAM WEBINÁŘE Biostatistika v R
Prohlédnout

Obsah

Kvintily: definice, využití a výpočet


Kvintil je statistická míra polohy (typ kvantilu), jež rozděluje uspořádaný soubor hodnot do pěti stejně velkých částí. Každá část tedy obsahuje 20 % ze všech pozorování. Existují 4 kvintily, označované jako Q1/Q0,2, Q2/Q0,4, Q3/0,6 a Q4/0,8.

Spolu s dalšími kvantily jej můžete spočítat u kvantitativních proměnných a ordinálních proměnných. U druhé skupiny je výpočet možný za předpokladu rovnoměrného rozložení dat a dostatečného počtu pozorování v každé kategorii (např. u školních známek, kde předpokládáme stejný rozdíl mezi jednotlivými stupni známkování).

Kvintily se počítají podle tohoto vzorce (viz příklad níže):

\[ Q_k = \frac{(n+1) \cdot k}{5} \]

\(Q_k \) označuje pořadí hodnoty k-tého kvintilu v souboru vzestupně seřazených dat (k = 1 pro první kvintil, k = 2 pro druhý kvintil, k = 3 pro třetí kvintil a k = 4 pro čtvrtý kvintil).

\(n \) je počet hodnot v datovém souboru. V praxi kvintily počítáme s pomocí statistických programů.

V případě, že výsledkem není celé číslo, upravte výsledek lineární interpolací mezi dvěma sousedními hodnotami v uspořádaném datovém souboru. Její vzorec je následující (viz příklad níže):

\[ y = y_1 + \left( \frac{x – x_1}{x_2 – x_1} \right) \cdot (y_2 – y_1) \]

\( x_1 \) a \( x_2 \) je menší, resp. větší pořadí hodnoty, pro které provádíme interpolaci. \( y_1 \) a \( y_2 \) je pak menší, resp. větší hodnota, které interpolujeme.

Zvýhodněné balíčky kurzů

Zakupte si balíček 2 nebo více vybraných kurzů a ušetřete

Pozor – aplikace pro statistickou analýzu, jako je Excel a jazyk R, nevyužívají pro získání výsledku lineární interpolaci, ale složitější postupy. Výsledky se proto mohou od ručního výpočtu lišit.


Využití kvintilů

Kvintil nachází široké využití v sociálních vědách, zejména v analýze socioekonomických dat. Jeho aplikace je cenná např. pro určení rozdělení příjmové nerovnosti, kde pomáhá identifikovat rozsah příjmů v různých částech populace.

V marketingu a obchodní sféře mohou kvintily pomoci segmentovat trh podle výše příjmů, spotřebitelského chování nebo jiných metrik. V oblasti vzdělání můžeme díky kvintilům porovnávat skupiny studentů podle výsledků zkoušek a odhalovat potenciální nerovnosti.

V přítomnosti odlehlých hodnot je vhodnější využít jiné typy kvantilů – decily nebo percentily, které poskytují ještě detailnější pohled na data.

Kvintily také nejsou nejvhodnější volbou při analýze dat s velmi malým vzorkem (do 10 hodnot), kde by segmentace do pěti částí mohla vést k přílišnému zjednodušení a zkresleným výsledkům – v takovém případě zvolte pro interpretaci dat průměr, medián a rozptyl.



Příklad výpočtu kvintilů

Vaším úkolem je spočítat hodnoty kvintilů pro měsíční příjem domácností. K dispozici máte tato data (v tisících Kč/měsíc): 28, 34, 22, 50, 46, 31, 38, 27, 25, 33, 35, 37, 45, 32, 47, 44, 12, 165, 15.

Prvním krokem je vzestupné seřazení hodnot:

Pořadí hodnoty 1 2 3 4 5 6 7 8 9 10
Měsíční příjem (tis. Kč) 12 15 22 25 27 28 31 32 33 34
Pořadí hodnoty 11 12 13 14 15 16 17 18 19
Měsíční příjem (tis. Kč) 35 37 38 44 45 46 47 50 165

Pro výpočet 1. kvintilu dosadíme tyto hodnoty do výše uvedené rovnice:

\[ Q_k = \frac{(n+1) \cdot k}{5} \] \[ Q_1 = \frac{(19+1) \cdot 1}{5} \] \[ Q_1 = 4 \]

Q1 odpovídá 4. hodnotě, tedy měsíčnímu příjmu 25 000 Kč u domácností ve vzorku.

Stejným způsobem spočítáme i 2., 3. a 4. kvintil:

\[ Q_k = \frac{(n+1) \cdot k}{5} \] \[ Q_2 = \frac{(19+1) \cdot 2}{5} \] \[ Q_2 = 8 \] \[ Q_3 = \frac{(19+1) \cdot 3}{5} \] \[ Q_3 = 12 \] \[ Q_3 = \frac{(19+1) \cdot 4}{5} \] \[ Q_4 = 16 \]

Q2 odpovídá 8. hodnotě (32 000 Kč/měsíc), Q3 odpovídá 12. hodnotě (37 000 Kč/měsíc) a Q4 odpovídá 16. hodnotě (46 000 Kč/měsíc).



Příklad výpočtu kvintilů s lineární interpolací

Vyjdeme ze stejných dat jako v předchozím příkladu, pouze přidáme navíc jednu hodnotu (měsíční příjem domácnosti 78 000 Kč):

Pořadí hodnoty 1 2 3 4 5 6 7 8 9 10
Měsíční příjem (tis. Kč) 12 15 22 25 27 28 31 32 33 34
Pořadí hodnoty 11 12 13 14 15 16 17 18 19 20
Měsíční příjem (tis. Kč) 35 37 38 44 45 46 47 50 78 165

Opět dosadíme hodnoty do vzorce pro výpočet prvního kvintilu:

\[ Q_k = \frac{(n+1) \cdot k}{5} \] \[ Q_1 = \frac{(20+1) \cdot 1}{5} \] \[ Q_1 = 4.2 \]

Pořadí číslo 4,2 (\( x \)) samozřejmě neexistuje. Proto musíme provést lineární interpolaci mezi hodnotami na 4. a 5. místě (\( x_1 \) a \( x_2 \)). Tyto hodnoty (25 000 a 27 000 Kč měsíčně, tedy \( y_1 \) a \( y_2 \)) dosadíme do příslušného vzorce (viz výše):

\[ y = y_1 + \left( \frac{x – x_1}{x_2 – x_1} \right) \cdot (y_2 – y_1) \] \[ y = 25000 + \left( \frac{4.2 – 4}{5 – 4} \right) \cdot (27000 – 25000) \] \[ y = 25400 \]

Hodnota 1. kvintilu se tedy rovná 26 600 Kč/měsíc. Stejným postupem se u 2., 3. a 4. kvintilu dostaneme k následujícímu pořadí hodnot:

\[ Q_2 = 8.4 \] \[ Q_3 = 12.6 \] \[ Q_4 = 16.8 \]

Po použití lineární interpolace pak vychází tyto hodnoty:

  • 2. kvintil = 32 400 Kč/měsíc,
  • 3. kvintil = 37 600 Kč/měsíc,
  • 4. kvintil = 46 800 Kč/měsíc.


Výpočet kvintilů v Excelu

# buňky A1 až A100 obsahují naměřené hodnoty

# funkce pro výpočet kvintilů
=PERCENTILE.INC(A1:A100, 0.2)  # pro výpočet Q0,2/Q1
=PERCENTILE.INC(A1:A100, 0.4)  # pro výpočet Q0,4/Q2
=PERCENTILE.INC(A1:A100, 0.6)  # pro výpočet Q0,6/Q3
=PERCENTILE.INC(A1:A100, 0.8)  # pro výpočet Q0,8/Q4


Výpočet kvintilů v jazyce R

# naměřené hodnoty
data <- c(3, 5, 6, 7, 8)

# funkce pro výpočet kvintilů
quantile(data, probs = c(0.2, 0.4, 0.6, 0.8))

# funkce pro výpočet kvintilů lineární interpolací
quantile(data, probs = c(0.2, 0.4, 0.6, 0.8), type = 6)


Mohlo by vás zajímat

Statistika
Typy proměnných (a jak je určit)

Pro výběr vhodného statistického testu a získání odpovědí na otázky ohledně objektu či jevu, který studujete, je zcela zásadní vědět, se kterými druhy proměnných ve výzkumu pracujete. Jak na to?

Články
Analýza dat ve vědě a výzkumu

Statistická analýza je klíčem ke kvalitnějším výsledkům a publikaci v prestižních vědeckých časopisech. Jak ji dělat správně?

Naše kurzy

Zpracování dat a prezentace výsledků v akademické literatuře

Přihlásit na kurz Lektor: Mgr. Patrik Galeta, PhD. Zpracujte data ze svého výzkumu tak, aby váš článek bez problémů prošel recenzním řízením ve všech vědeckých časopisech. V kurzu pro vědecké pracovníky získáte praktický návod, jak vybrané statistické metody využít a popsat je v odborném článku. Po absolvování školení budete umět připravit podklady (rukopis, tabulky, grafy, dopis editorovi) pro recenzní řízení. Během kurzu pracujeme s praktickými ukázkami ze známých vědeckých periodik. 2denním kurzem vás provede Mgr. Patrik Galeta, PhD., odborný asistent katedry antropologie Západočeské univerzity v Plzni, který se statistice věnuje v rámci demografických studií (viz profil lektora). Procvičování probíhá na příkladech z přírodních a společenských věd v české verzi aplikace Tibco Statistica, popř. RStudio. Počítač vám zapůjčíme na místě, není třeba nosit vlastní. Chci se přihlásit Adresa konání kurzu Délka kurzu Z kurzu budete mít největší užitek, pokud: připravujete tabulky a grafy do rukopisu článku a potřebujete výchozí data správně zpracovat (vědečtí pracovníci), potřebujete porozumět standardům statistické analýzy ve vědeckých periodikách. Jaké vstupní znalosti jsou potřeba? Pro absolvování kurzu nejsou potřeba žádné specifické znalosti. Co se v kurzu naučíte? jak vyhodnotit vztah dvou a více proměnných pomocí t-testů, analýzy rozptylu, kontingenčních tabulek a regrese, co z výsledků analýzy do odborného článku vybrat, jak připravit tabulky s popisnými statistikami, jakým způsobem v odborné literatuře vhodně vizualizovat data, jaká je základní struktura odborného článku (kapitoly úvod, materiál, metody, výsledky, diskuse, závěr), podle jakých vzorových formulací se statistické výsledky píší, jak připravit rukopis do recenzního řízení (a popř. jej upravit na základě zpětné vazby). Chci vidět podrobný sylabus kurzu R a Rstudio Základy ovládání R pomocí knihoven tidyverse Popisná statistika Četnostní tabulky Popisné ukazatele (průměr, medián, rozptyl) Grafy v knihovně ggplot2   Opakování hodnocení vztahu proměnných t-testy, ANOVA Kontingenční tabulky Regrese a korelace   Základní struktura odborného článku s analýzou kvantitativních dat Kapitoly Úvod, Materiál, Metody, Výsledky, Diskuze, Závěr Co je obsahem jednotlivých kapitol Jak si vytvořit „vědecký prostor“   Prezentace základních analýz v odborném článku Struktura kapitol Materiál a Metody Strukturované psaní kapitoly Výsledky Očekávaný formát tabulek v rukopisu článku Očekávaný formát grafů, nutné minimum   Příklady dobré praxe Vzorové články s prezentací základních analýz Kritický rozbor textu Typy používaných formulací   Příprava podkladů pro rukopis článku Text rukopisu, soubory s grafy a tabulky, titulky grafů Dopis editorovi ukázka portálu pro odevzdání u mezinárodního odborného časopisu (např. https://mc.manuscriptcentral.com/) Návrh recenzentů   Základy zpracování odpovědi na recenzní řízení Úprava rukopisu Podrobná odpověď na připomínky recenzentů Názory spokojených účastníků Chci

Úvod do programování v Pythonu (nejen) pro vědce

Online kurz (12 × 2,5 hod ve 12 týdnech) Přihlásit na kurz Lektor: Vít Kuntoš Trvání kurzu: 12 týdnů Naučte se základy nejoblíbenějšího programovacího jazyku Python, i když nemáte s programováním žádné zkušenosti. Po absolvování kurzu porozumíte syntaxu kódu v Pythonu a naučíte se využívat datové typy, řídící struktury, funkce a základní datové struktury. Na získané znalosti navážete např. kurzem statistického vyhodnocování dat v Pythonu. Kurzem s nejvýše 10 účastníky vás provede Vít Kuntoš, programátor s praxí v Pythonu a frameworku Django (viz profil lektora). Všechny prezentované postupy si vyzkoušíte na praktických příkladech v online aplikaci pro psaní kódu v Pythonu. Chci se přihlásit Adresa konání kurzu Délka kurzu Každý čtvrtek 18:00 – 20:30 Výukový čas Z kurzu budete mít největší užitek, pokud: nejste programátor a nikdy jste neprogramovali, ale chcete se naučit úplné základy programovacího jazyku Python, chcete získat základní znalosti pro další rozvoj a využití Pythonu všemi směry – pro vyhodnocování a vizualizaci dat (nejen) z výzkumu nebo tvorbu webových aplikací a automatizací. Jaké vstupní znalosti jsou potřeba? pro absolvování kurzu nejsou potřeba žádné specifické znalosti. Co se na kurzu naučíte? jak se orientovat v prostředí aplikace RStudio, jaké typy proměnných existují a jaké jsou mezi nimi rozdíly, co je průměr, medián, směrodatná odchylka a další popisné statistiky a kdy a jak je použít, jak v programovacím jazyce R vyhodnocovat data a testovat hypotézy pomocí základních statistických metod, jakým způsobem vhodně vizualizovat data, jak mezi sebou porovnávat dva a více datových souborů, jak vyhodnocovat data pomocí kontingenčních tabulek, jak sestavit regresní model a vytvářet modely typu „co se stane, když…“. Chci vidět podrobný sylabus kurzu Program kurzu podle lekcí Součástí každé lekce jsou příklady a úkoly, na kterých si přednášenou látku vyzkoušíte. V závěru kurzu vytvoříte vlastní projekt, na kterém v praxi ukážete, jak Pythonu rozumíte. Úvod do programování – k čemu jej využijete, historie a vlastnosti Pythonu, odkud získávat informace Psaní kódu – jak počítač kód zpracovává, psaní komentářů, typy proměnných, funkce print a input Číselné datové typy a operace – integer, float, complex, aritmetické operace, porovnávání, převody Řetězce – metody pro práci s textem, formátování, indexování, slicing, striding Boolean a podmínky – funkce if, else, elif, true a false, logické operátory, rozhodování v programu Cykly – funkce for a while, opakování bloku kódu, iterace přes sekvence dat Listy a práce s nimi – ukládání více hodnot, přístup k prvkům, metody pro manipulaci Slovníky a práce s

Ovládání R Markdown pro výzkumné pracovníky

Naučte se psát vědecké články a vytvářet atraktivní výstupy v R Markdown – populárním rozšíření programovacího jazyka R.
Po absolvování kurzu zvládnete v R Markdown vytvořit dokumenty ve formátech vyžadovaných různými periodiky, vložit do nich výzkumná data a ta vhodným způsobem vizualizovat.

Zvýhodněné balíčky kurzů

Zakupte si balíček 2 nebo více vybraných kurzů a ušetřete

[24. 4. 2024] Webinář ZDARMA: Jak získat 82% příspěvek na školení statistiky přes MPSV

Pod vedením zakladatele Datové akademie Dávida Tkáče mj. zjistíte: