Nový formát vzdělávání: Letní škola statistiky 2026
Za 5 dní ovládnete statistiku v R, JASP, nebo Jamovi. Napořád.

20. - 24. 7. 2026
Prohlédnout

Ředitel Datové akademie představí Letní školu statistiky.

30 minut, které vás přesvědčí, že by bylo škoda chybět.

čtvrtek 21. 05. 2026 od 15:00
Prohlédnout

Objevte nové možnosti využití statistiky pro svou praxi.

Podívejte se na ZÁZNAM WEBINÁŘE Biostatistika v R
Prohlédnout

Obsah

Rozptyl: definice, využití a výpočet


Rozptyl je základní míra variability, která udává míru rozptýlení (variabilitu) hodnot v datovém souboru okolo jeho střední hodnoty (zpravidla průměru). Často se využívá jako veličina v různých statistických testech (např. v analýze rozptylu). Rozlišujeme populační a výběrový rozptyl.

Populační rozptyl (σ2) počítáme jako průměr rozdílů druhých mocnin mezi každou hodnotou ve statistické populaci (statistickém souboru) a průměrem (střední hodnotou) této populace (viz příklad níže):

\[\sigma^2 = \sum_{i=1}^{N} \frac{(x_i – \bar{x})^2}{N} \]

\( N \) značí počet hodnot v dané populaci, \( x_i \) označuje i-tou hodnotu v souboru a \( \bar{x} \) aritmetický průměr datové sady.

V praxi (např. při vyhodnocení základních statistických charakteristik naměřených hodnot z experimentu), ale využíváme výběrový rozptyl (s2). Počítá se podobně jako populační rozptyl, ale namísto dělení počtem hodnot n dělíme počtem hodnot minus jedna (tzv. Besselovu oprava – viz příklad níže):

\[s^2 = \sum_{i=1}^{n} \frac{(x_i – \bar{x})^2}{n-1} \]

(\( n \) se standardně využívá pro označení počtu hodnot ve výběrovém souboru.)

Besselova oprava minimalizuje zkreslení dané např. vlivem extrémních hodnot v malém datovém souboru. Její použití umožňuje získat tzv. nestranný odhad variability v celé populaci na základě výběrového souboru.


Jaký typ rozptylu použít?

Pokud operujete s hodnotami celé populace (např. výškou žáků 7. třídy určité základní školy), použijte populační rozptyl.

Zvýhodněné balíčky kurzů

Zakupte si balíček 2 nebo více vybraných kurzů a ušetřete

Jestliže zkoumáte výšku žáků 7. třídy na základních školách v celé České republice a k dispozici máte naměřené hodnoty omezeného vzorku (např. 100 chlapců), použijete výběrový rozptyl.


Využití rozptylu

Rozptyl popisuje průměrnou odlišnost hodnot od střední hodnoty. Tím vám umožní:

  • porovnat variabilitu dvou a více datových sad (a tedy určit, zda lze např. pro ověření alternativní hypotézy využít metodu ANOVA nebo regresní analýzu),
  • identifikovat odlehlé hodnoty – vysoký rozptyl naznačuje jejich přítomnost,
  • posoudit spolehlivost průměru – nízký rozptyl naznačuje, že průměr je dobrou reprezentací datového souboru, zatímco vysoký rozptyl značí možné ovlivnění průměru extrémními hodnotami.

Rozptyl hraje důležitou roli v Shapiro-Wilkově testu pro posouzení normality rozložení dat (test je mj. citlivý na rozptyl hodnot).

Je také druhou mocninou směrodatné odchylky, důležitý míry variability používané v řadě statistických analýz.

Hodnota rozptylu se tedy udává ve druhé mocnině měřených proměnných (např. u délky se veličina délky m změní na m2). Rozptyl je proto méně intuitivní na pochopení a nelze jej přímo srovnávat s hodnotami v datovém souboru (k tomu slouží zmíněná směrodatná odchylka).


Příklad výpočtu populačního rozptylu

Vaším úkolem je spočítat rozptyl výšky žáků 7. třídy ve vybrané malé základní škole. Naměřili jste tyto hodnoty: 158, 145, 165, 150 a 157 cm.

Na této škole se vám podařilo změřit výšku všech žáků (celé populace). Použijeme tedy vzorec pro populační rozptyl:

\[\sigma^2 = \sum_{i=1}^{N} \frac{(x_i – \bar{x})^2}{N} \]

Nejprve spočítáme aritmetický průměr výšky:

\[\bar{x} = \frac{1}{N} \left( \sum_{i=1}^{N} x_i \right) = \frac{x_1 + x_2 + \ldots + x_N}{N} \] \[\bar{x} = \frac{158 + 145 + 165 + 150 + 157}{5}\] \[\bar{x} = 155\]

Získanou průměrnou výšku (155 cm) nyní dosadíme do vzorce pro populační rozptyl:

\[\sigma^2 = \sum_{i=1}^{N} \frac{(x_i – \bar{x})^2}{N} \] \[\sigma^2 = \frac{(158 – 155)^2 + (145 – 155)^2 + (165 – 155)^2 + (150 – 155)^2 + (157 – 155)^2}{5}\] \[\sigma^2 = 47.6\]

Rozptyl výšky zkoumané populace je 47,6 cm2.


Výpočet populačního rozptylu v Excelu

# buňky A1 až A100 obsahují naměřené hodnoty

# funkce pro výpočet populačního rozptylu
=VAR.P(A1:A100)


Výpočet populačního rozptylu v jazyce R

# naměřené hodnoty
data <- c(3, 5, 6, 7, 8)

# funkce pro výpočet populačního rozptylu
var(data) * (length(data)-1)/length(data)


Příklad výpočtu výběrového rozptylu

Vaším úkolem je spočítat rozptyl výšky žáků 7. třídy v menší obci (populace). K dispozici máte ale pouze hodnoty výšky pěti žáků z různých základních škol (výběr). Pro snazší srovnání použijeme stejné hodnoty jako v předchozím příkladu, tedy 158, 145, 165, 150 a 157 cm.

V tomto případě je proto nutné použít vzorec pro výběrový rozptyl, do kterého dosadíme naměřené hodnoty a průměrnou výšku (155 cm):

\[s^2 = \sum_{i=1}^{n} \frac{(x_i – \bar{x})^2}{n-1} \] \[s^2 = \sum_{i=1}^{n} \frac{(158 – 155)^2 + (145 – 155)^2 + (165 – 155)^2 + (150 – 155)^2 + (157 – 155)^2}{5 – 1} \] \[s^2 = 59.5\]

Výběrový rozptyl výšky studovaného vzorku žáků je 59,5 cm2.



Výpočet výběrového rozptylu v Excelu

# buňky A1 až A100 obsahují naměřené hodnoty

# funkce pro výpočet výběrového rozptylu
=VAR.S(A1:A100)


Výpočet výběrového rozptylu v jazyce R

# naměřené hodnoty
data <- c(3, 5, 6, 7, 8)

# funkce pro výpočet výběrového rozptylu
var(data)


Mohlo by vás zajímat

Naše kurzy

Ovládání R Markdown pro výzkumné pracovníky

Naučte se psát vědecké články a vytvářet atraktivní výstupy v R Markdown – populárním rozšíření programovacího jazyka R.
Po absolvování kurzu zvládnete v R Markdown vytvořit dokumenty ve formátech vyžadovaných různými periodiky, vložit do nich výzkumná data a ta vhodným způsobem vizualizovat.

Kompletní biostatistická analýza v jazyce R

Ovládání jazyka R + Kurz biostatistiky I v jazyce R + Kurz biostatistiky II v jazyce R Přihlásit na kurz Lektoři: Mgr. Patrik Galeta, PhD. a Mgr. Bc. Silvie Bělašková, PhD. Trvání kurzu: 5 dnů Naučte se od úplné nuly vyhodnocovat klinická a biologická data základními a pokročilými metodami v jazyce R – a výrazně zvyšte kvalitu svých výzkumných publikací. Balíček za zvýhodněnou cenu kombinuje: A/ Ovládání programovacího jazyka R (1 den) – orientace v prostředí R a aplikace RStudio, importování dat z Excelu a dalších aplikací, transformace a zpracování proměnných a vytváření grafů. B/ Kurz biostatistiky I v jazyce R (2 dny) – design vědeckého experimentu, testování medicínských a biologických hypotéz pomocí parametrických (t-test, ANOVA, lineární regrese ad.) a neparametrických metod (Wilcoxnovy testy, Kruskal-Wallisova ANOVA), využívání kontingenčních tabulek. C/ Kurz biostatistiky II v jazyce R (2 dny) – vyhodnocení dat pomocí korelační analýzy, logistické regrese a dalších metod, základy vícerozměrných statistických metod a časových řad, metodiky servival a risk analysis. Procvičování příkladů probíhá v anglické verzi aplikace RStudio. Počítač vám zapůjčíme na místě, není třeba nosit vlastní. Chci se přihlásit Spokojených absolventů Adresa konání kurzu Délka kurzu Z kurzů budete mít největší užitek, pokud: nemáte se zpracováním dat v jazyce R žádné zkušenosti a potřebujete datovou analýzu využívat ve své práci (výzkumní a technologičtí pracovníci, ad.). se chcete naučit vyhodnocovat klinická a biologická data základními a pokročilými metodami v programovacím jazyce R, chcete výrazně zvýšit svou šanci na publikování v prestižním periodiku. Jaké vstupní znalosti jsou potřeba? Pro absolvování balíčků kurzů nejsou potřeba žádné specifické znalosti – začneme od základů. Co vše se naučíte? A/ Ovládání programovacího jazyka R jak se orientovat v prostředí aplikace RStudio a balíčku tidyverse , jak lehce importovat data různých formátů do R, proč data zpracovávat pomocí na sebe navazujících algoritmických sekvencí (tzv. pipelines), jak použít knihovnu dplyr pro snadnou úpravu proměnných a práci s nimi, možnosti úprav textových proměnných a faktorů pomocí knihoven stringr a forcats, jak hromadně upravit proměnné, jak vytvořit krásné a přehledné grafy v knihovně ggplot2. Ovládání programovacího jazyka R – podrobný sylabus Prostředí RStudia Jednotná syntax funkcí skupiny knihoven tidyverse Úsporné psaní kódu pomocí „pipeline“ Načtení dat do R z formátu MS Excel (knihovna readxl) a SAS, SPSS, Stata (knihovna haven) Práce s daty (knihovna dplyr) Výběr proměnných a případů Přejmenování proměnných Úprava proměnných (jednotlivě i hromadně) Spojení více tabulek pomocí společné proměnné Práce s daty v rámci skupin Úprava textových proměnných (knihovna

Zvýhodněné balíčky kurzů

Zakupte si balíček 2 nebo více vybraných kurzů a ušetřete

[24. 4. 2024] Webinář ZDARMA: Jak získat 82% příspěvek na školení statistiky přes MPSV

Pod vedením zakladatele Datové akademie Dávida Tkáče mj. zjistíte: