Nový formát vzdělávání: Letní škola statistiky 2026
Za 5 dní ovládnete statistiku v R, JASP, nebo Jamovi. Napořád.

20. - 24. 7. 2026
Prohlédnout

Ředitel Datové akademie představí Letní školu statistiky.

30 minut, které vás přesvědčí, že by bylo škoda chybět.

čtvrtek 21. 05. 2026 od 15:00
Prohlédnout

Objevte nové možnosti využití statistiky pro svou praxi.

Podívejte se na ZÁZNAM WEBINÁŘE Biostatistika v R
Prohlédnout

Obsah

Směrodatná odchylka: definice, využití a výpočet


Směrodatná odchylka (druhá odmocnina rozptylu) je jednou ze základních měr variability. Vyjadřuje průměrnou vzdálenost hodnot od středu souboru (typicky od aritmetického průměru). Hraje mj. důležitou roli v interpretaci statistických výsledků.

Platí, že čím vyšší je hodnota směrodatné odchylky, tím rozptýlenější data v souboru budou (při normálním rozdělení dat):

směrodatná odchylka

Rozlišujeme populační a výběrovou směrodatnou odchylku.

Populační směrodatná odchylka (σ) je druhá odmocnina populačního rozptylu. Ten počítáme jako průměr kvadrátů rozdílů mezi každou hodnotou ve statistické populaci (statistickém souboru) a průměrem (střední hodnotou) této populace (viz příklad níže):

\[\sigma = \sqrt{\sigma^2} = \sqrt{\sum_{i=1}^{N} \frac{(x_i – \bar{x})^2}{N}} \]

\( N \) značí počet hodnot v daném souboru (populaci), \( x_i \) označuje i-tou hodnotu v souboru a \( \bar{x} \) aritmetický průměr datové sady.

Výběrová směrodatná odchylka (s) se používá např. při vyhodnocení hodnot naměřených při experimentu. Počítá se jako druhá odmocnina z populačního rozptylu a využívá tzv. Besselovu opravu, kdy namísto dělení počtem hodnot n dělíme počtem hodnot minus jedna (viz příklad níže):

\[s = \sqrt{s^2} = \sqrt{\sum_{i=1}^{n} \frac{(x_i – \bar{x})^2}{n-1}} \]

(\( n \) se standardně využívá pro označení počtu hodnot ve výběrovém souboru.)

Besselova oprava snižuje zkreslení způsobené například extrémními hodnotami v malých datových souborech. Její použití přispívá k přesnějšímu odhadu směrodatné odchylky celé populace na základě výběrového souboru.

Zvýhodněné balíčky kurzů

Zakupte si balíček 2 nebo více vybraných kurzů a ušetřete


Jaký typ směrodatné odchylky použít?

Jestliže pracujete s daty zahrnujícími celou populaci (např. výška žáků 7. třídy na konkrétní základní škole), zvolte populační směrodatnou odchylku.

Pokud ale studujete výšku žáků 7. třídy na základních školách v celé ČR a k dispozici máte naměřené hodnoty omezeného vzorku (např. 100 chlapců), použijete výběrovou směrodatnou odchylku.


Využití směrodatné odchylky

Směrodatná odchylka hraje roli při hodnocení vlastností datového souboru. Používá totiž stejné jednotky jako naměřená data (naopak rozptyl popisujeme v jejich druhé mocnině).

Své místo má také v identifikaci odlehlých hodnot. U souboru dat s normálním rozdělením můžete využít tzv. pravidlo tří sigma (3s kritérium).

Za odlehlé pak považujeme ty hodnoty, které leží dále než tři směrodatné odchylky od průměru. (To přibližně odpovídá hodnotám pod 0,15. percentilem a nad 99,85. percentilem – využití pravidla se odvíjí od kontextu měření.)

Směrodatnou odchylku využijete také pro:

  • testování normality rozložení dat – směrodatná odchylka má svou roli v konstrukci Q-Q grafu a P-P grafu (slouží k vizuálnímu posouzení normality dat) nebo při určování šikmosti a špičatosti (popisují tvar rozdělení – viz míry tvaru),
  • stanovení intervalu spolehlivosti (na toto téma pro vás připravujeme článek),
  • testování alternativních hypotéz (např. v regresní či korelační analýze).

Podobně jako další míry variability a míry polohy je směrodatná odchylka citlivá na extrémní hodnoty.


Příklad výpočtu populační směrodatné odchylky

Vaším úkolem je spočítat směrodatnou odchylku výšky žáků 7. třídy ve vybrané malé základní škole. Naměřili jste tyto hodnoty: 158, 145, 165, 150 a 157 cm.

Na této škole se vám podařilo změřit výšku všech žáků (celé populace). Použijeme tedy vzorec pro populační směrodatnou odchylku, která vychází ze vzorce pro populační rozptyl:

\[\sigma = \sqrt{\sigma^2} = \sqrt{\sum_{i=1}^{N} \frac{(x_i – \bar{x})^2}{N}} \]

Nejprve proto musíme spočítat aritmetický průměr výšky:

\[\bar{x} = \frac{1}{N} \left( \sum_{i=1}^{N} x_i \right) = \frac{x_1 + x_2 + \ldots + x_N}{N} \] \[\bar{x} = \frac{158 + 145 + 165 + 150 + 157}{5}\] \[\bar{x} = 155\]

Získanou průměrnou výšku (155 cm) nyní dosadíme do vzorce pro populační rozptyl:

\[\sigma^2 = \sum_{i=1}^{N} \frac{(x_i – \bar{x})^2}{N} \] \[\sigma^2 = \frac{(158 – 155)^2 + (145 – 155)^2 + (165 – 155)^2 + (150 – 155)^2 + (157 – 155)^2}{5}\] \[\sigma^2 = 47.6\]

Rozptyl výšky zkoumané populace je 47,6 cm2. Pro získání směrodatné odchylky stačí získanou hodnotu odmocnit:

\[\sigma = \sqrt{\sigma^2} \] \[\sigma = 6.9\]

Populační směrodatná odchylka má hodnotu 6,9 cm. To znamená, že hodnoty výšky zkoumané populace žáků 7. třídy jsou od středu (155 cm) v průměru rozptýlené o 6,9 cm.


Výpočet populační směrodatné odchylky v Excelu

# buňky A1 až A100 obsahují naměřené hodnoty

# funkce pro výpočet populační směrodatné odchylky
=STDEV.P(A1:A100)


Výpočet populační směrodatné odchylky v jazyce R

# naměřené hodnoty
data <- c(3, 5, 6, 7, 8)

# funkce pro výpočet populační směrodatné odchylky
sqrt(var(data) * (length(data)-1)/length(data))


Příklad výpočtu výběrového směrodatné odchylky

Vaším úkolem je spočítat směrodatnou odchylku výšky žáků 7. třídy v menší obci (populace). K dispozici máte ale pouze hodnoty výšky pěti žáků z různých základních škol (výběr). Pro snazší srovnání použijeme stejné hodnoty jako v předchozím příkladu, tedy 158, 145, 165, 150 a 157 cm.

Proto zvolíme vzorec pro výběrovou směrodatnou odchylku:

\[s = \sqrt{s^2} = \sqrt{\sum_{i=1}^{n} \frac{(x_i – \bar{x})^2}{n-1}} \]

(\( n \) se standardně využívá pro označení počtu hodnot ve výběrovém souboru.)

Nejprve spočítáme výběrový rozptyl, do kterého dosadíme naměřené hodnoty a průměrnou výšku (155 cm):

\[s^2 = \sum_{i=1}^{n} \frac{(x_i – \bar{x})^2}{n-1} \] \[s^2 = \sum_{i=1}^{n} \frac{(158 – 155)^2 + (145 – 155)^2 + (165 – 155)^2 + (150 – 155)^2 + (157 – 155)^2}{5 – 1} \] \[s^2 = 59.5\]

Výběrový rozptyl výšky studovaného vzorku žáků je 59,5 cm2. Pro spočítání výběrové směrodatné odchylky získaný výsledek odmocníme:

\[s = \sqrt{s^2} \] \[s = 7.7\]

Výběrová směrodatná odchylka má hodnotu 7,7 cm. Z toho usuzujeme, že data (výška žáků ve vzorku) jsou kolem průměrné výšky 155 cm v průměru rozptýlena o 7,7 cm.



Výpočet výběrové směrodatné odchylky v Excelu

# buňky A1 až A100 obsahují naměřené hodnoty

# funkce pro výpočet výběrové směrodatné odchylky
=STDEV.S(A1:A100)


Výpočet výběrové směrodatné odchylky v jazyce R

# naměřené hodnoty
data <- c(3, 5, 6, 7, 8)

# funkce pro výpočet výběrové směrodatné odchylky
sd(data)


Mohlo by vás zajímat

Webináře
Ředitel Datové akademie představí Letní školu statistiky.

Zaujala vás naše Letní škola statistiky? Chcete se dozvědět víc? Máte jakékoli otázky?
Využijte příležitost připojit se k živé prezentaci Dávida Tkáče, ředitele DataBon Datová akademie. Detailně vám představí celý koncept i obsah jednotlivých workshopů. Prezentace proběhne živě, takže bude příležitost zodpovědět i jakékoli vaše otázky.

Naše kurzy

Analýza rozptylu v TIBCO Statistica

Přihlásit na kurz Lektor: Mgr. Patrik Galeta, Ph.D. Naučte se v TIBCO Statistica správně používat funkce základní a pokročilé analýzy rozptylu a získané výsledky správně interpretovat. Na reálných příkladech vám ukážeme, jak pracovat s post-hoc testy i s různými ANOVA metodami pro porovnávání dvou a více skupin. 1denním kurzem vás provede Mgr. Patrik Galeta, Ph.D., odborný asistent katedry antropologie Západočeské univerzity v Plzni, který se statistice věnuje v rámci demografických studií (viz profil lektora). Procvičování probíhá v české verzi aplikace TIBCO Statistica. Počítač vám zapůjčíme na místě, není třeba nosit vlastní. Chci se přihlásit Adresa konání kurzu Délka kurzu Z kurzu budete mít největší užitek, pokud: chcete zjistit, jaké faktory (a v jaké míře) ovlivňují chování pozorovaných veličin (výzkumní pracovníci, datoví analytici a vědci), potřebujete svá data kvůli přesnosti vyhodnocovat pokročilejšími metodami analýzy rozptylu. Jaké vstupní znalosti jsou potřeba? pro účast na kurzu je vhodné mít znalosti v rozsahu základního kurzu statistiky I v TIBCO Statistica a základního kurzu statistiky II v TIBCO Statistica Co se na kurzu naučíte? jakým způsobem správně ověřovat předpoklady pro použití analýzy rozptylu, jak v TIBCO Statistica vhodně přeskupit data pro analýzu rozptylu, z kterých principů vycházejí metody ANOVA (pro jednofaktorová, vícefaktorová a opakovaná měření), ANCOVA, MANOVA a neparametrické ANOVA (Kruskal-Wallisova a Friedmannova), pochopit specifika jednotlivých metod, jaký typ analýzy pro daný úkol použít a jak výsledky správně interpretovat, jaké jsou rozdíly mezi jednotlivými post-hoc testy a jak je použít. Chci vidět podrobný sylabus kurzu Úvod Úvod do analýzy rozptylu Zopakování principu testování hypotéz Testy pro dva výběry (nepárové, párové a neparametrické) Metody analýzy rozptylu Ověřování předpokladů ANOVA Jednofaktorová ANOVA ANOVA pro opakovaná měření Analýza kovariance Vícerfaktorová ANOVA Vícerozměrná analýza rozptylu (MANOVA) Neparametrické metody analýzy rozptylu Kruskal-Wallisův test Friedmanova ANOVA Post-hoc testy Fisherův, Scheffého, atd. Názory spokojených účastníků Jaké školící materiály obdržíte? na kurzu obdržíte tištěné prezentace probírané látky, které vám následně zašleme v elektronické verzi Po kurzu Vám zašleme elektronickou verzi prezentace včetně příkladů. Jak dlouho kurz trvá? 1 pracovní den Kdo vás bude školit? Kurzem vás provede Mgr. Patrik Galeta, Ph.D., odborný asistent katedry antropologie Západočeské univerzity v Plzni, který se statistice věnuje v rámci demografických studií. Kolik kurz stojí, kde probíhá a jaké jsou možnosti platby? Kurz proběhne v prostorách Mendelovy univerzity v Brně. Cena kurzu je 7 900 Kč bez DPH. Součástí ceny je kromě zajištění pomůcek a školících materiálů také občerstvení v průběhu kurzu a oběd. Platba probíhá převodem oproti vystavené faktuře. Nezávazná přihláška na

Základní biostatistická analýza v jazyce R

Kurzy Ovládání programovacího jazyka R + Kurz biostatistiky I v jazyce R Přihlásit na kurz Lektoři: Mgr. Patrik Galeta, PhD. a Mgr. Bc. Silvie Bělašková, PhD. Trvání kurzu: 3 dny Naučte se od základů zpracovat a vyhodnotit klinická a biologická data základními statistickými metodami v jazyce R – i když jste s R nikdy nepracovali. Balíček za zvýhodněnou cenu kombinuje: A/ Ovládání programovacího jazyka R (1 den) – orientace v prostředí R a aplikace RStudio, importování dat z Excelu a dalších aplikací, transformace a zpracování proměnných a vytváření grafů. B/ Kurz biostatistiky I v jazyce R (2 dny) – design vědeckého experimentu, testování medicínských a biologických hypotéz pomocí parametrických (t-test, ANOVA, lineární regrese ad.) a neparametrických metod (Wilcoxnovy testy, Kruskal-Wallisova ANOVA), využívání kontingenčních tabulek. Procvičování příkladů probíhá v anglické verzi aplikace RStudio. Počítač vám zapůjčíme na místě, není třeba nosit vlastní. Chci se přihlásit Spokojených absolventů Adresa konání kurzu Délka kurzu Z kurzů budete mít největší užitek, pokud: se chcete naučit ovládat programovací jazyk R pro vyhodnocování dat ze svého klinického či biologického výzkumu, nemáte se zpracováním dat v jazyce R žádné zkušenosti a potřebujete datovou analýzu využívat ve své práci (výzkumní a technologičtí pracovníci, ad.). Jaké vstupní znalosti jsou potřeba? Pro absolvování balíčků kurzů nejsou potřeba žádné specifické znalosti – jde o školení pro úplné začátečníky. Co vše se naučíte? A/ Ovládání programovacího jazyka R jak se orientovat v prostředí aplikace RStudio a balíčku tidyverse , jak lehce importovat data různých formátů do R, proč data zpracovávat pomocí na sebe navazujících algoritmických sekvencí (tzv. pipelines), jak použít knihovnu dplyr pro snadnou úpravu proměnných a práci s nimi, možnosti úprav textových proměnných a faktorů pomocí knihoven stringr a forcats, jak hromadně upravit proměnné, jak vytvořit krásné a přehledné grafy v knihovně ggplot2. Ovládání programovacího jazyka R – podrobný sylabus Prostředí RStudia Jednotná syntax funkcí skupiny knihoven tidyverse Úsporné psaní kódu pomocí „pipeline“ Načtení dat do R z formátu MS Excel (knihovna readxl) a SAS, SPSS, Stata (knihovna haven) Práce s daty (knihovna dplyr) Výběr proměnných a případů Přejmenování proměnných Úprava proměnných (jednotlivě i hromadně) Spojení více tabulek pomocí společné proměnné Práce s daty v rámci skupin Úprava textových proměnných (knihovna stringr) Najít a nahradit řetězec Rozdělit a spojit řetězce Vyčistit řetězce Práce s faktory (knihovna forcats) Nastavit pořadí úrovně faktorů podle různých kritérií Přidat a odstranit úrovně Spojení úrovní více faktorů Práce s formátem datum (knihovna lubridate) Převedení data na formát datum Extrakce orku, měsíce, dne

Správa a řízení vědeckých dat dle FAIR Data Principles

Přihlásit na kurz Lektor: Ing. Jan Červený, Ph.D. Spravujte svá experimentální data tak, abyste s nimi vy i vědecká komunita mohli dlouhodobě pracovat – a vytěžit z nich další poznatky. Publikováním výsledků životnost nasbíraných dat nekončí. V kurzu pro vědecké pracovníky vás krok po kroku naučíme, jak data z experimentů uložit a zpřístupnit podle zásad FAIR Data Principles. Díky tomu s nimi budete moci opakovaně pracovat a hledat v nich nové souvislosti. 2denním kurzem vás provede Ing. Jan Červený, PhD., vedoucí výzkumný pracovník oddělení adaptivních a chytrých biotechnologií na Ústavu výzkumu globální změny AV ČR (viz profil lektora).  Procvičování probíhá v české verzi aplikace MS Excel 365 . Počítač vám zapůjčíme na místě, není třeba nosit vlastní Chci se přihlásit Adresa konání kurzu Délka kurzu Z kurzu budete mít největší užitek, pokud: chcete zvýšit své šance na získání výzkumných grantů, potřebujete zorganizovat a propojit data z různých projektů (a zpřístupnit je), publikujete vědecké články a potřebujete mít data v excelentní kvalitě, chcete zlepšit úroveň vědeckých výstupů své organizace. Jaké vstupní znalosti jsou potřeba? Pro absolvování kurzu jsou vhodné znalosti v rozsahu: MS Excel na základní uživatelské úrovni (základní operace a funkce), základní terminologie zpracování a ukládání informací (databázové principy, elementární matematické operace s daty), povědomí o existenci globálních systémů identifikace digitálních objektů (DOI apod.) Co se v kurzu naučíte? jak s daty systematicky pracovat a co to vašemu výzkumu přinese, jak se ke správě dat staví čtyři základní pilíře konceptu FAIR Data Principles (Findability – dohledatelnost, Accessibility – dostupnost, Interoperability – interoperabilita, Reuse – opakované použití), principy správného ukládání a popisování datových setů, jak propojit data z různých zdrojů (např. laboratorních zařízení či úložišť), jaké technologie jsou dostupné a které vybrat, jak data efektivně vyhodnotit s pomocí statistické analýzy. Chci vidět podrobný sylabus kurzu    Úvod:  Co jsou FAIR Data Principles a proč je důležité je dodržovat.  Dohledatelnost (Findability) – Jak zajistit nalezení dat včetně použití metadat a identifikátorů. Dostupnost (Accessibility) – Jak umožnit přístup k datům a zajistit jejich dostupnost pro výzkum. Interoperabilita (Interoperability) – Jak zajistit, aby data byla srozumitelná a čitelná pro různé systémy a aplikace. Opakované použití (Reuse) – Jak zajistit opakované využití dat v rámci výzkumné organizace i mimo ní.   Jaké jsou důvody potřeby systematického zpracovávání dat nejen kvůli naplňování požadavků na Open Science. Zvýhodněné balíčky kurzů Zakupte si balíček 2 nebo více vybraných kurzů a ušetřete Prohlédnout balíčky kurzů Jaký je přístup EU a

Zvýhodněné balíčky kurzů

Zakupte si balíček 2 nebo více vybraných kurzů a ušetřete

[24. 4. 2024] Webinář ZDARMA: Jak získat 82% příspěvek na školení statistiky přes MPSV

Pod vedením zakladatele Datové akademie Dávida Tkáče mj. zjistíte: