Nový formát vzdělávání: Letní škola statistiky 2026
Za 5 dní ovládnete statistiku v R, JASP, nebo Jamovi. Napořád.

20. - 24. 7. 2026
Prohlédnout

Ředitel Datové akademie představí Letní školu statistiky.

30 minut, které vás přesvědčí, že by bylo škoda chybět.

čtvrtek 21. 05. 2026 od 15:00
Prohlédnout

Objevte nové možnosti využití statistiky pro svou praxi.

Podívejte se na ZÁZNAM WEBINÁŘE Biostatistika v R
Prohlédnout

Obsah

Aritmetický průměr: definice, využití a výpočet


Aritmetický průměr je jeden z nejvyužívanějších ukazatelů popisné statistiky. Patří mezi tzv. míry polohy a vyjadřuje střední hodnotu datového souboru. U normálního rozdělení dat se hodnota aritmetického průměru rovná hodnotě mediánu.

Počítá se jako součet všech hodnot proměnné dělený celkovým počtem hodnot (viz příklad níže):

\[\bar{x} = \frac{1}{n} \left( \sum_{i=1}^{n} x_i \right) = \frac{x_1 + x_2 + \ldots + x_n}{n} \]

Využití aritmetického průměru

Aritmetický průměr je základem pro výpočet rozptylu a směrodatné odchylky. Hodí se pro běžná číselná data, jako je třeba výška rostlin, počet studentů nebo teplota v místnosti. Naopak není vhodný pro hodnoty:

  • s odlišnou váhou (např. výpočet celkové průměru u žáků z malé a velké školy, kdy průměr velké školy má vyšší váhu – viz vážený průměr),
  • vykazující určité tempo růstu či poklesu, tedy tzv. zřetězenou růstovou charakteristiku (např. průměrný roční výnos investic nebo rychlost růstu kolonie bakterií – viz geometrický průměr),
  • s charakterem podílu či převrácené hodnoty (např. účinnost nebo koncentrace látky v roztoku – viz harmonický průměr).

Nevýhodou aritmetického průměru je velká citlivost na odlehlé hodnoty, které mohou významně zkreslit celkový pohled na datový soubor. Odlehlé hodnoty mohou poukazovat na chybu v měření či výběru vzorku, může jít ale také o skutečnou hodnotu, která se od ostatních výrazně liší (na téma odlehlých hodnot pro vás připravujeme samostatný článek).



Příklad výpočtu aritmetického průměru

Při pozorování rychlosti růstu hrachoru jste týden po vyklíčení naměřili u 10 zástupců studovaného genotypu následující výšku (h): 10,75 cm, 11,35 cm, 11,56 cm, 13,17 cm, 13,23 cm, 14,04 cm, 14,69 cm, 15,73 cm, 18,38 cm a 19,45 cm.

Po dosazení do rovnice pro aritmetický průměr vychází:

\[\bar{h} = \frac{13.23 + 15.73 + 14.04 + 13.17 + 11.35 + 14.69 + 11.56 + 18.38 + 19.45 + 10.75}{10}\] \[\bar{h} = 14.23\ \text{cm}\]

Průměrná výška rostliny po týdnu růstu je 14,23 cm.





Výpočet aritmetického průměru v Excelu

# buňky A1 až A100 obsahují naměřené hodnoty

# funkce pro výpočet aritmetického průměru
=AVERAGE(A1:A100)


Výpočet aritmetického průměru v jazyce R

# naměřené hodnoty
data <- c(3, 5, 6, 7, 8)

# funkce pro výpočet aritmetického průměru
mean(data)


Pro hromadný výpočet aritmetického průměru a dalších charakteristik popisné statistiky v jazyce R slouží příkaz summary(), resp. describe()podrobnosti najdete zde.

Zvýhodněné balíčky kurzů

Zakupte si balíček 2 nebo více vybraných kurzů a ušetřete



Mohlo by vás zajímat

Statistika
Typy proměnných (a jak je určit)

Pro výběr vhodného statistického testu a získání odpovědí na otázky ohledně objektu či jevu, který studujete, je zcela zásadní vědět, se kterými druhy proměnných ve výzkumu pracujete. Jak na to?

Články
Analýza dat ve vědě a výzkumu

Statistická analýza je klíčem ke kvalitnějším výsledkům a publikaci v prestižních vědeckých časopisech. Jak ji dělat správně?

Naše kurzy

Zpracování dat a prezentace výsledků v akademické literatuře

Přihlásit na kurz Lektor: Mgr. Patrik Galeta, PhD. Zpracujte data ze svého výzkumu tak, aby váš článek bez problémů prošel recenzním řízením ve všech vědeckých časopisech. V kurzu pro vědecké pracovníky získáte praktický návod, jak vybrané statistické metody využít a popsat je v odborném článku. Po absolvování školení budete umět připravit podklady (rukopis, tabulky, grafy, dopis editorovi) pro recenzní řízení. Během kurzu pracujeme s praktickými ukázkami ze známých vědeckých periodik. 2denním kurzem vás provede Mgr. Patrik Galeta, PhD., odborný asistent katedry antropologie Západočeské univerzity v Plzni, který se statistice věnuje v rámci demografických studií (viz profil lektora). Procvičování probíhá na příkladech z přírodních a společenských věd v české verzi aplikace Tibco Statistica, popř. RStudio. Počítač vám zapůjčíme na místě, není třeba nosit vlastní. Chci se přihlásit Adresa konání kurzu Délka kurzu Z kurzu budete mít největší užitek, pokud: připravujete tabulky a grafy do rukopisu článku a potřebujete výchozí data správně zpracovat (vědečtí pracovníci), potřebujete porozumět standardům statistické analýzy ve vědeckých periodikách. Jaké vstupní znalosti jsou potřeba? Pro absolvování kurzu nejsou potřeba žádné specifické znalosti. Co se v kurzu naučíte? jak vyhodnotit vztah dvou a více proměnných pomocí t-testů, analýzy rozptylu, kontingenčních tabulek a regrese, co z výsledků analýzy do odborného článku vybrat, jak připravit tabulky s popisnými statistikami, jakým způsobem v odborné literatuře vhodně vizualizovat data, jaká je základní struktura odborného článku (kapitoly úvod, materiál, metody, výsledky, diskuse, závěr), podle jakých vzorových formulací se statistické výsledky píší, jak připravit rukopis do recenzního řízení (a popř. jej upravit na základě zpětné vazby). Chci vidět podrobný sylabus kurzu R a Rstudio Základy ovládání R pomocí knihoven tidyverse Popisná statistika Četnostní tabulky Popisné ukazatele (průměr, medián, rozptyl) Grafy v knihovně ggplot2   Opakování hodnocení vztahu proměnných t-testy, ANOVA Kontingenční tabulky Regrese a korelace   Základní struktura odborného článku s analýzou kvantitativních dat Kapitoly Úvod, Materiál, Metody, Výsledky, Diskuze, Závěr Co je obsahem jednotlivých kapitol Jak si vytvořit „vědecký prostor“   Prezentace základních analýz v odborném článku Struktura kapitol Materiál a Metody Strukturované psaní kapitoly Výsledky Očekávaný formát tabulek v rukopisu článku Očekávaný formát grafů, nutné minimum   Příklady dobré praxe Vzorové články s prezentací základních analýz Kritický rozbor textu Typy používaných formulací   Příprava podkladů pro rukopis článku Text rukopisu, soubory s grafy a tabulky, titulky grafů Dopis editorovi ukázka portálu pro odevzdání u mezinárodního odborného časopisu (např. https://mc.manuscriptcentral.com/) Návrh recenzentů   Základy zpracování odpovědi na recenzní řízení Úprava rukopisu Podrobná odpověď na připomínky recenzentů Názory spokojených účastníků Chci

Kompletní biostatistická analýza v jazyce R

Ovládání jazyka R + Kurz biostatistiky I v jazyce R + Kurz biostatistiky II v jazyce R Přihlásit na kurz Lektoři: Mgr. Patrik Galeta, PhD. a Mgr. Bc. Silvie Bělašková, PhD. Trvání kurzu: 5 dnů Naučte se od úplné nuly vyhodnocovat klinická a biologická data základními a pokročilými metodami v jazyce R – a výrazně zvyšte kvalitu svých výzkumných publikací. Balíček za zvýhodněnou cenu kombinuje: A/ Ovládání programovacího jazyka R (1 den) – orientace v prostředí R a aplikace RStudio, importování dat z Excelu a dalších aplikací, transformace a zpracování proměnných a vytváření grafů. B/ Kurz biostatistiky I v jazyce R (2 dny) – design vědeckého experimentu, testování medicínských a biologických hypotéz pomocí parametrických (t-test, ANOVA, lineární regrese ad.) a neparametrických metod (Wilcoxnovy testy, Kruskal-Wallisova ANOVA), využívání kontingenčních tabulek. C/ Kurz biostatistiky II v jazyce R (2 dny) – vyhodnocení dat pomocí korelační analýzy, logistické regrese a dalších metod, základy vícerozměrných statistických metod a časových řad, metodiky servival a risk analysis. Procvičování příkladů probíhá v anglické verzi aplikace RStudio. Počítač vám zapůjčíme na místě, není třeba nosit vlastní. Chci se přihlásit Spokojených absolventů Adresa konání kurzu Délka kurzu Z kurzů budete mít největší užitek, pokud: nemáte se zpracováním dat v jazyce R žádné zkušenosti a potřebujete datovou analýzu využívat ve své práci (výzkumní a technologičtí pracovníci, ad.). se chcete naučit vyhodnocovat klinická a biologická data základními a pokročilými metodami v programovacím jazyce R, chcete výrazně zvýšit svou šanci na publikování v prestižním periodiku. Jaké vstupní znalosti jsou potřeba? Pro absolvování balíčků kurzů nejsou potřeba žádné specifické znalosti – začneme od základů. Co vše se naučíte? A/ Ovládání programovacího jazyka R jak se orientovat v prostředí aplikace RStudio a balíčku tidyverse , jak lehce importovat data různých formátů do R, proč data zpracovávat pomocí na sebe navazujících algoritmických sekvencí (tzv. pipelines), jak použít knihovnu dplyr pro snadnou úpravu proměnných a práci s nimi, možnosti úprav textových proměnných a faktorů pomocí knihoven stringr a forcats, jak hromadně upravit proměnné, jak vytvořit krásné a přehledné grafy v knihovně ggplot2. Ovládání programovacího jazyka R – podrobný sylabus Prostředí RStudia Jednotná syntax funkcí skupiny knihoven tidyverse Úsporné psaní kódu pomocí „pipeline“ Načtení dat do R z formátu MS Excel (knihovna readxl) a SAS, SPSS, Stata (knihovna haven) Práce s daty (knihovna dplyr) Výběr proměnných a případů Přejmenování proměnných Úprava proměnných (jednotlivě i hromadně) Spojení více tabulek pomocí společné proměnné Práce s daty v rámci skupin Úprava textových proměnných (knihovna

Data mining v TIBCO Statistica

Přihlásit na kurz Lektor: doc. RNDr. Ing. Marcel Jiřina, Ph.D. Trvání kurzu: 2 dny Naučte se pomocí aplikace Statistica odhalit důležité informace ve svých datech data miningovými metodami. Na kurzu pro vědce, statistiky a datové analytiky vám na praktických příkladech ukážeme, jak data vytěžovat s pomocí pokročilých lineárních (regresních) i nelineárních modelů, neuronových sítí, klasifikačních stromů, metod strojového učení a dalších metod. Probereme také způsoby prezentace získaných výsledků (viz názory spokojených účastníků). 2denním kurzem vás provede vás provede doc. RNDr. Ing. Marcel Jiřina, Ph.D., děkan Fakulty informačních technologií Českého vysokého učení technického, který se věnuje výzkumu data-miningových metod, zejména zpracování textu a obrazu (viz profil lektora). Procvičování probíhá v české verzi aplikace TIBCO Statistica v modulu Data Miner. Počítač vám zapůjčíme na místě, není třeba nosit vlastní. Chci se přihlásit Adresa konání kurzu Délka kurzu Z kurzu budete mít největší užitek, pokud: potřebujete rychle a efektivně zpracovávat velké objemy dat (analytici z oblasti bankovnictví, pojišťovnictví a průmyslu, vědci), se chcete seznámit s modulem Data Miner a prohloubit své znalosti aplikace TIBCO Statistica. Jaké vstupní znalosti jsou potřeba? pro účast na kurzu je vhodné mít znalosti v rozsahu Základního kurzu statistiky I v TIBCO Statistica. Co se v kurzu naučíte? z jakých principů data miningu vychází a jak k němu přistupovat, připravit a zpracovat velké datové balíky pomocí klasifikačních a regresních stromů, lineárních modelů, metody shlukování či strojového učení, využívat techniky vytěžování textu a analýzy nezávislých komponent (ICA), sestavit predikční modely, vyhodnotit jejich kvalitu a získané výsledky správně interpretovat, nasadit modely na reálná data z praxe, automatizovat celý analytický proces, na co si dat při tvorbě modelů pozor a čemu se vyhnout. Chci vidět podrobný sylabus kurzu Úvod Základní informace o softwaru Statistica Výukové zdroje pro software a možnosti nápovědy Úvod do vytěžování dat, produkt Princip, možnosti, využití Práce s Recepty (wizardem) Příprava dat (načtení, výběr proměnných, transformace, vzorkování dat, odstranění duplicitních vzorů, filtrace odlehlých hodnot, oprava chybějících údajů) Detekce a případné odstranění podobných vstupních příznaků (prediktorů) Výběr důležitých prediktorů pro požadovanou úlohu Vytváření klasifikačních a regresních modelů Vyhodnocení kvality vytvořeného modelů Nasazení modelu v praxi Klasifikační a regresní stromy Princip, možnosti, využití CART stromy CHAID stromy Vytváření klasifikačních a regresních stromů v interaktivním režimu (generování stromu, prořezávání stromu, výběr rozhodovacích proměnných, výběr mezí) Generované stromy (Boosted Trees) Náhodné lesy (Random Forests) Lineární modely Princip regrese (Obecné) lineární modely Zobecněné lineární modely Zobecněné aditivní modely MARSplines Metody shlukování K-průměrů (k-means) Hierarchické a EM

Zvýhodněné balíčky kurzů

Zakupte si balíček 2 nebo více vybraných kurzů a ušetřete

[24. 4. 2024] Webinář ZDARMA: Jak získat 82% příspěvek na školení statistiky přes MPSV

Pod vedením zakladatele Datové akademie Dávida Tkáče mj. zjistíte: