Nový formát vzdělávání: Letní škola statistiky 2026
Za 5 dní ovládnete statistiku v R, JASP, nebo Jamovi. Napořád.

20. - 24. 7. 2026
Prohlédnout

Ředitel Datové akademie představí Letní školu statistiky.

30 minut, které vás přesvědčí, že by bylo škoda chybět.

čtvrtek 21. 05. 2026 od 15:00
Prohlédnout

Objevte nové možnosti využití statistiky pro svou praxi.

Podívejte se na ZÁZNAM WEBINÁŘE Biostatistika v R
Prohlédnout

Obsah

Aritmetický průměr: definice, využití a výpočet


Aritmetický průměr je jeden z nejvyužívanějších ukazatelů popisné statistiky. Patří mezi tzv. míry polohy a vyjadřuje střední hodnotu datového souboru. U normálního rozdělení dat se hodnota aritmetického průměru rovná hodnotě mediánu.

Počítá se jako součet všech hodnot proměnné dělený celkovým počtem hodnot (viz příklad níže):

\[\bar{x} = \frac{1}{n} \left( \sum_{i=1}^{n} x_i \right) = \frac{x_1 + x_2 + \ldots + x_n}{n} \]

Využití aritmetického průměru

Aritmetický průměr je základem pro výpočet rozptylu a směrodatné odchylky. Hodí se pro běžná číselná data, jako je třeba výška rostlin, počet studentů nebo teplota v místnosti. Naopak není vhodný pro hodnoty:

  • s odlišnou váhou (např. výpočet celkové průměru u žáků z malé a velké školy, kdy průměr velké školy má vyšší váhu – viz vážený průměr),
  • vykazující určité tempo růstu či poklesu, tedy tzv. zřetězenou růstovou charakteristiku (např. průměrný roční výnos investic nebo rychlost růstu kolonie bakterií – viz geometrický průměr),
  • s charakterem podílu či převrácené hodnoty (např. účinnost nebo koncentrace látky v roztoku – viz harmonický průměr).

Nevýhodou aritmetického průměru je velká citlivost na odlehlé hodnoty, které mohou významně zkreslit celkový pohled na datový soubor. Odlehlé hodnoty mohou poukazovat na chybu v měření či výběru vzorku, může jít ale také o skutečnou hodnotu, která se od ostatních výrazně liší (na téma odlehlých hodnot pro vás připravujeme samostatný článek).



Příklad výpočtu aritmetického průměru

Při pozorování rychlosti růstu hrachoru jste týden po vyklíčení naměřili u 10 zástupců studovaného genotypu následující výšku (h): 10,75 cm, 11,35 cm, 11,56 cm, 13,17 cm, 13,23 cm, 14,04 cm, 14,69 cm, 15,73 cm, 18,38 cm a 19,45 cm.

Po dosazení do rovnice pro aritmetický průměr vychází:

\[\bar{h} = \frac{13.23 + 15.73 + 14.04 + 13.17 + 11.35 + 14.69 + 11.56 + 18.38 + 19.45 + 10.75}{10}\] \[\bar{h} = 14.23\ \text{cm}\]

Průměrná výška rostliny po týdnu růstu je 14,23 cm.





Výpočet aritmetického průměru v Excelu

# buňky A1 až A100 obsahují naměřené hodnoty

# funkce pro výpočet aritmetického průměru
=AVERAGE(A1:A100)


Výpočet aritmetického průměru v jazyce R

# naměřené hodnoty
data <- c(3, 5, 6, 7, 8)

# funkce pro výpočet aritmetického průměru
mean(data)


Pro hromadný výpočet aritmetického průměru a dalších charakteristik popisné statistiky v jazyce R slouží příkaz summary(), resp. describe()podrobnosti najdete zde.

Zvýhodněné balíčky kurzů

Zakupte si balíček 2 nebo více vybraných kurzů a ušetřete



Mohlo by vás zajímat

Statistika
Typy proměnných (a jak je určit)

Pro výběr vhodného statistického testu a získání odpovědí na otázky ohledně objektu či jevu, který studujete, je zcela zásadní vědět, se kterými druhy proměnných ve výzkumu pracujete. Jak na to?

Naše kurzy

Ovládání R Markdown pro výzkumné pracovníky

Naučte se psát vědecké články a vytvářet atraktivní výstupy v R Markdown – populárním rozšíření programovacího jazyka R.
Po absolvování kurzu zvládnete v R Markdown vytvořit dokumenty ve formátech vyžadovaných různými periodiky, vložit do nich výzkumná data a ta vhodným způsobem vizualizovat.

Časové řady a predikce v jazyce R

Přihlásit na kurz Lektor: RNDr. Václav Čapek, PhD. Trvání kurzu: 2 dny Naučte se správně pracovat s časovými řadami a predikovat další vývoj pozorovaných veličin v programovacím jazyce R. Na praktických příkladech vás seznámíme s metodami časových řad a vysvětlíme vám, jak jejich chování predikovat a jak ohodnotit a interpretovat správnost získaných výsledků. 2denním kurzem vás provede RNDr. Václav Čapek, PhD., nezávislý datový konzultant na volné noze, který spolupracuje např. s Akademií věd ČR, Institutem klinické a experimentální medicíny nebo společností Dell Computer (viz profil lektora). Procvičování příkladů probíhá v anglické verzi aplikace RStudio. Počítač vám zapůjčíme na místě, není třeba nosit vlastní. Chci se přihlásit Adresa konání kurzu Délka kurzu Z kurzu budete mít největší užitek, pokud: pracujete s časově zatíženými daty a potřebujete je umět správně vyhodnotit (výzkumní a technologičtí pracovníci, datoví analytici ad.), rozumíte základům časových řad, ale chcete jednotlivé metody pochopit do větší hloubky a umět je správně používat. Jaké vstupní znalosti jsou potřeba? Pro absolvování tohoto kurzu je vhodné mít znalosti v rozsahu kurzů: Základní kurz statistiky I v programovacím jazyce R a Základní kurz statistiky II v programovacím jazyce R. Co se na kurzu naučíte? porozumět základním pojmům z oblasti časových řad (stacionární procesy, exponenciální vyrovnávání, různé typy modelů), pochopit specifika práce s časovou řadou oproti ostatním datovým typům, pracovat s běžně používanými metodami pro analýzu časových řad, vyhodnotit, která metoda je vhodná pro danou úlohu (ARMA, nestacionární a sezónní modely ad.). na co si při vyhodnocování časových řad dát pozor a čemu se vyhnout Chci vidět podrobný sylabus kurzu Úvod Úvod do časových řad Příklady časových řad Odhadování trendu a predikce pomocí regresní analýzy Hodnocení předpovědí v časových řadách Dekompozice časových řad Exponenciální vyrovnávání Bez trendu S trendem Bez sezónního vlivu Se sezónním vlivem Stacionární procesy Stacionární modely Autokorelační funkce (ACF, PACF) Predikce stacionárních časových řad Testování šumové náhodné posloupnosti ARMA modely ACF a PACF pro ARMA (p, q) Odhad řádu ARMA Nestacionární a sezonní modely ARIMA modely Sezonní SARIMA modely Názory spokojených účastníků Chci vidět další názory účastníků kurzu Jaké školící materiály obdržíte? na kurzu obdržíte tištěné prezentace probírané látky, které vám následně zašleme v elektronické verzi Jak dlouho kurz trvá? 2 pracovní dny Kdo vás bude školit? Kurzem vás provede RNDr. Václav Čapek, PhD., absolvent Matematicko-fyzikální fakulty Univerzity Karlovy v Praze, který působí jako nezávislý konzultant v oboru statistiky, zpracování dat, fnančního řízení, managementu, logistiky a implementace informačních systémů. Spolupracuje např. s Akademií

Základní biostatistická analýza v jazyce R

Kurzy Ovládání programovacího jazyka R + Kurz biostatistiky I v jazyce R Přihlásit na kurz Lektoři: Mgr. Patrik Galeta, PhD. a Mgr. Bc. Silvie Bělašková, PhD. Trvání kurzu: 3 dny Naučte se od základů zpracovat a vyhodnotit klinická a biologická data základními statistickými metodami v jazyce R – i když jste s R nikdy nepracovali. Balíček za zvýhodněnou cenu kombinuje: A/ Ovládání programovacího jazyka R (1 den) – orientace v prostředí R a aplikace RStudio, importování dat z Excelu a dalších aplikací, transformace a zpracování proměnných a vytváření grafů. B/ Kurz biostatistiky I v jazyce R (2 dny) – design vědeckého experimentu, testování medicínských a biologických hypotéz pomocí parametrických (t-test, ANOVA, lineární regrese ad.) a neparametrických metod (Wilcoxnovy testy, Kruskal-Wallisova ANOVA), využívání kontingenčních tabulek. Procvičování příkladů probíhá v anglické verzi aplikace RStudio. Počítač vám zapůjčíme na místě, není třeba nosit vlastní. Chci se přihlásit Spokojených absolventů Adresa konání kurzu Délka kurzu Z kurzů budete mít největší užitek, pokud: se chcete naučit ovládat programovací jazyk R pro vyhodnocování dat ze svého klinického či biologického výzkumu, nemáte se zpracováním dat v jazyce R žádné zkušenosti a potřebujete datovou analýzu využívat ve své práci (výzkumní a technologičtí pracovníci, ad.). Jaké vstupní znalosti jsou potřeba? Pro absolvování balíčků kurzů nejsou potřeba žádné specifické znalosti – jde o školení pro úplné začátečníky. Co vše se naučíte? A/ Ovládání programovacího jazyka R jak se orientovat v prostředí aplikace RStudio a balíčku tidyverse , jak lehce importovat data různých formátů do R, proč data zpracovávat pomocí na sebe navazujících algoritmických sekvencí (tzv. pipelines), jak použít knihovnu dplyr pro snadnou úpravu proměnných a práci s nimi, možnosti úprav textových proměnných a faktorů pomocí knihoven stringr a forcats, jak hromadně upravit proměnné, jak vytvořit krásné a přehledné grafy v knihovně ggplot2. Ovládání programovacího jazyka R – podrobný sylabus Prostředí RStudia Jednotná syntax funkcí skupiny knihoven tidyverse Úsporné psaní kódu pomocí „pipeline“ Načtení dat do R z formátu MS Excel (knihovna readxl) a SAS, SPSS, Stata (knihovna haven) Práce s daty (knihovna dplyr) Výběr proměnných a případů Přejmenování proměnných Úprava proměnných (jednotlivě i hromadně) Spojení více tabulek pomocí společné proměnné Práce s daty v rámci skupin Úprava textových proměnných (knihovna stringr) Najít a nahradit řetězec Rozdělit a spojit řetězce Vyčistit řetězce Práce s faktory (knihovna forcats) Nastavit pořadí úrovně faktorů podle různých kritérií Přidat a odstranit úrovně Spojení úrovní více faktorů Práce s formátem datum (knihovna lubridate) Převedení data na formát datum Extrakce orku, měsíce, dne

Zvýhodněné balíčky kurzů

Zakupte si balíček 2 nebo více vybraných kurzů a ušetřete

[24. 4. 2024] Webinář ZDARMA: Jak získat 82% příspěvek na školení statistiky přes MPSV

Pod vedením zakladatele Datové akademie Dávida Tkáče mj. zjistíte: