Ovládání programovacího jazyka R
- webinář ZDARMA -

Přesvědčte se, že nemusíte mít IT geny, abyste pracovali s datovými podklady, vytvářeli grafy, efektní reporty…

úterý 12. 05. 2026 od 15:00
Prohlédnout

Nový formát vzdělávání: Letní škola statistiky 2026
Za 5 dní ovládnete statistiku v R, JASP, nebo Jamovi. Napořád.

20. - 24. 7. 2026
Prohlédnout

Objevte nové možnosti využití statistiky pro svou praxi.

Podívejte se na ZÁZNAM WEBINÁŘE Biostatistika v R
Prohlédnout

Obsah

Aritmetický průměr: definice, využití a výpočet


Aritmetický průměr je jeden z nejvyužívanějších ukazatelů popisné statistiky. Patří mezi tzv. míry polohy a vyjadřuje střední hodnotu datového souboru. U normálního rozdělení dat se hodnota aritmetického průměru rovná hodnotě mediánu.

Počítá se jako součet všech hodnot proměnné dělený celkovým počtem hodnot (viz příklad níže):

\[\bar{x} = \frac{1}{n} \left( \sum_{i=1}^{n} x_i \right) = \frac{x_1 + x_2 + \ldots + x_n}{n} \]

Využití aritmetického průměru

Aritmetický průměr je základem pro výpočet rozptylu a směrodatné odchylky. Hodí se pro běžná číselná data, jako je třeba výška rostlin, počet studentů nebo teplota v místnosti. Naopak není vhodný pro hodnoty:

  • s odlišnou váhou (např. výpočet celkové průměru u žáků z malé a velké školy, kdy průměr velké školy má vyšší váhu – viz vážený průměr),
  • vykazující určité tempo růstu či poklesu, tedy tzv. zřetězenou růstovou charakteristiku (např. průměrný roční výnos investic nebo rychlost růstu kolonie bakterií – viz geometrický průměr),
  • s charakterem podílu či převrácené hodnoty (např. účinnost nebo koncentrace látky v roztoku – viz harmonický průměr).

Nevýhodou aritmetického průměru je velká citlivost na odlehlé hodnoty, které mohou významně zkreslit celkový pohled na datový soubor. Odlehlé hodnoty mohou poukazovat na chybu v měření či výběru vzorku, může jít ale také o skutečnou hodnotu, která se od ostatních výrazně liší (na téma odlehlých hodnot pro vás připravujeme samostatný článek).



Příklad výpočtu aritmetického průměru

Při pozorování rychlosti růstu hrachoru jste týden po vyklíčení naměřili u 10 zástupců studovaného genotypu následující výšku (h): 10,75 cm, 11,35 cm, 11,56 cm, 13,17 cm, 13,23 cm, 14,04 cm, 14,69 cm, 15,73 cm, 18,38 cm a 19,45 cm.

Po dosazení do rovnice pro aritmetický průměr vychází:

\[\bar{h} = \frac{13.23 + 15.73 + 14.04 + 13.17 + 11.35 + 14.69 + 11.56 + 18.38 + 19.45 + 10.75}{10}\] \[\bar{h} = 14.23\ \text{cm}\]

Průměrná výška rostliny po týdnu růstu je 14,23 cm.





Výpočet aritmetického průměru v Excelu

# buňky A1 až A100 obsahují naměřené hodnoty

# funkce pro výpočet aritmetického průměru
=AVERAGE(A1:A100)


Výpočet aritmetického průměru v jazyce R

# naměřené hodnoty
data <- c(3, 5, 6, 7, 8)

# funkce pro výpočet aritmetického průměru
mean(data)


Pro hromadný výpočet aritmetického průměru a dalších charakteristik popisné statistiky v jazyce R slouží příkaz summary(), resp. describe()podrobnosti najdete zde.

Zvýhodněné balíčky kurzů

Zakupte si balíček 2 nebo více vybraných kurzů a ušetřete



Mohlo by vás zajímat

Články
Analýza dat ve vědě a výzkumu

Statistická analýza je klíčem ke kvalitnějším výsledkům a publikaci v prestižních vědeckých časopisech. Jak ji dělat správně?

Naše kurzy

Data mining v TIBCO Statistica

Přihlásit na kurz Lektor: doc. RNDr. Ing. Marcel Jiřina, Ph.D. Trvání kurzu: 2 dny Naučte se pomocí aplikace Statistica odhalit důležité informace ve svých datech data miningovými metodami. Na kurzu pro vědce, statistiky a datové analytiky vám na praktických příkladech ukážeme, jak data vytěžovat s pomocí pokročilých lineárních (regresních) i nelineárních modelů, neuronových sítí, klasifikačních stromů, metod strojového učení a dalších metod. Probereme také způsoby prezentace získaných výsledků (viz názory spokojených účastníků). 2denním kurzem vás provede vás provede doc. RNDr. Ing. Marcel Jiřina, Ph.D., děkan Fakulty informačních technologií Českého vysokého učení technického, který se věnuje výzkumu data-miningových metod, zejména zpracování textu a obrazu (viz profil lektora). Procvičování probíhá v české verzi aplikace TIBCO Statistica v modulu Data Miner. Počítač vám zapůjčíme na místě, není třeba nosit vlastní. Chci se přihlásit Adresa konání kurzu Délka kurzu Z kurzu budete mít největší užitek, pokud: potřebujete rychle a efektivně zpracovávat velké objemy dat (analytici z oblasti bankovnictví, pojišťovnictví a průmyslu, vědci), se chcete seznámit s modulem Data Miner a prohloubit své znalosti aplikace TIBCO Statistica. Jaké vstupní znalosti jsou potřeba? pro účast na kurzu je vhodné mít znalosti v rozsahu Základního kurzu statistiky I v TIBCO Statistica. Co se v kurzu naučíte? z jakých principů data miningu vychází a jak k němu přistupovat, připravit a zpracovat velké datové balíky pomocí klasifikačních a regresních stromů, lineárních modelů, metody shlukování či strojového učení, využívat techniky vytěžování textu a analýzy nezávislých komponent (ICA), sestavit predikční modely, vyhodnotit jejich kvalitu a získané výsledky správně interpretovat, nasadit modely na reálná data z praxe, automatizovat celý analytický proces, na co si dat při tvorbě modelů pozor a čemu se vyhnout. Chci vidět podrobný sylabus kurzu Úvod Základní informace o softwaru Statistica Výukové zdroje pro software a možnosti nápovědy Úvod do vytěžování dat, produkt Princip, možnosti, využití Práce s Recepty (wizardem) Příprava dat (načtení, výběr proměnných, transformace, vzorkování dat, odstranění duplicitních vzorů, filtrace odlehlých hodnot, oprava chybějících údajů) Detekce a případné odstranění podobných vstupních příznaků (prediktorů) Výběr důležitých prediktorů pro požadovanou úlohu Vytváření klasifikačních a regresních modelů Vyhodnocení kvality vytvořeného modelů Nasazení modelu v praxi Klasifikační a regresní stromy Princip, možnosti, využití CART stromy CHAID stromy Vytváření klasifikačních a regresních stromů v interaktivním režimu (generování stromu, prořezávání stromu, výběr rozhodovacích proměnných, výběr mezí) Generované stromy (Boosted Trees) Náhodné lesy (Random Forests) Lineární modely Princip regrese (Obecné) lineární modely Zobecněné lineární modely Zobecněné aditivní modely MARSplines Metody shlukování K-průměrů (k-means) Hierarchické a EM

Správa a řízení vědeckých dat dle FAIR Data Principles

Přihlásit na kurz Lektor: Ing. Jan Červený, Ph.D. Spravujte svá experimentální data tak, abyste s nimi vy i vědecká komunita mohli dlouhodobě pracovat – a vytěžit z nich další poznatky. Publikováním výsledků životnost nasbíraných dat nekončí. V kurzu pro vědecké pracovníky vás krok po kroku naučíme, jak data z experimentů uložit a zpřístupnit podle zásad FAIR Data Principles. Díky tomu s nimi budete moci opakovaně pracovat a hledat v nich nové souvislosti. 2denním kurzem vás provede Ing. Jan Červený, PhD., vedoucí výzkumný pracovník oddělení adaptivních a chytrých biotechnologií na Ústavu výzkumu globální změny AV ČR (viz profil lektora).  Procvičování probíhá v české verzi aplikace MS Excel 365 . Počítač vám zapůjčíme na místě, není třeba nosit vlastní Chci se přihlásit Adresa konání kurzu Délka kurzu Z kurzu budete mít největší užitek, pokud: chcete zvýšit své šance na získání výzkumných grantů, potřebujete zorganizovat a propojit data z různých projektů (a zpřístupnit je), publikujete vědecké články a potřebujete mít data v excelentní kvalitě, chcete zlepšit úroveň vědeckých výstupů své organizace. Jaké vstupní znalosti jsou potřeba? Pro absolvování kurzu jsou vhodné znalosti v rozsahu: MS Excel na základní uživatelské úrovni (základní operace a funkce), základní terminologie zpracování a ukládání informací (databázové principy, elementární matematické operace s daty), povědomí o existenci globálních systémů identifikace digitálních objektů (DOI apod.) Co se v kurzu naučíte? jak s daty systematicky pracovat a co to vašemu výzkumu přinese, jak se ke správě dat staví čtyři základní pilíře konceptu FAIR Data Principles (Findability – dohledatelnost, Accessibility – dostupnost, Interoperability – interoperabilita, Reuse – opakované použití), principy správného ukládání a popisování datových setů, jak propojit data z různých zdrojů (např. laboratorních zařízení či úložišť), jaké technologie jsou dostupné a které vybrat, jak data efektivně vyhodnotit s pomocí statistické analýzy. Chci vidět podrobný sylabus kurzu    Úvod:  Co jsou FAIR Data Principles a proč je důležité je dodržovat.  Dohledatelnost (Findability) – Jak zajistit nalezení dat včetně použití metadat a identifikátorů. Dostupnost (Accessibility) – Jak umožnit přístup k datům a zajistit jejich dostupnost pro výzkum. Interoperabilita (Interoperability) – Jak zajistit, aby data byla srozumitelná a čitelná pro různé systémy a aplikace. Opakované použití (Reuse) – Jak zajistit opakované využití dat v rámci výzkumné organizace i mimo ní.   Jaké jsou důvody potřeby systematického zpracovávání dat nejen kvůli naplňování požadavků na Open Science. Zvýhodněné balíčky kurzů Zakupte si balíček 2 nebo více vybraných kurzů a ušetřete Prohlédnout balíčky kurzů Jaký je přístup EU a

Základy MS Power BI

Naučte se data z obchodu, financí či logistiky zpracovat do přehledných reportů – a naplánujte podle nich své další kroky.

Zvýhodněné balíčky kurzů

Zakupte si balíček 2 nebo více vybraných kurzů a ušetřete

[24. 4. 2024] Webinář ZDARMA: Jak získat 82% příspěvek na školení statistiky přes MPSV

Pod vedením zakladatele Datové akademie Dávida Tkáče mj. zjistíte: