Nový webinář Biostatistika v R – úvod do kurzu ZDARMA

Objevte nové možnosti využití statistiky v biomedicíně, klinickém výzkumu nebo veřejném zdraví. Investujte hodinu času a posuňte se ve své kariéře.

úterý 18. 11. 2025 od 15:00

Objevte nové možnosti využití statistiky pro svou praxi.

Podívejte se na ZÁZNAM WEBINÁŘE Biostatistika v R – klikněte ZDE.

Objevte nové možnosti využití statistiky pro svou praxi.

Podívejte se na ZÁZNAM WEBINÁŘE Biostatistika v R – klikněte ZDE.

Propásli jste webinář JAK NA STATISTIKU BEZ PROGRAMOVÁNÍ?

Podívejte se na ZÁZNAM ZDE!

Obsah

Aritmetický průměr: definice, využití a výpočet


Aritmetický průměr je jeden z nejvyužívanějších ukazatelů popisné statistiky. Patří mezi tzv. míry polohy a vyjadřuje střední hodnotu datového souboru. U normálního rozdělení dat se hodnota aritmetického průměru rovná hodnotě mediánu.

Počítá se jako součet všech hodnot proměnné dělený celkovým počtem hodnot (viz příklad níže):

\[\bar{x} = \frac{1}{n} \left( \sum_{i=1}^{n} x_i \right) = \frac{x_1 + x_2 + \ldots + x_n}{n} \]

Využití aritmetického průměru

Aritmetický průměr je základem pro výpočet rozptylu a směrodatné odchylky. Hodí se pro běžná číselná data, jako je třeba výška rostlin, počet studentů nebo teplota v místnosti. Naopak není vhodný pro hodnoty:

  • s odlišnou váhou (např. výpočet celkové průměru u žáků z malé a velké školy, kdy průměr velké školy má vyšší váhu – viz vážený průměr),
  • vykazující určité tempo růstu či poklesu, tedy tzv. zřetězenou růstovou charakteristiku (např. průměrný roční výnos investic nebo rychlost růstu kolonie bakterií – viz geometrický průměr),
  • s charakterem podílu či převrácené hodnoty (např. účinnost nebo koncentrace látky v roztoku – viz harmonický průměr).

Nevýhodou aritmetického průměru je velká citlivost na odlehlé hodnoty, které mohou významně zkreslit celkový pohled na datový soubor. Odlehlé hodnoty mohou poukazovat na chybu v měření či výběru vzorku, může jít ale také o skutečnou hodnotu, která se od ostatních výrazně liší (na téma odlehlých hodnot pro vás připravujeme samostatný článek).



Příklad výpočtu aritmetického průměru

Při pozorování rychlosti růstu hrachoru jste týden po vyklíčení naměřili u 10 zástupců studovaného genotypu následující výšku (h): 10,75 cm, 11,35 cm, 11,56 cm, 13,17 cm, 13,23 cm, 14,04 cm, 14,69 cm, 15,73 cm, 18,38 cm a 19,45 cm.

Po dosazení do rovnice pro aritmetický průměr vychází:

\[\bar{h} = \frac{13.23 + 15.73 + 14.04 + 13.17 + 11.35 + 14.69 + 11.56 + 18.38 + 19.45 + 10.75}{10}\] \[\bar{h} = 14.23\ \text{cm}\]

Průměrná výška rostliny po týdnu růstu je 14,23 cm.





Výpočet aritmetického průměru v Excelu

# buňky A1 až A100 obsahují naměřené hodnoty

# funkce pro výpočet aritmetického průměru
=AVERAGE(A1:A100)


Výpočet aritmetického průměru v jazyce R

# naměřené hodnoty
data <- c(3, 5, 6, 7, 8)

# funkce pro výpočet aritmetického průměru
mean(data)


Pro hromadný výpočet aritmetického průměru a dalších charakteristik popisné statistiky v jazyce R slouží příkaz summary(), resp. describe()podrobnosti najdete zde.

Zvýhodněné balíčky kurzů

Zakupte si balíček 2 nebo více vybraných kurzů a ušetřete



Mohlo by vás zajímat

Články
Analýza dat ve vědě a výzkumu

Statistická analýza je klíčem ke kvalitnějším výsledkům a publikaci v prestižních vědeckých časopisech. Jak ji dělat správně?

Naše kurzy

Regresní analýza v TIBCO Statistica

Přihlásit na kurz Lektor: Mgr. Patrik Galeta, PhD. Naučte se v aplikaci Statistica zpracovávat svoje data pomocí lineární a nelineární regrese – jedné z nejvyužívanějších statistických metod. Na kurzu vás provedeme vás různými modely regresní analýzy, metodami vyhodnocení a naučíme vás data správně vizualizovat (viz názory spokojených účastníků). 1denním kurzem vás provede Mgr. Patrik Galeta, PhD., odborný asistent katedry antropologie Západočeské univerzity v Plzni, který se statistice věnuje v rámci demografických studií (viz profil lektora). Procvičování probíhá v české verzi aplikace TIBCO Statistica. Počítač vám zapůjčíme na místě, není třeba nosit vlastní. Chci se přihlásit Adresa konání kurzu Délka kurzu Z kurzu budete mít největší užitek, pokud: potřebujete rychle a efektivně zpracovávat data z výzkumu, vývoje či obchodu (vědečí pracovníci, datoví nebo finanční analytici), chcete prohloubit své znalosti v oblasti regresní analýzy. Jaké vstupní znalosti jsou potřeba? Pro absolvování tohoto kurzu je vhodné mít znalosti v rozsahu kurzů: Základní kurz statistiky I v TIBCO Statistica a Základní kurz statistiky II v TIBCO Statistica. Co v kurzu naučíte? jaké regresní modely existují a jak správně ověřit předpoklady pro jejich použití, co je logistická regrese, jak sestavit regresní model a změřit jeho kvalitu, podle čeho hodnotit model jako celek, jaký je význam korelační analýzy (především multikolinearity), jakým způsobem data vhodně vizualizovat na co si dat při tvorbě regresních modelů pozor a čemu se vyhnout. Chci vidět podrobný sylabus kurzu Úvod Úvod do regresní analýzy Princip regresní analýzy Korelační analýza Význam korelace Multikolinearita Koeficient determinace Lineární regresní modely Ověření předpokladů Jednoduchá regrese Vícenásobná regrese Polynomiální regrese (určení stupně polynomu) Nelineární regresní modely Úvod do logistické regrese Názory spokojených účastníků Chci vidět další názory účastníků kurzu Jaké školící materiály obdržíte? na kurzu obdržíte tištěné prezentace probírané látky, které vám následně zašleme v elektronické verzi Jak dlouho kurz trvá? 1 pracovní den Kdo vás bude školit? Kurzem vás provede Mgr. Patrik Galeta, PhD., odborný asistent katedry antropologie Západočeské univerzity v Plzni. Statistickým metodám se věnuje v rámci demografických studií, na ZČU vede také kurz zpracování dat. Vedle stovek studentů proškolil ve statistických metodách také stovky účastníků našich kurzů. Kolik kurz stojí, kde probíhá a jaké jsou možnosti platby? Kurz probíhá v našem školícím středisku na adrese Kodaňská 1441/46, Praha 10. Cena kurzu je 7 900 Kč bez DPH. Součástí ceny je kromě zajištění pomůcek a školících materiálů také občerstvení v průběhu kurzu a oběd. Zvýhodněné balíčky kurzů Zakupte si balíček 2 nebo více vybraných kurzů a ušetřete Prohlédnout

Pokročilá biostatistická analýza v jazyce R

Kurz biostatistiky I v jazyce R + Kurz biostatistiky II v jazyce R Přihlásit na kurz Lektor: Mgr. Bc. Silvie Bělašková, PhD. Trvání kurzu: 4 dny Naučte se v jazyce R zpracovat a vyhodnotit klinická a biologická data základními i pokročilými metodami statistiky. Najděte ve svých měřeních skryté souvislosti a výrazně zvyšte kvalitu svých výzkumných publikací. Balíček za zvýhodněnou cenu kombinuje: A/ Kurz biostatistiky I v jazyce R (2 dny) – design vědeckého experimentu, testování medicínských a biologických hypotéz pomocí parametrických (t-test, ANOVA, lineární regrese ad.) a neparametrických metod (Wilcoxnovy testy, Kruskal-Wallisova ANOVA), využívání kontingenčních tabulek. B/ Kurz biostatistiky II v jazyce R (2 dny) – vyhodnocení dat pomocí korelační analýzy, logistické regrese a dalších metod, základy vícerozměrných statistických metod a časových řad, metodiky servival a risk analysis. Procvičování příkladů probíhá v anglické verzi aplikace RStudio. Počítač vám zapůjčíme na místě, není třeba nosit vlastní. Chci se přihlásit Spokojených absolventů Adresa konání kurzu Délka kurzu Z kurzů budete mít největší užitek, pokud: se chcete naučit ovládat programovací jazyk R pro vyhodnocování dat ze svého klinického či biologického výzkumu základními i pokročilými metodami, potřebujete ve svých datech rychle najít důležité vazby a souvislosti, chcete výrazně zvýšit svou šanci na publikování v prestižním periodiku. Jaké vstupní znalosti jsou potřeba? Pro účast na kurzech je vhodné absolvovat nejprve kurz Ovládání programovacího jazyka R. Co vše se naučíte? A/ Kurz biostatistiky I v jazyce R jaké typy proměnných existují a jaké jsou mezi nimi rozdíly, co je průměr, medián, směrodatná odchylka a další popisné statistiky, kdy a jak je použít a jak je vizualizovat, jak otestovat normalitu dat a kdy použít parametrickou a neparametrickou statistiku, jak v programovacím jazyce R vyhodnocovat data a testovat hypotézy pomocí základních parametrických (t-test, ANOVA ad.) a neparametrických metod (Wilcoxnovy testy, Kruskal-Wallisova ANOVA), jak mezi sebou porovnat a otestovat dva a více datových souborů pomocí kontingenčních tabulek a chí-kvadrát testu, jak sestavit a použít jednoduchý regresní model, jak z pohledu biostatistiky správně nadesignovat vědecký experiment, jak správně zpracovat statistické pasáže ve vědeckých publikacích a na co si dát pozor. Kurz biostatistiky I v jazyce R – podrobný sylabus Úvod do analýzy dat Typy proměnných. Popisná statistika (charakteristiky polohy a variability). Vhodné vizualizace dat. Normální rozdělení a ověření normality dat. Parametrická a neparametrická statistika Testování hypotéz Úvod do testování hypotéz. Parametrické testy. Jednovýběrový t test. Dvouvýběrový t test. Párový t test. Analýza rozptylu (ANOVA). Základní neparametrické testy. Wilcoxnovy testy. Kruskal-Wallisova

Úvod do programování v Pythonu (nejen) pro vědce

Online kurz (12 × 2,5 hod ve 12 týdnech) Přihlásit na kurz Lektor: Vít Kuntoš Trvání kurzu: 12 týdnů Naučte se základy nejoblíbenějšího programovacího jazyku Python, i když nemáte s programováním žádné zkušenosti. Po absolvování kurzu porozumíte syntaxu kódu v Pythonu a naučíte se využívat datové typy, řídící struktury, funkce a základní datové struktury. Na získané znalosti navážete např. kurzem statistického vyhodnocování dat v Pythonu. Kurzem s nejvýše 10 účastníky vás provede Vít Kuntoš, programátor s praxí v Pythonu a frameworku Django (viz profil lektora). Všechny prezentované postupy si vyzkoušíte na praktických příkladech v online aplikaci pro psaní kódu v Pythonu. Chci se přihlásit Adresa konání kurzu Délka kurzu Každý čtvrtek 18:00 – 20:30 Výukový čas Z kurzu budete mít největší užitek, pokud: nejste programátor a nikdy jste neprogramovali, ale chcete se naučit úplné základy programovacího jazyku Python, chcete získat základní znalosti pro další rozvoj a využití Pythonu všemi směry – pro vyhodnocování a vizualizaci dat (nejen) z výzkumu nebo tvorbu webových aplikací a automatizací. Jaké vstupní znalosti jsou potřeba? pro absolvování kurzu nejsou potřeba žádné specifické znalosti. Co se na kurzu naučíte? jak se orientovat v prostředí aplikace RStudio, jaké typy proměnných existují a jaké jsou mezi nimi rozdíly, co je průměr, medián, směrodatná odchylka a další popisné statistiky a kdy a jak je použít, jak v programovacím jazyce R vyhodnocovat data a testovat hypotézy pomocí základních statistických metod, jakým způsobem vhodně vizualizovat data, jak mezi sebou porovnávat dva a více datových souborů, jak vyhodnocovat data pomocí kontingenčních tabulek, jak sestavit regresní model a vytvářet modely typu „co se stane, když…“. Chci vidět podrobný sylabus kurzu Program kurzu podle lekcí Součástí každé lekce jsou příklady a úkoly, na kterých si přednášenou látku vyzkoušíte. V závěru kurzu vytvoříte vlastní projekt, na kterém v praxi ukážete, jak Pythonu rozumíte. Úvod do programování – k čemu jej využijete, historie a vlastnosti Pythonu, odkud získávat informace Psaní kódu – jak počítač kód zpracovává, psaní komentářů, typy proměnných, funkce print a input Číselné datové typy a operace – integer, float, complex, aritmetické operace, porovnávání, převody Řetězce – metody pro práci s textem, formátování, indexování, slicing, striding Boolean a podmínky – funkce if, else, elif, true a false, logické operátory, rozhodování v programu Cykly – funkce for a while, opakování bloku kódu, iterace přes sekvence dat Listy a práce s nimi – ukládání více hodnot, přístup k prvkům, metody pro manipulaci Slovníky a práce s

Zvýhodněné balíčky kurzů

Zakupte si balíček 2 nebo více vybraných kurzů a ušetřete

[24. 4. 2024] Webinář ZDARMA: Jak získat 82% příspěvek na školení statistiky přes MPSV

Pod vedením zakladatele Datové akademie Dávida Tkáče mj. zjistíte: