Nový formát vzdělávání: Letní škola statistiky 2026
Za 5 dní ovládnete statistiku v R, JASP, nebo Jamovi. Napořád.

20. - 24. 7. 2026
Prohlédnout

Ředitel Datové akademie představí Letní školu statistiky.

30 minut, které vás přesvědčí, že by bylo škoda chybět.

čtvrtek 21. 05. 2026 od 15:00
Prohlédnout

Objevte nové možnosti využití statistiky pro svou praxi.

Podívejte se na ZÁZNAM WEBINÁŘE Biostatistika v R
Prohlédnout

Obsah

Vážený průměr: definice, využití a výpočet


Vážený průměr je míra polohy, pomocí které počítáme střední hodnotu v datové sadě, ve které mají některé hodnoty jinou váhu než ostatní. Tím se liší od aritmetického průměru, kde mají všechny hodnoty stejnou váhu.

Počítá se jako součet všech hodnot vynásobených svou váhou, dělený celkový součtem vah (viz příklad níže):

\[\bar{x} = \frac{\sum_{i=1}^{n} w_i x_i}{\sum_{i=1}^{n} w_i} = \frac{w_1 x_1 + w_2 x_2 + \ldots + w_n x_n}{w_1 + w_2 + \ldots + w_n} \]


Využití váženého průměru

Vážený průměr nalézá využití v situacích, kdy mají určité hodnoty odlišnou důležitost (váhu) než jiná naměřená data. K tomu dochází tehdy, pokud:

  • je v souboru naměřených hodnot určitá skupina s menším zastoupením (např. při výpočtu celkového průměru známek u žáků z malé a velké školy přiřadíme průměru velké školy vyšší váhu),
  • některé hodnoty jsou ve vztahu k řešené výzkumné otázce a hypotéze významnější než jiné (např. při zkoumání léku na úzkostnou poruchu budeme výsledkům u jedinců se silnou úzkostí přiřazovat vyšší váhu).

Při správném nastavení vah poskytuje přesnější informace o střední hodnotě než aritmetický průměr. Hodnota váženého průměru je základem pro výpočet vážené směrodatné odchylky a váženého rozptylu.

Nevýhodou váženého průměru je obtížné nastavení vah, zejména pokud se určuje subjektivně. Z toho vyplývá možný nepřesný výsledek, který hodnotu průměru výrazně zkresluje.

Příkladem je hodnocení účinnosti různých vzdělávacích metod, kdy ovšem může být obtížné určit váhu vlivu učebních materiálů, metody výuky a kvalifikace učitelů.

Zvýhodněné balíčky kurzů

Zakupte si balíček 2 nebo více vybraných kurzů a ušetřete



Příklad výpočtu váženého průměru

Pro účely experimentu potřebujete vypočítat hustotu slitiny hliníku, mědi a manganu v poměru 95:4:1 (slitina dural, používaná např. v leteckém průmyslu). K dispozici máte údaje o hustotě hliníku (ρAl = 2,7 g/cm3), hustotě mědi (ρCu = 8,94 g/cm3) a hustotě manganu (ρMn = 7,21 g/cm3).

Váhu zastoupení jednotlivých kovů určuje jejich procentuální podíl ve slitině:

Kov Zastoupení kovu ve slitině (váha w) Hustota kovu (sledovaná hodnota ρ)
Hliník 95 2,7 g/cm3
Měď 4 8,94 g/cm3
Mangan 1 7,21 g/cm3

Po dosazení do rovnice pro vážený průměr vychází:

\[\bar{ρ} = \frac{\sum_{i=1}^{n} w_i ρ_i}{\sum_{i=1}^{n} w_i} \] \[\bar{ρ} = \frac{w_1 ρ_1 + w_2 ρ_2 + w_3 ρ_3}{w_1 + w_2 + + w_3} \] \[\bar{\rho} = \frac{(95 \times 2.7) + (4 \times 8.94) + (1 \times 7.21)}{95 + 4 + 1} \] \[\bar{\rho} = 2,99 \text{g/cm}^3 \]

Hustota zkoumané slitiny duralu je 2,99 g/cm3.



Výpočet váženého průměru v Excelu

# buňky A1 až A100 obsahují naměřené hodnoty
# buňky B1 až B100 obsahují váhy jednotlivých hodnoty

# funkce pro výpočet váženého průměru
=SUMPRODUCT(A1:A100, B1:B100) / SUM(B1:B100)


Výpočet váženého průměru v jazyce R

# naměřené hodnoty
data <- c(3, 5, 6, 7, 8)

# váhy naměřených hodnot
weights <- c(0.1, 0.3, 0.3, 0.2, 0.1)

# funkce pro výpočet váženého průměru
weighted.mean(x=data, w=weights)


Pro hromadný výpočet váženého průměru a dalších charakteristik popisné statistiky v jazyce R slouží příkaz summary(), resp. describe()podrobnosti najdete zde.



Mohlo by vás zajímat

Články
Analýza dat ve vědě a výzkumu

Statistická analýza je klíčem ke kvalitnějším výsledkům a publikaci v prestižních vědeckých časopisech. Jak ji dělat správně?

Naše kurzy

Pokročilá biostatistická analýza v jazyce R

Kurz biostatistiky I v jazyce R + Kurz biostatistiky II v jazyce R Přihlásit na kurz Lektor: Mgr. Bc. Silvie Bělašková, PhD. Trvání kurzu: 4 dny Naučte se v jazyce R zpracovat a vyhodnotit klinická a biologická data základními i pokročilými metodami statistiky. Najděte ve svých měřeních skryté souvislosti a výrazně zvyšte kvalitu svých výzkumných publikací. Balíček za zvýhodněnou cenu kombinuje: A/ Kurz biostatistiky I v jazyce R (2 dny) – design vědeckého experimentu, testování medicínských a biologických hypotéz pomocí parametrických (t-test, ANOVA, lineární regrese ad.) a neparametrických metod (Wilcoxnovy testy, Kruskal-Wallisova ANOVA), využívání kontingenčních tabulek. B/ Kurz biostatistiky II v jazyce R (2 dny) – vyhodnocení dat pomocí korelační analýzy, logistické regrese a dalších metod, základy vícerozměrných statistických metod a časových řad, metodiky servival a risk analysis. Procvičování příkladů probíhá v anglické verzi aplikace RStudio. Počítač vám zapůjčíme na místě, není třeba nosit vlastní. Chci se přihlásit Spokojených absolventů Adresa konání kurzu Délka kurzu Z kurzů budete mít největší užitek, pokud: se chcete naučit ovládat programovací jazyk R pro vyhodnocování dat ze svého klinického či biologického výzkumu základními i pokročilými metodami, potřebujete ve svých datech rychle najít důležité vazby a souvislosti, chcete výrazně zvýšit svou šanci na publikování v prestižním periodiku. Jaké vstupní znalosti jsou potřeba? Pro účast na kurzech je vhodné absolvovat nejprve kurz Ovládání programovacího jazyka R. Co vše se naučíte? A/ Kurz biostatistiky I v jazyce R jaké typy proměnných existují a jaké jsou mezi nimi rozdíly, co je průměr, medián, směrodatná odchylka a další popisné statistiky, kdy a jak je použít a jak je vizualizovat, jak otestovat normalitu dat a kdy použít parametrickou a neparametrickou statistiku, jak v programovacím jazyce R vyhodnocovat data a testovat hypotézy pomocí základních parametrických (t-test, ANOVA ad.) a neparametrických metod (Wilcoxnovy testy, Kruskal-Wallisova ANOVA), jak mezi sebou porovnat a otestovat dva a více datových souborů pomocí kontingenčních tabulek a chí-kvadrát testu, jak sestavit a použít jednoduchý regresní model, jak z pohledu biostatistiky správně nadesignovat vědecký experiment, jak správně zpracovat statistické pasáže ve vědeckých publikacích a na co si dát pozor. Kurz biostatistiky I v jazyce R – podrobný sylabus Úvod do analýzy dat Typy proměnných. Popisná statistika (charakteristiky polohy a variability). Vhodné vizualizace dat. Normální rozdělení a ověření normality dat. Parametrická a neparametrická statistika Testování hypotéz Úvod do testování hypotéz. Parametrické testy. Jednovýběrový t test. Dvouvýběrový t test. Párový t test. Analýza rozptylu (ANOVA). Základní neparametrické testy. Wilcoxnovy testy. Kruskal-Wallisova

Zpracování geodat v programovacím jazyce R

Přihlásit na kurz Lektor: Mgr. Ondřej Ledvinka, PhD. Trvání kurzu: 2 dny Naučte se od základu vyhodnocovat geoprostorová data (geodata) v programovacím jazyce R pomocí funkcí, které jejich hromadné zpracování zjednodušují a urychlují. V kurzu pro vědecké pracovníky z oblasti geověd vás naučíme, jak geodata zpracovat a transformovat na tzv. tidy formát i jak je analyzovat a vizualizovat (tvořit mapy). Po absolvování školení tak zvládnete rychle vytvořit analytické skripty pro geodata. 2denním kurzem vás provede Mgr. Ondřej Ledvinka, PhD., specialista Oddělení hydrofondu a bilancí ČHMÚ a odborný asistent Katedry fyzické geografie a geoekologie Univerzity Karlovy, který se zpracování geodat věnuje v oblasti hydrologie a klimatologie (viz profil lektora). Procvičování probíhá v anglické verzi aplikace RStudio. Počítač vám zapůjčíme na místě, není třeba nosit vlastní. Po skončení kurzů navíc získáte přes 40 skriptů, které použijete k analýze vlastních dat. Chci se přihlásit 60 minutový webinář jako OCHUTNÁVKA ZDARMA Adresa konání kurzu Délka kurzu Z kurzu budete mít největší užitek, pokud: se chcete naučit ovládat programovací jazyk R pro vyhodnocování dat, jejichž nedílnou součástí je geometrie (vektorová geodata, rastrová geodata), nemáte se zpracováním geodat v jazyce R žádné zkušenosti a potřebujete jejich analýzu využívat ve své práci (výzkumní pracovníci z oblasti geografie, geologie, hydrologie, klimatologie, ochrany životního prostředí, dálkového průzkumu Země a dalších geověd), máte s jazykem R zkušenosti, ale potřebujete své znalosti adaptovat pro zpracování geodat, potřebujete zefektivnit analýzu geodat ve své organizaci. Jaké vstupní znalosti jsou potřeba? Pro účast na kurzu je vhodné mít znalosti v rozsahu kurzu Ovládání programovacího jazyka R. Co se na kurzu naučíte? jak se orientovat v prostředí aplikace RStudio (zejm. pokud jde o specifické vlastnosti geodat v prostředí RStudia), jak importovat geodata různých formátů do R z různých zdrojů (souborů, serverových služeb a prostřednictvím specifických funkcí v R balíčcích), jak naopak efektivně ukládat geodata do souborů, aby nedocházelo ke ztrátě pracně vytvořených výsledků nebo meziproduktů, proč geograficky zatížená data zpracovávat pomocí na sebe navazujících algoritmických sekvencí (tzv. pipelines), jak využívat ekosystém balíčků tidyverse vzhledem ke zpracování vektorových geodat (především funkce balíčku sf), jak tvořit nová vektorová a rastrová geodata se specifikací souřadnicového referenčního systému – jak z existujících souřadnic, tak ze zcela nově definovaných souřadnicových párů (funkce balíčků sf, sfheaders) či rozsahu a horizontálního rozlišení (funkce balíčku terra), jak při zpracování geodat pomáhá funkcionální programování v R s definicemi anonymních funkcí, jak v R tvořit statické (tematické) mapy prostřednictvím funkcí balíčku ggplot2 a jemu podobných (např. tidyterra, ggspatial) nebo

Zvýhodněné balíčky kurzů

Zakupte si balíček 2 nebo více vybraných kurzů a ušetřete

[24. 4. 2024] Webinář ZDARMA: Jak získat 82% příspěvek na školení statistiky přes MPSV

Pod vedením zakladatele Datové akademie Dávida Tkáče mj. zjistíte: