Ovládání programovacího jazyka R
- webinář ZDARMA -

Přesvědčte se, že nemusíte mít IT geny, abyste pracovali s datovými podklady, vytvářeli grafy, efektní reporty…

úterý 12. 05. 2026 od 15:00
Prohlédnout

Nový formát vzdělávání: Letní škola statistiky 2026
Za 5 dní ovládnete statistiku v R, JASP, nebo Jamovi. Napořád.

20. - 24. 7. 2026
Prohlédnout

Objevte nové možnosti využití statistiky pro svou praxi.

Podívejte se na ZÁZNAM WEBINÁŘE Biostatistika v R
Prohlédnout

Obsah

Harmonický průměr: definice, využití a výpočet


Harmonický průměr je míra polohy, kterou používáme pro výpočet střední hodnoty v sadě čísel s převrácenými (recipročními) hodnotami nebo s charakterem podílu.

Počítá se jako převrácená hodnota průměru převrácených hodnot v datové sadě (viz příklad níže). Při výpočtu harmonického průměru tedy nejprve spočítáme nejprve aritmetický průměr převrácených hodnot datové sady a získaný výsledek opět převrátíme:

\[H = \frac{n}{\sum_{i=1}^{n} \frac{1}{x_i}} = \frac{n}{\frac{1}{x_1} + \frac{1}{x_2} + \ldots + \frac{1}{x_n}} \]


Využití harmonického průměru

Harmonický průměr dává přesnější výsledek v situacích, kdy je potřeba s vyšší váhou zohlednit malé hodnoty v datové sadě (a naopak přiřadit nižší váhu vysokým hodnotám).

Používáme jej také v situacích, kdy počítáme průměr z veličin vyjádřených podílem. Jde např. o:

  • výpočet průměrné rychlosti (harmonický průměr zohlední skutečný čas, který strávíme na cestě),
  • určení průměrného tlaku v nádobě s různými plyny (harmonický průměr zohledňuje jednotlivé tlaky plynných složek a poskytuje přesnější přehled o celkovém tlaku směsi),
  • zhodnocení průměrné životnosti komponent v sériové výrobě (harmonický průměr poskytuje přesnější odhad průměrné životnosti ve chvíli, kdy jsou některé komponenty méně spolehlivé a častěji selhávají, což má větší vliv na celkovou funkčnost).

Harmonický průměr nelze využít, pokud se v datové sadě nacházejí nulové hodnoty. Při započtení záporných hodnot zase výsledek nemusí dávat smysl. Harmonický průměr je také náročnější na pochopení a interpretaci získaných výsledků.



Příklad výpočtu harmonického průměru

Představte si, že máte dva stejně dlouhé úseky cesty. Na prvním úseku jste jeli rychlostí 60 km/h a na druhém rychlostí 80 km/h. Každý úsek byl dlouhý 60 km. Jaká je průměrná rychlost jízdy?

Zvýhodněné balíčky kurzů

Zakupte si balíček 2 nebo více vybraných kurzů a ušetřete

Po dosazení do rovnice pro harmonický průměr vychází:

\[H = \frac{n}{\sum_{i=1}^{n} \frac{1}{x_i}} = \frac{n}{\frac{1}{x_1} + \frac{1}{x_2} + \ldots + \frac{1}{x_n}}\] \[H = \frac{2}{\frac{1}{60} + \frac{1}{80}}\] \[H = \frac{2}{0.0167 + 0.0125}\] \[H \approx 68.49 \text{ km/h}\]

Průměrná rychlost jízdy je přibližně 68,5 km/h.

Ale pozor – pokud by se délka úseků lišila, je vhodnější spočítat celkovou dobu a celkovou vzdálenost a vypočítat průměrnou rychlost jako celkovou vzdálenost dělenou celkovým časem.



Výpočet harmonického průměru v Excelu

# buňky A1 až A100 obsahují naměřené hodnoty

# funkce pro výpočet harmonického průměru
=HARMEAN(A1:A100)


Výpočet harmonického průměru v jazyce R

Pro výpočet harmonického průměru v jazyce R je potřeba nejprve nainstalovat knihovnu psych.

# instalace a načtení knihovny
install.packages(psych)
library(psych)

# naměřené hodnoty
data <- c(3, 5, 6, 7, 8)

# funkce pro výpočet harmonického průměru
harmonic.mean(data)


Mohlo by vás zajímat

Naše kurzy

Ovládání Pythonu pro datovou analýzu

Přihlásit na kurz Lektor: Mgr. Bc. Silvie Bělašková, Ph.D. Trvání kurzu: 2 dny Naučte se ovládat programovací jazyk Python pro účely analýzy analýzy dat – s pomocí knihovny pandas a aplikace Jupyter Notebook, které práci v Pythonu výrazně zjednodušují. Po absolvování kurzu zvládnete v Pythonu data načíst, zpracovat, analyzovat, vizualizovat a a získané výsledky sdílet se svými kolegy. Získané znalosti ihned uplatníte ve své vědecké práci. Kurzem vás provede vás provede… (viz profil lektora). Všechny prezentované postupy si vyzkoušíte na praktických příkladech v anglické verzi Pythonu a aplikace Jupyter Notebook. Počítač vám zapůjčíme na místě, není třeba nosit vlastní.   Chci se přihlásit Adresa konání kurzu Délka kurzu Z kurzu budete mít největší užitek, pokud: se chcete naučit ovládat programovací jazyk Python pro vyhodnocování dat ze svého výzkumu, máte s Pythonem zkušenosti, ale potřebujete si oživit základy nebo se chcete k výsledkům dostat rychleji. Jaké vstupní znalosti jsou potřeba? pro absolvování kurzu nejsou potřeba žádné specifické znalosti Co se na kurzu naučíte? orientovat se v prostředí Pythonu, knihovny pandas a aplikace Jupyter Notebooks a importovat do nich vlastní datové soubory, pracovat v pandas s datovými tabulkami (dataframes), spojit je a vyhledat v nich potřebná data, filtrovat data, upravit je (včetně doplnění chybějících hodnot) a vyhodnotit, vizualizovat data v knihovně pandas, tvořit vlastní datové modely a testovat je. Chci vidět podrobný sylabus kurzu Základy Pandas a Jupyter notebooku Seznámení s Pythonem Seznámení s knihovnou Pandas Seznámení s Jupyter notebookem Instalace Pythonu, Jupyter notebooku a knihovny Pandas Seznámení s dalšími Python knihovnami Ukázka práce s knihovnou Pandas Základní práce s datovou tabulkou Pandas Seznámení s knihovnou Pandas Vysvětlení pojmů dataframe Vytvoření a načtení dataframe Praktické metody pro zobrazení dataframu Hledání dat a filtrování Grupování a filtrování Práce s daty Datové typy Chybějící data Přejmenování dat Spojování tabulek Vizualizace dat v prostředí Pandas Tvorba základních grafů Tvorba základních grafů Seznámení s vizualizačními knihovnami Investigace vlastních dat Import vlastního datasetu Metody investigace dat Vizualizace a interpretace dat Experimentování Pomoc Pandas dokumentace Pomoc ChatGPT Tvorba modelu nad vlastními daty Import vlastního datasetu Definování use case Příprava dat Volba modelu Testování modelu Názory spokojených účastníků „Lékaři zabývající se praktickou medicínou věříí, že argumentace pocházející z oblasti tzv. medicíny založené na důkazech obsahuje úplné informace z přesného a správného zpracování dat definovaných zdrojů. Každý z nás se musí vyrovnat s interpretací těchto dat. K tomu je velmi užitečné umět posoudit vztah mezi statistickou významností a praktickou důležitostí

Data mining v TIBCO Statistica

Přihlásit na kurz Lektor: doc. RNDr. Ing. Marcel Jiřina, Ph.D. Trvání kurzu: 2 dny Naučte se pomocí aplikace Statistica odhalit důležité informace ve svých datech data miningovými metodami. Na kurzu pro vědce, statistiky a datové analytiky vám na praktických příkladech ukážeme, jak data vytěžovat s pomocí pokročilých lineárních (regresních) i nelineárních modelů, neuronových sítí, klasifikačních stromů, metod strojového učení a dalších metod. Probereme také způsoby prezentace získaných výsledků (viz názory spokojených účastníků). 2denním kurzem vás provede vás provede doc. RNDr. Ing. Marcel Jiřina, Ph.D., děkan Fakulty informačních technologií Českého vysokého učení technického, který se věnuje výzkumu data-miningových metod, zejména zpracování textu a obrazu (viz profil lektora). Procvičování probíhá v české verzi aplikace TIBCO Statistica v modulu Data Miner. Počítač vám zapůjčíme na místě, není třeba nosit vlastní. Chci se přihlásit Adresa konání kurzu Délka kurzu Z kurzu budete mít největší užitek, pokud: potřebujete rychle a efektivně zpracovávat velké objemy dat (analytici z oblasti bankovnictví, pojišťovnictví a průmyslu, vědci), se chcete seznámit s modulem Data Miner a prohloubit své znalosti aplikace TIBCO Statistica. Jaké vstupní znalosti jsou potřeba? pro účast na kurzu je vhodné mít znalosti v rozsahu Základního kurzu statistiky I v TIBCO Statistica. Co se v kurzu naučíte? z jakých principů data miningu vychází a jak k němu přistupovat, připravit a zpracovat velké datové balíky pomocí klasifikačních a regresních stromů, lineárních modelů, metody shlukování či strojového učení, využívat techniky vytěžování textu a analýzy nezávislých komponent (ICA), sestavit predikční modely, vyhodnotit jejich kvalitu a získané výsledky správně interpretovat, nasadit modely na reálná data z praxe, automatizovat celý analytický proces, na co si dat při tvorbě modelů pozor a čemu se vyhnout. Chci vidět podrobný sylabus kurzu Úvod Základní informace o softwaru Statistica Výukové zdroje pro software a možnosti nápovědy Úvod do vytěžování dat, produkt Princip, možnosti, využití Práce s Recepty (wizardem) Příprava dat (načtení, výběr proměnných, transformace, vzorkování dat, odstranění duplicitních vzorů, filtrace odlehlých hodnot, oprava chybějících údajů) Detekce a případné odstranění podobných vstupních příznaků (prediktorů) Výběr důležitých prediktorů pro požadovanou úlohu Vytváření klasifikačních a regresních modelů Vyhodnocení kvality vytvořeného modelů Nasazení modelu v praxi Klasifikační a regresní stromy Princip, možnosti, využití CART stromy CHAID stromy Vytváření klasifikačních a regresních stromů v interaktivním režimu (generování stromu, prořezávání stromu, výběr rozhodovacích proměnných, výběr mezí) Generované stromy (Boosted Trees) Náhodné lesy (Random Forests) Lineární modely Princip regrese (Obecné) lineární modely Zobecněné lineární modely Zobecněné aditivní modely MARSplines Metody shlukování K-průměrů (k-means) Hierarchické a EM

Zvýhodněné balíčky kurzů

Zakupte si balíček 2 nebo více vybraných kurzů a ušetřete

[24. 4. 2024] Webinář ZDARMA: Jak získat 82% příspěvek na školení statistiky přes MPSV

Pod vedením zakladatele Datové akademie Dávida Tkáče mj. zjistíte: