Tabulka normální distribuce, vysvětlena

Rozdělení četností - Statistika (Listopad 2024)

Rozdělení četností - Statistika (Listopad 2024)
Tabulka normální distribuce, vysvětlena
Anonim

Normální vzorec je založen na dvou jednoduchých parametrech - průměrné a standardní odchylce charakteristiky dané datové množiny. Zatímco průměr znamená "centrální" nebo průměrnou hodnotu celé množiny dat, standardní odchylka označuje "rozpětí" nebo změnu datových bodů kolem této střední hodnoty.

Zvažte následující 2 datové množiny:

Dataset 1 = {10, 10, 10, 10, 10, 10, 10, 10, 10}

Datová množina 2 = {6, 8, 10, 12, 14, 14, 12, 10, 8, 6}

Pro Dataset2, střední hodnota = 10 a směrodatná odchylka (stddev) = 2. 83

Vypočtěme tyto hodnoty pro DataSet1:

Podobně pro DataSet2:

Červená vodorovná čára v obou výše uvedených grafech označuje "střední" nebo průměrnou hodnotu každého souboru dat (v obou případech 10). Růžové šipky v druhém grafu indikují rozložení nebo změnu hodnot dat ze střední hodnoty. Toto je reprezentováno hodnotou standardní odchylky 2,83 v případě DataSet2. Vzhledem k tomu, že datový server DataSet1 má všechny hodnoty stejné (jako každý každý) a žádné změny, je hodnota stddev nula a proto nejsou použitelné žádné růžové šipky.

Hodnota stddev má několik významných a užitečných vlastností, které jsou velmi užitečné při analýze dat. Pro normální distribuci jsou hodnoty dat symetricky rozloženy po obou stranách průměru. Pro libovolnou normálně distribuovanou datovou množinu vykreslíte graf se stddev na vodorovné ose a ne. datových hodnot na svislé ose se získá následující graf.

Vlastnosti normálního rozdělení

  1. Normální křivka je symetrická kolem průměru;
  2. Průměr je uprostřed a dělí plochu na dvě poloviny;
  3. Celková plocha pod křivkou se rovná 1 pro průměr = 0 a stdev = 1;
  4. Distribuce je úplně popsána jeho středem a stddev

Jak je vidět z výše uvedeného grafu, stddev představuje následující:

  • 68. 3% datových hodnot jsou v rozmezí 1 směrodatná odchylka střední (-1 až +1)
  • 95. 4% datových hodnot jsou v rozmezí 2 standardní odchylky průměrné hodnoty (-2 až +2)
  • 99. 7% datových hodnot je v rozmezí 3 standardní odchylky průměrné (-3 až +3)

Oblast pod zvlněnou křivkou měřená udává požadovanou pravděpodobnost daného rozsah:

  • menší než X: - e. G. pravděpodobnost, že hodnoty dat jsou menší než 70
  • větší než X - e. G. pravděpodobnost, že hodnoty dat budou vyšší než 95
  • mezi X 1 a X 2 - e. G. pravděpodobnost datových hodnot mezi 65 a 85

, kde X je hodnota zájmu (příklady níže).

Plotování a výpočet oblasti není vždy vhodné, protože různé datové množiny budou mít různé hodnoty střední hodnoty a hodnoty stddev.Pro usnadnění jednotné standardní metody pro snadné výpočty a použitelnost na problémy v reálném světě byla zavedena standardní konverze na hodnoty Z, které tvoří část tabulky normální distribuce .

Z = (X - střední) / stddev, kde X je náhodná proměnná.

Toto převedení v zásadě způsobuje, že hodnoty standardních a stddev jsou standardizovány na 0 a 1, což umožňuje použít standardní definovanou množinu hodnot Z (z Normální tabulka distribuce ) pro snadné výpočty . Záběr standardní tabulky hodnot z obsahující hodnoty pravděpodobnosti je následující:

z

0. 00

0. 01

0. 02

0. 03

0. 04

0. 05

0. 06

0. 0

0. 00000

0. 00399

0. 00798

0. 01197

0. 01595

0. 01994

0. 1

0. 0398

0. 04380

0. 04776

0. 05172

0. 05567

0. 05966

0. 2

0. 0793

0. 08317

0. 08706

0. 09095

0. 09483

0. 09871

0. 3

0. 11791

0. 12172

0. 12552

0. 12930

0. 13307

0. 13683

0. 4

0. 15542

0. 15910

0. 16276

0. 16640

0. 17003

0. 17364

0. 5

0. 19146

0. 19497

0. 19847

0. 20194

0. 20540

0. 20884

0. 6

0. 22575

0. 22907

0. 23237

0. 23565

0. 23891

0. 24215

0. 7

0. 25804

0. 26115

0. 26424

0. 26730

0. 27035

0. 27337

… … , zaokrouhlujte na 2 desetinná místa (tj. 0,24). Poté zkontrolujte, zda nejsou v prvních dvou významných číslic (0,2) v řádcích a nejmenší značné číslo (zbývající hodnota 0, 04) ve sloupci. To bude mít hodnotu 0. 09483.

Zde naleznete úplnou normální distribuční tabulku s přesností až na 5 desetinných míst pro pravděpodobnostní hodnoty (včetně hodnot pro záporné hodnoty).

Podívejme se na některé příklady z reálného života. Výška jednotlivců ve velké skupině sleduje normální rozložení. Předpokládejme, že máme soubor 100 jedinců, jejichž výšky jsou zaznamenávány a střední a stddev jsou vypočteny na 66 a 6 palců resp.

Zde je několik vzorových otázek, které lze snadno zodpovědět pomocí tabulky hodnot z:

Jaká je pravděpodobnost, že osoba ve skupině je 70 palců nebo méně?

  • Otázkou je najít

kumulativní hodnotu P (X <= 70) i. E. v celé sadě dat 100, kolik hodnot bude mezi 0 a 70.

Nejprve převést X hodnotu 70 na ekvivalentní hodnotu Z.

Z = (X - průměr) / stddev = (70-66) / 6 = 4/6 = 0. 66667 = 0. 67 (zaokrouhleno na 2 desetinná místa)

<= 0,67) = 0,24857 (z tabulky z výše)

i. E. existuje pravděpodobnost 24,857%, že osoba ve skupině bude menší nebo rovna 70 palců.

Ale držte se - výše uvedené je neúplné.Nezapomeňte, že hledáme pravděpodobnost všech možných výšky do 70 let. E. od 0 do 70. Výše ​​uvedené vám dává část od střední k požadované hodnotě (tj. 66 až 70). Musíme zahrnout druhou polovinu - od 0 do 66 - abychom dospěli k správné odpovědi.

Protože 0 až 66 představuje polovinu (tj. Jeden extrémní až střední střed), jeho pravděpodobnost je prostě 0. 5.

Proto správná pravděpodobnost, že osoba je 70 palců nebo méně = 0. 24857 + 0. 5 = 0. 74857 =

74. 857% Graficky (výpočtem plochy) jsou dvě součtové oblasti reprezentující řešení:

Jaká je pravděpodobnost, že osoba je 75 palců nebo vyšší?

  • i. E. Najít

Doplňkové kumulativní P (X> = 75). Z = (X - střední hodnota) / stddev = (75-66) / 6 = 9/6 = 1,5

P (Z> = 1,5) = 1- P (Z <= 1. 5) = 1 - (0. 5 + 0, 43319) = 0. 06681 = 6. 681%

Jaká je pravděpodobnost, že osoba bude mezi 52 a 67 palců?

  • Najděte P (52 <= x <= 67).

P (52 <= x <= 67) = p [(52-66) / 6 <= z <= (67-66) / 6] = p <-2,33 <= z <= 0. 17)

= P (Z <= 0. 17) -p (Z <= -0.233) = (0. 5 + 0, 56749) distribuční tabulka

(a z-hodnoty) se obvykle používá pro výpočty pravděpodobnosti očekávaných cenových pohybů na akciovém trhu pro akcie a indexy. Používají se v obchodování na bázi pásma, identifikují trendy uptrend nebo downtrend, úroveň podpory nebo rezistence a další technické ukazatele založené na normálních distribučních koncepcích průměrné a směrodatné odchylky.