Hypotéza Testování v oblasti financí: koncept a příklady

ИГРА ПРОФЕССИОНАЛОВ. Что такое сознание? Фильм 1 (Listopad 2024)

ИГРА ПРОФЕССИОНАЛОВ. Что такое сознание? Фильм 1 (Listopad 2024)
Hypotéza Testování v oblasti financí: koncept a příklady
Anonim

Váš investiční poradce navrhuje měsíční investiční schéma, které slibuje variabilní výnos každý měsíc. Budete investovat do něj pouze tehdy, pokud budete mít jistotu průměrného měsíčního příjmu $ 180. Váš poradce vám také říká, že za posledních 300 měsíců se systém vrátil s průměrnou hodnotou 190 USD a směrodatnou odchylkou 75 USD. Máte-li investovat do tohoto programu?

Testování hypotéz přichází k podpoře takového rozhodování.

Tento článek předpokládá znalost čtenářů koncepty normální distribuční tabulky, vzorce, hodnoty p a souvisejících základů statistiky.

Další informace o praktických aplikacích dat pro určení rizika naleznete v části "5 způsobů měření rizika podílového fondu".

Testování hypotéz (nebo testování významnosti) je matematický model pro testování tvrzení, nápadu nebo hypotézy o parametru zájmu v dané populační množině, s využitím dat naměřených ve vzorové sadě. Výpočty se provádějí na vybraných vzorcích, aby se získaly více rozhodující informace o charakteristikách celé populace, což umožňuje systematický způsob testování nároků nebo představ o celém datovém souboru.

Zde je jednoduchý příklad: (A) Ředitel školy hlásí, že studenti ve své škole získají průměrně 7 z 10 zkoušek. Pro testování této "hypotézy" zaznamenáváme známky 30 studentů (vzorku) z celé studentské populace školy (řekněme 300) a vypočítáme průměr tohoto vzorku. Můžeme pak porovnat (vypočítanou) střední hodnotu vzorku s průměrným (vykázaným) obyvatelstvem a pokusit se o potvrzení hypotézy.

Další příklad: (B) Roční návratnost konkrétního podílových fondů činí 8%. Předpokládejme, že podílový fond existuje již 20 let. Vezmeme náhodný vzorek ročních výnosů podílových fondů, například za pět let (vzorek), a vypočítáme jeho průměr. Poté porovnáme (vypočítanou) střední hodnotu vzorku s (prohlašovanou) populační hodnotou pro ověření hypotézy.

Existují různé metodiky pro testování hypotéz. Následující čtyři základní kroky jsou zahrnuty:

Krok 1: Definujte hypotézu:

Obvykle je hlášená hodnota (nebo statistika nároků) uvedena jako hypotéza a předpokládá se, že je pravdivá. U výše uvedených příkladů bude hypotéza:

  • Příklad A: Studenti ve škole získají průměrně 7 z 10 zkoušek
  • Příklad B: Roční návratnost podílového fondu je 8% ročně

popis představuje nulovou hypotézu (H 0 ) "a je považován za pravdivý. Stejně jako zkouška poroty začíná tím, že se předpokládá, že podezřelý je nevinen, a následně rozhodne, zda je předpoklad nepravdivý. Podobně testování hypotéz začíná tím, že se uvádí a předpokládá "nulová hypotéza", a pak proces určuje, zda je předpoklad pravděpodobný, že bude pravdivý nebo nepravdivý.

Důležité je poznamenat, že testujeme nulovou hypotézu, protože existuje pochybnost o její platnosti. Bez ohledu na informaci, která je proti uvedené nulové hypotéze, je zachycena v Alternativní hypotéze (H 1 ). U výše uvedených příkladů budou alternativní hypotézy:

  • Studenti získají průměr, který je ne rovný 7
  • Roční výnos podílových fondů je ne na 8% ročně

V souhrnu Alternativní hypotéza je přímým rozporem s nulovou hypotézou.

Stejně jako v procesu, porota předpokládá podezření nevinnosti (nulová hypotéza). Prokurátor musí prokázat jinak (alternativu). Podobně musí badatel dokázat, že nulová hypotéza je buď pravdivá nebo nepravdivá. Pokud prokurátor neprokáže alternativní hypotézu, porota musí propustit "podezřelého" (založení rozhodnutí na nulové hypotéze). Podobně, pokud výzkumník neprokáže alternativní hypotézu (nebo jednoduše nic neudělá), předpokládá se, že nulová hypotéza je pravdivá.

Krok 2: Nastavte rozhodovací kritéria

Kritéria pro rozhodování musí být založena na určitých parametrech datových souborů a to je místo, kde do obrazu přichází spojení s normální distribucí.

Podle standardního statistického postulátu o distribuci vzorků: "Pro libovolnou velikost vzorku n je distribuce vzorků X ^ normální, pokud je populace X, ze které je odebrána vzorka, normálně distribuovaná. "Proto pravděpodobnosti všech ostatních možných vzorkových prostředků , které byste mohli vybrat, jsou normálně distribuovány.

Pro e. G. , zjistit, zda průměrná denní návratnost akcií uvedených na burze cenných papírů XYZ kolem nového roku je vyšší než 2%.

H 0 : Nulová hypotéza: střední = 2%

H 1 : Alternativní hypotéza: Vezměte vzorek (tedy z 50 akcií z celkového počtu 500) a vypočítejte průměr vzorku.

Pro normální distribuci leží 95% hodnot v rámci 2 standardních odchylek průměrné populace. Proto tato normální distribuce a předpokládaný střední limit pro ukázkovou datovou množinu nám umožňují stanovit 5% jako významnou úroveň. Má smysl, jelikož podle tohoto předpokladu existuje méně než 5% pravděpodobnost (100-95) získání odlehlých hodnot, která přesahují 2 standardní odchylky od populačního průměru. V závislosti na povaze datových souborů je možné uvažovat o dalších hodnotách 1%, 5% nebo 10%. Pro finanční výpočty (včetně financování chování) je obecně přijatým limitem 5%.

Pokud najdeme nějaké výpočty, které přesahují obvyklé 2 standardní odchylky, pak máme silný případ odlehlých hodnot, abychom odmítli nulovou hypotézu. Standardní odchylky jsou velmi důležité pro pochopení statistických údajů. Další informace o nich naleznete sledováním videa společnosti Investopedia na standardních odchylkách. Graficky je reprezentován následujícím způsobem:

Ve výše uvedeném příkladu, je-li průměr vzorku mnohem větší než 2% (např. 3, 5%), pak odmítáme nulovou hypotézu.Je přijata alternativní hypotéza (průměr> 2%), která potvrzuje, že průměrný denní výnos zásob je skutečně vyšší než 2%.

Je-li průměrná hodnota vzorku pravděpodobně výrazně vyšší než 2% (a zůstává v průměru kolem 2,2%), pak NEMUSÍME odmítnout nulovou hypotézu. Problémem je, jak rozhodnout o případech tak blízko. Abychom dospěli k závěru z vybraných vzorků a výsledků, musí být určena úroveň

významnosti , což umožňuje vyvodit závěr o nulové hypotéze. Alternativní hypotéza umožňuje stanovení úrovně významnosti nebo koncepce "kritické hodnoty" pro rozhodování o takových případech s blízkým rozsahem. Podle standardní definice je "kritická hodnota" mezní hodnota, která definuje hranice, za kterými je menší než 5% vzorku lze získat prostředky, pokud je nulová hypotéza pravdivá. Vzorkovací prostředky získané za kritickou hodnotu budou mít za následek rozhodnutí odmítnout nulovou hypotézu. "Ve výše uvedeném příkladu jsme definovali kritickou hodnotu jako 2,1% a vypočtená střední hodnota dosahuje 2,2%, potom odmítáme nulovou hypotézu, kritická hodnota stanoví jasnou vymezení přijatelnosti nebo odmítnutí. Další příklady, které je třeba následovat - nejdříve se však podívejme na některé další klíčové kroky a koncepty.

Krok 3: Vypočítat statistiku testu:

Tento krok zahrnuje výpočet požadované hodnoty, známých jako statistické údaje o testu (jako střední, z-skóre, hodnota p, atd.) Pro vybranou vzorku. Jsou pokryty různé hodnoty, které se mají vypočítat v pozdější části s příklady.

Krok 4: Vyvozte závěry o hypotéze

S vypočtenými hodnotami rozhodněte o nulové hypotéze. Pokud je pravděpodobnost získání průměru vzorku menší než 5%, pak je závěr

odmítnut nulová hypotéza. Jinak přijme a zachová si nulovou hypotézu. Typy chyb v rozhodování:

Vzhledem k správné použitelnosti u celé populace mohou existovat čtyři možné výsledky při rozhodování založeném na vzorku:

Rozhodnutí o zachování

Rozhodnutí o zamítnutí > Platí pro celou populaci

Správná

Nesprávná

(Chyba TYPE 1 - a)

Neplatí pro celou populaci

Případy "správné" jsou případy, kdy rozhodnutí přijatá na vzorcích jsou skutečně použitelná pro celou populaci. Případy chyb vzniknou, když se člověk rozhodne zachovat (nebo odmítnout) nulovou hypotézu založenou na vzorových výpočtech, ale toto rozhodnutí se ve skutečnosti nevztahuje na celou populaci. Tyto případy představují chyby typu 1 (alfa) a typu 2 (beta), jak je uvedeno v tabulce výše.

Volba správné kritické hodnoty umožňuje eliminovat chyby typu alfa typu 1 nebo je omezit na přijatelný rozsah.

Alfa označuje chybu na úrovni významnosti a je určena výzkumným pracovníkem. Chcete-li zachovat standardní 5% význam nebo úroveň spolehlivosti pro výpočty pravděpodobnosti, zůstává to 5%.

Podle platných kritérií a definic pro rozhodování:

"Toto kritérium (alfa) je obvykle nastaveno na hodnotu 0.05 (a = 0. 05) a porovnáváme hodnotu alfa s hodnotou p. Pokud je pravděpodobnost chyby typu I menší než 5% (p <0.05), rozhodli jsme se odmítnout nulovou hypotézu; jinak zachováváme nulovou hypotézu. "

Technický termín použitý pro tuto pravděpodobnost je

hodnota p

. Je definována jako "pravděpodobnost získání výsledku vzorku, vzhledem k tomu, že hodnota uvedená v nulové hypotéze je pravdivá. Hodnota p pro získání výsledku vzorku je porovnána s úrovní významnosti ".

  • Chyba typu II nebo chyba beta je definována jako "pravděpodobnost nesprávného zachování nulové hypotézy, pokud se ve skutečnosti nevztahuje na celou populaci. "
  • Několik dalších příkladů demonstruje tento a další výpočty. Příklad 1. Existuje investiční systém s měsíčními příjmy, který slibuje variabilní měsíční výnosy. Investor do něj investuje pouze tehdy, pokud je zajištěn průměrný měsíční příjem ve výši 180 dolarů. Má vzorek 300 měsíců návratů, který má průměr 190 dolarů a standardní odchylku 75 dolarů. Měl by investovat do tohoto programu? Vyřešíme problém. Investor investuje do schématu, pokud si ujistí, že požadovaný průměrný výnos je 180 dolarů. Zde je
  • H

0

: Nulová hypotéza: střední = 180

H

1 : Alternativní hypotéza: průměr> 180 :

Určete kritickou hodnotu X L pro střední hodnotu vzorku, která je dostatečně velká k odmítnutí nulové hypotézy - i. E. (odmítněte H

0 vzhledem k tomu, že H

0 je pravděpodobné, je pravda), , které by bylo dosaženo, když střední hodnota vzorku překračuje kritické limity i. E. = P (vzhledem k tomu, že H

0 je pravdivé) = alfa graficky Z = 0. 05 = 1. 645 (z tabulky Z nebo z normální tabulky distribuce)

=> X

L = 180 +1. 645 * (75 / sqrt (300)) = 187. 12 Vzhledem k tomu, že střední hodnota vzorku (190) je větší než kritická hodnota (187.12), je nulová hypotéza odmítnuta a závěr je, skutečně vyšší než 180 USD, takže investor může zvážit investování do tohoto systému.

Metoda 2 - Používání standardizovaných statistických testů

: Je také možné použít standardizovanou hodnotu z. Zkušební statistika, Z = (průměr vzorku - průměr populace) / (std-dev / sqrt (počet vzorků) tj.

75 / sqrt (300)) = 2. 309 Naše oblast odmítnutí s 5% významovou úrovní je Z> Z 0.05

= 1. 645

než je 1. 645, nulová hypotéza může být odmítnuta s podobným závěrem uvedeným výše Metoda 3 - Výpočet hodnoty P:

Cílem je identifikovat P (průměr vzorku> = 190, když průměr = 180) = P (Z> = (190-180) / (75 / sqrt (300))

= P (Z> = 2. 309) k závěru, že dochází k potvrzení, že průměrné měsíční výnosy jsou vyšší než 180.

hodnota p

Inference

méně než 1% Potvrzené důkazy podporující alternativní hypotézu

mezi 1% až 5%

> mezi 5% a 10%

Slabé důkazy

podporující alternativní hypotézu

větší než 10%

že jeho makléřské sazby jsou nižší než ceny vašeho současného makléře (ABC). Údaje dostupné od nezávislé výzkumné firmy naznačují, že průměr a std-dev všech klientů ABC brokerů činí 18 a 6 dolarů.

Vzorek 100 klientů společnosti ABC je odebrán a makléřské poplatky jsou počítány s novými sazbami makléře XYZ. Pokud je průměr vzorku 18 USD. 75 a std-dev je stejný (6 dolarů), může se vyvodit nějaký závěr o rozdílu v průměrném makléřském účtu mezi makléřem ABC a XYZ?

H

0

: Nulová hypotéza: střední = 18 H

1

: Alternativní hypotéza: Z <= - z 2. 5

a Z> = Z

2. 5 (za předpokladu 5% úrovně významnosti, rozdělení 2. 5 na každé straně)

Z = (průměr vzorku - průměr) / (std-dev / sqrt (počet vzorků) (100) = 1. 25

Tato vypočítaná hodnota Z spadá mezi dvě limity definované - Z

2. 5

= -1 96 a Z

2. 5 = 1. 96. Z toho vyplývá, že neexistují dostatečné důkazy k závěru, že existuje rozdíl mezi sazbami stávajících a nových makléřů. Hodnota p = P (Z1.25)

= 2 * 0. 1056 = 0. 2112 = 21. 12%, což je větší než 0.05 nebo 5%, což vede k stejnému závěru. , je reprezentován následujícím: Kritické body pro hypotetické testování Metoda: -

Statistická metoda založená na předpokladech - Chyba náchylná k chybám alfa a beta Hodnota p může být ambigentní, což vede k matoucím výsledkům Bottom Line Testy hypotéz umožňují matematický model ověřit nárok nebo myšlenku s určitou míru spolehlivosti. Nicméně, stejně jako většina statistických nástrojů a modelů, je toto také omezeno několika omezeními. Použití tohoto modelu při rozhodování o finančních otázkách by mělo být zvažováno s kritičností, přičemž je třeba mít na paměti všechny závislosti. Alternativní metody, jako je Bayesian Inference, také stojí za to zkoumat podobnou analýzu.