Obsah:
Pokud jste někdy přemýšleli, jak se dvě nebo více věcí vzájemně vztahují, nebo kdybyste někdy šéfa požádali, abyste vytvořili prognózu nebo analyzovali vztahy mezi proměnnými, stát za svůj čas.
V tomto článku se naučíte základy jednoduché lineární regrese - nástroj běžně používaný při prognózování a finanční analýze. Začneme tím, že se seznámíme se základními principy regrese, nejprve se učíme o kovarianci a korelaci a budeme pokračovat v budování a interpretaci regresního výstupu. Mnoho softwaru, jako je Microsoft Excel, dokáže pro vás všechny regresní výpočty a výstupy, ale stále je důležité se naučit základní mechanice.
Proměnné
Ve středu regrese je vztah mezi dvěma proměnnými nazývanými závislé a nezávislé proměnné. Předpokládejme například, že chcete předpovědět prodeje vaší společnosti a vy jste dospěli k závěru, že prodej vaší společnosti jde nahoru a dolů v závislosti na změnách HDP.
Předpovídané prodeje by byly závislé proměnné, protože jejich hodnota "závisí" na hodnotě HDP a HDP by byla nezávislou proměnnou. Pak byste museli určit sílu vztahu mezi těmito dvěma proměnnými, abyste mohli odhadnout tržby. Pokud se HDP zvýší / sníží o 1%, kolik zvýší či sníží váš prodej?
Covariance
Vzorec pro výpočet vztahu mezi dvěma proměnnými se nazývá kovariance. Tento výpočet ukazuje směr vztahu a jeho relativní sílu. Pokud se jedna proměnná zvýší a druhá proměnná se bude také zvyšovat, bude kovarianta pozitivní. Pokud se jedna proměnná posune nahoru a druhá má tendenci klesat, pak by kovariance byla negativní.
Skutečné číslo, které získáte z výpočtu, je těžké interpretovat, protože není standardizováno. Kovarianta pět, například, může být interpretována jako pozitivní vztah, ale síla vztahu může být řečená být silnější než jestliže číslo bylo čtyři nebo slabší, než kdyby bylo číslo šest.
Koeficient korelace
Je třeba standardizovat kovarianci, abychom ji mohli lépe interpretovat a používat při prognóze, a výsledkem je korelační výpočet. Korelační výpočet jednoduše vezme kovarianci a rozdělí ji na produkt standardní odchylky obou proměnných. Bude to vázáno na korelaci mezi hodnotou -1 a +1.
Korelace +1 může být interpretována tak, že naznačuje, že obě proměnné se pohybují dokonale pozitivně mezi sebou a -1 znamená, že jsou dokonale negativně korelovány. V našem předchozím příkladu, je-li korelace +1 a HDP se zvyšuje o 1%, pak se prodej zvýší o 1%.Pokud je korelace -1, 1% nárůst HDP bude mít za následek snížení prodejů o 1% - přesný opak.
Regresní rovnice
Nyní, když víme, jak se vypočítá relativní vztah mezi oběma proměnnými, můžeme vytvořit regresní rovnici pro prognózu nebo předpověď proměnné, kterou chceme. Níže je vzorec pro jednoduchou lineární regresi. "Y" je hodnota, kterou se snažíme předpovědět, "b" je sklon regrese, "x" je hodnota naší nezávislé hodnoty a "a" představuje y-zachycení. Regresní rovnice jednoduše popisuje vztah mezi závislou proměnnou (y) a nezávislou proměnnou (x).
Zachycení nebo "a" je hodnota y (závislé proměnné), pokud je hodnota x (nezávislá proměnná) nula. Takže pokud nedošlo k žádné změně v HDP, vaše společnost by ještě dosáhla prodeje - tato hodnota, když je změna v HDP nula, je zachycení. Podívejte se na níže uvedený graf, abyste viděli grafické znázornění regresní rovnice. V tomto grafu je pouze pět datových bodů reprezentovaných pěti body v grafu. Lineární regrese se pokouší odhadnout čáru, která nejlépe odpovídá datům, a rovnice této linie vede k regresní rovnici.
Obrázek 1: Řada nejlépe fit |
Zdroj: Investopedia |
Excel
Nyní, když chápete některé pozadí, které se děje v regresní analýze, udělejte jednoduchý příklad pomocí regresních nástrojů aplikace Excel. Budeme vycházet z předchozího příkladu pokusu o prognózu příštího roku na základě změn v HDP. V následující tabulce jsou uvedeny některé umělé datové body, ale tyto čísla mohou být snadno dostupné v reálném životě.
Rok | Prodej | HDP |
2013 | 100 | 1. 00% |
2014 | 250 | 1. 90% |
2005 | 275 | 2. 40% |
2016 | 200 | 2. 60% |
2017 | 300 | 2. 90% |
Stačí se podívat na stůl, uvidíte, že bude existovat pozitivní korelace mezi tržbami a HDP. Obě mají tendenci spolu jít nahoru. Použitím aplikace Excel stačí kliknout na rozbalovací nabídku Nástroje , vyberte Analýza dat a vyberte Regrese . Vyskakovací pole se snadno vyplní odtud; váš vstupní rozsah Y je váš sloupec "Prodej" a vstupní rozsah X je změna ve sloupci HDP; vyberte výstupní rozsah místa, kde chcete, aby se data zobrazovaly v tabulce, a stiskněte tlačítko OK. Měli byste vidět něco podobného tomu, co je uvedeno v tabulce níže
Statistika regrese | Koeficienty | ||
Vícenásobné R | 0. 8292243 | Intercept | 34. 58409 |
R náměstí | 0. 687613 | HDP | 88. 15552 |
Upravené R náměstí | 0. 583484 |
- |
- |
Standardní chyba | 51. 021807 | - |
- |
Pozorování | 5 |
- |
- |
Interpretace
, zachycení a koeficient HDP. Číslo R-squared v tomto příkladu je 68. 7% - to ukazuje, jak dobře náš model předpovídá nebo předpovídá budoucí tržby. Dále máme zastavení 34.58, což nám říká, že pokud by se změna v HDP projevila na nulu, byl by náš prodej přibližně 35 jednotek. A nakonec korelační koeficient HDP ve výši 88,15 nám říká, že pokud se HDP zvýší o 1%, prodej se pravděpodobně zvýší o zhruba 88 jednotek.
Bottom Line
Tak jak byste tento jednoduchý model použili ve svém podnikání? Dobře, pokud váš výzkum vede k přesvědčení, že další změna HDP bude určitá procentní sazba, můžete tento model připojit do modelu a vytvořit prognózu prodeje. To vám může pomoci vyvíjet objektivnější plán a rozpočet pro nadcházející rok.
Samozřejmě je to jen jednoduchá regrese a existují modely, které můžete sestavit, které používají několik nezávislých proměnných nazývaných více lineární regrese. Ale více lineární regrese jsou komplikovanější a mají několik otázek, které by vyžadovaly další článek k diskusi.