Zpětné testování a dopředné testování: důležitost korelace

BESIP: Crash test - Správně připoutaný řidič (Září 2024)

BESIP: Crash test - Správně připoutaný řidič (Září 2024)
Zpětné testování a dopředné testování: důležitost korelace
Anonim

Obchodníci, kteří chtějí vyzkoušet obchodní myšlenku na živém trhu, často dělají chybu, že spoléhají výhradně na výsledky zpětného testování, aby zjistili, zda systém bude ziskový. Zatímco zpětné testování může poskytnout obchodníkům cenné informace, je často zavádějící a je to jen jedna část procesu hodnocení. Testy mimo testování a testování dopředného výkonu poskytují další potvrzení o účinnosti systému a mohou zobrazovat skutečné barvy systému, než se skutečná hotovost nachází na linii. Dobrá korelace mezi backtesting, out-of-ukázky a dopředu výsledky testování výkonu je zásadní pro určení životaschopnosti obchodního systému. (Více informací naleznete v článku Backtesting: Interpreting the Past )

Základy zpětného testování Backtesting znamená použití obchodního systému s historickými daty, aby ověřil, jak by systém mohl v daném časovém období vykonávat. Mnoho dnešních obchodních platforem podporuje zpětné testování. Obchodníci mohou testovat nápady s několika stisknutími kláves a získat náhled na účinnost myšlenky bez rizika vkladu na obchodním účtu. Zpětné testování může vyhodnotit jednoduché nápady, jako například, jak by křivka s klouzavým průměrem fungovala na historických datech nebo složitější systémy s různými vstupy a spouštěči.

Dokud může být myšlenka kvantifikována, může být zálohována. Někteří obchodníci a investoři mohou vyhledávat odborné znalosti kvalifikovaného programátora, aby tuto myšlenku vytvořili v testovatelné podobě. Obvykle se jedná o programátor, který tuto myšlenku kóduje, do vlastního jazyka, který hostuje obchodní platforma. Programátor může obsahovat uživatelsky definované vstupní proměnné, které umožňují obchodníkovi "vyladit" systém. Příkladem toho by byl systém jednoduchého klouzavého průměru uvedený výše: obchodník by mohl zadat (nebo měnit) délky dvou klouzavých průměrů použitých v systému. Obchodník by mohl zálohovat, aby zjistil, která délka klouzavých průměrů by v historických datech byla nejlepší. (Získejte lepší přehled o elektronickém obchodním výcviku .

Studie optimalizace
Mnoho obchodních platforem také umožňuje optimalizační studie. To znamená zadání rozsahu pro zadaný vstup a nechání počítače "udělat matematiku", aby zjistil, jaký vstup by měl nejlepší výkon. Multi-variabilní optimalizace může udělat matematiku pro dvě nebo více proměnných dohromady, aby se zjistilo, jaké úrovně dohromady by dosáhly nejlepšího výsledku. Například obchodníci mohou říci programu, které vstupy by chtěli přidat do své strategie; tyto by pak byly optimalizovány podle jejich ideálních hmotností vzhledem k testovaným historickým údajům.

Backtesting může být vzrušující v tom, že nerentabilní systém může být často magicky přeměněn na stroj na výrobu peněz s několika optimizacemi. Naneštěstí úprava systému za účelem dosažení nejvyšší úrovně ziskovosti v minulosti vede často k tomu, že systém bude fungovat špatně v reálném obchodování. Tato nadměrná optimalizace vytváří systémy, které vypadají dobře pouze na papíře.

Křivková montáž je použití optimalizační analýzy k vytvoření nejvyššího počtu vítězných obchodů s největším ziskem na historických datech použitých v testovacím období. I když vypadá působivě při zpětném testování, křivková montáž vede k nespolehlivým systémům, neboť výsledky jsou v podstatě navrženy pouze pro konkrétní data a časové období.

Zpětné testování a optimalizace přinášejí obchodníkům mnoho výhod, ale je to jen součást procesu při hodnocení potenciálního obchodního systému. Dalším krokem obchodníka je použít systém na historická data, která nebyla použita v počáteční fázi zpětného testování. (Klouzavý průměr se snadno vypočítá a po vykreslení na grafu je výkonným vizuálním nástrojem pro sledování trendů. Simple Moving Averages Make Trends Out

Vzorová a mimošampiónová data
Při testování myšlenky na historická data je výhodné vyhradit časové období historických dat pro účely testování. Počáteční historická data, na kterých je myšlenka testována a optimalizována, se označují jako údaje v rámci výběrového souboru. Soubor dat, který byl rezervován, je známý jako data mimo data. Toto nastavení je důležitou součástí procesu hodnocení, protože poskytuje způsob, jak testovat myšlenku na data, která nebyla součástí optimalizačního modelu. Výsledkem je, že tato myšlenka nebude žádným způsobem ovlivněna daty, které nejsou součástí výběrového souboru, a obchodníci budou schopni určit, jak může fungovat systém na nových datech; i. E. v reálném obchodování.

Před zahájením jakéhokoli zpětného testování nebo optimalizace mohou obchodníci vyhradit procentní podíl historických dat, které mají být vyhrazeny pro testy mimo testování. Jedna metoda je rozdělit historická data na třetiny a oddělit jednu třetinu pro použití v testu mimo testování. Pro počáteční testování a jakoukoli optimalizaci by měly být použity pouze údaje ve vzorku. Obrázek 1 ukazuje časový řádek, ve kterém je jedna třetina historických dat vyhrazena pro testování mimo testovací vzorek a dvě třetiny jsou použity pro testování v rámci výběrového souboru. Přestože na obrázku 1 jsou uvedeny údaje, které nejsou součástí vzorku na začátku testu, typické postupy by měly mít část mimo vzorku bezprostředně před předstihem.

Obr. 1: Časová čára reprezentující relativní délku dat ve vzorku a mimo vzorku používaných v procesu zpětného testování.

Jakmile byl systém obchodování vytvořen pomocí dat ve vzorku, je připraven k použití na údaje, které nejsou součástí výběrového souboru. Obchodníci mohou vyhodnotit a porovnat výsledky výkonu mezi daty ve vzorku a mimo vzorku.

Korelace odkazuje na podobnosti mezi výkony a celkovými trendy obou souborů dat.Korelační metriky lze použít při vyhodnocování přehledů výkonnosti strategie vytvořených během zkušebního období (funkce, kterou většina obchodních platforem poskytuje). Čím silnější je vzájemná korelace, tím lepší pravděpodobnost, že systém bude fungovat správně v předběžném testování výkonu a živém obchodování. Obr. 2 znázorňuje dva různé systémy, které byly testovány a optimalizovány na základě údajů ve vzorku, a poté aplikovány na data mimo vzorku. Graf na levé straně zobrazuje systém, který byl zřetelně křivý, aby dobře fungoval na vzorcích dat a úplně selhal u dat mimo data. Graf na obrázku vpravo ukazuje systém, který fungoval dobře jak v datech, tak i mimo ně.

Obrázek 2: dvě křivky vlastního kapitálu. Obchodní údaje před každou žlutou šipkou představují testování v rámci vzorku. Obchody vytvořené mezi žlutými a červenými šipkami ukazují, že testování je mimo testování. Obchody po červených šipkách pocházejí z fází testování dopředného výkonu.

Je-li mezi zkouškou ve vzorku a mimo testování jen malá korelace, jako je levý graf na obrázku 2, je pravděpodobné, že systém byl příliš optimalizovaný a nebude fungovat dobře v živém obchodování. Pokud existuje silná korelace ve výkonu, jak je vidět v pravém grafu na obrázku 2, další fáze vyhodnocení zahrnuje další typ testů mimo testování, známých jako testování dopředného výkonu. (Další informace o prognózování naleznete v části Finanční prognóza: Bayesovská metoda .)

Základy testování výkonu vpřed Testování dopředného výkonu, známé také jako obchodování s papírem, poskytuje obchodníkům další sadu vzorových dat, na kterých se vyhodnotí systém. Předběžné testování výkonu je simulací skutečného obchodování a zahrnuje sledování logiky systému na živém trhu. Také se nazývá obchodování s papírem, protože všechny obchody jsou prováděny pouze na papíře; tj. obchodní záznamy a výjezdy jsou zdokumentovány společně s jakýmkoli ziskem nebo ztrátou systému, ale nejsou prováděny žádné reálné obchody. Důležitým aspektem testování dopředného výkonu je přesně sledovat systémovou logiku; jinak se stává obtížné, ne-li nemožné, přesně vyhodnotit tento krok procesu. Obchodníci by měli být upřímní ohledně veškerých obchodních zájezdů a výstupů a vyhnout se chování jako obchodování s třešněmi nebo nezahrnují obchod na papír, který racionalizuje, že "nikdy bych tento obchod neudělal." Pokud by se obchod uskutečnil podle logiky systému, měl by být dokumentován a vyhodnocen.

Mnoho makléřů nabízí simulovaný obchodní účet, kde lze umístit obchody a vypočítat odpovídající zisk a ztrátu. Použití simulovaného obchodního účtu může vytvořit polorealistickou atmosféru, na níž se bude obchodovat a bude dále posuzovat systém.

Obrázek 2 také zobrazuje výsledky testování dopředného výkonu na dvou systémech. Systém, který je znázorněn v levém grafu, opět neproběhne přesahující počáteční testování údajů ve vzorku. Systém zobrazený v pravém diagramu však nadále dobře funguje ve všech fázích, včetně testování dopředného výkonu.Systém, který vykazuje pozitivní výsledky s dobrou korelací mezi testováním výkonu ve vzorku, mimo příkladu a dopředu, je připraven k provedení na živém trhu.

Bottom Line Backtesting je cenný nástroj dostupný ve většině obchodních platforem. Rozdělení historických dat do více souborů, které umožňují testování ve vzorku a mimo vzorku, může obchodníkům poskytnout praktické a účinné nástroje pro hodnocení obchodního nápadu a systému. Vzhledem k tomu, že většina obchodníků využívá optimalizační techniky při zpětném testování, je důležité, aby systém vyhodnotil čisté údaje a zjistil jejich životaschopnost. Pokračování v testování mimo testování s dopředným testováním výkonu poskytuje další úroveň bezpečnosti před uvedením systému na trh s rizikem skutečné hotovosti. Pozitivní výsledky a dobrá souvztažnost mezi zpětným testováním v reálném čase a předběžným testováním výkonnosti zvyšují pravděpodobnost, že systém bude v reálném obchodování dobře fungovat. (Podrobný přehled technických analýz naleznete v části Technická analýza: Úvod .