Jaké procento populace potřebujete v reprezentativním vzorku?

Now Go Build with Werner Vogels EP3 - Bergen (Listopad 2024)

Now Go Build with Werner Vogels EP3 - Bergen (Listopad 2024)
Jaké procento populace potřebujete v reprezentativním vzorku?
Anonim
a:

Technicky reprezentativní vzorek vyžaduje, aby bylo co nejvíce kopírovalo jakékoliv procento statistické populace ke studované nebo analyzované kvalitě nebo charakteristice. Například v populaci 1 000, která se skládá ze 600 mužů a 400 žen, které se používají při analýze nákupních trendů podle pohlaví, reprezentativní vzorek může sestávat z pouhých pěti členů, tří mužů a dvou žen nebo z 0. 5 procent populace. Zatímco tento vzorek je nominálně reprezentativní pro větší populaci, je pravděpodobné, že bude mít za následek vysoký stupeň vzorkovací chyby nebo zkreslení, pokud se ukáže, že jde o větší populaci, protože je tak malý.

Předběžná odchylka od vzorkování je nevyhnutelným důsledkem použití vzorků pro analýzu větší skupiny. Získávání dat z nich je proces, který je omezen a neúplný svou povahou. Jelikož je však vzhledem k omezené dostupnosti zdrojů často nezbytné, ekonomičtí analytici používají metody, které mohou snížit zkreslení vzorků na statisticky zanedbatelnou úroveň. Zatímco reprezentativní odběr vzorků je jednou z nejúčinnějších metod používaných k omezení zkreslení, často to nestačí k tomu, aby to bylo dostatečně vlastní.

Jedna strategie používaná v kombinaci s reprezentativním výběrem vzorků zajišťuje, že vzorek je dostatečně velký, aby optimálně snížil chybu. A zatímco obecně platí, že čím větší je podskupina, tím větší je pravděpodobnost, že se chyba sníží. V určitém okamžiku se toto snížení stává tak minimální, že neodůvodňuje dodatečné náklady potřebné k tomu, aby se vzorek zvětšil.

Stejně jako použití technicky reprezentativního, ale nepatrného vzorku nestačí samo o sobě na to, aby se snížila předpojatost vzorkování, jednoduše výběr velké skupiny bez zohlednění zastoupení může vést k ještě méně chybným výsledkům než použití malého reprezentativního vzorku. Při návratu k výše uvedenému příkladu je skupina 600 samců statisticky nepoužitelná samostatně při analýze genderových rozdílů v nákupních trendech.