Weryfikacja hipotez statystycznych - Google

Weryfikacja hipotez statystycznych

Z Wikipedii

Skocz do: nawigacji, szukaj

Weryfikacja hipotez statystycznych – sprawdzanie sądów o populacji przez badanie jej wycinka (próby statystycznej).

Spis treści

[edytuj] Definicje formalne

Niech

\mathcal{P}=\{P_\theta \colon \theta \in \Theta\}

będzie rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby \mathcal{X}, indeksowaną parametrem \theta\; (w szczególności może to być wektor parametrów rzeczywistych). P_\theta\; opisuje wielowymiarowy łączny rozkład wszystkich obserwacji w próbie X\;.

Hipotezą statystyczną H\; jest zdanie postaci \theta \in \Theta_0 gdzie \Theta_0\subset \Theta koduje własność rozkładu, którą chcemy testować.

Problem weryfikacji hipotezy statystycznej polega na takim podziale przestrzeni próby \mathcal{X} na rozłączne zbiory \mathbf{K} i \mathbf{A}, żeby prawdopodobieństwo warunkowe hipotezy P\{\theta \in \Theta_0\} było możliwie małe (w pewnym ustalonym sensie) dla X\in \mathbf{K} i możliwie duże dla X\in \mathbf{A}.

Zwykle wybiera się pewną statystykę T\; i buduje zbiór

\mathbf{K}=\{X\in\mathcal{X} \colon T(X) \in \mathbf{K}_T \}

gdzie:

\mathbf{K}_T jest tzw. obszarem krytycznym testu, wybranym tak, aby P\{T(X)\in \mathbf{K}_T | H \}\leqslant\alpha
\alpha\; jest wybranym prawdopodobieństwem, tzw. poziomem istotności testu, zwykle 0,05 lub 0,01.

Jednostronny obszar krytyczny to obszar postaci \mathbf{K}_T=\{t\colon t \leqslant t_\alpha\}, gdzie

t_\alpha\; jest tzw. wartością krytyczną testu. Jest to najmniejsza liczba, dla której P\{T(X) \geqslant t_\alpha | H \}\leqslant\alpha

Dwustronny obszar krytyczny to obszar postaci \mathbf{K}_T=\{t\colon t \leqslant t_{\alpha 1} \vee t \geqslant t_{\alpha 2}\} gdzie

t_{\alpha 1}\; jest największą liczbą dla której P\{T(X) \leqslant t_{\alpha 1} | H \}\leqslant\tfrac{\alpha}{2}
t_{\alpha 2}\; jest najmniejszą liczbą dla której P\{T(X) \geqslant t_{\alpha 2} | H \}\leqslant\tfrac{\alpha}{2}

[edytuj] Standardowy przebieg procedury weryfikacyjnej

[edytuj] Sformułowanie hipotezy zerowej i alternatywnej

Hipoteza zerowa (H0) - Jest to hipoteza poddana procedurze weryfikacyjnej, w której zakładamy, że różnica między analizowanymi parametrami lub rozkładami wynosi zero. Przykładowo wnioskując o parametrach hipotezę zerową zapiszemy jako:

H_0\colon \theta_1=\theta_2\;

Hipoteza alternatywna (H1) - hipoteza przeciwstawna do weryfikowanej. Możemy ją zapisać na trzy sposoby w zależności od sformułowania badanego problemu:

H_1\colon \theta_1 \ne \theta_2
H_1\colon \theta_1 > \theta_2\;
H_1\colon \theta_1 < \theta_2\;

[edytuj] Wybór statystyki testowej

Budujemy pewną statystykę W, która jest funkcją wyników z próby losowej W=f(x_1,x_2,\dots,x_n) i wyznaczamy jej rozkład przy założeniu, że hipoteza zerowa jest prawdziwa. Funkcję W nazywa się statystyką testową lub funkcją testową.

[edytuj] Określenie poziomu istotności α

Na tym etapie procedury weryfikacyjnej przyjmujemy maksymalne dopuszczalne prawdopodobieÅ„stwo popeÅ‚nienia błędu I rodzaju, który polega na odrzuceniu hipotezy zerowej wtedy, gdy jest ona prawdziwa. PrawdopodobieÅ„stwo to jest oznaczane symbolem α i nazywane poziomem istotnoÅ›ci. Na ogół przyjmujemy prawdopodobieÅ„stwo bliskie zeru, ponieważ chcemy aby ryzyko popeÅ‚nienia błędu byÅ‚o jak najmniejsze. Najczęściej zakÅ‚adamy poziom istotnoÅ›ci α=0.05, czasem przyjmuje siÄ™ np. α=0.01 ; α=0.1

[edytuj] Wyznaczenie obszaru krytycznego testu

Obszar krytyczny - obszar znajdujący się zawsze na krańcach rozkładu. Jeżeli obliczona przez nas wartość statystyki testowej znajdzie się w tym obszarze, to weryfikowaną przez nas hipotezę H0 odrzucamy. Wielkość obszaru krytycznego wyznacza dowolnie mały poziom istotności α, natomiast jego położenie określane jest przez hipotezę alternatywną.

Obszar krytyczny od pozostałej części rozkładu statystyki oddzielony jest przez tzw. wartości krytyczne testu (wα), czyli wartości odczytane z rozkładu statystyki przy danym α, tak aby spełniona była relacja zależna od sposobu sformułowania H1.

[edytuj] Obliczenie statystyki na podstawie próby

Wyniki próby opracowujemy w odpowiedni sposób, zgodnie z procedurą wybranego testu i są one podstawą do obliczenia statystyki testowej. Większość statystyk testowych, mających dokładny rozkład normalny, t-Studenta lub graniczny rozkład normalny, obliczamy w następujący sposób:

W=\frac{a-b}{c}

gdzie:

W\; – Statystyka testowa
a\; – Statystyka obliczona z próby
b\; – Hipotetyczna wartość parametru(ów)
c\; – Odchylenie standardowe rozkładu statystyki

[edytuj] Podjęcie decyzji

Wyznaczoną na podstawie próby wartość statystyki porównujemy z wartością krytyczną testu.

  • Jeżeli wartość ta znajdzie siÄ™ w obszarze krytycznym, to hipotezÄ™ zerowÄ… należy odrzucić jako nieprawdziwÄ…. StÄ…d wniosek, że prawdziwa jest hipoteza alternatywna.
  • Jeżeli natomiast wartość ta znajdzie siÄ™ poza obszarem krytycznym, oznacza to, że brak jest podstaw do odrzucenia hipotezy zerowej. StÄ…d wniosek, że hipoteza zerowa może, ale nie musi, być prawdziwa, a postÄ™powanie nie daÅ‚o żadnych dodatkowych informacji uprawniajÄ…cych do podjÄ™cia decyzji o przyjÄ™ciu lub odrzuceniu hipotezy zerowej.

Reguły postępowania przy weryfikacji hipotez są określane mianem testów statystycznych.

[edytuj] Alternatywne podejście

Powyższa standardowa procedura wymaga przyjęcia arbitralnego poziomu istotności α a wynikiem weryfikacji jest odpowiedź binarna – albo statystyka testowa mieści się w przedziale ufności, albo nie.

Alternatywnym i nowocześniejszym, choć mniej popularnym podejściem jest obliczenie zamiast tego surowej p-wartości (prawdopodobieństwa popełnienia błędu I rodzaju) i podawanie jej jako wyników weryfikacji. Dzięki temu nie ma potrzeby przyjmowania a priori żadnych wartości α, pozwala to również na porównywanie istotności różnych konkurencyjnych hipotez statystycznych.

[edytuj] Związane pojęcia

Rozmiar testu (α)
Rozmiar testu (poziom istotności) jest to założone maksymalne prawdopodobieństwo nieprawidłowego odrzucenia hipotezy zerowej.
Test najsilniejszy
Test najsilniejszy, to test, który przy danym poziomie istotności na największą moc.
Test najsilniejszy jednoznacznie
Test najsilniejszy jednoznacznie, to test, który ma największą moc dla wszytkich poziomów istotności.
Test nieobciążony
Test jest nieobciążony, gdy jego moc przewyższa poziom istotności.

[edytuj] Bibliografia

  • Ryszard ZieliÅ„ski: Siedem wykÅ‚adów wprowadzajÄ…cych do statystyki matematycznej. Warszawa: 2004.  http://www.impan.gov.pl/~rziel/7ALL.pdf (dostÄ™p: 21 maja 2008)
  • LesÅ‚aw Gajek: Wnioskowanie statystyczne dla studentów. Modele i metody. Warszawa: 1998. ISBN 8320424895. 

[edytuj] Zobacz też


Sesja na GPW rozpoczęła się od spadków
Sesja na warszawskiej giełdzie, która rozpoczęła się od spadków jest skutkiem pogorszenia klimatu inwestycyjnego na azjatyckich parkietach oraz nie nastrajających optymistycznie, spadków kontraktów terminowych na główne amerykańskie indeksy.
American Restaurants wezwał do sprzedaży 11,2 proc. Sfinksa
American Restaurants wezwał do sprzedaży 1.039.467 akcji spółki Sfinks Polska, stanowiących 11,2 proc. głosów na WZA, oferując za jedną akcję 19,41 zł - poinformował UniCredit CA IB Polska, pośredniczący w wezwaniu.
PKO TFI zmniejszył zaangażowanie w Jutrzence do 2,44 proc.
Fundusze zarządzane przez PKO TFI zmniejszyły zaangażowanie w Jutrzence do 2,44 proc. - podała spółka w komunikacie.
Point Group złożyło wniosek do UKE o częstotliwości naziemnej TV cyfrowej
Platforma Mediowa Point Group (PMPG) złożyła w środę w Urzędzie Komunikacji Elektronicznej wniosek o rezerwację częstotliwości w ramach multipleksów 1, 2 i 3 naziemnej telewizji cyfrowej (DVB-T), których uruchomienie planuje Urząd Komunikacji Elektronicznej (UKE), podała spółka w komunikacie.
HSBC obniżył ceny docelowe akcji Pekao, BZ WBK, BRE, podniósł PKO BP
Analitycy HSBC, w raporcie z 21 sierpnia, obniżyli ceny docelowe akcji Pekao, BZ WBK i BRE Banku oraz podwyższyli cenę docelową akcji PKO BP - poinformowała agencja Bloomberg.
Linki: Strona g³ówna