Statystyka od A do Z

Statystyka, ekonometria i data mining. Baza wiedzy

Kalkulator wielkości próby

Obliczenia wielkości próby dla frakcji arrow
Teoria i przykłady
Obliczenie maksymalnego błędu oszacowania dla frakcji arrow
Teoria i przykłady
Obliczenie wielkości próby przy szacowaniu średniej w populacji arrow
Teoria i przykłady
Wybierz poziom prawdopodobieństwa (α)

Teoria i przykłady

Badanie o charakterze częściowym to badanie statystyczne, w którym o rozkładach cech statystycznych dla całej populacji wnioskuje się w oparciu o rezultaty badań przeprowadzonych na pewnej podgrupie populacji generalnej (próbie). Metoda reprezentacyjna jest najbardziej prawidłową realizacją badania częściowego, w której próba dobierana jest w sposób losowy.

W celu pozyskania informacji o rozkładach cech statystycznych w populacji generalnej, wybiera się w sposób losowy grupę jednostek, czyli próbę, na niej zaś przeprowadza się badania mające na celu wyznaczenie analogicznych rozkładów. Otrzymane rezultaty służą do wnioskowania o całości populacji, przy czym wnioskowanie to jest obarczone błędem. Rachunek prawdopodobieństwa pozwala na oszacowanie wartości tego błędu.

Istotnym aspektem metody jest dobór próby. Ponieważ na jej podstawie wnioskujemy o całej populacji generalnej, chcemy, aby próba stanowiła dobrą (w sensie zachowania właściwości i prawidłowości) reprezentację całości. Najważniejszymi czynnikami, które mają wpływ na dokładność metody reprezentacyjnej są: struktura zbiorowości, wykorzystany schemat losowania oraz liczebność próby.

Istnieje możliwość wyznaczenia minimalnej liczebności próby w oparciu o określone parametry (m.in. dotyczące jakości wyników badania). Do tych parametrów należą:

  • Szacowana wielkość frakcji, czyli odsetek jednostek spełniających określoną cechę;
  • Maksymalny błąd oszacowania;
  • Poziom istotności, który interpretuje się jako prawdopodobieństwo, z jakim popełniony zostanie błąd oszacowania o zadanej wartości maksymalnej;
  • Liczebność populacji generalnej (dla populacji skończonej).

Minimalną liczebność próby wyznacza się inaczej, w zależności od tego, czy mamy do czynienia z populacją skończoną, czy nieskończoną. Z populacją nieskończoną rzadko mamy do czynienia w praktyce. W niektórych sytuacjach wygodniej jednak traktować populację o skończonej liczbie jednostek jako populację nieskończoną (w szczególności kiedy liczebność populacji generalnej jest bardzo duża). Dla populacji skończonej wzór na minimalną liczebność próby ma następującą postać:

wzór

natomiast dla populacji nieskończonej:

źródło

gdzie:
P – szacowana wielkość frakcji,
z – wartość wynikająca z przyjętego poziomu istotności (α), obliczana przy pomocy dystrybuanty rozkładu normalnego,
N – liczebność populacji generalnej (w przypadku populacji skończonej),
e – maksymalny błąd oszacowania.

Jeżeli nie jesteśmy w stanie oszacować wielkości frakcji P, jej wartość powinna zostać ustawiona na 50% (domyślnie).

Ponieważ rozważamy liczebność populacji, otrzymany wynik powinien być liczbą naturalną. Dlatego też wartość będąca wynikiem obliczeń zaokrąglona jest w górę. Mamy wówczas pewność, że wyniki badania przeprowadzonego na próbie o liczności nie mniejszej niż minimalna liczebność próby będą spełniały założenia, które zostały nałożone poprzez zadane parametry (maksymalny błąd oszacowania i poziom istotności).

Kalkulator wielkości próby pozwala na wyznaczenie minimalnej liczebności próby, dzięki której uzyskamy wyniki badania z zadaną dokładnością. Kalkulator jest dostępny w dwóch wariantach: dla populacji skończonej i dla populacji nieskończonej.

Przykład:
Chcemy przeprowadzić kontrolę jakości partii liczącej 10000 konserw. Jedynym sposobem na wskazanie ze stuprocentową pewnością dokładnej liczby puszek, których zawartość jest niezdatna do spożycia, jest otwarcie każdej konserwy w partii. Jest to oczywiście rozwiązanie niedopuszczalne; dlatego chcemy otworzyć taką liczbę puszek, aby prawdopodobieństwo tego, że faktyczny odsetek uszkodzonych konserw w całej partii będzie się różnił od oszacowanego o więcej niż 4%, wynosiło 0,05. Równoważnie: chcemy mieć 95% pewności, że rzeczywisty odsetek uszkodzonych konserw nie różni się od oszacowanego na podstawie próby o więcej niż 4%.

Aby uzyskać wyniki z opisaną wyżej dokładnością powinniśmy otworzyć 566 puszek.

Określenie minimalnej liczebności próby dla średniej:

W podobny sposób możemy określać minimalną liczebność próby dla szacowania średniej. Liczebność próby zapewniającą uzyskanie ustalonej z góry dokładności estymacji przedziałowej średniej wyraża wielkość:

wzór

Należy jednak pamiętać, że stosowanie tego wzoru wymaga normalności rozkładu badanej zmiennej oraz stałej i znanej wariancji σ2.

Jeżeli populacja generalna ma rozkład normalny z nieznaną wariancją σ2, minimalną liczebność próby możemy wyznaczyć korzystając z tzw. dwustopniowej metody Steina. Liczebność próby określamy wtedy na podstawie wzoru:

wzór

Gdzie:
n0 – liczebność próby w badaniu pilotażowym,
S2 wariancja próby obliczona na podstawie badania pilotażowego,
tα,n-1 – wartość odczytana z tablic rozkładu t-Studenta dla n0-1 stopni swobody.

Przykład:

Niezbędna liczebność próby przy szacowaniu średniej w populacji może poinformować na przykład jak liczna powinna być próba, żeby móc na jej podstawie oszacować średnią wagę ogółu noworodków przy ustalonym poziomie istotności α=0.01 i maksymalnym błędzie szacunku 0.3kg, jeżeli jej rozkład jest normalny ze znaną wariancją 0.56.

W tym przypadku szukana liczba to 42, co oznacza, że próba musiałaby zostać przeprowadzona na co najmniej 42 noworodkach.

Aktualności

Badania marketingowe – liczne zalety w jednym badaniu Badania marketingowe – liczne zalety w jednym badaniu
calendar 09.09.2024
Artykuł przedstawia kluczowe informacje na temat badań marketingowych, odpowiadając na pytania dotyczące ich celów, korzyści oraz negatywnych konsekwencji zaniedbania badań. Znajdziesz tu również wskazówki, jak skutecznie monitorować rynek przy użyciu narzędzi dostępnych na portalu…
Wyświetl wszystkie
Wyświetl wszystkie

Zastosowania statystyki

Wykorzystanie statystyki w projekcie badawczym to możliwość zdobycia rzetelnych danych i zależności, które pozwolą zdobyć pozycję na rynku oraz ją utrzymać. Jej wykorzystanie umożliwia dogłębne poznanie specyfiki rynku, preferencji konsumenckich, jakości obsługi klientów, a nawet poprawić wydajność poszczególnych procesów firmy.
Oferujemy analizy statystyczne w wielu obszarach:
Badania kliniczne
Badania kliniczne
(m.in. dla faz I-IV, przetwarzanie elektronicznie baz danych pacjentów (eCRF)
Badania medyczne
Badania medyczne
(m.in. badania statystyczno-epidemiologiczne, projekty naukowe)
Badania rynku
Badania rynku
(m.in. prognozowanie sprzedaży, segmentacji rynku, analizy migracji klientów)
Badania marketingowe
Badania marketingowe
(m.in. skuteczność kampanii reklamowej, analizy sprzedażowe, badanie wartości marki)
Badania satysfakcji klientów
Badania satysfakcji klientów
(m.in. poziom jakości obsługi klienta)
Badania farmaceutyczne
Badania farmaceutyczne
(m.in. substytucja leków w aptekach, badania statystyczne dla produktów OTC i Rx)

Zapraszamy do współpracy!

arrow
Uważasz, że Portal warto rozbudować o dodatkowe treści? Zajmujesz się szeroko pojętą statystyką? Przyślij do nas artykuł z zakresu statystyki, a my po pozytywnej recenzji opublikujemy go na stronie.
Najczęściej zadawane pytania
Jaki jest czas oczekiwania na wykonanie analizy statystycznej?
Czas realizacji jest zależny od skomplikowania projektu. Większość analiz przeprowadzamy w kilka dni. W naszej ofercie udostępniamy również możliwość zamówienia ekspresowych analiz statystycznych, które mogą być przeprowadzone nawet w 12 godzin!
Czy wykonują Państwo analizy statystyczne do prac naukowych?
Tak, wykonujemy. Ponadto podczas przygotowywania analiz, ściśle przestrzegamy norm uwzględnionych w ramach czasopism z listy filadelfijskiej.
Jakie dane powinienem przygotować, aby zlecić wykonanie analizy statystycznej?
Z przeprowadzonego badania powinniśmy od Ciebie uzyskać plik z bazą danych. Najczęstszym formatem używanym formatem jest plik MS Excel.
Co wchodzi w skład analizy statystycznej?
Zakres usługi jest zależny od charakteru badania. Zazwyczaj opracowujemy analizę statystyczną zgodną z protokołem badania, analizy przejściowe, a także opracowujemy graficznie wyniki badania. W finalnym kroku dla klienta możemy również sporządzić raport końcowy z przeprowadzonego badania.
Jaką mam pewność, że analiza zostanie przeprowadzona w rzetelny sposób?
Na nasze usługi statystyczne udzielamy 12‑miesięcznej gwarancji na wykonane analizy. W razie takiej konieczności oferujemy również konsulting z naszymi ekspertami.
Dlaczego powinienem wykonać analizę statystyczną w badaniu?
Po pierwsze, zyskujesz większość pewność co do przeprowadzonego badania oraz możesz zweryfikować czy zebrane dane są prawidłowe. Ponadto analizy statystyczne dają większą głębię uzyskanych danych. Dzięki nim m.in. zidentyfikujesz optymalną cenę rynkową, oszacujesz popyt i wartość sprzedaży detalicznej, czy rozpoznasz profil kluczowych graczy na rynku. Odkryjesz również zależności pomiędzy poszczególnymi grupami klientów w Twoim segmencie rynkowym.
Jaki jest możliwy zakres analizy danych?
Oferujemy pełny zakres analiz statystycznych, który zawsze jest uzgadniany z klientem w danym badaniu. Oferujemy zarówno analizy dla badań klinicznych, badań naukowych, jak i badań marketingowych.
Polecane serwisy: