Stichprobengröße beim t-Test mit verbundenen Stichproben mit G*Power - Björn Walther (2024)

Stichprobengröße beim t-Test mit verbundenen Stichproben mit G*Power - Björn Walther (1)

Im Vorfeld jeder statistischen Untersuchung sollte mittels einer Poweranalyse sichergestellt werden, dass eine hinreichend große Menge an Probanden/Beobachtungen vorliegt. Warum? Kurz gesagt, damit der Test auch die Chance hat, einen Effekt erkennen zu können. Diese Chance nennt man auch statistische Power.

Inhaltsverzeichnis

1 Vorbemerkungen

1.1 Statistische Power (Teststärke)

Teststärke (sog. statistische Power) beschreibt die Fähigkeit eines Tests, einen in der Stichprobe tatsächlich vorhandenen Effekt auch erkennen zu können und ist essenziell – nur leider ist das zu wenig bekannt. Beim verbundenen t-Test ist der Effekt offensichtlich ein Unterschied einer Population vor und nach einer Intervention, also zu zwei Messzeitpunkten.

Die Power berechnet sich aus 1 abzüglich des Beta-Fehlers.
Der Beta-Fehler beschreibt das fälschliche Beibehalten der Nullhypothese. Hier kann man gut erkennen, dass Power und Beta-Fehler (auch Fehler 2. Art) direkt zusammenhängen. Ich erhöhe die Power, wenn ich den Beta-Fehler minimiere. Hier sind 5% Fehlerwahrscheinlichkeit erstrebenswert, somit ist die Power 1 – 0,05 = 0,95 (95%). Mehr ist kaum praktikabel. Als Kompromiss findet man als Untergrenze 0,8 – also 80%. Eine geringere Power im Vorfeld anzunehmen, ist kaum rechtfertigbar. Auch 0,8 muss begründet sein.

1.2 Alpha-Fehler

Der Alpha-Fehler (auch Fehler 1. Art) ist das fälschliche Ablehnen der Nullhypothese. Typisch ist als Grenze für Alpha 5% (0,05). Man akzeptiert also eine maximale Alpha-Fehlerwahrscheinlichkeit von 5%. Weitere typische Grenzen sind 1%, 0,1% oder sogar 10%. Achtung, es kommt hier häufig auf den Kontext an. Niedriger kann pauschal als besser erachtet werden – es geht ja um die Fehlervermeidung.

1.3 Effektstärke

Im Vorfeld benötigt man die Effektstärke, also wie stark der beobachtete Effekt wohl sein wird bzw. vermutet wird. Im Kontext des t-Tests bei verbundenen Stichproben verwendet man Cohens d nach Cohen (1988)/Cohen (1992). In G*Power wird allerdings nicht d, sondern dz verwendet. Vereinfacht ausgedrückt wird aus den Werten der Messzeitpunkten eine Differenz gebildet. Für diese Differenz ergeben sich Mittelwert und Standardabweichung, aus denen lediglich der Quotient gebildet wird, also die Abweichung standardisiert:

Stichprobengröße beim t-Test mit verbundenen Stichproben mit G*Power - Björn Walther (2)

Es gibt hierzu verschiedene Herangehensweisen zur Festlegung im Rahmen der Poweranalyse:

  • Der einfachste Weg ist eine Orientierung an Vergleichsstudien und Verwendung der dort angegebenen Effektstärke dz. Sollte keine angegeben sein, kann man die mitunter nachträglich mit den angegebenen Populationsparametern nach obiger Formel ermitteln.
  • Der praktische Weg ist das Festlegen auf Basis der Erfahrung des Forschers. Dies ist aber subjektiv und eine Begründung mit persönlicher Erfahrung kann bei Gutachtern schnell zu einer ablehnenden Haltung führen.
  • Der pragmatische Weg ist die Annahme eines mittleren Effektes (dz = 0.5). Auch hier ist eine Begründung notwendig und kann nicht einfach so getroffen werden – nicht selten findet man aber keine.

Die Konventionen nach Cohen sind folgende:

  • d > 0,2 – kleiner Effekt
  • d > 0,5 – mittlerer Effekt
  • d > 0,8 – großer Effekt

1.4 Gerichtetheit der Hypothese

Naiv testet man ungerichtet, also zweiseitig. Man weiß also nicht, ob sich der Messwert nach der Intervention positiv oder negativ entwickelt. (Werte unterscheiden zwischen Zeitpunkten). Testet man einseitig, vermutet man im Vorfeld, dass zum Zeitpunkt 2 die Testvariable höher (oder niedriger) als zum Zeitpunkt 1 ist.

2 Die Mindeststichprobengröße mit G*Power

Zunächst ist der richtige Test auszuwählen, was am einfachsten über das obere Menü funktioniert.

Means -> Two Dependent Groups (matched pairs)

Stichprobengröße beim t-Test mit verbundenen Stichproben mit G*Power - Björn Walther (3)

Bei Type of Power Analysis ist zwingend a priori auszuwählen.
Entsprechend sind nun Gerichtetheit des Tests, Effektstärke (vermutetes Cohens d, siehe oben), Alphafehler (typisch 5%) sowie statistische Power (typisch 95%) einzutragen.

Bei einem zweiseitigen Test mit mittlerer Effektstärke von dz = 0,5, Alpha 5% und einer Power von 95% ergibt dies einen mindestens notwendigen Stichprobenumfang von n = 54 Beobachtungen. Es sind also 54 Beobachtungen zu jeweils zwei Zeitpunkten notwendig.

Stichprobengröße beim t-Test mit verbundenen Stichproben mit G*Power - Björn Walther (4)

3 Powertabellen

3.1 Zweiseitiges Testen

Hier eine Übersicht für verschiedene Effektstärken bei unterschiedlichen Power-Niveaus bei zweiseitigem Test:

Zweistichproben t-Test (2-seitig)Cohens d Alpha Power (1-Beta) N0,8 0,05 0,95 230,5 0,05 0,95 540,2 0,05 0,95 3270,8 0,05 0,8 150,5 0,05 0,8 340,2 0,05 0,8 1990,2 0,01 0,95 449

Es ist recht deutlich erkennbar, dass mit sinkender Effektstärke bei gleichbleibender Power die notwendige Stichprobengröße (N) stark steigt. Der “worst case” wäre eine kleine Effektstärke von 0,2 bei einem Alphafehler von 1% sowie einer Power von 95%. Hier wären insgesamt 449 Beobachtungen zu zwei Zeitpunkten notwendig.

3.2 Einseitiges Testen

Die Übersicht für verschiedene Effektstärken bei unterschiedlichen Power-Niveaus bei einseitigem Test:

Zweistichproben t-Test (1-seitig)Cohens d Alpha Power (1-Beta) N0,8 0,05 0,95 190,5 0,05 0,95 450,2 0,05 0,95 2720,8 0,05 0,8 120,5 0,05 0,8 270,2 0,05 0,8 1560,2 0,01 0,95 397

Man kann hier gut erkennen, dass bei einseitigen Tests ein wenig an der Mindeststichprobengröße “gespart” werden kann. Es hilft also im Vorfeld gerichtete Hypothesen aufzustellen.

4 Videotutorial

5 Literatur

  • Cohen, J. (1988). Statistical power analysis for the behavioral sciences. New York, NY: Psychology Press, Taylor & Francis Group
  • Cohen, J. (1992). A power primer. Psychological bulletin, 112(1), 155-159.
Stichprobengröße beim t-Test mit verbundenen Stichproben mit G*Power - Björn Walther (2024)

References

Top Articles
27407, NC Real Estate & Homes for Sale | realtor.com®
LRFXC2606S LG Appliances 26 cu. ft. Smart Counter-Depth MAX™ Refrigerator with Dual Ice Makers
Varsity Competition Results 2022
Nail Salons Open Now Near My Location
Maria Lima Lietz - Hamburger SV
Ebony Ts Facials
Babylon Showtimes Near Airport Stadium 12
T-Mobile SW 56th Street & SW 137th Ave | Miami, FL
Pogo Express Recharge
When Does Dtlr Close
Adopted. Abused. Abandoned. How a Michigan boy's parents left him in Jamaica
Public Agent.502
8x20, 8x40 Shipping containers storage container for rent or sale - general for sale - by dealer - craigslist
New Stores Coming To Canton Ohio 2022
Accident On May River Road Today
Real Estate Transfers Erie Pa
Nyu Paralegal Program
Ella And David Steve Strange
Lorton Transfer Station
1102 E Overland Trail Abilene 79601
Advanced Eyecare Bowling Green Mo
Glenwood Apartments Logan Utah
Inspire Brands.csod.com Arby's
Nwi Police Blotter
Cox Teacher Discount
Unveiling The Fascination: Makayla Campinos Video
Bardstown Ky Pawn Shops
Myworld Interactive American History Pdf
Naydenov Gymnastics Reviews
Watch The Lovely Bones Online Free 123Movies
Dumb Money, la recensione: Paul Dano e quel film biografico sul caso GameStop
Pa Legion Baseball
Olecranon Fractures Flower Mound
Savannah Riverboat Cruise Anniversary Package
Saint Lukes Epulse
Coil Cleaning Lititz
Devil May Cry 3: Dante's Awakening walkthrough/M16
How To Delete Jackd Account
Mellow Mushroom Nutrition Facts: What to Order & Avoid
Whose Address Is Po Box 9040 Coppell Tx 75019
Southeast Ia Craigslist
Traftarım 24
Leuke tips & bezienswaardigheden voor een dagje Wijk bij Duurstede
Swrj Mugshots Logan Wv
9294027542
Sacramento Library Overdrive
Cranes for sale - used and new - TrucksNL
Heatinghelp The Wall
Shaws Myaci
11 Awesome Cities: Skylines Mods You Need To Try
Tacoma Craigslist Free
How Long Ago Was February 28 2023
Latest Posts
Article information

Author: The Hon. Margery Christiansen

Last Updated:

Views: 5525

Rating: 5 / 5 (70 voted)

Reviews: 85% of readers found this page helpful

Author information

Name: The Hon. Margery Christiansen

Birthday: 2000-07-07

Address: 5050 Breitenberg Knoll, New Robert, MI 45409

Phone: +2556892639372

Job: Investor Mining Engineer

Hobby: Sketching, Cosplaying, Glassblowing, Genealogy, Crocheting, Archery, Skateboarding

Introduction: My name is The Hon. Margery Christiansen, I am a bright, adorable, precious, inexpensive, gorgeous, comfortable, happy person who loves writing and wants to share my knowledge and understanding with you.