Bitte erlauben Sie eine Korrektur: Ich denke, Ihre Aussage "er sagt, dass man aufrichtig versuchen sollte, Hypothesen zu widerlegen - und ich bin mir ziemlich sicher, dass er nicht die von Fisher formulierte Nullhypothese meinte, sondern die Hypothese, die von entscheidender Bedeutung ist zu uns "ist nicht wirklich richtig. Genau so hätte Fisher die "Nullhypothese" beschrieben. Für Fisher gibt es nur eine Art von Hypothese: die zu testende Hypothese, a.k.a. die Nullhypothese. Die von Neyman und Pearson eingeführte Unterscheidung zwischen Null- und Alternativhypothese wurde von Fisher nie akzeptiert (auch Conifolds Aussage "Anstatt die eigentliche Hypothese direkt zu testen, schlug Fisher vor, ihre 'Negation', die Nullhypothese, zu testen, wenn die Nullhypothese herauskommt Als unwahrscheinlich nach dem Test, dann beschreibt unsere tatsächliche Hypothese 'den Test überlebt' "den Ansatz von Fisher nicht richtig)
Wenn Sie Fisher sorgfältig lesen, wird die häufig verwendete Version der" Nullhypothese "(null, keine Wirkung, "nur zufällige Variation" und ähnliches) ist nicht das, worauf sich Fisher bezog. Die zentrale Bedeutung eines Tests für statistische Signifikanz ist seine Fähigkeit, Ergebnisse zu erzielen, die nach Fisher ("The Design of Experiments", 2. Aufl., 1937) in zwei Klassen mit unterschiedlichen Interpretationen unterteilt werden können:
“diejenigen, die eine signifikante Abweichung von einer bestimmten Hypothese aufweisen; […] Und […] Ergebnisse, die keine signifikante Abweichung von dieser Hypothese zeigen. Diese Hypothese […] ist wiederum charakteristisch für alle Experimente. […] [W] Wir können von dieser Hypothese als der „Nullhypothese“ sprechen, und es sollte beachtet werden, dass [es] im Verlauf des Experimentierens niemals bewiesen oder etabliert, aber möglicherweise widerlegt wird. […] Wenn behauptet würde, dass das Thema in ihren Urteilen niemals falsch sein würde, sollten wir wieder eine genaue Hypothese haben, und es ist leicht zu erkennen, dass diese Hypothese durch einen einzigen Fehler widerlegt, aber niemals bewiesen werden könnte durch eine endliche Menge an Experimenten. Es ist offensichtlich, dass die Nullhypothese genau sein muss, dh frei von Unbestimmtheit und Mehrdeutigkeit, da sie die Grundlage für das „Verteilungsproblem“ liefern muss, dessen Lösung der Signifikanztest ist . Eine Nullhypothese kann tatsächlich beliebige Elemente enthalten und tut dies in komplizierteren Fällen häufig. “ (S.18-20; Hervorhebung hinzugefügt)
Bitte beachten Sie, dass das einzige Unterscheidungsmerkmal einer Nullhypothese, wie sie von Fisher charakterisiert wird, die Fähigkeit ist, die Ergebnisse eines Experiments in zwei sich gegenseitig ausschließende Klassen (unterstützende und widersprüchliche Fälle) zu unterteilen und dies zu tun muss es genau sein. Das ist alles. Es wird nicht davon ausgegangen, dass eine Nullhypothese das Fehlen jeglicher Auswirkungen angeben muss, wie die meisten statistischen Ressourcen - Websites, Artikel und Lehrbücher - behaupten. Es ist auch wichtig, dass es, wie bereits erwähnt, in Fischers Ansatz keine "alternative" Hypothese gibt, die häufig mit der "Forschungshypothese" gleichgesetzt wird, die durch Ablehnung der Null gestützt werden soll. In Fischers Ansatz ist die "Nullhypothese" die Hypothese, die der Forscher testen möchte. Es kann das Fehlen eines Effekts oder seine Existenz angeben, und solange es genau ist, kann es getestet werden. Um jedoch eine Nicht-Null-Nullhypothese angemessen zu testen, müssen die üblicherweise angewendeten Tests (z. B. t-Tests) durch Versionen ersetzt werden, die den Effekt (die Größe) widerspiegeln. Im Fall des t-Tests könnte jeder Effekt mit einer bestimmten nicht zentralen Version dieses Tests getestet werden (der dieselbe Verteilung verwendet, die für Leistungsberechnungen im Neyman-Pearson-Ansatz verwendet wird). Ein signifikantes p würde - wie üblich - anzeigen, dass die Daten offensichtlich nicht mit der Vorhersage auf der Grundlage der Nullhypothese (unserer Forschungshypothese!) Entsprechen, die üblicherweise als Ablehnung der Null angesehen wird. So interpretiert verschwindet zumindest die Mehrheit (wenn nicht alle) der üblicherweise diskutierten Mängel von "NHST". Darüber hinaus sieht diese Interpretation von Signifikanztests wie eine statistische Version des Fälschungsprinzips von Popper oder zumindest als ein eng damit verbundenes statistisches Argument aus.
Die Verwirrung vieler Benutzer statistischer Methoden (die auch die - noch andauernde - Diskussion über NHST, "Nullhypothesen-Signifikanztests" in den "weichen" oder - besser - schwachen "Wissenschaften" [wie Psychologie] vorangetrieben hat) ist wahrscheinlich aufgrund der Verwechslung zweier unterschiedlicher Ansätze zum Testen von Hypothesen - Fischers Signifikanztest auf der einen Seite und Neyman-Pearsons Theorie der statistischen Entscheidung auf der anderen Seite - zu einem "inkonsistenten Hybrid, den jeder anständige Statistiker ablehnen würde" (Gigerenzer, 1993). Eine prototypische Studie, zumindest in der Psychologie, funktioniert folgendermaßen: Der Forscher geht davon aus, dass es einen Effekt gibt. Er / sie nimmt eine mittlere Effektgröße an (Cohens d = 0,5; wahrscheinlich schlechte Theorie, aber trotzdem ...) und berechnet die Stichprobengröße für diesen angenommenen Effekt, um sensibel angezeigt zu werden, beispielsweise mit Power = 0,8 (dies ist eine Art von Neyman-Pearson). Dann sammelt er / sie Daten, führt einen Standard- (zentralen) t- oder F-Test durch, setzt eine Strohmann-Nullhypothese von "keine Wirkung" und wenn p <0.05, lehnt er / sie die Null ab (was in Ordnung ist; dies ist Fisher, testet aber nicht die tatsächliche Hypothese) und akzeptiert A ( was nicht in Ordnung ist , da jede von null abweichende Effektgröße durch Ablehnung unterstützt wird die Null, sofern nicht alle anderen Alternativen ausgeschlossen werden können). Diese letztere Schlussfolgerung ist weder Fisher noch Neyman-Pearson, sie ist einfach nicht korrekt.
Zusammenfassend denke ich, dass die Zusammenfassung, auf die Sie sich beziehen, eher einer der seltenen Fälle ist, in denen das Wesen von Das Testen von Hypothesen (auf eine Weise, die von Fisher akzeptiert worden wäre) wurde mehr oder weniger korrekt extrahiert. Dennoch gibt es eine gewisse Ungenauigkeit in der Zusammenfassung, da davon ausgegangen wird, dass die Null- und die Forschungshypothese unterschiedliche Dinge sind. Tatsächlich ist es sowohl für Popper als auch für Fisher die Forschungshypothese, die getestet und gegebenenfalls zurückgewiesen werden muss. Was eigentlich ist Fischers Nullhypothese.
In Bezug auf Ihre dritte Frage:
In "Logik der Forschung" bezieht sich Popper manchmal auf das Wahrscheinlichkeitskonzept von Fisher, nicht jedoch auf Signifikanztests (oder auf die Neyman-Pearson-Theorie). In Bennetts (1990) "Statistical Inference and Analysis - Selected Correspondence of R.A. Fisher" ist Popper nicht als Korrespondent aufgeführt.