GWUP-Test beinahe bestanden

@Joey, was ist eine Nullhypothese? Ich muss das wissen, um deinen langen Beitrag zu verstehen, und finde bei Google nur unpassend erscheinende Definitionen.

Wie sieht es mit rational gefärbten Erklärungen aus, die nicht falsifizierbar sind? Ich denke hier besonders an Verschwörungstheorien und frage mich, was nach Ockham wahrscheinlicher ist: ein völlig absurder Plot, der ohne Erweiterung der bekannten Naturgesetze auskommt, oder die Annahme verborgener Kräfte.

Da geht es darum, Haare in der Suppe zu suchen, anstatt einfach davon auszugehen, sie sei sauber. Das halte ich für klug und richtig. Jedoch sehe ich eine Neigung, die Haare in der Suppe vorauszusetzen, und die wiederum ist unwissenschaftlich, denn sie fördert selektive Wahrnehmung.
Man unterscheidet als Gegensatzpaar Nullhypothese und Alternativhypothese (auch Gegenhypothese). Häufig sagt die Nullhypothese aus, dass kein Effekt bzw. Unterschied vorliegt oder dass ein bestimmter Zusammenhang nicht besteht. Diese These soll verworfen werden, so dass die Alternativhypothese als Möglichkeit übrig bleibt.
...
Weil eine Untersuchung häufig das Ziel hat, zu zeigen, dass es einen bestimmten Unterschied gibt, der in der alternativen Hypothese formuliert wird, beinhaltet die Nullhypothese
7c5081abe6c2100f0e44396b6ac51661.png
das Gegenteil, also die Gleichheit von Sachverhalten, etwa:

  • dass zwischen Gruppen kein Unterschied besteht,
  • dass ein bestimmtes Medikament keine Wirkung zeigt,
  • dass zwischen Merkmalen kein Zusammenhang besteht.
https://de.wikipedia.org/wiki/Hypothese_(Statistik)
 
Werbung:
Man unterscheidet als Gegensatzpaar Nullhypothese und Alternativhypothese (auch Gegenhypothese). Häufig sagt die Nullhypothese aus, dass kein Effekt bzw. Unterschied vorliegt oder dass ein bestimmter Zusammenhang nicht besteht. Diese These soll verworfen werden, so dass die Alternativhypothese als Möglichkeit übrig bleibt.
...
Weil eine Untersuchung häufig das Ziel hat, zu zeigen, dass es einen bestimmten Unterschied gibt, der in der alternativen Hypothese formuliert wird, beinhaltet die Nullhypothese
7c5081abe6c2100f0e44396b6ac51661.png
das Gegenteil, also die Gleichheit von Sachverhalten, etwa:

  • dass zwischen Gruppen kein Unterschied besteht,
  • dass ein bestimmtes Medikament keine Wirkung zeigt,
  • dass zwischen Merkmalen kein Zusammenhang besteht.
https://de.wikipedia.org/wiki/Hypothese_(Statistik)
Also bedeutet "die Wahrscheinlichkeit, unter Annahme der Nullhypothese ein Ergebnis zu erzielen" die Wahrscheinlichkeit, ein Ergebnis zufällig zu erzielen?
 
Also bedeutet "die Wahrscheinlichkeit, unter Annahme der Nullhypothese ein Ergebnis zu erzielen" die Wahrscheinlichkeit, ein Ergebnis zufällig zu erzielen?
Ich habe mich nicht ins Thema eingelesen (mach ich noch, zu spät jetzt), aber ein Nullhypothese nimmt im Prinzip an, dass es kein Ergebnis (keinen Unterschied, keine Wirkung, keinen Effekt usw.) gibt - die (Alternativ) hypothese besagt, dass es ein Ergebnis gibt, dass etwas wirkt, dass etwas einen Effekt hat.
Was letztendlich ausschlagebend ist, ist die Signifikanz ... .

Wenn du die Zahl 6 etliche Male nacheinander würfelst und behauptest, du habest das beeinflusst, könnte man das laienhaft (!) als "irgendein Ergebnis" werten - letztendlich wäre das aber nur eines, wenn du das immer wieder hinbekommst (was du nicht wirst). Somit ist das bei einem einzigen Mal ein Zufall.
(ich glaube aber, du meinst das, auch wenn du es mißverständlich ausgedrückt hast?)
 
@Joey, was ist eine Nullhypothese? Ich muss das wissen, um deinen langen Beitrag zu verstehen, und finde bei Google nur unpassend erscheinende Definitionen.

Das hat @Ireland schon ganz gut beantwortet. Experimente sind so gestaltet, dass sie zwiwschen verschiedenen Hypothesen entscheiden sollen, bzw. einer der möglichen Hypothesen einen Vorzug geben sollen. Das sind zumeist die beiden Hypothesen: "Da ist ein echter Effekt." oder: "Da ist kein Effekt" - letzteres wird dann die Nullhypothese genannt. Der p-Wert gibt die Wahrscheinlichkeit des Ergebnisses unter Annahme der Nullhypothese an, also, dass das erzielte Ergebnis durch Zufall entstanden ist.

Und in meinem längeren Beitrag gestern habe ich beschrieben, dass das NICHT mit der Wahrscheinlichkeit zu verwechseln ist, dass die Nullhypothese noch wahr ist. Dieser Denkfehler ist auch unter Wissenschaftlern noch weit verbreitet, so dass die Bedeutung dieses p-Werts stark überinterpretiert wird.

Wie sieht es mit rational gefärbten Erklärungen aus, die nicht falsifizierbar sind? Ich denke hier besonders an Verschwörungstheorien und frage mich, was nach Ockham wahrscheinlicher ist: ein völlig absurder Plot, der ohne Erweiterung der bekannten Naturgesetze auskommt, oder die Annahme verborgener Kräfte.

Ich bin mir nicht sicher, ob ich verstehe, was Du meinst. Magst du ein Beispiel nennen?

Da geht es darum, Haare in der Suppe zu suchen, anstatt einfach davon auszugehen, sie sei sauber. Das halte ich für klug und richtig. Jedoch sehe ich eine Neigung, die Haare in der Suppe vorauszusetzen, und die wiederum ist unwissenschaftlich, denn sie fördert selektive Wahrnehmung.

Diese Neigung ist denke ich durchaus da. Dahinter steckt allerdings auch die Erfahrung, dass sensationelle Entdeckungen selten sind, und sich bei sehr vielen sensationel anmutenden Entdeckungen herausstellte, dass sie auf Haaren in der Suppe beruhten - nicht nur in den Grenzwissenschaften.

Um mal ein paar Beispiele zu nennen:

https://de.wikipedia.org/wiki/N-Strahlen

https://de.wikipedia.org/wiki/Kluger_Hans

Oder auch in neuerer Zeit: Ihr erinnert Euch vielleicht daran, dass vor ein paar Jahren die OPERA-Kollaboration Messergebnisse veröffentlicht hat, dass neutrinoss Überlichtgeschwindigkeit erreichen können. Das Experiment sah so aus: Am CERN wurde ein Neutrino-Strahl erzeugt, der auf den paar-hundert km entfernten OPERA-Detektor gerichtet war, und sie schienen ein klein wenig früher anzukommen als erwartet. Über Wochen/Monate war der Preprint-.Server arxiv.org voll mit Vorschlägen dartüber, was bei der messung falsch gelaufen sein könnte, oder mit Theorie-Vorschlägen, die das Ergebnis erklären konnten. Letztendlich war es nur ein lockeres Kabel, was die Signal-Laufzeiten gegenüber früherer messungen veränderte.

Oder jetzt noch jünger: http://www.nature.com/news/microwave-oven-blamed-for-radio-telescope-signals-1.17510

Du hast gestern ein wenig die Freude am Debunken bemängelt. Ich kann auch gut nachvollziehen, wie dieser Eindruck zustande kommt, und an diesem Eindruck ist auch durchaus ein Kern Wahrheit dran. Ich kann jetzt nur für mich reden (und ich bin kein Mitglied der GWUP und habe auch zumindest kurzfristig nicht vor, eins zu werden). Ich schreibe hier schon seit Jahren auf der Esoterik-skeptische Seite. Sollte sich irgendwie herausstellen, dass ein Psi-Phänomen doch wirklich existieren sollte... das wäre durchaus unangenehm für micch. Ich bin ein Mensch mit Psychologie, ich denke nicht rein rational... und so würde das in mir eine sog. "kognitive Dissonanz" auslösen. Soweit so richtig.

Es ist allerdings die selbe kognitive Dissonanz, die auf Esoterik- und Parawissenschaftsseite auftritt, wenn begründet werden kann, dass die gelieferten Belege wohl nicht so Beweiskräftig sind, wie behazptet. Es ist die gleiche kognitive dissonanz, die dann Esoteriker und Parawissenschaftler zu dem Satz verleitet: "Du willst ja nur Dein Weltbild verteidigen." Ein Satz, der u.U. nicht ganz von der Hand zu weisen ist, aber für die Person, die den Vorwurf äußert, in gleicher Weise gilt. Und, ob man "nur sein Weltbild verteidigen will", sagt NICHTS darüber aus, ob es ein richtiges oder ein falsches Weltbild ist, was man verteidigt. Dieser Satz hat also keinerlei argumentativen Wert.
 
Das nicht unbedingt. Ich halte es jedoch für sehr wahrscheinlich, dass sie dennoch nichts Besonderes im Ergebnis sähen. Sie würden Ockhams Messer dahingehend auslegen, dass selbst die absurdeste herkömmliche Erklärung rationaler sei als die Annahme bislang unbekannter psychischer Kräfte.

Ich würde bei wiederholbaren Ergebnissen (die deutlich über der Ratewahrscheinlichkeit liegen) v.a. bei einer einzelnen Person, auch zuerst im "herkömmlichen Bereich" suchen - es gibt ja vorerst keinen Grund, paranormale Fähigkeiten anzunehmen.
Wenn Du z.B. hörst, dass eine Person beim Stabhochsprung den Weltrekord um 1m übertroffen, oder beim 100 m Lauf den Weltrekord um 2 sec. unterboten hat. Wo suchst Du zuerst nach möglichen Erklärungen? Warum gehen die Sportrichter nicht einfach von legalen, aber unbekannten physischen Kräften aus?
Und ich rede hier nicht von bewusstem Betrug - zumindest bei den Probanden der GWUP-Tests nehme ich das nicht an...
 
Wie sieht es mit rational gefärbten Erklärungen aus, die nicht falsifizierbar sind? Ich denke hier besonders an Verschwörungstheorien und frage mich, was nach Ockham wahrscheinlicher ist: ein völlig absurder Plot, der ohne Erweiterung der bekannten Naturgesetze auskommt, oder die Annahme verborgener Kräfte.

Ich hab über diese Frage noch ein wenig weiter nachgedacht.

Dabei musste ich an folgende Begebenheiten denken:

So ab den 60er Jahren berichteten Piloten über Leuchterscheinungen nicht unter sondern über Gewittern. Aus Angst, für verrückt gehalten zu werden, behielten viele Piloten allerdings die Sichtungen für sich. Ich meine auch mal gehört zu haben, dass Piloten ihren Job verloren haben, nachdem sie von ihren derartigen Sichtungen berichtet haben, aber dazu finde ich gerade keine konkreten Belege. Mittlerweile sind diese Phänomene allerdings dank intensiverer Suche und guter Fototechnik etc. gut belegt und gesichert: Siehe: http://www.spiegel.de/wissenschaft/...s-geheimnis-der-lichtgespenster-a-359591.html und https://de.wikipedia.org/wiki/Sprite_(Wetterphänomen)

Die Existenz von Kugelblitzen ist nach wie vor ungeklärt. Erklärungsversuche beinhalten Sinnestäuschungen, und ich habe mal ein Interview mit einem Wissenschaftler gesehen, der sich wehement auf eine Erklärung, die einzig und allein auf Sinnestäuschungen beruhte, versteift hat. Mittlerweile konnten im Labor zumindest kugelblitz-ähnliche Phänomene erzeugt werden (siehe https://de.wikipedia.org/wiki/Kugelblitz).

Wie Ockhams Rasiermesser in diesen Fällen entscheiden würde, ist mir nicht völlig klar. Es ist dabei zu beachten, dass der "völlig absurde Plot, der ohne Erweiterung der bekannten Naturgesetze auskommt", evtl. das Phänomen eben nicht gleich gut beschreibt wie ein Postulat eines neuen Naturgesetzes. Der völlig absurde Plot könnte eben selbst die bekannten Naturgesetze zwar nicht erweitern, aber ziemlich "gedehnt" interpretieren, was ihn eben mit absurd machen würde. Zum Beispiel ist die Aussage: "Kugelblitze beruhen auf Nachbildern auf der Netzhaut" doch eher schwammig, und es ist mir nicht klar, ob das, was wir über nachbilder auf der Netzhaut wissen, die verschiedenen Sichtungen wirklich hinreichend gut erklärt.

Desweiteren sei noch allgemein eingeworfen, dass Ockhams Rasiermesser nicht immer eindeutig entscheiden kann. Ich habe schon Diskussionen (innerhalb der Physik) erlebt, wo beide Seiten Ockhams Rasiermesser für sich beanspruchten... und beide mit durchaus nachvollziehbaren Gründen.

Abgesehen davon gebe ich Dir durchaus Recht, dass die Begründung nach Ockhams Rasiermesser alleine nicht die Suche nach weitereren (bislang unbekannte) Naturgesetzen gänzlich verhindern soll. Das soll jetzt aber NICHT ein Freubrief dafür sein, jede Sichtung, jeden (Schein-)Beweis etc. sofort zu akzeptieren. Ein postulieres Phänomen muss weiter mit größter Vorsicht begutachtet werden, was eben auch beinhaltet, nach Plots zu suchen, die ohne das behauptete Phänomen auskommen und so Ockhams Rasierbesser "bedienen". Und dabei ist es egal, mit welcher genauen Intention diese Plots gesucht werden.
 
Es ist allerdings die selbe kognitive Dissonanz, die auf Esoterik- und Parawissenschaftsseite auftritt, wenn begründet werden kann, dass die gelieferten Belege wohl nicht so Beweiskräftig sind, wie behazptet. Es ist die gleiche kognitive dissonanz, die dann Esoteriker und Parawissenschaftler zu dem Satz verleitet: "Du willst ja nur Dein Weltbild verteidigen." Ein Satz, der u.U. nicht ganz von der Hand zu weisen ist, aber für die Person, die den Vorwurf äußert, in gleicher Weise gilt. Und, ob man "nur sein Weltbild verteidigen will", sagt NICHTS darüber aus, ob es ein richtiges oder ein falsches Weltbild ist, was man verteidigt. Dieser Satz hat also keinerlei argumentativen Wert.
Richtig. Und sobald wenigstens eine Partei sich stur stellt, ist die Debatte für die Katz. Dies ist leider meistens der Fall, ganz besonders in Foren wie diesem, wobei es ohnehin immer dann am spannendsten wird, wenn jemand die volle Schärfe seiner Skepsis auf das eigene Weltbild richtet.

(Es sieht blöd aus, dass ich scheinbar ausweichend auf nur einen Bruchteil deiner Antworten reagiere, aber das liegt einfach daran, dass ich nichts daran auszusetzen habe.)
 
Richtig. Und sobald wenigstens eine Partei sich stur stellt, ist die Debatte für die Katz. Dies ist leider meistens der Fall, ganz besonders in Foren wie diesem,

Ich würde nicht sagen, dass die Debatte dann ganz für die Katz ist.Wir haben ja nicht nur zwei Parteien, sondern ein ganzes Spektrum an möglichen Ansichten zwischen den beiden Extremen. Es wird immer Leute geben, die sich stur stellen. Das macht ihre Argumente für die Leute im Zwischenspektrum aber nicht weniger wertvoll. Eine einzelne Debatte muss nicht unbedingt zu einem Konsenz führen.

(Daneben sei noch kurz angemerkt, dass ich hier im Forum eine ganz leicht härtere Position vertrete, als meine "echte" Meinung ist. Aber, wenn ich versuchen würde, diese ordentlich differenzier darzustellen, wären meine Beiträge mindestens doppelt so lang. Soviel Zeit habe ich nicht, und es würde eh kaum jemand wirklich verstehen).

wobei es ohnehin immer dann am spannendsten wird, wenn jemand die volle Schärfe seiner Skepsis auf das eigene Weltbild richtet..

Ja, durchaus. Wenn man das macht, kommt man schnell zu der Erkenntnis, dass sowas wie endgültige unzweifelbare empirische Beweise unmöglich sind. Jedes Weltbild ruht auf Grundaxiomen, und man muss nur an diesen etwas wackeln, um wieder so manche Aussage "möglich" zu machen. Dass erkennt man auch an manchen Diskussionen hier, die dann in die Metaphysik abgleiten.

Und innerhalb meines Weltbildes und meiner Paradigmen habe ich auch durchaus Kriterien, die mich z.B. von der Wirkung der Homöopathie oder der Existenz von Psi-Phänomenen überzeugen würden. Diese kritierien sind zugegebenermaßen nur schwer und keinesfalls schnell zu erfüllen... aber es ist nicht vollkommen unmöglich. (Und, solange sie nicht erfüllt sind, bin und bleibe ich stur).

(Es sieht blöd aus, dass ich scheinbar ausweichend auf nur einen Bruchteil deiner Antworten reagiere, aber das liegt einfach daran, dass ich nichts daran auszusetzen habe.)

Kein Problem. Ich glaube Deine Einstellung gut einschätzen zu können.
 
Hallo @Joey,


Ich möchte hierbei nochmal auf die Messlatte eingehen, die bei solchen Tests bzw. bei fast allen statistischen Auiswertungen in der Wissenschaft verwendung findet. Hier wird meist der sog. p-Wert verwendet: Die Wahrscheinlichkeit, dass das Ergebnis unter Annahme der Nullhypothese eintritt. Es wird vorher festgelegt, welcher p-Wert unterschritten werden soll, und, wenn das geschieht, nennt man das dann "statistisch signifikant". In medizinischen Studien wird oft die Messlatte auf 5% gesetzt. Das heißt allerdings auch, dass 5% aller derartigen Studien zu einem Nicht-Effekt ein falsch-positives Ergebnis liefern. In der Physik wird meist die sog. "5-Sigma"-Grenze angenommen. Die ist wesentlich strenger als in der Medizin. Die Wahrscheinlichkeit diese Grenze durch Zufall zu knacken ist in etwa 1 zu 3.5 Millionen. Durch die größeren Datenmengen, die in der Physik genommen werden können, ist das allerdings eine realistische grenze für echte Effekte. Die Messlatte der GWUP liegt irgendwo dazwischen, glaube ich... ich müsste es mal ausrecchnen.


Ich habe mal geschaut, was für eine Messlatte die GWUP generell bei den PSI-Tests anlegt:


GWUP schrieb:
Für die GWUP-Tests wurden Alpha-Werte von etwa 10^-10 angesetzt; die 1/Alpha-Werte liegen dementsprechend etwa bei etwa 10 Milliarden. Die Chance, dass ein Kandidat, der über keine besondere PSI-Fähigkeit verfügt, allein durch bloßes Raten (und ohne Schummeln) den Test erfolgreich meistert und die GWUP den Preis irrtümlich zahlen muss, ist damit etwa gleich der Chance, zwei Mal hintereinander einen „Fünfer“ im Lotto „6 aus 49“ zu gewinnen (ca. 10^-10). In der normalen Wissenschaft sind solche kleinen Werte für Alpha nicht üblich. Man beachte aber, dass es hier nicht nur um wissenschaftliche Aussagen geht, sondern auch um das Zahlen einer sehr hohen Prämie. Außerdem ist zu bedenken, dass eventuell im Laufe der Zeit recht viele Kandidaten getestet werden möchten. Die Wahrscheinlichkeit, dass die GWUP irgendwann irrtümlich den Preis zahlen muss, vervielfacht sich um die Anzahl dieser Kandidaten.


Quelle: http://www.gwup.org/images/stories/pdf/themen/gwup-teststatistik.pdf



Der Alpha-Wert ist das Signifikanzniveau, das vorher immer festgelegt wird. Nach der Datenerhebung wird der p-Wert berechnet und zum Alpha-Wert in eine Beziehung gesetzt.

Die Nullhypothese wird verworfen, wenn p<α.

Die Nullhypothese wird beibehalten, wenn p>α.


Der Alpha-Wert wird von der GWUP mit 10^-10 angesetzt. Üblich sind für Alpha aber Werte wie z. B. 0.05 (= 5%).
Damit müsste der p-Wert wirklich extrem niedrig sein. Also auf keinen Fall 5%!



Da im Thread Fragen zu den Begrifflichkeiten aufgetaucht sind, gebe ich noch mal eine kurze Erklärung bezogen auf den vorliegenden Fall. Falls ich dabei etwas falsches schreiben sollte, darfst du mich gerne korrigieren. :)
(Power-Wert und Prüfgröße lasse ich jetzt mal außen vor.)


Nullhypothese: "Herr Textor verfügt über keine paranormalen Fähigkeiten."


--> Damit geht die Nullhypothese davon aus, dass die von Textor erzielten Ergebnisse auf reinen Zufall zurückzuführen sind.


Alternativhypothese: "Herr Textor verfügt über paranormale Fähigkeiten."


--> Damit geht die Alternativhypothese davon aus, dass die von Textor erzielten Ergebnisse auf seine paranormalen Fähigkeiten zurückzuführen sind.


Alpha-Wert (= Signifikanzniveau): Im vorliegenden Test vermutlich 10^-10.


--> Der Alpha-Wert wird vor dem Test festgelegt. Er ist die Schwellenhöhe für die maximal zulässige Irrtumswahrscheinlichkeit. Damit soll die Wahrscheinlichkeit, dass Herr Textor den Test besteht, obwohl er die paranormalen Fähigkeiten nicht besitzt, möglichst gering gehalten werden. Aber auch wenn bei den Tests der GWUP die Irrtumswahrscheinlichkeit wirklich verschwindend gering ist, kann ein Irrtum nicht zu 100% ausgeschlossen werden.


p-Wert: Wenn die Ergebnisse der 50 Durchgänge vorliegen, wird der p-Wert errechnet. Im vorliegenden Fall müsste der errechnete p-Wert knapp über dem Alpha-Wert liegen, da Herr Textor knapp unter der Grenze von 40 Treffern blieb. Damit ist sein Ergebnis statistisch nicht signifikant, auch wenn es außerordentlich gut ist.


--> Der p-Wert soll nach der Auswertung der Ergebnisse helfen zu entscheiden, ob das erzielte Ergebnis auf reinen Zufall zurückzuführen ist.

Wenn der p-Wert größer als der Alpha-Wert ist, dann wird die Nullhypothese beibehalten und das erzielte Ergebnis auf reinen Zufall zurückgeführt.

Wenn der p-Wert aber kleiner als der Alpha-Wert ist, dann wird die Nullhypothese verworfen und die Alternativhypothese angenommen. Es muss also davon ausgegangen werden, dass das erzielte Ergebnis nicht auf reinen Zufall zurückgeführt werden kann.



Ich bin wirklich sehr gespannt auf den zweiten Test. Wenn Textor diesen Test dann besteht, glaube ich nicht, dass die GWUP das Ergebnis schlecht machen würde. Zum einen haben sie ja die Messlatte mit einem extrem niedrigen Alpha-Wert sehr hoch angelegt, und zum anderen arbeiten sie die Verlaufspläne ihrer Test selbst mit aus.

Ich würde mir wünschen, dass Textor den Test besteht, denn dann hätte man wirklich einen guten Grund solche "Fähigkeiten" ernstzunehmen und genauer zu untersuchen.
Da ich im Rahmen der Philosophie des Geistes, von meinem momentanen Wissensstand aus gesehen, die Identitätstheorie für recht plausibel halte, würde ich persönlich damit anfangen, den Gehirnzustand während des Wünschelrutengehens zu untersuchen. Laut der Identitätstheorie sind mentale Zustände nichts anderes als Gehirnzustände. Die Fähigkeit Wasser mittels einer Wünschelrute "wahrzunehmen" bzw. "zu erspüren" wäre demnach ein Gehirnzustand...... Ich lasse den Gedanken jetzt aber mal unausgereift da stehen, weil das zu weit vom Thema wegführen würde.


Viele Grüße :)
 
Werbung:
Der Alpha-Wert wird von der GWUP mit 10^-10 angesetzt. Üblich sind für Alpha aber Werte wie z. B. 0.05 (= 5%).
Damit müsste der p-Wert wirklich extrem niedrig sein. Also auf keinen Fall 5%!

Jain. In der medizinischen Forschung sind 5% üblich. In anderen Forschungsbereichen geht man da durchaus niedriger. Es kommt dabei auch darauf an, welcher Wert im Rahmen der Statistik realistisch erreicht werden kann, wenn die Hypothese wahr sein sollte.

Und ich will nochmal ausrechnen, ob 40 oder mehr Treffer von 50 Versuchen bei einer angenommenen Zufallswahrscheinlichkeit von 0.5 wirklich einer derart niedrigem Messlatte entspricht.

--> Der Alpha-Wert wird vor dem Test festgelegt. Er ist die Schwellenhöhe für die maximal zulässige Irrtumswahrscheinlichkeit. Damit soll die Wahrscheinlichkeit, dass Herr Textor den Test besteht, obwohl er die paranormalen Fähigkeiten nicht besitzt, möglichst gering gehalten werden. Aber auch wenn bei den Tests der GWUP die Irrtumswahrscheinlichkeit wirklich verschwindend gering ist, kann ein Irrtum nicht zu 100% ausgeschlossen werden.

Der p-Wert, bzw. der zu unterbietene Alphawert sind NICHT mit der Irrtumswahrscheinlichkeit zu verwechseln. Das sind zwei unterschiedliche sog. bedingte Wahrscheinlichkeiten. Der p-Wert gibt die Wahrscheinlichkeit des Ergebnisses unter der Bedingungn der Nullhypothese an. Die Irrtumswahrscheinlichkeit ist die Wahrscheinlichkeit der Nullhypothese under der Bedingung des Ergebnisses. Diese beiden bedingten Wahrscheinlichkeiten sind über Bayes Theorem miteinnander verknüpft. Um die Irrtumswahrscheinlichkeit auszurechnen, bräuchte man dazu allerdings noch Größen, deren Wert man meist nicht kennt (zum Beispiel die a priori Wahrscheeinlichkeiz, dass die test-Hypothese wahr ist). Daher wird meist der p-Wert bzw. der Alpha-Wert als Messlatte verwendet, dessen Interpretation aber nicht überinterpretiert werden darf.

Aber es stimmt schon, ein derart niedriger Alpha-Wert ist schon eine sehr starke Messlattel. Es lässt sich zwar NIE 100% ausschließen, aber man brauch das nicht überstrapazieren. Sollte da ein reproduzierbares Ergebnis bei rauskommen, liegen methodische Mängel als Erklärung erst einmal näher als der Zufall. Dann müsste in diesem konkreten Fall geschaut werden, ob der Testkandidat irgendwie anders bemerken kann, ob nun Durckluft oder Wasser durch einen Schlauch fließt... (z.B. ob es subtil unterschiedlich klingt; das wäre so mein erster Gedanke dabei).

Ich würde mir wünschen, dass Textor den Test besteht, denn dann hätte man wirklich einen guten Grund solche "Fähigkeiten" ernstzunehmen und genauer zu untersuchen.

Es wäre jedenfalls sehr spannend, ja.
 
Zurück
Oben