http://www.welt.de/wissenschaft/art...tengaenger-liegt-verdaechtig-oft-richtig.html
Der Wünschelrutengänger Bernd Textor lag beim GWUP-Test in 36 von 50 Fällen richtig und schrammte damit knapp am Preis vorbei. Als Zufallsereignis ist dieses Ergebnis in etwa so wahrscheinlich wie ein Fünfer im Lotto, daher soll der Test wiederholt werden.
Ich gehe davon aus, dass die GWUP das Ergebnis auch dann nicht anerkennen würde, wenn er es fünfzigmal hintereinander erzielte - notfalls kann sie sich immer noch in Betrugsvorwürfe flüchten -, aber sollte Textor es wiederholen können, dürften weniger befangene Wissenschaftler aufhorchen.
Bin ein bisschen gespannt.
Ja, sehr spannend.
Sollte er das Ergebnis reproduzieren können, wären zwar Betrugsvorwürfe theoretisch möglich, aber dabei ist auch zu beachten, dass die GWUP die Tests mit-entwirft. Der Betrug, falls es einer wäre, wäre also so geschickt und subtil, dass er an den skeptischen Betrachtern der GWUP vorbei noch funktioniert. Und alleine das wäre schon das Preisgeld wert.
Sollte er wiederholt diese Trefferquote oder eine höhere schaffen, so würde ich persönlich nicht unbedingt an Betrugsabsicht glauben, und ich denke, die GWUP auch nicht. Allerdings wäre das für mich auch noch nicht unbedingt ein Beweis, dass an Wünschelruten-Gehen, Erdstrahlen etc. doch etwas dran wäre. Vielmehr würde ich zuerst eine subtile noch nicht erkannte Schwäche im Test-Design vermuten - etwas in der Art, dass z.B. Druckluft oder Wasser im Schlauch subtil unterschiedlich klingt, was der Testkandidat unbewusst wahrnehmen könnte. Nachfolgestests, bei denen dann auch versuch wird, sowas weiter zu berücksichtigen, wären auf jeden Fall gerechtfertigt. Und, sollte das Resultat all sowas überstehen... DAS wäre dann eine sensationelle Entdeckung.
Ich möchte hierbei nochmal auf die Messlatte eingehen, die bei solchen Tests bzw. bei fast allen statistischen Auiswertungen in der Wissenschaft verwendung findet. Hier wird meist der sog. p-Wert verwendet: Die Wahrscheinlichkeit, dass das Ergebnis unter Annahme der Nullhypothese eintritt. Es wird vorher festgelegt, welcher p-Wert unterschritten werden soll, und, wenn das geschieht, nennt man das dann "statistisch signifikant". In medizinischen Studien wird oft die Messlatte auf 5% gesetzt. Das heißt allerdings auch, dass 5% aller derartigen Studien zu einem Nicht-Effekt ein falsch-positives Ergebnis liefern. In der Physik wird meist die sog. "5-Sigma"-Grenze angenommen. Die ist wesentlich strenger als in der Medizin. Die Wahrscheinlichkeit diese Grenze durch Zufall zu knacken ist in etwa 1 zu 3.5 Millionen. Durch die größeren Datenmengen, die in der Physik genommen werden können, ist das allerdings eine realistische grenze für echte Effekte. Die Messlatte der GWUP liegt irgendwo dazwischen, glaube ich... ich müsste es mal ausrecchnen.
Dieser p-Wert ist allerdings NICHT mit der Wahrscheinlichkeit zu identifizieren, dass das erzielte Ergebnis durch Zufall entstanden ist. Es ist ein subtiler aber wichtiger Unterschied der Wahrscheinlichkeit in Annahme der Nullhypothese ein Ergebnis zu erzielen (der p-Wert) und der Wahrscheinlichkeit, dass die Nullhypothese zutrifft, unter Vorgabe eines bestimmten Ergebnisses (also die Wahrscheinlichkeit, dass es ein falsch-positives Ergebnis ist). Es sind zwei verschiedene bedingte Wahrscheinlichkeiten, die durch Bayes Theorem miteinander verknüpft aber nicht identisch sind. Der p-Wert lässt sich relativ einfach ausrechnen, die Wahrscheinlichkeit, dass die Nullhypothese noch zu trifft - was die wesentlich bessere messlatte wäre - allerdings nicht so leicht oder gar nicht. Der p-Wert ist deswegen als Messlatte schon mehrfach in Kritik geraten - und das nicht nur in den Grenzberechen der Wissenschaften, sondern in allen Bereichen. (Siehe z.B.
http://www.spektrum.de/magazin/der-fluch-des-p-werts/1303092 und bzw. den konpletten Heft-Artikel dazu in Ausgabe 9/2014)