Vertrauensintervalle 4 Häufige Fehler

Konfidenzintervalle sind ein wesentlicher Bestandteil der Inferenzstatistik. Wir können eine Wahrscheinlichkeit und Information aus einer Wahrscheinlichkeitsverteilung verwenden, um einen Populationsparameter unter Verwendung einer Stichprobe abzuschätzen. Die Angabe eines Konfidenzintervalls erfolgt so, dass es leicht missverstanden wird. Wir werden die korrekte Interpretation der Konfidenzintervalle untersuchen und vier Fehler untersuchen, die in Bezug auf diesen Bereich der Statistik gemacht wurden.

Was ist ein Konfidenzintervall??

Ein Konfidenzintervall kann entweder als Wertebereich oder in der folgenden Form ausgedrückt werden:

Schätzung ± Fehlergrenze

Ein Konfidenzintervall wird normalerweise mit einem Konfidenzniveau angegeben. Übliche Konfidenzniveaus sind 90%, 95% und 99%..

Wir werden uns ein Beispiel ansehen, in dem wir einen Stichprobenmittelwert verwenden möchten, um den Mittelwert einer Population abzuleiten. Angenommen, dies ergibt ein Konfidenzintervall von 25 bis 30. Wenn wir sagen, dass wir zu 95% sicher sind, dass der unbekannte Populationsmittelwert in diesem Intervall enthalten ist, dann sagen wir wirklich, dass wir das Intervall mit einer Methode gefunden haben, die erfolgreich ist 95% der Zeit korrekte Ergebnisse liefern. Langfristig wird unsere Methode in 5% der Fälle nicht erfolgreich sein. Mit anderen Worten, wir werden es nicht schaffen, die wahre Bevölkerung zu erfassen, und das bedeutet nur eines von 20 Fällen.

Fehler # 1

Wir werden uns nun eine Reihe verschiedener Fehler ansehen, die beim Umgang mit Konfidenzintervallen gemacht werden können. Eine falsche Aussage, die häufig über ein Konfidenzintervall bei einem Konfidenzniveau von 95% gemacht wird, ist, dass die Wahrscheinlichkeit, dass das Konfidenzintervall den wahren Mittelwert der Bevölkerung enthält, bei 95% liegt.

Der Grund, warum dies ein Fehler ist, ist eigentlich ziemlich subtil. Die Schlüsselidee für ein Konfidenzintervall ist, dass die verwendete Wahrscheinlichkeit mit der verwendeten Methode in das Bild eintritt. Bei der Bestimmung des Konfidenzintervalls wird die verwendete Methode verwendet.

Fehler # 2

Ein zweiter Fehler besteht darin, ein 95% -Konfidenzintervall so zu interpretieren, dass 95% aller Datenwerte in der Grundgesamtheit innerhalb des Intervalls liegen. Wiederum sprechen 95% die Testmethode an.

Um zu sehen, warum die obige Aussage falsch ist, können wir eine normale Grundgesamtheit mit einer Standardabweichung von 1 und einem Mittelwert von 5 betrachten. Eine Stichprobe mit zwei Datenpunkten mit jeweils 6 Werten weist einen Stichprobenmittelwert von 6 auf. A 95% Das Konfidenzintervall für den Populationsmittelwert wäre 4,6 bis 7,4. Dies überschneidet sich eindeutig nicht mit 95% der Normalverteilung, sodass 95% der Bevölkerung nicht betroffen sind.

Fehler # 3

Ein dritter Fehler ist zu sagen, dass ein 95% -Konfidenzintervall impliziert, dass 95% aller möglichen Stichprobenmittel in den Bereich des Intervalls fallen. Überdenken Sie das Beispiel aus dem letzten Abschnitt. Jede Stichprobe der Größe zwei, die nur Werte unter 4,6 enthielt, hätte einen Mittelwert von weniger als 4,6. Somit würden diese Abtastmittel außerhalb dieses bestimmten Konfidenzintervalls liegen. Muster, die dieser Beschreibung entsprechen, machen mehr als 5% des Gesamtbetrags aus. Es ist also ein Fehler zu sagen, dass dieses Konfidenzintervall 95% aller Stichprobenmittelwerte erfasst.

Fehler # 4

Ein vierter Fehler beim Umgang mit Konfidenzintervallen ist die Annahme, dass sie die einzige Fehlerquelle sind. Während mit einem Konfidenzintervall eine Fehlerquote verbunden ist, gibt es andere Stellen, an denen sich Fehler in eine statistische Analyse einschleichen können. Einige Beispiele für diese Art von Fehlern könnten auf eine inkorrekte Versuchsplanung, eine Verzerrung bei der Stichprobe oder die Unfähigkeit zurückzuführen sein, Daten von einer bestimmten Untergruppe der Grundgesamtheit zu erhalten.