Das Konfidenzintervall oder auch Vertrauensintervall ist ein Bereich in dem aus einer Stichprobe geschätzte Werte mit eine bestimmten Wahrscheinlichkeit liegen. In den meisten Fällen möchte man einen Bereich angeben in dem mit sehr großer Wahrscheinlichkeit der gesuchte Wert liegt bzw. liegen darf. Sollte der Wert außerhalb liegen ist die Wahrscheinlichkeit sehr gering, dass die Schätzung zu der Annahme passt.
Beispiel
Bei einer Befragung von 20 Unternehmen der Region geben 8 an, dass sie mit fallenden Gewinnen im laufenden Jahr rechnen. Jetzt stellt sich die Frage, wie sich die gesamten Unternehmen der Region verhalten.
Der erste Schritt ist es den Erwartungswert zu bestimmen.
E(X)=μ=n⋅p=8
In diesem Fall gilt besonderes Interesse dem Wert der Wahrscheinlichkeit p.
p^=nμ=208=0,4
p^ ist der beste Schätzer für die Wahrscheinlichkeit. Für den Erwartungswert gilt: p^=nE(X)=E(nX)
Als nächstes kann man die Standartabweichung durch die Varianz bestimmen.
Hierbei soll nicht Var(X)=n⋅p⋅(1−p) sondern Var(p^)=Var(nX) bestimmt werden.
SD(p^)=Var(p^)=Var(nX)=n21Var(X)
(Vergleiche die Berechnung mit der Herleitung Varianz des Mittelwerts).
In Abhängigkeit der Standartabweichung kann ein Bereich bestimmt werden, in dem mit einer bekannten Sicherheit der gesuchte Wert liegt. Hierzu ist es die folgenden Zusammenhänge:
Im Intervall der Abweichung ±σ vom Erwartungswert sind 68,27 % aller Messwerte zu finden.
Im Intervall der Abweichung ±2σ vom Erwartungswert sind 95,45 % aller Messwerte zu finden.
Im Intervall der Abweichung ±3σ vom Erwartungswert sind 99,73 % aller Messwerte zu finden.
Jetzt Ergeben sich Konfidenzintervalle um den Erwartungswert von c⋅σ mit c=1;2;3:
pu=p^−c⋅n1⋅p⋅(1−p)
po=p^+c⋅n1⋅p⋅(1−p)
In diesem fall für ein Intervall [0,18;0,62] für eine 2σ Umgebung (95%). Es ist davon auszugehen, dass der wirkliche Anteil, an Unternehmen die an fallende Gewinne denken, in diesem Bereich liegt.
Erweiterung der Idee
Da es weitere Bereiche gibt die von Interesse sind und die angegebenen σ-Umgebungen gerade bei kleinen Stichproben ungenau sind, Ist es sinnvoll eine andere Rechenmethode zur Verfügung zu haben. Hier nutzt man die Umkehrfunktion der zugrundeliegenden Verteilung.
Hier wird die Inverse der kumulative Binomialverteilung InvBCD(P;n;p)=k verwendet. Mit dieser kann man die Quantielsgrenzen bestimmen, vor denen ein entsprechender Anteil an möglichen Ergebnissen liegt. Hier wäre es: