Mathematik

Statistik - Schätzung eines Bevölkerungsmittels

Schätzung eines Bevölkerungsmittels

Der grundlegendste Punkt- und Intervallschätzungsprozess beinhaltet die Schätzung eines Populationsmittelwerts. Angenommen, es ist von Interesse, den Populationsmittelwert μ für eine quantitative Variable zu schätzen. Daten, die aus einer einfachen Zufallsstichprobe gesammelt wurden, können zur Berechnung der Daten verwendet werdenProbe Mittelwert , X , wobei der Wert von x eine Punktschätzung von μ liefert.

Wenn der Stichprobenmittelwert als Punktschätzung des Populationsmittelwerts verwendet wird, können einige Ein Fehler kann erwartet werden, da eine Stichprobe oder Teilmenge der Grundgesamtheit zur Berechnung der Punktschätzung verwendet wird. Der absolute Wert der Differenz zwischen dem Stichprobenmittelwert und dem Populationsmittelwert μ, geschrieben | - μ | heißt dasStichprobenfehler . Die Intervallschätzung enthält eine Wahrscheinlichkeitsangabe über die Größe des Abtastfehlers. Die Stichprobenverteilung von bildet die Grundlage für eine solche Aussage.

Statistiker haben gezeigt, dass der Mittelwert der Stichprobenverteilung von gleich dem Populationsmittelwert μ ist und dass die Standardabweichung durch σ / Quadratwurzel von n gegeben ist , wobei σ die Populationsstandardabweichung ist. Die Standardabweichung einer Stichprobenverteilung wird als bezeichnetStandardfehler . Für große Stichprobengrößen gibt der zentrale Grenzwertsatz an, dass die Stichprobenverteilung von durch eine normale Wahrscheinlichkeitsverteilung angenähert werden kann . In der Praxis betrachten Statistiker Stichproben mit einer Größe von 30 oder mehr normalerweise als groß.

Im Fall einer großen Stichprobe wird eine 95% -Konfidenzintervallschätzung für den Populationsmittelwert durch ± 1,96σ / Quadratwurzel von n angegeben . Wenn die Populationsstandardabweichung σ unbekannt ist, wird die Stichprobenstandardabweichung verwendet, um σ in der Konfidenzintervallformel zu schätzen. Die Größe 1,96σ / Quadratwurzel von n wird oft als bezeichnetFehlerquote für die Schätzung . Die Größe σ / Quadratwurzel von n ist der Standardfehler, und 1,96 ist die Anzahl der Standardfehler aus dem Mittelwert, der erforderlich ist, um 95% der Werte in eine Normalverteilung einzubeziehen . Die Interpretation eines 95% -Konfidenzintervalls lautet, dass 95% der auf diese Weise konstruierten Intervalle den Populationsmittelwert enthalten. Somit hat jedes auf diese Weise berechnete Intervall eine 95% ige Sicherheit, den Populationsmittelwert zu enthalten. Durch Ändern der Konstantevon 1,96 bis 1,645 kann ein 90% -Konfidenzintervall erhalten werden. Aus der Formel für eine Intervallschätzung sollte hervorgehen, dass ein 90% -Konfidenzintervall enger als ein 95% -Konfidenzintervall ist und als solches ein etwas geringeres Vertrauen in die Einbeziehung des Populationsmittelwerts aufweist. Geringere Vertrauensniveaus führen zu noch engeren Intervallen. In der Praxis wird am häufigsten ein 95% -Konfidenzintervall verwendet.

Aufgrund des Vorhandenseins des n 1/2 -Terms in der Formel für eine Intervallschätzung beeinflusst die Stichprobengröße die Fehlerquote. Größere Stichproben führen zu kleineren Fehlergrenzen. Diese Beobachtung bildet die Grundlage für Verfahren zur Auswahl der Stichprobengröße. Die Stichprobengrößen können so gewählt werden, dass das Konfidenzintervall alle gewünschten Anforderungen an die Größe der Fehlergrenze erfüllt.

Das soeben beschriebene Verfahren zum Entwickeln von Intervallschätzungen eines Populationsmittelwerts basiert auf der Verwendung einer großen Stichprobe. Im Fall einer kleinen Stichprobe, dh wenn die Stichprobengröße n kleiner als 30 ist, wird die t- Verteilung verwendet, wenn die Fehlergrenze angegeben und eine Konfidenzintervallschätzung erstellt wird. Beispielsweise würde bei einem Konfidenzniveau von 95% ein Wert aus der t- Verteilung, der durch den Wert von n bestimmt wird, den aus der Normalverteilung erhaltenen Wert von 1,96 ersetzen. Die t- Werte sind immer größer, was zu größeren Konfidenzintervallen führt, aber wenn die Stichprobengröße größer wird, wird das tWerte nähern sich den entsprechenden Werten einer Normalverteilung an. Bei einer Stichprobengröße von 25 würde der verwendete t- Wert 2,064 betragen, verglichen mit dem normalen Wahrscheinlichkeitsverteilungswert von 1,96 im Fall einer großen Stichprobe.

Schätzung anderer Parameter

Zum qualitative Variablen , dieBevölkerungsanteil ist ein interessierender Parameter . Eine Punktschätzung des Bevölkerungsanteils ergibt sich aus demStichprobenanteil. Mit Kenntnis der Stichprobenverteilung des Stichprobenanteils wird eine Intervallschätzung eines Bevölkerungsanteils auf die gleiche Weise wie für einen Bevölkerungsdurchschnitt erhalten. Punkt- und Intervallschätzverfahren wie diese können auf andere Population angewendet werden Parameter als auch. Zum Beispiel Intervallschätzung einer Population Varianz , Standardabweichung und insgesamt kann in anderen Anwendungen erforderlich sein.

Schätzverfahren für zwei Populationen

Die Schätzverfahren können für Vergleichsstudien auf zwei Populationen erweitert werden. Angenommen, es wird eine Studie durchgeführt, um Unterschiede zwischen den Gehältern für Männer und Frauen zu ermitteln. Zwei unabhängige einfache Zufallsstichproben, eine aus der Bevölkerung von Männern und eine aus der Bevölkerung von Frauen, würden zwei Stichprobenmittel liefern, 1 und 2 . Die Differenz zwischen den beiden Stichprobenmitteln 1 - 2 würde als Punktschätzung der Differenz zwischen den beiden Populationsmitteln verwendet. Die Stichprobenverteilung von 1 - 2würde die Grundlage für eine Konfidenzintervallschätzung der Differenz zwischen den beiden Populationsmitteln liefern. Für qualitative Variablen können Punkt- und Intervallschätzungen der Differenz zwischen Bevölkerungsanteilen unter Berücksichtigung der Differenz zwischen Stichprobenanteilen erstellt werden.