switch to english START Anleitung Einstellungen Zeitleiste Ein Problem melden Wikipedia Link Seitenende

Anleitung : Wiederholungsmessungen

Seiteninhalt

Empirische Streuungsmaße, Schiefe und Exzess-Kurtosis Normalverteilungsplot Erläuterungen zu den statistischen Tests Anderson-Darling-Test auf Normalverteilung Beispiel: Wiederholte Höhenbestimmung eines Punktes Beispiel: Probieren Sie dieses Rechenwerkzeug mit normalverteilten Pseudozufallszahlen aus Beispiel: Probieren Sie dieses Rechenwerkzeug mit anderen Pseudozufallszahlen aus Auch interessant In der Bibliothek

In der Geodäsie und in anderen messenden Disziplinen wird eine Größe oft mehrmals unter denselben äußeren Bedingungen gemessen, um die Genauigkeit und Zuverlässigkeit zu erhöhen. Es wird angenommen, dass sich die Messwerte nur durch zufällige Messabweichungen unterscheiden. Solche Messwerte werden umfassend ausgewertet, einschließlich sämtlicher anwendbarer statistischer Tests. Statt geodätischer Messwerte können auch alle anderen Zufallsstichproben ausgewertet werden.

Empirische Streuungsmaße, Schiefe und Exzess-Kurtosis

Histogramm der Messwerte
Histogramm der Messwerte

Der Quartilabstand (auch Interquartilabstand) ist der Abstand des ersten und dritten Quartils (Viertelwerts). Innerhalb dieses Intervalls liegen 50% aller Werte einer Größe. Für die Berechnung des Quartilabstands werden mindestens 12 Messwerte benötigt.

Die Schiefe zeigt an, wie symmetrisch oder unsymmetrisch die Messwert-Verteilung ist. Schiefe < 0: linksschief, = 0: symmetrisch, > 0: rechtsschief.

Die Exzess-Kurtosis zeigt an, wie flach- oder steilgipflig die Messwert-Verteilung ist, im Vergleich zur Normalverteilung. Exzess-Kurtosis < 0: flachgipflig, = 0: normale Form (Gauß-Glocke), > 0: steilgipflig.

Normalverteilungsplot

Abweichungen von der Normalverteilung
Abweichungen von der Normalverteilung (von links nach
rechts): rechtsschief, linksschief, steilgipflig, flachgipflig

Dieser Plot stellt eine schnelle graphische Methode dar, um bei den Wiederholungsmessungen Abweichungen von der Normalverteilung festzustellen. Auf der horizontalen Achse sind die Messwerte aufgetragen und auf der vertikalen Achse die Mediane der zugehörigen normalen Ordnungsstatistiken. Im Falle einer Normalverteilung müssten alle Punkte etwa auf einer Geraden liegen. Abweichungen davon können auf unsymmetrische (schiefe) oder steilgipflige, d.h. endlastige, oder flachgipflige Verteilungen hindeuten. Isoliert liegende Punkte links unten oder rechts oben in der Graphik sind ausreißerverdächtig.

Erläuterungen zu den statistischen Tests

Die Messwerte werden als unabhängige Realisierungen einer normalverteilten Zufallsvariable betrachtet. Wenn die Messwerte nur näherungsweise einer Normalverteilung folgen, liefern einige Tests immer noch korrekte Ergebnisse, wenn die Zahl der Messwerte nicht zu gering ist. Korrelationen würden das Ergebnis verfälschen.

Obwohl für die Messwerte alle möglichen Tests nacheinander berechnet werden, wäre es nicht korrekt , die Ergebnisse mehrerer Tests gleichzeitig zu benutzen, ohne die Wahrscheinlichkeit für Entscheidungsfehler erster Art α anzupassen. Möchte man mit denselben Messwerten einen multiplen Test durchführen, z.B. einen Ausreißertest und sodann einen Test des Erwartungswertes, dann muss berücksichtigt werden, dass die Gesamtwahrscheinlichkeit für Entscheidungsfehler erster Art α größer wird. Im einfachsten Fall von nahezu unabhängigen multiplen Teststatistiken muss nach der Bonferroni-Gleichung die gewünschte Gesamtwahrscheinlichkeit durch die Anzahl der Einzeltests dividiert werden, um zur für jeden Einzeltest einzustellenden Wahrscheinlichkeit α zu gelangen.

Alle Tests werden berechnet, die theoretisch berechenbar sind, selbst wenn ein anderer Test wahrscheinlich eine bessere Entscheidung herbeiführen würde. Beispiel : Ist die Standardabweichung der Messwerte a priori korrekt bekannt, führt der w-Test nach Baarda häufiger eine richtige Entscheidung als der Pope-Test und der Gauß-Test wahrscheinlich eine bessere Entscheidung als der t-Test herbei.

Annahmebereich: Die Nullhypothese Ho wird angenommen, wenn die Teststatistik

zweiseitiger Test
beim zweiseitigen Test zwischen die kritischen Werte c1,c2 fällt.
rechtsseitiger Test
beim rechtsseitigen Test den kritischen Wert c2 unterschreitet.
linksseitiger Test
beim linksseitigen Test den kritischen Wert c1 überschreitet.

Testverteilungen

N(μ,σ) Normalverteilung mit Erwartungswert μ und Standardabweichung σ
t(r) t-Verteilung mit r Freiheitsgraden
τ(r) τ-Verteilung mit r Freiheitsgraden
χ²(r) χ²-Verteilung mit r Freiheitsgraden
F(r,r') F-Verteilung mit r und r' Freiheitsgraden

Anderson-Darling-Test auf Normalverteilung

Dieser Test überprüft für die Messwerte die Hypothese der Normalverteilung. Die Teststatistik bewertet die Differenz zwischen der empirischen Verteilung der Stichprobe und der Normalverteilung und gibt dabei mehr Gewicht auf die Enden der Verteilung, als klassische Tests wie z.B. der Cramér–von-Mises Test.
Wenn Parameter der Verteilung μ0 und/oder σ0 a priori bekannt sind, werden diese im Test benutzt.

Beispiel: Wiederholte Höhenbestimmung eines Punktes

Jährlich im dritten Semester werden im Studiengang Vermessung/ Geoinformatik der Hochschule für Technik und Wirtschaft Dresden von jedem Studierenden tachymetrische Bestimmungen derselben Punkte vorgenommen. Diese können als unabhängige Wiederholungsmessungen angesehen werden. In den Jahren 2010 und 2011 wurden für einen ausgewählten Punkt folgende Ergebnisse erhalten:

JahrBestimmungen der Punkthöhe, Einheit=Meter
2010 116.774 116.755 116.755 116.751 116.742 116.745 116.760 116.754 116.753 116.739 116.752 116.747 116.732 116.752 116.736 116.764 116.738 116.765 116.757 116.750 116.741 116.759 116.751 116.753 116.734 116.737 116.757 116.730 116.755
2011 116.764 116.748 116.758 116.743 116.757 116.659 116.744 116.754 116.761 116.762 116.769 116.741 116.747 116.738 116.744 116.750 116.746 116.736 116.760 116.762 116.760 116.756 116.739 116.754 116.728 116.745 116.737 116.750

Der Punkt hat im Übungnetz die bekannte Soll-Höhe 116.767 m . Von den Studierenden kann trotz fehlender Routine eine Bestimmung der Punkthöhe mit einer Standardabweichung von σo=0.01 m erwartet werden. Die Wiederholungsmessungen sollen mit einer Wahrscheinlichkeit für Entscheidungsfehler erster Art von α=0.05 statistisch getestet werden.

und Rechnen

Der ⇑ Normalverteilungsplot zeigt die Verteilung der Messwerte (Punkte) relativ zu einer am besten passenden Normalverteilung (Gerade) an. Sofort fällt auf, dass links unten ein roter (=2011) Punkt insoliert liegt. Dieser zeigt eindeutig einen Ausreißer an.
Die restlichen Punkte streuen etwa um die blaue (=2010) Gerade. Im mittleren Bereich der Punkte (rund um den Median) liegen die blauen (=2010) Punkte etwas weiter rechts, als die roten (=2011). Der Median der 2010er Messwerte ist also größer, nämlich um 3 mm.

Zunächst kann man untersuchen, ob die geforderte Messgenauigkeit erreicht wurde, ob also Ho:σ≤σo anzunehmen ist. Das überprüft der linksseitige Globaltest , der bei der Messreihe Jahr 2011 abgelehnt wird. Also wurde die Messgenauigkeit hier wahrscheinlich nicht erreicht. Genauer gesagt, die Wahrscheinlichkeit, dass die Messgenauigkeit erreicht und der Globaltest trotzdem abgelehnt wurde, beträgt weniger als α=0.05.

Auch der w-Test nach Baarda zeigt für Jahr 2011 einen Ausreißer an. Dies ist der Messwert 116.659, der am weitesten vom Mittelwert entfernt liegt. Eliminiert man diesen Wert und wiederholt die Auswertung, wird sowohl der linksseitige Globaltest, als auch der w-Test angenommen. Allerdings könnte irritieren, dass auch der rechtsseitige Globaltest Ho:σ≥σo angenommen wird. Die Ursache für dieses Phänomen ist folgende: Wenn α klein genug gewählt wird, werden alle Nullhypothesen letztlich angenommen. Und für nur wenige Messwerte ist α=0.05 praktisch schon sehr klein.

Wäre σo=0.01 nicht bekannt gewesen, hätte man den Ausreißer hier auch mittels τ-Test nach Pope aufdecken können.

Die Standardabweichungen einer einzelnen Bestimmung der Punkthöhe werden jetzt a posteriori mit 0.0107 m für Jahr 2010 und 0.0102 m für Jahr 2011 ermittelt. Die Antwort auf die Frage, ob nach Eliminierung des Ausreißers die Messgenauigkeiten beider Jahre als gleich zu bewerten sind, liefert der zweiseitige F-Test mit Hoxy. Diese Hypothese wird angenommen, also war die Genauigkeit im Jahr 2011 nicht signifikant höher.

Die Mittelwerte betragen 116.7496 m für Jahr 2010 und 116.7501 m für Jahr 2011. Die Antwort auf die Frage, ob nach Eliminierung des Ausreißers die Erwartungswerte beider Messreihen als gleich zu bewerten sind, liefert der Zweistichproben-Gauß-Test mit Hoxy . Diese Hypothese wird angenommen, also sind die Erwartungswerte als gleich zu betrachten.

Die Hypothese, dass der als Sollhöhe des Punktes bisher verwendete Wert μo=116.767 mit den Mittelwerten identisch ist, ist Gegenstand des zweiseitigen Einstichproben-Gauß-Tests mit Ho:μ=μo . Diese Hypothese wird für beide Jahre abgelehnt. Die Schlussfolgerung könnte lauten, dass die Sollhöhe nicht korrekt ist, oder dass in beiden Jahren dieselben systematischen Messabweichungen aufgetraten. In diesem Fall ist nur denkbar, dass eine in allen Bestimmungen gemeinsam verwendete Anschlusshöhe falsch war und dies bei der Stationshöhenbestimmung nicht auffiel.

Da beide Messreihen keine signifikanten Unterschiede aufweisen, kann man diese zu einer Messreihe vereinen und die Auswertung wiederholen:

und Rechnen

Genau wie in allen bisherigen Fällen wird die Sollhöhe μo=116.767 zurückgewiesen. Dieser Wert ist entweder nicht korrekt oder wurde systematisch falsch erhalten. Außerdem wird die ⇑ Hypothese der Normalverteilung mit dem Parameter μo=116.767 abgelehnt. Ohne diesen Parameter ist der Anderson-Darling-Test erfolgreich.

Beispiel: Probieren Sie dieses Rechenwerkzeug mit normalverteilten Pseudozufallszahlen aus

Zwei Reihen normalverteilter Pseudozufallszahlen N(53.06;16.10) aus ▷ www.random.org/gaussian-distributions

und Rechnen

Beispiel: Probieren Sie dieses Rechenwerkzeug mit anderen Pseudozufallszahlen aus

Eine Reihe Laplace-verteilter und eine Reihe χ²(1)-verteilter Pseudozufallszahlen, je 100 Werte, berechnet mit ▷ GNU Octave werden untersucht. Die wahren Parameter dieser Verteilungen sind

ReiheErwartungswertMedianStandardabw.QuartilabstandSchiefeExzess-Kurtosis
Laplace 00 1.4141.3860 3
χ²(1)10.4551.4141.2222.82812
und Rechnen

Auch interessant

Wiederholungsmessungen
Vermittelnde Ausgleichung
Kritische Werte für Hypothesentests
Erste Schritte
Vermittelnde Ausgleichung
Satzmessungen
Suche

In der Bibliothek

 
Link Autor(en)TitelJahr Typ Seiten
MByte
PDF: offener ZugriffLehmann RGeodätische Messabweichungen2016Lehr36
1
PDF: offener ZugriffFoppe KFehlerlehre und Statistik2015Lehr94
0.8
PDF: offener ZugriffVermeer MStatistical methods in geodesy2015Lehr112
0.1
PDF: beschränkter ZugriffLehmann ROn the formulation of the alternative hypothesis for geodetic outlier detection2013GruF14
0.1
PDF: offener ZugriffLehmann ROn the formulation of the alternative hypothesis for geodetic outlier detection (postprint)2013GruF20
1.3
PDF: offener ZugriffFoppe KRepetorium zur Fehlerlehre und Statistik und Ausgleichungsrechnung2009Lehr87
1.9
PDF: beschränkter ZugriffLehmann RDas arithmetische Mittel von Mehrfachmessungen unter Wiederholbedingungen2008GruF5
0.1
PDF: offener ZugriffKoch KRParameterschätzung und Hypothesentests in linearen Modellen2004GruF382
1.7
PDF: offener ZugriffTanizaki HComputational Methods in Statistics and Econometrics2004Lehr512
5.5
©Rüdiger Lehmann    Impressum
27.05.2017 19:25 (Zeitzone Berlin)
START Anleitung r.lehmann@htw-dresden.de Seitenanfang HTW Dresden, Fakultät Geoinformation