IN DUBIO PRO GEO Anleitung : Informationskriterien

Informationskriterien für stochastische Modelle werden berechnet, damit Sie das optimale Modell selektieren können. Einige Rechenwerkzeuge berechnen von sich aus mehrere Modelle und listen die zugehörigen Informationskriterien auf.

Ein Informationskriterium ist ein Kriterium zur Auswahl eines Modells in der Statistik. Hat man stochastische Beobachtungen und eine Anzahl von Modellkandidaten zur Verfügung, so berechnet man für alle Kandidaten den zugehörigen Wert des Informationskriteriums. Ein niedriger Wert zeigt ein passendes Modell an. Das Modell mit dem kleinsten Wert ist am besten zu den Beobachtungen passend und sollte gewählt werden.

≡ START Erste Schritte English Definitionen

Leider gibt es in der statistischen Literatur mehrere verschiedene Definitionen für Informationskriterien. Die wichtigsten sind:

Informations-
kriterium		Formel	Symbole
Akaike	AIC	`= 2·k − 2·log(L( θ; l))`	`k` = Anzahl der Modellparameter `θ`
Akaike korrigiert	AICc	`= AIC + 2k(k+1)/(n-k-1)`	`n` = Anzahl der Beobachtungen `l`
Bayes	BIC	`= log(n)k − 2·log(L( θ; l))`	`L` = Likelihoodfunktion des Modells
			`θ` = Maximum-Likelihood-Schätzung von `θ`

Alle diese Kriterien zerfallen in einen Strafterm für die Anzahl der Modellparameter, der eine Überanpassung bestraft, und einen Modellanpassungsterm -2·log(L( θ; l)). Beachten Sie, dass zu den k Modellparametern θ auch die (Ko-)Varianzparameter (unbekannte (Ko-)Varianzfaktoren oder -komponenten) zu zählen sind. Liegen jedoch d Datumsdefekte vor, z.B. bei der freien Netzausgleichung, dann ist k um d zu verringern. Enthält das Modell zusätzlich m unabhängige Bedingungsgleichungen für Parameter, so ist k um m zu verringern.

In der Geodäsie sind Modelle mit normalverteilten Beobachtungen verbreitet. Zwei Fälle sind praktisch besonders bedeutsam:

≡ START Erste Schritte English Normalverteilte Beobachtungen - prio-Fall

In diesem Fall ist die Kovarianzmatrix Σ_l der Beobachtungen l vollständig bekannt.
Wir haben θ = x und k = u - m - d. Die Likelihoodfunktion L hat folgende Gestalt:

L( x; l) = (2π·det(Σ_l))^-1/2 exp(-(Ax− l)^TΣ_l^-1 (Ax− l)/2) =(2πσ²)^-n/2det(P)^1/2exp(-σ^-2 (Ax− l)^TP(Ax− l)/2)

Hierbei sind die Symbole aus verwendet worden. Daraus gewinnt man

- 2·log(L( x; l)) = n·log(2πσ²)− log(det(P)) + σ^-2(Ax− l)^TP (Ax− l)

Haben wir speziell den Fall, dass die Gewichtsmatrix P eine Diagonalmatrix mit den Elementen p₁, p₂, …, p_n ist, erhalten wir

- 2·log(L( x; l)) = n·log(2πσ²) − Σ log(p_i) + σ^-2(Ax− l) ^TP(Ax− l)

Die ersten beiden Summanden sind für alle Informationskriterien und Modelle gleich und könnten bei der Minimumbestimmung weggelassen werden. Wegen der Vergleichbarkeit der Werte berechnet IN DUBIO PRO GEO sie aber trotzdem mit. Zusammengefasst erhalten wir im prio-Fall:

C_prio := n·log(2πσ²)− ⅀ log(p_i)
Ω( x,l):= (Ax− l)^T P(Ax− l)
AIC_prio=2k + σ^-2Ω( x,l) + C_prio
AICc_prio=2k + 2k(k+1)/(n-k-1) + σ^-2Ω( x,l) + C_prio
BIC_prio=log(n)k + σ^-2Ω( x,l) + C_prio

≡ START Erste Schritte English Normalverteilte Beobachtungen - post-Fall

In diesem Fall enthält die Kovarianzmatrix der Beobachtungen Σ_l=σ²P^-1 einen unbekannten Varianzfaktor σ². Dieser muss ebenfalls geschätzt werden. Dadurch umfasst θ eine weitere Größe, d.h. k = u - m - d + 1. Als Schätzwert für σ² wird der (nicht erwartungstreue) Maximum-Likelihood-Schätzwert verwendet:

σ² = Ω( x,l)/n

Die neue Likelihoodfunktion lautet:

L( x,σ²; l) = (2πσ²)^-n/2det(P)^1/2 exp(-σ^-2(Ax− l)^T P(Ax− l)/2) =(2πΩ( x,l)/n)^-n/2det(P)^1/2exp(-n/2)
- 2·log(L( x,σ²; l)) = n·log(2πΩ( x,l)/n)− ⅀ log(p_i) + n

Zusammengefasst erhalten wir im post-Fall:

C_post := n·log(2π)− ⅀ log(p_i) + n
AIC_post=2k + n·log(Ω( x,l)/n) + C_post
AICc_post=2k + 2k(k+1)/(n-k-1) + n·log(Ω( x,l)/n) + C _post
BIC_post=log(n)k + n·log(Ω( x,l)/n) + C_post

Schon gewusst? Mit können Sie Messwerte auf Normalverteilung testen.

≡ START Erste Schritte English

Ausgleichungslehrbücher

Autor(en)	Titel	Jahr	Typ	Seiten MByte
Lehmann R, Lösler M	Congruence analysis of geodetic networks – hypothesis tests versus model selection by information criteria	2017	GruF	13 0.1
Lehmann R, Lösler M	Multiple Outlier Detection: Hypothesis Tests Versus Model Selection by Information Criteria	2016	GruF	11 0.1
Lehmann R, Lösler M	Multiple Outlier Detection: Hypothesis Tests Versus Model Selection by Information Criteria (postprint)	2016	GruF	11 1.1
Lehmann R	Observation error model selection by information criteria vs. normality testing	2015	GruF	16 0.1
Lehmann R	Observation error model selection by information criteria vs. normality testing (postprint)	2015	GruF	15 0.9

≡ START Erste Schritte English Anleitung : Informationskriterien

Seiteninhalt

≡ START Erste Schritte English Definitionen

≡ START Erste Schritte English Normalverteilte Beobachtungen - prio-Fall

≡ START Erste Schritte English Normalverteilte Beobachtungen - post-Fall

≡ START Erste Schritte English

≡ START Erste Schritte English In der Bibliothek