Das Fenster beinhaltet zwei Grafiken. In der oberen Hälfte ist die Grafik der DFIT-Werte zu sehen, darunter ist die kombinierte DFIT-Leverage-Grafik dargestellt.
Grafik der DFIT-Werte (DFIT: engl. Akronym für standardized differences in fits)
Die Grafik der DFIT-Werte dient der Identifizierung von ausreißerverdächtigen Beobachtungswerten. Ein großer DFIT-Wert ist ein Indiz für einen Beobachtungswert, der einen starken Einfluss auf die aus dem Modell berechneten Schätzwerte ŷ hat.
Intuitive Deutung: Zunächst berechnet man das Regressionsmodell mit allen Werten. Für den i-ten Beobachtungswert wird aus dem Modell ein Schätzwert ermittelt. Anschließend wird erneut das Regressionsmodell berechnet; diesmal allerdings ohne den i-ten Beobachtungswert. Für das neue Modell wird wieder ein Schätzwert für den i-ten Beobachtungswert ermittelt. Weichen nun die beiden Schätzwerte stark voneinander ab, so wird das einen großen DFIT-Wert zur Folge haben. Ein großer DFIT-Wert ist gleichbedeutend mit der Aussage, dass der i-te Beobachtungswert ausreißerverdächtig ist. Der DFIT-Wert ist der Cook-Distanz ähnlich, bietet jedoch gegenüber der Cook-Distanz den Vorteil, dass die Richtung der verzerrenden Wirkung auf die Schätzung zu erkennen ist.
Formel für den i-ten DFIT-Wert
ŷi = i-ter Schätzwert aus dem Modell, welches mit dem vollständigen Datensatz berechnet wurde.
ŷi(i) = i-ter Schätzwert aus dem Modell, welches ohne Berücksichtigung des i-ten Beobachtungswert berechnet wurde.
s(i) = Reststandardabweichung, ohne Berücksichtigung des i-ten Beobachtungswertes.
hii = i-tes Diagonalelement der Hat-Matrix
Oberer und unterer Grenzwert für die DFIT-Werte
Die eingeblendeten Grenzwerte für die DFIT-Werte berechnen sich nach folgender Beziehung:
Oberer Grenzwert Dob =
Unterer Grenzwert Dun = -
p = Anzahl der geschätzten Koeffizienten, inklusive der Konstanten
n = Stichprobenumfang
Kombinierte DFIT-Leverage-Grafik
In dieser Grafik können Sie schnell erkennen, ob einzelne Werte sowohl große Hebelwirkungen haben als auch große DFIT-Werte aufweisen. Solche Werte haben quasi zwei Indizien für die Einstufung als ausreißerverdächtiger Beobachtungswert.