DFIT-Distanzen

 

Das Fenster beinhaltet zwei Grafiken. In der oberen Hälfte ist die Grafik der DFIT-Werte zu sehen, darunter ist die kombinierte DFIT-Leverage-Grafik dargestellt.

 

Grafik der DFIT-Werte (DFIT: engl. Akronym für standardized differences in fits)

Die Grafik der DFIT-Werte dient der Identifizierung von ausreißerverdächtigen Beobachtungswerten. Ein großer DFIT-Wert ist ein Indiz für einen Beobachtungswert, der einen starken Einfluss auf die aus dem Modell berechneten Schätzwerte ŷ hat.

Intuitive Deutung: Zunächst berechnet man das Regressionsmodell mit allen Werten. Für den i-ten Beobachtungswert wird aus dem Modell ein Schätzwert ermittelt. Anschließend wird erneut das Regressionsmodell berechnet; diesmal allerdings ohne den i-ten Beobachtungswert. Für das neue Modell wird wieder ein Schätzwert für den i-ten Beobachtungswert ermittelt. Weichen nun die beiden Schätzwerte stark voneinander ab, so wird das einen großen DFIT-Wert zur Folge haben. Ein großer DFIT-Wert ist gleichbedeutend mit der Aussage, dass der i-te Beobachtungswert ausreißerverdächtig ist. Der DFIT-Wert ist der Cook-Distanz ähnlich, bietet jedoch gegenüber der Cook-Distanz den Vorteil, dass die Richtung der verzerrenden Wirkung auf die Schätzung zu erkennen ist.

Formel für den i-ten DFIT-Wert

 S:\DEVEL_AD\HELP\HELP_ME8\QDASGER\!SSL!\Printed_Documentation\!doc_tmp_folder_1\image68.gif

ŷi = i-ter Schätzwert aus dem Modell, welches mit dem vollständigen Datensatz berechnet wurde.

 ŷi(i)  = i-ter Schätzwert aus dem Modell, welches ohne Berücksichtigung des i-ten Beobachtungswert berechnet wurde.

s(i) = Reststandardabweichung, ohne Berücksichtigung des i-ten Beobachtungswertes.

hii = i-tes Diagonalelement der Hat-Matrix S:\DEVEL_AD\HELP\HELP_ME8\QDASGER\!SSL!\Printed_Documentation\!doc_tmp_folder_1\image70.gif 

Oberer und unterer Grenzwert für die DFIT-Werte

Die eingeblendeten Grenzwerte für die DFIT-Werte berechnen sich nach folgender Beziehung:

Oberer Grenzwert Dob =  S:\DEVEL_AD\HELP\HELP_ME8\QDASGER\!SSL!\Printed_Documentation\!doc_tmp_folder_1\image71.gif

Unterer Grenzwert Dun = - S:\DEVEL_AD\HELP\HELP_ME8\QDASGER\!SSL!\Printed_Documentation\!doc_tmp_folder_1\image71.gif

p = Anzahl der geschätzten Koeffizienten, inklusive der Konstanten

n = Stichprobenumfang

Kombinierte DFIT-Leverage-Grafik

In dieser Grafik können Sie schnell erkennen, ob einzelne Werte sowohl große Hebelwirkungen haben als auch große DFIT-Werte aufweisen. Solche Werte haben quasi zwei Indizien für die Einstufung als ausreißerverdächtiger Beobachtungswert.