Polynome (nur bei quasilinearer Regression sichtbar)
Das Auswahlfeld Polynome ist für das Hinzufügen von Koeffizienten für quadratische, kubische und weitere Effekte höheren Grades gedacht. Diese Funktionalität steht allerdings nur bei der einfachen und mehrfachen quasilinearen Regression zur Verfügung.
Um Koeffizienten für die Effekte höheren Grades in das Modell aufzunehmen, aktivieren Sie die zugehörigen Checkboxen mit der Maus. Durch einen weiteren Mausklick wird die Checkbox wieder deaktiviert und der zugehörige Koeffizient aus dem Modell entfernt. Das Modell kann auch manuell angepasst werden. Klicken Sie dazu auf die Schaltfläche manuelle Auswahl (Beschreibung folgt weiter unten).
Normierung
Dieses Auswahlfeld steht zur Verfügung, wenn Grenzwerte für die lineare Transformation (Fenster Daten) eingegeben worden sind.
Wählt man entsprechend Eingabe, so erfolgt die lineare Transformation derart, dass der kleinste Merkmalswert dem unteren eingegeben Grenzwert Eun und der größte Merkmalswert dem oberen eingegebenen Grenzwert Eob entspricht.
Bei der Normierung auf min./max. Werte entspricht der kleinste Merkmalswert dem unteren Grenzwert Eun = -1 und der größte Merkmalswert dem oberen Grenzwert Eob = +1.
Schrittweiser Abbau (t-Test)
Diese Funktionalität ist nur bei der mehrfachen Regression verfügbar. Mit dem schrittweisen Abbau werden nicht signifikante Modellterme aus dem Modell entfernt.
Das Abbau-Prinzip in Kürze:
Zunächst wird vom Rechner das Regressionsmodell mit allen Koeffizienten – gemäß dem gewählten Ansatz - berechnet. Für jeden Koeffizienten wird eine Prüfgröße t berechnet und ein t-Test auf Signifikanz durchgeführt (Beschreibung der Prüfgröße siehe weiter unten unter Ergebnistabelle). Von allen Koeffizienten, die als nicht signifikant eingestuft wurden, wird der Koeffizient mit dem kleinsten t-Wert ausgewählt und aus dem Modellansatz entfernt. Danach wird das Modell erneut berechnet und das Verfahren wiederholt. Der schrittweise Abbau wird üblicher Weise so lange fortgesetzt, bis nur noch signifikante Koeffizienten übrig sind.
Es gibt zwei Varianten des schrittweisen Abbaus: eine manuelle und eine automatisierte Durchführung des Verfahrens.
Manuelle Durchführung des schrittweisen Abbaus
Die erste Variante funktioniert buchstäblich schrittweise:
Mit jedem Mausklick auf das Icon wird jeweils genau ein einziger
Modellterm entfernt (sofern dieser nicht signifikant ist).
Automatisierte Durchführung des schrittweisen Abbaus
Geben Sie zunächst das gewünschte Vertrauensniveau für den
t-Test ein. Anschließend vollziehen Sie einen Mausklick auf dem Icon . Dadurch wird der schrittweise Abbau solange
durchgeführt, bis nur noch signifikante Koeffizienten übrig sind. Das heißt, Sie
erhalten sofort das Endergebnis ohne die Zwischenergebnisse.
Mit einem Mausklick auf das Icon wird der schrittweise Abbau – stets
vollständig - rückgängig gemacht.
Manuelle Auswahl
Möchten Sie die Koeffizientenauswahl ihres Modells manuell anpassen, so klicken Sie auf die Schaltfläche. Daraufhin erscheint das Fenster Auswahl bearbeiten. In diesem Fenster können Sie manuell die Modellkoeffizienten an- und abschalten, indem Sie mit der Maus auf die entsprechenden Felder in der Spalte Auswahl klicken.
Koeffizienten
Das Fenster enthält mehrere Berechnungsergebnisse, die in Spalten angeordnet sind. In der Überschrift befindet sich der berechnete Wert des Korrelationskoeffizienten r und der Wert des Bestimmtheitsmaßes B. Darunter befinden sich, nach Spalten geordnet, folgende Angaben.
• Merkm.: Die vom Benutzer vergebene Merkmalsnummer.
• Merkm. Bez.: Die Bezeichnung des Merkmals.
• xi : Der Typ des geschätzten Koeffizienten, wie z.B. Konstante, Wechselwirkung, etc.
• bi : Die aus der Stichprobe berechneten Schätzwerte für die Koeffizienten
• bi : Der zweiseitige 95%-Vertrauensbereich des geschätzten Modellkoeffizienten
• sci : Die Standardabweichung des geschätzten Koeffizienten
• |ti| : Der Betrag der Prüfgröße t des durchgeführten t-Tests für den Koeffizienten
• |ti| : Die Balkengrafik des Testergebnisses des t-Tests für den Koeffizienten
(H0: Der Wert des Koeffizient der Grundgesamtheit ist 0 versus
H1: Der Wert des Koeffizienten der Grundgesamtheit ist ungleich 0)
• VIF: Der Wert des Varianzeninflationsfaktors des Merkmals
Schätzwerte für die Koeffizienten bi
Die aus der Stichprobe berechneten Werte bi der Koeffizienten des Regressionsmodells sind Schätzwerte für die „wahren“ Koeffizienten ßi des Modells der Grundgesamtheit. Die folgende Formel stellt in Matrix-Schreibweise die Berechnung der Schätzwerte des linearen Modells dar.
b = Vektor der Modellkoeffizienten
X = Matrix der Einflussgrößen
Y = Vektor der Beobachtungswerte der Zielgröße
Individuelle zweiseitige 95%-Vertrauensbereiche für die Koeffizienten bi
Dargestellt sind die Zahlenwerte des zweiseitigen 95%-Vertrauensbereiches für jeden einzelnen Koeffizienten ßi. Rechnerisch erhält man für den i-ten Koeffizient bi die untere Vertrauensbereichsgrenze bun und die obere Vertrauensbereichsgrenze bob wie folgt:
bi= Schätzwert des i-ten Koeffizienten aus der Stichprobe
sci = Standardabweichung des i-ten Koeffizienten
n = Stichprobenumfang
p = Anzahl geschätzter Koeffizienten, inklusive der Konstanten
t = Quantil der t-Verteilung mit f = n-p Freiheitsgraden
Standardabweichung sci des geschätzten Koeffizienten
Die Standardabweichungen der geschätzten Koeffizienten erhält man aus der Varianz-Kovarianz-Matrix Var(b), die hier in Matrix-Schreibweise dargestellt ist:
s² = Restvarianz, also der Anteil der Gesamtstreuung der Zielgrößenwerte, der nicht durch das Regressionsmodell erklärt werden kann.
Y = Vektor der tatsächlich beobachteten Zielgrößenwerte
Ŷ = Vektor der aus dem Regressionsmodell geschätzten Zielgrößenwerte
n = Stichprobenumfang
p = Anzahl der geschätzten Koeffizienten, inklusive der Konstanten
Die Diagonalelemente der Varianz-Kovarianz-Matrix Var(b) sind die Varianzen der Koeffizienten. Die positive Quadratwurzel dieser Diagonalelemente entspricht den Standardabweichungen der Koeffizienten, deren Werte in der Ergebnismaske dargestellt sind.
Betrag der Prüfgröße t für den t-Test
Die wahren Koeffizienten könnten auch den Wert ßi = 0 haben. Um dies zu prüfen, wird ein t-Test durchgeführt (siehe nächster Abschnitt). Der Betrag der Prüfgröße ti ergibt sich nach folgender Beziehung:
bi = Schätzwert des i-ten Koeffizienten aus der Stichprobe
ßi = Vorgabewert für den i-ten Wert des Koeffizienten der Grundgesamtheit (hier: ßi = 0)
sci = Standardabweichung des i-ten Koeffizienten
Balkengrafik des Testergebnisses von dem t-Test
Auf der Basis der zuvor errechneten Prüfgröße wird der t-Test durchgeführt. Basis für den Test ist die nachfolgend dargestellte Kombination aus Null- und Alternativhypothese.
H0: ßi = 0 versus H1: ßi ≠ 0.
In der Balkengrafik sind drei rot eingefärbte, senkrechte Linien zu sehen. Diese repräsentieren die Schwellenwerte der t-Verteilung für die Signifikanzniveaus – von links nach rechts gelesen - α = 5%, α = 1% und α = 0,1%. Überschreitet die Prüfgröße die Schwellenwertlinie für das Signifikanzniveau α = 5%, so erhält der Prüfgrößenwert ein Sternchen (*). Wird die Schwellenwertlinie für α = 1 % überschritten, so erhält der Prüfgrößenwert zwei Sternchen (**). Bei Überschreitung der dritten Schwellenwertlinie für α = 0,1 % erhält die Prüfgröße drei Sternchen (***). Bleibt der Balken unterhalb der Schwellenwertlinien, so ist das Testergebnis als nicht signifikant eingestuft und der Prüfgrößenwert erhält kein Sternchen.
Diese Spalte ist nur bei der mehrfachen Regression sichtbar. Der VIF-Wert gibt Ihnen ein Indiz, ob das Merkmal mit einem anderen Merkmal stark korreliert. Der Idealwert ist VIF=1, was bedeutet, dass keine Korrelation vorliegt. Je größer der Wert ist, umso stärker ist die Korrelation mit anderen Merkmalen. Der Name leitet sich aus dem Gedanken ab, wie stark die Streuung des betrachteten Merkmals durch die Korrelation mit den anderen Merkmalen aufgebläht wird. Ist VIF > 10, so liegen starke Abhängigkeiten zwischen dem betrachteten Merkmal und einem oder mehreren anderen Merkmalen vor. Wird das Modell für Prognosen verwendet, so sollte man sehr vorsichtig bei Extrapolationen sein.
Bi = Merkmalsbezogen berechnetes Bestimmtheitsmaß (auch Quadrat des multiplen Korrelationskoeffizienten genannt). Der Wert des multiplen Korrelationskoeffizienten drückt die Abhängigkeit des betrachteten Merkmals von allen übrigen Merkmalen aus.