Frage: Definitionsbereich bei logistischer Regression
Hallo,
ich möchte einen Datensatz mit zwei Variablen x, y auf einen logistischen Zusammenhang hin prüfen. (Es geht nicht um Logits und Eintrittswahrscheinlichkeiten, es ist nur ein einfacher Zusammenhang zwischen zwei Variablen, der eben die Form einer logistischen Kurve annimmt). Über die Methode der kleinsten Quadrate habe ich nun Werte für die Parameter a, b, c für meine Funktion y=c/(1+e^(a+bx)) ermittelt, die auch ganz gut passen.
Zur Berechnung von r² habe ich dann die beobachteten y über die Umkehrfunktion in geschätzte Y transformiert. Als Umkehrfunktion habe ich ermittelt Y=(ln((c/y)-1)-a)/b Für die Fälle, bei denen y größer ist als c, wird nun das im ln kleiner Null und ich kann keinen Wert für Y ermitteln. Wie gehe ich nun vor? Muss ich c so wählen, dass es größer ist, als das größte y; dass ich also für alle Fälle Y ausrechnen kann? Oder kann ich diese Fälle ignorieren/ausschließen?
TIA
Chris
Kommentar schreiben
Benötigte Felder sind mit einem Stern (*) markiert.
klei6b05
Erstellt am: 20.01.2010