La página de referencia dice:

Parameters: 
X : array-like or sparse matrix, shape (n_samples, n_features)
Training data

y : array_like, shape (n_samples, n_targets)
Target values. Will be cast to X’s dtype if necessary

¿Es X la variable exógena? Supongo que sí, pero con el statsmodel OLS lo endógeno es lo primero, así que quiero confirmarlo porque producen diferentes coeficientes.

1
SpartanDawg 28 jun. 2019 a las 17:27

1 respuesta

La mejor respuesta

Sí, tiene razón, el orden en el que alimenta sus variables exógenas y endógenas se invierte en el módulo sklearn (también para otros modelos en sklearn) en comparación con el módulo OLS statsmodel.

Si X = variable exógena e Y = endógena

En sklearn harías algo como esto:

clf.fit(X,Y)

Mientras que en statsmodel harías:

clf.fit(Y,X)

Donde clf es el modelo que está intentando construir.

¡Espero que esto ayude!

1
Parthasarathy Subburaj 28 jun. 2019 a las 16:52