Tengo un marco de datos y seleccionaría solo filas que contienen valor de índice en df1.index.
Por ejemplo:
In [96]: df
Out[96]:
A B C D
1 1 4 9 1
2 4 5 0 2
3 5 5 1 0
22 1 3 9 6
Y estos índices
In[96]:df1.index
Out[96]:
Int64Index([ 1, 3, 4, 5, 6, 7, 22, 28, 29, 32,], dtype='int64', length=253)
Me gustaría esta salida:
In [96]: df
Out[96]:
A B C D
1 1 4 9 1
3 5 5 1 0
22 1 3 9 6
Gracias
2 respuestas
Utilice isin
:
df = df[df.index.isin(df1.index)]
O obtenga todos los índices intersectados y seleccione por loc
:
df = df.loc[df.index & df1.index]
df = df.loc[np.intersect1d(df.index, df1.index)]
df = df.loc[df.index.intersection(df1.index)]
print (df)
A B C D
1 1 4 9 1
3 5 5 1 0
22 1 3 9 6
Editar:
Intenté la solución: df = df.loc [df1.index]. ¿Crees que esta solución es correcta?
La solución es incorrecta:
df = df.loc[df1.index]
print (df)
A B C D
1 1.0 4.0 9.0 1.0
3 5.0 5.0 1.0 0.0
4 NaN NaN NaN NaN
5 NaN NaN NaN NaN
6 NaN NaN NaN NaN
7 NaN NaN NaN NaN
22 1.0 3.0 9.0 6.0
28 NaN NaN NaN NaN
29 NaN NaN NaN NaN
32 NaN NaN NaN NaN
C:/Dropbox/work-joy/so/_t/t.py:23: FutureWarning:
Passing list-likes to .loc or [] with any missing label will raise
KeyError in the future, you can use .reindex() as an alternative.
See the documentation here:
http://pandas.pydata.org/pandas-docs/stable/indexing.html#deprecate-loc-reindex-listlike
print (df)
Pasar el índice al indexador / segmentador de filas de .loc ahora funciona, solo necesita asegurarse de especificar también las columnas, es decir:
df = df.loc[df1.index, :] # works
Y no
df = df.loc[df1.index] # won't work
OMI Esto es más ordenado / consistente con el uso esperado de .loc
Preguntas relacionadas
Nuevas preguntas
python
Python es un lenguaje de programación multipropósito, de tipificación dinámica y de múltiples paradigmas. Está diseñado para ser rápido de aprender, comprender y usar, y hacer cumplir una sintaxis limpia y uniforme. Tenga en cuenta que Python 2 está oficialmente fuera de soporte a partir del 01-01-2020. Aún así, para preguntas de Python específicas de la versión, agregue la etiqueta [python-2.7] o [python-3.x]. Cuando utilice una variante de Python (por ejemplo, Jython, PyPy) o una biblioteca (por ejemplo, Pandas y NumPy), inclúyala en las etiquetas.