Solo estoy mirando la competencia Titanic Kaggle y encontré este parámetro en la función .describe () intrigante. He hecho una foto de pantalla (resaltada en azul) . Y este es el enlace para el cuaderno. < / a>

enter image description here

He estado tratando de averiguar qué hace pero no puedo ... ¿qué números excluye? Fui a la documentación de pandas pero no me resultó útil :(

0
Frank Jimenez 31 ago. 2020 a las 13:07

1 respuesta

La mejor respuesta

Cuando pasa exclude="number" a df.describe, pandas excluye todas las columnas en el marco de datos cuyos tipos de datos son subclases de numpy.number, que son:

 numpy.clongdouble,
 numpy.complex128,
 numpy.complex64,
 numpy.complexfloating,
 numpy.float16,
 numpy.float32,
 numpy.float64,
 numpy.floating,
 numpy.inexact,
 numpy.int16,
 numpy.int32,
 numpy.int64,
 numpy.int8,
 numpy.intc,
 numpy.integer,
 numpy.longdouble,
 numpy.signedinteger,
 numpy.timedelta64,
 numpy.uint16,
 numpy.uint32,
 numpy.uint64,
 numpy.uint8,
 numpy.uintc,
 numpy.unsignedinteger

IOW, solo las columnas no numéricas permanecen en el marco de datos. Esto es útil cuando desea ver solo el resumen de las variables categóricas (como en el ejemplo que compartió) porque las estadísticas de las columnas no numéricas no se muestran en la salida de .describe de forma predeterminada.

1
Mustafa Aydın 31 ago. 2020 a las 11:02