Quería importar este conjunto de datos llamado "wind.data" para realizar algunas operaciones en él pero no pude encontrar una manera de convertirlo en una estructura de tabla adecuada. Así es como se ve después de importar: marco de datos de viento. Intenté usar el parámetro sep=' ' en pd.read_csv('wind.data', sep=' ') pero no funciona. ¿Cómo separo los nombres de columna y sus respectivos valores de este conjunto de datos?

1
user10169126 16 dic. 2019 a las 12:12

2 respuestas

La mejor respuesta

El archivo no está separado por comas (o cualquier otro carácter) pero tiene un formato fijo de ancho.

En lugar de intentar forzar read_csv para que lo maneje correctamente, debe usar read_fwf.

df = pd.read_fwf("wind.data", header=1)
3
M. Spiller 16 dic. 2019 a las 09:19

Tratar:

pd.read_csv('wind.data', delimiter=r'\s+')

Porque no siempre hay un espacio único entre columnas.

1
Claudio P 16 dic. 2019 a las 09:15