Estoy tratando de leer un archivo de Excel usando Pandas por:

dataSet = pd.read_excel(xlsPath, encoding = 'utf-8')

Pero tengo este error:

UnicodeEncodeError: 'charmap' codec can't encode character '\xa4' in position 15353: character maps to <undefined>

¿Hay alguna manera de arreglar eso?

PD Ese es el archivo de Excel en el que estoy trabajando

1
Amarth Gûl 9 sep. 2018 a las 18:05

3 respuestas

La mejor respuesta

Aquí hay una manera de descargar la cosa directamente, pasando ?raw=true. ¡Funciona bien para mí!

import pandas as pd

url = 'https://github.com/Amarthgul/PersonalCodes/blob/master/EDUTL1902/Data.xlsx?raw=true'
df = pd.read_excel(url, encoding='utf-8')
0
Anton vBR 9 sep. 2018 a las 17:43

Estoy de acuerdo con las otras respuestas que veo publicadas. Vuelva a guardar el archivo como .xlsx y debería cargarse bien. Funcionó para mi.

0
Javier Rivera 9 sep. 2018 a las 17:31

El archivo no está codificado en utf-8. Necesita descubrir cuál es la codificación.

Personalmente, primero le daría una oportunidad a dataSet = pd.read_excel(xlsPath, encoding="ISO-8859-1").

0
Batman 9 sep. 2018 a las 16:10