Tengo un diccionario y quiero crear un marco de datos donde las columnas son todos los valores individuales de cada clave. Por ejemplo, si el diccionario se ve así:

d = {'gender': 'female',
     'company': ['nike', 'adidas'],
     'location': ['chicago', 'miami'],
     'plan': 'high'}

Quiero que el marco de datos se vea así:

female  nike  adidas  chicago  miami  high
1       1     1       1        1      1
0
hirshg 27 jun. 2020 a las 02:02

2 respuestas

La mejor respuesta

Puedes hacer explode + value_counts

df=pd.Series(d).explode().value_counts().to_frame(0).T
   chicago  female  nike  miami  high  adidas
0        1       1     1      1     1       1
1
YOBEN_S 26 jun. 2020 a las 23:13

Aquí hay una solución ingenua pero funciona. La idea es que:

  1. organizar ese diccionario d en un diccionario contador como
{'female': 1,
 'nike': 1,
 'adidas': 1,
 'chicago': 1,
 'miami': 1,
 'high': 1}
  1. y a partir de ahí, puedes crear un pandas df

Aquí está el código:

# 1. create list to count 
out = []
for value in d.values():
    if isinstance(value, list):
        out.extend(value)
    else:
        out.append(value)
# out = ['female', 'nike', 'adidas', 'chicago', 'miami', 'high']

# 2. count occurrence of each unique item in this out list
from collections import Counter
count = Counter(out)

# 3. pandas df from dictionary
import pandas as pd
pd.DataFrame([Counter(out)])

# output:
# female  nike  adidas  chicago  miami  high
# 1       1     1       1        1      1
0
user140536 26 jun. 2020 a las 23:14