Me estoy tirando de los pelos en este.

Tengo 2 marcos de datos:

Df1 contiene datos de jugadores con su posición (zona) (delantero, mediocampista o defensor) y algunos de sus

Estadísticas del juego

df1 = pd.DataFrame({'Zone': ['DEF', 'MID', 'FWD'], 'Tackles': [5, 10, 5], 'Goals': [0, 1, 1], 'Shots': [10, 5, 2]} , index=(['Player A', 'Player B', 'Player C']))

         Zone  Tackles  Goals  Shots
Player A  DEF        5      0     10
Player B  MID       10      1      5
Player C  FWD        5      1      2

Df2 tiene el peso que quiero aplicar para calcular un índice de rendimiento para cada jugador. Los pesos dependen de las posiciones de los jugadores.

df2 = pd.DataFrame({'Tackles': [1, 2, 4], 'Goals': [10, 5, 2], 'Shots': [3, 3, 1]}, index=(['FWD', 'MID', 'DEF']))

     Tackles  Goals  Shots
FWD        1     10      3
MID        2      5      3
DEF        4      2      1

Me gustaría multiplicar cada fila en df1 por su fila correspondiente en df2

Esto es lo que quiero obtener:

         Zone  Tackles  Goals  Shots  Index
Player A  DEF        5      0     10    30.0 (5*4 + 0*2 + 10*1)
Player B  MID       10      1      5    40.0 (10*2 + 1*5 +5*3)
Player C  FWD        5      1      2    21.0 (5*1 + 1*10 +2*3)

Lo que he intentado es esto:

df1['Index'] = (df1 * df2.loc[df1['Zone']]).sum(axis=1)

Pero no funciona ...

Muchas gracias de antemano por tu ayuda

1
vianneydubs 10 ene. 2022 a las 19:20

1 respuesta

La mejor respuesta

Agregar temporal Zone como índice de df1:

df1['Index'] = df1.set_index('Zone', append=True).mul(df2, level=1).sum(axis=1).values
print(df1)

# Output
         Zone  Tackles  Goals  Shots  Index
Player A  DEF        5      0     10     30
Player B  MID       10      1      5     40
Player C  FWD        5      1      2     21
0
Corralien 10 ene. 2022 a las 19:33
¡¡Funciona!! Gracias.
 – 
vianneydubs
10 ene. 2022 a las 19:40