• Tengo una matriz 3D, en el siguiente ejemplo es una matriz (5, 4, 2): data_matrix
  • Tengo otra matriz de índice de forma (5, 4) donde cada fila de la matriz representa la ubicación del elemento: indx_array

No sé cómo puedo obtener el required_output. Estoy tratando de organizar (1,2) elementos de cada fila según el indx_array

¡No quiero usar bucles for!

data_matrix = np.array([
    [[0, 1], [2, 3], [4, 5], [6, 7]],
    [[8, 9], [10, 11], [12, 13], [14, 15]], 
    [[16, 17], [18, 19], [20, 21], [22, 23]], 
    [[24, 25], [26, 27], [28, 29], [30, 31]], 
    [[32, 33], [34, 35], [36, 37], [38, 39]]
])

indx_array = np.array([[3,2,1,0], [0,1,2,3], [1,0,3,2], [0,3,1,2], [1,2,3,0]])


# I want following result:
required_output = [
    [[6, 7], [4, 5], [2, 3], [0, 1]]
    [[8, 9], [10, 11], [12, 13], [14, 15]]
    [[18, 19], [16, 17], [22, 23], [20, 21]]
    [[24, 25], [30, 31], [26, 27], [28, 29]]
    [[34, 35], [36, 37], [38, 39], [32, 33]]
]

EDITAR: actualizado el indx_array para ilustrar mejor la situación.

1
Snehal 15 ago. 2020 a las 23:40

2 respuestas

La mejor respuesta
In [637]: data_matrix.shape                                                                          
Out[637]: (5, 4, 2)
In [638]: indx_array.shape                                                                           
Out[638]: (5, 4)

Necesita indexación avanzada en las 2 primeras dimensiones. La matriz de la primera dimensión debe transmitirse con la segunda (5,4). Para hacer eso, hago un (5,1) arange:

In [639]: data_matrix[np.arange(5)[:,None], indx_array]                                              
Out[639]: 
array([[[ 6,  7],
        [ 4,  5],
        [ 2,  3],
        [ 0,  1]],

       [[ 8,  9],
        [10, 11],
        [12, 13],
        [14, 15]],

       [[18, 19],
        [16, 17],
        [22, 23],
        [20, 21]],

       [[24, 25],
        [30, 31],
        [26, 27],
        [28, 29]],

       [[34, 35],
        [36, 37],
        [38, 39],
        [32, 33]]])

Compare mi índice (5,1) con el _x aceptado (que es (5,4) desordenado):

In [640]: np.arange(5)[:,None]                                                                       
Out[640]: 
array([[0],
       [1],
       [2],
       [3],
       [4]])
In [641]: _x = np.repeat(np.arange(indx_array.shape[0]),indx_array.shape[1])                         
In [643]: _x                                                                                         
Out[643]: array([0, 0, 0, 0, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 4, 4, 4, 4])

Con la transmisión, el _x no necesita repetirse, (5,4); (5,1) es suficiente.

La radiodifusión hace una repetición virtual. Esto se puede ilustrar con la función broadcast_to:

In [648]: np.broadcast_to(np.arange(5)[:,None],(5,4))                                                
Out[648]: 
array([[0, 0, 0, 0],
       [1, 1, 1, 1],
       [2, 2, 2, 2],
       [3, 3, 3, 3],
       [4, 4, 4, 4]])
In [649]: _.strides                                                                                  
Out[649]: (8, 0)

Es ese 0 zancadas que se repite sin hacer copias. as_strided es la función stride_tricks más útil, especialmente cuando se hacen cosas como mover ventanas. Por lo general, dejamos que la transmisión automática haga el trabajo sin preocuparnos demasiado por el cómo.

3
hpaulj 15 ago. 2020 a las 22:40

Se puede hacer con un poco de manipulación de la matriz de índices.

import numpy as np

_x = np.repeat(np.arange(indx_array.shape[0]),indx_array.shape[1])
_y = indx_array.ravel()

output = data_matrix[_x, _y].reshape(data_matrix.shape)

Lo que da como resultado la matriz numpy esperada

array([[[ 6,  7],
        [ 4,  5],
        [ 2,  3],
        [ 0,  1]],

       [[ 8,  9],
        [10, 11],
        [12, 13],
        [14, 15]],

       [[18, 19],
        [16, 17],
        [22, 23],
        [20, 21]],

       [[24, 25],
        [30, 31],
        [26, 27],
        [28, 29]],

       [[34, 35],
        [36, 37],
        [38, 39],
        [32, 33]]])

4
Richard Nemeth 15 ago. 2020 a las 21:14