Tengo un conjunto de datos uber_data que tiene columnas como [START_DATE *, END_DATE * CATEGORY *, START *, STOP *, MILES *] donde START * es la ubicación inicial y STOP * es la ubicación final. Tengo que conseguir la ruta más frecuente que tome el conductor uber

Y a continuación está el código que estoy usando para obtener el requerido.

uber_data [['START *', 'STOP *', 'START_DATE *']]. groupby (['START *', 'STOP *']). count (). max ()

Esto me da el número de rutas que llega a ser 201. Pero no pude imaginar cómo obtener la combinación para la que viene este 201. Tengo que ver manualmente los datos para saber la combinación que resulta ser Agnew-Cary

Quiero mi salida de esta manera

** INICIO * DETENER * START_DATE *

Agnew Cary 201 **

Intenté obtener el valor usando index () pero no obtuve el resultado deseado.

0
Ritesh Singh 16 oct. 2019 a las 10:34

1 respuesta

La mejor respuesta

Uso

 uber_data.groupby(['START*','STOP*'])['START_DATE*'].count().sort_values(ascending=False).head(1)

Que debería darte tanto el índice como el valor

0
Onyambu 16 oct. 2019 a las 07:52