Pandas es una biblioteca de Python para la manipulación y análisis de datos, p. marcos de datos, series de tiempo multidimensionales y conjuntos de datos transversales que se encuentran comúnmente en estadísticas, resultados de ciencias experimentales, econometría o finanzas. Pandas es una de las principales bibliotecas de ciencia de datos en Python.

pandas...

Quiero comparar df y df_equal. df contiene varios marcos de datos individuales import pandas as pd df1 = pd.DataFrame([[ 'b', 'b', 'b' ]], columns=['a', 'b', 'c']) Output: a b c 0 b b b df2 = pd.DataFrame([[ 'x', 'x', 'x' ]], columns=['a', 'b', 'c']) Outp....
17 may. 2020 a las 18:47
Estoy tratando con TSA y necesito saber el corrcoef entre df.Series y df.Series.shift(1). df.corr() es útil como se muestra a continuación: (1) df.DataFrame.corr() df = pd.read_csv('https://raw.githubusercontent.com/jbrownlee/Datasets/master/daily-min-temperatures.csv', index_col=0,....
Necesito escribir un servicio que imprima clientes cuyo costo promedio sea mayor a 500.00. Tenemos dos conjuntos de datos, el primero almacena los clientes y sus chatbots utilizados ese mes. df_bots_used = pd.DataFrame({'customer_id': [7494212,7494212,1475185,6946725,6946725], ....
17 may. 2020 a las 03:14
Tengo un marco de datos con estados: Alabama[edit] 8 Alaska[edit] 1 Arizona[edit] 3 Arkansas[edit] Desea eliminar la [edición] del final de la cadena. Intenté: unit ['State'] = unit ['State']. Str.rstrip ('[edit]') Pero este código termina eliminando las letras e....
15 may. 2020 a las 22:24
Estoy trabajando con un conjunto de datos y estoy tratando de crear una nueva columna que muestre el número promedio por etiqueta de ID en una fila, pero solo basado en la última fila, que es el número más grande en el grupo de ID. El ejemplo está abajo. Mi conjunto de datos actual: ID Date....
15 may. 2020 a las 20:53
Tengo este Marco, 2 columnas (Azul y Rojo) y valores (0,1) **Blue Red** 0 1 1 1 Quiero un resultado de Dataframe como este, si la columna Red tiene un valor = 1, reemplace este 1 con el name_column Red **Blue Red** 0 Red Blue Red Puedo hacerlo con "for" pero, ¿conoces ....
15 may. 2020 a las 20:22
Ya ha habido algunas variaciones de esta pregunta, pero no puedo encontrar exactamente lo que estoy buscando. Tengo un marco de datos de clientes con los productos que han comprado: customer product 0 John Milk 1 John Milk 2 John Shoes 3 John Shoes 4 John Shoes....
15 may. 2020 a las 16:00
He concatado muchas series Pandas ' juntas para crear un marco de datos. datasize = Reducedset['estimate'].groupby(level=0).apply(lambda x:x.count()) datasum = Reducedset['estimate'].groupby(level=0).apply(lambda x:x.sum()) datamean = Reducedset['estimate'].groupby(level=0).apply(lambda x:x.mean....
15 may. 2020 a las 15:50
Tengo dos marcos de datos Primer marco de datos, df1 UserMasterId Status Count 0 1296.0 5 5 1 1316.0 5 9 2 1325.0 5 14 3 1332.0 5 5 4 1337.0 5 44 5 1342.0 5 2 6 1344.0 5 18 ....
15 may. 2020 a las 15:28
Tengo un Dataframe que tiene valores de Nombre duplicados. Pero, solo quiero mantener el valor duplicado que tiene un valor de Equipo establecido en "TOT": Name Team Games Trevor SAC 32 Trevor TOT 50 Trevor POR 18 Kyle MEM 59 LeMarc....
Soy nuevo en la programación de Python. Tengo dos marcos de datos df1 que contienen etiquetas (180k filas) y df2 que contienen nombres de equipos (1600 filas) Df1: Line TagName CLASS 187877 PT_WOA .ZS01_LA120_T05.SB.S2384_LesSwL 10 187878 PT_WOA .....
15 may. 2020 a las 06:18
Estoy tratando de reemplazar los nombres de mis columnas que tienen citas y simplemente elimino las citas, pero cuando intento esto: for x in df.columns: x = x.replace('"', '') print(x) No pasa nada y las citas siguen ahí.....
15 may. 2020 a las 01:53
Tengo un marco de datos con cadenas de igual longitud (10). Quiero "explotar" esta columna en 10 columnas. No importa qué solución intente, hay una columna vacía principal. Las soluciones existentes me dan este problema, por lo que no hace falta decir que las respuestas existentes a esta pregunta no....
14 may. 2020 a las 21:39
Tengo un marco de datos en el que una de las columnas tiene matrices unidimensionales como valores. Como ejemplo de juguete: easy={"a":[1,2,3,4,5,6,7,8,9],"b":[9,8,7,6,5,4,3,2,1], "c":[[0.9,0.3,0.1],[0.8,0.7,0.2],[0.7,0.6,0.3], [0.6,0.2,0.4....
14 may. 2020 a las 19:32
Soy nueva en Pandas y trabajo en algún ejercicio. La pregunta es encontrar la cantidad de elementos que tienen más de 3 tipos. Estoy confundido sobre cómo obtener los tipos (claves) de la columna type. Además, ¿es una forma adecuada para que los pandas almacenen par kv en una sola columna? ¡Gracias!....
14 may. 2020 a las 18:58
Digamos que tengo un marco de datos como este: a b c 0 x1 y1 9 1 x1 y2 9 2 x1 y3 4 3 x2 y4 2 4 x2 y5 10 5 x2 y6 5 6 x3 y7 6 7 x3 y8 4 8 x3 y9 8 9 x4 y10 11 10 x4 y11 11 11 x4 y12 11 Primero quiero hacer una especie de columna agrupada c (agrupada p....
14 may. 2020 a las 18:33
Estoy tratando de iterar a través de una Serie Pandas . Si un valor en la columna '% renovable' es mayor que la mediana para la columna '% renovable' , el valor debe asignarse a 1 en una nueva columna 'HighRenew' . De lo contrario, el valor debe permanecer como está. El valor de cada elem....
14 may. 2020 a las 17:32
Digamos que tengo la siguiente lista. my_list = ['4/10', '8/-', '9/2', '4/11', '-/13', '19/10', '25/-', '26/-', '4/12', '10/16'] Me gustaría verificar la aparición de cada elemento y, si existe más de una vez, me gustaría almacenarlo en una nueva lista. Por ejemplo, de la lista anterior, 4 existe 3 ....
14 may. 2020 a las 11:45
Soy bastante nuevo en los pandas, y tengo una lista llena de cosas así: something=[10,20,30,40,50] Cuando lo convierto en un marco de datos de pandas sin embargo, tengo la lista completa como un elemento: dataset = pd.DataFrame({'something': something, \ 'something2': some....
14 may. 2020 a las 11:32
Tengo un marco de datos que se ve más o menos así: Podría agruparlos y ordenarlos con df_players.groupby(['vehicle']).agg({'frags':sum}).sort_values(['frags'],ascending=False) ¿Cómo puedo agrupar el vehicles y obtener sus tasas de ganancias así: EDITAR: (datos) [ {"player": "bob", "vehi....
14 may. 2020 a las 10:28
Mi código de Python es el siguiente: #Loading libraries import re import pandas as pd import numpy as np import datetime #Creating an empty dataframe columns = ['A'] df_ = pd.DataFrame(columns=columns) df_ = df_.fillna(0) #Reading the data line by line with open('serverLogs.log-2020-04-30-01') as ....
14 may. 2020 a las 09:32
Tengo el marco de datos de la siguiente manera: df = pd.DataFrame({'$a':[1,2], '$b': [10,20]}) Traté de crear una función que permita cambiar el nombre de la columna dinámicamente donde solo puedo ingresar el nombre de la columna anterior y el nuevo nombre de la columna en la función de la siguient....
14 may. 2020 a las 08:07
Entonces, quiero dividir un marco de datos dado en dos marcos de datos en función de una condición if para una columna en particular. Actualmente estoy logrando esto iterando sobre todo el marco de datos dos veces. Sugiera algunas formas de mejorar esto. player score dan 10 dmitri 45 ....
13 may. 2020 a las 23:30
Estoy tratando de agregar una nueva columna con subtotales y una columna final con totales. Por ejemplo, df = pd.DataFrame({"A": ["foo", "foo", "foo", "foo", "foo", "bar", "bar", "bar", "bar"], "B": ["one", "one", "one", "two", "two","one", "one", "two", "two"], "C": ["....
13 may. 2020 a las 22:30
Está bien, este estoy un poco atrapado. Tengo un marco de datos como este: time Throttle Vout 0 1056.65785 1 8 1 1056.66255 2 8 2 1056.66785 3 9 3 1056.67330 4 11 4 1056.67840 5 15 Y necesito agregar una fila....
13 may. 2020 a las 17:43