Pandas es una biblioteca de Python para la manipulación y análisis de datos, p. marcos de datos, series de tiempo multidimensionales y conjuntos de datos transversales que se encuentran comúnmente en estadísticas, resultados de ciencias experimentales, econometría o finanzas. Pandas es una de las principales bibliotecas de ciencia de datos en Python.

Más sobre pandas...

Tengo una lista de cadenas como esta: stringlist = [JAN, jan, FEB, feb, mar] Y tengo un marco de datos que se parece a esto: **date** **value** 01MAR16 1 05FEB16 12 10jan17 5 10mar15 9 03jan05 7 04APR12 ....
2 may. 2021 a las 23:44
Quiero explicar mi pregunta con un ejemplo. Tengo un conjunto de datos que incluye precios promedio de aguacate y muchas características sobre estos precios (supongo que el conjunto de datos de precios de aguacate es muy popular, idk). Y hay una característica llamada "región" que muestra dónde cr....
2 may. 2021 a las 23:27
import csv import pandas as pd from matplotlib import pyplot as plt # Declaring workout data to df variable df = pd.read_csv('workout.csv') # Declaring name variable and storing name data into it name = df['name'] # Calculating the mass moved moved_mass_data = df['sets'] * df['reps'] * df['weight....
2 may. 2021 a las 22:44
Estoy tratando de averiguar cómo obtener datos de varias filas en diferentes columnas de un nuevo marco de datos. El nuevo marco de datos consta de ID únicos del marco de datos ord. df_1 = pd.DataFrame({'course_id': [1, 1, 2, 2, 3, 3, 4, 4, 4], 'exam_id': ['A', 'B', 'A', 'A', '....
2 may. 2021 a las 22:43
Estoy leyendo un csv y los datos están un poco desordenados. Aquí está el código: import pandas as pd ocorrencias = pd.read_csv('data.csv', encoding="1252", header=None) ocorrencias = ocorrencias.drop([0, 1, 2, 4, 10, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 3....
2 may. 2021 a las 21:15
Entonces, tengo algunos datos de muestra como tales: import pandas as pd objs = [ {'location':'US', 'fruit':'apple', 'time':'night', 'value': 1}, {'location':'US', 'fruit':'orange', 'time':'night', 'value': 3}, {'location':'US', 'fruit':'banana', 'time':'night', 'value': 1}, {'locati....
2 may. 2021 a las 21:05
Tengo dos marcos de datos df1 y df2. d = d = {'ID': [31,42,63,44,45,26], 'lat': [64,64,64,64,64,64], 'lon': [152,152,152,152,152,152], 'other1': [12,13,14,15,16,17], 'other2': [21,22,23,24,25,26]} df1 = pd.DataFrame(data=d) d2 ={'ID': [27,48,31,45,49,10], 'LAT': [63,63,63....
2 may. 2021 a las 20:54
Curiosamente, es una mejor manera de mapear la columna de pandas contra una lista. ref_list=['a','b','c','d'] lst = [0,2,1] df = pd.DataFrame(lst,columns=['no']) Producción esperada no map 0 0 a 1 2 c 2 1 b ....
2 may. 2021 a las 19:54
Estoy tratando de filtrar filas en un marco de datos basado en cierto patrón. Puede consultar el código a continuación: import pandas df=pandas.read_csv("output.csv", header=None) a=list(df.iloc[:,1]) b=[prism for prism in a if prism[-7:]=="relatif" and prism[-15:-12]=="MPO"] df1=pandas.read_csv("....
2 may. 2021 a las 19:05
Estoy procesando previamente los datos recibidos en una encuesta a través de un archivo .csv. Esta columna contiene el nombre del curso que han tomado los estudiantes. Dado que esto ha sido escrito por ellos, hay diferentes formas en que se ha escrito el mismo nombre de curso. Por ejemplo: el nom....
2 may. 2021 a las 18:59
Tengo esta lista de listas c = [[[1.0, 1.0000000000000002, 6154.0], [2.0, 0.0, 6154.0], [3.0, -0.9999999999999997, 6154.0], [4.0, 0.3809523809523809, 6154.0], [5.0, 0.0, 6154.0]], [[1.0, 1.0000000000000002, 3720.0], [2.0, 0.07407407407407404, 3720.0], [3.0, 1.0, 3720.0], [4.0, 1.0, 37....
2 may. 2021 a las 18:30
Tengo un marco de datos de pandas con el siguiente formato: col1 col2 ... col4 A 2 [2-3-4] B 3 [2-6] A 3 [2-3-4] C 2 [2-3-4] D 2 [2-3-4] Me gustaría seleccionar solo las filas donde el valor en col2 está en la lista de col....
2 may. 2021 a las 18:00
Tengo un marco de datos con tres columnas y una función que calcula los valores de la columna yyz dado el valor de la columna x. Solo necesito calcular los valores si les falta NaN. def calculate(x): return 1, 2 df = pd.DataFrame({'x':['a', 'b', 'c', 'd', 'e', 'f'], 'y':[np.NaN, np.NaN, np.NaN....
2 may. 2021 a las 18:00
Tengo un conjunto de datos que se ve así: datetime id 2020-01-22 11:57:09.286 UTC 5 2020-01-22 11:57:02.303 UTC 6 2020-01-22 11:59:02.303 UTC 5 Quiero crear un nuevo conjunto de datos a partir de él, de modo que para cada identificación única, se seleccione el valor mínimo de fec....
2 may. 2021 a las 17:45
Tengo dos marcos de datos df1 y df2, necesito verificar si los valores en la columna df1 x1 y la columna x2 existen en la columna df2 x. Si el valor no existe, agréguelo a la columna x de df2 y NaN a la columna y de df2. Lo siguiente es lo que tengo, funciona pero lleva demasiado tiempo para grande....
2 may. 2021 a las 17:19
En un marco de datos tengo alrededor de 20 registros con pocas columnas y una de las dos columnas es "Orig.Req" y "Mod.Req" He escrito una función color_change, en la que tengo que comparar las dos cadenas registro por registro en estas dos columnas y devolver el color para imprimir en el estilo. im....
2 may. 2021 a las 16:44
Tengo la siguiente trama de datos: account_id contract_id date_activated 2021-12-01 00:00:00 2021-01-01 00:00:00 2021-02-01 00:00:00 2021-03-01 00:00:00 2021-04-01 00:00:00 2021-05-01 00:00:00 2021-06-01 00:00:00 0 1 A 2020-12-04 200.0 200.0 200.0 0.0 0.0 0.0 0.0 1 1 B 2021-03-0....
2 may. 2021 a las 16:32
Tengo lista de objetos. Cada objeto es de la clase Student que tiene los atributos: nombre, identificación, calificaciones. grados es un diccionario con claves de cadena ('matemáticas', 'cs', ..). Quiero convertir esta lista de marcos de datos de pandas: df = name id math cs a 2 90 92 ....
2 may. 2021 a las 15:46
Tengo varios valores nulos en una columna: print(df['col'].isnull().sum(axis = 0)) Estoy tratando de reemplazarlos así: df['col'].fillna(value='no_val') #df['col'].value_counts() print(df['col'].isnull().sum(axis = 0)) Pero no funciona y todavía muestra el mismo número de valores nulos después de ....
2 may. 2021 a las 15:42
Tengo un marco de datos como NAME1 NAME2 VALUE1 VALUE2 FAMILY ORDER Homo_sapiens_1:0-30 Homo_sapiens-BLOCS2 45 67 Hominidae Primates Homo_sapiens_1:45-75 Homo_sapiens-BLOCS2 46 64 Hominidae Primates Canis_lupus_1:5-66 NA 10 ....
2 may. 2021 a las 15:10
Me gustaría trazar un diagrama de barras. Muestra el dinero por un día. El gráfico se ve bien, pero muestra un día como este "% y-% m-% d% h:% m:% s". Sería bueno, cuando solo muestre "% y-% m-% d". Mi dataframe se ve así: Erdtemp Heizung Money_H DatumZeit ....
2 may. 2021 a las 10:15
Datos de la serie tengo 2 archivos. Cada observación de datos tiene un retraso de 20 segundos Archivo 1 Archivo 2 Resultado esperado Lo que he hecho hasta ahora Con código ....
Tengo un marco de datos de la siguiente manera: payeeId amount createdAt TrxnID 1001 2.30 2021-04-24 01:40:11.156000+00:00 100AA 1001 35 2021-04-24 02:10:11.146000+00:00 100AB 1001 600 2021-04-24 02:12:1....
2 may. 2021 a las 08:22
Tengo un marco de datos con texto y la fecha y hora de su creación. Sin embargo, hay un problema con la columna de fecha y hora: tweets datetime 0 'Everybody...' datetime.datetime(2020, 8, 29, 23, 25, 19) 1 'Good for ...' datetime.datetime(202....
2 may. 2021 a las 08:09
Aquí se respondió una versión de este problema (sin embargo, esto usa datos con una frecuencia de minutos). Contar el número de apariciones consecutivas de números en el marco de datos con índice múltiple Tengo un marco de datos que tiene un índice múltiple (cotización de cotización y fecha) con una....
2 may. 2021 a las 07:00