Pandas es una biblioteca de Python para la manipulación y análisis de datos, p. marcos de datos, series de tiempo multidimensionales y conjuntos de datos transversales que se encuentran comúnmente en estadísticas, resultados de ciencias experimentales, econometría o finanzas. Pandas es una de las principales bibliotecas de ciencia de datos en Python.

Más sobre pandas...

Disculpas si me han preguntado algo similar antes, busqué pero no pude encontrar una solución. Mi conjunto de datos se parece a eso data1 = {'Group':['Winner','Winner','Winner','Loser','Loser','Loser'], 'MathStudy': ['Read','Read','Notes','Cheat','Cheat','Read'], 'ScienceStudy': ['No....
27 feb. 2021 a las 00:03
Tengo un marco / serie de datos que contiene datos muestreados por hora durante un par de años. Me gustaría sumar los valores de cada mes y luego calcular la media de esos totales mensuales durante todos los años. Puedo obtener un marco de datos / serie de índices múltiples de los totales usando: ....
27 feb. 2021 a las 00:01
Tengo un marco de datos como este: - data = [['a', 'b', 'c', 'd'],['q', 'r', 's', 't'],['n'],['w', 'x', 'y', 'z']] df = pd.DataFrame(data, columns = ['Full_1', 'Full_2', 'Full_3', 'Full_4']) Ahora quiero agregar las columnas de un marco de datos que contiene el valor 'Ninguno' usando para loop dent....
26 feb. 2021 a las 21:51
Importo algunos datos de Excel al marco de datos. En Excel, hay algunas celdas que están en blanco (no vacías), es decir, alguien ha presionado la barra espaciadora del teclado para llenar esa celda en Excel, por lo tanto, no hay caracteres pero todavía se ve en blanco. En el marco de datos intent....
26 feb. 2021 a las 19:24
¿Cómo leo correctamente un CSV con símbolos de moneda? Probé muchas codificaciones df = pd.read_csv('file.csv', encoding="windows-1252") df € discount €price 0 1 2 Salida esperada: df € discount €price 0 1 2 ....
26 feb. 2021 a las 16:16
Tengo una df como esta: >>> a = [1, 2, 3, 4, 5, 6, 7, 8] >>> df = pd.DataFrame({'a': a}) >>> df a 0 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 Me gustaría reemplazar estos valores con valores que muestren cuántas de las observaciones son menores que el valor (en porcentajes). Como esto: >>> df a ....
26 feb. 2021 a las 15:39
Hola, tengo un df donde el sufijo suele ser el nombre del archivo. df apple_filename_fruit.csv banan_filename_new fruity.csv test_col 0 0 26 4 1 23 262 2 2 23 ....
26 feb. 2021 a las 15:12
He raspado algunos sitios web para recopilar datos de la empresa. Los datos de la dirección son uno de ellos. Debido a la etiqueta HTML, solo pude raspar los datos dentro de una 'etiqueta'. Un ejemplo es la salida de mis datos que se puede ver a continuación. Streetname housenumber zip-code city ....
26 feb. 2021 a las 14:08
Usando la entrada a continuación como ejemplo, estoy tratando de crear una columna agregada en un marco de datos en Python basado en instancias únicas de otros. Sin embargo, el mejor intento que puedo hacer deja algo de NaN en la nueva columna raw_data = {'RegionCode' : ['10001', '10001', '10001', ....
26 feb. 2021 a las 13:52
Tengo un DF que se ve así: Virus Host blastRank crisprRank mashRank 0 NC_000866|1 NC_017660|1 1.0 inf inf 1 NC_000871|1 NC_017595|1 1.0 inf inf 2 NC_000872|1 NC_017595|1 1.0 inf inf 3 NC_000....
26 feb. 2021 a las 13:45
Considere una DataFrame como df = pd.DataFrame({'a': [1,-2,0,3,-1,2], 'b': [-1,-2,-5,-7,-1,-1], 'c': [-1,-2,-5,4,5,3]}) Para cada columna, ¿cómo reemplazar cualquier valor negativo con el último valor positivo o cero? El último aquí se refiere de arriba a ab....
26 feb. 2021 a las 13:07
Quiero crear un diagrama de barras donde el eje x es la columna datetime de mi marco de datos. Convertí la datetime en la columna pandas a tiempo solamente y obtengo un error cuando intento usar la función matplotlib.pyplot.barplot para trazar los datos: import pandas as pd import matplotlib.pyplot ....
26 feb. 2021 a las 12:19
Tengo un marco de datos como este: >>> df X Y 0 a 2021-02-26 06:30:00 1 b 2021-02-26 06:30:30 2 c 2021-02-26 06:30:45 3 d 2021-02-26 06:31:30 4 e 2021-02-26 06:31:50 Quiero encontrar todos los pares de X donde Y está dentro de los 60. Entonces yo quiero: A, b A, c Antes de Cris....
26 feb. 2021 a las 11:08
Tengo la siguiente trama de datos: El país es en realidad el índice: 2014 2015 PopEst Country China 8.230121e+12 8.797999e+12 1.367645e+09 United States 1.615662e+13 1.654857e+13 3.176154e+08 ....
26 feb. 2021 a las 10:42
Digamos que tengo un gl como el de abajo. num value 0 1 229 1 2 203 2 3 244 3 4 243 4 5 230 Y una matriz: array([ 2, 4]). Me gustaría crear una nueva columna para la variable binaria, de modo que sea 1 cuando num sea igual al valor de la matriz y 0 en caso contrario. num....
26 feb. 2021 a las 03:01
Me enfrento a un problema al implantar un código Python que lee el primer n rows de un archivo .csv y almacena los valores de columns en un list . la longitud de la lista debe ser 2000, y la lista se utilizará para crear un plot Las columns en el archivo .csv no están etiquetadas....
26 feb. 2021 a las 01:12
Necesito reemplazar cualquier valor sin nombre en Tipo, y después de eso, necesito completar los datos, pero tengo la advertencia de que no sé cómo resolver esto. ¿Cualquier sugerencia? Date Column1 Total Type N P 2 04/2019 2 NaN Type1 NaN NaN 3 05/2019 2 ....
26 feb. 2021 a las 00:01
Tengo un archivo csv, con un número de líneas múltiplos de 16. Después de leer, quiero iterar e inspeccionar cada una de las 16 filas de datos. ex: following file has lines, which is multiple of 2 1 2 4 4 5 6 4 5 7 3 4 7 6 7 1 3 1 8 then I want to divide these lines into 3 tables 1 2 4 4 5 6 4 5 ....
25 feb. 2021 a las 22:07
Tengo un marco de datos como: doc_id text uci_class tokens lemma pos 1 accès rapide et facile personnel très avenant... 1 [accès, rapide, et, fac....
25 feb. 2021 a las 21:08
Tengo un marco de datos como este: ids dim 0 1 2 1 1 0 2 1 1 3 2 1 4 2 2 5 3 0 6 3 2 7 4 1 8 4 2 9 Nan 0 10 Nan 1 11 Nan 0 Quiero construir un tensor de tensorflow a....
25 feb. 2021 a las 20:07
Estoy totalmente atascado con este ejercicio y no sé cómo proceder. Tengo datos en forma de ID / From / To / Value 12 / 1.1.2021 7:50 / 1.1.2021 8:20 / 50 13 / 1.1.2021 8:00 / 1.1.2021 8:03 / 100 14 / 1.1.2021 9:12 / 1.1.2021 9:30 / 12 Necesito dividir todas las series de tiempo en minutos y averi....
25 feb. 2021 a las 19:27
Considere el siguiente marco de datos: Name identifierOne identifierTwo 0 Name1 ['12032', '444', '555'] ['aaa', 'bbb', 'ccc'] 1 Name2 ['666', '51206', '777'] ['ddd', 'eee', 'fff'] 2 Name3 ['111', '222', '333'] ['ggg', 'hhh', 'iii'] Puedo obtener la fila de la ....
25 feb. 2021 a las 18:52
Tengo un marco de datos algo como esto d1 d2 d3 d4 780 37.0 21.4 122840.0 784 38.1 21.4 122860.0 846 38.1 21.4 122880.0 843 38.0 21.5 122900.0 820 36.3 22.9 133220.0 819 36.3 22.9 133240.0 819 36.4 22.9 133260.0 820 36.3 22.9 133280.0 822 36.4 22....
25 feb. 2021 a las 18:36
Tengo dos marcos de datos: Df1: top1 top2 top3 693541495124446625 US GB CN 912819499544441670 US CN TW Df2: US GB CN TW \ ... 693541495124446625 939.00 932.00 8....
25 feb. 2021 a las 18:18
Tengo un marco de datos y me gustaría contar las rayas de esta manera. Hasta ahora lo he intentado dataframe['streak'] = dataframe['close'].groupby((dataframe['close'] <= dataframe['close'].shift(1)).cumsum()).cumcount() +1 Pero esto no baja de 0 Cualquier sugerencia sería apreciada....
25 feb. 2021 a las 18:16