Pandas es una biblioteca de Python para la manipulación y análisis de datos, p. marcos de datos, series de tiempo multidimensionales y conjuntos de datos transversales que se encuentran comúnmente en estadísticas, resultados de ciencias experimentales, econometría o finanzas. Pandas es una de las principales bibliotecas de ciencia de datos en Python.
Disculpas si me han preguntado algo similar antes, busqué pero no pude encontrar una solución.
Mi conjunto de datos se parece a eso
data1 = {'Group':['Winner','Winner','Winner','Loser','Loser','Loser'],
'MathStudy': ['Read','Read','Notes','Cheat','Cheat','Read'],
'ScienceStudy': ['No....
Tengo un marco / serie de datos que contiene datos muestreados por hora durante un par de años. Me gustaría sumar los valores de cada mes y luego calcular la media de esos totales mensuales durante todos los años. Puedo obtener un marco de datos / serie de índices múltiples de los totales usando:
....
Tengo un marco de datos como este: -
data = [['a', 'b', 'c', 'd'],['q', 'r', 's', 't'],['n'],['w', 'x', 'y', 'z']]
df = pd.DataFrame(data, columns = ['Full_1', 'Full_2', 'Full_3', 'Full_4'])
Ahora quiero agregar las columnas de un marco de datos que contiene el valor 'Ninguno' usando para loop dent....
Importo algunos datos de Excel al marco de datos. En Excel, hay algunas celdas que están en blanco (no vacías), es decir, alguien ha presionado la barra espaciadora del teclado para llenar esa celda en Excel, por lo tanto, no hay caracteres pero todavía se ve en blanco. En el marco de datos intent....
¿Cómo leo correctamente un CSV con símbolos de moneda? Probé muchas codificaciones
df = pd.read_csv('file.csv', encoding="windows-1252")
df
€ discount €price
0 1 2
Salida esperada:
df
€ discount €price
0 1 2
....
26 feb. 2021 a las 16:16
Tengo una df como esta:
>>> a = [1, 2, 3, 4, 5, 6, 7, 8]
>>> df = pd.DataFrame({'a': a})
>>> df
a
0 1
1 2
2 3
3 4
4 5
5 6
6 7
7 8
Me gustaría reemplazar estos valores con valores que muestren cuántas de las observaciones son menores que el valor (en porcentajes). Como esto:
>>> df
a ....
Hola, tengo un df donde el sufijo suele ser el nombre del archivo.
df apple_filename_fruit.csv banan_filename_new fruity.csv test_col
0 0 26 4
1 23 262 2
2 23 ....
26 feb. 2021 a las 15:12
He raspado algunos sitios web para recopilar datos de la empresa. Los datos de la dirección son uno de ellos. Debido a la etiqueta HTML, solo pude raspar los datos dentro de una 'etiqueta'. Un ejemplo es la salida de mis datos que se puede ver a continuación.
Streetname housenumber zip-code city ....
26 feb. 2021 a las 14:08
Usando la entrada a continuación como ejemplo, estoy tratando de crear una columna agregada en un marco de datos en Python basado en instancias únicas de otros. Sin embargo, el mejor intento que puedo hacer deja algo de NaN en la nueva columna
raw_data = {'RegionCode' : ['10001', '10001', '10001', ....
26 feb. 2021 a las 13:52
Tengo un DF que se ve así:
Virus Host blastRank crisprRank mashRank
0 NC_000866|1 NC_017660|1 1.0 inf inf
1 NC_000871|1 NC_017595|1 1.0 inf inf
2 NC_000872|1 NC_017595|1 1.0 inf inf
3 NC_000....
26 feb. 2021 a las 13:45
Considere una DataFrame como
df = pd.DataFrame({'a': [1,-2,0,3,-1,2],
'b': [-1,-2,-5,-7,-1,-1],
'c': [-1,-2,-5,4,5,3]})
Para cada columna, ¿cómo reemplazar cualquier valor negativo con el último valor positivo o cero? El último aquí se refiere de arriba a ab....
26 feb. 2021 a las 13:07
Quiero crear un diagrama de barras donde el eje x es la columna datetime de mi marco de datos.
Convertí la datetime en la columna pandas a tiempo solamente y obtengo un error cuando intento usar la función matplotlib.pyplot.barplot para trazar los datos:
import pandas as pd
import matplotlib.pyplot ....
26 feb. 2021 a las 12:19
Tengo un marco de datos como este:
>>> df
X Y
0 a 2021-02-26 06:30:00
1 b 2021-02-26 06:30:30
2 c 2021-02-26 06:30:45
3 d 2021-02-26 06:31:30
4 e 2021-02-26 06:31:50
Quiero encontrar todos los pares de X donde Y está dentro de los 60.
Entonces yo quiero:
A, b
A, c
Antes de Cris....
Tengo la siguiente trama de datos:
El país es en realidad el índice:
2014 2015 PopEst
Country
China 8.230121e+12 8.797999e+12 1.367645e+09
United States 1.615662e+13 1.654857e+13 3.176154e+08
....
Digamos que tengo un gl como el de abajo.
num value
0 1 229
1 2 203
2 3 244
3 4 243
4 5 230
Y una matriz: array([ 2, 4]).
Me gustaría crear una nueva columna para la variable binaria, de modo que sea 1 cuando num sea igual al valor de la matriz y 0 en caso contrario.
num....
Me enfrento a un problema al implantar un código Python que lee el primer n rows de un archivo .csv y almacena los valores de columns en un list . la longitud de la lista debe ser 2000, y la lista se utilizará para crear un plot
Las columns en el archivo .csv no están etiquetadas....
Necesito reemplazar cualquier valor sin nombre en Tipo, y después de eso, necesito completar los datos, pero tengo la advertencia de que no sé cómo resolver esto. ¿Cualquier sugerencia?
Date Column1 Total Type N P
2 04/2019 2 NaN Type1 NaN NaN
3 05/2019 2 ....
Tengo un archivo csv, con un número de líneas múltiplos de 16.
Después de leer, quiero iterar e inspeccionar cada una de las 16 filas de datos.
ex: following file has lines, which is multiple of 2
1 2 4
4 5 6
4 5 7
3 4 7
6 7 1
3 1 8
then I want to divide these lines into 3 tables
1 2 4
4 5 6
4 5 ....
Tengo un marco de datos como:
doc_id text uci_class tokens lemma pos
1 accès rapide et facile personnel très avenant... 1 [accès, rapide, et, fac....
25 feb. 2021 a las 21:08
Tengo un marco de datos como este:
ids dim
0 1 2
1 1 0
2 1 1
3 2 1
4 2 2
5 3 0
6 3 2
7 4 1
8 4 2
9 Nan 0
10 Nan 1
11 Nan 0
Quiero construir un tensor de tensorflow a....
25 feb. 2021 a las 20:07
Estoy totalmente atascado con este ejercicio y no sé cómo proceder.
Tengo datos en forma de
ID / From / To / Value
12 / 1.1.2021 7:50 / 1.1.2021 8:20 / 50
13 / 1.1.2021 8:00 / 1.1.2021 8:03 / 100
14 / 1.1.2021 9:12 / 1.1.2021 9:30 / 12
Necesito dividir todas las series de tiempo en minutos y averi....
Considere el siguiente marco de datos:
Name identifierOne identifierTwo
0 Name1 ['12032', '444', '555'] ['aaa', 'bbb', 'ccc']
1 Name2 ['666', '51206', '777'] ['ddd', 'eee', 'fff']
2 Name3 ['111', '222', '333'] ['ggg', 'hhh', 'iii']
Puedo obtener la fila de la ....
Tengo un marco de datos algo como esto
d1 d2 d3 d4
780 37.0 21.4 122840.0
784 38.1 21.4 122860.0
846 38.1 21.4 122880.0
843 38.0 21.5 122900.0
820 36.3 22.9 133220.0
819 36.3 22.9 133240.0
819 36.4 22.9 133260.0
820 36.3 22.9 133280.0
822 36.4 22....
Tengo dos marcos de datos:
Df1:
top1 top2 top3
693541495124446625 US GB CN
912819499544441670 US CN TW
Df2:
US GB CN TW \ ...
693541495124446625 939.00 932.00 8....
Tengo un marco de datos y me gustaría contar las rayas de esta manera.
Hasta ahora lo he intentado
dataframe['streak'] = dataframe['close'].groupby((dataframe['close'] <= dataframe['close'].shift(1)).cumsum()).cumcount() +1
Pero esto no baja de 0
Cualquier sugerencia sería apreciada....