Pandas es una biblioteca de Python para la manipulación y análisis de datos, p. marcos de datos, series de tiempo multidimensionales y conjuntos de datos transversales que se encuentran comúnmente en estadísticas, resultados de ciencias experimentales, econometría o finanzas. Pandas es una de las principales bibliotecas de ciencia de datos en Python.

pandas...

Me gustaría extraer el nombre del elemento del texto. fg['Product'] = pd.Series([' 5 Guys Greasy Burger 3/5LB (24) [51656]', '5 Guys Super Strawberry Shake - (3/4) OZ (9) [5645654], '5 Guys Giant Loaded Double Cheese Burger 1/2LB Buns - 8Z Cups (22) [564654]']) Lo que necesito en la columna df para....
19 ago. 2020 a las 15:46
Tengo los siguientes datos: ID | Start Date | End Date 1 |2017-01-01 | 2017-08-01 2 |2017-01-01 | 2017-08-01 3 |2017-12-01 | 2018-05-01 4 |2018-03-02 | 2018-10-02 Me gustaría ver cuántos ID únicos hay en cada mes. Las fechas de inicio y finalización son objetos de fecha y hora que prop....
19 ago. 2020 a las 00:18
Supongamos que tengo el siguiente marco de datos: df = pd.DataFrame({'id': [1,2,3,3,3], 'v1': ['a', 'a', 'c', 'c', 'd'], 'v2': ['z', 'y', 'w', 'y', 'z']}) df id v1 v2 1 a z 2 a y 3 c w 3 c y 3 d z Y quiero transformarlo a este formato: {1: [('a', 'z')], 2: [('a', 'y')], 3: [('....
18 ago. 2020 a las 15:29
Oye todo lo que quiero cambiar las filas por condición en una columna. Entonces, donde la columna "tipo" == A Quiero que las columnas [col1-col5] sean 1 si el valor es mayor 2 Si no, me gusta que el valor sea 0 the DATA data={"col1":[np.nan,3,4,5,9,2,6], "col2":[4,2,4,6,0,1,5], "col3":[7,6,0,11,3,6....
16 ago. 2020 a las 17:12
Tengo un marco de datos con columnas de latitud y longitud, df = pd.DataFrame({'Latitude':[47.5112, 47.7210, 47.7379, 47.5208, 47.6168], 'Longitude':[-122.257, -122.319, -122.233, -122.393, -122.045]}) ¿Cómo creo una columna que mida la distancia hacia una ubicación en particula....
15 ago. 2020 a las 19:52
Digamos que tenemos estos datos: list1, list2, list3 = [1,2,3,4], [1990, 1990, 1990, 1991], [2009, 2009, 2009, 2009] df = pd.DataFrame(list(zip(list1, list2, list3)), columns = ['Index', 'Y0', 'Y1']) > df Index Y0 Y1 1 1990 2009 2 1990 2009 3 1990 2009....
13 ago. 2020 a las 16:31
He creado un marco de datos de csv que tiene valores como este position, location 1,0,1, 1.2,2.2 Basado en valores separados por comas, quiero crear subcolumnas como se muestra en el diagrama. El número de separados por comas seguirá siendo el mismo para todos. Por ejemplo Si un valor de ubicación ....
13 ago. 2020 a las 16:13
Necesito eliminar los duplicados de todas las columnas. Mis datos: id country publisher weak A B C 123 US X 1 6.77 0 0 123 US X 1 0 1.23 88.7 456 BZ Y 2 0 56.87 9.65 456....
12 ago. 2020 a las 16:03
Tengo este marco de datos y aquí quiero averiguar la diferencia de tiempo para cada fila open close 0 09:44:00 10:07:00 1 10:07:00 11:01:00 2 11:05:00 13:05:00 Intenté el siguiente código. import numpy as np (df['open']-df['close'])/np.timedelta64(1,'m') Pero ocurrió el siguient....
12 ago. 2020 a las 11:59
Después de encontrarme con esto: Combinando dos mapas de calor en seaborn hice lo siguiente: df = pd.DataFrame(np.random.rand(8,1), columns=list("A")) df2 = pd.DataFrame(np.random.rand(8,1), columns=list("B")) df3 = pd.DataFrame(np.random.rand(8,4), columns=list("CDEF")) df4 = pd.DataFrame(np.random....
Tengo dos dfs como se muestra a continuación. Df1: Date t_factor plan plan_score 0 2020-02-01 5 NaN 0 1 2020-02-02 23 NaN 0 2 2020-02-03 14 start 0 3 2020-02-04 23 start 0 4 20....
9 ago. 2020 a las 14:11
Tengo un marco de datos que se ve así: Symbol Date Amount Portfolio Value 0 BLL 2020-01-06 5116.83 5069.42 1 BLL 2020-03-16 5104.98 4615.97 5 BLL 2020-03-17 5116.83 5118.95 6 BLL 2020-06-15 5104.95 5401.712 7 BLL 2020-06-16 5116.83 5570.23 11 IBB 2014-03-04 542.98 179.48 12 I....
8 ago. 2020 a las 22:42
Tengo un marco de datos que se parece a lo siguiente: ip_address malware_type ip_1 malware_1 ip_2 malware_2 ip_1 malware_1 ip_1 malware_1 ip_1 malware_2 ip_2 malware_2 ip_2 malware_3 . . . Quiero eliminar filas duplicadas según la co....
8 ago. 2020 a las 21:53
Digamos que tengo un marco de datos con N filas. Quiero elegir las filas donde la ubicación de la fila módulo P da Q. Entonces, para concreción, digamos P = 7 y Q = 5. Row 0: 0 mod 7 = 0 (not satisfied) Row 1: 1 mod 7 = 1 (not satisfied) ... Row 5: 5 mod 7 = 5 (satisfied) ... Row 12: 12 mod 7 = 5 (s....
8 ago. 2020 a las 21:24
Tengo este df_players: rank player_id posicao 0 39 82730 Goleiro 1 136 100651 Atacante 2 140 87863 Meio-Campista 3 66 83257 Atacante 4 139 101290 Atacante df_players.info(): Data columns (total 3 columns): rank 733 non....
8 ago. 2020 a las 20:36
Quiero calcular la media de varias celdas de diferentes marcos de datos. He calculado la correlación entre variables con df.corr() y tengo que hacer esto otras 9 veces y calcular la media de correlación de cada variable. Por ejemplo, el primer marco de datos con correlaciones que obtuve como resulta....
8 ago. 2020 a las 19:30
Siempre que trato de ejecutar una operación de impresión simple en una variable dentro de mi marco de datos, muestra los siguientes errores: TypeError: el objeto 'str' no puede interpretarse como un entero Durante el control de la excepción anterior, se produjo otra excepción: Y entonces: KeyError: ....
8 ago. 2020 a las 17:29
Suponiendo que tengo el siguiente DataFrame df df = pd.DataFrame({ "a" : [8,8,0,8,8,8,8,8,8,8,4,1,4,4,4,4,4,4,4,4,4,4,7,7,4,4,4,4,4,4,4,4,5,5,5,5,5,5,1,1,5,5,5,5,5,5,1,5,1,5,5,5,5]} Quiero normalizar mis datos, si hay un valor consecutivo menos de 3 veces, cambia el valor con el valor consecutivo v....
8 ago. 2020 a las 16:41
Estoy tratando de dividir dos marcos de datos que contienen valores nan y cuando verifico una condición obtengo el resultado como Falso, pero quiero el resultado al dividir dos valores nan y comparar con una condición para ser VERDADERO todo el tiempo ....
8 ago. 2020 a las 09:15
Hay 2 dfs df = pd.DataFrame({'A': ['a', 'b', 'a','d','e']},index=[1,2,3,4,5]) ndf = pd.DataFrame({'A': ['a', '2', '6','e'], 'B': ['apple', 'pen', 'sky','duck']},index=[7,8,9,19]) La columna A de df debe actualizarse con valores de columnas B de ndf como este: si una celda de val....
8 ago. 2020 a las 08:58
Mi dataframe se ve así: Dividends Stock Splits Date 2014-08-13 0.28 0.0 2015-04-27 0.30 0.0 2015-07-31 0.30 0.0 2016-05-05 0.30 0.0 2016-08-15 0.30 0.0 2017-05-04 0.30 ....
8 ago. 2020 a las 07:45
En pandas dataframe tengo una columna que se ve así: +----------------------------------------------+ | carContactTel | +----------------------------------------------+ | [] | | ['tel 432424'] | | ....
8 ago. 2020 a las 07:38
Tengo la siguiente trama de datos: | Date | Word | Numb | |------------|---------|------| | 2020/01/01 | ab | 12 | | 2020/01/01 | bc | 24 | | 2020/01/01 | ab | -12 | | 2020/01/01 | bc | 34 | | 2020/01/02 | ab | 3 | | 2020/01/02 | bc | 123 | | 2020/01....
8 ago. 2020 a las 04:18
Tengo una trama de datos pandas como esta: sn sentence entity 1. an apple is an example of? an apple is example of fruit 2. a potato is an example of? a potato is example of vegetable Quiero crear otro marco de datos de pandas que se vea a continuación: donde la longitud de ....
8 ago. 2020 a las 02:50
Así que tengo algunos datos de existencias que son para cada minuto durante el 2020. Aunque mi problema es que solo quiero los datos desde las 9:30 de la mañana hasta las 4:00 de la tarde. Actualmente, los datos también incluyen precios fuera del horario laboral que me gustaría filtrar. El código de....
8 ago. 2020 a las 00:43