Me estoy tirando de los pelos en este. Tengo 2 marcos de datos: Df1 contiene datos de jugadores con su posición (zona) (delantero, mediocampista o defensor) y algunos de sus Estadísticas del juego df1 = pd.DataFrame({'Zone': ['DEF', 'MID', 'FWD'], 'Tackles': [5, 10, 5], 'Goals': [0, 1, 1], 'Shots': ....
10 ene. 2022 a las 19:20
Estoy aprendiendo Python, quizás en escenarios de casos reales, y obtuve la tarea de filtrar los nombres de las empresas que contienen más de 3 palabras. Está en la columna denominada "Nombre de la empresa" y el marco de datos se denomina "datos". Logré incluirlos en la lista y, finalmente, tambié....
6 ene. 2022 a las 01:47
Tengo un conjunto de datos que he creado al fusionar 2 df juntos en la columna "NOMBRE" y ahora tengo un conjunto de datos más grande. Para terminar el DF, quiero realizarle un poco de lógica para limpiarlo. Requisitos: Quiero seleccionar el 'NOMBRE' único, pero quiero hacer coincidir el nombre ....
8 dic. 2021 a las 03:49
Entonces, estoy buscando una forma eficiente de configurar valores dentro de una columna existente y configurar valores para una nueva columna en función de algunas condiciones. Si tengo 10 condiciones en un conjunto de datos grandes, ¿tengo que escribir 10 líneas? ¿O puedo combinarlos de alguna m....
5 oct. 2021 a las 21:38
¿Por qué está funcionando esto? import pandas as pd numbers = {'mynumbers': [51, 52, 53, 54, 55]} df = pd.DataFrame(numbers, columns =['mynumbers']) df.loc[df['mynumbers'] <= 53, 'mynumbers'] = 'True' print (df) Salida: mynumbers 0 True 1 True 2 True 3 False 4 False Pero ....
2 oct. 2021 a las 13:48
Esto es demasiado complicado y realmente no proporciona una solución a la pregunta. otras respuestas son mas claras Este es mi código de script: test = all_SS_batting_columns.loc[all_SS_batting_columns['Year'] == '2021'] Pero solo devuelve: Empty DataFrame Columns: [index, Year, Age, Tm, Lg, G, PA,....
5 ago. 2021 a las 09:24
Tengo un conjunto de datos csv que importé en Jupyter y almacené en inp0. Estoy tratando de crear un grupo de precios para estos usando la función .loc en la apuesta de pandas que se encuentra por debajo del error. Mi código: inp0.loc[inp0.price==0.00, 'Price_Bucket'] = 'Free App' inp0.loc[[inp0.pr....
25 jul. 2021 a las 10:32
Tengo un DF que es bastante grande. Un fragmento como el que se muestra a continuación. SrNo | Merchant | Revenue | Currency 1 | UBER SR | 123 | INR 2 | UBER (SR)| 123 | INR 3 | SR UBER | 123 | INR 4 | ZOMATO SR| 123 | INR 5 | ZOMATOSR | 123 | INR 6 |1....
28 jun. 2021 a las 15:57
He estado practicando con pandas y tengo el siguiente problema. He estado practicando con un conjunto de datos de medallas olímpicas donde los países se enumeran en una columna y las medallas en las columnas siguientes. Como parte de una verificación de control de calidad, quería escribir una línea....
9 jun. 2021 a las 21:28
Problema Pandas parece admitir el uso de df.loc para asignar un diccionario a una entrada de fila, como lo siguiente: df = pd.DataFrame(columns = ['a','b','c']) entry = {'a':'test', 'b':1, 'c':float(2)} df.loc[0] = entry Como se esperaba, Pandas inserta los valores del diccionario a las columnas co....
20 may. 2021 a las 21:26
Tratando de sumar filas para columnas específicas en pandas. Tener: df = name age gender sales commissions joe 25 m 100 10 jane 55 f 40 4 Desear: df = name age gender sales commissions joe 25 m 100 10 jane 55 f 40 4 ....
2 may. 2021 a las 01:25
Estoy tratando de filtrar mi marco de datos en múltiples condiciones usando loc Los datos provienen de un archivo de Excel que importé al marco de datos usando df = pd.read_csv () Aquí hay una estructura de muestra del df usando df.head (): df.head () Y necesito filtrar por los siguientes criterios:....
18 abr. 2021 a las 23:28
Entonces, mi conjunto de datos son datos de encuestas, donde cada fila muestra una pregunta y la respuesta numérica de un encuestado único a esa pregunta. Desafortunadamente, la escala estaba al revés para alguna pregunta (también conocido como 1s debería ser 4s .......
12 feb. 2021 a las 02:38
Estoy tratando de averiguar las filas donde la confiabilidad es <0.70, pero la salida parece incluir filas donde la confiabilidad también es 0.70. ¿Qué podría estar mal? DF original: Po_id po_name producto año medida tasa denominador numerador is_reported fiabilidad 0 1051408 Aberdeen Care Allia....
4 feb. 2021 a las 21:02
Tengo una serie temporal df con 5 años de precios del índice bursátil (por lo que df tiene 2 columnas Fecha y Precio. Luego tengo una nueva columna '3M forward date' que es solo la columna Fecha original + 3 meses. Luego estoy tratando de crear una columna de 'Precio a plazo de 3M'. Este sería el p....
22 ene. 2021 a las 15:11
Tengo un marco de datos como este df = pd.DataFrame ({'a': [1], 'b': [1], 'c': [1], 'd': [1], 'e': [ 1]}) df Quiero seleccionar las columnas a, b, c, e con .loc! Encuentro l = df.loc [:, 'a': 'c']. Columnas.to_list () l + = ['e'] .......
30 dic. 2020 a las 18:09
Estoy buscando una forma iterativa de crear un subconjunto de mi marco de datos de pandas en función de la fecha y el producto. Me gustaría mantener la primera fila para cada producto dentro de una ventana de 2 semanas. Entonces, para df A: .......
16 dic. 2020 a las 00:05
Estoy buscando extraer columnas de un marco de datos usando otro marco de datos. No quiero codificar los encabezados de las columnas en el código, ya que los datos provienen de un csv y las columnas se pueden agregar con diferentes encabezados. Intenté con .loc y usando iteraciones, pero nada pare....
9 dic. 2020 a las 07:57
Estoy tratando de agregar dos marcos de datos usando concat con axis = 0, por lo que las columnas permanecen iguales pero el índice aumenta. Uno de los marcos de datos contiene columnas específicas con un número de serie (que va de uno hacia arriba, pero no necesariamente en secuencia, por ejemplo,....
26 nov. 2020 a las 13:21
Me siento realmente estúpida ahora, esto debería ser fácil. Me siento realmente estúpido ahora, esto debería ser fácil. Recibí una buena ayuda aquí cómo hacerlo -keep-the-index-of-my-pandas-dataframe-after-normallazation-json Necesito obtener el valor mínimo / máximo en la columna 'precio' solo dond....
17 nov. 2020 a las 19:43
Aquí estoy tratando de extraer el promedio de las filas 0 a 8 y las columnas "15/9/2020" a "18/9/2020" del marco de datos df usando .loc [] en pandas [Este es el marco de datos df que tiene 8 filas y 9 columnas] [1] [1]: https://i.stack.imgur.com/QgjBp.png He intentado usar la siguiente sintaxis l....
21 sep. 2020 a las 07:18
Por ejemplo: FRUTO ÍNDICE 0: "banana" 1: "manzana" 2: "rosquilla" 3: "pizza" 4: "fideos" 5: "helado" 6: "pomelo" Por lo general, para eliminar las filas 2-5 inclusive, utilizo drop. (Df.index [[2,3,4,5]]) Sin embargo, para el proyecto que estoy haciendo, el el marco de datos es mucho más grande y....
10 jul. 2020 a las 05:07