Pandas es una biblioteca de Python para la manipulación y análisis de datos, p. marcos de datos, series de tiempo multidimensionales y conjuntos de datos transversales que se encuentran comúnmente en estadísticas, resultados de ciencias experimentales, econometría o finanzas. Pandas es una de las principales bibliotecas de ciencia de datos en Python.

Más sobre pandas...

Tengo un marco de datos: df = pd.DataFrame({ 'BU': ['AA', 'AA', 'AA', 'BB', 'BB', 'BB'], 'Line_Item': ['Revenues','EBT', 'Expenses', 'Revenues', 'EBT', 'Expenses'], '201901': [100, 120, 130, 200, 190, 210], '201902': [100, 120, 130, 200, 190, 210], '201903': [200, 250, 450, 120....
9 jun. 2021 a las 01:11
Tengo este dummy df: data = {'numerator_en':[11, 113, 53], 'denominator_en':[91, 982, 298], 'numerator_fr':[6, 232, 58], 'denominator_fr':[63, 1278, 389], 'numerator_th':[14, 652, 231], 'denominator_th':[416, 3835, 1437], ....
8 jun. 2021 a las 23:46
Tengo un marco de datos con dos columnas, necesito separar estas dos columnas (columna A y B) por N Filas secuenciales (por ejemplo, 100 filas). Entonces, la salida será de 100 filas en la columna A y B, otras 100 filas en la columna C y D, ... ¿Hay alguna función específica que pueda lidiar con est....
8 jun. 2021 a las 23:21
Estoy usando la serie Panda para organizar datos de la salida de VMStat. Después de cargar los datos, el flujo de datos se ve bien: vmstat_filename = 'vmstat0607.csv' df = pd.read_csv(vmstat_filename, sep=',') df date_time free_mem block_ins block_outs interupts context_switches cpu_u....
8 jun. 2021 a las 23:00
Tengo un marco de datos Group Score Rank 1 0 3 1 4 1 1 2 2 2 3 2 2 1 3 2 7 1 Tengo que tomar la diferencia de la puntuación en el siguiente rango dentro de cada grupo. Por ejemplo, en el rango del Grupo 1 (1) - Rango (2) = 4 - 2 Sa....
8 jun. 2021 a las 22:42
Tengo un marco de datos: Group Score 1 3 1 2 2 3 2 1 3 0 3 1 4 1 4 1 Quiero tomar la puntuación media de cada grupo y clasificar a todos los grupos según la puntuación promedio en orden descendente. Mi proceso de pensamiento....
8 jun. 2021 a las 22:35
Necesito crear un diccionario donde cada elemento es una fila. La clave representa una columna específica y los valores serán una lista de las entradas restantes de la columna. Ejemplo simple a continuación: Ejemplo df: Col_A Col_B Col_C Col_D Roger 5 blue house Kim 2....
8 jun. 2021 a las 21:20
Tengo una solicitud en la que estoy tratando de convertir un cuadro de datos de Pandas hacia y desde un objeto JSON, y estoy corriendo en un problema cuando el DF contiene un objeto Timedelta. Estoy usando Pandas 1.2.4. Aquí está la muestra DF que he estado usando: >>> timedelta_df = pd.DataFrame({'....
8 jun. 2021 a las 21:18
Estoy haciendo un proyecto personal para practicar pandas, y hermosa sopa, raspé esta información y la tenga en un Panda DF como este: 0 €8.5M 1 €0 2 €9.5M 3 €2M 4 €21M ... 16534 €1.8M 16535 €1.1M 16536 €550K 16537 €650K 16538 €1.1M ....
8 jun. 2021 a las 20:12
Aquí están los datos de entrada 2019-09-06 00: 00: 1567702800 He intentado un montón de método para cambiarlo al formato YYAY-MM-DD, pero no funciona, debido a esta parte "00: 00: 1567702800" No es el formato correcto. Debe ser 00: 00: 15.67702800. ¿Cómo puedo cambiar el formato de 00: 00: 156770280....
8 jun. 2021 a las 18:20
Tengo un conjunto de datos que contiene dos columnas. Uno es el Message Received Timestamp y otro es el Message Sent Timestamp. El formato del tiempo parece tal 2021-06-05T07:00:34Z. Me gustaría calcular la diferencia de tiempo en segundos entre esas dos columnas y asegúrese de que la diferencia sea....
8 jun. 2021 a las 18:19
Tengo una columna de edad: df.age, donde existen algunos valores que no tienen sentido en el contexto dado. ¿Cómo puedo convertir valores que están fuera del rango de 18-100 a NA? Sé cómo hacerlo en r ya que hay una función para ello, pero ¿hay algo similar en Python?....
8 jun. 2021 a las 17:56
1 - Intento convertir la columna "Días" a los días del número de días -> "-1 días +08: 22: 13.269259" a "-1" Fecha límite de 2 - y columna a solo una fecha -> "0021-06-09 00:00:00" a "09-06-21" >>>new['Days'] = (datetime.datetime.today() - pd.to_datetime(new['Deadline'], format=("00%y-%m-%d %H:%M:%S....
8 jun. 2021 a las 17:27
Me gustaría pegar un objeto para sobresalir, pero tengo problemas para transponerlo a una fila y dejar caer los años. El ejemplo está a continuación: c Out[274]: 2020 3.000000 2021 323.216667 2022 127.533333 2023 1.500000 2024 -148.000000 2025 -25.083333 2026 -48.133333 2027....
8 jun. 2021 a las 17:10
Tengo un contexto de datos PD cooc_all (Matriz simétrica) de la que me gustaría crear una lista que contenga todos los valores del contexto de datos. Actualmente, he hecho esto de la siguiente manera: pd_list = [] for i in range(0,40): for j in range(i, 40): pd_list.append(cooc_all[j][i....
8 jun. 2021 a las 16:55
Estoy tratando de iterar la siguiente lista que se recupera de la tabla HTML table = pd.read_html(url) He extraído la 3ra tabla: table1 = table[2] Estoy tratando de contar hasta cierta palabra en la lista de la variable de la lista1. La estructura de salida de la lista se muestra a continuación ....
8 jun. 2021 a las 15:05
Tengo un marco de datos de Pandas con varias filas que están cerca de los duplicados entre sí, excepto por un valor. Mi objetivo es fusionar esas filas y sumar el valor distinto. Aquí hay un ejemplo: names count subject A 2 physics A 3 physics A 3 chemistry B ....
8 jun. 2021 a las 14:00
Quiero eliminar un subconjunto de filas de un pandas DataFrame basado en una inspección groupby(). El primario DataFrame: >>> df name day fruit foobar 0 Tim 1 Apple 0 1 Tim 1 Apple 1 2 Tim 2 Apple 2 3 Anna 1 Banana 3 4 Ann....
8 jun. 2021 a las 13:42
Podría usar una mano en la función ISIN Pandas. Básicamente, necesito agregar datos en un proceso de datos de acuerdo con diferentes criterios por año. El problema es que necesito hacer muchas agregaciones sobre los datos (por ejemplo, el nombre del país, el programa de financiamiento, etc.). Para q....
8 jun. 2021 a las 13:21
Tengo el siguiente df: values_list = [[15, {'num':[0]}, 100], [20, {'num':[0]}, 50], [25, {'num':[0]}, 80], [45, {'num':[0], 'option':[1]}, 48], [40, {'num':[0]}, 70], [41, {'num':[0]}, 90], [51, {'num':[0]}, 111]] df = pd.DataFrame(values_list, columns=['Field_1', ....
8 jun. 2021 a las 12:43
¿Cómo puedo analizar las cadenas utilizando los mismos pandas lógicos que usarían al leer un CSV, donde el casting "Falso" a bool me daría False? Tengo valores de texto ingresados por los usuarios que necesito para insertar en un contexto de datos, se deben emitir automáticamente a la DTYPE de la co....
8 jun. 2021 a las 11:44
Entrada: df1 = pd.DataFrame([[101, 'DC1', 'QA,DEMO'], [101, 'EM5', 'QA,DEMO'], [102, 'RA6', 'PA,QA,GF'], [103, 'DC1', 'AB,LK'], [103, 'RA6', 'OO'], [103, 'PA4', 'AB,OO'] ] , columns=['Call_id', 'Ag....
8 jun. 2021 a las 10:45
Quiero alejar las columnas sin orden; Completamente pseudo-aleatoriamente, en una línea de código. Antes: A B 0 1 2 1 1 2 Después: B A 0 2 1 1 2 1 Mis intentos hasta ahora: df = df.reindex(columns=columns) df.sample(frac=1, axis=1) df.apply(np.random.shuffle, axis=1) ....
8 jun. 2021 a las 10:28
Estoy tratando de eliminar la fila idéntica que coincide entre dos marcos de datos. Sin embargo, ¿cuál es lo que estoy intentando las filas idénticas en el mismo marco de datos también se cae? Pero quiero conservar las filas idénticas del mismo marco de datos y suelte los que solo coinciden con otro....
8 jun. 2021 a las 10:23
Tuve que derretir los 4 archivos de datos y luego cambiar de nombre de la columna de valor cuando solo realice la codificación en cada DF, el código funciona, pero al hacer un bucle para el código no funciona? ¿Por qué? El bucle for: data_files = [df1, df2, df3, df4] names = ['child_mortality','inco....
8 jun. 2021 a las 10:15