Pandas es una biblioteca de Python para la manipulación y análisis de datos, p. marcos de datos, series de tiempo multidimensionales y conjuntos de datos transversales que se encuentran comúnmente en estadísticas, resultados de ciencias experimentales, econometría o finanzas. Pandas es una de las principales bibliotecas de ciencia de datos en Python.

Más sobre pandas...

Tengo una lista de diccionarios en Python que se ve a continuación list = [{'entityType': 'source', 'databaseName': 'activities', 'type': 'POSTGRES', 'children': [{'id': '3c144414-0c73-41df-9f0e-4dd7cb5af46e', 'path': ['Activities (DEV)', 'public'], 'type': 'CONTAINER', 'contai....
5 oct. 2021 a las 13:19
Me gustaría convertir mi DataFrame en un JSON específico. Intento usar to_dict () pero por el momento no encontré los parámetros correctos para replicar la salida. ¿Tienes idea? Mi código : import pandas as pd data = { 'alt' : ["BeattheBeachmark NEW", "BeattheBeachmark NEW"], 'Mod' : ["GA",....
5 oct. 2021 a las 11:03
Tengo este marco de datos panda timestamp EG2021 EGH2021 2021-01-04 33 Nan 2021-02-04 45 65 Y estoy tratando de reemplazar el nombre de la columna con el nuevo nombre asignado en un archivo de Excel como este OldId NewId EG2021 LER_EG2021 EGH....
5 oct. 2021 a las 10:48
Hay un marco de datos: data = pd.DataFrame({'o':[1,1,2,1,2], 'd':[1,2,1,3,3], 'distance':[3,5,10,6,8]}) Quiero promediar la tercera columna cuando los índices de las dos primeras columnas son iguales o están invertidos. Por ejemplo, si o = 1, d = 2, distance = 5 o....
5 oct. 2021 a las 06:57
Este problema es un poco difícil de entender para mí, así que espero poder explicarlo correctamente a continuación. Tengo un marco de datos con muchas filas pero solo 3 columnas como a continuación: data = {'line_group': [1,1,8,8,4,4,5,5], 'route_order': [1,2,1,2,1,2,1,2], 'StartEnd':['20888->2085....
5 oct. 2021 a las 05:44
Estoy tratando de filtrar una columna que contiene números de teléfono en Python. En esa columna, quiero obtener todos los números de teléfono que comienzan con +61. ¿Podrías ayudarme con eso? ¿Los datos de muestra están a continuación?....
5 oct. 2021 a las 03:15
Estoy interesado en asignar valores para duplicar filas en un marco de datos de Pandas como se muestra a continuación. El marco de datos está a continuación: - data_1 = {'ID': ['001', '003', '001','002','002','002'], 'Name': ["XX1", "XX3", "XX1", "XX2", "XX2", "XX2"]} df = pd.DataFrame(data_1) ....
5 oct. 2021 a las 01:08
print(dfs["Categorias"]) Estoy recibiendo esto 0 wordpress, criação de sites 1 criação de sites 2 e-commerce, criação de sites, wordpress 3 marketing digital, vendas ¿Cómo puedo eliminar elementos repe....
4 oct. 2021 a las 23:50
Tengo un marco de datos de muestra como se indica a continuación. import pandas as pd data = {'ID':['A','A','A','A','A', 'B','B','B','C','C','C','C'], 'Date':['9/20/2021 4:34:57 AM', '9/21/2021 6:54:22 PM', '9/28/2021 5:54:22 PM', '9/30/2021 6:54:22 PM', '10/5/2021 6:54:22 PM', ....
Estoy usando juypter para analizar un archivo csv grande. Dentro del archivo hay alrededor de 40.000 valores str y 15 valores flotantes. Estoy tratando de convertir todos los valores de str a numéricos para poder analizar todos los datos. Sin embargo, no puedo debido a los valores flotantes aleator....
4 oct. 2021 a las 21:54
Tengo un marco de datos df1 como: idx Col1 2 v2 3 v3 4 v4 5 v5 Quiero volver a indexar df1 para los valores df1.reindex([1, 2, 3, 4, 5, 6]) para obtener lo siguiente: idx Col1 1 v2 2 v2 3 v3 4 v4 5 v5 6 v5 Donde todos los valores menores que 2 obtuvieron el valor del índice 2, ....
4 oct. 2021 a las 21:24
Entonces, tengo un marco de datos de Pandas con comida y cocina que les gusta a algunas personas. Tengo que dividirlos en columnas, para que cada comida o cocina se convierta en una columna. Cada comida / cocina viene después de una coma, pero si rompo mi cadena solo con comas, perderé el contenid....
4 oct. 2021 a las 21:20
Tengo un marco de datos que crea una puntuación final basada en otras puntuaciones almacenadas en valores de columna. Junto con estas otras columnas puntuadas, hay una columna que muestra cuánto tiempo en meses un jugador ha estado activo. Estas columnas son números enteros que se escalan del 1 al ....
4 oct. 2021 a las 19:29
Tengo un marco de datos que lo guardo en un archivo de Excel en una ubicación determinada. Actualmente lo hago de esta manera: df.to_excel(r'C:\Users\user_name\Downloads\test.xlsx') El problema al que me enfrento es que cuando inserto el nuevo marco de datos, sobrescribe los antiguos. Quiero agre....
4 oct. 2021 a las 18:28
Tengo un archivo para procesar, pero el nombre de las columnas y el orden cambian con el tiempo. Quiero cambiar el nombre de las columnas de una manera que pueda funcionar incluso si son un cambio en el archivo. Para exp: a veces es exp 1: postcode brand abde exp1 enter code here exp 2 Pos....
4 oct. 2021 a las 17:50
Tengo un marco de datos que tengo que dividir en 2 marcos de datos. Ejemplo: Project_Number Indication S100 X S100 Y S200 Z S300 P S300 Q S300 R S400 S Ahora tengo que dividir en....
4 oct. 2021 a las 16:28
¿Hay alguna forma de reasignar valores en un marco de datos de pandas usando el método .apply ()? Tengo este código: import pandas as pd df = pd.DataFrame({'switch': ['ON', 'OFF', 'ON'], 'value': [10, 15, 20]}) print (df, '\n') def myfunc(row): if row['switch'] == 'ON': ....
4 oct. 2021 a las 15:41
Tengo un marco de datos de pandas con un número único de usuario: data_frame = pd.DataFrame({'uniq_num' :['1qw3','2wed','3das','4frr','533ew','612w']}) Quiero pasar esta columna a la consulta SQL donde uso el operador IN: SELECT users FROM database where users IN ("here I want to pass my dataframe,....
4 oct. 2021 a las 15:37
Puede parecer una pregunta duplicada, pero es ligeramente diferente a la que he encontrado aquí. Tengo los siguientes pandas DF (sin la nueva columna) y quiero crear la nueva_columna | chicken | cow | moose | goat | pigeon | new column | |:--------|:----|:------|:-----|:----....
4 oct. 2021 a las 13:36
Estoy tratando de calcular la diferencia de tiempo (en días) entre el tiempo de espera de la visita anterior del cliente y la última visita del cliente en el tiempo. time difference = latest in time - previous out time Aquí hay una muestra de datos de entrada. Tabla de salida de muestra El enfoque....
Tengo el siguiente código: folder_names = [] spreadsheet_contents = [] all_data = pd.DataFrame() current_directory = Path.cwd() for folder in current_directory.iterdir(): folder_names.append(folder.name) file_n = '*.csv' spreadsheet_path = folder / file_n spread....
4 oct. 2021 a las 10:19
Tengo una muestra de datos: muestra de datos Quiero convertirlo dividiendo el encabezado de la columna en dos columnas separadas y transponer los valores. El resultado debería verse así: resultado ¿De qué manera puedo dividir una celda en dos encabezados de columna con la cadena y los números y co....
4 oct. 2021 a las 10:06
Necesito iterar un marco de datos, para cada fila necesito crear una ID basada en dos columnas existentes: nombre y sexo. Eventualmente agrego esta nueva columna al df. df = pd.read_csv(file, sep='\t', dtype=str, na_values="", low_memory=False) row_ids = [] for index, row in df.iterrows(): ....
4 oct. 2021 a las 04:49
Estoy tratando de extraer datos de resultados de búsqueda de una API en un sitio web y ponerlos en un marco de datos de pandas. Pude extraer con éxito la información de la API en un formato JSON. El siguiente paso en el que estoy atascado es cómo recorrer los resultados de búsqueda en una página en....
3 oct. 2021 a las 20:35
Mi muestra df se ve así: sid score cat_type 101 70 na 102 56 PNP 101 65 BAW 103 88 SAO 103 50 na 102 42 VVG 105 79 SAE .... df_groupby = df.groupby(['sid']).agg( score_max = ('score','max'), cat_type_first_ro....
3 oct. 2021 a las 19:45