Un marco de datos es una estructura de datos tabular. Por lo general, contiene datos donde las filas son observaciones y las columnas son variables de varios tipos. Mientras que "marco de datos" o "marco de datos" es el término utilizado para este concepto en varios idiomas (R, Apache Spark, deedle, Maple, la biblioteca de pandas en Python y la biblioteca de DataFrames en Julia), "tabla" es el término utilizado en MATLAB y SQL.

dataframe...

Hola tengo una df como: COL1 COL2 0.005554 0.35200000000000004 5.622e-11 0.267 0.006999999999999999 0.307 2.129e-14 0.469 2.604e-14 0.39 1.395e-60 0.27899999999999997 8.589999999999998e-74 0.29600000000000004 1.025e-42 0.4270000000000001 Sé cómo redondear el dígito en el CO....
27 ago. 2020 a las 16:07
Tengo un marco de datos con 2415 columnas y quiero eliminar columnas duplicadas consecutivas. Es decir, si la columna 1 y la columna 2 tienen los mismos valores, quiero eliminar la columna 2. Escribí el siguiente código pero no parece funcionar: for i in (0,len(df.columns)-1): if (df[i].tolist()....
27 ago. 2020 a las 05:10
Tengo un gran conjunto de datos (300 millones de filas) y necesito un algoritmo eficiente (o rápido) que haga el trabajo. Así que aquí hay algunas filas de conjuntos de datos. db = pd.DataFrame({'A': [2,3,4,5], 'T': [1,2,6,7], 'G': [8, 1, 4, 6], 'C': [1,1 , 3, 4], 'basecall' : ['G'....
26 ago. 2020 a las 19:29
Existe un amplio conjunto de datos, un ejemplo simple es df<-data.frame("id"=c(1:6), "ax"=c(1,2,2,3,4,4), "bx"=c(7,8,8,9,10,10), "cx"=c(11,12,12,13,14,14)) Estoy buscando una forma de asignar los valores en "ax" a la columna "bx" y "cx". Aquí, imagina que tenemos mi....
26 ago. 2020 a las 03:42
import pandas as pd df = pd.DataFrame([[1, 'li'], [2, 'la'], [3, 'lu']], columns=(['index', 'col'])) class Test: def __init__(self, data): self.data = data self.data.set_index('index', inplace = True) test1 = Test(df) test2 = Test(df) print(test1.data) print(test2.data) Es....
25 ago. 2020 a las 18:12
Tengo un marco de datos que se muestra a continuación. Quiero copiar un valor de columna de la fila anterior donde está presente el mismo valor ('Nombre'). df: Name Age Ethnicity Sam 17 E Chris 0 B Tom 19 P Sam 22 NaN Chris 18 NaN Tom 7 NaN Y esto es l....
25 ago. 2020 a las 16:07
Tengo datos en el siguiente formato. El primer elemento del vector se refiere al encabezado y el segundo al final del vector se refiere a los valores del encabezado. Quiero poner los datos en formato tabular / estructurado (o marco de datos con encabezado y valores). k <- c("Afv.dato : Type Termin l....
25 ago. 2020 a las 15:27
Tengo un diccionario como se muestra a continuación. d1 = { 'start_date' : '2020-10-01T20:00:00.000Z', 'end_date' : '2020-10-05T20:00:00.000Z', 'n_days' : 6, 'type' : 'linear', "coef": [0.1,0.1,0.1,0.1,0.1,0.1] } D1: es la entrada del usuario, el usuario p....
25 ago. 2020 a las 13:39
Tengo un problema similar con mi pregunta anterior: Eliminar cero de cada columna y reorganizarlo con python pandas / numpy Pero en este caso, necesito eliminar NaN. He probado muchas soluciones, incluida la modificación de soluciones de mi publicación anterior: a = a[a!=np.nan].reshape(-1,3) Pero ....
25 ago. 2020 a las 13:33
Estoy trabajando con python3.7 y tengo un problema con una versión reciente de pandas. Aquí está mi código. import pandas as pd import numpy as np data = {'col_1':[9087.6000, 9135.8000, np.nan, 9102.1000], 'col_2':[0.1648, 0.1649, '', 5.3379], 'col_nan':[np.nan, np.nan, np.nan, np.n....
25 ago. 2020 a las 09:25
Tengo los datos que se muestran a continuación, In [20]: test_data Out[22]: ut first_name_ini 0 WOS:000386321800001 Enriquez, F 1 WOS:000386321800001 Troyano, J 2 WOS:000386321800001 Lopez-Solaz, T 3 WOS:000386321800002 da Rochaa, S 4 WOS:000386321800002 Bra....
25 ago. 2020 a las 04:48
Tengo un dato numpy.ndarray que se ve a continuación y quiero aplanarlo para poder manipularlo. Encuentre mis datos de muestra a continuación: sample_data=[list([{'region': 'urn:li:region:9194', 'followerCounts': {'organicFollowerCount': 157, 'paidFollowerCount': 0}}, {'region': 'urn:li:region:7127'....
25 ago. 2020 a las 03:25
Soy realmente nuevo en R y esta es probablemente una pregunta muy básica. Consulte mi código de muestra. Me gustaría representar el porcentaje de personas que realizan un trabajo semanal durante un período de 24 horas. ¿Cómo puedo cambiar el eje y en porcentajes en lugar de totales? Probé este códig....
25 ago. 2020 a las 00:34
Intento obtener un marco de datos 3D a partir de 2 marcos de datos que tienen la misma forma. Si tomamos el siguiente script como ejemplo, quiero crear un marco de datos 3D que tenga 2 filas (ayb), 3 columnas (A, B y C) y 2 elementos (df1 y df2). Y también para que quede claro, traté de explicar mi ....
23 ago. 2020 a las 12:00
Estoy tratando de convertir el marco de datos en un diccionario (ya que son más rápidos al filtrar por clave) que estoy usando actualmente t3 = time() r={} for i in df.index.unique(): r[i]=[] r[i].append(df.loc[i].values) print(round((time()-t3), 1), "s") Este tipo de conversión es lento. ¿....
21 ago. 2020 a las 23:34
Tengo un bucle que cada vez crea un marco de datos (DF) con un formulario DF ID LCAR RCAR ... LPCA1 LPCA2 RPCA2 0 d0129 312.255859 397.216797 ... 1.098888 1.101905 1.152332 Y luego agregue ese marco de datos a un marco de datos existente (main_exl_df) con este for....
20 ago. 2020 a las 18:15
Estoy tratando de enlazar datos con otra fila adicional. Pero sigo recibiendo el siguiente error: Error in `.rowNamesDF<-`(x, value = value) : duplicate 'row.names' are not allowed In addition: Warning message: non-unique values when setting 'row.names': ‘1’, ‘2’, ‘3’, ‘4’ Estoy casi seguro de ....
19 ago. 2020 a las 18:45
En la Databricks referencia de visualización indica Los DataFrames de PySpark, pandas y koalas tienen un método de visualización que llama a la función de visualización de Databricks. Puede llamarlo después de una simple operación de DataFrame Con ejemplo diamonds_df = spark.read.csv("/databricks-da....
18 ago. 2020 a las 15:34
Supongamos que tengo el siguiente marco de datos: df = pd.DataFrame({'id': [1,2,3,3,3], 'v1': ['a', 'a', 'c', 'c', 'd'], 'v2': ['z', 'y', 'w', 'y', 'z']}) df id v1 v2 1 a z 2 a y 3 c w 3 c y 3 d z Y quiero transformarlo a este formato: {1: [('a', 'z')], 2: [('a', 'y')], 3: [('....
18 ago. 2020 a las 15:29
Tengo un marco de datos df1 que tiene la columna srv_val. Tengo que reemplazar 0000000000 con solo 0 si algún valor de cadena en la columna src_val contiene 0000000000 Imprimir los valores de la columna en el marco de datos print(srv_val) 0000000089.56 0000000023.45 0000000000.00 0000000000.89 0000....
18 ago. 2020 a las 15:25
Tengo un marco de datos: df = pd.DataFrame({'col1': [69, 77, 88], 'col2': ['barfoo', 'foo', 'bar']}) print(df) col1 col2 0 69 barfoo 1 77 foo 2 88 bar También tengo una función que devuelve dos valores basados en la cadena: def get_first_n_second(string)....
18 ago. 2020 a las 10:57
¿Cómo se combinan df_1 y df_2 para lograr el marco de datos deseado? Es de esperar que los cuadrados de color brinden una rápida visualización de lo que se requiere. es decir. Luchando con este: se agradecen todas las ayudas / sugerencias. Gracias.....
18 ago. 2020 a las 10:56
Estoy tratando de calcular el valor de Dataframe con Pandas. Pero no pude calcular "FW_result" y "SS_result". df1: category num standard FW U-1 3 FW U-2 3 FW U-3 2 SS U-4 3 SS U-5 2 df2: name U-1 U-2 U-3 U-4 U-5 A 3 1 1 2 1 B ....
18 ago. 2020 a las 10:12
Tengo un conjunto de datos en R con la siguiente estructura: sub ses valor Sub1 0 .1454 Sub1 1 .0857 Sub2 0 .1123 Sub2 1 .2345 Sub3 0 .2105 Sub3 1 .0665 df <- data.frame(sub=c("sub1","sub1","sub2","sub2","sub3","sub3"),ses=c(0,1,0,1,0,1),value=c(.1454,.0857,.1123,.2345,.2105,.0665)) Con el fi....
18 ago. 2020 a las 02:49
Estoy leyendo una gran base de datos en múltiples marcos de datos. Que funciona todo el tiempo. Entonces tengo marcos de datos individuales. Luego, escribo cada marco de datos en un archivo csv. Inicialmente tiene 34 columnas. Después de esto, leí el archivo csv en un nuevo marco de datos y ahora te....
17 ago. 2020 a las 23:31