Un marco de datos es una estructura de datos tabular. Por lo general, contiene datos donde las filas son observaciones y las columnas son variables de varios tipos. Mientras que "marco de datos" o "marco de datos" es el término utilizado para este concepto en varios idiomas (R, Apache Spark, deedle, Maple, la biblioteca de pandas en Python y la biblioteca de DataFrames en Julia), "tabla" es el término utilizado en MATLAB y SQL.

dataframe...

Aquí está mi marco de datos: ID Tell Number 0 1 Perhaps 2 1 1 Yes 6 2 1 No 9 3 2 Yes 4 4 2 Ye 7 5 2 No 8 6 3 Ye 15 7 3 Perhaps 2 8 3 No 6 9 3 Yes 2 # Creating the dictio....
18 jun. 2020 a las 00:28
Supongamos que tengo los siguientes datos: import pandas as pd boxes = {'Color': ['Green','Green','Green','Blue','Blue','Red','Red','Red'], 'Shape': ['Rectangle','Rectangle','Square','Rectangle','Square','Square','Square','Rectangle'], 'Price': [10,15,5,5,10,15,15,5] } df....
17 jun. 2020 a las 23:53
Tengo un marco de datos como el que se muestra a continuación df1 = pd.DataFrame({'person_id': [11, 21, 31, 41, 51], 'date_1': ['12/30/1961', '05/29/1967', '02/03/1957', '7/27/1959', '01/13/1971'], 'date_2': ['07/23/2017','05/29/2017','02/03/2015',np.n....
17 jun. 2020 a las 18:41
Tengo dos marcos de datos en R que se ven de la siguiente manera: # A B C D # 4 12 1 6 # 3 5 3 8 # 6 1 9 4 Donde A, B, C, D son nombres de columna y # id value # A 10 # B 15 # C 12 # D 20 Donde id y valor son nombres de columna Estoy tratando de escribir un código para....
17 jun. 2020 a las 18:06
Tengo un dato: test_df <- data.frame(x1 = c("a", "b", "c", NA, NA), x2 = sample(1:5), x3 = c(T, NA, F, T, NA), x4 = c(NA, NA, 1, 2, 3), stringsAsFactors = F) colset1 <- c("x1", "x2", "x3") colset2 <- c("x2", "x....
17 jun. 2020 a las 12:07
0 1 2 Ticket Open Time 3 5302684589 2020.06.17 01:32:13 ... 4 5302717457 2020.06.17 03:11:57 5 NaN 0 6 Closed P/L: Closed P/L: 7 Ticket Open Time 8 5302718245 2020.06.17 03:12:14 ... Tengo una base de datos que he cargado como marco de dato....
17 jun. 2020 a las 06:46
Tengo un marco de datos que se ve de la siguiente manera: df <- data.frame(Name = c("BB", "AA", "AA", "BB", "DD", "AA", "DD", "DD", "CC"), string = c("a11", "a120", "a120", "a8", "a45", "a11", "a140", "a8", "a45") , value = rnorm(9, mean = 0, 1)) Name string value BB....
17 jun. 2020 a las 02:31
Disculpas por el (potencialmente) pobre título, pero me cuesta entender cómo describirlo yo mismo. Tengo un conjunto de datos que, cuando se lee en un marco de datos de pandas, tiene aproximadamente la siguiente forma: import pandas as pd import numpy as np df_all = pd.DataFrame(np.random.randn(2, ....
17 jun. 2020 a las 00:05
Tengo un DataFrame con casi 100 columnas. Necesito seleccionar col2 a col4 y col54. ¿Como lo puedo hacer? Intento df = df.loc [:, 'col2': col4 '] pero no puedo agregar col54....
16 jun. 2020 a las 22:45
Mi muestra de datos es: a <- data.frame(a1=c('a','b','c','d','e'), a2=c('b','a','d','c','f'), a3=c(0.1,0.3,0.5,0.1,1)) Lo que quiero hacer es combinar las columnas a1 y a2, y ordenar las cadenas al mismo tiempo. Entonces, los datos deberían cambiar a: a1 a2 a3 a1....
16 jun. 2020 a las 10:38
Soy nueva en el marco de datos aquí. Tengo una lista de diccionarios que obtuve de un script de Python: result = [{'Name':'J','age':'5','address':'California'}, {'Name':'Q', 'age':'10','address':'newYork'} ] Quiero que esta salida esté en un archivo csv donde el nombre de la columna sea "info" y c....
15 jun. 2020 a las 15:28
¿Cómo puedo seleccionar filas Pandas DataFrame para un grupo de meses con el formato aaaa-mm y no aaaa-mm-dd? Dado el siguiente código: import pandas as pd import numpy as np # Create a DataFrame of rows between 2018-01-01 and 2018-12-31 rng = pd.date_range('2018-01-01', periods=365, freq='D') df ....
15 jun. 2020 a las 06:37
Estoy intentando combinar tres marcos de datos que totalizan más de 120,000 características y 206,000 filas. Los tres marcos de datos son matrices de términos de documentos. Aquí está el código: new_df = pd.concat([df_1, df_2], axis = 1, sort = False) Como puede ver, estoy usando la función concat ....
15 jun. 2020 a las 00:22
Tengo una trama de datos que se parece a: A B C D 0 1.2 0 1.1 3.2 1 2.3 2.2 2.2 2.5 2 1.1 1.5 0 1.7 3 0 1.1 1.4 1.2 4 3.3 3.0 1.7 1.7 5 1.1 1.0 2.2 2.5 6 5.0 5.0 5.0 5.0 Me gustaría encontrar la frecuencia con l....
14 jun. 2020 a las 21:48
Estoy buscando una manera de fusionar dos marcos de datos df1 y df2 sin ninguna condición, sabiendo que df1 y df2 tienen la misma longitud Por ejemplo: df1: +--------+ |Index | +--------+ | 0| | 1| | 2| | 3| | 4| | 5| +--------+ df2 +--------+ |Value | +-----....
14 jun. 2020 a las 19:55
Aquí está mi DF actual: DF: User time distance Jeff 00:04:00 10 Mike 00:01:00 2 Mike 00:05:00 4 Jeff 00:08:00 4 Estoy buscando agregar dos nuevas columnas: avgtime y avg speed (distance / time). El tiempo promedio y el promedio de vel se calculan para....
14 jun. 2020 a las 16:28
Considere a continuación dos marcos de datos (longitud desigual). df1 = pd.DataFrame({'date': ['2016-10-08', '2016-11-08','2016-12-08','2017-01-08'], 'qty': [1,8,2,4]}) df2 = pd.DataFrame({'date': ['2016-11-12', '2017-01-12'], 'factor': [2,3]}) >>> df1 date qty 0 2016-10-08 1 1 2016-....
14 jun. 2020 a las 13:40
Estoy teniendo un marco de datos con valores de NA df <- data.frame("About" = c("Ram","Std 8",NA,NA,NA,"John", "Std 9", NA, NA,NA,NA), "Questions" = c(NA,NA,"Q1","Q2","Q3",NA,NA,"Q1","Q2","Q3","Q4"), "Ratings" = c(NA,NA,7,7,7,NA,NA,7,7,7,7), stringsAsFactors = FALS....
13 jun. 2020 a las 11:51
Tengo un marco de datos que se ve así. Solo order es único. vendor order order_class time 33 33 42 22/12/2018 33 39 189 25/12/2018 35 197 91 19/01/2019 35 22 189 18/12/2018 35 11 189 30/11/2018 ¿Cómo giro mi datafr....
13 jun. 2020 a las 10:44
Tal como dice el título, estoy tratando de convertir mis etiquetas de DataFrame para escribir datetime. En el siguiente intento de solución, extraje las etiquetas del DataFrame a date_index e intenté convertirlas a datetime utilizando la función DatetimeIndex.to_datetime, sin embargo, mi compilador ....
13 jun. 2020 a las 06:39
Así que soy bastante nuevo en R y estoy trabajando con un conjunto de datos muy grande de crecimiento / mortalidad de árboles durante varios años. Como la mortalidad no siempre se registró correctamente, necesito buscar mediciones en cada fila (puede ser el diámetro a la altura del pecho (DBH) o el ....
13 jun. 2020 a las 01:21
Df.head (10) XYZVal 0 {"X":"56.68","Y":"51.56","Z":"100"} 1 {"X":"58.05","Y":"52.37","Z":"62.6"} 2 {"X":"59.32","Y":"54.48","Z":"69.59"} 3 {"X":"58.51","Y":"36.36","Z":"82.76"} 4 {"X":"65.21","Y":"60.26","Z":"71.06"} 5 {"X":"57.64","Y":"52.07","Z":"67.89"} 6 {"X":"58.24","Y":"50","....
12 jun. 2020 a las 22:15
Tengo un marco de datos debajo id action ================ 10 CREATED 10 111 10 222 10 333 10 DONE 10 222 10 UPDATED 777 CREATED 10 333 10 DONE Me ....
12 jun. 2020 a las 19:35
Tengo la siguiente trama de datos: Company_ID Year Metric_1 Metric_2 Bankrupt 1 2010 10 20 0.0 1 2011 NaN 30 0.0 1 2012 30 40 0.0 1 2013 50 NaN 1.0 2 2012 50 60 0.0 2 ....
12 jun. 2020 a las 18:33
Tengo un marco de datos y en la columna "roles", cada fila tiene un valor de "estudiantes" o "profesor". Quiero reemplazar estos valores con "st" o "te" en consecuencia. roles_complete <- c("students","teacher") roles_standard <- c("st", "te") data$roles <- stri_replace_all(data$roles, regex= roles_....
12 jun. 2020 a las 17:42