En versiones anteriores de dplyr, si quisiera obtener recuentos de filas además de otros valores de resumen usando summarise(), podría hacer algo como library(tidyverse) df <- tibble( group = c("A", "A", "B", "B", "C"), value = c(1, 2, 3, 4, 5) ) df %>% group_by(group) %>% summari....
11 feb. 2021 a las 22:38
Asumamos los siguientes datos: df <- data.frame(x = c(1, 2), y = c(3, 4), z = c(5, 6)) Supongamos además que tengo un vector que contiene los nombres de las columnas en las que quiero trabajar, p. Ej. var_names_1 <- c("test", "x", "y") var_names_2 <- c("test", "z")....
3 feb. 2021 a las 23:21
Supongamos que tengo un conjunto de datos df en el que quiero hacer coincidir el valor de col X en los valores de varias columnas A to F y quiero devolver el nombre de la columna coincidente (en caso contrario, NA) en una nueva columna. Dput df <- structure(list(A = c(4L, NA, NA, NA), B = c(NA, 5L, ....
30 ene. 2021 a las 13:02
Digamos que tengo el siguiente data.frame df: # col1 col2 col3 othercol1 othercol11 # 1 Hola WHAT_hello2 Hola 10 3 # 2 WHAT_hello WHAT_hello WHAT_hello .......
20 ene. 2021 a las 17:23
Estoy teniendo problemas para lograr que mutate, cross y case_when funcione correctamente, he recreado una versión simple de mi problema aquí: a <- c(1:10) b <- c(2:11) c <- c(3:12) test <- tibble(a, b, c) # A tibble: 10 x 3 a b c <int> <int> <int> 1 1 2 3 2 2 ....
17 ene. 2021 a las 03:32
Tengo datos en el formato que se describe a continuación, donde todas las variables con las que necesito trabajar son NA o el nombre de la variable, y necesito cambiar las NA a 0 y las cadenas a 1. Lo estoy intentando ... .....
14 ene. 2021 a las 04:00
Tengo 18 pares de variables y me gustaría hacer cálculos matemáticos en pares para calcular 18 nuevas variables. La función across () en dplyr es bastante útil cuando se aplica una fórmula a una columna. ¿Hay alguna forma de aplicar across () a pares de columnas? Pequeño ejemplo con división simpl....
2 ene. 2021 a las 23:08
Tengo datos similares a este (aunque un conjunto de datos mucho más grande): correct.trial1 RT.trial1 correct.trial2 RT.trial2 correct.trial3 RT.trial3 1 1 473 0 337 1 426 2 1 496 1 407 1 ....
16 dic. 2020 a las 01:31
Quiero tener una función flexible usando summarize en la cual: la función de agregación la da el usuario la función de agregación puede utilizar más argumentos que se refieren a variables dentro de los datos mismos. Un buen ejemplo es el usuario que proporciona fun=weighted.mean() y especifica el ar....
11 nov. 2020 a las 03:28
Siento que debería haber una forma muy sencilla de hacer esto, pero no puedo resolverlo. Quiero usar across con una lista de variables y ayudantes tidyselect en un conjunto de datos grande, pero usaré iris como ejemplo. Antes de la actualización de dplyr 1.0, podía usar con éxito verbos con alcance ....
10 nov. 2020 a las 06:00
Estoy seguro de que la solución es una sola línea, pero me estoy golpeando la cabeza contra la pared. Vea el reprex muy breve al final de la publicación; ¿Cómo le digo a dplyr que quiero duplicar solo las columnas sin NA? Muchas gracias library(dplyr) #> #> Attaching package: 'dplyr' #> The followi....
27 oct. 2020 a las 16:20
Un resumen de mi objetivo Tengo la siguiente estructura de marco de datos: my.df <-data.frame("col1_A.C"=c("AA","AC","CC"), "col2_A.T"=c("TT","AT","TT"), "col3_C.G"=c("GG","CG","CG")) my.df # col1_A.C col2_A.T col1_C.G # 1 AA TT GG # 2 ....
21 oct. 2020 a las 08:00
Hola, estoy tratando de cambiar el nombre de algunas columnas agregando "Última" con la nueva versión de dplyr, pero sigo recibiendo este error. Error: `across()` must only be used inside dplyr verbs. Este es mi código data %>% rename(across(everything(), ~paste0("Last_", .))) Versión dplyr: v1.0.....
3 oct. 2020 a las 23:26
En mi marco de datos, quiero reemplazar todos los valores en ciertas columnas a NA. Test2 ID Sex Location Obs1 Obs4 Obs5 1 291978 FEMALE 2 16.5 4836 0.563636364 2 292429 FEMALE 2 20.2 5428 0.584158416 3 292466 FEMALE 2 19.2 48 0.005208333 4 293656 FEMALE ....
24 ago. 2020 a las 15:23
library(tidyverse, warn.conflicts = TRUE) #> Warning: package 'tidyverse' was built under R version 3.6.3 #> Warning: package 'ggplot2' was built under R version 3.6.3 #> Warning: package 'tidyr' was built under R version 3.6.3 #> Warning: package 'purrr' was built under R version 3.6.3 #> Warning: ....
1 ago. 2020 a las 04:40
Estoy tratando de reemplazar condicionalmente los valores en varias columnas en función de una coincidencia de cadena en una columna diferente, pero me gustaría poder hacerlo en una sola línea de código utilizando la función across (), pero sigo recibiendo errores que no funcionan No tiene mucho sen....
25 jun. 2020 a las 18:10
Pido disculpas por la larga pregunta, pero después de un tiempo no pude encontrar una solución por mí mismo. Tengo este marco de datos de juguete set.seed(23) df <- tibble::tibble( id = paste0("00", 1:6), cond = c(1, 1, 2, 2, 3, 3), A_1 = sample(0:9, 6, replace = TRUE), A_2 = sample(0:9, 6, re....
24 jun. 2020 a las 16:43
Digamos que tenemos una df de la siguiente manera: A B C D E 1 1 0 0 1 0 0 1 0 0 0 0 0 0 1 1 1 1 1 0 0 1 1 0 1 1 0 1 0 0 Entonces me gustaría hacer otra variable F que diga, si la suma de A: D es mayor que 1, F es 1 y A: D son 0 . Además, si E == 1, entonces F = 0. A....
23 jun. 2020 a las 18:28
Tengo estos datos: # A tibble: 20 x 6 ID style param1 param2 param3 param4 <dbl> <chr> <chr> <chr> <chr> <chr> 1 1 ar R78 NA NA NA 2 2 bg NA NA NA NA 3 3 bh NA NA NA NA 4 4 ar NA R78 NA NA 5 ....
18 jun. 2020 a las 14:42