¡Mi pregunta puede ser muy simple!

Tengo una variable desordenada . Me gustaría cortar esta variable en grupos k de igual tamaño y luego calcular la media de cada uno de estos grupos de valores.

vec = c(1:10,1:5,2:6)
mean(vec[1:4])
mean(vec[5:8])
mean(vec[9:12])
mean(vec[13:16])
mean(vec[17:20])

Gracias de antemano por su ayuda!

-1
Flora Grappelli 28 abr. 2020 a las 20:20

4 respuestas

vec = c(1:10,1:5,2:6)

# get quartiles, quantiles, or any prob
q <- quantile(vec, c(0.25,.5,.75, 1) )  

# get the means
lapply(q, function(x){mean(vec[vec<=x])})

    $`25%`
[1] 1.6

$`50%`
[1] 2.636364

$`75%`
[1] 3.5

$`100%`
[1] 4.5
0
desval 28 abr. 2020 a las 17:25

Gracias a esta respuesta, encontré una solución

vec = c(1:10,1:5,2:6)
aa= split(vec, floor(5 * seq.int(0, length(vec) - 1) / length(vec)))
lapply(aa, mean)
 # To be compared:
mean(vec[1:4])
mean(vec[5:8])
mean(vec[9:12])
mean(vec[13:16])
mean(vec[17:20])
0
Flora Grappelli 28 abr. 2020 a las 17:39

Otra forma sería usar aggregate

vec <- c(1:10,1:5,2:6)

mystep <- 4

bins <- rep(1:ceiling(length(vec)/mystep), each = mystep)
bins <- bins[1:length(vec)]  # removes any "overflow" values due to ceiling
xy <- data.frame(vec, bins)

aggregate(vec ~ bins, data = xy, FUN = mean)

  bins vec
1    1 2.5
2    2 6.5
3    3 5.5
4    4 3.5
5    5 4.5
1
Roman Luštrik 28 abr. 2020 a las 18:29

Dividido en 5:

lapply(split(vec, sort(vec%%5)), mean)
$`0`
[1] 2.5

$`1`
[1] 6.5

$`2`
[1] 5.5

$`3`
[1] 3.5

$`4`
[1] 4.5
1
desval 28 abr. 2020 a las 17:47