En un servicio de alquiler de coches, el 50% de los coches se devuelven a tiempo. Se estudia una muestra de 20 coches de alquiler. Para calcular la probabilidad de que los 20 coches se devuelvan a tiempo, utilizo la distribución binomial:

dbinom(x=20, size=20, prob=0.5)

¿Cómo puedo calcular la media para determinar la cantidad más probable de autos devueltos? Para calcular la media utilizo:

mean(dbinom(x=20, size=20, prob=0.5))

Que devuelve:

[1] 9.536743e-07

¿Cómo puedo utilizar la media para calcular el número más probable de coches devueltos?

0
blue-sky 16 oct. 2018 a las 14:11

2 respuestas

La mejor respuesta

El most likely number of returned cars y el mean number of returned cars no son en general lo mismo.

En particular, el primero está limitado a ser un número entero; el último tiene un valor potencialmente continuo.

La respuesta a la primera proviene de dbinom:

xx = 0:20
xx[which.max(dbinom(xx, size=20, prob=0.5))]
# [1] 10

Si quería la media, solo tiene que ponderar por xx:

sum(xx*dbinom(xx, size = 20, prob = .5))
# [1] 10

Por supuesto, la media de una variable binomial es prob * size, por lo que solo necesita seleccionar un valor de prob para el cual no es un número entero para ver la diferencia:

prob = sqrt(2)/2
xx[which.max(dbinom(xx, size=20, prob=prob))]
# [1] 14
sum(xx*dbinom(xx, size = 20, prob = prob))
# [1] 14.14214

Si realmente insiste en usar mean, probablemente quiera simular el promedio de la distribución binomial, en cuyo caso debe usar rbinom en su lugar:

mean(rbinom(1e6, size = 20, prob = .5))
# [1] 10.00235
2
MichaelChirico 16 oct. 2018 a las 11:21

El valor esperado es E (X) = np, que es el resultado más probable.

El modo es:

  1. piso de (n + 1) p, si (n + 1) p es 0 o un número no entero,
  2. (n + 1) p y (n + 1) p-1, si (n + 1) p está en {1, ..., n}
  3. n, si (n + 1) p = n + 1
1
user2974951 16 oct. 2018 a las 11:18