A continuación, he incluido datos de un estudio de investigación de PEW. ¿Cuál es el método para combinar probabilidades para llegar a un compuesto de, por ejemplo, un hombre negro de 18 años?

Example

0
Craig_VG 16 feb. 2018 a las 08:23

2 respuestas

La mejor respuesta

Como señaló Imran, no se puede deducir la respuesta de los datos limitados que están disponibles. Si está dispuesto a hacer una suposición simplificadora, puede avanzar. Sin embargo, tenga en cuenta que si esta suposición es válida o no, solo se puede responder obteniendo datos más detallados.

Aquí vamos. OP pide P (teléfono celular | edad, raza, género). Según la regla de Bayes, esto es:

P(cell phone|age, race, gender)
  = P(age, race, gender, cell phone) / P(age, race, gender)
  = P(age, race, gender|cell phone) P(cell phone) / P(age, race, gender)

La suposición simplificadora es que la edad, la raza y el género son independientes dado el estado del teléfono celular. Nuevamente, si esto es válido no se puede responder con los datos disponibles. Asumiendo eso, tenemos:

P(age, race, gender|cell phone)
  = P(age|cell phone) P(race|cell phone) P(gender|cell phone)

Ahora aplique la regla de Bayes a cada término:

P(age|cell phone) = P(cell phone|age) P(age) / P(cell phone)
P(race|cell phone) = P(cell phone|race) P(race) / P(cell phone)
P(gender|cell phone) = P(cell phone|gender) P(gender) / P(cell phone)

En este punto tenemos:

P(age, race, gender, cell phone)
  = P(cell phone|age) P(cell phone|race) P(cell phone|gender)
    P(age) P(race) P(gender) / P(cell phone)^2

Sea P1 = P (edad, raza, sexo, teléfono celular) y P0 = P (edad, raza, sexo, sin teléfono celular). Entonces P (edad, raza, sexo) = P1 + P0, y

P(cell phone|age, race, gender) = P1/(P1 + P0) = 1/(1 + P0/P1)

Ahora, felizmente, se cancelan algunos términos:

P0/P1 = foo/bar

Con

foo = P(no cell phone|age) P(no cell phone|race) P(no cell phone|gender) / P(no cell phone)^2
bar = P(cell phone|age) P(cell phone|race) P(cell phone|gender) / P(cell phone)^2

Algunos ejemplos:

P(cell phone|age = 18-29, race=black, gender=male)
  = 1 / (1 + ((0 * 0.02 * 0.05) / 0.05^2) / ((1 * 0.98 * 0.95) / 0.95^2))
  = 1

P(cell phone|age = 30-49, race=black, gender=male)
  = 1 / (1 + ((0.02 * 0.02 * 0.05) / 0.05^2) / ((0.98 * 0.98 * 0.95) / 0.95^2))
  = 0.992

P(cell phone|age = 65+, race=white, gender=female)
  = 1 / (1 + ((0.15 * 0.06 * 0.06) / 0.05^2) / ((0.85 * 0.94 * 0.94) / 0.95^2))
  = 0.794

Entonces, hay algunos resultados. Nuevamente, recuerde que estos resultados dependen de una suposición que solo se puede verificar con más datos.

2
Robert Dodier 19 feb. 2018 a las 00:52

No hay suficiente información para determinar exactamente cuántas personas en un grupo combinado tienen un teléfono celular, porque no sabemos exactamente cómo se superponen esos grupos .

Consideremos un ejemplo más simple: de cada 100 personas, 50 son hombres y 50 como queso. ¿Cuántos son los hombres a los que les gusta el queso?

Claramente no tenemos suficiente información, porque a ninguno de los hombres a todos les podría gustar el queso.

El mismo concepto se aplica a los datos de los teléfonos móviles y, además, es difícil siquiera pensar en un rango de posibilidades.

Por ejemplo, considere cuántos hombres hispanos tienen teléfonos celulares. Debería estar entre el 95% y el 98%, ¿verdad? ¡Incorrecto! Imagínese que hay 10.000 hombres en la encuesta, 990 mujeres hispanas, pero solo 10 hombres hispanos. Podríamos tener 9.5k hombres no hispanos, 980 mujeres hispanas y 0 hombres hispanos que tengan un teléfono celular, lo que nos da un 0% de hombres hispanos con un teléfono celular. O con un razonamiento similar podríamos construir un caso en el que el 100% de los hombres hispanos tengan un teléfono celular.

Sin embargo, si tenemos datos sobre exactamente cuántos de cada grupo fueron encuestados, es posible que pueda encontrar algunos rangos posibles que sean más estrechos que 0-100%. Por ejemplo, en el ejemplo de los hombres a los que les gusta el queso, si 60 de las personas fueran hombres, podríamos decir que al menos a 10 les debe gustar el queso.

2
Imran 16 feb. 2018 a las 17:55