Tengo un marco de datos en R que contiene los siguientes datos

> df3
    care_uncare              risks
1            No High risk patients
2           Yes High risk patients
3           Yes High risk patients
4           Yes High risk patients
5           Yes  Low risk patients
6           Yes  Low risk patients
7            No  Low risk patients
8           Yes High risk patients
9           Yes  Low risk patients
10          Yes  Low risk patients
11          Yes High risk patients
12          Yes  Low risk patients
13           No  Low risk patients
14          Yes  Low risk patients
15          Yes  Low risk patients
16          Yes High risk patients

Donde la variable care_uncare contiene valores Sí / No y la variable riesgos contiene pacientes de alto riesgo / pacientes de bajo riesgo.

Quiero generar un resumen o visualización que muestre el número total de pacientes que tienen care_uncare como 'Sí' pero que tienen riesgos como 'Pacientes de alto riesgo'

¿Cómo puedo hacer este análisis?

1
IronMaiden 13 mar. 2021 a las 00:11

2 respuestas

La mejor respuesta

Puedes usar filter y summarise

library(dplyr)
df %>% filter(care_uncare == "Yes" & risks == "High risk patients") %>%
summarise( Total_Yes_High = n() )

  a     care_uncare risks             
  <chr> <chr>       <chr>             
1 2     Yes         High risk patients
2 3     Yes         High risk patients
3 4     Yes         High risk patients
4 8     Yes         High risk patients
5 11    Yes         High risk patients
6 16    Yes         High risk patients
1
TarJae 13 mar. 2021 a las 04:02

Esto puede fácilmente con esto:

df3 %>% group_by(care_uncare, risks) %>% summarise( n = n() )
0
Manu 14 mar. 2021 a las 08:14