ENS data FONDECYT
ENS2017
Bases disponibles en http://epi.minsal.cl/bases-de-datos/
Diabetes es definida como Glucosa en ayuno (8 o mas horas) >=126 o autoreporte diagnóstico (de acuerdo a pregunta di3, excluye diabetes en embarazo di4)
di3. Alguna vez un doctor, una enfermera u otro profesional de la salud le ha dicho a Ud. que ha tenido o que tiene o que padece de Diabetes (azúcar alta en la sangre)?
di4. ¿Eso ocurrió cuando estuvo embarazada?
Subpoblaciones
Base1: Diabéticos, sin previo diagnóstico
Base2: Diabéticos, con previo diagnóstico, sin control (HBGLICOA1C_AYUNO< 7)
Base1<-subset(ENS2017_vars, DIABETES_P1==1 & CONOCIMIENTO_DIABETES_P1==0)
Base2<-subset(ENS2017_vars, DIABETES_P1==1 & CONOCIMIENTO_DIABETES_P1==1 & CONTROL_DIABETES_P1==0)
Imputación Base1
Utilizo paquete R “mice”
set.seed(42)
imp0 <- mice(Base1, maxit=0)
pred1 <- imp0$predictorMatrix
meth1 <- imp0$method
Base1imp<-Base1 %>%
select(Folio_AP,IdEncuesta, Edad, Sexo, SBP, FC, Hemoglobina, aux_Hemoglobina_A1C, Colesterol_HDL, Colesterol_LDL_Calculado,
ta3, IMC, m4p1, m4p2, FPG_MDRD, Microalbuminuria,
d7,A10BA02,A10BB01,
Glucosa, m3p1,
d1_F1, di9, Trat_DM, as27, agnos_estudio, Zona, Fexp_EX1p_Corr)
imp0 <- mice(Base1imp, maxit=0)
pred1 <- imp0$predictorMatrix
meth1 <- imp0$method
meth1[c("Hemoglobina")] <- "cart"
pred1[,"Folio_AP"] <- 0 # don't use country factor
pred1[,"IdEncuesta"] <- 0 # don't use country factor
tempData <- mice(Base1imp, maxit=20, m=20, predictorMatrix=pred1, method=meth1)
long1 <- complete(tempData, action='long', include=TRUE)
long1$Trat_DM<-as.numeric(long1$Trat_DM)
long1$d1_F1<-as.numeric(long1$d1_F1)
long1$di9<-as.numeric(long1$di9)
long1$d7<-as.numeric(long1$d7)
long1_mean<-long1 %>%
group_by(Folio_AP)%>%
summarise_if(is.numeric, mean, na.rm = TRUE)
long1_mean$Trat_DM_01<-round(long1_mean$Trat_DM,0)
long1_mean$d1_F1_01<-round(long1_mean$d1_F1,0)
long1_mean$di9_01<-round(long1_mean$di9,0)
long1_mean$d7_01<-round(long1_mean$d7,0)
base1imputed<-long1_mean
write.csv(long1_mean,"ENS2017_Base1.csv")
Imputación Base2
# names(Base2)
Base2imp<-Base2 %>%
select(Folio_AP,IdEncuesta, Edad, Sexo, di3a,
SBP, FC, Hemoglobina, aux_Hemoglobina_A1C, Colesterol_HDL, Colesterol_LDL_Calculado,
ta3, IMC, m4p1, m4p2, FPG_MDRD, Microalbuminuria,
d7,A10BA02,A10BB01,
Glucosa, m3p1,
d1_F1, di9, Trat_DM, as27, agnos_estudio, Zona, Fexp_EX1p_Corr)
imp0 <- mice(Base2imp, maxit=0)
pred1 <- imp0$predictorMatrix
meth1 <- imp0$method
meth1[c("Hemoglobina")] <- "cart"
pred1[,"Folio_AP"] <- 0 # don't use country factor
pred1[,"IdEncuesta"] <- 0 # don't use country factor
tempData <- mice(Base2imp, maxit=20, m=20, predictorMatrix=pred1, method=meth1)
long1 <- complete(tempData, action='long', include=TRUE)
long1$Trat_DM<-as.numeric(long1$Trat_DM)
long1$d1_F1<-as.numeric(long1$d1_F1)
long1$di9<-as.numeric(long1$di9)
long1$d7<-as.numeric(long1$d7)
long1_mean<-long1 %>%
group_by(Folio_AP)%>%
summarise_if(is.numeric, mean, na.rm = TRUE)
long1_mean$Trat_DM_01<-round(long1_mean$Trat_DM,0)
long1_mean$d1_F1_01<-round(long1_mean$d1_F1,0)
long1_mean$di9_01<-round(long1_mean$di9,0)
long1_mean$d7_01<-round(long1_mean$d7,0)
write.csv(long1_mean,"ENS2017_Base2.csv")
base2imputed<-long1_mean