8 Padrões Pontuais II

8.1 Exemplo com os dados de dengue em Dourados/MS

Nesta aula serão utilizados os dados da monografia de Isis Rodrigues Reitman, apresentada ao Curso de Geografia da Faculdade de Ciências Humanas da Universidade Federal da Grande Douradosos/MS, em março de 2013. O título da monografia é “DISTRIBUIÇÃO ESPACIAL DOS CASOS DE DENGUE NO PERÍMETRO URBANO DE DOURADOS-MS E SUA RELAÇÃO COM OS FATORES SOCIOAMBIENTAIS E POLÍTICOS”

ATENÇÃO ATENÇÃO ATENÇÃO

Devido a maneira que o Windows acessa as url usando a internet é necessario mudar a opção default dele para que possa usar apropiadamenet os recursos https, ftps, etc… A linha abaixo deve ser utilizanda antes de usar as funções que acessam esse tipo de recurso.

Lendo a tabela da população por setor censitário e baixando os shapes files do contorno e por setor censitário de Dourados/MS

 [1] "contorno.dbf"                                     "contorno.sbn"                                    
 [3] "contorno.sbx"                                     "contorno.shp"                                    
 [5] "contorno.shx"                                     "dourados.zip"                                    
 [7] "Setor_UTM_SIRGAS.dbf"                             "Setor_UTM_SIRGAS.prj"                            
 [9] "Setor_UTM_SIRGAS.sbn"                             "Setor_UTM_SIRGAS.sbx"                            
[11] "Setor_UTM_SIRGAS.shp"                             "Setor_UTM_SIRGAS.shx"                            
  • Lendo e plotando os casos de dengue georreferenciados em Dourados/MS

Plotando os casos de dengue segundo o sexo.

Plotando apenas o contorno de Dourados/MS.

Usando a ggplot() para fazer um gráfico do contorno e dos casos.

Formatando os pontos que representam os casos de dengue na classe ppp (point pattern)

Uma vez que temos o objeto em formato ppp, podemos verificar a melhor largura de banda sugerida por vários métodos disponíveis pela biblioteca spatstat para os casos de Dengue em Dourados/MS.

Nome Comando R Resultado
Diggle bw.diggle(dengue.ppp) 14.1335
Cronie and van Lieshout’s (CvL) bw.CvL(dengue.ppp) 1630.7311
Scoot bw.scott(dengue.ppp) 771.6202, 467.906
likelihood cross-validation bw.ppl(dengue.ppp) 178.0477

Existem ainda outros métodos para determinar automaticamente a largura de banda. É possível usa-los para ajudar a escolher o melhor valor, mas é preciso verificar se essa largura de banda apresenta plausibilidade dentro do contexto do estudo.

Fazendo o mapa de kernel dos casos de dengue segundo várias larguras de banda.

Fazendo o kernel segundo sexo, criando padrões para cada sexo e em seguida gerando um kernel para cada categoria.

Fazendo a razão de kernel entre os sexos.

Como podemos observar no kernel acima, não foi detectada variabilidade espacial na razão entre os sexos. Observe o efeito de borda que ocorre no Norte, onde um único indivíduo do sexo masculido é responsável pelo efeito de borda.

Extraindo os centróides dos setores censitários de Dourados/MS.

Fazendo o kernel dos pontos dos centróides dos setores censitários de Dourados/MS. Tal distribuição, pode se sugerida como uma proxy da verdadeira distribuição populacional de Dourados/MS

Gerando um kernel de atributo com a população de cada setor censitário. O parâmetro weights nos permite entrar o valor do atributo a ser ponderado. Desta forma é possível gerar um kernel de um valor especificado (atributo).

Calculando a taxa média de casos (por 1.000 hab) de dengue do município de Dourados/MS

[1] 5.853

Gerando a razão de kernel (casos/população) x 1000

Plotando a distribuição das taxas por dengue estimadas via razão de kernel. É possível verificar que a mediana das razões de kernel é bem próxima a taxa média de casos (por 1.000 hab) em Dourados/MS.

Sobrepondo a malha da população por setores censitários (dados de área) com os pontos de casos de dengue (padrões pontuais)

Razão de casos confirmados vs não confirmados

Como verificamos abaixo temos 713 casos confirmados de Dengue e 304 não confirmados , será que existe algum padrão espacial para os casos não confirmados ?

FALSE TRUE 304 713

Para visualizarmos vamos inicialmente criar dois objetos do tipo ppp uma para confirmados e outro para não confirmados.

Em seguida vamos fazer um kernel para cada um deles.

Aparentemente existem diferenças nos padrões dos casos confirmados e descartados de dengue. O próximo passo é fazer uma razão de kernel para averiguar essa diferença de padrões.

  • A razão não evidencia grande diferença, por que ?

  • Qual seria a melhor maneira de evidenciar essa diferença ?

8.2 Modelos Generalizados Aditivos (GAM)

  • Um modelo aditivo generalizado (Hastie and Tibishirani, 1990) é um modelo linear generalizado com um preditor linear envolvendo a soma de funções suavizadas das covariáveis + os efeitos fixos das mesmas.

\[\eta = \sum X \beta + f_1(x_{1i}) + f_2(x_{2i}) + \ldots\]

8.3 Modelos Espaciais Generalizados Aditivos

  • São modelos aditivos generalizados tendo como um dos preditores o efeito suavizado das componentes espaciais.

\[\eta = \sum X \beta + f_1(x_{1i}) + f_2(x_{2i}) + f_3(latitude_{i}, longitude_{i}) + \ldots\]

Exemplo GAM Dourados - Tipo Caso/Controle

Vamos ajustar um modelo GAM do tipo “caso/controle”, onde casos serão representados pelos casos de dengue confirmados e controles os casos não confirmados.

Family: binomial Link function: logit

Formula: CLASSI_FIN == 1 ~ s(X, Y)

Parametric coefficients: Estimate Std. Error z value Pr(>|z|)
(Intercept) 1.0069 0.0795 12.7 <2e-16 *** — Signif. codes: 0 ‘’ 0.001 ’’ 0.01 ’’ 0.05 ‘.’ 0.1 ’ ’ 1

Approximate significance of smooth terms: edf Ref.df Chi.sq p-value
s(X,Y) 21.9 26.2 144 <2e-16 *** — Signif. codes: 0 ‘’ 0.001 ’’ 0.01 ’’ 0.05 ‘.’ 0.1 ’ ’ 1

R-sq.(adj) = 0.161 Deviance explained = 14.7% UBRE = 0.085615 Scale est. = 1 n = 1017

  • Podemos observar que o modelo espacial vazio parace evidenciar que o componente espacial *s(X,Y) é significativo, ou seja, existe indícios que o espaço geográfico está influenciando a variável de desfecho.

Agora vamos verificar a saída gráfica original do modelo.

  • Essa saída não parece ser muito intuitiva, apesar ser possível observarmos as áreas onte apresentão ‘pistas’ de haver um risco maior e as áreas onde estão mais isentas de casos de dengue.

Vamos agora tentar melhorar tal saída gráfica.

[1] 1 2

Podemos também inspecionar a superfície do erro padrão do modelo.

[1] 3 4

Note que no centro, onde existe a maior qunatidade de pontos, o erro e bem menor que nas áreas onde existem menos pontos e nas bordas !

Incluindo no modelo a variável sexo.

Family: binomial Link function: logit

Formula: CLASSI_FIN == 1 ~ CS_SEXO + factor(CS_RACA) + s(X, Y)

Parametric coefficients: Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.9830 0.1097 8.96 <2e-16 *** CS_SEXOM -0.0215 0.1530 -0.14 0.888
factor(CS_RACA)2 -0.6188 0.3746 -1.65 0.099 .
factor(CS_RACA)3 -0.2041 0.9833 -0.21 0.836
factor(CS_RACA)4 0.2949 0.2099 1.41 0.160
factor(CS_RACA)5 -0.5668 1.1361 -0.50 0.618
factor(CS_RACA)9 0.8469 0.8517 0.99 0.320
— Signif. codes: 0 ‘’ 0.001 ’’ 0.01 ’’ 0.05 ‘.’ 0.1 ’ ’ 1

Approximate significance of smooth terms: edf Ref.df Chi.sq p-value
s(X,Y) 21.8 26.2 143 <2e-16 *** — Signif. codes: 0 ‘’ 0.001 ’’ 0.01 ’’ 0.05 ‘.’ 0.1 ’ ’ 1

R-sq.(adj) = 0.162 Deviance explained = 15.2% UBRE = 0.094684 Scale est. = 1 n = 1011

Como já visto anteriormente na análise exploratória espacial de pontos, a variável sexo não é significativa significativa.

[1] 5 6

8.4 Bibliografia sugerida

Wood, S.N. (2017) Generalized Additive Models: an introduction with R (2nd edition), CRC.