9 Geoestatística
9.1 Conceito
Podemos definir como sendo uma análise de um atributo espacialmente contínuo amostrado em localizações fixas.
Os dados compreendem um conjunto de localizações (em geral latitudes e longitudes), mas agregados a cada uma delas, uma medida. Como por exemplo:
O volume de chuva medido em estações de monitoramento;
O número de ovos do Aedes aegypti postados em ovitrampas.
9.2 Objetivos
Entender o padrão dos valores amostrados nestas localizações;
Estimar valores em localizações sem medidas dado os valores observados em localizações com medidas.
9.3 Principais aplicações
Geologia
Ciências ambientais (chuva, temperatura, umidade, poluentes no ar, etc.)
9.4 Exemplo
Estações de monitoramento pluviométrico da cidade do Rio de Janeiro.
Interesse: Fazer previsão para alguns pontos da cidade ou para toda a cidade.
9.5 Efeitos
Os fenômenos espaciais são o resultado de uma mistura de efeitos de primeira e segunda ordem.
Efeitos de primeira ordem: variação do valor médio do processo no espaço, ou seja, tendência global ou de grande escala.
Efeitos de segunda ordem: resultam da estrutura de correlação espacial ou dependência espacial do processo, ou seja, são efeitos locais ou de pequena escala.
9.6 Formalizando
Seja Y(s) um vetor aleatório nas localizações s, onde s varia continuamente sobre D, um subconjunto fixo de R2 .
Em geral existem n estações de coleta de dados onde são observadas as variáveis (Y(s1),...,Y(sn)).
Podemos particionar os dados espacialmente contínuos em dois termos: uma média e um erro associado:
Y(s)=μ(s)+e(s)
- A análise espacial é composta por um conjunto de procedimentos cuja finalidade é a escolha de um modelo que considere explicitamente a componente espacial existente.
9.7 Efeito de primeira ordem: regressão linear
Supondo μ(s)=μ(x,y)=β0+β1x1+β2x2, temos
Y(s)=μ(s)+e(s)
Y(s)=β0+β1x1+β2x2+e(s) sendo e(s)∼N(0,σ2)
9.8 Efeito de segunda ordem: regressão espacial
Supondo μ(s)=μ(x,y)=β0+β1x1+β2x2, temos
Y(s)=μ(s)+e(s)
Y(s)=β0+β1x1+β2x2+e(s) sendo e(s)∼N(0,σ2)
Deste modo, denotamos a média e a variância do processo por:
E(Y(s))=μ(s) e Var(Y(s))=σ2(s)
A covariância desse processo em dois pontos distintos, si e sj , será dada por:
C(si,sj)=E((Y(si)−μ(si))(Y(sj)−μ(sj))
E a correlação será:
ρ(si,sj)=C(si,sj)σ(si)σ(sj)
9.9 Análise exploratória
Inicialmente são utilizadas técnicas de análise exploratórias e de visualização dos dados.
Para os efeitos de primeira ordem:
Mapa com a localização dos pontos e a intensidade do processo.
Plot de Y(s) versus cada coordenada, por exemplo latitude e longitude.
Para os efeitos de segunda ordem:
Covariograma
Variograma
9.10 Simplificações: Estacionariedade e Isotropia
Quando o processo é estacionário:
A média E(Y(s))=μ para todo s
A variância Var(Y(s+h)−Y(s))=2γ(h)
para a qual 2γ(h) é chamado de variograma e γ(h) é o semi-variograma.
- A covariância
C(si,sj)=C(si−sj)=C(h)
Sendo C(h) o covariograma do processo.
Quando o processo é isotrópico:
C(si,sj)=C(||si−sj||)=C(h)
para a qual ||.|| denota distância euclideana.
9.11 Variograma empírico
Um estimador natural para o variograma (variograma empírico), considerando a distância h, é:
2γ2(h)=1n(h)∑si−sj=h(y(si)−y(sj))2
para a qual a soma é feita sobre todos os pares de dados observados com uma distância h e n(h) é o número de pares com distância h.
Exemplo: Variograma empírico para os dados de chuva do Paraná.
9.11.1 Relação entre variograma, covariograma e correlograma
Para um processo espacial estacionário, o covariograma, o correlograma e o variograma fornecem informações similares;
O covariograma e o correlograma têm a mesma forma, sendo que o correlograma possui como máximo o valor 1;
O variograma também tem a mesma forma do covariograma, mas aparece “invertido”;
Enquanto o covariograma começa de um máximo em σ2 em h=0 e decresce até 0, o variograma inicia em 0 e cresce até um máximo de σ2.
9.11.2 Estrutura do variograma
Observando o gráfico do variograma podemos destacar alguns elementos importantes:
Nugget (Efeito pepita): representa os possíveis erros de medida, por exemplo, devidos ao processo de coleta. É o valor de γ(0)=τ2;
Sill (Patamar): é o valor do variograma onde concluímos não haver mais correlação entre as observações, ou que elas sejam pouco correlacionadas;
Range (Amplitude): é o valor da distância a partir da qual concluímos não haver mais correlacão entre as observações, ou que elas são pouco correlacionadas. No variograma a amplitude é o ponto de x onde a curva atinge um patamar.
9.11.3 Variogramas para modelos isotrópicos
Alguns exemplos de funções de variogramas para modelos isotrópicos:
- Esférica:
γ(h)={σ2h>ϕσ2{23(hϕ)−12(hϕ)3}0<h<ϕ
- Exponencial
γ(h)=σ2(1−exp{−(hϕ)}) , h>0
- Gaussiano
γ(h)=σ2(1−exp{−(hϕ)2}) , h>0
O modelo gaussiano, por exemplo, apresenta um crescimento lento e um comportamento parabólico próximo a origem e fornece um modelo para fenômenos extremamente contínuos.
O modelo exponencial cresce mais rapidamente perto da origem mas a aproximação da função ao patamar é mais lenta.
Frequentemente os modelos são ajustados aos dados observados no variograma empírico, apenas por uma comparação visual.
Por exemplo, para os dados de chuva do Paraná, utilizando diferentes variogramas:
9.12 Modelagem em Geoestatística
Em geral, assumimos que Y(s) segue um processo Gaussiano tal que
Y(.)∼PG(μ(.),c(.;.))
sendo μ(.) é a tendência do processo Y(.) e c(.;.), sua função de covariância.
A tendência pode ser explicada através de funções polinomiais das coordenadas geográficas, funções suaves (ex: thin plate splines) e covariáveis medidas nas mesmas localizações.
Os variogramas e covariogramas empíricos correspondem a uma estimativa da estrutura de covariância, sob a hipótese de alguma estacionaridade.
Se não temos estacionaridade, os variogramas e covariogramas empíricos podem ser dominados por efeitos de primeira ordem.
A matriz de covariância deve ser simétrica e positiva definida.
A matriz de covariância é estimada através de modelos paramétricos.
Por exemplo: função de covariância exponencial, gaussiana, Matérn, etc.
9.12.1 Modelando dados de Geoestatística - Dados de chuva no Paraná
Podemos ajustar o seguinte modelo:
chuva(s)=β0+β1lat(s)+β2long(s)+Z(s)+e(s)
para o qual:
Z(.) é um processo Gaussiano com média 0 e estrutura de correlação, ρ(.;ϕ), dada pela função exponencial e variância igual a σ2.
A componente e(.) representa o erro de medida (efeito pepita) tal que e(.)∼N(0,τ2).
9.13 Krigagem
O principal interesse em geoestatística é prever valores de uma variável que é espacialmente contínua, em localizações em que esta não foi medida.
A técnica de prever para localizações não medidas, é chamada frequentemente de krigagem.
O nome deriva do geólogo sul africano D. G. Krige que desenvolveu a primeira versão do método.
Estima o processo em uma localização não observada s′, ˆY(s′) .
Uma forma simples de obter estimativas para uma localização não medida é:
ˆy(s′)=ˆμ(s′)
Neste caso, estamos considerando apenas efeitos globais.
Podemos utilizar o conhecimento sobre a função de covariancia C para adicionar à previsão uma estrutura de efeitos locais.
Tipos de krigagem:
Krigagem simples
Krigagem ordinária
Krigagem universal
Krigagem bayesiana
9.13.1 Krigagem Universal
Assume-se que existe um componente de tendência, ou seja, μ(s)=x(s)β .
Vamos estimar ˆy(s′) através de uma combinação linear ponderada dos valores observados nas localizações medidas.
ˆy(s′)=n∑i=1λi(s′)y(si)
sendo λi(s′) o peso dado a cada y(si) e esse peso é função da covariância.
9.13.2 Algumas considerações da krigagem em geral:
Vale lembrar que todo processo está suscetível à escolha dos modelos para a tendência e para o variograma.
Uma maneira de avaliar todo o procedimento é fazer uma validação cruzada.
Na validação cruzada, cada elemento observado, y(si), é retirado e utilizando o restante dos dados fazemos uma previsão para a localização retirada. Como resultado, obtemos um conjunto de n erros de previsão entre o valor observado e o valor predito.
Esses erros podem ser analisados e podemos avaliar o processo de krigagem e se necessário podemos fazer ajustes no modelo para o variograma ou para a superfície de tendência.
9.13.3 Krigagem - Dados de chuva no Paraná
O modelo ajustado com as estimativas dos parâmetros são:
chuva(s)=421.8−0.15lat(s)−0.39long(s)+Z(s)+e(s)
sendo:
Z(s) um processo Gaussiano com média 0 e estrutura de correlação exponencial com ϕ=130 e variância igual a σ2=685.
A variância do efeito pepita τ2=480.
Utilizando a krigagem universal, obtemos:
9.15 Aplicação 1 - Dados de temperatura
Lendo o banco:
local <- "https://raw.githubusercontent.com/ogcruz/dados_eco_2023/main/dados/"
temperatura <- read.table(paste0(local, "temperatura.dat"))
Carregando o pacote geoR:
Transformando em objeto geodata:
Number of data points: 40
Coordinates summary
latitude longitude
min 230.0 32.5
max 234.5 34.0
Distance summary
min max
0.500 4.743
Data summary
Min. 1st Qu. Median Mean 3rd Qu. Max.
16.43 17.13 17.94 17.83 18.38 19.07
Análise exploratória:
Controlando o tamanho dos pontos:
Dividindo os dados em quantis:
Modificando o formato dos pontos:
Removendo a tendência, isto é, fazendo o gráfico dos resíduos de uma regressão linear nas coordenadas:
Outros gráficos:
Calculando o variograma:
variog: computing omnidirectional variogram
variog: computing omnidirectional variogram
Ajustando os parâmetros do variograma de maneira interativa
Utilizando a função variofit para estimar os parâmetros da função de covariância:
variofit: covariance model used is matern
variofit: weights used: npairs
variofit: minimisation function used: optim
variofit: searching for best initial value ... selected values:
sigmasq phi tausq kappa
initial.value "0.13" "0.59" "0" "0.5"
status "est" "est" "est" "fix"
loss value: 0.967481567978338
variofit: covariance model used is exponential
variofit: weights used: npairs
variofit: minimisation function used: optim
variofit: searching for best initial value ... selected values:
sigmasq phi tausq kappa
initial.value "0.13" "0.59" "0" "0.5"
status "est" "est" "est" "fix"
loss value: 0.967481567978338
variofit: covariance model used is gaussian
variofit: weights used: npairs
variofit: minimisation function used: optim
variofit: searching for best initial value ... selected values:
sigmasq phi tausq kappa
initial.value "0.13" "0.59" "0" "0.5"
status "est" "est" "est" "fix"
loss value: 0.815547531351043
variofit: covariance model used is spherical
variofit: weights used: npairs
variofit: minimisation function used: optim
variofit: searching for best initial value ... selected values:
sigmasq phi tausq kappa
initial.value "0.13" "1.76" "0" "0.5"
status "est" "est" "est" "fix"
loss value: 0.835325143183182
par(mfrow = c(2, 2))
plot(variog.temp2, main = "matern")
lines(wls1)
plot(variog.temp2, main = "exponencial")
lines(wls2)
plot(variog.temp2, main = "gaussian")
lines(wls3)
plot(variog.temp2, main = "esférico")
lines(wls4)
par(mfrow = c(1, 1))
plot(variog.temp2)
lines(wls1)
lines(wls2, col = 2)
lines(wls3, col = 3)
lines(wls4, col = 4)
legend("bottomright", legend = c("matern", "exponencial",
"gaussiano", "esférico"), col = 1:4, lty = 1)
9.15.1 Krigagem
resp.kg <- krige.conv(temp.geo, loc = temp.geo$coords,
krige = krige.control(cov.pars = c(0.14, 1.6)))
## krige.conv: model with constant mean
## krige.conv: Kriging performed using global neighbourhood
Interpolando para a grade
grade <- expand.grid(seq(230, 234.5, length.out = 200),
seq(32.5, 34, length.out = 200))
resp.kg2 <- krige.conv(temp.geo, loc = grade, krige = krige.control(cov.pars = c(1.52,
1.6)))
## krige.conv: model with constant mean
## krige.conv: Kriging performed using global neighbourhood
9.16 Repita a análise para o banco de ovos em Higienópolis
Lendo o banco:
higi <- read.table(paste0(local, "ovoshigi.dat"))
higi.borda <- read.table(paste0(local, "points_higi.dat"))
Transformando em objeto geodata:
Number of data points: 40
Coordinates summary
x y
min 677963 7469028
max 678725 7469672
Distance summary
min max
6.083 826.473
Data summary
Min. 1st Qu. Median Mean 3rd Qu. Max.
909 3944 6663 6025 7992 12655
9.16.1 Resumindo
Os principais tipos de kriging são:
Krigagem simples: é o tipo mais básico de kriging. Assume que a média local é constante e igual à média da população.
Krigagem universal: é uma extensão da krigagem simples que permite que a média local varie.
Cokrigagem: é um método que permite estimar uma variável a partir de dados de outras variáveis espacialmente dependentes.
Krigagem bayesiana é uma extensão da krigagem clássica que incorpora uma distribuição de probabilidade para os valores estimados. Essa distribuição de probabilidade permite que a krigagem bayesiana faça estimativas mais robustas e confiáveis, especialmente em casos de dados incompletos ou ruidosos.A krigagem bayesiana é um método complexo, mas existem muitos softwares disponíveis para implementá-la.
As principais bibliotecas do R para krigagem são:
Biblioteca R | Métodos de krigagem suportados | Características |
---|---|---|
geoR | Simples, universal, bayesiana | Geoestatística |
gstat | Simples, universal, bayesiana | Geoestatística |
spBayes | Bayesiana | Bayesiana |
9.17 Bibliografia sugerida
Isaaks and Srivastava; An Introduction to Applied Geostatistics 1st Edition, 1989.
Cressie, N. A. Statistics For Spatial Data. Revised edition. Iowa State Univesity, New York: A Wiley Interscience Publication, 1993.
Diggle, Peter J. & Ribeiro Jr, Paulo Justiniano; Model-based Geostatistics Series: Springer Series in Statistics, 2007. (Primeira edição 1999)
Pebesma, E.J., 2004. Multivariable geostatistics in S: the gstat package. Computers & Geosciences, 30: 683-691.
Finley, A. O., Banerjee, S., & Gelfand, A. E. (2015). spBayes for Large Univariate and Multivariate Point-Referenced Spatio-Temporal Data Models. Journal of Statistical Software, 63(13), 1–28. https://doi.org/10.18637/jss.v063.i13