sábado, 20 de setembro de 2014

Método do Quartil na Representação da Informação

Caros leitores, hoje falaremos sobre representação da informação. Suponhamos que nosso desafio seja representar a densidade populacional dos 5570 municípios brasileiros. Seria impossível uma interpretação correta da realidade através de uma de representação visual (intensidade de cores) se optássemos por representar cada valor único. Nesse contexto se faz necessário agrupar dados segundo padrões de semelhança. Para isso utilizamos um instrumental metodológico.

Na cartografia temática podemos construir representações quantitativa através de vários métodos: intervalos iguais, desvio padrão, quebras manuais, quebras naturais, quartile e outros. Esse post se dedica ao método dos quartile.

Definindo o Número de classes
Primeiramente se faz necessário definir o número de classes em que seus dados serão agrupados, é comum encontrar mapas que tenha de 4 a 8 classes. Entende-se que mapas com mais de 8 agrupamentos não facilitam o entendimento. Existe uma metodologia (STURGER) que equaciona essa questão nos seguintes termos: K= 1 + 3.33LogN
onde K= ao número de classes e N o número de valores não repetidos. 
Ainda que existe uma fórmula proposta para a definição do número de classes seu uso não é obrigatório, a experiência do analista muitas vezes permite a apresentação de soluções mais adequadas para a representação dos fenômenos.

Quartile
O método dos quartiles consiste em agrupar os dados com quantidades iguais de observações. Construímos um conjunto de observações aleatório e organizamos em uma tabela para facilitar o entendimento. Observe o quadro abaixo:

O primeiro quartil representa os 25% das observações, de menor valor, entre o segundo e terceiro quartis temos os valores centrais situados os valores 9 e 34, a mediana se encontra em 16,5. O último quartil inicia-se do 37 e vai até 50. Com esse instrumental analisamos onde e quanto. Onde estão os valores mais próximos da mediana, os valores mais baixos, os mais altos.

Os quartis nos permitem ter conjuntos com uma distribuição de observações mais equilibrado além de poder identificar imediatamente qual a posição de cada observação em relação ao todo. Se o valor associado a uma observação é mais central ou se está nos extremos.

Abaixo uma figura de como o ArcGIS organiza os dados sobre essa perspectiva, nessa figura, extraída do help online, os dados foram divididos em 7 grupos, observe que ele altera a amplitude de alguns agrupamentos a fim de obter conjunto com quantidades de observações semelhantes.

A escolha do método adequado para agrupar seus dados é determinante para o sucesso da sua análise. Situações podem ser postas em evidencia ou ocultadas. Padrões podem evidenciar a necessidade de ações e apontar onde elas devem se concentrar, hoje o GIS é uma realidade nos processos de tomada de decisão, assim a importância e responsabilidade do nosso trabalho só aumenta. 


Do discurso para o mapa
Apresento dois exemplos extraídos do material didático do curso de análise espacial do Inpe. Dois métodos diferentes foram usados para agrupar o mesmo conjunto de dados, no caso a proporção de crianças de 0 a 5 anos residentes em domicílios em que o responsável ou cônjuge é analfabeto e saneamento é inadequado. O primeiro método agrupa os dados dividindo a amplitude pelo número de classes definidas em intervalos iguais.

fonte da figura: Material didático do Curso de Análise Espacial de Dados Geográficos do Inpe

As cores quentes representam as áreas de maior atenção. Agora a mesmo fenômeno representado pelo método dos quartile, no caso divido em 10 partes, cada uma representando 10% dos dados.

Observe a alteração da quantidade áreas com cores quentes, isso porque o método está focada na distribuição dos dados, pelo tamanho dos agrupamentos não pela rigidez dos intervalos. Observe que a coluna quantidade apresenta valores semelhantes de geometrias associadas.

De forma geral não podemos dizer que o método dos intervalos iguais não seja válido, entendo que ele não é válido para representar esse fenômeno. Várias bibliografias apontam esse método como muito apropriado para fenômenos contínuos, como tipos de solos e distribuição de temperaturas. Mas podemos afirmar que o método dos quartile nos permite observar os 10, 20, 30% mais críticos num primeiro olhar.

Serviços de análise de dados geográficos, com alto rigor técnico, podem ser contratados em: www.geoanalytics.com.br
 
Web Analytics