segunda-feira, 4 de julho de 2016

Geocodificação de endereços com software livre de GIS


A geocodificação é o processo em que uma listagem de endereços passa a ter uma referência geográfica, no caso um par de coordenadas. Referenciar seus dados de negócio é o primeiro passo para poder analisar espacialmente suas informações.

Serviços de gestão de saúde pública geocodificam casos de doenças e buscam identificar padrões de agrupamento para então inferir uma possível causa. Assim como as grandes redes de varejo geocodificam os endereços dos seus clientes para identificar o padrão sócio econômico dos clientes mais próximos e assim definir e ajustar o mix de produtos das suas lojas.
 
Nesses últimos dias me vi diante da necessidade de geocodificar nada menos do que um milhão e meio de endereços únicos na cidade de São Paulo, representando quase a completude das fachadas da cidade de São Paulo. Sem uma base proprietária proprietária ou um sistema proprietário com software e dados à minha disposição.

Nas minhas consultorias tenho sempre a preocupação de atender as necessidades do cliente dentro da sua realidade financeira. Adequando e construindo soluções com abordagens inovadoras.
Recorri a base do Centro de Estudos da Metrópole que recentemente lançou uma versão atualizada, assim do ponto de vista dos dados meu problema já estava bem resolvido. Optei por testar a geocodificação no Terraview. Tanto a base como o software sem custo de aquisição. Em um primeiro teste com pouco mais de cem endereços os resultados foram satisfatórios, porém eu desejava que os pontos não ficassem sobre a linha, que fosse aplicado um deslocamento de 10 metros e que nas extremidades também não houvesse pontos mapeados. Para o usuário, de fato ninguém instala um estabelecimento ou mora sob a linha, na minha perspectiva ainda pretendo agrupar esses dados em polígonos e preciso portanto separar par e ímpar.
Endereços Geocodificados na Av Ipiranga, posicionados sobre a linha.
 
Frente a essa dificuldade e a meta no objetivo optei por editar as geometrias, gerando uma base para geocodificar os endereços pares e outra para os endereços ímpares. Como primeiro passo gerei um ponto nos cruzamentos e a partir dele um buffer e em seguida apaguei o trecho contido no buffer. A ideia aqui é evitar que algum endereço seja geocodificado no meio do cruzamento.

Como declarado gerei as feições próprias para cada face de quadra, fiz um tratamento último dos endereços padronizado tipo de logradouro, título e preposição e parti para a geocodificação.
Também na região central os dados geocodificados no Terra View.


 O software tem ampla documentação em português assim não vou focar nessa questão, os dados foram geocodificados em dois lotes, primeiro ímpar, depois par. Somando os dois lotes o tempo de processamento não chegou a duas horas para quase um milhão e meio de pontos.
A base de endereços já era muito boa, quase a totalidade dos registros tinham cep completo e válido, com os tratamentos adicionais ultrapassamos 95% geocodificação. Um valor ótimo que só é possível se a tabela de endereços for completa e a base de ruas atual.
O software além de permitir exportar para shape, também gera relatório resumido e detalhado, o detalhado demonstra para cada registro qual o endereço ele validou em relação a base.
A base do Centro de Estudos da Metrópole abrange toda a RMSP, para outras regiões também podemos apresentar soluções inovadoras garantindo acurácia no nível do setor censitário.
Web Analytics