quarta-feira, 28 de janeiro de 2015

Objetivos Estratégicos - Elemento chave para a integração das tecnologias Geograph Information System (GIS) e Business Intelligence

A estratégia da organização deve definir as tecnologias e as integrações necessárias na composição do instrumental de inteligência que deverá apoiar a construção dos objetivos de longo, médio e curto prazo.

As definições menos decomposta, de BI o definem com o processo de coleta de dados (internos e externos), estruturação dos dados, validação dos dados, construção do Data Warehousing, extração de informações através das técnicas de mineração de dados e geração de relatórios analíticos. Então definir o quê coletar, organizar, extrair e representar está na base do problema. Alinhar aos objetivos de alto nível da organização, ao seu planejamento estratégico, não restringindo as ações operacionais pode dar um fôlego maior a solução que se pretende implantar.

Admitindo que os leitores do blog já tem um domínio sobre os conceitos relacionados ao GIS, partimos para a inserção do problema do onde. O famoso onde, delimita e limita no território muitos problemas relacionados aos objetivos de alto nível de uma organização. Nos parece que quanto mais alto o nível do problema mais presente é a geografia.

Para não restringir apenas a visões de varejo, enquanto ramo de negócio. Pensemos em demandas sociais, elas não são uniformes no território, dependente de muitos fatores. Teremos que olhar para as desigualdes regionais, infraestrutura, concentração econômica, perfil econômico, redes de acesso, questões climáticas, densidade populacional, perfil de renda e etário, oferta de profissionais, entre outros aspectos, são questões tensionadas pela geografia.

Assim uma solução de BI que pretenda apoiar tomadores de decisão na esfera governamental deverá ser alimentada por uma base de dados que deve contemplar informações territoriais em todas as escalas que se faça necessário analisar e posteriormente representar a informação.

Exemplificando um planejador que tenha no seu planejamento estratégico a melhoria dos indicadores de educação no Estados precisará desse dado decomposto, por distritos de grandes cidades, cidades, regiões metropolitanas e outros regionalizações.

A ESRI oferta componentes para a integração entre o BI e o GIS em diferentes plataformas, abaixo a arquitetura de uma solução integrada com Cognos.


Dessa forma nos parece que a necessidade da integração se defini nos objetivos da organização. A tecnologia está a serviço dos objetivos. Antes de discutir entre as diferentes plataforma é necessário se ter claro quais perguntas se pretende responder com essa solução e qual seu alcance.

A integração de sistema de gestão, informação e inteligência tem potencial elevado para apoiar o uso racional de recursos, assim pode ofertar benefícios as organizações públicas, privadas, cidadãos ou seja a toda a sociedade.

sexta-feira, 31 de outubro de 2014

Representação cartográfica do processo eleitoral e democracia

Tem atraído minha atenção a quantidade de mapas elaborados na intenção de comunicar ao eleitor o resultado eleitoral e suas características regionais. No entanto, a valorização da cartografia sem a devida atenção aos métodos de representação tem contribuído para uma compreensão equivocada da realidade em vez de revelar a complexidade do processo eleitoral.

Representações que tratam apenas do candidato vencedor de cada território levam uma comunicação equivocada de homogeneidade. Como se em algum lugar todos os eleitores tivesse feito uma única escolha. Essa representação não contempla o resultado das urnas.

Representações binárias de fenômenos sociais tendem a alimentar interpretações binárias desses fenômenos.

Como geógrafo e profissional de sistemas de informação geográfica entendo que devo contribuir ao debate de forma propositiva. Apresento abaixo um mapa que tem o objetivo de representar a porcentagem de cada candidato por estado. Com o objetivo de representar o resultado do segundo da forma mais fiel possível a realidade.

Entendo que esse mapa é necessário para que possamos compreender nossa própria diversidade de opiniões. É fundamental numa sociedade democrática o reconhecimento da opinião divergente. Aquele que não concorda comigo existe e é um sujeito tão qualificado a fazer escolhas como eu. Esse é o ponto de vista que pretendo defender.

Mesmo em estados com maior polarização como, por exemplo, em São Paulo posição onde o candidato do PSDB obteve um excelente desempenho 35,7 % dos eleitores optaram pela candidatura governista. Na outra ponta, na Bahia onde Dilma obteve pouco mais de 70% dos votos próximo de 30% dos eleitores optaram pela candidatura oposicionista. Os casos acima são extremos na maioria dos estados encontrou-se um equilíbrio maior.

Levando em conta que a diferença entre os candidatos foi inferior a 2% como poderíamos desqualificar o divergente sem fomentar uma visão segregacionista na sociedade?



Métodos

Trabalhei com dados em porcentagem, como método de representação utilizei símbolos graduados, nesse método o técnico estabelece o tamanho máximo e mínimo para a forma que ira representar a quantificação do fenômeno. Os agrupamentos foram construídos de forma manual uma vez que os dados dos dois candidatos precisavam de uma divisão em agrupamentos semelhante e isto não foi possível por nenhum método automático.

Dessa forma o primeiro grupo de ambos foi do seu piso até 40%, o segundo de 40% a 50% e o terceiro até 65%. Esse foi o valor máximo que a candidatura de Aécio Neves obteve. Já Dilma Rousseff atingiu a casa dos 78%, assim para a referida candidata construí uma última classe de agrupamento. Dessa forma as frequências relativas ao candidato Aécio ficaram distribuídas em três grupos e as frequências da candidata Dilma em quatro, a última agrupando os valores que ficaram acima de 65%.

Na definição do tamanho mínimo da simbologia de cada um, busquei uma equivalência através da aplicação de uma regra de três, de forma que o valor inicial da candidatura oposicionista, em torno de 22% dos votos válidos, fosse proporcional ao tamanho do valor mínimo da candidatura da situação, pouco mais de 35% dos votos válidos. Para os valores máximos busquei o mesmo resultado procedendo da mesma maneira.

Ao utilizar uma cor neutra para a representação do território procurei comunicar uma visão na qual o Brasil continua e continuará pertencendo ao povo brasileiro, independente do resultado da eleição. O que se disputa em uma eleição é tão somente a gestão do governo federal, não está em disputa o Estado, quem dirá o território brasileiro.

Termino essa postagem pedindo mais rigor nas técnicas de representação, mais visão crítica na leitura das técnicas de representação. Mapas e gráficos são instrumentos de síntese por demais valiosos devemos trabalhar por sua popularização. Contudo não devemos nos omitir frente a eventuais deturpações.

sábado, 20 de setembro de 2014

Método dos Quartile na Representação da Informação

Caros leitores, hoje falaremos sobre representação da informação. Suponhamos que nosso desafio seja representar a densidade populacional dos 5570 municípios brasileiros. Seria impossível uma interpretação correta da realidade através de uma de representação visual (intensidade de cores) se optássemos por representar cada valor único. Nesse contexto se faz necessário agrupar dados segundo padrões de semelhança. Para isso utilizamos um instrumental metodológico.

Na cartografia temática podemos construir representações quantitativa através de vários métodos: intervalos iguais, desvio padrão, quebras manuais, quebras naturais, quartile e outros. Esse post se dedica ao método dos quartile.

Definindo o Número de classes
Primeiramente se faz necessário definir o número de classes em que seus dados serão agrupados, é comum encontrar mapas que tenha de 4 a 8 classes. Entende-se que mapas com mais de 8 agrupamentos não facilitam o entendimento. Existe uma metodologia (STURGER) que equaciona essa questão nos seguintes termos: K= 1 + 3.33LogN
onde K= ao número de classes e N o número de valores não repetidos. 
Ainda que existe uma fórmula proposta para a definição do número de classes seu uso não é obrigatório, a experiência do analista muitas vezes permite a apresentação de soluções mais adequadas para a representação dos fenômenos.

Quartile
O método dos quartiles consiste em agrupar os dados com quantidades iguais de observações. Construímos um conjunto de observações aleatório e organizamos em uma tabela para facilitar o entendimento. Observe o quadro abaixo:

O primeiro quartil representa os 25% das observações, de menor valor, entre o segundo e terceiro quartis temos os valores centrais situados os valores 9 e 34, a mediana se encontra em 16,5. O último quartil inicia-se do 37 e vai até 50. Com esse instrumental analisamos onde e quanto. Onde estão os valores mais próximos da mediana, os valores mais baixos, os mais altos.

Os quartis nos permitem ter conjuntos com uma distribuição de observações mais equilibrado além de poder identificar imediatamente qual a posição de cada observação em relação ao todo. Se o valor associado a uma observação é mais central ou se está nos extremos.

Abaixo uma figura de como o ArcGIS organiza os dados sobre essa perspectiva, nessa figura, extraída do help online, os dados foram divididos em 7 grupos, observe que ele altera a amplitude de alguns agrupamentos a fim de obter conjunto com quantidades de observações semelhantes.

A escolha do método adequado para agrupar seus dados é determinante para o sucesso da sua análise. Situações podem ser postas em evidencia ou ocultadas. Padrões podem evidenciar a necessidade de ações e apontar onde elas devem se concentrar, hoje o GIS é uma realidade nos processos de tomada de decisão, assim a importância e responsabilidade do nosso trabalho só aumenta. 


Do discurso para o mapa
Apresento dois exemplos extraídos do material didático do curso de análise espacial do Inpe. Dois métodos diferentes foram usados para agrupar o mesmo conjunto de dados, no caso a proporção de crianças de 0 a 5 anos residentes em domicílios em que o responsável ou cônjuge é analfabeto e saneamento é inadequado. O primeiro método agrupa os dados dividindo a amplitude pelo número de classes definidas em intervalos iguais.

fonte da figura: Material didático do Curso de Análise Espacial de Dados Geográficos do Inpe

As cores quentes representam as áreas de maior atenção. Agora a mesmo fenômeno representado pelo método dos quartile, no caso divido em 10 partes, cada uma representando 10% dos dados.

Observe a alteração da quantidade áreas com cores quentes, isso porque o método está focada na distribuição dos dados, pelo tamanho dos agrupamentos não pela rigidez dos intervalos. Observe que a coluna quantidade apresenta valores semelhantes de geometrias associadas.

De forma geral não podemos dizer que o método dos intervalos iguais não seja válido, entendo que ele não é válido para representar esse fenômeno. Várias bibliografias apontam esse método como muito apropriado para fenômenos contínuos, como tipos de solos e distribuição de temperaturas. Mas podemos afirmar que o método dos quartile nos permite observar os 10, 20, 30% mais críticos num primeiro olhar.
Web Analytics