WEB SCRAPPING

(Código para construção de banco de dados de outorgas superficiais e subterrâneas)

Os certificados de usos outorgados são disponibilizados publicamente através do site do Instituto Mineiro de Gestão das Águas (Igam) do estado de Minas Gerais. As informações são dispostas em centenas de arquivos, dificultando o download, compilação e análise dos pontos de interesse do usuário.

Nesse sentido, foi desenvolvido um código em linguagem de programação R para coleta automatizada desses documentos em *.pdf e realização de um scrapping, extraindo de forma otimizada as informações necessárias para constituição do banco de dados dos usos de água, a fim de atender estudos de outorga.

O código realiza uma varredura nos documentos, considerando padrões de nomenclaturas, tais como: Portaria, Finalidade, Município, Localização (latitude e longitude) Tipologia (superficial ou subterrânea), Curso d’água (quando for o caso), Poço tubular (quando for o caso), Bacia hidrográfica e Prazo de validade. Dessa forma, é possível montar um banco de dados organizado, possibilitando a atualização contínua das informações.

Compartilhe em suas redes

pt_BR