Análise e Discussão Big Data Cases

Dados abertos: democratizando a informação com Big Data

dados abertos
1
Conteúdo originalmente publicado no eBook Dados abertos: democratizando a informação com Big Data

Se te dissermos que os dados poderão se tornar, em breve, uma das principais matérias-primas da transformação social, você é capaz de imaginar como isso acontecerá? Na verdade, esta é uma transformação que já está ocorrendo em algumas ocasiões. Tudo isso graças ao que podemos chamar de Open Data, ou dados abertos.

Big Data e Open Data são assuntos que se cruzam, embora tenham definições bem diferentes. Neste artigo, você entenderá a relação entre os dois assuntos e se aprofundará no universo dos dados abertos, um dos grandes insumos para uma nova cultura tecnológica.

DADOS PODERÃO SE TORNAR, EM BREVE, UMA DAS PRINCIPAIS MATÉRIAS-PRIMAS DA TRANSFORMAÇÃO SOCIAL

Big Data, Big Data Analytics e Open Data

O termo Big Data está diretamente relacionado ao universo infinito e profundo de dados que construímos todos os dias. Desde simples atos, como alguém passar pela catraca de um ônibus ou publicar uma foto no Facebook, até ações mais elaboradas, como alimentar planilhas com informações, fórmulas e números sobre o histórico de vendas de uma empresa, tudo isso tem a ver com Big Data. Todos esses exemplos são fontes de dados que podem ser usadas para análises de comportamento, tendências, predição e outras demandas.

Além de entender o que é de fato Big Data, é importante também compreender que todos estes dados só têm valor quando analisados. Portanto, usa-se para tais situações o termo Big Data Analytics. Na prática, Big Data Analytics é o trabalho analítico de grandes volumes de dados (sendo estes estruturados ou não-estruturados), com o objetivo de encontrar insights que auxiliem empresas a tomarem decisões inteligentes de negócio, ou de responder quaisquer outras perguntas sobre um mercado específico.

Por meio de softwares de alto desempenho, tais dados podem ser coletados, armazenados e interpretados de forma rápida e aprofundada. Em suma, torna-se possível cruzar uma infinidade de dados de ambiente externo e interno, avaliar todos os históricos e utilizar estas análises como uma verdadeira bússola gerencial. Agora que já sabemos o que é Big Data e Big Data Analytics, vamos entender o que é Open Data.


Leia também: Data preparation: alicerce dos projetos de Big Data


Dados abertos ≠ Big Data

No universo de Big Data, que envolve diversos tipos e fontes de dados, podemos identificar dados fechados e também abertos. É importante frisar que Big Data é diferente de Open Data, mas que esses termos podem ser usados ao mesmo tempo para definir alguma situação específica.

Segundo a definição da Open Knowledge Foundation (instituição que tem como propósito empoderar a sociedade por meio do conhecimento livre), em suma, dados podem ser considerados abertos quando qualquer pessoa pode livremente usá-los, reutilizá-los e redistribuí-los, estando sujeita à exigência, no máximo, de creditar a sua autoria e compartilhar pela mesma licença.

Todo esse assunto de dados abertos costuma estar diretamente relacionado a questões governamentais, uma vez que atualmente a maior parte dos órgãos públicos trabalham para disponibilizar informações públicas (como orçamento e gastos públicos), de forma transparente para a sociedade.

Considerando esses fatos, o ativista e especialista em políticas públicas David Eaves propôs três leis e oito princípios que ajudam a definir melhor os dados abertos.

As 3 leis

1. Se o dado não pode ser encontrado e indexado​ na web, ele não existe;

2. Se não estiver aberto e disponível em formato compreensível por máquina, ele não pode ser reaproveitado;

3. Se algum dispositivo legal não permitir sua replicação​, ele não é útil.

É importante frisar que estas leis foram propostas, a princípio, para os dados abertos Governamentais. Entretanto, hoje podemos dizer que elas se aplicam aos dados abertos de forma geral.

Os 8 princípios

Tentando decifrar e explicar melhor o que são, de fato, os dados abertos, um grupo de ativistas e interessados no tema se reuniu na Califórnia (EUA), em 2007, e chegou a um consenso que define os princípios de Open Data por meio de 8 ítens fundamentais. São eles:

1. Completos

Todos os dados públicos são disponibilizados. Eles são informações eletronicamente gravadas, incluindo (mas não se limitando a) documentos, bancos de dados, transcrições e gravações audiovisuais. Dados públicos não estão sujeitos a limitações válidas de privacidade, segurança ou controle de acesso reguladas por estatutos.

2. Primários

Os dados são publicados na forma que foram coletados na fonte, com a mais fina granularidade possível, e não de forma agregada ou transformada.

3. Atuais

Os dados são disponibilizados o quão rapidamente seja necessário para preservar o seu valor.

4. Acessíveis

Os dados são disponibilizados para o público mais amplo possível e para os propósitos mais variados possíveis.

5. Processáveis por máquina

Os dados são razoavelmente estruturados para possibilitar o seu processamento automatizado.

6. Acesso não discriminatório

Os dados estão disponíveis a todos, sem que seja necessária identificação ou registro.

7. Formatos não proprietários

Os dados estão disponíveis em um formato sobre o qual nenhum indivíduo tenha controle exclusivo.

8. Livres de licenças

Os dados não estão sujeitos a regulações de direitos autorais, marcas, patentes ou segredo industrial. Restrições razoáveis de privacidade, segurança e controle de acesso podem ser permitidos na forma regulada por estatutos.

A TENTATIVA DE GOVERNOS DE CONTROLAR A INTERNET É PERIGOSA PARA A HUMANIDADE

Al Gore, ex-vice-presidente dos EUA e ativista ambiental

O grupo de pesquisadores também determinou que a conformidade com esses princípios precisa ser verificável, além de que uma pessoa deve ser designada como contato responsável pelos dados. Da mesma forma das três leis, essa lógica de classificação para dados também passa a ser aplicada quando o contexto não for de Dados Governamentais (com a possível exceção do primeiro item da lista, já que aborda exclusivamente dados do poder público).

Como os dados abertos podem melhorar a sociedade?

Quando um órgão público decide abrir dados, significa que a sociedade civil ganha uma nova forma de empoderamento social. Indica que cidadãos que têm familiaridade com desenvolvimento de aplicativos, sites e demais softwares poderão usar sua especialidade envolvendo informações de cunho público.

E também significa que os cidadãos poderão praticar seu direito de controle social tendo acesso mais adequado aos orçamentos, aos gastos mensais da prefeitura de sua cidade e aos investimentos feitos com a verba pública de seu estado, dentre outras situações.

Quando os governos entendem que transparência e empoderamento social são ingredientes para gestões mais positivas e inteligentes, eles trabalham para abrir dados.

A seguir vamos entender, na prática, como esta abertura de dados funciona.

add-banner

Transparência pública e democracia digital

A democratização de acesso aos dados digitais e o amadurecimento relacionado ao poder dos dados, que vem acontecendo aos poucos, fez com que muitas pessoas percebessem que podemos estar vivendo uma era da “revolução dos dados”.

Projetos políticos, cidadania horizontal, empoderamento do cidadão e temas do tipo começaram a ser pauta em grupos que antes não costumavam se envolver diretamente com política. Hackers, ativistas digitais e todo o público que enxerga a internet como uma ferramenta poderosa começaram a dar ainda mais atenção aos temas de transparência pública e democracia digital.

Tudo isso graças aos dados.

Histórias como a da WikiLeaks, que vazou centenas de dados e informações confidenciais de alto interesse público, foram fundamentais para abrir a discussão sobre o assunto. Atores políticos da Casa Branca e demais influenciadores do mundo inteiro passaram a pensar sobre esta questão crítica, relacionada à abertura de dados e transparência, de forma mais madura.

Prova desta evolução citada aqui foi a criação da Lei de Acesso à Informação (LAI), que no Brasil entrou em vigor em 2012. A seguir, entenda mais sobre a relação entre dados abertos e LAI.

Lei 12527/2011 e os dados abertos

Também conhecida como LAI, a Lei de Acesso à Informação obriga órgãos públicos federais, estaduais e municipais (ministérios, estatais, governos estaduais, prefeituras, empresas públicas, autarquias) a ceder informações relacionadas às suas atividades a qualquer pessoa que solicitar os dados.

Para ilustrar: hoje você pode procurar o atendimento da Prefeitura, ou de qualquer outro órgão público, e solicitar acesso aos dados que são públicos e que não atingem a privacidade de ninguém. Outro exemplo: hoje você pode acessar dados referentes ao valor do salário que recebe qualquer servidor público, ou ainda consultar quantos reais um órgão gasta com despesas internas. Não há limites para as informações a serem solicitadas.

HOJE VOCÊ PODE PROCURAR O ATENDIMENTO DA PREFEITURA, OU DE QUALQUER OUTRO ÓRGÃO PÚBLICO, E SOLICITAR ACESSO AOS DADOS QUE SÃO PÚBLICOS

É importante também fazer algumas ressalvas. A Lei não garante explicitamente que o órgão envie para os cidadãos os dados em formato aberto, portanto em alguns casos você poderá receber um arquivo em PDF ou até mesmo uma imagem em formato JPG que apresente a informação que você solicitou.

Além disso, nem sempre os órgãos têm disponíveis os dados estruturados e organizados; todavia, ao solicitar o acesso à informação, é possível fazer o pedido para que ela seja compartilhada em formato aberto (CSV ou RAW, por exemplo).

Transparência Ativa

Uma consequência positiva da Lei de Acesso à Informação é o surgimento de inúmeros Portais de Transparência.

Podemos também chamar tais iniciativas de “transparência ativa”, uma vez que, nestes casos, os órgãos públicos já deixam acessíveis inúmeros dados para os cidadãos antecipadamente.

A Lei solicita aos órgãos, ainda, que os dados sejam publicados, inclusive em formatos abertos e não-proprietários. Essencialmente, demanda a publicação de dados abertos, embora não utilize este termo diretamente.

Se quiser conhecer na prática esses portais, clique nos links abaixo:

Desenvolvimento político e social por meio dos dados

Big Data, Open Data e democracia são assuntos que estão relacionados, embora não seja tão claro para a maioria das pessoas. Sabemos, agora, que é papel dos órgãos públicos oferecer transparência em suas gestões e oferecer aos cidadãos acesso não só às informações, mas também ao contexto variado e sempre atualizado de dados (Big Data) públicos.

Os governos são personagens particularmente importantes neste cenário. Em primeiro lugar, devido à grande quantidade e centralidade de dados, e em segundo, pelo fato de que tais dados são públicos – um direito garantido no artigo 5º da Constituição Federal Brasileira.

A importância prática disso é que diversos grupos, indivíduos e organizações podem se beneficiar por meio da disponibilização de dados. A seguir, apresentaremos alguns cases que deixam explícito o valor dos dados abertos na mão da sociedade.

Seis tipos de projetos disruptivos feitos com dados abertos

1. Detecção de fraudes e controladoria de gastos públicos popular

A ferramenta “Para onde foi meu dinheiro?”​, do projeto Gastos Abertos, idealizado pela Open Knowledge Brasil, está sendo desenvolvida para oferecer uma visualização dos gastos públicos do Governo Federal e de São Paulo.

Ela expõe e torna acessível para toda a população o destino de mais de R$ 1,5 trilhão que compõem o orçamento anual autorizado pela União, e a execução local dos R$ 50 bilhões do orçamento da Cidade de São Paulo, beneficiando diretamente toda a população brasileira.

Saiba mais aqui​.

2. Governos horizontais

O projeto brasileiro “Vote na Web”​ faz uso dos dados abertos pelo Senado, Assembleia e demais órgãos. Ele apresenta os projetos de lei que estão para entrar em votação pelos parlamentares e permite que nós mesmos discutamos os textos.

Alguns deputados já fazem uso da plataforma, a fim de descobrirem o desejo popular da sociedade antes de tomarem decisões.

Conheça o projeto aqui​.

3. Jornalismo

Com o objetivo de evitar as narrativas jornalísticas enviesadas, foi fundado o “Observatório de Favelas”​. O projeto ajuda a construir outras formas de contar as mesmas histórias sobre as favelas e periferias urbanas, desenvolver novas ferramentas e ensinar coletivamente.

Tudo isso acontece usando diversos tipos de dados abertos.

Conheça aqui​.

4. Games

Idealizado por um grupo de mineiros de Belo Horizonte, o “Política Esporte Clube” tem como proposta gamificar o acompanhamento dos políticos por meio da metáfora do futebol.

O projeto permite às pessoas criarem times de futebol fictícios com deputados e senadores. Por meio dos dados abertos das Assembleias e do Senado, é possível saber qual deputado está ou não indo trabalhar todos os dias, qual parlamentar está propondo projetos de lei (e quantos por mês), dentre outras questões.

Conheça e jogue aqui​.

5. Uso de dados abertos por empresas

Lima I/O

Um grupo de jovens peruanos ganhou um evento de hackers com uma ideia que virou negócio: dados climáticos + arduíno = negócio sustentável​.

Utilizando dados abertos de órgãos públicos, como mapas e gráficos do estado do meio ambiente, os desenvolvedores criaram um sistema que coleta dados de algumas cidades para responder perguntas como:

  • “Quantos microclimas a sua cidade tem?”
  • “Como está a saúde do meio ambiente da região onde vive?”
  • “Podemos prever alguma tendência de terremoto?”

Saiba mais aqui​.

Data Viva

Esse não é o caso de uma empresa disponibilizando dados abertos, mas é uma ferramenta ótima para uso de empreendedores. O “Data Viva”​ é uma plataforma que foi criada pelo Governo do Estado de Minas Gerais, a fim de auxiliar a tomada de decisões estratégicas com base em dados.

O projeto, idealizado por pesquisadores do MIT Media Lab​, permite mais de 100 mil visualizações de dados e facilita o entendimento dos cenários econômicos por meio de diversos tipos de informações.

Visite aqui​.

6. Outros exemplos

Husetsweb

Criado na Dinamarca, o Husetswebe tem por propósito ajudar a encontrar formas de melhorar a eficiência energética das residências. Ele conta com uma ferramenta de planejamento financeiro e um motor de busca específica por empreiteiros que possam realizar o trabalho necessário para economizar mais.

Conheça.

Open Food Facts

Um projeto muito interessante de dados abertos, que foge da esfera da gestão pública, é o Open Food Facts. Trata-se de um banco de dados abertos à livre colaboração, sobre informações alimentares de todo o mundo.

Esse é um projeto que pode, por exemplo, ser utilizado por desenvolvedores, pesquisadores e empresas que buscam tais tipos de dados.

Saiba mais aqui.


Leia também: 11 cases de sucesso com Big Data


Conclusão

Agora que você compreende o que são dados abertos, deve ter percebido o quão embrionário é este assunto e como ele tem ressonância com Big Data.

Trata-se de um “oceano azul” – ambiente pouco explorado e com poucos concorrentes. Poderíamos dizer que é até mesmo um “problema em busca de soluções”, uma vez que temos hoje tantos bancos de dados desperdiçados, sem análise e aproveitamento.

Todavia, tudo isso nos mostra como o nosso futuro tem afinidade com a Ciência de Dados. Naturalmente essa questão vai ficando mais clara para todos durante o aumento do alcance da internet, a popularização dos gadgets e as demais consequências da democratização da tecnologia.

E você? Consegue imaginar como melhoraria a sua empresa, a sua comunidade ou até mesmo a sociedade em um sentido mais amplo por meio dos dados abertos?

Sobre a Hekima

A Hekima é um empresa de soluções de Big Data e Inteligência Artificial.

Nossa missão é simplificar a aplicação de A.I. em projetos e negócios envolvendo quantidades massivas de dados.

Acesse o site e conheça nossos serviços: hekima.com

Related Post