Na Mídia

 

Portal Brasileiro de Dados Abertos – O que é? Para que Servem? Está dentro da Lei?

Portal Brasileiro de Dados Abertos – O que é? Para que Servem? Está dentro da Lei?

Autor: Romeu Gomes
Em: 18-09-2022 19:26
Tempo de Leitura: 8 min

O que são dados, e o porque algumas informações são chamadas de Dados Abertos?

Por definição, dados são valores atribuídos a algo, ou seja uma propriedade ou atributo de alguma coisa, estes valores geralmente se classificam como números, ou valores que possam pode ser medidos e comparados, porém também podem ser atributos e conceitos distribuídos de forma arbitrária, como os nomes ou por algum critério próprio de validação.

Por exemplo os dados climáticos, as notas de uma turma na escola, métricas de vendas, a quantidade e duração das ligações telefônicas, as relações de amizade de uma pessoa nas redes sociais, dados de faturamento de empresas, dados cadastrais ou grupos de informações de um determinado tipo, produto ou serviço, enfim, a lista é interminável e, cada vez mais, diversos aspectos de nosso cotidiano são transformados em dados.

Dados são abertos quando qualquer pessoa pode livremente acessá-los, utilizá-los, modificá-los e compartilhá-los para qualquer finalidade, estando sujeito a, no máximo, a exigências que visem preservar sua proveniência e sua abertura. Isso geralmente é satisfeito pela publicação destes sob uma licença aberta ou livre.

Quais são as regras ou princípios para a divulgação de Dados Abertos?

As chamadas “leis” dos dados abertos são, em suma, um conjunto de testes para avaliar se um dado pode, de fato, ser encontrado e indexado na Web ou através de outros meios, se este pode estar disponível e em formato compreensível por máquina ou por seres humanos, se pode ser reaproveitado e utilizado com algum propósito, e por fim, se algum dispositivo ou artificio legal não permita sua replicação, consulta, distribuição ou uso.

Estas regras foram propostas com base nos dados governamentais, mas pode-se dizer que elas se aplicam a qualquer conjunto de dados, mesmo fora de ambientes governamentais. Por exemplo, em empresas privadas, organizações da sociedade civil e organismos internacionais.

Dados podem ser abertos voluntariamente por organizações privadas, por diversos motivos, nos últimos anos, especialistas têm discutido a abertura de dados pelo setor privado para ações que beneficiam o interesse público, os chamados “dados colaborativos“.

Desde 2007, os dados governamentais passaram a ser regidos por um grupo de quatro preceitos, que garantem a transparência das operações, e a divulgação de dados públicos, e devem estar:

  1. Completos: Todos os dados públicos devem ser disponibilizados, pois são informações eletronicamente gravadas, incluindo, mas não se limitando a, documentos, bancos de dados, transcrições e gravações audiovisuais. Dados públicos são dados que não estão sujeitos a limitações válidas de privacidade, segurança ou controle de acesso, reguladas por estatutos.

  2. Primários e Atualizados: Devem ser disponibilizados assim como são coletados na fonte, com a mais fina granularidade possível, e não de forma agregada ou transformada e processada. Além de serem disponibilizados o quão rapidamente seja necessário para preservar o seu valor, usabilidade e validade.

  3. Acessíveis e Processáveis: Devem ser disponibilizados para o público mais amplo possível e para os propósitos mais variados possíveis, sem restrições ou necessidade de identificação ou informação sobre o seu uso ou propósito. Além de estarem razoavelmente estruturados para possibilitar o seu processamento automatizado, através de processamento de dados ou através de máquinas ou processos computacionais.

  4. Formatos não proprietários: Os dados devem estar disponíveis em um formato livre e sobre o qual nenhuma entidade detenha controle exclusivo, ou que seja necessária a aquisição de softwares ou licenças para seu uso ou distribuição. E não devem estar sujeitos a restrições por regulações de direitos autorais, marcas, patentes ou segredo industrial. Exceto restrições razoáveis de privacidade, segurança e controle de acesso que podem ser necessárias e devem estar regidas por estatutos.

Além de que a conformidade com esses princípios precisa ser verificável e uma pessoa deve ser designada como contato responsável pelos dados, e por sua atualização ou manutenção.

As razões para que as organizações públicas invistam em iniciativas de abertura de dados governamentais, são: Transparência na gestão pública (lei da transparência), Contribuição da sociedade com serviços inovadores ao cidadão (lei de acessibilidade e livre acesso), Aprimoramento na qualidade dos dados governamentais (gestão de qualidade), Viabilização de novos negócios (incentivo da iniciativa privada), Obrigatoriedade por lei.

Abrir dados é uma obrigação legal?

Para a administração pública, sim. A Lei de Acesso à Informação – LAI se aplica aos órgãos públicos da administração direta e entes da administração indireta dos Poderes Executivo, Legislativo, incluindo as Cortes de Contas, e Judiciário e do Ministério Público, em todas as esferas (art. 1ª, parágrafo único). No que diz respeito à transparência ativa, a LAI traz consigo conceitos de dados abertos, em especial em seu art. 8º:

Art. 8º É dever dos órgãos e entidades públicas promover, independentemente de requerimentos, a divulgação em local de fácil acesso, no âmbito de suas competências, de informações de interesse coletivo ou geral por eles produzidas ou custodiadas.
§ 2º Para cumprimento do disposto no caput, os órgãos e entidades públicas deverão utilizar todos os meios e instrumentos legítimos de que dispuserem, sendo obrigatória a divulgação em sítios oficiais da rede mundial de computadores (internet).
§ 3º Os sítios de que trata o § 2º deverão, na forma de regulamento, atender, entre outros, aos seguintes requisitos: (...) II – possibilitar a gravação de relatórios em diversos formatos eletrônicos, inclusive abertos e não proprietários, tais como planilhas e texto, de modo a facilitar a análise das informações; III – possibilitar o acesso automatizado por sistemas externos em formatos abertos, estruturados e legíveis por máquina;

A lei também define as hipóteses de sigilo e de informações pessoais, que são consideradas exceções à regra geral de que os dados devem ser abertos. Qualquer pessoa com conhecimentos técnicos de tratamento de dados, ou “processamento de dados” deve conseguir ter acesso aos dados, tendo a própria internet diversos cursos na internet voltados a ensinar essas habilidades, como, por exemplo, os da Escola de Dados, que são direcionados ao uso de dados abertos. Exemplos de perfis de pessoas que usam dados abertos são acadêmicos, jornalistas, cientistas de dados em empresas privadas, organizações da sociedade civil e nas diversas instâncias de governo. Para conhecer alguns exemplos de uso de dados, como visualizações, infográficos e análises, veja a seção “aplicativos“.

Dados abertos no Brasil – Quem pode distribuir e usar?

Além da iniciativa nacional do portal dados abertos, há diversos outros programas que têm sido implementados nas diversas esferas e poderes da administração pública no Brasil, e também em algumas esferas privadas, principalmente por universidades e instituições de pesquisa.

O acesso a informação está previsto na Constituição Federal e na Declaração Universal dos Direitos Humanos. Dados Abertos é a publicação e disseminação dos dados e informações públicas na Internet, organizados de tal maneira que permita sua reutilização em aplicativos digitais desenvolvidos pela sociedade.

Isso proporciona ao cidadão um melhor entendimento do governo, no acesso aos serviços públicos, no controle das contas públicas e na participação no planejamento e desenvolvimento das políticas públicas.

Essas políticas foram públicadas em 18 de novembro de 2011, quando foi sancionada a Lei de Acesso a Informação Pública (Lei 12.527/2011) que regula o acesso a dados e informações detidas pelo governo. Essa lei constitui um marco para a democratização da informação pública, e preconiza, dentre outros requisitos técnicos, que a informação solicitada pelo cidadão deve seguir critérios tecnológicos alinhados com as “leis de dados abertos”. Dentro desse contexto o Portal Brasileiro de Dados Abertos é a ferramenta construída pelo governo para centralizar a busca e o acesso dos dados e informações públicas.

Pode ser usado livremente, qualquer pessoa com conhecimentos técnicos de tratamento de dados, pode fazer uso dos dados e informações, inclusive para compor outros softwares ou sistemas, ou tratá-los e gerar relatórios específicos, por exemplo uso acadêmico, jornalistas, cientistas de dados em empresas privadas, organizações da sociedade civil e nas diversas instâncias de governo, produzindo e até comercializando estes dados, com o formato de visualizações, infográficos e análises, ou outros aplicativos e aplicações. Embora os dados abertos possam ser encontrados com facilidade, o seu uso requer um nível básico de conhecimento técnico.

No geral, esses dados podem ser divididos em: Dados qualitativos que se referem a tudo o da qualidade a algo. Em geral, são representados com palavras ou conceitos, como cores, nacionalidades, nomes, gêneros, etc. Dados quantitativos são dados que são mensuráveis ou se referem a números, o número de bolas de golfe usado em uma partida, o tamanho, o preço, a nota em uma prova, sua idade. Porém, dados podem ser categorizados de outras maneiras.

Dados categóricos: são os que categorizam o item que você está descrevendo. A condição das bolas de golfe, por exemplo. Elas são novas, quebradas ou consertadas?

Dados discretos: são dados sempre numéricos, representados por números inteiros não negativos. Por exemplo, a contagem das bolas de golfe, número de pessoas, quantidade média de músicas em um álbum.

Dados contínuos: são dados numéricos, que permitem qualquer tipo de valores, por exemplo tamanho médio do pé de jogadores.

Como resultados, do processamento desses dados, você poderá observá-los de maneira detalhada (analítica) ou resumida (estatística), por exemplo em :

Sequências ordenadas - que são listas, com grupos de valores em ordem, distribuídos em uma única dimensão, como por exemplo esportes praticados em clubes: [‘golfe’, ‘futebol’,’corrida’,’ciclismo’].

Tabelas - Um dos formatos mais frequentes quando pensamos em dados, podendo ser entendida por uma sequência empilhada, com duas dimensões, linhas e colunas. Uma tabela pode conter dados mais resumidos sobre um determinado objeto ou mais detalhados (microdados), como dados empresariais dos registros do CNPJ.

Redes e grafos - Esse tipo de apresentação é mais voltada para relações, composta de nós, e arestas, onde cada nó é um ente, pessoa ou organização que você está analisando e as arestas são as linhas que fazem essas conexões. Dados das EMPRESAS REGISTRADAS NO BRASIL e DADOS DAS FILIAIS DE CADA EMPRESA.

Dados geográficos - São dados que possuem características que servem para serem traçados ou apontados em um mapa, como coordenadas geográficas ou projeções cartográficas. Exemplo: Painel do Índice de Transparência da Covid-19 nos estados, ou Densidade populacional por região.

Textos - Podem ser compreendidos como formatos de dados e podem ser analisados através de métodos como processamento de linguagem natural.

Imagens, Sons e Multimídia - Também podem ser analisadas para extrair dados usando software que podem identificar objetos, pessoas e outros.Exemplo: Detecção de pessoas e objetos em uma imagem.

Quais são os formatos aceitos e Disponibilizados?

JSON - É um acrônimo para JavaScript Object Notation. É um padrão aberto de estruturação de dados baseado em texto e legível por humano. A especificação é a RFC 4627. JSON ganhou maior utilização com o advento do Ajax. A serialização em JSON é muito simples e resulta em uma estrutura pouco verbosa o que se mostra uma ótima alternativa para o XML. JSON possibilita serialização de estrutura de objetos complexos, como listas e subpropriedades. JSON está se tornando o padrão mais utilizado para integração de dados entre repositórios e frameworks, também está se tornando o padrão nativo de armazenamento em alguns bancos de dados modernos.

XML - Significa Extensible Markup Language. É um conjunto de regras para codificar documentos com estrutura hierárquica e em um formato legível por máquina. É baseado em texto e tem como principais objetivos simplicidade, extensibilidade e usabilidade. XML é largamente utilizado como formato de troca de dados nos clássicos Web Services SOAP. Possui uma ampla gama de ferramentas associadas, tais como o padrão XSLT que permite transformar para outra estrutura XML ou outro formato. Apesar de sua ampla utilização, tem sido menos encorajada a utilização desse formato para integração de aplicações na Web, por utilizar mais recursos para transmissão e para o processamento do dados. Em substituição, recomenda-se utilizar JSON.

CSV - Significa Comma-Separated Values, ou valores separados por vírgula, e é um formato para armazenamento de dados tabulares em texto. A codificação é muito simples: cada linha do arquivo representa uma linha na tabela, e as colunas são separadas por vírgula. Campos que podem conter vírgula devem ser delimitados por aspas. CSV é recomendado para representação de estrutura de dados mais simples, de natureza tabular, onde não existem subpropriedades ou listas, gerando um arquivo menor e mais leve para processamento. Arquivos CSV são processáveis diretamente por editores de planilhas, como o OpenOffice e o MS Excel.

ODS - Significa Open Document Spreadsheet, é um formato não proprietário de arquivo baseado em XML, padronizado pela ABNT sob a norma NBR ISO/IEC 26300:2006. É comumente chamado de planilha. Planilhas são largamente utilizadas, são de fácil utilização e manipuláveis por diversos aplicativos. Apesar de ser um formato estruturado, é muito flexível, possibilitando manipulação e mistura de diversos tipos de dados, como imagens e textos formatados. Para a publicação de dados abertos tabulares, é recomendável a utilização de CSV, pela sua simplicidade e padronização.

RDF - Significa Resource Description Framework, é um modelo de dados estruturado em grafos e possui diversos formatos de serialização, tais como RDF/XML, Notation 3 e Turtle. Os formatos baseados em RDF têm seus dados descritos em vocabulários disponíveis na Web. Apesar da grande qualidade dos dados disponibilizados em RDF, a construção de vocabulários para seu uso não é trivial. Numa escala de níveis de qualidade/complexidade de dados abertos, o RDF está no último nível, onde se constituirá a Web semântica.

Além desses existem outros formatos, como: SVG (Scalable Vector Graphics) utilizado para dados vetoriais e geográficos, GML (Geography Markup Language) útil para exprimir características e exportação de dados geográficos, HTML/RDFa é a incorporação de marcações semânticas com uso de RDF sobre as tags HTML de uma página.

Como explicado, esses formatos possibilitam pouca tratativa das massas de dados e são complexos para filtragem, o que possibilita aos desenvolvedores utilizarem esses dados para criarem aplicações específicas para produzirem resultados acessíveis ao grande público, e consumir esses dados da maneira que bem entenderem.

#Dados Abertos # portal brasileiro de dados abertos # gov.br # bases de dados

Este artigo teve 804 Visualizações

Conheça Também Estes Produtos: