Debate Dados Abertos

Projeto de Lei 226/2011
(Dados Abertos - São Paulo)


O que é

Projeto de lei que estabelece diretrizes a serem observadas para a publicação de dados e informações pela Prefeitura do Município de São Paulo, pela Câmara Municipal de São Paulo e pelo Tribunal de Contas do Município de São Paulo.

Define que todos os dados e informações publicados em meio eletrônico e na internet estarão também disponíveis em formato aberto.

Dados Governamentais Abertos são informações públicas governamentais que são compartilhadas com os cidadãos na forma digital, através da Internet, de forma a promover sua análise e reutilização (W3C Brasil).


O que não é

Não é um projeto de acesso à informação. Este assunto é tratado no Projeto de Lei de Acesso à Informação (PL 219/2003) e em outras leis que regulamentam o acesso a informações públicas como, por exemplo, a Lei de Responsabilidade Fiscal.

Participantes do debate

Roberto Agune e Álvaro Gregório, do Grupo de Apoio Técnico à Inovação da Secretaria Estadual de Gestão Pública; Fernando Guarnieri e Andrea Marcondes de Freitas, pesquisadores do Cebrap; Antonio Graeff, autor do livro Eleições 2.0: A Internet e as Mídias Sociais no Processo Eleitoral e criador do Radar Municipal; Rafael Lamardo, professor da pós-graduação da FIA e da ESPM, responsável pelo projeto Extrato Parlamentar; Liane Lira e Diego Casaes, da Transparência Hacker; Felipe Gomes, consultor de tecnologia da Secretaria Estadual do Meio Ambiente; Alexandre Geraldi, Antonio Mogadouro e Ana Célia Guarnieri, funcionários do gabinete do vereador Tião Farias.








Debate Dados Abertos

No dia 31/05/11 foi realizado um debate para discutir o Projeto de Lei 226/2011. Assista aos principais trechos.

      (O vídeo não abriu? Clique aqui)
Se preferir, assista ao debate na 


Pontos levantados pelos participantes


Abrangência do projeto: Não restringi-lo aos dados já publicados em meio eletrônico, e sim a todas as bases de dados e informações não sigilosas do município. O sigilo é regulamentado por lei.

Formato aberto: 
Disponibilizar arquivos digitais em uma tecnologia independente de plataforma. É a forma como se disponibilizam os dados e informações que deve ser “aberta”, em linguagem aberta (CSV, XML), qualquer que seja.

Catálogo de dados: A base de dados não precisa ser centralizada. Independe da localização do servidor. O acesso é que deve estar centralizado, para facilitar a vida do cidadão. É preciso que o órgão / unidade produtora transforme essa base em formato aberto e disponibilize o link. Os links devem ficar em um único lugar. Não é necessário saber se determinado assunto é da unidade “A” ou da unidade “B”. O portal da prefeitura (em um site específico) deverá conter relação de todas as bases de dados, a descrição detalhada destas bases e um link de acesso. Pode-se clicar naquele link e copiar a base de dados, sendo possível também a leitura por máquinas.

Acessibilidade: O acesso deve ser de qualquer lugar. O dado deve estar disponível na Internet.

Participação Universal: Não é necessário classificar a capacidade das pessoas. A informação está aberta para a sociedade. Como julgar se a pessoa é capaz de usar e reutilizar?

Acesso restrito: Não cabe (art. 3º do PL). Assunto já regulamentado por lei. Se a informação é sigilosa, independe de sistema. Exemplo: o prontuário médico não pode ser disponibilizado nem em papel.

Dados Interpretáveis: Formato aberto com estrutura orientada ao objeto, com estrutura semântica que permita extrair significado efetivo da base. Dado => informação => conhecimento.

Interoperabilidade: Conceitos de arquitetura da informação e de web services. Utilizar padrões abertos de troca de informações, não só padrões técnicos como XML, CSV etc. O valor da base toma outra dimensão ao se comunicar com outras bases (informações georreferenciadas, da iniciativa privada). Começamos a ter uma riqueza a partir deste cruzamento.

Validação: Informações passíveis de auditoria. Todo o processo deve ser validado, desde a geração do dado até a publicação. Inclusive o ciclo de atualização. De onde vem esta informação? Que sistema alimentou esta informação?

Coleta de Dados: 
O pesquisador recolhe muitos dados na Internet, mas de uma forma manual. 70% das teses são frutos da coleta diária de dados. Tem-se de traduzir um documento em PDF na Internet em uma tabela para conseguir cruzar informações e gerar conhecimento.


Documentação das variáveis: A menção a uma documentação das variáveis é fundamental. Normalmente as tabelas são disponibilizadas em códigos. Cada variável deve ter uma documentação, para sabermos seu significado, em especial quando ela é tratável, para assim conseguir cruzar essas variáveis com outras coisas.

Padronização das variáveis: Exemplo: uma dotação orçamentária, para um mesmo objeto, tem um código e uma descrição diferente entre as subprefeituras.

Descrição detalhada: Além da base de dados é fundamental que se tenha uma descrição detalhada de como foi construída a base (data da pesquisa, estrutura das variáveis, forma de coleta etc). O órgão responsável pela base deve fazer a descrição, inclusive pela questão da atualidade. No Governo Aberto SP, nos dados do SEADE, você encontra a descrição de cada variável. Foi lançado há pouco tempo o web service do sistema de finanças públicas do Estado de São Paulo. Lá tem toda a descrição de como é constituído o orçamento e a contabilidade pública. A descrição detalhada vem junto com a base de dados.

Disponibilização: O Estado deve disponibilizar a base como ela está hoje. É fundamental que esta chegue à sociedade. O Tribunal de Contas lançou uma API.

Confiabilidade: É fundamental para o pesquisador ter confiança nos dados, saber de onde eles vêm e como foram selecionados. Deve-se tomar cuidado com a confiabilidade e validação dos dados.

Colaboração: Não se pode esquecer o crowdsourcing, que é tão importante quanto a transparência. Uma colaboração coletiva das pessoas, produzindo outras coisas. Não devemos nos ater às bases de dados do orçamento. 



Substitutivo ao PL 226/2011

O debate resultou em uma minuta para a apresentação de substitutivo ao Projeto de Lei 226/2011. Faça as suas sugestões.


Edite o texto aqui
Projeto de Lei Nº 226/2011


Estabelece diretrizes a serem observadas para a publicação de dados e informações pela Prefeitura do Município de São Paulo, Câmara Municipal de São Paulo e pelo Tribunal de Contas do Município de São Paulo em formato eletrônico e pela Internet, e dá outras providências.


A CÂMARA MUNICIPAL DE SÃO PAULO decreta:


Art. 1º. Todos os dados e informações da Prefeitura do Município de São Paulo, incluindo a  administração direta, indireta e fundacional,  da Câmara Municipal de São Paulo e do Tribunal de Contas do Município de São Paulo, publicados em meio eletrônico e na internet, estarão também disponíveis em formato aberto.

§ 1º. Para os efeitos desta lei, formato aberto é aquele em que os dados e informações podem ser livremente utilizados, reutilizados e redistribuídos por qualquer pessoa ou máquina.

§ 2º. Os arquivos digitais em formato aberto deverão possibilitar a interoperabilidade entre diversos aplicativos e plataformas, sem quaisquer restrições ou pagamento.

§ 3º. Os dados e informações em formato aberto referem-se a bases de dados, relatórios, balanços, balancetes, estudos, listagens de serviços e endereços, mapas e qualquer publicação em meio eletrônico e na internet.


Art. 2º. Caberá aos órgãos responspáveis pela publicação dos dados e informações:

I – organizar, estruturar e descrever  as bases de dados e informações a serem disponibilizadas e publicadas em formato aberto, além de indicar a data de pesquisa, forma de coleta e códigos das variáveis e tabelas;

II – resposabilizar-se pela autenticidade, integridade e atualidade dos dados e informações.


Art. 3º. Os dados e informações governamentais disponíveis em formato aberto observarão os seguintes princípios:

I – Completude: todos os dados e informações públicas não sigilosas e que não estão sujeitas a restrições de privacidade, segurança ou outros privilégios,  devem ser disponibilizados.

II – Primariedade: apresentados tais como colhidos da fonte, com o menor nível possível de agregação ou modificação.

III – Acessibilidade: devem ser disponibilizados para o maior número possível de pessoas e para o maior conjunto possível de finalidades.

IV – Atualidade: devem ser constantemente atualizados para preservar o seu valor.

V – Reuso: devem ser fornecidos sob termos que permitam a sua reutilização e redistribuição, incluindo o cruzamento com outros conjuntos de dados.

VI – Legíveis por máquina: devem ser estruturados de modo a permitir o seu processamento automatizado.

VII - Confiabilidade: todo o processo de geração e publicação dos dados, incluindo o ciclo de atualização, deve ser válidado e passível de auditoria.

VIII – Participação universal: os dados e informações devem estar disponíveis para todos, sem qualquer discriminação em relação a áreas de atuação, pessoas e grupos.

IX – Não exclusividade: nenhuma entidade ou organização deve ter controle exclusivo sobre os dados e informações publicadas.

X – Livres de licenças: não devem estar sujeitos a nenhuma restrição de direito autoral, patentes, propriedade intelectual ou segredo industrial, admitindo-se restrições quanto à privacidade, segurança e outros privilégios de acesso, desde que previstos em norma legal.


Art. 4º. O acesso aos dados devem ser centralizados em página específica do site, na qual haverá uma listagem de todas as informações e  bases de dados publicados pela Prefeitura do Município de São Paulo, Câmara Municipal de São Paulo e pelo Tribunal de Contas do Município de São Paulo.

I – As bases poderão ser copiadas por meio de transfêrencia de arquivos (download).

Art. 5º. As disposições previstas nesta lei deverão ser implementadas no prazo máximo de 6 (seis) meses, contados a partir da publicação desta lei.  


Art. 6º. As despesas decorrentes da execução desta lei correrão por conta das dotações orçamentárias próprias, suplementadas se necessário.


Art. 7º. O Executivo regulamentará esta lei 60 (sessenta) dias, contados da data de sua publicação.


Art. 8º. Esta lei entrará em vigor na data de sua publicação.


Sala das Sessões, em



Tião Farias

Vereador




PROJETO DE LEI Nº 226/2011 (Primeira Versão)


Estabelece diretrizes a serem observadas para a publicação de dados e informações pela Prefeitura do Município de São Paulo em formato eletrônico, e dá outras providências.


A CÂMARA MUNICIPAL DE SÃO PAULO decreta:


Art. 1º. Todos os dados e informações da Prefeitura do Município de São Paulo, incluindo a administração direta, indireta e fundacional, publicados em meio eletrônico, estarão também disponíveis em formato aberto.

§ 1º. Para os efeitos desta lei, formato aberto é aquele em que os dados e informações podem ser livremente utilizados, reutilizados e redistribuídos por qualquer pessoa ou máquina.

§ 2º. Os dados e informações em formato aberto referem-se a relatórios, balanços, balancetes, estudos, listagens de serviços e endereços, mapas e qualquer publicação em meio eletrônico.


Art. 2º. Os dados e informações governamentais disponíveis em formato aberto observarão os seguintes princípios:

I – Completude: todos os dados e informações públicas devem ser disponibilizados, pois não estão sujeitos a restrições de privacidade, segurança ou outros privilégios.

II – Primariedade: são apresentados como são colhidos da fonte, sem agregação ou modificação.

III – Atualidade: devem ser publicados o mais rápido possível para preservar o seu valor.

IV – Acessibilidade: devem ser disponibilizados por inteiro, para a maior quantidade possível de pessoas, por um custo razoável e num formato conveniente e modificável.

V – Reuso: devem ser fornecidos sob termos que permitam a reutilização e a redistribuição, incluindo o cruzamento com outros conjuntos de dados.

VI – Legíveis por máquina: devem ser estruturados de modo a permitir o processamento automático.

VII – Centralização: os dados e informações de um órgão devem ser reunidos e mantidos em único lugar.

VIII – Participação universal: os dados e informações devem estar disponíveis para qualquer pessoa capaz de usar, reutilizar e redistribuir, sem qualquer discriminação em relação a áreas de atuação, pessoas e grupos.

IX – Não-exclusividade: nenhuma entidade ou organização deve ter controle exclusivo sobre os dados e informações publicadas.

X – Livres de licenças: não devem estar sujeitos a copyrights, patentes, marcas registradas ou regulações de segredo industrial, admitindo-se restrições quanto à privacidade, segurança e outros privilégios, desde que justificadas.


Art. 3º. Não se aplicam as disposições desta lei aos dados e informações fornecidos por meio de sistemas fechados ou restritos, cujo acesso é privativo a servidores públicos.


Art. 4º. As despesas decorrentes da execução desta lei correrão por conta das dotações orçamentárias próprias, suplementadas se necessário.


Art. 5º. O Executivo regulamentará esta lei 60 (sessenta) dias, contados da data de sua publicação.


Art. 6º. Esta lei entrará em vigor na data de sua publicação.


Sala das Sessões, em


Tião Farias

Vereador


JUSTIFICATIVA


O acesso pleno aos dados e informações oficiais é uma forma de demonstrar em termos concretos a vinculação dos atos e ações do Poder Público, de qualquer esfera, ao princípio da publicidade (art. 37, caput, Constituição Federal).

A publicidade e a transparência dos atos estatais são corolários do Estado Democrático de Direito (art. 1º, caput, Constituição Federal), organização política em que “todo o poder emana do povo, que o exerce por meio de representantes eleitos ou diretamente” (art. 1º, par. único, Constituição Federal) .

A regra geral, segundo a Constituição, é a publicidade, ressalvadas as informações cujo sigilo é considerado imprescindível à segurança da sociedade e do Estado (art. 5º, inc. XXXIII).

A proposta que submeto à apreciação tem por finalidade mais uma opção: o uso das tecnologias disponíveis pelos cidadãos e pelas organizações não governamentais por meio dos dados governamentais abertos. Essa medida permitirá o acesso e a reutilização dos dados governamentais, publicados em meio eletrônico, em formato que torne possível seu uso para qualquer fim lícito.

Dados governamentais abertos podem ser conceituados como os “dados produzidos pelo governo, mas colocados à disposição das pessoas de forma a tornar possível não apenas sua leitura e acompanhamento, mas também sua reutilização em novos projetos, sites e aplicativos; seu cruzamento com outros dados de diferentes fontes; sua disposição em visualizações interessantes e esclarecedoras.”1

Ou seja, são dados que podem ser livremente utilizados, reutilizados e redistribuídos por qualquer pessoa.2

Os dados governamentais serão classificados como abertos quando atenderem aos seguintes princípios3:

1) Completude – Todos os dados que são públicos devem ser disponibilizados. Dado público é aquele que não está sujeito a restrições de privacidade, segurança ou outros privilégios.

2) Primariedade – Os dados devem ser apresentados tal como são colhidos da fonte, com o maior nível possível de granularidade, sem agregação ou modificação. Por exemplo: um gráfico não é um dado aberto, mas os dados utilizados para construir a planilha que deu origem a ele podem ser dados abertos.

3) Atualidade – Os dados devem ser publicados o mais rápido possível para preservar o seu valor. Em geral, os dados têm periodicidade: quanto mais recentes e atuais, mais úteis para os usuários de uma determinada informação.

4) Acessibilidade – Os dados devem ser disponibilizados para a maior quantidade possível de pessoas, atendendo assim aos mais diferentes propósitos, além de estarem disponíveis por inteiro, num formato conveniente e modificável e por um custo razoável de reprodução, preferencialmente através de download pela internet. É imprescindível, além disso, que possam ser indexados (organizados) por mecanismos de busca (tais como Google, Yahoo!, Bing e outros). Um exemplo de dados que precisam ser adequados ao formato: os Balancetes da Receita, publicados pela Secretaria Municipal de Finanças, são fornecidos apenas em formato PDF, impossibilitando, dessa forma, a análise, a comparação, a classificação e o tratamento dos dados e informações ali dispostas. Ou seja, somente a leitura é possível ao usuário; se quiser utilizar-se desses dados, deverá copiá-los um a um, o que dificulta o acesso.

5) Reuso – devem ser fornecidos sob termos que permitam a reutilização e a redistribuição, incluindo o cruzamento com outros conjuntos de dados.

6) Legíveis por máquina – Os dados devem ser estruturados de modo a possibilitar que sejam processados automaticamente. Assim, uma tabela em PDF pode ser muito bem compreendida por pessoas, mas para um computador é apenas uma imagem. De outra parte, uma tabela em formato estruturado, como CSV ou XML, é processada mais facilmente por softwares e sistemas.

7) Centralização – os dados e informações de um órgão devem ser reunidos e mantidos em único lugar.

8) Participação universal – Os dados devem estar disponíveis para qualquer pessoa, sem necessidade de cadastro ou de qualquer outro procedimento que impeça o acesso.

9) Não-exclusividade – Nenhuma entidade ou organização deve ter controle exclusivo sobre os dados disponibilizados.

10) Livres de licenças – Os dados não devem estar sujeitos a copyrights, patentes, marcas registradas ou regulações de segredo industrial. Restrições razoáveis quanto à privacidade, segurança e outros privilégios podem ser aceitas, desde que sejam transparentes e justificadas.

A utilização dos dados governamentais abertos possibilita: (I) maior transparência, participação popular e controle democrático; (II) surgimento de novos produtos e serviços no âmbito privado; (III) inovação; (IV) maior eficiência na prestação de serviços governamentais, com redução de custos; (V) aferição do impacto das políticas públicas.

Existem muitos exemplos de utilização dos dados abertos em diversas atividades em outros países.4

Existem sites na Finlândia – Tax Free – e na Inglaterra - Where does my money go? (para onde vai o meu dinheiro?), que mostram como os recursos públicos são utilizados pelo governo. No Canadá, a abertura de dados possibilitou a economia de 3.2 bilhões de dólares a partir da descoberta de fraudes fiscais. Na Dinamarca, o site Folketsing acompanha as atividades do Parlamento.

Na Holanda, o site Vervuilings Alarm informa sobre a qualidade do ar. O site Mapumental, na Inglaterra, e o Mapnificent, na Alemanha, permitem encontrar locais para morar, de acordo com características do imóvel, preços e localização.

A utilização dos dados abertos tem grande importância econômica na União Européia. Novos produtos de novas companhias reutilizam esses dados. Na Dinamarca, o site Husetsweb ajuda a encontrar formas para melhorar a eficiência energética das residências, o que inclui planejamento financeiro e busca de construtores que possam realizar o trabalho. O Google Translate utiliza-se do grande volume de documentos europeus, publicados em todas as línguas européias, para treinar seus algoritmos5 de tradução, o que melhorou a qualidade do serviço.

No Brasil6, mais especificamente em São Paulo, o programador independente Maurício Maia desenvolveu o CMSP7, que traz uma nova forma de visualização de contas publicadas no site da Câmara Municipal de São Paulo. O que anteriormente poderia ser encontrado somente em diversas listas e tabelas, não permitindo a comparação entre as contas dos vereadores, hoje encontra-se disponível em gráficos e listagens interativas.

Ele também criou e desenvolveu o projeto Alagamentos, que reorganiza dados públicos sobre incidências de alagamentos na cidade de São Paulo, o que ajuda o usuário a evitar vias congestionadas ou perigosas nos dias de chuva.

O programador independente Bruno Barreto desenvolveu o SACSP, que permite visualizar e acompanhar as reclamações feitas pelos munícipes no site da Prefeitura de São Paulo.

O sociólogo Pedro Belasco criou o site Legislados, que republica os dados de tramitação de projetos na Câmara dos Deputados. Embora esses dados já estejam disponíveis na internet, o site fornece as mesmas informações em formatos estruturados e legíveis por máquina, o que facilita o trabalho de outras pessoas que queiram criar sistemas integrados às informações de projetos de lei em tramitação naquela Casa Legislativa.

Como se vê, há um enorme potencial a ser explorado em termos de criação de valor. A apresentação dos dados governamentais em formato aberto torna possível a combinação de diferentes conjuntos de dados e o desenvolvimento de novos produtos e serviços, em benefício da sociedade.

No Brasil, apesar de ser possível o acesso aos dados públicos, como no caso dos orçamentos, são poucos os órgãos que fornecem dados governamentais abertos. Os dados estão disponíveis para a visualização, mas apresentados com barreiras técnicas que dificultam a reutilização pela sociedade na criação de novos projetos e serviços.

É o que se verifica no Município de São Paulo, cuja legislação prevê a divulgação de dados e informações, mas não no formato aberto.

Pode-se citar a Lei nº 13.949, de 21-01-2005, que dispõe sobre a apresentação de relatórios de elaboração e execução orçamentárias; a Lei nº 14.016, de 28-06-2005, que dispõe sobre a apresentação de relatórios de execução orçamentárias; e as leis que dispõem sobre as diretrizes orçamentárias do Município.

  Ressalve-se que não se aplicam as disposições desta lei aos dados e informações fornecidos por meio de sistemas fechados ou restritos, cujo acesso é privativo a servidores públicos. É o caso do sistema NOVOSEO e SOF, que somente podem ser acessados por servidores do Executivo e do Legislativo. Entretanto, seria recomendável também que esses sistemas fossem disponibilizados aos cidadãos a partir de um web service (sem recorrer à tradução literal, web service seria uma espécie de cópia aberta do sistema na rede mundial de computadores).

A opção a mais pelo formato em dados abertos não geraria custos adicionais de implementação, pois os dados, já publicados, em formatos PDF, DOC ou JPEG, poderiam facilmente ser publicado em formatos abertos.

Diversas organizações não governamentais atuam para que o direito à informação seja exercido – a implementação dos dados em formato aberto é uma faceta da luta para conquistar esse direito na sua plenitude. Citem-se as seguintes: Fórum de Direito de Acesso a Informações Públicas (www.informacaopublica.com.br); Transparência HackDay (groups.google.com/group/thackday); Casa de Cultura Digital/São Paulo (http://www.casadaculturadigital.com.br); Informação é um direito seu (http://artigo19.org); Livre Acesso (http://www.livreacesso.net); Esfera (http://blog.esfera.mobi); Brasil Aberto (http://www.brasilaberto.org/manual-dados-abertos).     

Em vista das razões acima expostas e da relevância da matéria aqui tratada e exposta, espero dos meus Pares a aprovação desta propositura.



1- Transparência Hacker, Manual dos dados governamentais abertos, p. 3; traduzido e adaptado de opendatamanual.org. 2- Transparência Hacker, obra citada, p. 6. 3- A maioria dos princípios aqui listados são citados pela Transparência Hacker, obra citada, p. 6. 4- Transparência Hacker, Manual dos dados governamentais abertos, p. 3; traduzido e adaptado de opendatamanual.org. 5- No campo da informática, algoritmo é um conjunto de regras e procedimentos lógicos perfeitamente definidos que levam à solução de um problema em número finito de etapas. Dicionário Houaiss em versão eletrônica; disponível em www.uol.com.br/biblioteca. 6- Transparência Hacker, obra citada, p. 5. 7- Acesso ao site: http://cmsp.topical.com.br.




Comentários
Divulgue