Os dados são a base do progresso em quase todas as áreas. Eles são a matéria-prima a partir da qual são forjados insights profundos, permitindo-nos medir com precisão as realidades atuais, identificar tendências críticas e, possivelmente, prever resultados futuros.
No Google, nossa missão com o Data Commons é organizar os dados estatísticos disponíveis publicamente no mundo todo, tornando-os mais acessíveis e úteis para todos. Ele é um gráfico de conhecimento de código aberto que unifica uma vasta gama de dados públicos de diversas origens, simplificando o acesso e a compreensão para desenvolvedores, pesquisadores e analistas de dados. Junto com o site datacommons.org, a Pesquisa Google usa o Data Commons para responder a consultas como "Qual é a população de São Francisco?", com o gráfico superior gerado pelo Data Commons.
Hoje, estamos anunciando a disponibilidade geral da nova biblioteca de cliente do Python para Data Commons com base na API REST V2. Essa nova biblioteca do Python melhora drasticamente a forma como os desenvolvedores de dados podem usar o Data Commons.
Esse marco foi moldado principalmente pela visão e pelas contribuições substanciais de nossa parceira The ONE Campaign, uma organização global que trabalha para criar os investimentos necessários para oportunidades econômicas e vidas mais saudáveis na África. Construímos o Data Commons como uma plataforma de código aberto precisamente para incentivar as contribuições da comunidade e permitir usos inovadores, e essa parceria com a The ONE Campaign exemplifica perfeitamente esse objetivo. A ONE defendeu, propôs o design e codificou a biblioteca de cliente para disponibilizar os ricos insights do Data Commons para cientistas e analistas de dados que desejam aproveitar o vasto ecossistema de ferramentas analíticas e bibliotecas do Python.
A plataforma Data Commons também permite que organizações como as Nações Unidas ou a ONE hospedem suas próprias instâncias do Data Commons. Essas instâncias personalizadas permitem a integração total de conjuntos de dados proprietários com o gráfico de conhecimento fundamental do Data Commons. As organizações aproveitam as ferramentas e o framework de dados do Data Commons, mantendo controle total sobre seus próprios dados e recursos.
Uma das adições mais impactantes na biblioteca V2 é o suporte robusto a instâncias personalizadas. Isso significa que, agora, você pode usar a biblioteca do Python para consultar programaticamente qualquer instância pública ou privada, seja ela hospedada localmente, em sua organização ou no Google Cloud Platform.
A biblioteca do Python facilita muito a execução de consultas comuns em dados do Data Commons, tais como:
A V2 da biblioteca de cliente oferece muitas melhorias técnicas em relação à biblioteca V1, incluindo:
variable = "sdg/SI_POV_DAY1"
variable_name = "Proportion of population below international poverty line"
df = client.observations_dataframe(variable_dcids=variable, date="all", parent_entity="Earth", entity_type="Continent")
df = df.pivot(index="date", columns="entity_name", values="value")
ax = df.plot(kind="line")
ax.set_xlabel("Year")
ax.set_ylabel("%")
ax.set_title(variable_name)
ax.legend()
ax.plot()
Para começar a usar a biblioteca do Python do Data Commons, você pode instalar o pacote diretamente a partir de PyPI. Também fornecemos recursos abrangentes para ajudar você a se aprofundar, incluindo documentação de referência e tutoriais on-line disponíveis como notebooks do Google Colab.
Para quem atualmente usa a API Python V1, recomendamos atualizar para a nova biblioteca Python V2. A API V1 está programada para ser descontinuada, e a adoção da nova biblioteca garante que você tenha acesso aos recursos mais recentes e a suporte contínuo.
Essa biblioteca é um testemunho do poder da colaboração de código aberto. O código-fonte aberto está disponível no GitHub, e agradecemos as contribuições da comunidade de acordo com o Contrato de licença de colaborador do Google.