Skip to content
Snippets Groups Projects
Select Git revision
  • main default protected
1 result

simcaq_statistics

  • Clone with SSH
  • Clone with HTTPS
  • simcaq_statistics

    Este repositório contém scripts e análises referentes ao banco do Simcaq.

    Objetivo

    Encontrar uma forma de encontrar colunas que se completam em um banco de dados, mesmo que as colunas sejam de tipos diferentes e possuam nulos.
    Tentativas até então

    • Somar colunas binarias de presença de dados

    • Teste de Kolmogorov-smirnov
      Hipotese nula: Para todas as amostras retiradas de colunas diferentes, elas pertencem ao mesmo dado.

    Links

    Fonte dos microdados do governo

    https://www.gov.br/inep/pt-br/acesso-a-informacao/dados-abertos/microdados/