Skip to content
Snippets Groups Projects
Select Git revision
  • f884ca99a16e4454f969f7ab92495e357ca37f55
  • main default protected
2 results

simcaq_statistics

  • Clone with SSH
  • Clone with HTTPS
  • Muriki's avatar
    mgy20 authored
    f884ca99
    History

    simcaq_statistics

    Este repositório contém scripts e análises referentes ao banco do Simcaq.

    Objetivo

    Encontrar uma forma de encontrar colunas que se completam em um banco de dados, mesmo que as colunas sejam de tipos diferentes e possuam nulos.
    Tentativas até então

    • Somar colunas binarias de presença de dados

    • Teste de Kolmogorov-smirnov
      Hipotese nula: Para todas as amostras retiradas de colunas diferentes, elas pertencem ao mesmo dado.

    Links

    Fonte dos microdados do governo

    https://www.gov.br/inep/pt-br/acesso-a-informacao/dados-abertos/microdados/