diff --git "a/Explora\303\247\303\243o de dados/README.md" "b/Explora\303\247\303\243o de dados/README.md" index ae4f3a1d72146e455a4e8c04586838340f0fb630..bb8324aee5d49a7b1b16b4300955ed7842d7da96 100644 --- "a/Explora\303\247\303\243o de dados/README.md" +++ "b/Explora\303\247\303\243o de dados/README.md" @@ -1,16 +1,23 @@ # Exercicio pratico 3 - Que tipos de dados você tem, majoritariamente (atributos numéricos, textuais)? + O Dataset tem majoritariamente dados numéricos, com algumas informações de IP e timestamps junto. - Qual seu objetivo com esse dataset? + Detectar e diferenciar ataques DDoS do tipo UDP-Flood, Syn-Flood e Conexões benignas a servidores. - Como é a distribuição dos dados do dataset? + O dataset contém dados de ataques DDoS, juntamente com dados de conexões benignas a servidores. - Explicações detalhadas podem ser encontradas [aqui](https://www.unb.ca/cic/datasets/ddos-2019.html) + + Explicações detalhadas podem ser encontradas [aqui](https://www.unb.ca/cic/datasets/ddos-2019.html). + Os dados são majoritariamente sobre Syn flood, mas contêm UDP-Lag, UDP-flood e dados de conexões benignas. - Quais colunas/atributos você julga ser interessante manter e remover? Por quê? + Eu pretendo manter as colunas com informações numéricas, remover as que não são assim como timestamps. + As colunas mais importantes para mim são as colunas 'Source Port', 'Destination Port' e 'Packet Length Variance', que são as que têm valores que deixam mais claro que tipo de informação se tem a cada linha. \ No newline at end of file