diff --git "a/Explora\303\247\303\243o de dados/README.md" "b/Explora\303\247\303\243o de dados/README.md" new file mode 100644 index 0000000000000000000000000000000000000000..e11524e835e1940b5abb92d388d49edb44ac9b90 --- /dev/null +++ "b/Explora\303\247\303\243o de dados/README.md" @@ -0,0 +1,16 @@ +# Perguntas e respostas feitas no exercicio pratico 3 + +- Que tipos de dados você tem, majoritariamente (atributos numéricos, textuais)? + O Dataset tem majoritariamente dados numéricos, com algumas informações de IP e timestamps junto. + +- Qual seu objetivo com esse dataset? + Detectar e diferenciar ataques DDoS do tipo UDP-Flood, Syn-Flood e Conexões benignas a servidores. + +- Como é a distribuição dos dados do dataset? + O dataset contém dados de ataques DDoS, juntamente com dados de conexões benignas a servidores. + Explicações detalhadas podem ser encontradas [aqui](https://www.unb.ca/cic/datasets/ddos-2019.html) + Os dados são majoritariamente sobre Syn flood, mas contêm UDP-Lag, UDP-flood e dados de conexões benignas. + +- Quais colunas/atributos você julga ser interessante manter e remover? Por quê? + Eu pretendo manter as colunas com informações numéricas, remover as que não são assim como timestamps. + As colunas mais importantes para mim são as colunas 'Source Port', 'Destination Port' e 'Packet Length Variance', que são as que têm valores que deixam mais claro que tipo de informação se tem a cada linha. \ No newline at end of file