Skip to content
Snippets Groups Projects
Commit a5d9ed09 authored by Fernando Mayer's avatar Fernando Mayer
Browse files

Revisao da proposta

parent 6631f0d9
No related branches found
No related tags found
No related merge requests found
...@@ -5,52 +5,54 @@ ...@@ -5,52 +5,54 @@
- **Instrutores**: Fernando Mayer & Walmes Zeviani (LEG/UFPR) - **Instrutores**: Fernando Mayer & Walmes Zeviani (LEG/UFPR)
- **Resumo**: A ideia central da Pesquisa Reproduzível é que a bem - **Resumo**: A ideia central da pesquisa reproduzível é que para a bem
sucedida comunicação e validação dos resultados precisa que o código sucedida comunicação e validação de resultados de pesquisas
seja distribuído junto com os resultados. A necessidade da científicas, os dados e os códigos utilizados nas análises devem ser
distribuídos junto com os resultados. A necessidade da
reproducibilidade cresce na proporção que surgem problemas complexos reproducibilidade cresce na proporção que surgem problemas complexos
ou incomuns que recebem soluções elaboradas ou específicas. Como em ou incomuns que recebem soluções elaboradas ou específicas. Assim como
outras áreas, na Estatística as análises de dados empregam métodos em outras áreas, na Estatística as análises de dados empregam métodos
novos e algoritmos especializados, além ainda de cada vez mais novos e algoritmos especializados, além de cada vez mais envolverem
envolvem grandes bases de dados e alto processamento computacional. Em grandes bases de dados e alto processamento computacional. Em
situações como essa, surge a dificuldade de outros 1) reproduzirem os situações como essa, surge a dificuldade de outros pesquisadores: 1)
resultados da pesquisa para entender com segurança e integralmente as reproduzirem os resultados da pesquisa para entender com segurança e
conclusões, 2) aplicarem variações da metodologia no mesmo contexto e integralmente as conclusões, 2) aplicarem variações da metodologia no
3) empregarem em outros contextos. A pesquisa reproduzível se baseia mesmo contexto e 3) empregarem a metodologia em outros contextos. A
preodominantemente nos documentos híbridos, que misturam prosa e pesquisa reproduzível se baseia preodominantemente nos documentos
código. Para a Estatística, Sweave foi o primeiro recurso dessa híbridos, que misturam texto e código. Para a Estatística, o Sweave
modalidade e consiste de fragmentos de código R inseridos no meio de foi o primeiro recurso dessa modalidade e consiste de fragmentos de
prosa em documentos LaTeX. Atualmente, pode-se usar MarkDown, Org, código R inseridos no meio de texto em documentos LaTeX. Atualmente,
HTML, e até documentos do OpenOffice Writer, no lugar do LaTeX, para a pode-se usar outras linguagens como Markdown, Org, HTML, e até
prosa. Para os fragmentos de código R existe amplo controle na documentos do OpenOffice Writer, para a escrita do texto. Para os
execução e exportação dos resultados, como *layout* de tabelas, fragmentos de código R, existe amplo controle na execução e exportação
dimensão de figuras e armazenamento de artefatos (*cache*). Portanto, dos resultados, como *layout* de tabelas, dimeno de figuras e
uma das principais vantagens é que as tabelas e gráficos são gerados armazenamento de resultados (*cache*). Portanto, uma das principais
programaticamente e, por isso, atualizados com o código, diminuindo o vantagens é que as tabelas e gráficos são gerados dinamicamente e, por
trabalho de revisão pelos autores. A Pesquisa Reproduzível assegura isso, atualizados com o código, diminuindo o trabalho de revisão pelos
que os leitores reproduzam os resultados ao invés de se preocuparem em autores. A pesquisa reproduzível assegura que os leitores reproduzam
reimplementar a partir das descrições, incompletas ou imprecisas, os resultados ao invés de se preocuparem em reimplementar a partir das
fornecidas no documento (artigo, tese). Embora reconhecida a descrições (algumas vezes incompletas ou imprecisas), fornecidas no
importância da Pesquisa Reproduzível, sua baixa adoção é, em maior documento (artigo, tese). A importância da reproducibilidade na
parte, pelo desconhecimento das melhores ferramentas, hoje ciência é altamente reconhecida hoje em dia, mas ainda não é
abundantes. O desconhecimento dos melhores meios, além de exigir largamente praticada como deveria ser. Um dos motivos é que muitos
elevada dedicação dos autores, tem pouca garantia de cientistas (e particularmente estatísticos) não adotaram ainda as
reproducibilidade. ferramentas necessárias para a pesquisa reproduzível.
- **Objetivos**: Neste curso serão discutidos os princípios gerais para - **Objetivos**: Neste curso serão discutidos os princípios gerais para
a Pesquisa Reproduzível voltada para a Estatística. O foco é capacitar a pesquisa reproduzível voltada para a Estatística. O foco é capacitar
acadêmicos, professores e pesquisadores a usar as ferramentas, acadêmicos, professores e pesquisadores a usar as ferramentas,
baseadas em software livre, mais interessantes e fáceis de usar, para baseadas em software livre, mais interessantes e fáceis de usar, para
análises reproduzível de dados. O curso está dividido em duas análise reproduzível de dados. O curso está dividido em duas partes. A
partes. A primeira demonstra como gerar relatórios dinâmicos com o R primeira demonstra como gerar relatórios dinâmicos com o R usando
usando, principalmente, MarkDown e LateX e a segunda ensina a criar principalmente Markdown e LateX, e a segunda parte irá demonstrar a
pacotes do R que incluam dados, funções, documentação e vinhetas. Com criação de pacotes do R que incluem dados, funções, documentação e
estas duas partes, o Curso vai permitir facilitar a produção de vinhetas. Com estas duas partes, o curso vai permitir facilitar a
comunicações científicas, como artigos, teses e livros bem como notas produção de comunicações científicas reproduzíveis, como artigos,
de aula e relatórios de análise de dados. Para isso, serão utilizados teses e livros bem como notas de aula e relatórios de análise de
os pacotes R `knitr`, `rmarkdown`, `devtools`, e `roxygen2` além das dados. Para isso, serão utilizados os pacotes do R: `knitr`,
linguagens de marcação LaTeX e Markdown, todos estes disponíveis para `rmarkdown`, `devtools`, e `roxygen2`, além das linguagens de marcação
LaTeX e Markdown. Todas estas ferramentas estão disponíveis para
qualquer sistema operacional. Por fim, nosso objetivo final é de que qualquer sistema operacional. Por fim, nosso objetivo final é de que
os atendentes do Curso saiam preparados para utilizar essas os atendentes do curso saiam preparados para utilizar essas
ferramentas em suas próprias pesquisas, ajudando a ampliar o uso a ferramentas em suas próprias pesquisas, ajudando a ampliar o uso, e a
melhorar a forma como se faz pesquisa reproduzível atualmente. melhorar a forma como se faz pesquisa reproduzível atualmente.
0% Loading or .
You are about to add 0 people to the discussion. Proceed with caution.
Please register or to comment