Skip to content
GitLab
Explore
Sign in
Primary navigation
Search or go to…
Project
prr
Manage
Activity
Members
Labels
Plan
Issues
Issue boards
Milestones
Wiki
Code
Merge requests
Repository
Branches
Commits
Tags
Repository graph
Compare revisions
Build
Pipelines
Jobs
Pipeline schedules
Artifacts
Deploy
Releases
Harbor Registry
Model registry
Operate
Environments
Monitor
Incidents
Analyze
Value stream analytics
Contributor analytics
CI/CD analytics
Repository analytics
Model experiments
Help
Help
Support
GitLab documentation
Compare GitLab plans
Community forum
Contribute to GitLab
Provide feedback
Keyboard shortcuts
?
Snippets
Groups
Projects
Show more breadcrumbs
leg
prr
Commits
a5d9ed09
Commit
a5d9ed09
authored
9 years ago
by
Fernando Mayer
Browse files
Options
Downloads
Patches
Plain Diff
Revisao da proposta
parent
6631f0d9
No related branches found
No related tags found
No related merge requests found
Changes
1
Show whitespace changes
Inline
Side-by-side
Showing
1 changed file
proposta.md
+45
-43
45 additions, 43 deletions
proposta.md
with
45 additions
and
43 deletions
proposta.md
+
45
−
43
View file @
a5d9ed09
...
@@ -5,52 +5,54 @@
...
@@ -5,52 +5,54 @@
-
**Instrutores**
: Fernando Mayer & Walmes Zeviani (LEG/UFPR)
-
**Instrutores**
: Fernando Mayer & Walmes Zeviani (LEG/UFPR)
-
**Resumo**
: A ideia central da Pesquisa Reproduzível é que a bem
-
**Resumo**
: A ideia central da pesquisa reproduzível é que para a bem
sucedida comunicação e validação dos resultados precisa que o código
sucedida comunicação e validação de resultados de pesquisas
seja distribuído junto com os resultados. A necessidade da
científicas, os dados e os códigos utilizados nas análises devem ser
distribuídos junto com os resultados. A necessidade da
reproducibilidade cresce na proporção que surgem problemas complexos
reproducibilidade cresce na proporção que surgem problemas complexos
ou incomuns que recebem soluções elaboradas ou específicas.
Como em
ou incomuns que recebem soluções elaboradas ou específicas.
Assim como
outras áreas, na Estatística as análises de dados empregam métodos
em
outras áreas, na Estatística as análises de dados empregam métodos
novos e algoritmos especializados, além
ainda
de cada vez mais
novos e algoritmos especializados, além de cada vez mais
envolverem
envolvem
grandes bases de dados e alto processamento computacional. Em
grandes bases de dados e alto processamento computacional. Em
situações como essa, surge a dificuldade de outros
1) reproduzirem os
situações como essa, surge a dificuldade de outros
pesquisadores: 1)
resultados da pesquisa para entender com segurança e
integralmente as
reproduzirem os
resultados da pesquisa para entender com segurança e
conclusões, 2) aplicarem variações da metodologia no
mesmo contexto e
integralmente as
conclusões, 2) aplicarem variações da metodologia no
3) empregarem em outros contextos. A pesquisa reproduzível se baseia
mesmo contexto e 3) empregarem a metodologia em outros contextos. A
preodominantemente nos documentos
híbridos, que misturam prosa e
pesquisa reproduzível se baseia
preodominantemente nos documentos
código. Para a Estatística, Sweave
foi o primeiro recurso dessa
híbridos, que misturam texto e
código. Para a Estatística,
o
Sweave
modalidade e consiste de fragmentos de
código R inseridos no meio de
foi o primeiro recurso dessa
modalidade e consiste de fragmentos de
prosa
em documentos LaTeX. Atualmente,
pode-se usar MarkDown, Org,
código R inseridos no meio de texto
em documentos LaTeX. Atualmente,
HTML, e até documentos do OpenOffice Writer, no lug
ar
do
LaTeX, para a
pode-se usar outras linguagens como M
ar
k
do
wn, Org, HTML, e até
prosa. Para os fragmentos de código R existe amplo controle na
documentos do OpenOffice Writer, para a escrita do texto. Para os
execução e exportação dos resultados, como
*layout*
de tabelas,
fragmentos de código R, existe amplo controle na execução e exportação
d
imensão de figuras e armazena
men
t
o de
artefatos (
*cache*
). Portanto,
d
os resultados, como
*layout*
de tabelas, di
men
sã
o de
figuras e
uma das principais vantagens é que as tabelas e gráficos são gerado
s
armazenamento de resultados (
*cache*
). Portanto, uma das principai
s
programaticamente e, por isso, atualizados com o código, diminuindo o
vantagens é que as tabelas e gráficos são gerados dinamicamente e, por
trabalho de revisão pelos autores. A Pesquisa Reproduzível assegura
isso, atualizados com o código, diminuindo o trabalho de revisão pelos
que os leitores reproduzam os resultados ao invés de se preocuparem e
m
autores. A pesquisa reproduzível assegura que os leitores reproduza
m
reimplementar a partir das descrições, incompletas ou imprecis
as
,
os resultados ao invés de se preocuparem em reimplementar a partir d
as
fornecidas no documento (artigo, tese). Embora reconh
ecida
a
descrições (algumas vezes incompletas ou imprecisas), forn
ecida
s no
importância da Pesquisa Reproduzível, sua baixa adoção é, em maior
documento (artigo, tese). A importância da reproducibilidade na
parte, pelo desconhecimento das melhores ferramentas, hoje
ciência é altamente reconhecida hoje em dia, mas ainda não é
abundantes. O desconhecimento dos melhores meios, além de exigir
largamente praticada como deveria ser. Um dos motivos é que muitos
elevada dedicação dos autores, tem pouca garantia de
cientistas (e particularmente estatísticos) não adotaram ainda as
reproducibilidade
.
ferramentas necessárias para a pesquisa reproduzível
.
-
**Objetivos**
: Neste curso serão discutidos os princípios gerais para
-
**Objetivos**
: Neste curso serão discutidos os princípios gerais para
a
P
esquisa
R
eproduzível voltada para a Estatística. O foco é capacitar
a
p
esquisa
r
eproduzível voltada para a Estatística. O foco é capacitar
acadêmicos, professores e pesquisadores a usar as ferramentas,
acadêmicos, professores e pesquisadores a usar as ferramentas,
baseadas em software livre, mais interessantes e fáceis de usar, para
baseadas em software livre, mais interessantes e fáceis de usar, para
análises reproduzível de dados. O curso está dividido em duas
análise reproduzível de dados. O curso está dividido em duas partes. A
partes. A primeira demonstra como gerar relatórios dinâmicos com o R
primeira demonstra como gerar relatórios dinâmicos com o R usando
usando, principalmente, MarkDown e LateX e a segunda ensina a criar
principalmente Markdown e LateX, e a segunda parte irá demonstrar a
pacotes do R que incluam dados, funções, documentação e vinhetas. Com
criação de pacotes do R que incluem dados, funções, documentação e
estas duas partes, o Curso vai permitir facilitar a produção de
vinhetas. Com estas duas partes, o curso vai permitir facilitar a
comunicações científicas, como artigos, teses e livros bem como notas
produção de comunicações científicas reproduzíveis, como artigos,
de aula e relatórios de análise de dados. Para isso, serão utilizados
teses e livros bem como notas de aula e relatórios de análise de
os pacotes R
`knitr`
,
`rmarkdown`
,
`devtools`
, e
`roxygen2`
além das
dados. Para isso, serão utilizados os pacotes do R:
`knitr`
,
linguagens de marcação LaTeX e Markdown, todos estes disponíveis para
`rmarkdown`
,
`devtools`
, e
`roxygen2`
, além das linguagens de marcação
LaTeX e Markdown. Todas estas ferramentas estão disponíveis para
qualquer sistema operacional. Por fim, nosso objetivo final é de que
qualquer sistema operacional. Por fim, nosso objetivo final é de que
os atendentes do
C
urso saiam preparados para utilizar essas
os atendentes do
c
urso saiam preparados para utilizar essas
ferramentas em suas próprias pesquisas, ajudando a ampliar o uso a
ferramentas em suas próprias pesquisas, ajudando a ampliar o uso
, e
a
melhorar a forma como se faz pesquisa reproduzível atualmente.
melhorar a forma como se faz pesquisa reproduzível atualmente.
This diff is collapsed.
Click to expand it.
Preview
0%
Loading
Try again
or
attach a new file
.
Cancel
You are about to add
0
people
to the discussion. Proceed with caution.
Finish editing this message first!
Save comment
Cancel
Please
register
or
sign in
to comment