Skip to content
GitLab
Explore
Sign in
Primary navigation
Search or go to…
Project
prr
Manage
Activity
Members
Labels
Plan
Issues
Issue boards
Milestones
Wiki
Code
Merge requests
Repository
Branches
Commits
Tags
Repository graph
Compare revisions
Build
Pipelines
Jobs
Pipeline schedules
Artifacts
Deploy
Releases
Harbor Registry
Model registry
Operate
Environments
Monitor
Incidents
Analyze
Value stream analytics
Contributor analytics
CI/CD analytics
Repository analytics
Model experiments
Help
Help
Support
GitLab documentation
Compare GitLab plans
Community forum
Contribute to GitLab
Provide feedback
Keyboard shortcuts
?
Snippets
Groups
Projects
Show more breadcrumbs
leg
prr
Commits
6532ddb4
Project 'c3sl/c3docs/c3hpc-user-docs' was moved to 'root/c3hpc/user-docs'. Please update any links and bookmarks that may still have the old path.
Commit
6532ddb4
authored
9 years ago
by
Walmes Marques Zeviani
Browse files
Options
Downloads
Patches
Plain Diff
Finaliza o resumo sobre PR.
parent
5f9e73f7
No related branches found
No related tags found
No related merge requests found
Changes
1
Show whitespace changes
Inline
Side-by-side
Showing
1 changed file
proposta.md
+25
-36
25 additions, 36 deletions
proposta.md
with
25 additions
and
36 deletions
proposta.md
+
25
−
36
View file @
6532ddb4
...
...
@@ -13,42 +13,31 @@
reproducibilidade cresce na proporção que surgem problemas complexos
ou incomuns que recebem soluções elaboradas ou específicas. Como em
outras áreas, na Estatística as análises de dados empregam métodos
novos e algoritmos especializados, além ainda de envolvem grandes
bases de dados e alto processamento computacional. Em situações como
essa, surge a dificuldade de outros 1) reproduzirem os resultados da
pesquisa para entender com segurança e integralmente as conclusões, 2)
aplicarem variações da metodologia no mesmo contexto e 3) empregarem
em outros contextos.
A pesquisa reproduzível se baseia preodominantemente nos documentos
híbridos, que misturam prosa e código. Nestes, uma grande vantagem é
que as tabelas e gráficos são gerados programaticamente e, por isso,
atualizados com o código.
Para a estatística, Sweave foi o primeiro recurso dessa modalidade e
consiste de blocos de código R inseridos no meio de prosa em
documentos LaTeX. Atualmente, pode-se usar MarkDown, Org, HTML, e até
documentos do OpenOffice Writer, no lugar do LaTeX, para a prosa. Para
os fragmentos de código R existe amplo controle na execução e
exportação dos resultados, como
*layout*
de tabelas, dimensão de
figuras e armazenamento de artefatos (
*cache*
).
A reproducibilidade assegura que as pessoas reproduzam os resultados
ao invés de se preocuparem em reimplementar a partir das descrições,
imcompletas ou imprecisas, de um documento (artigo, tese).
Um pouco mais complicado para quem escreve porém muito melhor para
quem lê.
As ferramentas garantem reproducibilidade da pesquisa sem
acrescentar grande demanda/exigência/empenho do autor.
Embora reconhecida a importância da PR, sua baixa adoção é por
desconhecimento das melhores ferramentas.
Este curso será focado nas ferramentas para análise estatística
documentada, que permitem que cientistas publiquem suas análises em um
único documento que irá permitir que outros cientistas executem a
mesma análise e obtenham os mesmos resultados, modifiquem e estendam.
novos e algoritmos especializados, além ainda de cada vez mais
envolvem grandes bases de dados e alto processamento computacional. Em
situações como essa, surge a dificuldade de outros 1) reproduzirem os
resultados da pesquisa para entender com segurança e integralmente as
conclusões, 2) aplicarem variações da metodologia no mesmo contexto e
3) empregarem em outros contextos. A pesquisa reproduzível se baseia
preodominantemente nos documentos híbridos, que misturam prosa e
código. Para a Estatística, Sweave foi o primeiro recurso dessa
modalidade e consiste de fragmentos de código R inseridos no meio de
prosa em documentos LaTeX. Atualmente, pode-se usar MarkDown, Org,
HTML, e até documentos do OpenOffice Writer, no lugar do LaTeX, para a
prosa. Para os fragmentos de código R existe amplo controle na
execução e exportação dos resultados, como
*layout*
de tabelas,
dimensão de figuras e armazenamento de artefatos (
*cache*
). Portanto,
uma das principais vantagens é que as tabelas e gráficos são gerados
programaticamente e, por isso, atualizados com o código, diminuindo o
trabalho de revisão pelos autores. A Pesquisa Reproduzível assegura
que os leitores reproduzam os resultados ao invés de se preocuparem em
reimplementar a partir das descrições, incompletas ou imprecisas,
fornecidas no documento (artigo, tese). Embora reconhecida a
importância da Pesquisa Reproduzível, sua baixa adoção é, em maior
parte, pelo desconhecimento das melhores ferramentas, hoje
abundantes. O desconhecimento dos melhores meios, além de exigir
elevada dedicação dos autores, tem pouca garantia de
reproducibilidade.
-
**Objetivos**
: Este curso tem como objetivo fornecer os conceitos e
ferramentas por trás da comunicação de analises de dados modernas, de
...
...
This diff is collapsed.
Click to expand it.
Preview
0%
Loading
Try again
or
attach a new file
.
Cancel
You are about to add
0
people
to the discussion. Proceed with caution.
Finish editing this message first!
Save comment
Cancel
Please
register
or
sign in
to comment