Skip to content
Snippets Groups Projects
Commit 58f50b41 authored by Bruna Wundervald's avatar Bruna Wundervald
Browse files

Pequenas adições no texto

parent 6af0b733
No related branches found
No related tags found
No related merge requests found
Pipeline #
vignettes/Rplot.png

10 KiB

File added
...@@ -18,7 +18,7 @@ MLG (ou GLM), vamos utilizar o conjunto de dados `PaulaEx3.7.25.txt`. ...@@ -18,7 +18,7 @@ MLG (ou GLM), vamos utilizar o conjunto de dados `PaulaEx3.7.25.txt`.
```{r} ```{r}
library(labestData) library(labestData)
# lista de dados de dentro do pacote # lista os dados dentro do pacote
# ls("package:labestData") # ls("package:labestData")
``` ```
Podemos olhar para a descrição dos dados, obtida através da função `help`: Podemos olhar para a descrição dos dados, obtida através da função `help`:
...@@ -27,13 +27,15 @@ help(PaulaEx3.7.25, help_type = "html") ...@@ -27,13 +27,15 @@ help(PaulaEx3.7.25, help_type = "html")
``` ```
Este banco de dados trata sobre a a pulsação em repouso de homens que Este banco de dados trata sobre a a pulsação em repouso de homens que
fumam. A variável resposta é dicotômica, podendo ser pulsção "normal" ou "alta". fumam. A variável resposta é dicotômica, podendo ser pulsção "normal"
As duas outras variáveis, ou seja, o peso do indivíduo e o fator "fuma ou não", ou "alta". As duas outras variáveis, ou seja, o peso do indivíduo e o
serão utilizadas como possíveis explicativas no nível de pulsação. fator "fuma" (sim ou não), serão utilizadas como possíveis explicativas
no nível de pulsação.
Para cada variável, precisamos estar atentos às respectivas unidades de medida, Para cada variável, precisamos estar atentos às respectivas unidades
pois as interpretações do ajuste do modelo dependem, também, disso. Aqui não de medida, pois as interpretações do ajuste do modelo dependem, também,
teremos problemas, porque temos conhecimento e clareza sobre estas unidades. disso. Aqui não teremos problemas, porque temos conhecimento e clareza
sobre estas unidades.
```{r} ```{r}
#----------------------------------------------------------------------- #-----------------------------------------------------------------------
...@@ -93,7 +95,7 @@ $$ f(y_{i}; \theta_{i}, \phi) = exp \{ \frac{\theta_{i}y_{i} - b(\theta_{i})}{\p ...@@ -93,7 +95,7 @@ $$ f(y_{i}; \theta_{i}, \phi) = exp \{ \frac{\theta_{i}y_{i} - b(\theta_{i})}{\p
Com: Com:
$E(Y_{i}) = b'(\theta_{i})$ e $Var(Y_{i}) = \phi b"(\theta_{i}) = \phi V(\mu_{i})$ $E(Y_{i}) = b'(\theta_{i})$ e $Var(Y_{i}) = \phi b''(\theta_{i}) = \phi V(\mu_{i})$
- O componente sistemático é o preditor linear, contemplando um conjunto de - O componente sistemático é o preditor linear, contemplando um conjunto de
...@@ -121,9 +123,9 @@ Códigos para o ajuste: ...@@ -121,9 +123,9 @@ Códigos para o ajuste:
# como a variável 'pulsa' é um fator binário, vamos # como a variável 'pulsa' é um fator binário, vamos
# utilizar a distribuição binomial # utilizar a distribuição binomial
m0 <- glm(pulsa ~ peso + fuma, data = PaulaEx3.7.25, m0 <- glm(pulsa ~ peso + fuma, data = PaulaEx3.7.25,
family= binomial(link="logit")) # especificação da função de ligação family= binomial(link="logit")) # especificação da função
# como sendo 'logito' # de ligação como 'logito'
summary(m0) # resumo do modelo summary(m0) # resumo do ajuste
levels(PaulaEx3.7.25$pulsa) # níveis da variável resposta levels(PaulaEx3.7.25$pulsa) # níveis da variável resposta
``` ```
...@@ -136,10 +138,30 @@ mais chances de ter uma pulsação normal em repouso. Obtemos ...@@ -136,10 +138,30 @@ mais chances de ter uma pulsação normal em repouso. Obtemos
essas conclusões uma vez que ambos os parâmetros $\beta_{1}$ e essas conclusões uma vez que ambos os parâmetros $\beta_{1}$ e
$\beta_{2}$ têm sinal negativo. $\beta_{2}$ têm sinal negativo.
Como esse é um caso *binomial*, estamo modelado uma probabilidade, Como esse é um caso *binomial*, estamo modelando uma probabilidade,
ou seja, valores que devem pertencer ao intervalo $[0,1]$. As estimativas ou seja, valores que devem pertencer ao intervalo $[0,1]$. As estimativas
acima estão na escala do preditos. Para colocar na escala da **resposta**, acima estão na escala do preditos. Para colocar na escala da **resposta**,
a seguinte equação é utilizada: a seguinte equação é utilizada:
$$ \hat\pi_{x} = \frac{\exp^{\beta_{0} + \beta_{1} * x_{1} + \beta_{2} * x_{2}}}{1 + \exp^{\beta_{0} + \beta_{1} * x_{1} + \beta_{2}}}$$ $$ \hat\pi_{x} = \frac{\exp^{\beta_{0} + \beta_{1} x_{1} + \beta_{2} x_{2}}}{1 + \exp^{\beta_{0} + \beta_{1} x_{1} + \beta_{2} x_{2}}}$$
$$ \hat\pi_{x} = \frac{\exp^{3.18021 -0.05050 * x_{1} -1.19298 x_{2}}}{1 + \exp^{3.18021 -0.05050 * x_{1} -1.19298 x_{2}}}$$ $$ \hat\pi_{x} = \frac{\exp^{3.18021 -0.05050 x_{1} -1.19298 x_{2}}}{1 + \exp^{3.18021 -0.05050 x_{1} -1.19298 x_{2}}}$$
Todavia, o valor da *deviance* residual parece ser muito alto. Dela
para a do modelo nulo, temos uma diferença de apenas 7.57. Isso
é indicativo de má qualidade do ajuste. Logo, ao ajustar um modelo
linear generalizado, devemos atentar para este ponto, porque medidas
de melhoria do ajuste podem ser tomadas.
```{r}
par(mfrow=c(2,2))
plot(m0)
layout(1)
plot(residuals(m0, type = "deviance"))
plot(residuals(m0, type = "pearson"))
library(hnp)
hnp(m0)
```
0% Loading or .
You are about to add 0 people to the discussion. Proceed with caution.
Please register or to comment