Skip to content
Snippets Groups Projects
Commit 38ae09e0 authored by Eduardo E. R. Junior's avatar Eduardo E. R. Junior
Browse files

Incorpora sugestões pós apresentação do tcc

parent 14b7107d
No related branches found
No related tags found
No related merge requests found
%% abtex2-modelo-trabalho-academico.tex, v<VERSION> laurocesar
%% Copyright 2012-<COPYRIGHT_YEAR> by abnTeX2 group at http://www.abntex.net.br/
%%
%% This work may be distributed and/or modified under the
%% conditions of the LaTeX Project Public License, either version 1.3
%% of this license or (at your option) any later version.
%% The latest version of this license is in
%% http://www.latex-project.org/lppl.txt
%% and version 1.3 or later is part of all distributions of LaTeX
%% version 2005/12/01 or later.
%%
%% This work has the LPPL maintenance status `maintained'.
%%
%% The Current Maintainer of this work is the abnTeX2 team, led
%% by Lauro César Araujo. Further information are available on
%% http://www.abntex.net.br/
%%
%% This work consists of the files abntex2-modelo-trabalho-academico.tex,
%% abntex2-modelo-include-comandos and abntex2-modelo-references.bib
%%
% ------------------------------------------------------------------------ % ------------------------------------------------------------------------
% ------------------------------------------------------------------------ % ------------------------------------------------------------------------
% abnTeX2: Modelo de Trabalho Academico (tese de doutorado, dissertacao de % abnTeX2: Modelo de Trabalho Academico (tese de doutorado, dissertacao de
...@@ -45,6 +24,21 @@ ...@@ -45,6 +24,21 @@
svgnames svgnames
]{abntex2} ]{abntex2}
% ---
% Novo list of (listings) para QUADROS
% ---
\newcommand{\quadroname}{Quadro}
\newcommand{\listofquadrosname}{Lista de quadros}
\newfloat[chapter]{quadro}{loq}{\quadroname}
\newlistof{listofquadros}{loq}{\listofquadrosname}
\newlistentry{quadro}{loq}{0}
% configurações para atender às regras da ABNT
\counterwithout{quadro}{chapter}
\renewcommand{\cftquadroname}{\quadroname\space}
\renewcommand*{\cftquadroaftersnum}{\hfill--\hfill}
% --- % ---
% PACOTES % PACOTES
...@@ -97,6 +91,7 @@ ...@@ -97,6 +91,7 @@
\usepackage{tikz} \usepackage{tikz}
\usepackage{pdflscape} % para ambiente landscape \usepackage{pdflscape} % para ambiente landscape
\usepackage{pgfgantt} % cronograma estilo gráfico de gantt \usepackage{pgfgantt} % cronograma estilo gráfico de gantt
\usepackage{multicol}
\usetikzlibrary{backgrounds} \usetikzlibrary{backgrounds}
% --- % ---
...@@ -142,7 +137,7 @@ ...@@ -142,7 +137,7 @@
% --- % ---
% Informações de dados para CAPA e FOLHA DE ROSTO % Informações de dados para CAPA e FOLHA DE ROSTO
% --- % ---
\titulo{Extensões e Aplicações Modelo de Regressão \titulo{Extensões e Aplicações do Modelo de Regressão
Conway-Maxwell-Poisson para Modelagem de Dados de Contagem} Conway-Maxwell-Poisson para Modelagem de Dados de Contagem}
\vspace{2cm} \vspace{2cm}
\autor{Eduardo Elias Ribeiro Junior} \autor{Eduardo Elias Ribeiro Junior}
...@@ -227,7 +222,7 @@ ...@@ -227,7 +222,7 @@
<<setup, include=FALSE, cache=FALSE>>= <<setup, include=FALSE, cache=FALSE>>=
source("_setup.R") source("_setup.R")
library(tccPackage) library(cmpreg)
@ @
...@@ -314,29 +309,29 @@ library(tccPackage) ...@@ -314,29 +309,29 @@ library(tccPackage)
representam o número de ocorrências de um evento em um domínio representam o número de ocorrências de um evento em um domínio
discreto ou contínuo. Para análise estatística dessas variáveis, o discreto ou contínuo. Para análise estatística dessas variáveis, o
modelo de Poisson é amplamente utilizado. Porém, não são raras as modelo de Poisson é amplamente utilizado. Porém, não são raras as
situações de sub ou superdispersão, que inviabilizam o emprego deste situações de sub ou superdispersão, que inviabilizam o emprego desse
modelo. Uma alternativa paramétrica é o modelo COM-Poisson que, com a modelo. Uma alternativa paramétrica é o modelo COM-Poisson que, com a
adição de um parâmetro, contempla diferentes níveis de dispersão. adição de um parâmetro, contempla diferentes níveis de dispersão.
Outras características bastantes frequentes em dados de contagem são Outras características frequentes em dados de contagem são excesso de
frequência excessiva de valores zeros e estrutura de correlação entre contagens nulas e estrutura de correlação entre observações, muitas
observações, muitas vezes induzida pelo processo de casualização ou vezes induzida pelo processo de casualização ou amostragem. Nesses
amostragem. Nesses casos os modelos adotados devem ser casos os modelos adotados devem ser adaptados. Neste trabalho são
adaptados. Neste trabalho são exploradas as características da exploradas as características da distribuição COM-Poisson e
distribuição COM-Poisson e apresentados os modelos de regressão apresentados os modelos de regressão COM-Poisson de efeitos fixos, com
COM-Poisson de efeitos fixos, com modelagem para excesso de zeros e modelagem para excesso de zeros e incluindo efeitos aleatórios. O
incluindo efeitos aleatórios. O emprego dos modelos COM-Poisson e suas emprego dos modelos COM-Poisson e suas extensões é ilustrado com
extensões é ilustrado com aplicações onde seus resultados são aplicações e seus resultados são comparados com as abordagens Poisson,
comparados com as abordagens Poisson, Quasi-Poisson e Binomial Quasi-Poisson e Binomial Negativa (para casos de superdispersão) via
Negativa (para casos de superdispersão) via níveis descritivos de níveis descritivos de testes de razão de verossimilhanças, critério de
testes de razão de verossimilhanças, critério de informação de Akaike informação de Akaike e predições pontuais e intervalares. O ajuste dos
e predições pontuais e intervalares. O ajuste dos modelos é feito via modelos é feito via maximização da verossimilhança. Os resultados
maximização da verossimilhança. Os resultados mostram que o modelo mostram que o modelo Poisson é de fato restritivo, com ajustes
Poisson é de fato restritivo, com ajustes inadequados na maioria das inadequados na maioria das aplicações. O modelo COM-Poisson, por sua
aplicações. O modelo COM-Poisson, por sua vez, mostrou-se bastante vez, mostrou-se bastante flexível apresentando resultados similares
flexível com resultados similares aos obtidos via abordagem aos obtidos via abordagem semi-paramétrica Quasi-Poisson. As extensões
semi-paramétrica Quasi-Poisson. As extensões propostas para o modelo propostas para o modelo COM-Poisson apresentaram resultados
COM-Poisson apresentaram resultados satisfatórios, sendo equivalentes satisfatórios, sendo equivalentes às abordagens já consolidadas na
as abordagens já consolidadas na literatura. literatura.
\textbf{Palavras-chave}: \textbf{Palavras-chave}:
COM-Poisson; dados de contagem; subdispersão; superdispersão; excesso COM-Poisson; dados de contagem; subdispersão; superdispersão; excesso
...@@ -359,6 +354,14 @@ library(tccPackage) ...@@ -359,6 +354,14 @@ library(tccPackage)
\cleardoublepage \cleardoublepage
% --- % ---
% ---
% inserir lista de quadros
% ---
\pdfbookmark[0]{\listofquadrosname}{loq}
\listofquadros*
\cleardoublepage
% ---
% --- % ---
% inserir lista de abreviaturas e siglas % inserir lista de abreviaturas e siglas
% --- % ---
......
No preview for this file type
...@@ -6,20 +6,20 @@ Em diversas áreas do conhecimento é comum o interesse em i) compreender ...@@ -6,20 +6,20 @@ Em diversas áreas do conhecimento é comum o interesse em i) compreender
o relacionamento entre variáveis de interesse e características de uma o relacionamento entre variáveis de interesse e características de uma
amostra e ii) realizar predições por meio de modelos estatísticos amostra e ii) realizar predições por meio de modelos estatísticos
ajustados por dados de uma amostra. A teoria de modelos de regressão ajustados por dados de uma amostra. A teoria de modelos de regressão
sustentam muitas das pesquisas na área de Estatística aplicada. sustenta muitas das pesquisas na área de Estatística aplicada.
Os modelos de regressão, na sua forma univariada e usual, consistem no Os modelos de regressão, na sua forma univariada e usual, consistem no
estabelecimento de uma equação matemática que relaciona a média de uma estabelecimento de uma equação matemática que relaciona a média de uma
variável aleatória de interesse (variável resposta) com as demais variável aleatória de interesse (variável resposta) com as demais
variáveis observadas (covariáveis). Nesta metodologia considera-se uma variáveis observadas (covariáveis). Nessa metodologia considera-se uma
distribuição de probabilidades para a variável resposta condicionada as distribuição de probabilidades para a variável resposta condicionada às
covariáveis cuja média está associada a uma preditor que acomoda os covariáveis cuja média está associada a um preditor que acomoda os
efeitos das covariáveis. efeitos dessas covariáveis.
Pode-se destacar o modelo linear normal como o de uso predominante Pode-se destacar o modelo linear normal como o de uso predominante
dentre os disponíveis para análises estatísticas aplicadas. Esse modelo dentre os disponíveis para análises estatísticas aplicadas. Esse modelo
estabelece que a variável resposta condicional as covariáveis tem estabelece que a variável resposta, condicional às covariáveis, tem
distribuição Normal de média descrita por um preditor linear das distribuição Normal, de média descrita por um preditor linear das
covariáveis. Todavia, não são raras as situações em que a variável covariáveis. Todavia, não são raras as situações em que a variável
resposta é uma contagem, assumindo valores inteiros não resposta é uma contagem, assumindo valores inteiros não
negativos. Variáveis aleatórias de contagem, de forma geral, representam negativos. Variáveis aleatórias de contagem, de forma geral, representam
...@@ -28,7 +28,7 @@ ser contínuo, como um intervalo de tempo ou espaço, ou discreto, como ...@@ -28,7 +28,7 @@ ser contínuo, como um intervalo de tempo ou espaço, ou discreto, como
indivíduos ou grupos. indivíduos ou grupos.
A análise de dados de contagem pelo modelo linear normal produz A análise de dados de contagem pelo modelo linear normal produz
estimativas que contêm erros padrões inconsistentes e podem produzir estimativas que contêm erros padrões inconsistentes e pode produzir
predições negativas para o número de eventos \cite{King1989}. Uma predições negativas para o número de eventos \cite{King1989}. Uma
alternativa adotada durante muitos anos, e ainda aplicada, é encontrar alternativa adotada durante muitos anos, e ainda aplicada, é encontrar
alguma forma de transformação da variável resposta a fim de atender aos alguma forma de transformação da variável resposta a fim de atender aos
...@@ -40,57 +40,59 @@ a relação média e variância, característica de dados de contagem e iv) o ...@@ -40,57 +40,59 @@ a relação média e variância, característica de dados de contagem e iv) o
uso da transformação logarítmica é problemática quando há contagens uso da transformação logarítmica é problemática quando há contagens
nulas. nulas.
Diante do problema diferentes abordagens foram propostas, contudo Diante dos problemas relatados na aplicação de modelos normais para
destaca-se o trabalho apresentado por \citeonline{Nelder1972} que análise de dados de contagem, diferentes abordagens foram
introduz a teoria dos modelos lineares generalizados (MLG's). Esta nova propostas. Destaca-se o trabalho apresentado por \citeonline{Nelder1972}
classe de modelos flexibilizou a distribuição condicional permitindo que que introduz a teoria dos modelos lineares generalizados (MLG's). Essa
outras distribuições pertencentes à família exponencial fossem nova classe de modelos flexibilizou a distribuição condicional
consideradas para a distribuição da variável resposta. Tal família permitindo que outras distribuições pertencentes à família exponencial
contempla as distribuições Poisson, Binomial, Gama entre outras bem fossem consideradas para a distribuição da variável resposta. Tal
conhecidas na literatura, além da própria distribuição Normal. família contempla as distribuições Poisson, Binomial, Gama entre outras
bem conhecidas na literatura, além da própria distribuição Normal.
Com os MLG's a modelagem de dados passou a ser mais fiel a natureza da
Com os MLG's a modelagem de dados passou a ser mais fiel à natureza da
variável resposta, principalmente no que diz respeito ao seu variável resposta, principalmente no que diz respeito ao seu
suporte. Nesse contexto, a análise de variáveis aleatórias de contagem, suporte. Nesse contexto, a análise de variáveis aleatórias de contagem,
que têm suporte nos conjunto dos números naturais, foi enriquecida que têm suporte nos conjunto dos números naturais, foi enriquecida
expressivamente. expressivamente.
Para análise estatística dessas variáveis, o modelo probabilístico de Para análise estatística dessas variáveis, o modelo probabilístico de
Poisson, já consolidado na literatura é amplamente utilizado. Este Poisson, já consolidado na literatura, é amplamente utilizado. Esse
modelo possui apenas um parâmetro, denotado por $\lambda$, que modelo possui apenas um parâmetro, denotado por $\lambda$, que
representa a média e também a variância, o que implica em uma relação representa a média e também a variância, o que implica em uma relação
identidade ($\lambda = E(Y) = V(Y)$). Essa propriedade, chamada de identidade ($\lambda = E(Y) = V(Y)$). Essa propriedade, chamada de
equidispersão, é uma particularidade do modelo Poisson que pode não ser equidispersão, é uma particularidade do modelo Poisson que pode não ser
adequada a diversas situações. Quando aplicado sob negligência desta adequada a diversas situações. Quando aplicado sob negligência dessa
suposição, o modelo Poisson apresenta erros padrões inconsistentes para suposição, o modelo Poisson apresenta erros padrões inconsistentes para
as estimativas dos parâmetros e por consequência, para toda função as estimativas dos parâmetros e, por consequência, para toda função
desses parâmetros \cite{Winkelmann1995, Winkelmann1994}. desses parâmetros \cite{Winkelmann1995, Winkelmann1994}.
O caso de superdispersão, quando a variância é maior que a média, é o O caso de superdispersão, quando a variância é maior que a média, é o
mais comum e existe uma variedade de métodos para análise de dados mais comum e existe uma variedade de métodos para análise de dados
assim. A superdispersão pode ocorrer pela ausência de covariáveis superdispersos. A superdispersão pode ocorrer pela ausência de
importantes, excesso de zeros, diferentes amplitudes de domínio covariáveis importantes, excesso de zeros, diferentes amplitudes de
(\textit{offset}) não consideradas, heterogeneidade de unidades domínio (\textit{offset}) não consideradas, heterogeneidade de unidades
amostrais, entre outros \cite{RibeiroJr2012}. Para tais casos, uma amostrais, entre outros \cite{RibeiroJr2012}. Para tais casos, uma
abordagem é a adoção de modelos com efeitos aleatórios que capturam a abordagem é a adoção de modelos com efeitos aleatórios, que capturam a
variabilidade extra com a adoção de um ou mais termos de efeito variabilidade extra, com a adoção de um ou mais termos de efeito
aleatório. Um caso particular do modelo Poisson de efeitos aleatórios, aleatório. Um caso particular do modelo Poisson de efeitos aleatórios,
muito adotado no campo aplicado da Estatística, ocorre quando muito adotado no campo aplicado da Estatística, ocorre quando a
considera-se a distribuição Gama para os efeitos aleatórios, nessa distribuição Gama é assumida para os efeitos aleatórios. Nessa situação
situação há expressão fechada para a função de probabilidade há expressão fechada para a função de probabilidade marginal, que assume
marginal, que assume a forma Binomial Negativa. a forma Binomial Negativa.
Outra manifestação de fuga da suposição de equidispersão é a Outra manifestação de fuga da suposição de equidispersão é a
subdispersão, situação menos comum na literatura. Os processos que subdispersão, situação menos comum na prática e menos relatada na
reduzem a variabilidade das contagens, abaixo do estabelecido pela literatura. Os processos que reduzem a variabilidade das contagens,
Poisson, não são tão conhecidos quanto os que produzem variabilidade abaixo do estabelecido pela Poisson, não são tão conhecidos quanto os
extra. Pela mesma razão, são poucas as abordagens descritas na que produzem variabilidade extra. Pela mesma razão, são poucas as
literatura capazes de tratar subdispersão, uma vez que efeitos abordagens descritas na literatura capazes de tratar subdispersão, uma
aleatórios só capturam a variabilidade extra. Cita-se os modelos vez que efeitos aleatórios só capturam a variabilidade extra. Cita-se os
de quasi-verossimilhança como a abordagem mais utilizada. Todavia não é modelos de quasi-verossimilhança como a abordagem mais
possível descrever uma distribuição de probabilidades para a variável utilizada. Todavia não é possível descrever uma distribuição de
resposta nessa abordagem, pois a modelagem é baseada apenas nos dois probabilidades para a variável resposta nessa abordagem, pois a
primeiros momentos da distribuição condicional \cite{Paula2013}. modelagem é baseada apenas nos dois primeiros momentos da distribuição
condicional \cite{Paula2013}.
<<processo-pontual, fig.cap="Ilustração de diferentes tipos de processos pontuais. Da direita para esquerda têm-se processos sob padrões aleatório, aglomerado e uniforme.", fig.height=3, fig.width=7>>= <<processo-pontual, fig.cap="Ilustração de diferentes tipos de processos pontuais. Da direita para esquerda têm-se processos sob padrões aleatório, aglomerado e uniforme.", fig.height=3, fig.width=7>>=
...@@ -132,21 +134,21 @@ xyplot(y ~ x | caso, data = da, ...@@ -132,21 +134,21 @@ xyplot(y ~ x | caso, data = da,
@ @
A figura \ref{fig:processo-pontual} ilustra, em duas dimensões, a A \autoref{fig:processo-pontual} ilustra, em duas dimensões, a
ocorrência de equi, super e subdispersão respectivamente. Nesta figura ocorrência de equi, super e subdispersão respectivamente. Nessa figura
cada ponto representa a ocorrência de um evento e cada parcela, cada ponto representa a ocorrência de um evento e cada parcela,
delimitada pelas linhas pontilhadas, representa a unidade (ou domínio) delimitada pelas linhas pontilhadas, representa a unidade (ou domínio)
na qual tem-se o número de eventos (como variável aleatória). O painel na qual conta-se o número de eventos (como variável aleatória). O painel
da esquerda representa a situação de dados de contagem equidispersos, da esquerda representa a situação de dados de contagem equidispersos.
nesse cenário as ocorrências da variável aleatória se dispõem Nesse cenário as ocorrências dos eventos se dispõem aleatoriamente. No
aleatoriamente. No painel central o padrão já se altera, tem-se a painel central o padrão já se altera, tem-se a representação do caso de
representação do caso de superdispersão. Nesse cenário formam-se superdispersão. Nesse cenário formam-se aglomerados que deixam parcelas
aglomerados que deixam parcelas com contagens muito elevadas e parcelas com contagens muito elevadas e parcelas com contagens baixas. Uma
com contagens baixas. Uma possível causa deste padrão se dá pelo possível causa desse padrão se dá pelo processo de contágio
processo de contágio (e.g. contagem de casos de uma doença contagiosa, (e.g. contagem de casos de uma doença contagiosa, contagem de frutos
contagem de frutos apodrecidos). No terceiro e último painel ilustra-se apodrecidos). No terceiro e último painel ilustra-se o caso de
o caso de subdispersão, em que as ocorrências se dispõem uniformemente subdispersão, em que as ocorrências se dispõem uniformemente no
no espaço. Agora as contagens de ocorrências nas parcelas variam bem espaço. Agora as contagens de ocorrências nas parcelas variam bem
pouco. Ao contrário do caso superdisperso uma causa provável seria o pouco. Ao contrário do caso superdisperso uma causa provável seria o
oposto de contágio, a repulsa, ou seja, uma ocorrência causa a repulsa oposto de contágio, a repulsa, ou seja, uma ocorrência causa a repulsa
de outras ocorrências em seu redor (e.g. contagem de árvores, contagem de outras ocorrências em seu redor (e.g. contagem de árvores, contagem
...@@ -154,7 +156,7 @@ de animais territoriais ou que disputam por território). ...@@ -154,7 +156,7 @@ de animais territoriais ou que disputam por território).
Uma alterativa paramétrica que contempla os casos de equi, super e Uma alterativa paramétrica que contempla os casos de equi, super e
subdispersão é a adoção de uma distribuição mais flexível para a subdispersão é a adoção de uma distribuição mais flexível para a
variável resposta condicional as covariáveis. \citeonline{Conway1962}, variável resposta condicional às covariáveis. \citeonline{Conway1962},
antes da formalização dos MLG's, propuseram uma distribuição denominada antes da formalização dos MLG's, propuseram uma distribuição denominada
COM-Poisson (nome em em homenagem aos seus autores Richard W. Conway, COM-Poisson (nome em em homenagem aos seus autores Richard W. Conway,
William L. Maxwell, \textbf{Co}nway-\textbf{M}axwell-Poisson) que William L. Maxwell, \textbf{Co}nway-\textbf{M}axwell-Poisson) que
...@@ -165,10 +167,10 @@ contemplando os casos de sub e superdispersão \cite{Shmueli2005}. ...@@ -165,10 +167,10 @@ contemplando os casos de sub e superdispersão \cite{Shmueli2005}.
Uma característica bastante relevante é que a COM-Poisson possui como Uma característica bastante relevante é que a COM-Poisson possui como
casos particulares as distribuições Poisson, Geométrica e casos particulares as distribuições Poisson, Geométrica e
Binomial. Portanto, empregando a COM-Poisson como distribuição Binomial. Portanto, empregando a COM-Poisson como distribuição
condicional de um modelo de regressão, a imposição de equidispersão não condicional em um modelo de regressão, a imposição de equidispersão não
precisa ser satisfeita. Tal flexibilidade, considerando o amplo uso do precisa ser satisfeita. Tal flexibilidade, considerando o amplo uso do
modelo Poisson, significa que a COM-Poisson pode ser aplicada nessas modelo Poisson, significa que a COM-Poisson pode ser aplicada nessas
situações e será especialmente importante naquelas onde há fuga da situações e será especialmente importante naquelas em que há fuga da
equidispersão. equidispersão.
Assim como no modelo COM-Poisson vários aspectos do COM-Poisson podem Assim como no modelo COM-Poisson vários aspectos do COM-Poisson podem
...@@ -177,42 +179,43 @@ experimento sugere uma estrutura de covariância entre observações ...@@ -177,42 +179,43 @@ experimento sugere uma estrutura de covariância entre observações
induzidas por um processo hierárquico de casualização ou amostragem. São induzidas por um processo hierárquico de casualização ou amostragem. São
casos assim os experimentos em parcelas subdivididas e experimentos com casos assim os experimentos em parcelas subdivididas e experimentos com
medidas repetidas ou longitudinais. Tais estruturas estabelecem modelos medidas repetidas ou longitudinais. Tais estruturas estabelecem modelos
com efeitos não observáveis que agem em grupos experimentais e isso pode com efeitos não observáveis e isso pode ser incorporado no modelo de
ser incorporado no modelo de regressão COM-Poisson com a inclusão de regressão COM-Poisson com a inclusão de efeitos aleatórios a nível de
efeitos aleatórios. Da mesma forma, excesso de zeros pode ser grupos experimentais. Da mesma forma, excesso de zeros pode ser
introduzido a essa distribuição da mesma maneira que ocorre para o introduzido a essa distribuição como ocorre para o modelo Poisson,
modelo Poisson, através de truncamento (modelos Hurdle) ou inflação através de truncamento (modelos Hurdle) ou inflação (modelos de mistura)
(modelos de mistura) \cite{Sellers2016}. Estas extensões do modelo \cite{Sellers2016}. Estas extensões do modelo COM-Poisson ainda não são
COM-Poisson ainda não são bem consolidadas na literatura e são escassas bem consolidadas na literatura e são escassas suas aplicações. Uma
suas aplicações. Uma constatação do fato é que não há implementações constatação do fato é que não há implementações destas extensões nos
destas extensões nos principais softwares estatísticos. principais softwares estatísticos.
Na literatura brasileira, aplicações do modelo COM-Poisson são Na literatura brasileira, aplicações do modelo COM-Poisson são
escassas. Foram encontradas apenas aplicações na área de Análise de raras. Foram encontradas apenas aplicações na área de Análise de
Sobrevivência, mais especificamente em modelos com fração de cura Sobrevivência, mais especificamente em modelos com fração de cura
\cite{Ribeiro2012, Borges2012}. Portanto, o presente trabalho visa \cite{Ribeiro2012, Borges2012}. Portanto, o presente trabalho visa
colaborar com a literatura estatística brasileira i) apresentando e colaborar com a literatura estatística brasileira i) apresentando e
explorando o modelo de regressão COM-Poisson para dados de contagem, ii) explorando o modelo de regressão COM-Poisson para dados de contagem; ii)
estendendo as aplicações desse modelo para situações específicas como estendendo as aplicações desse modelo para situações específicas como
inclusão de efeitos aleatórios e modelagem de excesso de zeros, iii) inclusão de efeitos aleatórios e modelagem de excesso de zeros; iii)
discutindo os aspectos inferenciais por meio de análise de dados reais e discutindo os aspectos inferenciais por meio de análise de dados reais;
iv) disponibilizando os recursos computacionais, em formato de pacote R, e iv) disponibilizando os recursos computacionais, em formato de pacote
para ajuste dos modelos apresentados. Nas aplicações optou-se também R, para ajuste dos modelos apresentados. Nas aplicações optou-se também
pela análise via modelos já disponíveis para as situações estudadas. pela análise via modelos Poisson, Quasi-Poisson e Binomial Negativa para
comparação de resultados.
O trabalho é organizado em cinco capítulos. Esse primeiro capítulo visa
O trabalho é organizado em cinco capítulos. O primeiro capítulo visa
enfatizar as características das variáveis aleatórias de contagem e suas enfatizar as características das variáveis aleatórias de contagem e suas
lacunas que podem ser complementadas na análise estatística dessas lacunas que podem ser complementadas na análise estatística dessas
variáveis. O capítulo \ref{cap:modelos-para-dados-de-contagem} é variáveis. O \autoref{cap:modelos-para-dados-de-contagem} é dedicado a
dedicado a revisão bibliográfica dos modelos estatísticos empregados a revisão bibliográfica dos modelos estatísticos empregados à análise de
análise de dados de contagem. Nesse capítulo os modelos Poisson, dados de contagem. Nesse capítulo os modelos Poisson, Binomial Negativo,
Binomial Negativo, COM-Poisson, as abordagens para excesso de zeros e a COM-Poisson, as abordagens para excesso de zeros e a estrutura dos
estrutura dos modelos de efeitos aleatórios são apresentados. No modelos de efeitos aleatórios são apresentados. No
capítulo \ref{cap:material-e-metodos} são apresentos os conjuntos de \autoref{cap:material-e-metodos} são apresentados os conjuntos de dados
dados a serem analisados e os métodos para ajuste e comparação dos a serem analisados e os métodos para ajuste e comparação dos modelos. O
modelos. O capítulo \ref{cap:resultados-e-discussao} traz os os \autoref{cap:resultados-e-discussao} traz os principais resultados da
principais resultados da aplicação e comparação dos modelos estatísticos aplicação e comparação dos modelos estatísticos, com ênfase nas
com ênfase nas discussões sob aspectos inferenciais discussões sob aspectos inferenciais empíricos. Finalmente, no
empíricos. Finalmente no capítulo \ref{cap:consideracoes-finais} são \autoref{cap:consideracoes-finais} são apresentadas as considerações
apresentadas as considerações finais obtidas desse trabalho e listados finais obtidas desse trabalho e listadas algumas possíveis linhas de
algumas possíveis linhas de pesquisa para estudos futuros. pesquisa para estudos futuros.
This diff is collapsed.
This diff is collapsed.
This diff is collapsed.
...@@ -3,46 +3,48 @@ ...@@ -3,46 +3,48 @@
% ------------------------------------------------------------------------ % ------------------------------------------------------------------------
Os objetivos nesse trabalho foram a exploração, extensão e aplicação da Os objetivos nesse trabalho foram a exploração, extensão e aplicação da
distribuição COM-Poisson na análise de dados de contagem cujo foram distribuição COM-Poisson na análise de dados de contagem, cujo foram
atendidos com a apresentação de seis aplicações dos modelos COM-Poisson atendidos com a apresentação de seis aplicações dos modelos COM-Poisson
à conjuntos de dados reais que exibem equidispersão, subdispersão, a conjuntos de dados reais que exibem equidispersão, subdispersão,
superdispersão, contagens altas, excesso de zeros e efeito aleatório, superdispersão, contagens altas, excesso de zeros e efeito aleatório,
mostrando a flexibilidade do modelo COM-Poisson. mostrando a flexibilidade do modelo COM-Poisson.
Das análises realizadas destaca-se a característica restritiva do modelo Das análises realizadas destaca-se a característica restritiva do modelo
Poisson, que na maioria dos casos não se ajustou adequadamente devido a Poisson, que na maioria dos casos não se ajustou adequadamente devido à
suposição de equidispersão. Para os modelos de regressão de efeitos suposição de equidispersão. Para os modelos de regressão de efeitos
fixos, os resultados obtidos com as abordagens via modelo COM-Poisson, fixos, os resultados obtidos com as abordagens via modelo COM-Poisson,
Quasi-Poisson e Binomial Negativo (para os casos de superdispersão) Quasi-Poisson e Binomial Negativo (para os casos de superdispersão)
foram bastante similares quanto a significância dos efeitos e predição foram bastante similares quanto à significância dos efeitos e predição
com bandas de confiança. Resultados satisfatórios também foram obtidos com bandas de confiança. Resultados satisfatórios também foram obtidos
para nos modelos COM-Poisson para modelagem de excesso de zeros e nos modelos COM-Poisson com modelagem de excesso de zeros e
inclusão de efeitos aleatórios. Nessas extensões, há dificuldade inclusão de efeitos aleatórios. Nessas extensões, há dificuldade
computacional de ajuste dos modelos, principalmente devido ao cálculo computacional para ajuste dos modelos, principalmente devido ao cálculo
das constantes de normalização, que mesmo nos modelos de efeitos fixos das constantes de normalização, que mesmo nos modelos de efeitos fixos
ainda são problemáticas. se mostram como dificuldades a serem superadas.
Em todas as aplicações observou-se a não ortonalidade empírica na matriz Em todas as aplicações observou-se a não ortonalidade empírica, via
hessiana, o que se mostra como característica da distribuição. Outra matriz hessiana, o que se mostra como característica da
característica observada na análise de dados é a simetria nos perfis de distribuição. Outra característica observada na análise de dados é a
verossimilhança para o parâmetro $\phi$, indicando que aproximações simetria nos perfis de verossimilhança para o parâmetro $\phi$,
quadráticas da verossimilhança podem ter bons desempenhos. indicando que aproximações quadráticas da verossimilhança podem ter bons
desempenhos.
De forma geral, sugere-se a aplicação dos modelos COM-Poisson na análise De forma geral, sugere-se a aplicação dos modelos COM-Poisson na análise
de dados de contagem, pois devido a sua flexibilidade, seus resultados de dados de contagem, pois devido à sua flexibilidade, seus resultados
se equivalem a abordagem semi-paramétrica via quasi-verossimilhança, se equivalem a abordagem semi-paramétrica via quasi-verossimilhança,
porém com todos os benefícios da inferência totalmente paramétrica. porém com todos os benefícios da inferência totalmente paramétrica.
Dado o escopo do trabalho foram vários os tópicos levantados para Dado o escopo do trabalho foram vários os tópicos levantados para
pesquisas futuras. Estudo de reparametrizações que tornem os parâmetros pesquisas futuras. Estudo de reparametrizações que tornem os parâmetros
$\lambda$ e $\nu$ ortogonais no modelo COM-Poisson podem ser de grande $\lambda$ e $\nu$ ortogonais no modelo COM-Poisson podem ser de grande
valia, pois tornaram as inferências entre eles independentes, além de valia, pois tornarão as inferências entre eles independentes, além de
possivelmente permitir a fatoração da verossimilhança com estimação possivelmente permitir a fatoração da verossimilhança com estimação
concentrada. Para acelerar o algoritmo de estimação aproximações da concentrada. Para acelerar o algoritmo de estimação aproximações da
constante normalização podem resultar em ajustes satisfatórios. Estudos constante normalização podem resultar em ajustes satisfatórios. Estudos
de simulação para verificar a robustez do modelo à má especificação da de simulação para verificar a robustez do modelo à má especificação da
distribuição da variável resposta. Implementação da modelagem de excesso distribuição da variável resposta. Implementação da modelagem de excesso
de zeros via mistura de distribuições. Inclusão de efeitos aleatórios de zeros via mistura de distribuições. Expansão do modelo misto
dependentes no modelo misto COM-Poisson. São algumas das muitas COM-Poisson com diferentes fontes de efeito aleatório e efeitos
possibilidades para pesquisa envolvendo dados de contagem subdispersos aleatórios dependentes. São algumas das muitas possibilidades para
ou superdispersos modelados com a distribuição COM-Poisson. pesquisa envolvendo dados de contagem subdispersos ou superdispersos
modelados com a distribuição COM-Poisson.
...@@ -5,7 +5,7 @@ ...@@ -5,7 +5,7 @@
Todos os resultados apresentados são realizados com o \textit{software} Todos os resultados apresentados são realizados com o \textit{software}
R, cujo códigos para ajuste dos modelos COM-Poisson de efeito fixo, R, cujo códigos para ajuste dos modelos COM-Poisson de efeito fixo,
aleatório e com componente de barreira foram disponibilizados em formato aleatório e com componente de barreira foram disponibilizados em formato
de pacote no endereço \url{github.com/jreduardo/tccPackage}. Nesse de pacote no endereço \url{github.com/jreduardo/cmpreg}. Nesse
apêndice são apresentados os códigos, que utilizam as funções do pacote, apêndice são apresentados os códigos, que utilizam as funções do pacote,
para produzir os resultados da seção \ref{sec:analise-cottonBolls2} para produzir os resultados da seção \ref{sec:analise-cottonBolls2}
(modelos de regressão de efeitos fixos). Todavia, os códigos que (modelos de regressão de efeitos fixos). Todavia, os códigos que
...@@ -15,15 +15,15 @@ visualizados no complemento online ...@@ -15,15 +15,15 @@ visualizados no complemento online
<<code-cottonBolls2, echo=TRUE, eval=FALSE>>= <<code-cottonBolls2, echo=TRUE, eval=FALSE>>=
##---------------------------------------------------------------------- ##----------------------------------------------------------------------
## Instalando o pacote tccPackage, elaborado no trabalho ## Instalando o pacote cmpreg, elaborado no trabalho
library(devtools) library(devtools)
install_git("git@github.com:JrEduardo/tccPackage.git") install_git("git@github.com:JrEduardo/cmpreg.git")
##---------------------------------------------------------------------- ##----------------------------------------------------------------------
## Análise de dados apresentados na seção ... (v.a. número de nós) ## Análise de dados apresentados na seção ... (v.a. número de nós)
## Carrega o pacote no workspace ## Carrega o pacote no workspace
library(tccPackage) library(cmpreg)
## Dados ## Dados
data(cottonBolls2) data(cottonBolls2)
......
0% Loading or .
You are about to add 0 people to the discussion. Proceed with caution.
Please register or to comment