Data Science
Unsupervised
Técnicas Multivariadas Exploratórias
Análise de Agrupamentos
profa. Adriana referente ao Capítulo 9 do Manual do prof. Fávero
Análise Fatorial por Componentes Principais
prof. Rafael referente ao Capítulo 10 do Manual do prof. Fávero
Análise de Correspondência
prof. Rafael referente ao Capítulo 11 do Manual do prof. Fávero
Simples
Múltipla
Discorrer
Supervised
Modelos Lineares Generalizados
Ou Generalized Linear Models (GLM) referente ao Capítulo 12~14 do Manual do prof. Fávero
Modelos de Regressão Linear
Simples
Distribuição Normal Função no R: lm()
Múltipla
Distribuição Normal, após a transformação
Modelos de Regressão Logística
Binária
Distribuição Bernoulli Função no R: glm(…, family=”binomial”)
Multinomial
Distribuição Binomial Função no R: multinom(…) # Pacote nnet
Modelos de Regressão para Dados de Contagem
Poisson
Distribuição Poisson Função no R: glm(…, family=”poisson”)
Binomial Negativo
Distribuição Poisson-Gamma Função no R: glm.nb(…) # Pacto MASS
Zero Inflated - Poisson (ZIP)
Distribuição Poisson com uma Bernoulli para a inflação de zeros Função no R: zeroinfl(…, dist=”poisson”) # Pacto pscl
Zero Inflated - Binomial Negativo (ZINB)
Distribuição Poisson-Gamma com uma Bernoulli para a inflação de zeros Função no R: zeroinfl(…, dist=”negbin”) # Pacto pscl
Modelos Lineares Multinível
Também chamados de:
- Generalized Linear Multilevel Models (GLMM)
- Generalized Linear Mixed Models (GLMM)
- GLLAMM (Latents), para usuários do Stata
- Modelos Hierárquivos (HLM)
- Nested Models
- RCM (Random Coefficientes Modeling)
referente ao Capítulo 15~16 do Manual do prof. Fávero
Ideia do
1
2
3
Outros
Graus de Liberdade
df = n - k
sendo:
- df: degreees of freedom
- n: número de observações
- k é o somátório dos parâmetros, usualmente alpha e beta, ou seja, 2!
Passo a passo:
- Stepwise
- Teste Shapiro Francia nos resíduos do modelo
- Se tem p value maior que 0,05, ou seja, resíduos ajustam na normal, passou!
- Se NÃO tem p value maior que 0,05, ou seja, resíduos ajustam na normal, box cox
- Já faz o cox box com stepwise nos resíduos.
Multicolinearidade
Variance Inflation Factor (VIF) Tolerância
Séries Temporais
https://towardsdatascience.com/online-time-series-forecasting-in-python-12bada43b8bd
https://cloud.mindsdb.com/editor