Conteúdo Programático
Módulos utilizados: IBM SPSS Modeler
Objetivo: Este curso demonstra como desenvolver modelos para previsão de variáveis categóricas e contínuas, usando técnicas de redes neurais, árvores de decisão, regressão logística, modelos de support vector machines e redes bayesianas. Estão incluídos exemplos de uso dos nós Binary Classifier e Numeric Predictor, para seleção automática dos modelos. Também são discutidas técnicas de seleção de melhores informações para o modelo e detecção de dados extremos. Melhores opções para cada nó de modelagem são revisadas em detalhe e são feitas sugestões sobre quando e como usar cada modelo. Além disso, você aprenderá a combinar dois ou mais modelos para melhorar a predição.
Duração: 3 dias/18 horas
Pré-requisito: Conhecimentos gerais em informática. Experiência com o IBM SPSS Modeler, incluindo familiaridade com o ambiente IBM SPSS Modeler, criação de fluxos, leitura de arquivos de dados, avaliação da qualidade dos dados e manipulação dos dados ausentes (nós TYPE e DATA AUDIT). Conhecimentos básicos de manipulação de dados (nós DERIVE e SELECT) e criação de modelos. Ter participado previamente do curso “Introdução ao IBM SPSS Modeler” é altamente indicado. Um curso introdutório em estatística ou experiência equivalente seria altamente indicado para assimilação das técnicas de modelagem.
Observação: Apostilas e arquivos estão em inglês.
I – Preparação de dados para Modelagem
- Limpeza dos dados
- Balanceamento dos dados
- Transformações em dados numéricos
- Criação de faixas de valores
- Particionamento dos dados
- Detecção de Anomalias
- Seleção de preditores para os modelos
II – Redução de Dados
- Uso de Componentes Principais para modelagem preditiva e análise de cluster
- O que procurar quando executar componentes principais ou análise fatorial
- Princípios
- Análise Fatorial versus Análise de Componentes Principais
- Números de Componentes
- Rotações
- Escores dos componentes
- Tamanho da Amostra
- Métodos
- Recomendações Gerais
- Regressão com Componentes Principais
III – Árvore de Decisão / Indução de Regras
- Comparação dos modelos de Árvores de Decisão
- Usando o nó C5.0
- Analisando o Modelo
- Gerando e analisando um conjunto de Regras
- Compreendendo a regra e determinando a acurácia
- Compreendendo os fatores mais importantes na predição
- Mais tópicos na Modelagem C5.0
- Modelando variáveis categóricas com outros algoritmos de Árvores de Decisão
- Modelando variáveis categóricas com árvores CHAID
- Modelando variáveis categóricas com árvores C&RT
- Modelando variáveis categóricas com árvores QUEST
- Árvores interativas
- Prever variáveis numéricas
IV – Redes Neurais
- Introdução a Redes Neurais
- O nó Redes Neurais
- Paleta de Modelos
- Validando a Lista de Preditores
- Entendendo a Rede Neural
- Entendendo o raciocínio por trás das predições
- Usando o Nó Analysis
- Resumo do modelo
- Técnicas avançadas de Redes Neurais
- Métodos de treinamento
- Rede Neural MLP (Multi-layer Perceptron)
- Rede Neural RBF (Radial Basis Function)
- Opções avançadas
- Algoritmos disponíveis
- Qual o método, quando?
- Prevenção de Super estimação
- Valores ausentes nas Redes Neurais
- Explorando as diferentes opções de Redes Neurais
V – Support Vector Machines
- A estrutura dos modelos SVM
- Modelo SVM para prever Churn
- Explorando o modelo
- Um modelo com uma função de Kernel diferente
- Ajustando o modelo RBF
VI – Regressão Linear
-
Conceitos básicos de Regressão
- Um exemplo: detecção de erros ou fraudes em seguros
VII – Regressão Cox para Análise de Sobrevicência
- O
que é uma Análise de Sobrevivência
- Regressão de Cox
- Regressão de Cox para prever Churn
- Checando as suposições de riscos proporcionais
- Predições de um modelo de Cox
VIII – Análise de Séries Temporais
- O que é uma Série Temporal?
- Um arquivo de dados de Séries Temporais
- Componentes de Tendências, Sazonalidade e Ciclicos
- O que é um modelo de Séries Temporais?
- Intervenções
- Alisamento Exponencial
- ARIMA
- Requisitos nos dados
- Previsões automáticas numa linha de produção
- Prevendo o uso de banda larga em diversos mercados
- Aplicando modelos em várias séries
IX – Regressão Logística
- Introdução a regressão logística
- Uma análise logística multinomial: prevendo risco de crédito
- Interpretando coeficientes
X - Análise Discriminante
- Como trabalhar com Análise Discriminante?
- O Modelo Discriminante
- Como os casos são classificados
- As suposições da Análise Discriminante
- Dicas de análise
- Comparação da Análise Discriminante e da Regressão Logística
- Um exemplo de aplicação da Análise Discriminante
XI - Redes Bayesianas
- O básico das Redes Bayesianas
- Tipos de Redes Bayesianas no IBM SPSS Modeler
- Criando um modelo de Redes Bayes
- Modificando ajustes dos modelo de Redes Bayes
XII - Descobrir o melhor modelo para Resultados Binários
XIII - Descobrir o melhor modelo para Resultados Numéricos
XIV - Obtendo o Melhor dos Modelos
- Combinando os modelos com o Nó Ensemble
- Usando escores de propensão
- Nível de meta modelagem
- Modelagem de erro
XV – Apêndice A - Lista de Decisão
- Um modelo de Lista de Decisão
- Comparação de modelos de Indução de Regras
- Indução de Regras usando Lista de Decisão
- Entendendo as regras e determinando a acurácia
- Entendendo os fatores mais importantes na predição
- Opções avançadas de Lista de Decisão
- Lista de Decisão Interativa
|