Conteúdo Programático
Módulos utilizados: Base e Decision Trees
Objetivo: Este curso cobre os princípios e práticas dos métodos de regressão e classificação baseados em árvores disponíveis no IBM SPSS Decision Trees. Será feita uma introdução geral às características do módulo IBM SPSS Decision Trees e serão abordados os métodos baseados em árvore de decisão: CHAID, CHAID Exaustivo, C&RT e QUEST. Esses métodos são usados para executar classificação, segmentação e modelagem de previsão num vasto leque de negócios e áreas de pesquisa. As técnicas são discutidas e comparadas, através da execução de análises e interpretação dos resultados.
Duração: 1 dia/6 horas
Pré-requisito: Conhecer o IBM SPSS Statistics for Windows ou ter concluído o Introdução ao IBM SPSS Statistics. Conhecimento em estatística básica é muito útil.
Observação: Apostilas e arquivos estão em inglês.
I – Introdução ao IBM SPSS Decision Trees
- Introdução
- Análise de Árvore de Decisão
- Uso geral das Análises de Árvore de Decisão
- Aplicações das Análises de Árvore de Decisão
- Por que quatro métodos?
- Comparar os métodos de árvore de decisão
- Sugestões
- Criando nossa primeira árvore de decisão
- Os itens padrão do output da árvore
- Nível de medida
II – Análise CHAID
- Introdução à Análise CHAID
- O que é CHAID ?
- Princípios e Considerações
- CHAID Exaustivo
- Ajuste de Bonferroni
- Tipos de Variáveis
- Um exemplo: A aceitação a um novo cartão de crédito
- Examinar a saída
- Tabela de risco
- Tabelas de classificação
- As regras do modelo para a classificação dos casos
- CHAID e Regressão Logística
III – Características Adicionais e Extensões do CHAID
- Introdução
- Validação
- Criar uma árvore CHAID validada
- Examinar a saída
- Validação cruzada (Cross-Validation)
- Acrescentar benefícios ao modelo
- Custos de classificação errada
- CHAID Exaustivo
IV – Árvore e Classificação C&RT
- O método C&RT
- Executar uma análise de Árvore de Classificação
- Visualizar um diagrama de árvore
- Examinar os ganhos do C&RT para os nós das tabelas
- Incluir custos de classificação errada na árvore C&RT
- Incluir distribuições a priori nas árvores C&RT
V – Árvore de Regressão C&RT
- Por que usar Árvores de Regressão?
- Método de Árvore de Regressão
- Executar uma análise de Árvore de Regressão
- Examinar as Árvores de Regressão
- Examinar os resultados C&RT
VI – Análise QUEST
- Método QUEST
- Executar as análises QUEST
- Examinar uma árvore QUEST
- Adicionar custos de classificação errada e distribuições a priori em árvores QUEST
- Comparação - métodos QUEST, C&RT e CHAID
VII - Recomendações, Dicas e Atalhos
- Melhor seleção das variáveis
- Tamanho mínimo de nós pais e filhos
- Mais que duas categorias alvo
- Preditoras nominais com muitas categorias
- Uso de sementes aleatórias para replicação de resultados
- Seleção automática de casos a partir de um nó
- Editar o diagrama da árvore
- Importância das variáveis no modelo (método C&RT)
- Opções de salvamento
|