Skip navigation
Logo
User training | Reference and search service

Library catalog

Retrievo
EDS
b-on
More
resources
Content aggregators
Please use this identifier to cite or link to this item:

acessibilidade

http://hdl.handle.net/10071/8634
acessibilidade
Title: Análise discriminante sobre variáveis qualitativas
Authors: Marques, Anabela de Fátima Domingues Cardoso
Orientador: Ferreira, Ana Sousa
Cardoso, Margarida G. M. S.
Keywords: Análise discriminante discreta
Combinação de modelos
Modelo de independência condicional
Modelo gráfico decomponível
Modelo de emparelhamento hierárquico
Discrete discriminant analysis
Combined models for classification
First-order independence model
Dependence trees model
Hierarchical coupling model
Issue Date: 2014
Citation: MARQUES, Anabela de Fátima Domingues Cardoso - Análise discriminante sobre variáveis qualitativas [Em linha]. Lisboa: ISCTE-IUL, 2014. Tese de doutoramento. [Consult. Dia Mês Ano] Disponível em www:<http://hdl.handle.net/10071/8634>.
Abstract: Este estudo insere-se no campo da Análise Discriminante Discreta (ADD) propondo uma combinação de modelos, uma vez que se tem verificado que, em geral, a sua aplicação conduz a métodos mais estáveis e robustos. O trabalho que se apresenta é particularmente focado no caso em que se dispõe de classes a priori mal separadas e/ou amostras de pequena ou moderada dimensão, situações em que a tarefa de ADD é mais difícil. Procura-se com esta contribuição, ultrapassar a dificuldade de estimação de um grande número de parâmetros em ADD e encontrar classificadores que melhor se ajustem aos dados em estudo, uma vez que os erros de classificação obtidos por vários modelos não ocorrem sobre os mesmos objetos (Sousa Ferreira, 2000; Brito, 2002 e Brito et al., 2006). Com este objetivo, propusemos uma combinação de dois modelos com especificidades diferentes, o Modelo de Independência Condicional (Goldstein and Dillon, 1978) e o Modelo Gráfico Decomponível (Celeux and Nakache, 1994; Pearl, 1988). Tendo-nos deparado, em diversas aplicações do modelo proposto, com um número demasiado elevado de variáveis explicativas face à dimensão da amostra considerada, direcionámos o trabalho na procura de métodos de seleção de variáveis de forma a reduzir a complexidade dos dados a analisar. Houve, ainda, necessidade de avaliar o impacto de alguns fatores no desempenho dos classificadores propostos, nomeadamente: relação entre as variáveis explicativas intra-classes; grau de separabilidade entre as classes; classes balanceadas ou não balanceadas; número de estados omissos e dimensão da amostra.
This study falls within the scope of Discrete Discriminant Analysis (DDA) and proposes a combination of models since, overall, its application has been found to lead to more stable and robust methods. The work focuses particularly on the case where there are poorly separated a priori classes and/or small or moderate-sized samples which tend to present more difficulties for the DDA task. This contribution sets out to overcome the difficulty of estimating a large amount of DDA parameters and to find classifiers which are better suited to the data under study, given that the classification errors obtained by diverse models do not occur on the same objects (Sousa Ferreira, 2000; Brito, 2002 and Brito et al., 2006). To this end, we have proposed a combination of two models with different specificities, the First-order Independence Model (Goldstein and Dillon, 1978) and the Dependence Tree Model (Celeux and Nakache, 1994; Pearl, 1988). In several applications of the proposed model, we were confronted with an excessive number of explanatory variables in relation to the sample size under study. Therefore, our work has been geared towards seeking variable selection methods, so as to reduce the complexity of the data to be analysed. It was also necessary to evaluate the impact of certain factors on the performance of the proposed combined model, namely the relationship among intra-class explanatory variables; the degree of separation between classes; balanced or unbalanced classes; number of missing states and sample size.
Description: Compilação de artigos especialmente elaborada para obtenção do grau de Doutor em Métodos Quantitativos / Classificação: C100; C400
Peer reviewed: Sim
URI: http://hdl.handle.net/10071/8634
Thesis identifier: 101482809
ISBN: 978-989-732-551-9
Appears in Collections:T&D-TD - Teses de doutoramento

Files in This Item:
acessibilidade
File Description SizeFormat 
TESE_DOUT_AnabelaMarques.pdf21.05 MBAdobe PDFView/Open


FacebookTwitterDeliciousLinkedInDiggGoogle BookmarksMySpace
Formato BibTex MendeleyEndnote Currículo DeGóis 

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.