Utilize este identificador para referenciar este registo: http://hdl.handle.net/10071/34503
Registo completo
Campo DCValorIdioma
dc.contributor.advisorAlmeida, Ana Maria Carvalho de-
dc.contributor.advisorNunes, Luís Miguel Martins-
dc.contributor.authorConceição, Dílan Vera Cruz Viana da-
dc.date.accessioned2025-05-20T19:22:18Z-
dc.date.issued2024-12-11-
dc.date.submitted2024-10-
dc.identifier.citationConceição, D. V. C. V. da (2024). Imbalanced learning on bank account frauds [Dissertação de mestrado, Iscte - Instituto Universitário de Lisboa]. Repositório Iscte. http://hdl.handle.net/10071/34503por
dc.identifier.urihttp://hdl.handle.net/10071/34503-
dc.description.abstractImbalanced learning, a common challenge in machine learning, occurs when one class, usually the one of primary interest, is significantly underrepresented compared to others. This can impact the performance of the machine learning algorithm because it will become biased toward the majority class, resulting in poor classification of the minority class. This thesis aims to explore the existing imbalanced learning techniques and understand how effective they are in dealing with class imbalance. It explores data-level methods such as resampling and feature selection techniques, and algorithm-level methods such as cost-sensitivity techniques and threshold moving techniques, examining the impact of these techniques when used separately as well as combined. A total of hundred and sixteen models were built using the XGBoost algorithm and evaluated using evaluation metrics such as prediction, recall, F1-score and roc. The dataset used is a bank account fraud dataset that contains a total of one million instances, being only one percent of them of the positive class. This thesis provides valuable insight into the performance of imbalanced learning techniques, offering valuable recommendations for practitioners working with imbalanced datasets in fields like fraud detection.por
dc.description.abstractA aprendizagem não equilibrada ocorre quando uma classe, geralmente a de maior interesse, é de significativamente menor quantidade em relação às outras. Isto pode impactar o desempenho do algoritmo de Machine Learning, pois este tende a ser enviesado para a classe maioritária, resultando numa má classificação da classe minoritária. Esta tese visa explorar as técnicas existentes de aprendizagem não equilibrada e compreender a sua eficácia na resolução do desequilíbrio entre classes. Nesta tese também foi feita um estudo de métodos de aprendizagem não equilibrada ao nível de dados, como técnicas de amostragem e seleção de características, e métodos ao nível dos algoritmos, como cost-sensitive learning e ajuste de thresholds, examinando o impacto destas técnicas quando utilizadas separadamente e em conjunto. Foram construídos e um total de cento e dezasseis modelos utilizando o XGBoost e os mesmos foram avaliados usando métricas de avaliação como precisão, recall, F1-score e roc. O conjunto de dados utilizado é de fraudes na abertura de contas bancárias e contém um milhão de linhas, sendo apenas um porcento destas da classe minoritária. Esta tese fornece uma visão valiosa sobre o desempenho das técnicas de aprendizagem não equilibrada, oferecendo recomendações úteis para profissionais que trabalham com conjuntos de dados não equilibrados em áreas como a deteção de fraudes.por
dc.language.isoengpor
dc.relationinfo:eu-repo/grantAgreement/FCT/Concurso de avaliação no âmbito do Programa Plurianual de Financiamento de Unidades de I&D (2017%2F2018) - Financiamento Base/UIDB%2F04466%2F2020/PTpor
dc.relationinfo:eu-repo/grantAgreement/FCT/Concurso de avaliação no âmbito do Programa Plurianual de Financiamento de Unidades de I&D (2017%2F2018) - Financiamento Programático/UIDP%2F04466%2F2020/PTpor
dc.rightsrestrictedAccesspor
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/por
dc.subjectImbalanced learningpor
dc.subjectImbalance ratiopor
dc.subjectData samplingpor
dc.subjectFeature selectionpor
dc.subjectThreshold movingpor
dc.subjectCost-sensitivepor
dc.subjectAprendizagem não equilibradapor
dc.subjectRácio de desequilíbriopor
dc.subjectSeleção de característicaspor
dc.subjectAjuste de thresholdspor
dc.subjectCost-sensitive learningpor
dc.titleImbalanced learning on bank account fraudspor
dc.typemasterThesispor
dc.peerreviewedyespor
dc.identifier.tid203892984por
dc.subject.fosDomínio/Área Científica::Engenharia e Tecnologia::Outras Engenharias e Tecnologiaspor
dc.subject.fosDomínio/Área Científica::Ciências Sociais::Economia e Gestãopor
thesis.degree.nameMestrado em Sistemas Integrados de Apoio à Decisãopor
dc.date.embargo2026-12-11-
thesis.degree.departmentDepartamento de Ciências e Tecnologias da Informaçãopor
Aparece nas coleções:T&D-DM - Dissertações de mestrado

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
master_dilan_viana_conceicao.pdf
  Restricted Access
1,93 MBAdobe PDFVer/Abrir Request a copy


FacebookTwitterDeliciousLinkedInDiggGoogle BookmarksMySpaceOrkut
Formato BibTex mendeley Endnote Logotipo do DeGóis Logotipo do Orcid 

Este registo está protegido por Licença Creative Commons Creative Commons