Please use this identifier to cite or link to this item:
http://hdl.handle.net/10071/36730Full metadata record
| DC Field | Value | Language |
|---|---|---|
| dc.contributor.advisor | Mendes, Diana Elisabeta Aldea | - |
| dc.contributor.advisor | Moro, Sérgio | - |
| dc.contributor.author | Moura, Caroline Dalcomuni de | - |
| dc.date.accessioned | 2026-03-26T13:12:56Z | - |
| dc.date.available | 2026-03-26T13:12:56Z | - |
| dc.date.issued | 2025-12-03 | - |
| dc.date.submitted | 2025-09 | - |
| dc.identifier.citation | Moura, C. D. de (2025). Personal credit risk assessment with machine learning : Balancing performance, fairness, and interpretability [Dissertação de mestrado, Iscte - Instituto Universitário de Lisboa]. Repositório Iscte. http://hdl.handle.net/10071/36730 | por |
| dc.identifier.uri | http://hdl.handle.net/10071/36730 | - |
| dc.description.abstract | This study investigates the application of machine learning (ML) techniques in personal credit assessment, with particular attention to their relevance for underbanked populations and their implications for the banking sector. Due to strict privacy and governance restrictions on access to real banking data, a synthetic dataset from the LendingClub platform was employed. While originating in a peer-to-peer lending context, the dataset was reinterpreted through the lens of commercial banking and mapped, as far as possible, against the creditworthiness assessment criteria defined by the Bank of Portugal. The research followed the Cross-Industry Standard Process for Data Mining (CRISP-DM), covering data understanding, preprocessing, feature selection, modeling, and evaluation. Multiple supervised learning algorithms were tested under both unbalanced and balanced class distributions, reflecting the prevalence of non-default cases in real credit markets. Ensemble methods, particularly LightGBM and AdaBoost, outperformed traditional models in recall, accuracy, and AUC-ROC, demonstrating strong discriminatory capacity in identifying defaults. Logistic Regression, used as a benchmark, retained value due to its interpretability and regulatory alignment. Beyond technical performance, the study emphasizes transparency and fairness in credit scoring. Feature importance analysis confirmed that ML models prioritize variables aligned with Portuguese credit assessment practices, reinforcing their institutional relevance. By combining methodological rigor with a reflection on inclusiveness, this research contributes to ongoing debates on responsible credit risk modeling. The findings suggest that ML can complement traditional approaches in Portugal, improving predictive accuracy while supporting more equitable access to credit. | por |
| dc.description.abstract | Este estudo investiga a aplicação de técnicas de aprendizagem supervisionada Machine Learning (ML) na avaliação de crédito pessoal, com especial atenção à sua relevância para populações sub-bancarizadas e às potenciais implicações para o setor bancário português. Devido a restrições de privacidade no acesso a dados bancários reais, recorreu-se a um conjunto de dados sintéticos da plataforma LendingClub. Embora tenha origem num contexto de peer-to-peer lending, o dataset foi reinterpretado sob a ótica da banca comercial e mapeado, tanto quanto possível, com os critérios de avaliação de solvabilidade definidos pelo sistema bancário. A investigação seguiu a metodologia CRISP-DM (Cross-Industry Standard Process for Data Mining), abrangendo compreensão dos dados, pré-processamento, análise de correlação e seleção de variáveis, modelação e avaliação. Foram testados diversos algoritmos de aprendizagem supervisionada em cenários de classes equilibradas e não-equilibradas, refletindo a predominância de casos de não-incumprimento nos mercados de crédito. Os métodos de ensemble, em particular o LightGBM e o AdaBoost, superaram os modelos tradicionais em termos de recall, accuracy e AUC-ROC, demonstrando forte capacidade discriminatória na identificação de incumprimentos. A Regressão Logística, usada como referência, manteve relevância devido à sua interpretabilidade e alinhamento regulatório. Para além da performance técnica, o estudo evidencia a importância da transparência e da equidade na avaliação de crédito. A análise de importância das variáveis confirmou que os modelos de ML priorizam critérios próximos dos do Banco de Portugal, reforçando a sua pertinência institucional. Combinando rigor metodológico e reflexão sobre inclusão financeira, a investigação mostra como o ML pode complementar práticas tradicionais em Portugal, aumentando a precisão preditiva e promovendo acesso mais justo ao crédito. | por |
| dc.language.iso | eng | por |
| dc.rights | openAccess | por |
| dc.subject | Análise de crédito -- Credit analysis | por |
| dc.subject | Machine learning -- Machine learning | por |
| dc.subject | Financial inclusion | por |
| dc.subject | Risco de crédito -- Credit risk | por |
| dc.subject | Underbanked populations | por |
| dc.subject | Portugal | por |
| dc.subject | Inclusão financeira | por |
| dc.subject | Populações sub-bancarizadas | por |
| dc.title | Personal credit risk assessment with machine learning : Balancing performance, fairness, and interpretability | por |
| dc.type | masterThesis | por |
| dc.peerreviewed | yes | por |
| dc.identifier.tid | 204092817 | por |
| dc.subject.fos | Domínio/Área Científica::Ciências Sociais::Economia e Gestão | por |
| dc.subject.fos | Domínio/Área Científica::Engenharia e Tecnologia::Outras Engenharias e Tecnologias | por |
| thesis.degree.name | Mestrado em Ciência de Dados | por |
| thesis.degree.department | Departamento de Métodos Quantitativos para Gestão e Economia | por |
| thesis.degree.department | Departamento de Ciências e Tecnologias da Informação | por |
| Appears in Collections: | T&D-DM - Dissertações de mestrado | |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| Master_caroline_dalcomuni_moura.pdf | 2,27 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.












