Utilize este identificador para referenciar este registo:
http://hdl.handle.net/10071/34740
Autoria: | Dias, André Gonçalo Carrapiço |
Orientação: | Costa, Anabela |
Data: | 3-Dez-2024 |
Título próprio: | Predicting the success of dating profiles: A data driven approach |
Referência bibliográfica: | Dias, A. G. C. (2024). Predicting the success of dating profiles: A data driven approach [Dissertação de mestrado, Iscte - Instituto Universitário de Lisboa]. Repositório Iscte. http://hdl.handle.net/10071/34740 |
Palavras-chave: | Dating Measuring attractiveness Matchmaking Mating preferences Dating profile Predictive analytics |
Resumo: | This thesis aims to apply and reconcile the domains of data science with the area of human attraction and dating, using complex Machine Learning techniques in an attempt to demystify some of the underlying complexities and intricacies associated with the topic. With the goal of analyzing the factors that influence success in in-person and potentially online dating, this dissertation examines data from an experiment conducted in the 2000s, in which a diverse sample of individuals with various characteristics engaged in a series of sequential dating. Utilizing data science and predictive analysis methods, this study examines demographic data, personal preferences, and behavioral characteristics of the participants, aiming to identify patterns that contribute to greater compatibility between couples.
Armed with the CRISP-DM methodology and its wide range of tools at its disposal, such as exploratory data analysis (EDA) and supervised classification techniques, this dissertation seeks to predict the likelihood of a “match” between individuals.
This study explores the practical potential that predictive models may offer within this area of study. Notably, the analysis employs advanced machine learning techniques, including XGBoost, Random Forests, and logistic regression, along with a compilation of these models via an ensemble method in order to enhance predictive accuracy and provide a comprehensive understanding of the variables that drive successful matches. Esta tese pretende aplicar e conciliar os domínios da ciência de dados com a área da atração humana e dos encontros, fazendo uso de complexas técnicas de Machine Learning de modo a tentar desmistificar um pouco as complexidades e detalhes subjacentes, associados a este tópico. Com o objetivo de analisar os fatores que influenciam o sucesso nos encontros presenciais e potencialmente online, esta dissertação analisa dados de uma experiência ocorrida na década de 2000, onde uma amostra generosa, de indivíduos com diversas características, realizaram uma sucessão de encontros em cadeia. Utilizando métodos de ciência de dados e análise preditiva, este estudo debruça-se e examina dados demográficos, preferências pessoais e características comportamentais dos participantes, visando identificar padrões que contribuem para uma maior compatibilidade entre casais. Equipado com a metodologia CRISP-DM e a sua larga gama de ferramentas à sua disposição, tais como a análise exploratória dos dados (EDA) ou técnicas de aprendizagem supervisionada de classificação, esta dissertação tem como principal objetivo prever a probabilidade de “match” entre indivíduos. Este estudo explora o potencial prático que os modelos preditivos têm para oferecer nesta área de estudo. Notavelmente, a análise emprega técnicas avançadas de machine learning, incluindo modelos como o XGBoost, Florestas Aleatórias e Regressão Logística, juntamente com a combinação destes modelos por meio de um método de ensemble, com o objetivo de aumentar a precisão preditiva e proporcionar uma compreensão abrangente das variáveis que impulsionam o sucesso dos encontros. |
Designação do Departamento: | Departamento de Métodos Quantitativos para Gestão e Economia Departamento de Ciências e Tecnologias da Informação |
Designação do grau: | Mestrado em Ciência de Dados |
Arbitragem científica: | yes |
Acesso: | Acesso Restrito |
Aparece nas coleções: | T&D-DM - Dissertações de mestrado |
Ficheiros deste registo:
Ficheiro | Descrição | Tamanho | Formato | |
---|---|---|---|---|
master_andre_carrapico_dias.pdf Restricted Access | 1,72 MB | Adobe PDF | Ver/Abrir Request a copy |
Todos os registos no repositório estão protegidos por leis de copyright, com todos os direitos reservados.