Utilize este identificador para referenciar este registo: http://hdl.handle.net/10071/34740
Autoria: Dias, André Gonçalo Carrapiço
Orientação: Costa, Anabela
Data: 3-Dez-2024
Título próprio: Predicting the success of dating profiles: A data driven approach
Referência bibliográfica: Dias, A. G. C. (2024). Predicting the success of dating profiles: A data driven approach [Dissertação de mestrado, Iscte - Instituto Universitário de Lisboa]. Repositório Iscte. http://hdl.handle.net/10071/34740
Palavras-chave: Dating
Measuring attractiveness
Matchmaking
Mating preferences
Dating profile
Predictive analytics
Resumo: This thesis aims to apply and reconcile the domains of data science with the area of human attraction and dating, using complex Machine Learning techniques in an attempt to demystify some of the underlying complexities and intricacies associated with the topic. With the goal of analyzing the factors that influence success in in-person and potentially online dating, this dissertation examines data from an experiment conducted in the 2000s, in which a diverse sample of individuals with various characteristics engaged in a series of sequential dating. Utilizing data science and predictive analysis methods, this study examines demographic data, personal preferences, and behavioral characteristics of the participants, aiming to identify patterns that contribute to greater compatibility between couples. Armed with the CRISP-DM methodology and its wide range of tools at its disposal, such as exploratory data analysis (EDA) and supervised classification techniques, this dissertation seeks to predict the likelihood of a “match” between individuals. This study explores the practical potential that predictive models may offer within this area of study. Notably, the analysis employs advanced machine learning techniques, including XGBoost, Random Forests, and logistic regression, along with a compilation of these models via an ensemble method in order to enhance predictive accuracy and provide a comprehensive understanding of the variables that drive successful matches.
Esta tese pretende aplicar e conciliar os domínios da ciência de dados com a área da atração humana e dos encontros, fazendo uso de complexas técnicas de Machine Learning de modo a tentar desmistificar um pouco as complexidades e detalhes subjacentes, associados a este tópico. Com o objetivo de analisar os fatores que influenciam o sucesso nos encontros presenciais e potencialmente online, esta dissertação analisa dados de uma experiência ocorrida na década de 2000, onde uma amostra generosa, de indivíduos com diversas características, realizaram uma sucessão de encontros em cadeia. Utilizando métodos de ciência de dados e análise preditiva, este estudo debruça-se e examina dados demográficos, preferências pessoais e características comportamentais dos participantes, visando identificar padrões que contribuem para uma maior compatibilidade entre casais. Equipado com a metodologia CRISP-DM e a sua larga gama de ferramentas à sua disposição, tais como a análise exploratória dos dados (EDA) ou técnicas de aprendizagem supervisionada de classificação, esta dissertação tem como principal objetivo prever a probabilidade de “match” entre indivíduos. Este estudo explora o potencial prático que os modelos preditivos têm para oferecer nesta área de estudo. Notavelmente, a análise emprega técnicas avançadas de machine learning, incluindo modelos como o XGBoost, Florestas Aleatórias e Regressão Logística, juntamente com a combinação destes modelos por meio de um método de ensemble, com o objetivo de aumentar a precisão preditiva e proporcionar uma compreensão abrangente das variáveis que impulsionam o sucesso dos encontros.
Designação do Departamento: Departamento de Métodos Quantitativos para Gestão e Economia
Departamento de Ciências e Tecnologias da Informação
Designação do grau: Mestrado em Ciência de Dados
Arbitragem científica: yes
Acesso: Acesso Restrito
Aparece nas coleções:T&D-DM - Dissertações de mestrado

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
master_andre_carrapico_dias.pdf
  Restricted Access
1,72 MBAdobe PDFVer/Abrir Request a copy


FacebookTwitterDeliciousLinkedInDiggGoogle BookmarksMySpaceOrkut
Formato BibTex mendeley Endnote Logotipo do DeGóis Logotipo do Orcid 

Todos os registos no repositório estão protegidos por leis de copyright, com todos os direitos reservados.