Utilize este identificador para referenciar este registo:
http://hdl.handle.net/10071/21876
Autoria: | Pires, Pedro Miguel Geraldes |
Orientação: | Moro, Sérgio Pereira, Renato |
Data: | 25-Nov-2020 |
Título próprio: | A data-driven approach to predict the value and key features of collectible cars |
Referência bibliográfica: | PIRES, Pedro Miguel Geraldes - A data-driven approach to predict the value and key features of collectible cars [Em linha]. Lisboa: Iscte, 2020. Dissertação de mestrado. [Consult. Dia Mês Ano] Disponível em www:<http://hdl.handle.net/10071/21876>. |
Palavras-chave: | Data mining Collectible cars market Alternative investments Emotional assets Coronavirus Mineração de dados Mercado de carros colecionáveis Investimentos alternativos Ativos emocionais |
Resumo: | In our study, a Data Mining approach is proposed to predict the selling price of collectible
cars at auction and determine which vehicle's characteristics influence this value. RM Sotheby's, a prestigious auction house, allowed us over 30,000 vehicles in order to build
our data set. The use of different models allowed us to analyze a large data set with 18
features. In order to determine which model is most suitable for our study, 11 Data Mining
models were compared using 4 metrics (MAE, NMAE, RAE and RMSPE), the 11 models
were tested on our data set using a rolling window scheme. "Xgboost", a decision tree
model, presented the best results (RMSPE = 12.69%). In addition, a method of extracting
knowledge from sensitivity analysis was applied, which allowed us to determine the key
features in the sales price (Brand.continent, Car.age, km.categorized and
Model.identifier).
In addition, a comparison with traditional investments was made and it was used
to analyze the impact of coronavirus. Our results demonstrated a superior performance
when compared to iron, FTSE MIB and FTSE 100. In the case of coronavirus, there was
a significant drop in volume and sales since the beginning of coronavirus, although the
average price per car has increased, which does not allow us to guarantee that there was
an impact in this market. A more detailed analysis to 25 different models was conducted.
From these, 9 saw an appreciation in price while the remaining devalued. In total, those
25 models had an overall devaluation of 5%. No nosso estudo é proposto uma abordagem de Data Mining para prever o preço de venda de carros colecionáveis em leilão e determinar quais as características do veículo que influenciam esse valor. RM Sotheby's, uma prestigiada casa de leilões, permitiu-nos recolher mais de 30.000 veículos para construir o nosso conjunto de dados. O uso de diferentes modelos permitiu que analisássemos um grande conjunto de dados com 19 variáveis. De forma a determinar qual o modelo mais adequado ao nosso estudo, 11 modelos de Data Mining foram comparados através de 4 métricas (MAE, NMAE, RAE e RMSPE), os modelos foram testados através de um esquema de janela rolante. "Xgboost", um modelo de árvore de decisão, apresentou os melhores resultados (RMSPE= 12,69%). Além disso, foi aplicado um método de extração de conhecimento de análise de sensibilidade que nos permitiu determinar os principais influenciadores no preço de venda (Brand.continent, Car.age, km.categorized e Model.identifier). Para alem disso uma comparação com investimentos mais tradicionais foi realizada assim como uma análise do impacto do coronavírus. Os nossos resultados demonstraram um desempenho superior em comparaçao ao ferro, FTSE MIB e FTSE 100. No caso do coronavírus verificou-se uma queda significativa no volume e nas vendas, no período correspondente ao coronavírus, embora o preço médio por carro tenha aumentado. Uma análise mais detalhada foi também realizada em 25 modelos distintos, destes, 9 viram uma valorização no preço enquanto os restantes sofreram uma desvalorização. No total, os 25 modelos tiveram uma desvalorização de aproximadamente 5%. |
Designação do grau: | Mestrado em Informática e Gestão |
Arbitragem científica: | yes |
Acesso: | Acesso Aberto |
Aparece nas coleções: | T&D-DM - Dissertações de mestrado |
Ficheiros deste registo:
Ficheiro | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Master_Pedro_Geraldes_Pires.pdf | 19,32 MB | Adobe PDF | Ver/Abrir |
Todos os registos no repositório estão protegidos por leis de copyright, com todos os direitos reservados.