Please use this identifier to cite or link to this item: http://hdl.handle.net/10071/33027
Author(s): Miranda, Mariana Ferreiro
Advisor: Caçador, Susana Almeida
Cruz, Rui Francisco Pereira Moital Loureiro da
Date: 18-Nov-2024
Title: Previsão do sucesso de um filme
Reference: Miranda, M. F. (2024). Previsão do sucesso de um filme [Dissertação de mestrado, Iscte - Instituto Universitário de Lisboa]. Repositório Iscte. http://hdl.handle.net/10071/33027
Keywords: Filme -- Films
Cinema -- Movie theater
Abstract: A indústria cinematográfica é muito volátil e está sujeita a diversas alterações económicas externas, logo é crucial para as empresas exibidoras de cinemas estarem preparadas para os riscos que podem enfrentar. Assim, é essencial para estas empresas perceberem quais os produtos, neste caso, filmes, em que devem investir de forma a obterem o maior lucro possível. Para a realização desta investigação foi utilizada a metodologia CRISP-DM e começou por se obter e preparar a base de dados que contém 2266 filmes, com 19 variáveis independentes, que incluem características de exibição, de identificação e temporais. Esta base de dados é relativa a Portugal e compreende dados entre os anos de 2018, 2019, 2022 e 2023. A variável dependente deste estudo é a variável relacionada com o número de admissões, ou seja, o número de espectadores. Sendo uma variável ainda pouco utilizada neste tipo de estudos. De seguida, na fase de modelação utilizaram-se os algoritmos CART, RF, KNN, SVM e NN para construir os modelos preditivos, utilizaram-se, ainda, métodos "ensemble", o "boosting" e o "bagging", e métodos de balanceamento de dados, o "oversampling" e o "undersampling". O melhor modelo obtido foi construído através do algoritmo SVM com bagging e obteve-se uma precisão de 86%, uma sensibilidade de 80% e um F1-score de 82%, ou seja, este modelo permite prever com alguma eficácia o sucesso de um filme. Para além disso, conclui-se que algumas das características que mais afetam o sucesso de um filme são o distribuidor, a duração, os idiomas, entre outros.
Film industry is very volatile and must deal with various external economic changes, so it’s crucial to cinema exhibition companies to be ready for the risks they might face. Therefore, it’s essential for these companies to understand which products, this is, movies, they should invest to maximize their profit. It was used the CRISP-DM methodology in this investigation, and it starts with the collection and preparation of the data set which contains 2266 movies, with 19 independent variables, that include exhibition, identification and temporal characteristics. This data set is about Portugal and contains data from 2018, 2019, 2022 and 2023. The target variable of this study is related to admissions, this is the number of people that watched the movie. This is a variable not used as a target in most studies done in this investigation area. Then, in modeling, to build the models, several machine learning algorithms were used such as CART, RF, KNN, SVM and NN, and ensemble methods (boosting and bagging) and balanced methods (oversampling and undersampling) were also used. The best model was built by SVM algorithm with bagging method, and it achieved 86% of precision, 80% of recall and 82% of F1-score, which means this model can predict with efficacy the success of a movie. Besides that, some characteristics that affect the most the success of a movie are the distributor, duration, languages, among others.
Department: Departamento de Métodos Quantitativos para Gestão e Economia
Degree: Mestrado em Métodos Analíticos para Gestão
Peerreviewed: yes
Access type: Restricted Access
Appears in Collections:T&D-DM - Dissertações de mestrado

Files in This Item:
File Description SizeFormat 
master_mariana_ferreiro_miranda.pdf
  Restricted Access
1,2 MBAdobe PDFView/Open Request a copy


FacebookTwitterDeliciousLinkedInDiggGoogle BookmarksMySpaceOrkut
Formato BibTex mendeley Endnote Logotipo do DeGóis Logotipo do Orcid 

This item is licensed under a Creative Commons License Creative Commons