Please use this identifier to cite or link to this item: http://hdl.handle.net/10071/34765
Author(s): Morais, Inês Filipa Correia
Advisor: Ribeiro, Ricardo Daniel Santos Faro Marques
Batista, Fernando Manuel Marques
Date: 3-Dec-2024
Title: Da voz aos sentimentos: Transcrição automática com vista ao controlo de qualidade de chamadas telefónicas
Reference: Morais, I. F. C. (2024). Da voz aos sentimentos: Transcrição automática com vista ao controlo de qualidade de chamadas telefónicas [Dissertação de mestrado, Iscte - Instituto Universitário de Lisboa]. Repositório Iscte. http://hdl.handle.net/10071/34765
Keywords: Transcrição automática
Chamadas telefónicas
Contact center
Reconhecimento automático da fala
WhisperX
Análise de sentimento
Automatic transcription
Phone calls
Automatic speech recognition
Sentiment analysis
Abstract: Este estudo explora o uso de tecnologias de transcrição automática de fala e análise de sentimento no controlo de qualidade de chamadas de um contact center de uma seguradora. Foram comparadas duas ferramentas de transcrição – WhisperX e Microsoft Azure Speech-to-Text – com o objetivo de avaliar a viabilidade de soluções de código aberto para substituir alternativas comerciais dispendiosas. Os resultados mostram que, apesar de ambos os modelos gerarem transcrições compreensíveis, o WhisperX destaca-se pela fluidez e precisão em captar nuances linguísticas e variações regionais do português. No entanto, enfrenta desafios em contextos de áudio complexos, como múltiplos locutores e variações de intensidade. Além disso, foram propostas diversas aplicações práticas das transcrições para otimizar o atendimento ao cliente, incluindo a análise de cumprimento de guiões, métricas de diálogo e deteção de sentimentos. Para demonstrar o potencial destas aplicações, foi implementado o modelo FinBERT-PT-BR nas transcrições, que permitiu captar sentimentos predominantes nas interações e identificar momentos de insatisfação e incerteza. Os principais contributos deste trabalho incluem a análise de desempenho de ferramentas de transcrição aplicadas a interações em português europeu, bem como a proposta de aplicação de um modelo de análise de sentimento orientado para a melhoria da qualidade do atendimento ao cliente. Entre as limitações, destaca-se a necessidade de dados anotados para uma avaliação mais rigorosa. Futuras investigações poderão beneficiar de uma abordagem multimodal que combine transcrição e características acústicas para uma análise emocional robusta, especialmente num contexto de contact center.
This study explores the use of automatic speech transcription and sentiment analysis technologies in the quality control of call monitoring in an insurance contact center. Two transcription tools – WhisperX and Microsoft Azure Speech-to-Text – were compared to evaluate the feasibility of open-source solutions as alternatives to costly commercial options. The results show that, while both models generate comprehensible transcriptions, WhisperX stands out for its fluency and accuracy in capturing linguistic nuances and regional variations of Portuguese. However, it faces challenges in complex audio contexts, such as multiple speakers and varying intensity levels. Furthermore, several practical applications of transcriptions were proposed to optimize customer service, including script compliance analysis, dialogue metrics, and sentiment detection. To demonstrate the potential of these applications, the FinBERT-PT-BR model was implemented on the transcriptions, which enabled the capture of predominant sentiments in interactions and identification of moments of dissatisfaction and uncertainty. The main contributions of this work include a performance analysis of transcription tools applied to european portuguese interactions, as well as the proposal of a sentiment analysis model aimed at improving customer service quality. Among the limitations, the need for annotated data for more rigorous evaluation can be highlighted. Future research may benefit from a multimodal approach that combines transcription and acoustic features for a more robust emotional analysis, particularly in a contact center context.
Department: Departamento de Métodos Quantitativos para Gestão e Economia
Departamento de Ciências e Tecnologias da Informação
Degree: Mestrado em Ciência de Dados
Peerreviewed: yes
Access type: Embargoed Access
Appears in Collections:T&D-DM - Dissertações de mestrado

Files in This Item:
File Description SizeFormat 
master_ines_correia_morais.pdf
  Restricted Access
2,35 MBAdobe PDFView/Open Request a copy


FacebookTwitterDeliciousLinkedInDiggGoogle BookmarksMySpaceOrkut
Formato BibTex mendeley Endnote Logotipo do DeGóis Logotipo do Orcid 

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.