Please use this identifier to cite or link to this item: http://hdl.handle.net/10071/30191
Author(s): Polido, Susana Isabel de Carvalho
Advisor: Almeida, Ana Maria Carvalho de
Breternitz Jr., Maurício
Date: 21-Nov-2023
Title: Applying federated learning to a Covid-19 anomaly detection pipeline
Reference: Polido, S. I. de C. (2023). Applying federated learning to a Covid-19 anomaly detection pipeline [Dissertação de mestrado, Iscte - Instituto Universitário de Lisboa]. Repositório Iscte. http://hdl.handle.net/10071/10191
Keywords: Anomaly detection
Federated learning
Health model
Machine learning
Deteção de anomalias
Aprendizagem federada
Modelo na saúde
Aprendizagem automática
Abstract: The COVID-19 pandemic of 2020 spread around the world fast, overwhelming healthcare systems and causing millions of deaths all over the globe. Researchers and scientists rushed to find tools to help detect and contain the spread of the disease, including automatic ones powered by machine learning models. Amongst the efforts, several studies focused on exploring differences between biometric signals in people with the disease collected before and after the infection, in search of patterns that can help detect it as soon as possible. In particular, heart rate related signals collected via devices such as smartwatches. These studies have resulted in some detection tools, but they always require users to have data from before the infection occurred in order to be used and often contain personalization based on this healthy data. But what if a new user has not yet collected healthy data? Can a model trained with the data of other individuals successfully detect the illness on a novel one? This work explores that situation by taking an individual based anomaly detection and transporting into a Federated Learning environment in order to see its behavior on the data from individuals that trained the model and novel individuals, including data collected via hospital devices from individuals admitted to the intensive care unit which is unlikely to contain healthy data. Although the resulting models, on average, did not detect more true anomalies than the personalized ones, their performance is similar when applied to the training individuals and novel ones.
A pandemia de COVID-19 de 2020 espalhou-se rapidamente, sobrecarregando os sistemas de saúde e causando milhões de mortes em todo o mundo. Investigadores e cientistas concentraram esforços em encontrar soluções para ajudar a detetar e conter a propagação da doença, incluindo ferramentas alimentadas por modelos de aprendizagem automática. Entre os estudos efetuados, vários exploram diferenças entre sinais biométricos de pessoas que contraíram COVID-19, recolhidos antes e depois da infeção, em busca de padrões que possam ajudar a detetar a doença o mais rápido possível. Em particular, em sinais relacionados com a frequência cardíaca recolhidos através de dispositivos como smartwatches. Esses estudos resultaram em algumas ferramentas de deteção, mas precisam que os utilizadores tenham dados anteriores a contraírem a doença para serem usados, contendo elementos de personalização com base nos dados saudáveis para funcionarem. Mas e se um novo utilizador não possuir dados saudáveis? Poderá um modelo treinado com dados de uns indivíduos detetar a doença noutros, com sucesso? Este trabalho explora essa situação transportando uma ferramenta de deteção de anomalia personalizada para um ambiente de Aprendizagem Federada, a fim de ver seu comportamento em dados de indivíduos que participaram no treino do modelo e de novos indivíduos, incluindo dados recolhidos por dispositivos hospitalares de indivíduos internados numa unidade de cuidados intensivos, que dificilmente contém dados saudáveis. Embora os modelos resultantes em média, não detetem mais anomalias verdadeiras do que os modelos personalizados, seu desempenho ´e semelhante quando aplicado a dados de indivíduos de treino e novos indivíduos.
Department: Departamento de Ciências e Tecnologias da Informação
Degree: Mestrado em Engenharia Informática
Peerreviewed: yes
Access type: Open Access
Appears in Collections:T&D-DM - Dissertações de mestrado

Files in This Item:
File Description SizeFormat 
master_susana_carvalho_polido.pdf5,31 MBAdobe PDFView/Open


FacebookTwitterDeliciousLinkedInDiggGoogle BookmarksMySpaceOrkut
Formato BibTex mendeley Endnote Logotipo do DeGóis Logotipo do Orcid 

This item is licensed under a Creative Commons License Creative Commons