Utilize este identificador para referenciar este registo:
http://hdl.handle.net/10071/20195
Autoria: | Gomes, Pedro André Fonseca Garez |
Orientação: | Almeida, Ana Maria Carvalho de Loureiro, Dália Susana Santos Cruz |
Data: | 12-Dez-2019 |
Título próprio: | Flow time series clustering for demand pattern recognition in drinking water distribution systems: New insights about the most adequate methods |
Referência bibliográfica: | Gomes, P. A. F. G. (2019). Flow time series clustering for demand pattern recognition in drinking water distribution systems: New insights about the most adequate methods [Dissertação de mestrado, Iscte - Instituto Universitário de Lisboa]. Repositório Iscte. http://hdl.handle.net/10071/20195 |
Palavras-chave: | Unsupervised learning Time series clustering Flow time series Demand pattern recognition Water distribution systems Aprendizagem não supervisionada Clustering de series temporais Séries temporais de caudal Reconhecimento de padrões de consumo Sistemas de distribuição de água Algoritmo -- Algorithm Clusters -- Clusters Séries temporais Utilização da água Portugal |
Resumo: | This study presents a proposal of clustering methodologies for demand pattern recognition
using network flow data collected from a large set of drinking water distribution networks in
Portugal. Most of the existing studies about clustering in flow time series rely on hierarchical
or k-Means clustering algorithms with inelastic measures distances. This study explores
alternative clustering algorithms, distance measures, comparison time windows, internal
index metrics and clustering prototypes. The performance of the alternative clustering
methodology was assessed in terms of multiple internal index metrics and the characterization
of the cluster centroids.
The methods with the best performance were Partition Algorithm with DTW distance, PAM
prototype with 15 minutes time window and the Partition Algorithm with GAK distance,
PAM prototype and 15 minutes time window because they allow a clear partition of flow
time series in three clusters. The first method identifies a night consumption pattern, a
typical weekend pattern and a typical working day pattern, whereas the second one identifies
a pattern with small variability between night and daily consumption.
To improve knowledge extraction, in terms of typical and anomalous existing patterns,
additional clustering operations were performed with the flow data set that belongs to
the cluster with small variability between night and daily consumption. New clusters were
identified and characterized regarding weekday, geographical location, and dry months and
wet months, showing that patterns associated with garden irrigation are independent of the
period of the day and season of the year, which indicates an inefficient water use. Este estudo apresenta uma proposta de metodologias de clustering para reconhecimento de padrões de consumo usando um conjunto de dados de caudal coletados em redes de distribuição de água em Portugal. A maioria dos estudos existentes sobre clustering em séries temporais de caudal baseia-se em algoritmos de clustering hierárquicos ou de k-Means com medidas de distâncias inelásticas. Este estudo explora alternativas de algoritmos de clustering, medidas de distância, janelas temporais de comparação, medidas de índice interno e protótipos de clustering. O desempenho das metodologias de clustering foi avaliado em termos de medidas de índice interno e também através da caracterização dos centroides dos clusters. As metodologias com melhor desempenho foram o Algoritmo de Partição com distância DTW, protótipo PAM e janela de temporal de 15 minutos e o Algoritmo de Partição com distância GAK, protótipo PAM e janela de temporal de 15 minutos, pois permitiram a formação três clusters. O primeiro método identifica um padrão de consumo noturno, um padrão típico de fim-de-semana e um padrão típico de dia útil, enquanto o segundo método destaca-se por apresentar um padrão com pequena variabilidade entre o consumo noturno e diurno. Para melhorar a extração de conhecimento, operações adicionais de clustering foram realizadas ao conjunto de dados que pertence ao cluster com pequena variabilidade entre consumo noturno e diurno. Novos clusters foram identificados e caracterizados, mostrando que os padrões associados à irrigação são independentes do período do dia e da época do ano, o que indica um uso ineficiente da água. |
Designação do grau: | Mestrado em Engenharia de Telecomunicações e Informática |
Arbitragem científica: | yes |
Acesso: | Acesso Aberto |
Aparece nas coleções: | T&D-DM - Dissertações de mestrado |
Ficheiros deste registo:
Ficheiro | Descrição | Tamanho | Formato | |
---|---|---|---|---|
master_pedro_garez_gomes.pdf | 36,51 MB | Adobe PDF | Ver/Abrir |
Todos os registos no repositório estão protegidos por leis de copyright, com todos os direitos reservados.