Utilize este identificador para referenciar este registo: http://hdl.handle.net/10071/34645
Autoria: Queni, Ednilson Fonseca
Orientação: Ferreira, João Carlos Amaro
Elvas, Luís Manuel Nobre de Brito
Data: 26-Mar-2025
Título próprio: MANCAPT: Identificação de autores e transcrição de manuscritos
Referência bibliográfica: Queni, E. F. (2025). MANCAPT: Identificação de autores e transcrição de manuscritos [Dissertação de mestrado, Iscte - Instituto Universitário de Lisboa]. Repositório Iscte. http://hdl.handle.net/10071/34645
Palavras-chave: Inteligência artificial -- Artificial intelligence
Aprendizagem máquina
Reconhecimento ótico de caracteres
Identificação de autor
Machine learning -- Machine learning
Optical character recognition
Author identification
Resumo: Este trabalho explora os desafios da digitalização de documentos manuscritos, com foco na variabilidade da caligrafia e nas limitações dos sistemas de Reconhecimento Ótico de Caracteres (OCR) genéricos. Este trabalho consiste na criação de um protótipo designado por MANCAPT, que apresenta uma solução baseada em tecnologias avançadas, incluindo o Microsoft AI Document Intelligence, utilizado para a criação de modelos personalizados de diferentes autorias e transcrição dos manuscritos, e a arquitetura neural InceptionV3, utilizada para a identificação dos autores dos manuscritos com elevada precisão. O MANCAPT integra técnicas de pré-processamento como a binarização, remoção de ruído e normalização da escala, complementadas por data augmentation para criar um conjunto de treino consistente. Foram utilizadas imagens manuscritas e impressas numa proporção equilibrada (70% impressas 30% manuscritas), permitindo ao modelo capturar tanto padrões claros como nuances estilísticas da escrita manual. Os resultados experimentais demonstraram que a integração do InceptionV3 e do Azure AI Document Intelligence no sistema aumentou a precisão da identificação de autores para 98% e reduziu a Taxa de Erro de Caracteres (CER) para 6%, em comparação com o modelo genérico do Azure AI Document Intelligence, que obteve um CER de 11,3% na transcrição de manuscritos. A abordagem personalizada do MANCAPT revelou-se crucial para lidar com as idiossincrasias da escrita, promovendo a eficiência em soluções de OCR.
This work explores the challenges of digitizing handwritten documents, focusing on handwriting variability and the limitations of generic Optical Character Recognition (OCR) systems. This study involves the creation of a prototype named MANCAPT, which provides a solution based on advanced technologies, including Microsoft AI Document Intelligence for the development of customized models for different authors and the transcription of manuscripts, as well as the neural architecture InceptionV3 for high-precision author identification. MANCAPT integrates preprocessing techniques such as binarization, noise removal, and scale normalization, complemented by data augmentation to create a robust and resilient training dataset. Handwritten and printed images were used in a balanced proportion (70% printed, 30% handwritten), allowing the model to capture both clear patterns and stylistic nuances of manual writing. Experimental results demonstrated that integrating InceptionV3 with Azure AI Document Intelligence improved author identification accuracy to 98% and reduced the Character Error Rate (CER) to 6%, compared to the generic Azure AI Document Intelligence model, which achieved a CER of 11.3% in manuscript transcription. The personalized approach of MANCAPT proved crucial in addressing the idiosyncrasies of handwriting, enhancing the efficiency of OCR solutions.
Designação do Departamento: Escola de Tecnologias e Arquitectura
Designação do grau: Mestrado em Tecnologias Digitais para o Negócio
Arbitragem científica: yes
Acesso: Acesso Aberto
Aparece nas coleções:T&D-DM - Dissertações de mestrado

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
Master_ednilson_fonseca_queni.pdf1,37 MBAdobe PDFVer/Abrir


FacebookTwitterDeliciousLinkedInDiggGoogle BookmarksMySpaceOrkut
Formato BibTex mendeley Endnote Logotipo do DeGóis Logotipo do Orcid 

Todos os registos no repositório estão protegidos por leis de copyright, com todos os direitos reservados.