Utilize este identificador para referenciar este registo:
http://hdl.handle.net/10071/34645
Autoria: | Queni, Ednilson Fonseca |
Orientação: | Ferreira, João Carlos Amaro Elvas, Luís Manuel Nobre de Brito |
Data: | 26-Mar-2025 |
Título próprio: | MANCAPT: Identificação de autores e transcrição de manuscritos |
Referência bibliográfica: | Queni, E. F. (2025). MANCAPT: Identificação de autores e transcrição de manuscritos [Dissertação de mestrado, Iscte - Instituto Universitário de Lisboa]. Repositório Iscte. http://hdl.handle.net/10071/34645 |
Palavras-chave: | Inteligência artificial -- Artificial intelligence Aprendizagem máquina Reconhecimento ótico de caracteres Identificação de autor Machine learning -- Machine learning Optical character recognition Author identification |
Resumo: | Este trabalho explora os desafios da digitalização de documentos manuscritos, com foco na
variabilidade da caligrafia e nas limitações dos sistemas de Reconhecimento Ótico de
Caracteres (OCR) genéricos. Este trabalho consiste na criação de um protótipo designado por
MANCAPT, que apresenta uma solução baseada em tecnologias avançadas, incluindo o
Microsoft AI Document Intelligence, utilizado para a criação de modelos personalizados de
diferentes autorias e transcrição dos manuscritos, e a arquitetura neural InceptionV3, utilizada
para a identificação dos autores dos manuscritos com elevada precisão.
O MANCAPT integra técnicas de pré-processamento como a binarização, remoção de
ruído e normalização da escala, complementadas por data augmentation para criar um conjunto
de treino consistente. Foram utilizadas imagens manuscritas e impressas numa proporção
equilibrada (70% impressas 30% manuscritas), permitindo ao modelo capturar tanto padrões
claros como nuances estilísticas da escrita manual.
Os resultados experimentais demonstraram que a integração do InceptionV3 e do Azure AI
Document Intelligence no sistema aumentou a precisão da identificação de autores para 98% e
reduziu a Taxa de Erro de Caracteres (CER) para 6%, em comparação com o modelo genérico
do Azure AI Document Intelligence, que obteve um CER de 11,3% na transcrição de
manuscritos. A abordagem personalizada do MANCAPT revelou-se crucial para lidar com as
idiossincrasias da escrita, promovendo a eficiência em soluções de OCR. This work explores the challenges of digitizing handwritten documents, focusing on handwriting variability and the limitations of generic Optical Character Recognition (OCR) systems. This study involves the creation of a prototype named MANCAPT, which provides a solution based on advanced technologies, including Microsoft AI Document Intelligence for the development of customized models for different authors and the transcription of manuscripts, as well as the neural architecture InceptionV3 for high-precision author identification. MANCAPT integrates preprocessing techniques such as binarization, noise removal, and scale normalization, complemented by data augmentation to create a robust and resilient training dataset. Handwritten and printed images were used in a balanced proportion (70% printed, 30% handwritten), allowing the model to capture both clear patterns and stylistic nuances of manual writing. Experimental results demonstrated that integrating InceptionV3 with Azure AI Document Intelligence improved author identification accuracy to 98% and reduced the Character Error Rate (CER) to 6%, compared to the generic Azure AI Document Intelligence model, which achieved a CER of 11.3% in manuscript transcription. The personalized approach of MANCAPT proved crucial in addressing the idiosyncrasies of handwriting, enhancing the efficiency of OCR solutions. |
Designação do Departamento: | Escola de Tecnologias e Arquitectura |
Designação do grau: | Mestrado em Tecnologias Digitais para o Negócio |
Arbitragem científica: | yes |
Acesso: | Acesso Aberto |
Aparece nas coleções: | T&D-DM - Dissertações de mestrado |
Ficheiros deste registo:
Ficheiro | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Master_ednilson_fonseca_queni.pdf | 1,37 MB | Adobe PDF | Ver/Abrir |
Todos os registos no repositório estão protegidos por leis de copyright, com todos os direitos reservados.