Utilize este identificador para referenciar este registo: http://hdl.handle.net/10071/29950
Registo completo
Campo DCValorIdioma
dc.contributor.advisorNunes, Luís Miguel Martins-
dc.contributor.advisorRibeiro, Ricardo Daniel Santos Faro Marques-
dc.contributor.authorAlves, Tiago de Sousa-
dc.date.accessioned2023-12-06T13:13:41Z-
dc.date.issued2023-11-09-
dc.date.submitted2023-10-
dc.identifier.citationAlves, T. de S. (2023). Análise de prospetos e regulamentos de gestão de produtos de investimento [Dissertação de mestrado, Iscte - Instituto Universitário de Lisboa]. Repositório Iscte. http://hdl.handle.net/10071/29950por
dc.identifier.urihttp://hdl.handle.net/10071/29950-
dc.description.abstractA análise de documentos com recurso a técnicas de PLN (Processamento de Língua Natural) é um tema em grande desenvolvimento. Neste trabalho desenvolvemos um protótipo que recorre a algumas técnicas de PLN com o objetivo de ajudar a CMVM - Comissão do Mercado de Valores Mobiliários a validar prospetos financeiros que são documentos jurídicos emitidos por empresas destinados aos investidores sobre os valores mobiliários que estas emitem e sobre si próprias. O trabalho consiste em primeiro extrair a informação dos documentos mantendo a estrutura dos mesmos. Para isso recorremos ao índice que nos dá toda a informação necessária dos capítulos e respetivas páginas. De seguida foram desenvolvidas algumas regras com base no Regulamento (UE) 2017 1129 para serem aplicadas à secção do sumário. Estas regras estão divididas em três grupos: REGEX’s, Reconhecimento de Entidades Mencionadas e cálculo de similaridade de textos. Os resultados obtidos foram positivos ainda que tenham sido detetadas algumas melhorias preciosas que se podem aplicar futuramente. Por fim são aplicas as regras desenvolvidas às devidas secções e avaliados os resultados obtidos através de um conjunto de documentos previamente escolhidos por nós, onde é feita uma comparação entre a validação automática e a validação manual. Nesta fase testamos desde a extração do índice, passando pela identificação e extração do sumário e de seguida aplicação das regras ao mesmo. Os resultados são animadores, contudo percebemos que o facto de não haver uma normalização dos documentos cria algumas dificuldades no processo de validação automática.por
dc.description.abstractThe analysis of documents using NLP (Natural Language Processing) techniques is a hot topic. In this work we have developed a prototype that uses some NLP techniques with the aim of helping the CMVM - Comissão do Mercado de Valores Mobiliários to validate financial prospectuses, which are legal documents issued by companies to investors about the securities they issue and about themselves. The work consists of first extracting the information from the documents while maintaining their structure. To do this, we used the table of contents, which gives us all the information we need about the chapters and their respective pages. Next, we developed some rules based on Regulation (UE) 2017 1129 to be applied to the summary section. These rules are divided into three groups: REGEX’s, Named Entety Recognition and text similarity calculation. The results obtained were positive, although some valuable improvements were detected that could be applied in the future. Finally, the rules developed are applied to the appropriate sections and the results obtained are evaluated using a set of documents previously chosen by us, where a comparison is made between automatic validation and manual validation. At this stage we tested everything from extracting the table of contents to identifying and extracting the summary and then applying the rules to it. The results are encouraging, but we can see that the fact that the documents are not standardized creates some difficulties in the automatic validation process.por
dc.language.isoporpor
dc.relationinfo:eu-repo/grantAgreement/FCT/6817 - DCRRNI ID/UIDB%2F04466%2F2020/PTpor
dc.relationinfo:eu-repo/grantAgreement/FCT/6817 - DCRRNI ID/UIDP%2F04466%2F2020/PTpor
dc.rightsrestrictedAccesspor
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/por
dc.subjectPLNpor
dc.subjectDocumentos legaispor
dc.subjectExtração de informaçãopor
dc.subjectNERpor
dc.subjectNLPpor
dc.subjectLegal documentspor
dc.subjectInformation extractionpor
dc.titleAnálise de prospetos e regulamentos de gestão de produtos de investimentopor
dc.typemasterThesispor
dc.peerreviewedyespor
dc.identifier.tid203412893por
dc.subject.fosDomínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informáticapor
thesis.degree.nameMestrado em Engenharia Informáticapor
dc.date.embargo2024-11-08-
thesis.degree.departmentDepartamento de Ciências e Tecnologias da Informaçãopor
Aparece nas coleções:T&D-DM - Dissertações de mestrado

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
master_tiago_sousa_alves.pdf
  Restricted Access
1,5 MBAdobe PDFVer/Abrir Request a copy


FacebookTwitterDeliciousLinkedInDiggGoogle BookmarksMySpaceOrkut
Formato BibTex mendeley Endnote Logotipo do DeGóis Logotipo do Orcid 

Este registo está protegido por Licença Creative Commons Creative Commons