Utilize este identificador para referenciar este registo: http://hdl.handle.net/10071/35103
Registo completo
Campo DCValorIdioma
dc.contributor.authorZanatti, M.-
dc.contributor.authorRibeiro, R.-
dc.contributor.authorPinto, H. S.-
dc.contributor.authorBorbinha, J.-
dc.date.accessioned2025-09-03T11:24:55Z-
dc.date.available2025-09-03T11:24:55Z-
dc.date.issued2025-
dc.identifier.citationZanatti, M., Ribeiro, R., Pinto, H. S., & Borbinha, J. (2025). Atribuição de descritores a acórdãos do Supremo Tribunal de Justiça Português com base em representações locais esparsas. Linguamática, 17(1), 35-51. https://doi.org/10.21814/lm.17.1.481-
dc.identifier.issn1647-0818-
dc.identifier.urihttp://hdl.handle.net/10071/35103-
dc.description.abstractA Classificação Extrema Multi-etiqueta (XML) consiste na predição de múltiplas etiquetas para um determinado input, sendo um problema fundamental em domínios como categorização de texto, sistemas de recomendação e marcação de imagens. Esta tarefa apresenta desafios significativos para a aprendizagem automática e a recuperação de informação, especialmente devido ao crescimento exponencial de dados online e à consequente necessidade de algoritmos capazes de lidar com conjuntos de dados de grande escala e com um elevado número de etiquetas. Os métodos tradicionais de classificação são inadequados para esta tarefa devido ao vasto número de possíveis combinações de etiquetas e à dispersão das atribuições. Este artigo apresenta os resultados de um projeto realizado com o Supremo Tribunal de Justiça de Portugal, onde abordámos este problema utilizando Sparse Local Embeddings for Extreme Multi-label Classification (SLEEC), uma abordagem baseada em embeddings que demonstrou resultados promissores no domínio legal. O nosso objetivo foi associar descritores, que categorizam os acórdãos do tribunal Português, aos respetivos acórdãos. Este trabalho enfrentou diversos desafios, nos quais se incluem um elevado número de descritores, um conjunto de dados desbalanceado, a presença de muitas etiquetas raras (tail labels) e a extensão considerável dos documentos. Os resultados experimentais demonstram que a nossa abordagem alcançou uma variação de precisão/cobertura entre 0,57 e 0,68, indicando um desempenho promissor nesta tarefa complexa.por
dc.language.isopor-
dc.publisherUniversidade do Minho; Universidade de Vigo-
dc.relationinfo:eu-repo/grantAgreement/FCT/Concurso de avaliação no âmbito do Programa Plurianual de Financiamento de Unidades de I&D (2017%2F2018) - Financiamento Base/UIDB%2F50021%2F2020/PT-
dc.relationC645008882-00000055-
dc.rightsopenAccess-
dc.subjectDescritorespor
dc.subjectDocumentos legaispor
dc.subjectClassificação extrema multi-etiquetapor
dc.subjectSLEECpor
dc.titleAtribuição de descritores a acórdãos do Supremo Tribunal de Justiça Português com base em representações locais esparsaspor
dc.title.alternativeSLEEC assignment of descriptors to judgments of the Supreme Court of Justice of Portugalen
dc.typearticle-
dc.pagination35 - 51-
dc.peerreviewedyes-
dc.volume17-
dc.number1-
dc.date.updated2025-09-03T12:24:01Z-
dc.description.versioninfo:eu-repo/semantics/publishedVersion-
dc.identifier.doi10.21814/lm.17.1.481-
dc.subject.fosDomínio/Área Científica::Humanidades::Línguas e Literaturaspor
iscte.identifier.cienciahttps://ciencia.iscte-iul.pt/id/ci-pub-112792-
iscte.alternateIdentifiers.wosWOS:WOS:001544977900003-
iscte.journalLinguamática-
Aparece nas coleções:CTI-RI - Artigos em revistas científicas internacionais com arbitragem científica

Ficheiros deste registo:
Ficheiro TamanhoFormato 
article_112792.pdf535,98 kBAdobe PDFVer/Abrir


FacebookTwitterDeliciousLinkedInDiggGoogle BookmarksMySpaceOrkut
Formato BibTex mendeley Endnote Logotipo do DeGóis Logotipo do Orcid 

Todos os registos no repositório estão protegidos por leis de copyright, com todos os direitos reservados.