Recovering capitalization and punctuation marks for automatic speech recognition: case study for Portuguese broadcast news

Batista, F.; Caseiro, D.; Mamede, N.; Trancoso, I.

doi:10.1016/j.specom.2008.05.008

Utilize este identificador para referenciar este registo: http://hdl.handle.net/10071/22063

Registo completo

Campo DC	Valor	Idioma
dc.contributor.author	Batista, F.	-
dc.contributor.author	Caseiro, D.	-
dc.contributor.author	Mamede, N.	-
dc.contributor.author	Trancoso, I.	-
dc.date.accessioned	2021-02-18T10:47:13Z	-
dc.date.available	2021-02-18T10:47:13Z	-
dc.date.issued	2008	-
dc.identifier.issn	0167-6393	-
dc.identifier.uri	http://hdl.handle.net/10071/22063	-
dc.description.abstract	The following material presents a study about recovering punctuation marks, and capitalization information from European Portuguese broadcast news speech transcriptions. Different approaches were tested for capitalization, both generative and discriminative, using: finite state transducers automatically built from language models; and maximum entropy models. Several resources were used, including lexica, written newspaper corpora and speech transcriptions. Finite state transducers produced the best results for written newspaper corpora, but the maximum entropy approach also proved to be a good choice, suitable for the capitalization of speech transcriptions, and allowing straightforward on-the-fly capitalization. Evaluation results are presented both for written newspaper corpora and for broadcast news speech transcriptions. The frequency of each punctuation mark in BN speech transcriptions was analyzed for three different languages: English, Spanish and Portuguese. The punctuation task was performed using a maximum entropy modeling approach, which combines different types of information both lexical and acoustic. The contribution of each feature was analyzed individually and separated results for each focus condition are given, making it possible to analyze the performance differences between planned and spontaneous speech. All results were evaluated on speech transcriptions of a Portuguese broadcast news corpus. The benefits of enriching speech recognition with punctuation and capitalization are shown in an example, illustrating the effects of described experiments into spoken texts.	eng
dc.language.iso	eng	-
dc.publisher	Elsevier	-
dc.rights	openAccess	-
dc.subject	Rich transcription	eng
dc.subject	Punctuation recovery	eng
dc.subject	Sentence boundary detection	eng
dc.subject	Capitalization	eng
dc.subject	Truecasing	eng
dc.subject	Maximum entropy	eng
dc.subject	Language modeling	eng
dc.subject	Weighted finite state transducers	eng
dc.title	Recovering capitalization and punctuation marks for automatic speech recognition: case study for Portuguese broadcast news	eng
dc.type	article	-
dc.pagination	847 - 862	-
dc.peerreviewed	yes	-
dc.journal	Speech Communication	-
dc.volume	50	-
dc.number	10	-
degois.publication.firstPage	847	-
degois.publication.lastPage	862	-
degois.publication.issue	10	-
degois.publication.title	Recovering capitalization and punctuation marks for automatic speech recognition: case study for Portuguese broadcast news	eng
dc.date.updated	2021-02-18T10:45:22Z	-
dc.description.version	info:eu-repo/semantics/acceptedVersion	-
dc.identifier.doi	10.1016/j.specom.2008.05.008	-
dc.subject.fos	Domínio/Área Científica::Ciências Naturais::Ciências da Computação e da Informação	por
dc.subject.fos	Domínio/Área Científica::Ciências Naturais::Ciências Físicas	por
dc.subject.fos	Domínio/Área Científica::Ciências Agrárias::Outras Ciências Agrárias	por
iscte.identifier.ciencia	https://ciencia.iscte-iul.pt/id/ci-pub-16009	-
iscte.alternateIdentifiers.wos	WOS:000260702200006	-
iscte.alternateIdentifiers.scopus	2-s2.0-53149126088	-
Aparece nas coleções:	CTI-RI - Artigos em revistas científicas internacionais com arbitragem científica