Utilize este identificador para referenciar este registo:
http://hdl.handle.net/10071/25096
Autoria: | Vicente, M. Batista, F. Carvalho, J. |
Editor: | Adnan Yazici, Nikhil R. Pal, Uzat Kaymak |
Data: | 2015 |
Título próprio: | Twitter gender classification using user unstructured information |
ISSN: | 1544-5615 |
ISBN: | 978-1-4673-7428-6 |
DOI (Digital Object Identifier): | 10.1109/FUZZ-IEEE.2015.7338102 |
Palavras-chave: | Twitter Gender detection Fuzzy c-means Supervised and unsupervised methods |
Resumo: | This paper describes an approach to automatically detect the gender of Twitter users, based only on clues provided by their profile information in an unstructured form. A number of features that capture phenomena specific of Twitter users is proposed and evaluated on a dataset of about 242K English language users. Different supervised and unsupervised approaches are used to assess the performance of the proposed features, including Naive Bayes variants, Logistic Regression, Support Vector Machines, Fuzzy c-Means clustering, and K-means. An unsupervised approach based on Fuzzy c-Means proved to be very suitable for this task, returning the correct gender for about 96% of the users. |
Arbitragem científica: | yes |
Acesso: | Acesso Aberto |
Aparece nas coleções: | IT-CRI - Comunicações a conferências internacionais |
Ficheiros deste registo:
Ficheiro | Descrição | Tamanho | Formato | |
---|---|---|---|---|
conferenceobject_24678.pdf | Versão Aceite | 139,68 kB | Adobe PDF | Ver/Abrir |
Todos os registos no repositório estão protegidos por leis de copyright, com todos os direitos reservados.