DETECÇÃO AUTOMÁTICA DE CONTEÚDOS PRECONCEITUOSOS UTILIZANDO TÉCNICAS DE CLASSIFICAÇÃO DE TEXTOS
Resumo
Com o aumento exponencial da quantidade de informações textuais torna-se relevante investigar métodos e técnicas que permitam lidar com este conteúdo de forma eficiente e automática, dessa forma, o processamento automático de textos é um grande desafio. A classificação automática de texto envolve atribuir uma ou mais categorias de documentos predefinidas. Esta investigação se propõe a examinar as técnicas associadas à categorização automática, propondo uma ferramenta computacional que permita identificar conteúdos preconceituosos em redes sociais, a partir da análise estatística e linguística de textos coletados. O intuito deste trabalho foi investigar e desenvolver técnicas de classificação automática para realizar a tarefa de detectar discursos de ódio contra a comunidade LGBTQIA+. Foi desenvolvido um website responsivo, utilizando linguagem Python, banco de dados MySQL e Flask Framework, permitindo que usuários possam classificar seus comentários ou visualizar comentários classificados pelo modelo como preconceituoso ou não.
Referências
BECKER, K.; TUMITAN, D. Introdução à Mineração de Opiniões: Conceitos, Aplicações e Desafios. In: Joao Eduardo Ferreira. (Org.). Lectures of the 28th Brazilian Symposium on Databases. 1ed. Pernambuco: CIN - UFPE, 2013, p. 27-52. Disponível em: https://www.inf.ufrgs.br/~kbecker/lib/exe/fetch.php?media=minicursosbbd_versaosubmetida.pdf. Acesso em: 04 jul. 2024.
COMUNICA QUE MUDA, 2016. Nova/sb identifica quadro de intolerância no Brasil. São Paulo, 08/04/2016. Disponível em: http://www.clubedecriacao.com.br/ultimas/comunica-que-muda-2/. Acesso em: 04 jul. 2024.
JORNAL DO COMÉRCIO. Governo Federal Lança Ação Para Defesa de Direitos Humanos na Internet. Porto Alegre, 07/04/2015. Disponível em: https://www.jornaldocomercio.com/site/noticia.php?codn=192894. Acesso em: 04 jul. 2024.
MATSUURA, S. Brasil Cultiva Discurso de Ódio nas Redes Sociais, Mostra Pesquisa. O Globo, Rio de Janeiro, 03 ago. 2016. Disponível em: https://oglobo.globo.com/brasil/brasil-cultiva-discurso-de-odio-nas-redes-sociais-mostra-pesquisa-19841017#newsletterLink. Acesso em: 04 jul. 2024.
O'DELL, J. How Big Is the Web & How Fast Is It Growing? Mashable, Nova York, 19 jun. 2011. Disponível em: https://mashable.com/2011/06/19/how-many-websites/. Acesso em: 04 jul. 2024.
PANG, B.; LEE, L. Opinion Mining and Sentiment Analysis. Foundations and Trends in Information Retrieval, v. 2, p. 1–135. Disponível em: https://ieeexplore.ieee.org/document/8187070/metrics#metrics. Acesso em: 04 jul. 2024.
PUBLICO. Comentários racistas publicados no Facebook divulgados à porta de quem os escreveu. Lisboa, 1 dez. 2015. Disponível em: https://www.publico.pt/2015/12/01/tecnologia/noticia/comentarios-racistas-publicados-no-facebook-divulgados-a-porta-de-quem-os-escreveu-1716118. Acesso em: 04 jul. 2024.
WEISS, S. M. et al. Text Mining: Predictive Methods for Analyzing Unstructured Information. New York, Springer Science & Business Media, 1st ed. 1, 2005.