Pipeline que permite gerar visualizações dos principais atores, agrupamentos de perfis e os diferentes pontos de discussão na rede social Twitter relacionados a diversos eventos ao longo das eleições presidenciais brasileiras de 2022, uma das mais disputadas da história do país. Contém também uma base de dados desidratados de Tweets de Agosto/2002 a Janeiro/2023, incluindo o evento de 08 de janeiro, relacionado à invasão dos Três Poderes em Brasília.
Pipeline de Limpeza de Dados Textuais em Português
Este repositório contém um pipeline de limpeza de dados em Python, desenvolvido para pré-processar conjuntos de dados textuais. O pipeline foi desenvolvido para limpeza de dados advindos de redes sociais. Entretanto, ele pode ser utilizado para várias bases de dados textuais.