Codigos & Bases de Dados

Tweet_Eleições_2022: Um dataset de tweets durante as eleições presidenciais brasileiras de 2022

O dataset foi criado a partir da API da plataforma Twitter durante o período das eleições de 2022 no Brasil, com o intuito de capturar tweets relacionados às eleições e aos temas políticos relevantes.  Identificamos e selecionamos as notícias e acontecimentos relacionados às eleições de 2022. Isso envolveu monitorar diversos canais de informação, como sites de notícias, portais on-line e jornais, a fim de identificar temas relevantes e hashtags em destaque. A seleção das notícias foi realizada com base no interesse e avaliação dos autores sobre a sua repercussão na mídia oficial e o quanto se associava direta ou indiretamente a personalidades ou a ideologias político-partidárias presentes nas eleições. Na sequência, foram selecionadas palavras-chave e hashtags pertinentes aos eventos escolhidos. Esses termos foram utilizados para configurar a query de extração, especificando o período de interesse, o limite máximo de tweets a serem recuperados e diversos campos do tweet foram coletados para fins da pesquisa para qual o dataset foi inicialmente gerado.

Tweets Eleições 2022

Pipeline que permite gerar visualizações dos principais atores, agrupamentos de perfis e os diferentes pontos de discussão na rede social Twitter relacionados a diversos eventos ao longo das eleições presidenciais brasileiras de 2022, uma das mais disputadas da história do país. Contém também uma base de dados desidratados de Tweets de Agosto/2002 a Janeiro/2023, incluindo o evento de 08 de janeiro, relacionado à invasão dos Três Poderes em Brasília.

Pipeline de Limpeza de Dados Textuais em Português

Este repositório contém um pipeline de limpeza de dados em Python, desenvolvido para pré-processar conjuntos de dados textuais. O pipeline foi desenvolvido para limpeza de dados advindos de redes sociais. Entretanto, ele pode ser utilizado para várias bases de dados textuais.

Visite também o repositório do CIBERDEM no Github.