SOFTWARE

RSO-EXTRATOR: FERRAMENTA DE COLETA, REMOÇÃO DE EMOJIS E ARMAZENAMENTO DE DADOS DAS REDES SOCIAIS FACEBOOK E TWITTER

Resumo

A Ferramenta proposta apresenta um modelo de extração, armazenamento e pré-processamento de dados de redes sociais. A arquitetura do sistema foi projetada para dar suporte ao desenvolvimento de uma aplicação web, denominada de “RSO-Visualizador: ferramenta de gerenciamento e visualização de dados das redes sociais Facebook e Twitter”, a qual utiliza o Django (Framework Python para desenvolvimento de aplicações web). Utilizando a ferramenta RSO-Extrator é possível extrair dados de duas redes sociais: Twitter e Facebook. Nestas, a extração de dados ocorre por meio de uma Application Programming Interface (API). Para armazenar os dados brutos extraídos é utilizado o Sistema Gerenciador de Banco de Dados (SGBD) MySQL, sendo feito o pré-processamento nos dados armazenados. O pré-processamento consiste no tratamento dos dados, tendo como principais atividades: a remoção de stopwords (palavras não relevantes no texto, como: acentos, pontuação, artigos, pronomes); conversão de emoticons (ícones) em caracteres equivalentes.

Solução Proposta

A interação entre usuários da internet está no centro da web, que tem visto um rápido crescimento nos últimos anos. Além disso, temos que todos os acontecimentos mundiais são registrados nas redes sociais, através de postagens que expressam críticas, elogios, atitudes, emoções, novas ideias sobre pessoas, lugares, eventos, novos produtos, serviços, ou qualquer assunto. Este fato acontece, uma vez que a internet é um meio que permite livre expressão, sendo possível identificar as necessidades dos usuários e suas opiniões. Por outro lado, dados não estruturados oriundos de inúmeras fontes, como as Redes Sociais Online (RSO), necessitam de tratamento mais complexo. Neste contexto, propôs-se o desenvolvimento de uma ferramenta, cujo objetivo é extrair, armazenar e pré-processar advindos das RSO, afim de disponibilizar dados preparados de forma adequada para aplicar processos de descoberta de conhecimento sobre estes.

Autor

ANTONIO FERNANDO LAVAREDA JACOB JUNIOR; BEATRIZ NERY RODRIGUES CHAGAS; FÁBIO MANOEL FRANÇA LOBATO; ABRAÃO DA COSTA SANTANA

Propriedade Intelectual

BR512019000935-5

Campo de Aplicação

CO-04; IF-01; IF-09

Tipo de programa

GI-01; GI-07; GI-08

Linguagem de programação

HTML; JAVA SCRIPT; PYTHON



Contato

E-mail: coordenacao@propriedadeintelectual.uema.br
Telefone: (98) 99131-0337