Coder Social home page Coder Social logo

sara_public's Introduction

Sara

experimental version labmic

A Sara é um framework semi-automatizado para coleta e análise de dados de redes sociais online, utilizando Redes complexas, Aprendizagem de Máquina e Mineração de texto.

Desenvolvido no Laboratório de Modelagem Computacional e Inteligência Computacional (LABMIC) da Universidade Federal de São João del-Rei (UFSJ)

Estado : Em desenvolvimento / Experimental

Site : https://labmicufsj.github.io/sara_public/

Guias

Módulos

Coletor

O módulo de coleta utiliza a API do Twitter.

Módulos associados:

  • sara_coletor - Realiza as coletas de tweets em tempo real.
  • coletor_agendado - Realiza coletas de acordo com agendamento.
  • conexao_twitter - Contém os dados de acesso da API do Twitter.

Os dados coletados são salvos no mongodb, um banco de dados não relacional.

Geração da Rede

A geração da rede é realizada por meio do módulo sara_estrutural.

  • sara_estrutural - Gera uma rede direcionada ou não direcionada.

A rede gerada é salva no diretório redes/.

Análise de Centralidade

O framework identifica os vértices de maior importância de acordo com as seguintes métricas de centralidade:

  • Betweenness, PageRank, Degree, Curtidas, Retweets.

A detecção de centralidade é realizada por meio da utilização do módulo sara_centralidade.

O resultado deste módulo é salvo no diretório resultados_importancia/.

Detecção de Comunidades

A detecção de comunidade neste framework é realizada por meio do módulo Overlap.

Esta ferramenta procura encontrar ego comunidades formada em torno de determinados usuários.

  • Detecção de comunidades - Realiza a detecção de comunidades sobrepostas, utilize o resultado da centralidade ou outra sequência de importância para detecção de comunidades.

Modulo associado

  • overlap.py

Análise de conteúdo

A visualização e análise do conteúdo é realizada por meio da utilização da técnica de LDA combinada com uma nuvem de palavras.

Módulos associados:

  • Sara_conteudo - Responsável pela geração da nuvem de palavras.
  • Sara_sentimento - Responsável pela análise de sentimento.

Dependências:

Consulte o guia de instalação.

  • python >= 3.6
  • pymongo
  • mongodb
  • networkx
  • gensim
  • spacy
  • matplot
  • wordcloud
  • nltk
  • seaborn
  • pandas

Artigos associados

Trabalhos relacionados a esta pesquisa que foram publicados em conferências:

sara_public's People

Contributors

cmagnobarbosa avatar

Stargazers

 avatar

Forkers

labmicufsj

sara_public's Issues

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.