Coder Social home page Coder Social logo

barbaraneves / multi-label-stratification-skmultilearn Goto Github PK

View Code? Open in Web Editor NEW
5.0 3.0 0.0 32.4 MB

Multi-label data stratification with Scikit-multilearn.

Jupyter Notebook 100.00%
stratification scikit-multilearn multi-label pre-processing nlp text-classification data-analysis data-visualization multi-label-classification

multi-label-stratification-skmultilearn's Introduction

Estratificação de dados multi-label com o Scikit-multilearn

A capacidade de classificar e reconhecer certos tipos de dados vem sendo exigida em diversas aplicações modernas e, principalmente, onde o Big Data é usado para tomar todos os tipos de decisões, como no governo, na economia e na medicina. As tarefas de classificação também permitem que pesquisadores consigam lidar com a grande quantidade de dados as quais têm acesso.

Sobre a estratificação do Scikit-multilearn

Existe uma biblioteca, chamada Scikit-multilearn, que permite realizar diversas operações, mediante as implementações nativas do Python encontradas na biblioteca de métodos populares da classificação multi-label. A implementação da estratificação iterativa do Scikit-multilearn visa fornecer uma distribuição equilibrada das evidências das classes de um conjunto de dados até uma determinada ordem.

Definição do problema

Neste projeto, analisamos o que isso significa utilizando o conjunto de treino desbalanceado disponível na competição Toxic Comment Classification, disponível na comunidade de Ciência de Dados Kaggle: Your Home for Data Science. Esta competição trata de um problema de classificação de texto, mais precisamente de classificação de comentários tóxicos.

Os dados possuem um grande número de comentários do Wikipédia, classificados de acordo com os seguintes rótulos:

toxic
sever_toxic
obscene
threat
insult
identity_hate

Para mais informações sobre esse projeto, acesse o artigo disponível no blog do Insight Data Science Lab ou no Medium.

multi-label-stratification-skmultilearn's People

Contributors

barbaraneves avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.