pi-v,shodi

Transcrever e parametrizar o Cross Validation

O cross validation precisa ser transcrito para um linguagem mais performática.

A Validação Cruzada (ou também conhecido como Cross Validation) é uma técnica para avaliação de classificadores.

Para esse trabalho, considere que:

Embaralhe o conjunto de entrada antes de aplicar o Cross Validation.
Utilizaremos o 10-fold Cross Validation, que consiste em dividir a amostra em 10 partes de tamanhos (aproximadamente) iguais. Repetir 10 rodadas de treinamento, deixando alternadamente uma das partes para teste em cada rodada.
Para cada "rodada" do Cross Validation, você deverá calcular o erro amostral (veja o erro amostral do método Holdout no slide da aula de "Estimação de Erro").
Ao término de todas as rodadas do Cross-Validation, você deverá calcular o erro de validação cruzada, que é dado pela média dos erros amostrais das 10 rodadas.

Gerar mapa de calor (HEATMAP)

Depois da execução do LVQ, para cada raio R escolhido você deverá gerar um Mapa de Calor semelhante aos da imagem mostrada a seguir.

Para gerar um Mapa de Calor, você deve fazer o seguinte:

Associe uma cor para cada classe do conjunto de entrada;
Execute o 10-fold Cross Validation normalmente;
Considere somente a matriz de neurônios M como o da última rodada do Cross Validation executado;
Considere X como o conjunto de entrada inteiro (ou seja, sem as partições do Cross Validation).
Para cada instância x do conjunto X, faça:
a. Associe x ao neurônio mais próximo da matriz de neurônio N.
b. Marque o neurônio encontrado pela cor da classe da instância x;
Imprima na tela o mapa de neurônios.

Você deve fazer isso para cada conjunto de dados e cada configuração R do LVQ. Portanto, para cada conjunto de dados teremos 4 mapas de calor (R = 1 até R = N).

Apresente esses mapas no relatório.

Verificar qual é o melhor configuração de raio R para o LVQ

Desenvolver interação gráfica com o usuário

Pesquisar tecnologia e desenvolver interação gráfica com o usuário.

Reescrever o kNN numa linguagem mais performatica

Como usaremos o kNN para comparação com o Learning Vector Quantization (LVQ), temos que ter certeza que ele funciona e que ambos tem a mesma condição de concorrência.

Montar "matriz de confusão multi-nível".

Essa matriz consiste em uma matriz N x N, sendo N a quantidade de classes, que apresenta a quantidade de elementos X classificados como Y, sendo X e Y duas classes iguais ou diferentes.

Um exemplo da matriz de confusão aparece abaixo para o conjunto de dados Iris. As linhas representam as classes corretas (esperadas) e as colunas são as que seu modelo gerou ou respondeu.

#11 Lembre-se que, para cada configuração do LVQ haverá uma tabela dessas, ou seja, uma tabela para o algoritmo para R = 1, quando R = 3, etc. O objetivo aqui é comparar qual a melhor configuração R do algoritmo.

Arrumar mlp.py que não está convergindo

Normalizar os dados antes de salvar no .csv

Os dados devem ser normalizador usando o seguinte padrão:

dado 1	dado 2	dado 3	categoria
x11	x12	x13	0
x21	x22	x23	1
x31	x32	x33	1

Deve ser feito a distância euclidiana nas colunas e também a label deve ser o último.

Categoria 1 = Mulher
Categoria 2 = Homem

Organizar a disposição dos arquivos e diretórios e modularizar ainda mais o código

Considerando que aplicaremos o partes do código para um ou mais algoritmos (tarefas) será necessário repensarmos em como podemos modularizar e melhor dispor a organização atual.

Desenvolver uma versão 2.0 com reconhecimento de música a partir de sons e batuques.

Coletar dados;
Normalizar
etc.

Calcular o Erro amostral de cada rodada do Cross Validation.

Calcular Erro de Validação Cruzada.

Montar "matriz de confusão"

Falso-positivo (FP)
Falso-negativo (FN)
Verdadeiro-positivo (TP)
Verdadeiro-negativo (TN)

Calcular Acurácia

Acurácia = Pontos Classificados Corretamente / Total número de pontos
Um exemplo de acurácia na tabela acima temos o seguinte:
Pontos classificados corretamente = 12 + 16 + 16 = 44
Número total de pontos = 12 + 16 + 16 + 1 + 1 + 1 = 47
Acurácia = 44 / 47 = 93.62%

Qual o classificador apresentou o melhor resultado: LVQ ou kNN

Chamar aqruivo mlp.r a partir do Python

Criar Relatório do que foi feito

O relatório deverá ser confeccionado categorizado por:

Para cada conjunto de dados utilizado:

Para cada versão do algoritmo LVQ.
a. Mostrar resultado (binário ou multiclasse)
b. Conclusões da equipe sobre os resultados desta execução. Para cada execução, deverá haver uma análise comparativa aos resultados das outras versões do algoritmo LVQ
Depois de mostrar os resultados de cada versão, descrever qual foi o melhor raio escolhido e o por quê.
Comparar os resultados do conjunto do melhor raio escolhido com os resultados do melhor k encontrado usando o algoritmo k-Nearest-Neighbours (Trabalho 1).

Veja a seção do experimento onde há detalhes sobre a matriz de confusão e outras informações.

Aumentar/melhorar o dataset com aúdios diferentes

Pegar aúdios aleatórios e trata-los para adicionar ao dataset.

Criar VIRTUALENV

Gravar vídeo explicando o algoritmo

Você e sua equipe deverão elaborar um vídeo da tela explicando:

Algoritmo: você deverá mostrar como está estruturado e como funciona cada parte do seu código-fonte.
Execução: você deverá escolher um conjunto de dados (por exemplo, Íris) e uma versão (por exemplo, o LVQ com R = N / 2) e mostrar a sua execução, explicando o que está acontecendo. Procure não escolher o R = 1 por ser muito simplista.
Não precisa mostrar a execução de outro conjunto e de outra versão do LVQ pois o vídeo ficará muito extenso.

Nessa parte, você deverá utilizar um software gravador de tela. Os sistemas Windows 10 e macOS possuem softwares gravadores de tela nativos.

Desenvolver o código do Learning Vector Quantization (LVQ)

SUBTASKS:

Geração de números aleatórios para peso de cada neurônio de 0.01 à 1
Função que faz o cálculo de tamanho da rede
Média, Desvio padrão (?)

VERSÕES DO ALGORITMO

Uma forma de considerar os vizinhos do neurônio vencedor seria criar um raio a partir do neurônio vencedor.

Vamos definir por N a largura (ou altura) da rede de neurônios. Deixe que o raio de vizinhos R seja parametrizável no seu algoritmo, pois precisaremos para o Cross Validation.

Assim, faremos 4 execuções para diferentes valores de R, como mostrado a seguir:

R = 1;
R = 3;
R = N / 2;
R = N

Recuperar informações importantes da predição

Acuracia
Gafico do comportamento dos dados
Etc.

shodi / pi-v Goto Github PK

pi-v's People

Contributors

Stargazers

Watchers

pi-v's Issues

Recommend Projects

Recommend Topics

Recommend Org