A simple word2phrase application for Turkish text files - Türkçe metinler için basit bir word2phrase uygulaması
Bu uygulama, word2vec uygulamalarına hazırlık olarak bazı tamlamaların (phrases) belirlenip, sözcükleri alt_çizgi işaretiyle birleştirilmesi çalışması için bir örnek olarak hazırlanmıştır. Orijinal word2vec modülünde aslında word2phrase() bir metod halinde bulunuyor. Ancak dosya boyutları büyüdüğünde, bellek sorunları oluşmaktadır. Bu nedenle, orijinal kodlara eğitim verisi haline getirilmeden önce parçalar halinde bu uygulamayı yapmak çalışmaları kolaylaştırabilir.
word2phrase kodları https://github.com/travisbrady/word2phrase adresinden alınmıştır.
Bu tür çalışmalardan derlemtr: https://github.com/ahmetax/derlemtr projesinde de yararlanılacaktır.