Coder Social home page Coder Social logo

bitirme's Introduction

Proje Logo

1.Dil İşleme Destekli CV-Mentör Eşleştirme Sistemi

Kişilerin CV'lerini (özgeçmişlerini) ve startup (girişim) şirketlerinin ihtiyaçlarını karşılaştırarak en uygun eşleşmeyi bulmayı amaçlar. Proje, BERT (Bidirectional Encoder Representations from Transformers) adlı derin öğrenme modelini kullanarak (tekoneler ile ) metin verilerini gömülü vektörlere dönüştürür ve bu vektörler arasındaki benzerliği cosinus benzerliği ile hesaplar

1.1 Veri Toplama Yöntemleri

Proje kapsamında kullanılan veriler, iki farklı kaynaktan elde edilmiştir bunlar startup bilgileri ve CV verileri, json fromatına dönüştürülüne bu veriler githubda startup.json dosyasına kaydedildi ve cv.json dosyalarına veri arttırma işlemi uygulanmış ve modele hazır hale getirildi .

1.1.1 Startup Verilerinin Toplanması

Startup verileri, EU-Startups sitesinden elde edilmiştir. Scrapy adlı web kazıma kütüphanesi kullanılarak belirlenen URL'lerden veriler çekilmiş ve JSON formatında kaydedilmiştir. Starups.py file ile toplanan veriler startup.json da saklanmıştır.

1.1.2 CV Verilerinin Toplanması

CV verileri, belirli bir formatta düzenlenmiş ve JSON dosyalarına dönüştürülmüştür. Bu veriler, çeşitli kaynaklardan manuel veya otomatik olarak toplanmış ve belirli bir formata dönüştürülmüştür.cv.json dosyasında saklanmıştır.

2. Model Eğitimi ve Değerlendirme Yöntemleri

Proje Logo Json formatına dönüştürülen veriler Bert (google nin ) dil modelinde verildi ve ilgili json verileri bert modeli ile vektörleştirildi ve bu vektörler sayısal vektörleşme uygulandı tüm verilere kosinus benzerliği uygulandı bu uygulama sonrasında elde edilen skor her firma için en uygun cv ye sahip kişinin adını ve yüzde üzerinden uygunluk değerine ait skor değerini çıktı olarak almaktayız. Eğitim sırasınd 2 farklı yöntem uygulanmıştır bunları model-1 ve model -2 olarak isimlendirdim.

Modelin Diagramla Gösterimi

Proje Logo

Model 1:

BERT modelinin son katmanından (last_hidden_state) elde edilen çıktının ortalamasını kullanır. Bu, BERT modelinin tüm çıktılarını tek bir vektörde toplamak anlamına gelir. Kodda: outputs.last_hidden_state.mean(dim=1).detach().numpy()

Model 2:

BERT modelinin belirli bir katmanından (örneğin 11. katman) elde edilen çıktının ortalamasını kullanır. Belirli bir katman seçerek, modelin farklı seviyelerdeki özelliklerini kullanabilirsiniz. Kodda: outputs.hidden_states[layer_num].mean(dim=1).detach().numpy()

Modelde'in Detaylı Gösterimi

Proje Logo

3. Kullanım

  1. GOOGLE COLAB da ilgili dosyayı açın ve verilerinizi uygun formatta oluşturun ve düzenleyin ve modele bu verileri sunun çıktıları görütüleyin .
  2. [ Hugging Face deki kullanımı için bağlantı] (https://huggingface.co/hmyrcmn/cvMentorMatch/commit/a9427233de3a8a649ce155275c8ed024528ed17e) yı ziyaret edebilirsiniz.
  3. Kullanım örneği için buradaki örnek kodları inceleyebirsiniz

4. Model 2 nin Sonuçları

Proje Logo

Bu tabloda selin öztürk cvsine firmaların uygunluklarını belirten skorlar yer almaktadır.

bitirme's People

Contributors

hmyrcmn avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.