View Code? Open in Web Editor
NEW
A BERT-based reverse dictionary of fruits!
fruitify's People
Contributors
Watchers
fruitify's Issues
๋ชฉํ
kor - kor
en - en
์ด๋ ๊ฒ unaligned pair๋ง์ ๊ฐ์ง๊ณ ํ์ต์ ํด๋ณด๋ ๊ฒ.
์ด๋ฐ์ ๋ฐ ์๊ฐ in week 0.
ํด์ผํ ๊ฒ?
๊ตฌ์กฐ๋ MonoLingRD ์ ์ ํํ ๋์ผํ๋ค. ํ๊ฐ์ง ๋ค๋ฅธ์ ์ ์ฌ์ฉํ๋ ์ฌ์ ํ๋ จ ๋ชจ๋ธ์ด mbert_mlm์ด๋ผ๋ ๊ฒ.
์ด๊ฑธ ํด๋์ค๋ฅผ ๋ฐ๋ก ์ ์๋ฅผ ํด์ผํ๋?
๋ฐ๋ก ์ ์๋ฅผ ํด์, ์ด๋ค bert๋ฅผ ์๊ตฌํ๋์ง ํ์คํ๊ฒ ํ๊ธฐํ๋๋ก ํ์.
find at least 5 definitions for:
- apple
- banana
- strawberry
- orange
- grape
use the following authoritative dictionaries:
- Oxford dict
- Cambridge dict
- Merriam Webster
- Longman dict
- Macmillan dict
Why?
๋๋ ์ฃผ์ฒด์ ์ธ ๊ต์ก์๊ฐ ๋ ๊ฒ์ด๋ค. ๋๋ง์ด ๊ฐ๋ฅด์น ์ ์๋ ๊ทธ๋ฐ ๊ต์ก๊ณผ์ ์ ๋ง๋ค์ด๋ณด๊ณ ์ถ๋ค.
How?
์ผ๋จ #10 (comment) ์ฌ๊ธฐ์ sprint 1์ ํด๊ฒฐํ๋ค.
์ด์ ๊ณ์, sprint 2, sprint 3, sprint 4๋ฅผ ๋ฌ๋ฆฌ๋ฉฐ ๋ ์ถ๊ฐํด๋๊ฐ์.
์ปค๋ฆฌํ๋ผ
- week 1
- inverted index & TFIDF๋ก ๊ตฌํํด๋ณด๊ธฐ : ์ฅ์ ํ์
/ ๋ฌธ์ ์ธ์ (semantic search ๋ถ๊ฐ. ์ ์์ ํฌํจ๋์ง ์์ ๋จ์ด๋ ๊ฒ์
- week 2. Word2Vec๋ก ๊ตฌํํด๋ณด๊ธฐ : inverted index ๋๋น ์ฅ์ ํ์
/ ๋ฌธ์ ์ธ์ - averaging vectors to get a sentence vector์ ๋จ์ .
- RNN & LSTM์ผ๋ก ๊ตฌํํด๋ณด๊ธฐ: Word2Vec ๋๋น ์ฅ์ ํ์
/ ๋ฌธ์ ์ธ์ - ๋ฐ์ดํฐ๊ฐ ๋ง์ด ํ์ํจ & ๊ทธ๋๋ ์ฌ์ ํ... ๊ธด ๋ฌธ์ฅ์ ํ๋ค๋ค.
- Traansformer ๋ก ๊ตฌํํด๋ณด๊ธฐ: RNN & LSTM ๋๋น ์ฅ์ ํ์
/ ๋ฌธ์ ์ธ์ - ์ฌ์ ํ ๋ฐ์ดํฐ๊ฐ ๋ง์ด ํ์ํ๋ค.
- BERT๋ก ๊ตฌํํด๋ณด๊ธฐ: Transformer ๋๋น ์ฅ์ ํ์
/ ๋ฌธ์ ์ธ์ - ...BERT์ ๋ฌธ์ ๊ฐ ๋ญ๋๋ผ?
- GPT3 & The future of NLP .... (e.g. few-shot learning )
- different tasks in NLP other than RD - generation, speech recognition (ํนํ ์ด๊ฒ๋ ์ธ๊ณต์ง๋ฅ์ด ํ์ํ๋ค๋ ๊ฒ),
- Practical tips - tokenisation, lemmatization, stemming, etc
- ์ด์ด์... ๋ ์ฑ์์ผ ํ๋ ๊ฒ๋ค.
Just visualising them with opaciity will suffice.
Todo
Implement MonoFruit
defined in fruitify/models.py
; Implement its three member methods:
fruitify
forward
training_step
Testing (pseudo)
python3 -m fruitify.scripts.train --fruit_type="mono" --k=5 --max_epochs=10
Support
Explore the scripts in fruitfiy/examples
for:
- exploring
bert_mlm
- exploring
bert_tokenizer
- exploring the
fruit2def
dataset
- implementing cross entropy in Pytorch