Projekt konkursowy na: https://festiwalcyfryzacji.pl/digital-ars
- dane pobrane ze strony poezja.org przy wykorzystaniu kodów z R
- dane pobrane z wikipedia source przy wykorzystaniu kodów Python
- następnie stworzyliśmy jeden zbiór danych i wrzuciliśmy go do folderu data.
- wybraliśmy wiersze z rymami (ABBA, ABAB, AABB), gdzie średnia długość wersa nie była dłuższa niż 50.
- model trenowaliśmy na google colab
- w sumie wytrenowaliśmy 160.000 epok dla modelu GPT-2