Скрипт извлекает текст из js файлов, генерирующих слайды в презентации, приводя его в более-менее читабельный вид.
Версия: 3.6+ Необходимые библиотеки: bs4
- Установить Python 3.6+ и bs4
- Найти нужную тему.
- Пролистать презентацию. Нужно, чтобы были загружены все слайды.
- Сохранить страницу в папку со скриптом.
- Наслаждаться!
- Править ошибки...
Скрипт проходит по js файлам, выделяя заголовки в слайдах с помощью regular expressions, заменяя повторяющиеся заголовки в соседних слайдах, удаляя ненужные пробелы и переносы строк.
Текст по умолчанию сохраняется в "utf-8". Логи работы скрипта по умолчанию сохраняются в файл logs.