SiX Web Scraper adalah proyek untuk mengambil data dari Sistem Informasi Akademik SiX milik ITB. Proyek ini fokus pada pengambilan data mata kuliah, kelas mata kuliah, jadwal, dan informasi terkait dari halaman jadwal kuliah pada menu kelas SiX.
Perhatian: Proyek ini adalah upaya untuk mengambil data dari Sistem Informasi Akademik SiX yang dimiliki oleh Institut Teknologi Bandung (ITB). Data yang diperoleh melalui proyek ini sepenuhnya dimiliki oleh ITB dan digunakan dengan tujuan non-komersial dan pendidikan. Pembuat proyek tidak memiliki kepemilikan atau klaim atas data yang diambil melalui scraping.
Pastikan Anda telah menginstal semua prasyarat yang tercantum dalam file requirements.txt
sebelum menjalankan proyek ini.
pip install -r requirements.txt
Berikut adalah langkah-langkah untuk menjalankan proyek SiX Web Scraper:
-
Ubah nama file
.env.example
menjadi.env
. -
Isi semua variabel yang diperlukan dalam file
.env
sesuai dengan konfigurasi Anda. -
Pastikan Anda memiliki
COOKIES_KHONGGUAN
, yang dapat ditemukan dengan cara berikut:- Buka halaman SiX di peramban web.
- Lakukan inspect element pada laman tersebut.
- Pergi ke tab Application (Aplikasi) atau Storage (Penyimpanan) di inspect element.
- Temukan cookies yang memiliki nama
khongguan
.
-
Pastikan server PostgreSQL sudah berjalan dan Anda memiliki database yang sesuai dengan konfigurasi yang diisi di dalam file
.env
. -
Jalankan web scraper dengan menggunakan perintah berikut:
python3 scraper.py
or
python scraper.py
Sesuaikan perintah dengan lingkungan lokal Anda.