VN_laws_qa / README.txt
wanderer2k1's picture
f
9833a80
raw
history blame
No virus
1.82 kB
#Setup
1. Cài Python 3.9.13: https://www.python.org/ftp/python/3.9.13/python-3.9.13-amd64.exe
Lưu ý: khi install lưu ý tick chọn "Add Python 3.9 to PATH".
2. Mở command line dẫn đến thư mục này, nhập:
python -m venv venv
venv/Scripts/activate
python -m pip install -r requirements.txt
3. Tải file dữ liệu về từ link: https://drive.google.com/file/d/1s2-Yi1R8pEgGOPNwbJEsSY-Ltum1UNLH/view?usp=sharing
Giải nén file ở thư mục này, tên thư mục sau giải nén là "data". Lưu ý: các file dữ liệu ở ngay trong thư mục data, tránh sau khi giải nén thêm folder data bên trong folder data.
4. Tải file models về từ link: https://drive.google.com/file/d/1aHBXKINBuLEDLPYF-GMUTwQBDDF-FNSj/view?usp=sharing
Giải nén file ở thư mục này, tên thư mục sau giải nén là "models".
5. để chạy chương trình, mở command line dẫn đến thư mục này, nhập:
venv/Scripts/activate
streamlit run streamlit/main.py
* Lưu ý: lần đầu query đầu, hệ thống sẽ tải các models về từ repo cá nhân, dung lượng khoảng 3GB nên mất nhiều thời gian.
# Cấu trúc thư mục:
.
|
|_Notebooks: Các .ipynb notebooks đã xử lý dữ liệu, huấn luyện mô hình và đánh giá mô hình. Đã chạy trên Google colab.
||_Prepare_data: Các .ipynb notebook xử lý dữ liệu cho huấn luyện và đánh giá mô hình.
||_Training: Các .ipynb notebook huấn luyện mô hình.
||_Evaluation: Các .ipynb notebook đánh giá mô hình.
|
|_src: Script python chứa hàm chạy chương trình.
|
|_streamlit: Chứa script chạy webapp, file css style webapp, các lớp liên quan đến web app.
|
|_requirements.txt: file chứa các thư viện python cần cài đặt.
|
|_README.txt