10085 6 166

Tien Dung PRO

tiendung

tiendung

AI & ML interests

None yet

Articles

Ưu tiên có thể diễn giải thông qua Mô hình Phần thưởng Đa mục tiêu và Hỗn hợp Chuyên gia

5 days ago

• 1

Bài học đắng trong AI

5 days ago

• 1

Organizations

Posts 1

Post

1098

ICML 2024 Tutorial: Physics of Language Models
https://www.youtube.com/watch?v=yBL7J0kgldU
Physics of Language Models: Part 3.1, Knowledge Storage and Extraction (2309.14316)

Series bài nói về việc hiểu cách LLM hoạt động. Rất thú vị, họ làm thí nghiệm kiểm soát 100% cách huấn luyện model và phát hiện rằng nếu pretrain không chứa dạng dữ liệu extraction (QA instruction, hoặc các dạng dữ liệu mà tác giả gọi là knowledge augmentation) thì mặc dù có qua instruct finetune thì LLM cũng không thể học skill knowledge extraction. => đặt lại câu hỏi liệu cách pretrain rồi mới SFT như hiện tại đã thực sự tốt chưa?

Họ đã thử vài trăm thí nghiệm với các loại kiến trúc mô hình, độ to nhỏ, ... và đều ra kết quả như nhau.

KNOWLEDGE AUGMENTATION (data augmentation)
Nếu bạn không mix instruct data với pre-train data (mix training) tốt nhất hãy áp dụng knowledge augmentation. Tức là cùng một câu đó nhưng diễn tả lại bằng nhiều cách khác nhau.

KNOWLEDGE MANIPULATION
ví dụ giả sử đã biết (đc huấn luyện) tiểu sử của A (bao gồm ngày tháng năm sinh) và hỏi A sinh tháng chẵn hay lẻ (50% cơ hội trả lời đúng). Nếu không sử dụng CoT (gợi nhớ lại kiến thức, xem A sinh tháng mấy) thì kết quả là model không làm được. => CoT (gợi nhớ kiến thức đã học) rất quan trọng với knowledge manipulation (phân loại, so sánh, xếp hạng ...)

Collections 2

models 15

datasets 3

tiendung/cc-vi_truyen-filters

Updated Oct 3, 2023 • 1

tiendung/cc-vi_domains

Updated Sep 21, 2023 • 1

tiendung/chai

Viewer • Updated Sep 15, 2023 • 70.8k • 4

Tien Dung PRO

AI & ML interests

Articles

Ưu tiên có thể diễn giải thông qua Mô hình Phần thưởng Đa mục tiêu và Hỗn hợp Chuyên gia

Bài học đắng trong AI

Organizations

Posts 1

Collections 2

arcee-ai/The-Tome

migtissera/Synthia-v1.5-I

Gryphe/ChatGPT-4o-Writing-Prompts

PawanKrd/gpt-4o-200k

cfli/pretrain_wiki

cfli/bge-full-data

models 15

tiendung/bge-reranking-m3_bf16

tiendung/bge-embedding-m3_bf16

tiendung/gemma2embedding

tiendung/gemma1reranking

tiendung/gemma2reranking

tiendung/cc-vi_segdedup

tiendung/pygmalion-6b-20-percent-soda_2e_merged

tiendung/open_llama_3b-8k_visyll

tiendung/tiny_starcoder_py-vi06

tiendung/c4_vi_filtered

datasets 3

tiendung/cc-vi_truyen-filters

tiendung/cc-vi_domains

tiendung/chai

Tien Dung PRO

AI & ML interests

Articles

Ưu tiên có thể diễn giải thông qua Mô hình Phần thưởng Đa mục tiêu và Hỗn hợp Chuyên gia

Bài học đắng trong AI

Organizations

Posts 1

Collections 2

models 15 Sort: Recently updated

datasets 3 Sort: Recently updated

models 15

datasets 3