DanaHehe's picture

13 6

DanaHehe

DanaHehe

AI & ML interests

None yet

Organizations

None yet

DanaHehe's activity

upvoted 2 papers 3 days ago

PrefixQuant: Static Quantization Beats Dynamic through Prefixed Outliers in LLMs

Paper • 2410.05265 • Published 9 days ago • 29

Data Advisor: Dynamic Data Curation for Safety Alignment of Large Language Models

Paper • 2410.05269 • Published 9 days ago • 3

upvoted 2 papers 22 days ago

B4: Towards Optimal Assessment of Plausible Code Solutions with Plausible Tests

Paper • 2409.08692 • Published Sep 13 • 25

How Do Your Code LLMs Perform? Empowering Code Instruction Tuning with High-Quality Data

Paper • 2409.03810 • Published Sep 5 • 30

upvoted a paper 23 days ago

MiniCPM: Unveiling the Potential of Small Language Models with Scalable Training Strategies

Paper • 2404.06395 • Published Apr 9 • 21

upvoted 2 papers 2 months ago

MatchTime: Towards Automatic Soccer Game Commentary Generation

Paper • 2406.18530 • Published Jun 26 • 12

RAG Foundry: A Framework for Enhancing LLMs for Retrieval Augmented Generation

Paper • 2408.02545 • Published Aug 5 • 32

upvoted an article 4 months ago

Article

Cosmopedia: how to create large-scale synthetic data for pre-training Large Language Models

Mar 20

• 62

upvoted a paper 4 months ago

A Tale of Tails: Model Collapse as a Change of Scaling Laws

Paper • 2402.07043 • Published Feb 10 • 13

upvoted 4 papers 6 months ago

Deciphering the Impact of Pretraining Data on Large Language Models through Machine Unlearning

Paper • 2402.11537 • Published Feb 18 • 1

OpenELM: An Efficient Language Model Family with Open-source Training and Inference Framework

Paper • 2404.14619 • Published Apr 22 • 124

LLM-R2: A Large Language Model Enhanced Rule-based Rewrite System for Boosting Query Efficiency

Paper • 2404.12872 • Published Apr 19 • 11

Phi-3 Technical Report: A Highly Capable Language Model Locally on Your Phone

Paper • 2404.14219 • Published Apr 22 • 251