ntnq (Quentin Tardif)

upvoted a collection 5 days ago

Salamandra 🦎

Collection

4 items • Updated 6 days ago • 22

upvoted a paper 5 days ago

Law of the Weakest Link: Cross Capabilities of Large Language Models

Paper • 2409.19951 • Published 7 days ago • 49

upvoted a paper 11 days ago

Molmo and PixMo: Open Weights and Open Data for State-of-the-Art Multimodal Models

Paper • 2409.17146 • Published 11 days ago • 92

upvoted a collection 11 days ago

Llama 3.2

Collection

This collection hosts the transformers and original repos of the Llama 3.2 and Llama Guard 3 • 11 items • Updated 11 days ago • 330

upvoted a collection 12 days ago

LLM Reasoning Papers

Collection

Papers to improve reasoning capabilities of LLMs • 13 items • Updated 12 days ago • 45

upvoted a paper 12 days ago

EuroLLM: Multilingual Language Models for Europe

Paper • 2409.16235 • Published 13 days ago • 18

upvoted a collection about 1 month ago

OLMoE

Collection

Artifacts for open mixture-of-experts language models. • 13 items • Updated 12 days ago • 21

upvoted a paper about 1 month ago

OLMoE: Open Mixture-of-Experts Language Models

Paper • 2409.02060 • Published Sep 3 • 77

upvoted an article about 1 month ago

Article

Synthetic dataset generation techniques: generating custom sentence similarity data

By

•

May 23

• 14

upvoted 3 papers 2 months ago

The Llama 3 Herd of Models

Paper • 2407.21783 • Published Jul 31 • 103

SeaLLMs 3: Open Foundation and Chat Multilingual Large Language Models for Southeast Asian Languages

Paper • 2407.19672 • Published Jul 29 • 54

SaulLM-54B & SaulLM-141B: Scaling Up Domain Adaptation for the Legal Domain

Paper • 2407.19584 • Published Jul 28 • 60

upvoted an article 3 months ago

Article

The Rise of Agentic Data Generation

By

•

Jul 15

• 74

upvoted 2 papers 3 months ago

Qwen2 Technical Report

Paper • 2407.10671 • Published Jul 15 • 154

PaliGemma: A versatile 3B VLM for transfer

Paper • 2407.07726 • Published Jul 10 • 65

upvoted an article 3 months ago

Article

How I train a LoRA: m3lt style training overview

By

•

Jul 1

• 46

upvoted 2 papers 3 months ago

Scaling Synthetic Data Creation with 1,000,000,000 Personas

Paper • 2406.20094 • Published Jun 28 • 94

Judging the Judges: Evaluating Alignment and Vulnerabilities in LLMs-as-Judges

Paper • 2406.12624 • Published Jun 18 • 36

upvoted 3 papers 4 months ago

GLiNER multi-task: Generalist Lightweight Model for Various Information Extraction Tasks

Paper • 2406.12925 • Published Jun 14 • 22

Scaling Laws for Reward Model Overoptimization in Direct Alignment Algorithms

Paper • 2406.02900 • Published Jun 5 • 10

Matryoshka Multimodal Models

Paper • 2405.17430 • Published May 27 • 30

upvoted 4 papers 5 months ago

MS MARCO Web Search: a Large-scale Information-rich Web Dataset with Millions of Real Click Labels

Paper • 2405.07526 • Published May 13 • 16

upvoted 7 papers 6 months ago

Scaling Instructable Agents Across Many Simulated Worlds

Paper • 2404.10179 • Published Mar 13 • 26

Ferret-v2: An Improved Baseline for Referring and Grounding with Large Language Models

Paper • 2404.07973 • Published Apr 11 • 30

JetMoE: Reaching Llama2 Performance with 0.1M Dollars

Paper • 2404.07413 • Published Apr 11 • 36

MiniCPM: Unveiling the Potential of Small Language Models with Scalable Training Strategies

Paper • 2404.06395 • Published Apr 9 • 21

Zephyr: Direct Distillation of LM Alignment

Paper • 2310.16944 • Published Oct 25, 2023 • 120

RewardBench: Evaluating Reward Models for Language Modeling

Paper • 2403.13787 • Published Mar 20 • 19

Jamba: A Hybrid Transformer-Mamba Language Model

Paper • 2403.19887 • Published Mar 28 • 103

upvoted 3 papers 7 months ago

RAFT: Adapting Language Model to Domain Specific RAG

Paper • 2403.10131 • Published Mar 15 • 66

SaulLM-7B: A pioneering Large Language Model for Law

Paper • 2403.03883 • Published Mar 6 • 74

The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits

Paper • 2402.17764 • Published Feb 27 • 592

upvoted a collection 7 months ago

FrenchBench Evaluation datasets

Collection

These datasets are used to evaluate models on French performance using: https://github.com/EleutherAI/lm-evaluation-harness (from CroissantLLM paper) • 11 items • Updated Jun 7 • 4

upvoted 9 papers 8 months ago

DataDreamer: A Tool for Synthetic Data Generation and Reproducible LLM Workflows

Paper • 2402.10379 • Published Feb 16 • 29

In Search of Needles in a 10M Haystack: Recurrent Memory Finds What LLMs Miss

Paper • 2402.10790 • Published Feb 16 • 40

Chain-of-Thought Reasoning Without Prompting

Paper • 2402.10200 • Published Feb 15 • 99

Generative Representational Instruction Tuning

Paper • 2402.09906 • Published Feb 15 • 51

Direct Language Model Alignment from Online AI Feedback

Paper • 2402.04792 • Published Feb 7 • 27

SemScore: Automated Evaluation of Instruction-Tuned LLMs based on Semantic Textual Similarity

Paper • 2401.17072 • Published Jan 30 • 25

CroissantLLM: A Truly Bilingual French-English Language Model

Paper • 2402.00786 • Published Feb 1 • 25

Dolma: an Open Corpus of Three Trillion Tokens for Language Model Pretraining Research

Paper • 2402.00159 • Published Jan 31 • 59

OLMo: Accelerating the Science of Language Models

Paper • 2402.00838 • Published Feb 1 • 79

upvoted 4 papers 9 months ago

Mixtral of Experts

Paper • 2401.04088 • Published Jan 8 • 157

LLaMA Beyond English: An Empirical Study on Language Capability Transfer

Paper • 2401.01055 • Published Jan 2 • 53

Self-Play Fine-Tuning Converts Weak Language Models to Strong Language Models

Paper • 2401.01335 • Published Jan 2 • 64

Improving Text Embeddings with Large Language Models

Paper • 2401.00368 • Published Dec 31, 2023 • 79

upvoted 5 papers 10 months ago

LLM in a flash: Efficient Large Language Model Inference with Limited Memory

Paper • 2312.11514 • Published Dec 12, 2023 • 257

Purple Llama CyberSecEval: A Secure Coding Benchmark for Language Models

Paper • 2312.04724 • Published Dec 7, 2023 • 20

Beyond Surface: Probing LLaMA Across Scales and Layers

Paper • 2312.04333 • Published Dec 7, 2023 • 18

Efficient Monotonic Multihead Attention

Paper • 2312.04515 • Published Dec 7, 2023 • 6

Rank-without-GPT: Building GPT-Independent Listwise Rerankers on Open-Source Large Language Models

Paper • 2312.02969 • Published Dec 5, 2023 • 12

upvoted 5 papers 11 months ago

GAIA: a benchmark for General AI Assistants

Paper • 2311.12983 • Published Nov 21, 2023 • 182

System 2 Attention (is something you might need too)

Paper • 2311.11829 • Published Nov 20, 2023 • 39

Adapting Large Language Models via Reading Comprehension

Paper • 2309.09530 • Published Sep 18, 2023 • 75

Efficient Memory Management for Large Language Model Serving with PagedAttention

Paper • 2309.06180 • Published Sep 12, 2023 • 25

Data-Centric Financial Large Language Models

Paper • 2310.17784 • Published Oct 7, 2023 • 14

upvoted a paper 12 months ago

Self-RAG: Learning to Retrieve, Generate, and Critique through Self-Reflection

Paper • 2310.11511 • Published Oct 17, 2023 • 74

Quentin Tardif

AI & ML interests

Organizations

ntnq's activity

Synthetic dataset generation techniques: generating custom sentence similarity data

The Rise of Agentic Data Generation

How I train a LoRA: m3lt style training overview