Spaces:

AnishHF
/

Mistral-7B

Runtime error

AnishHF commited on Jun 8

Commit

3eb757e

•

1 Parent(s): da2c202

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -2,15 +2,11 @@ import os
 import bitsandbytes as bnb
 import torch
 import gradio as gr
-from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig
 access_token = os.environ["GATED_ACCESS_TOKEN"]
-quantization_config = BitsAndBytesConfig(
-        load_in_4bit=True,
-        bnb_4bit_quant_type="nf4",
-        bnb_4bit_compute_dtype="float16",
-)
 model = AutoModelForCausalLM.from_pretrained("mistralai/Mistral-7B-v0.1", quantization_config=quantization_config, device_map="auto", token=access_token)
 tokenizer = AutoTokenizer.from_pretrained("mistralai/Mistral-7B-v0.1")

 import bitsandbytes as bnb
 import torch
 import gradio as gr
+from transformers import AutoTokenizer, AutoModelForCausalLM, HqqConfig
 access_token = os.environ["GATED_ACCESS_TOKEN"]
+quantization_config = HqqConfig()
 model = AutoModelForCausalLM.from_pretrained("mistralai/Mistral-7B-v0.1", quantization_config=quantization_config, device_map="auto", token=access_token)
 tokenizer = AutoTokenizer.from_pretrained("mistralai/Mistral-7B-v0.1")