Spaces:

gpt-99
/

steering-vectors

Sleeping

gpt-99 commited on Oct 18, 2024

Commit

4dae401

verified ·

1 Parent(s): a090ab6

Upload app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,17 +1,23 @@
 import gradio as gr
 import torch
-from transformers import AutoModelForCausalLM, AutoTokenizer
 from einops import einsum
 from tqdm import tqdm
 device = "cuda" if torch.cuda.is_available() else "cpu"
 model_name = 'microsoft/Phi-3-mini-4k-instruct'
 model = AutoModelForCausalLM.from_pretrained(
     model_name,
     device_map=device,
     torch_dtype="auto",
     trust_remote_code=True,
 )
 tokenizer = AutoTokenizer.from_pretrained(model_name)

 import gradio as gr
 import torch
+from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig
 from einops import einsum
 from tqdm import tqdm
 device = "cuda" if torch.cuda.is_available() else "cpu"
 model_name = 'microsoft/Phi-3-mini-4k-instruct'
+quantization_config = BitsAndBytesConfig(
+    load_in_4bit=True,
+    bnb_4bit_compute_dtype=torch.float16
+)
 model = AutoModelForCausalLM.from_pretrained(
     model_name,
     device_map=device,
     torch_dtype="auto",
     trust_remote_code=True,
+    quantization_config=quantization_config,
 )
 tokenizer = AutoTokenizer.from_pretrained(model_name)