Spaces:

CoderCowMoo
/

Llama-3-70b-Instruct-Orthoganalized

Runtime error

CoderCowMoo commited on May 5, 2024

Commit

267b4cd

verified ·

1 Parent(s): 4f77518

llama 3 dumbass

Files changed (1) hide show

app.py CHANGED Viewed

@@ -12,9 +12,9 @@ from threading import Thread
 import einops
-tokenizer = AutoTokenizer.from_pretrained("NousResearch/Meta-LLaMA-70B-Instruct")
 quantization_config = BitsAndBytesConfig(load_in_4_bit=True)
-model = AutoModelForCausalLM.from_pretrained("NousResearch/Meta-LLaMA-70B-Instruct", quantization_config, device_map="cuda" ).eval()
 @spaces.GPU

 import einops
+tokenizer = AutoTokenizer.from_pretrained("NousResearch/Meta-LLaMA-3-70B-Instruct")
 quantization_config = BitsAndBytesConfig(load_in_4_bit=True)
+model = AutoModelForCausalLM.from_pretrained("NousResearch/Meta-LLaMA-3-70B-Instruct", quantization_config, device_map="cuda" ).eval()
 @spaces.GPU