Spaces:

shionhonda
/

reviewer2-bot

Sleeping

shionhonda commited on Apr 21

Commit

9947362

•

1 Parent(s): 89f2f05

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -7,17 +7,18 @@ st.header("Reviewer #2 Bot")
 title = st.text_input("Title : ")
 submit = st.button("Submit")
 model = AutoModelForCausalLM.from_pretrained("TinyLlama/TinyLlama-1.1B-Chat-v1.0")
 model = PeftModel.from_pretrained(model, "shionhonda/tiny-llama-reviewer2-1.1B-dpo-lora")
-tokenizer = AutoTokenizer.from_pretrained("TinyLlama/TinyLlama-1.1B-Chat-v1.0")
 prompt = tokenizer.apply_chat_template([
         {"role": "system", "content": "You are an experienced researcher and a reviewer of scientific papers. Given a title of the paper, write a review about it in one sentence."},
         {"role": "user", "content": title}
     ], tokenize=False, add_generation_prompt=True)
 inputs = tokenizer(prompt, return_tensors="pt")
-generate_ids = model.generate(inputs.input_ids, max_new_tokens=50, do_sample=True, temperature=0.5, top_k=50, top_p=0.95)
 if submit:
     st.subheader("Reviewer #2:")
-    st.write(tokenizer.batch_decode(generate_ids, skip_special_tokens=True, clean_up_tokenization_spaces=False)[0])

 title = st.text_input("Title : ")
 submit = st.button("Submit")
+tokenizer = AutoTokenizer.from_pretrained("TinyLlama/TinyLlama-1.1B-Chat-v1.0")
 model = AutoModelForCausalLM.from_pretrained("TinyLlama/TinyLlama-1.1B-Chat-v1.0")
 model = PeftModel.from_pretrained(model, "shionhonda/tiny-llama-reviewer2-1.1B-dpo-lora")
 prompt = tokenizer.apply_chat_template([
         {"role": "system", "content": "You are an experienced researcher and a reviewer of scientific papers. Given a title of the paper, write a review about it in one sentence."},
         {"role": "user", "content": title}
     ], tokenize=False, add_generation_prompt=True)
 inputs = tokenizer(prompt, return_tensors="pt")
+generate_ids = model.generate(inputs.input_ids, max_new_tokens=64, do_sample=True, temperature=0.5, top_k=50, top_p=0.95)
 if submit:
     st.subheader("Reviewer #2:")
+    output = tokenizer.batch_decode(generate_ids, skip_special_tokens=True, clean_up_tokenization_spaces=False)[0]
+    st.write(output.split("<|assistant|>")[-1])