Spaces:

MedTiouti
/

SandHillRoadPodcast

Runtime error

Med Tiouti commited on Jan 17

Commit

ca90067

•

1 Parent(s): 94bff1a

Setup for runpod

Files changed (2) hide show

app.py CHANGED Viewed

@@ -1,6 +1,7 @@
 import gradio as gr
 # retrievers
 from langchain.chains import RetrievalQA
 import textwrap
 import time
@@ -49,7 +50,7 @@ repetition_penalty = 1.15
 pipe = pipeline(
     task = "text-generation",
-    model = model,
     tokenizer = tokenizer,
     pad_token_id = tokenizer.eos_token_id,
     max_length = max_len,
@@ -136,27 +137,12 @@ def process_llm_response(llm_response):
     ans += "\n Sand Hill Road podcast episodes based on your question : \n" + sources_used
     return ans,sources_used
-def llm_ans(query):
-    start = time.time()
-    llm_response = qa_chain(query)
     ans,sources_used = process_llm_response(llm_response)
-    end = time.time()
-    time_elapsed = int(round(end - start, 0))
-    time_elapsed_str = f'\n\nTime elapsed: {time_elapsed} s'
-    return ans, sources_used ,time_elapsed_str
-def predict(message, history):
-    # output = message # debug mode
-    output = str(llm_ans(message)[0]).replace("\n", "<br/>")
-    return output
-demo = gr.ChatInterface(
-    predict,
-    title = f' Sand Hill Road Podcast Chatbot'
-)
-demo.queue()
-demo.launch(debug=True,share=True)

 import gradio as gr
 # retrievers
 from langchain.chains import RetrievalQA
+import runpod
 import textwrap
 import time
 pipe = pipeline(
     task = "text-generation",
+    model = "daryl149/llama-2-13b-chat-hf",
     tokenizer = tokenizer,
     pad_token_id = tokenizer.eos_token_id,
     max_length = max_len,
     ans += "\n Sand Hill Road podcast episodes based on your question : \n" + sources_used
     return ans,sources_used
+def text_generation(job):
+    llm_response = qa_chain(job_input = job["prompt"])
     ans,sources_used = process_llm_response(llm_response)
+    return str(ans).replace("\n", "<br/>")
+runpod.serverless.start({"handler": text_generation})

requirements.txt CHANGED Viewed

@@ -6,4 +6,5 @@ sentence_transformers
 accelerate
 bitsandbytes
 xformers
 einops

 accelerate
 bitsandbytes
 xformers
+runpod
 einops