UW-SBEL-ChronoPhi3-4b-it

Runtime error

App Files Files Community

artificialguybr commited on Sep 1

Commit

48b916e

•

1 Parent(s): 95bc271

Update app.py

Browse files

Files changed (1) hide show

app.py +13 -3

app.py CHANGED Viewed

@@ -36,7 +36,7 @@ model = model.eval()
 @spaces.GPU()
 def stream_chat(
-    message: str,
     history: list,
     system_prompt: str,
     temperature: float = 0.5,
@@ -44,15 +44,19 @@ def stream_chat(
     top_p: float = 1.0,
     top_k: int = 50,
 ):
     full_prompt = f"<<SYS>>\n{system_prompt}\n<</SYS>>\n\n"
     for prompt, answer in history:
         full_prompt += f"[INST]{prompt}[/INST]{answer}"
     full_prompt += f"[INST]{message}[/INST]"
     inputs = tokenizer(full_prompt, truncation=False, return_tensors="pt").to(device)
     streamer = TextIteratorStreamer(tokenizer, timeout=60.0, skip_prompt=True, skip_special_tokens=True)
     generate_kwargs = dict(
         inputs=inputs.input_ids,
         max_new_tokens=max_new_tokens,
@@ -81,10 +85,12 @@ with gr.Blocks(css=CSS, theme="soft") as demo:
         fn=stream_chat,
         chatbot=chatbot,
         fill_height=True,
         additional_inputs=[
             gr.Textbox(
                 value="You are a helpful assistant capable of generating long-form content.",
                 label="System Prompt",
             ),
             gr.Slider(
                 minimum=0,
@@ -92,6 +98,7 @@ with gr.Blocks(css=CSS, theme="soft") as demo:
                 step=0.1,
                 value=0.5,
                 label="Temperature",
             ),
             gr.Slider(
                 minimum=1024,
@@ -99,6 +106,7 @@ with gr.Blocks(css=CSS, theme="soft") as demo:
                 step=1024,
                 value=32768,
                 label="Max new tokens",
             ),
             gr.Slider(
                 minimum=0.0,
@@ -106,6 +114,7 @@ with gr.Blocks(css=CSS, theme="soft") as demo:
                 step=0.1,
                 value=1.0,
                 label="Top p",
             ),
             gr.Slider(
                 minimum=1,
@@ -113,6 +122,7 @@ with gr.Blocks(css=CSS, theme="soft") as demo:
                 step=1,
                 value=50,
                 label="Top k",
             ),
         ],
         examples=[

 @spaces.GPU()
 def stream_chat(
+    message: str,
     history: list,
     system_prompt: str,
     temperature: float = 0.5,
     top_p: float = 1.0,
     top_k: int = 50,
 ):
+    print(f'message: {message}')
+    print(f'history: {history}')
     full_prompt = f"<<SYS>>\n{system_prompt}\n<</SYS>>\n\n"
     for prompt, answer in history:
         full_prompt += f"[INST]{prompt}[/INST]{answer}"
     full_prompt += f"[INST]{message}[/INST]"
     inputs = tokenizer(full_prompt, truncation=False, return_tensors="pt").to(device)
+    context_length = inputs.input_ids.shape[-1]
     streamer = TextIteratorStreamer(tokenizer, timeout=60.0, skip_prompt=True, skip_special_tokens=True)
     generate_kwargs = dict(
         inputs=inputs.input_ids,
         max_new_tokens=max_new_tokens,
         fn=stream_chat,
         chatbot=chatbot,
         fill_height=True,
+        additional_inputs_accordion=gr.Accordion(label="⚙️ Parameters", open=False, render=False),
         additional_inputs=[
             gr.Textbox(
                 value="You are a helpful assistant capable of generating long-form content.",
                 label="System Prompt",
+                render=False,
             ),
             gr.Slider(
                 minimum=0,
                 step=0.1,
                 value=0.5,
                 label="Temperature",
+                render=False,
             ),
             gr.Slider(
                 minimum=1024,
                 step=1024,
                 value=32768,
                 label="Max new tokens",
+                render=False,
             ),
             gr.Slider(
                 minimum=0.0,
                 step=0.1,
                 value=1.0,
                 label="Top p",
+                render=False,
             ),
             gr.Slider(
                 minimum=1,
                 step=1,
                 value=50,
                 label="Top k",
+                render=False,
             ),
         ],
         examples=[