Spaces:

X-Pipe
/

flash

Sleeping

App Files Files Community

NickNYU commited on Jun 25, 2023

Commit

45b3942

•

1 Parent(s): b5d3f34

Update app.py

Browse files

Files changed (1) hide show

app.py +59 -34

app.py CHANGED Viewed

@@ -1,13 +1,11 @@
-import os
-from llama_index import SimpleDirectoryReader
-from llama_index.node_parser import SimpleNodeParser
-from llama_index.data_structs.node import Node, DocumentRelationship
-from llama_index import VectorStoreIndex
-from llama_index import LLMPredictor, VectorStoreIndex, ServiceContext
 from langchain.llms import AzureOpenAI
 from langchain.embeddings.openai import OpenAIEmbeddings
-from llama_index import LangchainEmbedding, ServiceContext
-from llama_index import StorageContext, load_index_from_storage
 import logging
 import sys
@@ -18,24 +16,32 @@ logging.basicConfig(
 )  # logging.DEBUG for more verbose output
 logging.getLogger().addHandler(logging.StreamHandler(stream=sys.stdout))
-def main() -> None:
-    documents = SimpleDirectoryReader("./data").load_data()
-    # index = VectorStoreIndex.from_documents(documents)
-    # parser = SimpleNodeParser()
-    # nodes = parser.get_nodes_from_documents(documents)
-    # index = VectorStoreIndex(nodes)
     # define embedding
     embedding = LangchainEmbedding(OpenAIEmbeddings(client=None, chunk_size=1))
     # define LLM
     llm_predictor = LLMPredictor(
         llm=AzureOpenAI(
-            client=None,
             deployment_name="text-davinci-003",
             model="text-davinci-003",
         )
     )
@@ -43,26 +49,45 @@ def main() -> None:
     service_context = ServiceContext.from_defaults(
         llm_predictor=llm_predictor, embed_model=embedding
     )
-    # build index
-    index = VectorStoreIndex.from_documents(
-        documents,
-        service_context=service_context,
-    )
-    index.storage_context.persist(persist_dir="./dataset")
-    storage_context = StorageContext.from_defaults(persist_dir="./dataset")
-    index = load_index_from_storage(
-        storage_context=storage_context, service_context=service_context
-    )
-    # index.vector_store.persist("./dataset")
-    # query with embed_model specified
-    query_engine = index.as_query_engine(
-        retriever_mode="embedding", verbose=True, service_context=service_context
-    )
-    response = query_engine.query("请帮忙推荐一杯咖啡给我，我喜欢咖啡因")
-    print(response)
 if __name__ == "__main__":

+from llama_hub.github_repo import GithubRepositoryReader, GithubClient
+from llama_index import download_loader, GPTVectorStoreIndex
+from llama_index import LLMPredictor, ServiceContext, LangchainEmbedding
 from langchain.llms import AzureOpenAI
 from langchain.embeddings.openai import OpenAIEmbeddings
+import os
+import pickle
+import streamlit as st
 import logging
 import sys
 )  # logging.DEBUG for more verbose output
 logging.getLogger().addHandler(logging.StreamHandler(stream=sys.stdout))
+# Sidebar contents
+with st.sidebar:
+    st.title("🤗💬 LLM Chat App")
+    st.markdown(
+        """
+    ## About
+    This app is an LLM-powered chatbot built using:
+    - [Streamlit](https://streamlit.io/)
+    - [LangChain](https://python.langchain.com/)
+    - [X-Pipe](https://github.com/ctripcorp/x-pipe)
+    """
+    )
+    # add_vertical_space(5)
+    st.write("Made by Nick")
+def main() -> None:
+    st.header("X-Pipe Wiki 机器人 💬")
     # define embedding
     embedding = LangchainEmbedding(OpenAIEmbeddings(client=None, chunk_size=1))
     # define LLM
     llm_predictor = LLMPredictor(
         llm=AzureOpenAI(
             deployment_name="text-davinci-003",
             model="text-davinci-003",
+            client=None,
         )
     )
     service_context = ServiceContext.from_defaults(
         llm_predictor=llm_predictor, embed_model=embedding
     )
+    download_loader("GithubRepositoryReader")
+    docs = None
+    if os.path.exists("docs/docs.pkl"):
+        with open("docs/docs.pkl", "rb") as f:
+            docs = pickle.load(f)
+    if docs is None:
+        github_client = GithubClient(os.getenv("GITHUB_TOKEN"))
+        loader = GithubRepositoryReader(
+            github_client,
+            owner="ctripcorp",
+            repo="x-pipe",
+            filter_directories=(
+                [".", "doc"],
+                GithubRepositoryReader.FilterType.INCLUDE,
+            ),
+            filter_file_extensions=([".md"], GithubRepositoryReader.FilterType.INCLUDE),
+            verbose=True,
+            concurrent_requests=10,
+        )
+        docs = loader.load_data(branch="master")
+        with open("docs/docs.pkl", "wb") as f:
+            pickle.dump(docs, f)
+    index = GPTVectorStoreIndex.from_documents(docs, service_context=service_context)
+    query_engine = index.as_query_engine(service_context=service_context)
+    query = st.text_input("X-Pipe Wiki 问题:")
+    if query:
+        index = GPTVectorStoreIndex.from_documents(
+            docs, service_context=service_context
+        )
+        query_engine = index.as_query_engine(service_context=service_context)
+        response = query_engine.query(query)
+        st.write(response)
 if __name__ == "__main__":