Edit model card

You need to agree to share your contact information to access this model

This repository is publicly accessible, but you have to accept the conditions to access its files and content.

Log in or Sign Up to review the conditions and access this model content.

asadfgglie/banban-beta-v0

AI VTuber板板模型。

目標是打造屬於NTNU VLSI的專屬AI VT!

目前僅開放給NTNU VLSI社員。如果你是社員,並想要取得本模型的權重,請至Discord聯繫我。

Model Description

Uses

接觸板板,理解板板,成為板板

主要用於聊天與VT直播用,但目前能力僅供聊天用

Direct Use

你可以直接拿來當普通的AI助手來用,嗯,帶點食品偏好鳳梨狂熱的助手

Out-of-Scope Use

關於一些政治類問題我不建議你去問板板,主要原因是基底模型Llama3本身就被訓練會避開這些問題回答。

Bias, Risks, and Limitations

板板是一名狂熱的鳳梨披薩支持者,從現在是,以後未來也是。這是直接寫在訓練集與prompt中的設定,屬於刻在DNA裡的印記,是神聖不可分割的一部分!

Recommendations

你必須接受鳳梨披薩才能理解板板

How to Get Started with the Model

對於不會寫程式,只想嘗鮮的新手們,我的建議是LM Studio,這個免費的專案可以很方便地幫你搞定一切麻煩的設定,只是沒辦法使用自定義名稱,因此可能會無法體驗到最佳的對話效果

(主要是因為這東西還沒把內部的對話紀錄儲存格式更新到與openAI最新版API相同的模樣,最新版的openAI API已經支援定義每個message的作者名稱設定了,llama3本身也設計過prompt格式,也有限度的支援自定義作者名稱)

如果你選擇使用oobabooga/text-generation-webui來做為你的推理平台,請等text-generation-webui的作者更新他的transformers依賴到新版本。因為本模型所使用的架構似乎不存在於當下所依賴的版本。如果你發現有依賴了請聯繫我,我會在更新此文檔。

Technical Specifications

Model Architecture and Objective

LlavaForConditionalGeneration, turn base model into llama3

Compute Infrastructure

Hardware

CPU: Intel(R) Core(TM) i5-14400 GPU: NVIDIA GeForce RTX 4060 Ti 16G RAM: 32G

(若VRAM小於等於16G,請使用load_in_8bitload_in_4bit載入,否則基本上會OOM)

Software

感謝偉大的hiyouga/LLaMA-Factory讓我省下了大把稿基建的時間

Downloads last month
0
Safetensors
Model size
8.36B params
Tensor type
FP16
·
Inference API
Inference API (serverless) does not yet support transformers models for this pipeline type.

Dataset used to train asadfgglie/banban-beta-v0

Collection including asadfgglie/banban-beta-v0