Descripton:

This is ruadapt version of upstage/SOLAR-10.7B-v1.0 model with tokenizer replacement. Additionally to previous work, the model was adapted in two stages: 1) vocabulary optimization, and 2) additional attention fine-tuning using LoRa.

How to cite:

Tikhomirov M., Chernyshev D. Impact of Tokenization on LLaMa Russian Adaptation //arXiv preprint arXiv:2312.02598. – 2023.

Downloads last month: 21

Safetensors

Model size

10.7B params

Tensor type

FP16

Inference Examples

Text Generation

Inference API (serverless) is not available, repository is disabled.

Model tree for msu-rcc-lair/ruadapt_solar_10.7_darulm_unigram_proj_init_twostage_v1

Finetunes

1 model

msu-rcc-lair
/

ruadapt_solar_10.7_darulm_unigram_proj_init_twostage_v1

Descripton:

How to cite:

Model tree for msu-rcc-lair/ruadapt_solar_10.7_darulm_unigram_proj_init_twostage_v1

Spaces using msu-rcc-lair/ruadapt_solar_10.7_darulm_unigram_proj_init_twostage_v1 3