AswanthCManoj
/

results

Generated from Trainer

Model card Files Files and versions Community

results / adapter_config.json

AswanthCManoj's picture

Training in progress, step 25

213b643 verified 9 months ago

No virus

460 Bytes

	{
	"auto_mapping": null,
	"base_model_name_or_path": "deepseek-ai/deepseek-coder-1.3b-instruct",
	"encoder_dropout": 0.0,
	"encoder_hidden_size": 250,
	"encoder_num_layers": 2,
	"encoder_reparameterization_type": "MLP",
	"inference_mode": true,
	"num_attention_heads": 16,
	"num_layers": 24,
	"num_transformer_submodules": 1,
	"num_virtual_tokens": 50,
	"peft_type": "P_TUNING",
	"revision": null,
	"task_type": "CAUSAL_LM",
	"token_dim": 2048
	}