ghost613
/

whisper-large-v3-turbo-korean

Automatic Speech Recognition

Model card Files Files and versions Metrics Training metrics Community

whisper-large-v3-turbo-korean / README.md

ghost613's picture

Update README.md

afa3ec6 verified 10 days ago

|

654 Bytes

	---
	datasets:
	- Bingsu/zeroth-korean
	language:
	- ko
	metrics:
	- cer
	- wer
	base_model:
	- openai/whisper-large-v3-turbo
	pipeline_tag: automatic-speech-recognition
	---

	## Description
	Fine-tuning Whisper Large V3 Turbo on zeroth Korean dataset.

	## Dataset split:
	- The test dataset from Korean zeroth is divided to test and validation -> 50% validation, 50% test
	- Train set duration: 206 hours 43 minutes
	- Validation set duration: 2 hours 22 minutes
	- Test set duration: 2 hours 22 minutes

	## Results:
	- validation WER: 4.90%
	- validation CER: 1.78%
	- test WER: 4.89%
	- test CER: 2.06%

	## Notes
	- Models did not converge, better results are possible.