ghost613
/

whisper-large-v3-turbo-korean

Automatic Speech Recognition

Model card Files Files and versions Metrics Training metrics Community

whisper-large-v3-turbo-korean / README.md

ghost613's picture

Update README.md

afa3ec6 verified 10 days ago

|

654 Bytes

metadata

datasets:
  - Bingsu/zeroth-korean
language:
  - ko
metrics:
  - cer
  - wer
base_model:
  - openai/whisper-large-v3-turbo
pipeline_tag: automatic-speech-recognition

Description

Fine-tuning Whisper Large V3 Turbo on zeroth Korean dataset.

Dataset split:

The test dataset from Korean zeroth is divided to test and validation -> 50% validation, 50% test
Train set duration: 206 hours 43 minutes
Validation set duration: 2 hours 22 minutes
Test set duration: 2 hours 22 minutes

Results:

validation WER: 4.90%
validation CER: 1.78%
test WER: 4.89%
test CER: 2.06%

Notes

Models did not converge, better results are possible.