whisper.cpp で音声ファイルを日本語テキストへ自動文字起こし

OSS whisper.cpp で音声ファイルを日本語テキストへ自動文字起こした話をご紹介します。

事前準備 16kHz の .wav ファイルを準備

ffmpeg -i input.m4a -ar 16000 output_16khz.wav

whisper.cpp をダウンロード

git clone https://github.com/ggerganov/whisper.cpp.git  
cd whisper.cpp

Whisper モデルをダウンロード

bash ./models/download-ggml-model.sh large

build

make

WAV ファイルから音声を文字書き起こし

./main -m models/ggml-large.bin -f output_16khz.wav -l ja

以上、whisper.cpp で音声ファイルを日本語テキストへ自動文字起こした、現場からお送りしました。