音響モデル作成しようとして、できなかった話
前の以下の記事でopen-jtalkの使い方がわかったので、次は音響モデルを作成しようとしました。 以下に流れを記載します!
音声合成ツールを探して、使ってみた話 - moamoa diary
参考
- https://www.jstage.jst.go.jp/article/isciesci/62/2/62_57/_pdf
- Compiling HTK 3.4 on Mac OS 10.5 | SpeechTechie
# パッケージのダウンロードと解凍 wget http://hts.sp.nitech.ac.jp/archives/2.3/HTS-2.3_for_HTK-3.4.1.tar.bz2 tar jxvf HTS-2.3_for_HTK-3.4.1.tar.bz2 wget http://hts.sp.nitech.ac.jp/archives/2.3/HTS-demo_NIT-ATR503-M001.tar.bz2 tar jxvf HTS-demo_NIT-ATR503-M001.tar.bz2
cd htk patch -d . -p1 く ../HTS-2.3_for_HTK-3.4.1.patch chmod +x configure ./configure --without-x -prefix=/Users/toro/local make all make install cd ..
# SPTKのコンパイルとインストール cd SPTK-3.9 ./configure -prefix=/Users/toro/local make all make install exit
# 5.学習スクリプトを実行 cd ./HTS-demo_NIT-ATR503-M001/ # cp -f $directoryincludeyouraudiofiles/*.raw/HTS-demoNIT-ATR503-M001/data/raw/ # rm-f./HTS-demoNIT-ATR503-M001/data/raw/*.raw #4. ユーザ自身の収録音声をコピー # /usr/local/bin\ ./configure --with-sptk-search-path=/Users/toro/local/bin/ \ -with-hts-engine-search-path=/Users/toro/local/bin/ \ -with-hts-search-path=/Users/toro/local/bin/ make
--> ここで音響モデルが作成されるはずなんです。 が、なぜか私の環境では作成されませんでした、、 HTS-demo_NIT-ATR503-M001/logを見てみると以下のように何かエラーが出ていることがわかりました。 しかしまっかくわかりません、、ということでここで力尽きました、、
HMM Def Error: <BeginHMM> symbol expected at line 1/col 1/char 0 in HTS-demo_NIT-ATR503-M001/models/qst001/ver1/cmp/HRest/I ERROR [+7050] HMError: ERROR [+7032] LoadHMMSet: GetHMMDef failed ERROR [+2628] Initialise: LoadHMMSet failed
結論
音響モデルを作成しようとするもうまくできず、、
おまけ: rawファイルをwav化して音声を聞く方法
参考: Raw形式をWav形式にする・Wav形式をRaw形式にする
brew install sox sox -r 16000 -c 1 -w -s "input.raw" "output.wav" sox "input.wav" "output.raw"
サンプル音声の再生方法: あらゆる現実を全て自分の方へねじ曲げたのだ
sox -t raw -c 1 -r 44100 -b 16 -e signed-integer "HTS-demo_NIT-ATR503-M001/data/raw/nitech_jp_atr503_m001_a01.raw" "output.wav" afplay output.wav