音響モデル作成しようとして、できなかった話

前の以下の記事でopen-jtalkの使い方がわかったので、次は音響モデルを作成しようとしました。 以下に流れを記載します!

音声合成ツールを探して、使ってみた話 - moamoa diary

参考

  1. https://www.jstage.jst.go.jp/article/isciesci/62/2/62_57/_pdf
  2. Compiling HTK 3.4 on Mac OS 10.5 | SpeechTechie
# パッケージのダウンロードと解凍
wget http://hts.sp.nitech.ac.jp/archives/2.3/HTS-2.3_for_HTK-3.4.1.tar.bz2
tar jxvf HTS-2.3_for_HTK-3.4.1.tar.bz2

wget http://hts.sp.nitech.ac.jp/archives/2.3/HTS-demo_NIT-ATR503-M001.tar.bz2
tar jxvf HTS-demo_NIT-ATR503-M001.tar.bz2
cd htk
patch -d . -p1 く ../HTS-2.3_for_HTK-3.4.1.patch
chmod +x configure
./configure --without-x -prefix=/Users/toro/local
make all
make install
cd ..
# SPTKのコンパイルとインストール
cd SPTK-3.9
./configure -prefix=/Users/toro/local
make all
make install
exit
# 5.学習スクリプトを実行
cd ./HTS-demo_NIT-ATR503-M001/
# cp -f $directoryincludeyouraudiofiles/*.raw/HTS-demoNIT-ATR503-M001/data/raw/
# rm-f./HTS-demoNIT-ATR503-M001/data/raw/*.raw
#4. ユーザ自身の収録音声をコピー

# /usr/local/bin\
./configure --with-sptk-search-path=/Users/toro/local/bin/ \
  -with-hts-engine-search-path=/Users/toro/local/bin/ \
  -with-hts-search-path=/Users/toro/local/bin/

make

--> ここで音響モデルが作成されるはずなんです。 が、なぜか私の環境では作成されませんでした、、 HTS-demo_NIT-ATR503-M001/logを見てみると以下のように何かエラーが出ていることがわかりました。 しかしまっかくわかりません、、ということでここで力尽きました、、

 HMM Def Error: <BeginHMM> symbol expected at line 1/col 1/char 0 in HTS-demo_NIT-ATR503-M001/models/qst001/ver1/cmp/HRest/I
   ERROR [+7050]  HMError:
   ERROR [+7032]  LoadHMMSet: GetHMMDef failed
   ERROR [+2628]  Initialise: LoadHMMSet failed

結論

音響モデルを作成しようとするもうまくできず、、

おまけ: rawファイルをwav化して音声を聞く方法

参考: Raw形式をWav形式にする・Wav形式をRaw形式にする

brew install sox
sox -r 16000 -c 1 -w -s "input.raw" "output.wav"
sox "input.wav" "output.raw"

サンプル音声の再生方法: あらゆる現実を全て自分の方へねじ曲げたのだ

sox -t raw -c 1 -r 44100 -b 16 -e signed-integer "HTS-demo_NIT-ATR503-M001/data/raw/nitech_jp_atr503_m001_a01.raw" "output.wav"
afplay output.wav