試験運用中なLinux備忘録・旧記事

はてなダイアリーで公開していた2007年5月-2015年3月の記事を保存しています。

日本語の文字列をオーディオデータに変換するOpen JTalkについての追加メモ(2014年1月時点)

新しいバージョン

2013年の年末に

  • hts_engine API
  • Open JTalk
  • MMDAgent "Sample Script"

のバージョンが上がっており、(これまで旧形式でしか利用できなかった)「Mei」の声データについても今回の「MMDAgent "Sample Script"」の新バージョンからOpen JTalk1.06以上/hts_engine API 1.07以上で使われる「.htsvoice」形式のものとなっており、最新のOpen JTalkから利用できるようになっている。

Ubuntu向けパッケージを更新

PPAリポジトリppa:kakurasan/unstable」でOpen JTalk関係のソフトウェアやデータの最新バージョンをUbuntu 13.10向けに公開している。今回は「Mei」の声データ以外はDebianのパッケージをもとにしており、ソースパッケージのdebianディレクトリ以下はDebianのパッケージ(GPL 2以降のライセンス)の改変となる。「Mei」の声データのパッケージの同ディレクトリ以下は自作で、こちらはパブリックドメインとする。

パッケージ名説明アーキテクチャ依存/非依存の種別
libhtsengine1hts_engine APIの共有オブジェクト(Debian/Ubuntuのパッケージのhts_engineコマンドやopen_jtalkコマンドで使用される)依存
libhtsengine-devhts_engine APIを用いたプログラムをビルドする場合に使用
htsenginehts_engineコマンド
open-jtalkopen_jtalkコマンド
open-jtalk-mecab-naist-jdicOpen JTalkで用いられる辞書データ非依存
hts-voice-nitech-jp-atr503-m001「nitech-jp-atr503-m001」の声データ
hts-voice-mei「mei_angry」「mei_bashful」「mei_happy」「mei_normal」「mei_sad」の声データ
今回のバージョンから「Mei」の声データのパッケージは以下のファイル配置となり、全て/usr/share/hts-voice/mei/以下に配置される。

[/]-+-[usr]-+-[share]-+-[hts-voice]-+-[mei]-+-mei_angry.htsvoice
    |       |         |             |       +-mei_bashful.htsvoice
    |       |         |             |       +-mei_happy.htsvoice
    |       |         |             |       +-mei_normal.htsvoice
    |       |         |             |       +-mei_sad.htsvoice

「hts-voice-nitech-jp-atr503-m001」の声データについては2012年の年末から新形式で配布されていたが、今回プログラム側のバージョンを新形式対応のものに上げたのにあわせて最新バージョンを公開した。こちらの配置場所は/usr/share/hts-voice/nitech-jp-atr503-m001/nitech_jp_atr503_m001.htsvoiceとなる。

.htsvoice形式の声ファイルの指定

Open JTalk1.06以上/hts_engine API 1.07以上では声ファイルは新しい「.htsvoice」形式にのみ対応しているが、この指定(hts_engineコマンドやopen_jtalkコマンド)は-m [.htsvoiceファイルの場所]オプションで行う。

関連記事:

使用したバージョン:

  • hts_engine API 1.08
  • Open JTalk 1.07
  • MMDAgent "Sample Script" 1.4