各種 Text-to-Speech エンジンを統一的に操作するライブラリです。VOICEROIDなどを自動化する簡易Webサーバもあります。
- Windows 10/11 (64bit)
- VOICEROID+ 各種
- 音街ウナTalkEx
- VOICEROID2 各種 (x86, x64)
- A.I.VOICE (要x64ビルド)
- ガイノイドTALK 各種
- かんたん!AITalk3 / 関西風 / Lite
- CeVIO CS6 / CS7 (x86, x64)
- CeVIO AI (要x64ビルド)
- VOICEVOX
- COEIROINK
- SAPI5 (Windows10標準の音声合成機能。スタートメニュー>設定>時刻と言語>音声認識>音声の管理>音声の追加から各国語の音声が追加できます。API仕様により追加しても列挙されない音声があります。)
- VOICEPEAK
ライブラリ名はインストールされたフォルダなどを参照して機械的に抽出しているため、リストにないものでも音声合成エンジンが共通であれば動作する可能性が高いです。
音声合成エンジン | ライブラリ名 |
---|---|
VOICEROID+ EX | 民安ともえ EX, 東北ずん子, 東北きりたん, 京町セイカ |
音街ウナTalkEx | 音街ウナ |
VOICEROID2 | 琴葉 茜, 琴葉 葵, 結月ゆかり, 紲星あかり, 東北イタコ, 桜乃そら, ついなちゃん(標準語), ついなちゃん(関西弁) |
VOICEROID2 (VOICEROID+ EX からのアップグレード) | 民安ともえ(v1), 東北ずん子(v1), 東北きりたん(v1), 京町セイカ(v1) |
かんたん!AITalk3 | あんず, かほ, ななこ, のぞみ, せいじ |
かんたん!AITalk3 関西風 | みやび, やまと |
かんたん!AITalk3 LITE | あんず(LITE), かほ(LITE), ななこ(LITE), のぞみ(LITE), せいじ(LITE) |
ガイノイドTALK | 鳴花ヒメ, 鳴花ミコト |
A.I.VOICE | 琴葉 茜,琴葉 茜(蕾),琴葉 茜,琴葉 茜(蕾),Kotonoha Akane (English),Kotonoha Aoi (English),結城 香, 足立 レイ,栗田まろん |
CeVIO CS6 / CS7 | さとうささら, すずきつづみ, タカハシ, IA, ONE |
CeVIO AI | さとうささら, 小春六花, 弦巻マキ (英), 弦巻マキ (日) ※ライセンスエラーが出る場合は #5 へお知らせください |
VOICEVOX | 四国めたん,ずんだもん,春日部つむぎ,雨晴はう,波音リツ,玄野武宏,白上虎太郎,青山龍星,冥鳴ひまり,九州そら |
COEIROINK | つくよみちゃん,MANA,おふとんP,ディアちゃん,アルマちゃん |
SAPI5 | Microsoft Haruka Desktop, Microsoft David Desktop, Microsoft Zira Desktop, Microsoft Irina Desktop |
VOICEPEAK(1.2.1以降) | Frimomen, Tohoku Zunko, Zundamon, Japanese Female Child, Japanese Male 1, Japanese Male 2, Japanese Male 3, Japanese Female 1, Japanese Female 2, Japanese Female 3 |
この実装は簡易実装であり、音声合成ライブラリと同一のPC上で実行することを想定しています。インターネット上への公開は、セキュリティ上のリスクや音声合成ライブラリのライセンス上の問題がある可能性があります。
- ビルド済み実行ファイル64bit版(v0.1.0) (2022/3/15更新)
- ビルド済み実行ファイル32bit版(v0.1.0) (2022/3/15更新)
- SpeechWebServer のプロジェクトを Visual Studio 2019 でビルドして
SpeechWebServer.exe
を実行します(管理者権限が必要です)
- ブラウザで http://localhost:1000/ を開くと現在の時刻を発話します
- http://localhost:1000/?text=こんにちは を開くと「こんにちは」と発話します。「こんにちは」の部分は任意の文字列を指定できます
- http://localhost:1000/?text=おはようございます&range=1.2&volume=1.0&pitch=0.8&speed=0.8 のように、音量(volume), 話速(speed), 高さ(pitch), 抑揚(range) を指定できます (かんたん!AITalk3 LITE, CeVIO, SAPI5を除く)
- VOICEROID+ 東北きりたんがインストールされている場合、http://localhost:1000/?name=東北きりたん&text=こんばんは を開くと東北きりたんの声で発話します。他の音声合成エンジンを利用する場合は、アプリ起動時に表示される「インストール済み音声合成ライブラリ」の表記を参考に、適宜 name の引数を変更してください。なお、VOICEVOX, COEIROINK を利用する場合は、あらかじめアプリケーションを起動しておいてください。
- 複数の音声合成エンジンがインストールされており、同一のnameが利用されている環境では、http://localhost:1000/?text=アカネチャンやでー&name=琴葉%20茜&engine=AIVOICE のように engine で区別をします
- http://localhost:1000/?text=おはよう&speaker=和室 のように音声を再生するスピーカー名を指定することができます。カッコ内の文字列を前方一致で検索します。なお、Google Home デバイスは Windows から Bluetoothスピーカーとして接続ができ、任意の名前(「和室」など)を付けることが可能です。
- http://localhost:1000/?text=ささやき声なのだ&name=ずんだもん&whisper=0.02&speed=0.8 のようにwhisperを設定することで、任意の音声をささやき声に変換できます(ささやき声化した音声は whisper.wav として自動的に保存されます)。音声がおかしく聞こえる場合は &volume=0.6 などのオプションを指定して音量を小さくしてみてください。
- 話者の一覧取得
- 話者に応じたTTS切り替え
- Bluetooth スピーカーの安定動作のための無音区間挿入
- 同時起動対応(先に起動しているほうに処理を委譲)
- 再生
- 音量の取得・変更
- 話速の取得・変更
- ピッチの取得・変更
- 抑揚の取得・変更
- 発話中の音声停止
- 合成した音声の保存
- 連続して文字列が入力されたときの対応
- 音声合成対象の文字列の途中に .wav ファイルを差し込み
- 音声合成対象の文字列の途中に音声コントロールを埋め込み
- 音声出力デバイス選択