Merge branch 'master' into add/xx_label_val

tarepan · Feb 4, 2024 · fc8ea3f · fc8ea3f
2 parents 9a137a2 + 843bd76
commit fc8ea3f
Show file tree

Hide file tree

Showing 72 changed files with 11,903 additions and 557 deletions.
diff --git a/.github/workflows/build-docker.yml b/.github/workflows/build-docker.yml
@@ -15,8 +15,8 @@ on:
 env:
   IMAGE_NAME: ${{ vars.DOCKERHUB_USERNAME }}/voicevox_engine
   PYTHON_VERSION: "3.11.3"
-  VOICEVOX_RESOURCE_VERSION: "0.14.4"
-  VOICEVOX_CORE_VERSION: "0.14.5"
+  VOICEVOX_RESOURCE_VERSION: "0.16.0"
+  VOICEVOX_CORE_VERSION: "0.15.0"
 
 defaults:
   run:

diff --git a/.github/workflows/build.yml b/.github/workflows/build.yml
@@ -26,8 +26,8 @@ on:
 
 env:
   PYTHON_VERSION: "3.11.3"
-  VOICEVOX_RESOURCE_VERSION: "0.14.4"
-  VOICEVOX_CORE_VERSION: "0.14.5"
+  VOICEVOX_RESOURCE_VERSION: "0.16.0"
+  VOICEVOX_CORE_VERSION: "0.15.0"
 
 defaults:
   run:
@@ -464,10 +464,10 @@ jobs:
             LIBONNXRUNTIME_PATH=download/onnxruntime/lib/libonnxruntime.so
           fi
 
-          pyinstaller --noconfirm run.spec -- \
-            --libcore_path="$LIBCORE_PATH" \
-            --libonnxruntime_path="$LIBONNXRUNTIME_PATH" \
-            --core_model_dir_path="download/core/model"
+          CORE_MODEL_DIR_PATH="download/core/model" \
+          LIBCORE_PATH="$LIBCORE_PATH" \
+          LIBONNXRUNTIME_PATH="$LIBONNXRUNTIME_PATH" \
+          pyinstaller --noconfirm run.spec
 
       - name: Gather DLL dependencies to dist/run/ (Windows)
         if: startsWith(matrix.os, 'windows-')

diff --git a/Dockerfile b/Dockerfile
@@ -23,7 +23,7 @@ EOF
 # assert VOICEVOX_CORE_VERSION >= 0.11.0 (ONNX)
 ARG TARGETPLATFORM
 ARG USE_GPU=false
-ARG VOICEVOX_CORE_VERSION=0.14.5
+ARG VOICEVOX_CORE_VERSION=0.15.0
 
 RUN <<EOF
     set -eux
@@ -275,7 +275,7 @@ RUN <<EOF
 EOF
 
 # Download Resource
-ARG VOICEVOX_RESOURCE_VERSION=0.14.4
+ARG VOICEVOX_RESOURCE_VERSION=0.16.0
 RUN <<EOF
     set -eux
 

diff --git a/README.md b/README.md
@@ -57,21 +57,21 @@ echo -n "こんにちは、音声合成の世界へようこそ" >text.txt
 
 curl -s \
     -X POST \
-    "127.0.0.1:50021/audio_query?style_id=1"\
+    "127.0.0.1:50021/audio_query?speaker=1"\
     --get --data-urlencode [email protected] \
     > query.json
 
 curl -s \
     -H "Content-Type: application/json" \
     -X POST \
     -d @query.json \
-    "127.0.0.1:50021/synthesis?style_id=1" \
+    "127.0.0.1:50021/synthesis?speaker=1" \
     > audio.wav
 ```
 
 生成される音声はサンプリングレートが 24000Hz と少し特殊なため、音声プレーヤーによっては再生できない場合があります。
 
-`style_id` に指定する値は `/speakers` エンドポイントで得られます。
+`speaker` に指定する値は `/speakers` エンドポイントで得られる `style_id` です。互換性のために `speaker` という名前になっています。
 
 ### 読み方を AquesTalk 風記法で取得・修正
 
@@ -99,7 +99,7 @@ echo -n "ディープラーニングは万能薬ではありません" >text.txt
 
 curl -s \
     -X POST \
-    "127.0.0.1:50021/audio_query?style_id=1" \
+    "127.0.0.1:50021/audio_query?speaker=1" \
     --get --data-urlencode [email protected] \
     > query.json
 
@@ -111,7 +111,7 @@ cat query.json | grep -o -E "\"kana\":\".*\""
 echo -n "ディイプラ'アニングワ/バンノ'オヤクデワ/アリマセ'ン" > kana.txt
 curl -s \
     -X POST \
-    "127.0.0.1:50021/accent_phrases?style_id=1&is_kana=true" \
+    "127.0.0.1:50021/accent_phrases?speaker=1&is_kana=true" \
     --get --data-urlencode [email protected] \
     > newphrases.json
 
@@ -122,7 +122,7 @@ curl -s \
     -H "Content-Type: application/json" \
     -X POST \
     -d @newquery.json \
-    "127.0.0.1:50021/synthesis?style_id=1" \
+    "127.0.0.1:50021/synthesis?speaker=1" \
     > audio.wav
 ```
 
@@ -238,7 +238,7 @@ curl -s \
     -H "Content-Type: application/json" \
     -X POST \
     -d @query.json \
-    "127.0.0.1:50021/synthesis?style_id=$style_id" \
+    "127.0.0.1:50021/synthesis?speaker=$style_id" \
     > audio.wav
 ```
 
@@ -255,7 +255,7 @@ echo -n "モーフィングを利用することで、２種類の声を混ぜ
 
 curl -s \
     -X POST \
-    "127.0.0.1:50021/audio_query?style_id=0"\
+    "127.0.0.1:50021/audio_query?speaker=8"\
     --get --data-urlencode [email protected] \
     > query.json
 
@@ -264,7 +264,7 @@ curl -s \
     -H "Content-Type: application/json" \
     -X POST \
     -d @query.json \
-    "127.0.0.1:50021/synthesis?style_id=0" \
+    "127.0.0.1:50021/synthesis?speaker=8" \
     > audio.wav
 
 export MORPH_RATE=0.5
@@ -274,17 +274,17 @@ curl -s \
     -H "Content-Type: application/json" \
     -X POST \
     -d @query.json \
-    "127.0.0.1:50021/synthesis_morphing?base_style_id=0&target_style_id=1&morph_rate=$MORPH_RATE" \
+    "127.0.0.1:50021/synthesis_morphing?base_speaker=8&target_speaker=10&morph_rate=$MORPH_RATE" \
     > audio.wav
 
 export MORPH_RATE=0.9
 
-# query、base_style_id、target_style_idが同じ場合はキャッシュが使用されるため比較的高速に生成される
+# query、base_speaker、target_speakerが同じ場合はキャッシュが使用されるため比較的高速に生成される
 curl -s \
     -H "Content-Type: application/json" \
     -X POST \
     -d @query.json \
-    "127.0.0.1:50021/synthesis_morphing?base_style_id=0&target_style_id=1&morph_rate=$MORPH_RATE" \
+    "127.0.0.1:50021/synthesis_morphing?base_speaker=8&target_speaker=10&morph_rate=$MORPH_RATE" \
     > audio.wav
 ```
 

diff --git a/build_util/check_release_build.py b/build_util/check_release_build.py
@@ -34,14 +34,14 @@ def test_release_build(dist_dir: Path, skip_run_process: bool) -> None:
     # テキスト -> クエリ
     text = "こんにちは、音声合成の世界へようこそ"
     req = Request(
-        base_url + "audio_query?" + urlencode({"style_id": "1", "text": text}),
+        base_url + "audio_query?" + urlencode({"speaker": "1", "text": text}),
         method="POST",
     )
     with urlopen(req) as res:
         query = json.loads(res.read().decode("utf-8"))
 
     # クエリ -> 音声
-    req = Request(base_url + "synthesis?style_id=1", method="POST")
+    req = Request(base_url + "synthesis?speaker=1", method="POST")
     req.add_header("Content-Type", "application/json")
     req.data = json.dumps(query).encode("utf-8")
     with urlopen(req) as res:

diff --git a/build_util/make_docs.py b/build_util/make_docs.py
@@ -1,12 +1,12 @@
 import json
 from pathlib import Path
 
-from voicevox_engine.dev.core import MockCoreWrapper
+from voicevox_engine.dev.core.mock import MockCoreWrapper
 from voicevox_engine.dev.tts_engine.mock import MockTTSEngine
-from voicevox_engine.preset import PresetManager
-from voicevox_engine.setting import USER_SETTING_PATH, SettingLoader
+from voicevox_engine.preset.PresetManager import PresetManager
+from voicevox_engine.setting.SettingLoader import USER_SETTING_PATH, SettingLoader
 from voicevox_engine.tts_pipeline.tts_engine import CoreAdapter
-from voicevox_engine.utility import engine_root
+from voicevox_engine.utility.path_utility import engine_root
 
 
 def generate_api_docs_html(schema: str) -> str:

diff --git a/docs/VOICEVOX音声合成エンジンとの連携.md b/docs/VOICEVOX音声合成エンジンとの連携.md
@@ -3,3 +3,5 @@
 - バージョンが上がっても、`/audio_query`で返ってくる値をそのまま`/synthesis`に POST すれば音声合成できるようにする予定です
   - `AudioQuery`のパラメータは増えますが、なるべくデフォルト値で以前と変わらない音声が生成されるようにします
 - バージョン 0.7 から音声スタイルが実装されました。スタイルの情報は`/speakers`から取得できます
+  - スタイルの情報にある`style_id`を`speaker`に指定することで、今まで通り音声合成ができます
+    - style_id の指定先が speaker なのは互換性のためです
diff --git a/engine_manifest.json b/engine_manifest.json
@@ -9,10 +9,10 @@
     "port": 50021,
     "icon": "engine_manifest_assets/icon.png",
     "default_sampling_rate": 24000,
+    "frame_rate": 93.75,
     "terms_of_service": "engine_manifest_assets/terms_of_service.md",
     "update_infos": "engine_manifest_assets/update_infos.json",
     "dependency_licenses": "engine_manifest_assets/dependency_licenses.json",
-    "supported_vvlib_manifest_version": "0.15.0",
     "supported_features": {
         "adjust_mora_pitch": {
             "type": "bool",
@@ -54,6 +54,11 @@
             "value": true,
             "name": "2種類のスタイルでモーフィングした音声を合成"
         },
+        "sing" : {
+            "type": "bool",
+            "value": true,
+            "name": "歌唱音声合成"
+        },
         "manage_library": {
             "type": "bool",
             "value": true,

diff --git a/engine_manifest_assets/update_infos.json b/engine_manifest_assets/update_infos.json
@@ -1,4 +1,58 @@
 [
+  {
+    "version": "0.16.0",
+    "descriptions": [
+      "ソングAPIを追加",
+      "キャラクター「四国めたん」「ずんだもん」「春日部つむぎ」「雨晴はう」「波音リツ」のハミングを追加",
+      "キャラクター「波音リツ」のソングを追加"
+    ],
+    "contributors": ["Hiroshiba", "y-chan"]
+  },
+  {
+    "version": "0.15.1",
+    "descriptions": ["ビルド成果物のディレクトリ構造を元に戻した"],
+    "contributors": []
+  },
+  {
+    "version": "0.15.0",
+    "descriptions": [
+      "/validate_kana APIを追加",
+      "起動時のエンジン設定項目追加",
+      "ユーザー辞書のインポート・エクスポート機能追加",
+      "ビルド成果物のディレクトリ構造を変更",
+      "書き込み系APIを一括で無効化可能に",
+      "開発環境の向上",
+      "バグ修正"
+    ],
+    "contributors": [
+      "aoirint",
+      "FujisakiEx",
+      "Hiroshiba",
+      "K-shir0",
+      "My-MC",
+      "nagi-miaow",
+      "okaits",
+      "raa0121",
+      "sabonerune",
+      "sevenc-nanashi",
+      "siketyan",
+      "stmtk1",
+      "takana-v",
+      "tarepan",
+      "tomoish",
+      "tuna2134",
+      "weweweok",
+      "whiteball",
+      "y-chan"
+    ]
+  },
+  {
+    "version": "0.14.7",
+    "descriptions": [
+      "キャラクター「小夜」「ずんだもん」「もち子さん」「青山龍星」のスタイルを追加・更新"
+    ],
+    "contributors": []
+  },
   {
     "version": "0.14.6",
     "descriptions": [