-
Notifications
You must be signed in to change notification settings - Fork 206
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
別キャラクターのエンジンを用意する #237
Comments
良さそうです!! assignさせていただきました! たしかにmockで良さそうですが、個人的には本番同等の機能を持ったCOEIROINKエンジンを作って頂くというのが良いのかなと感じています。 もちろんmockでも全く問題ないと思います! |
@Hiroshiba
こちら全然問題ありませんが「COEIROINKエンジン = espnetエンジン」なので以前以下のようなお話をしていたような。
すでに私のgitで「COEIROINKエンジン(espnetエンジン)」があるので、それを見れば誰でもvoicevoxで動くespnetモデルをCOEIROINKのように公開できる状態ではありますが、COEIROINKエンジンの実装方針に関して相談させてくださいー。 =======================================
メリット:
デメリット:
=======================================
メリット:
デメリット:
=======================================
メリット:
デメリット:
=======================================
これはCOEIROINKに限ると自分の工数しか変わらない?のでお気になさらず。 |
ニュアンスとしては1が近いイメージでした! なので、3でも良いかなと思いました! |
了解です!
そうですね。あまりGithub Actionsは詳しくないのですが、
|
はい、そちらの流れで良いかなと思います! |
このissueに関しての質問なのですが,ここに書いて大丈夫でしょうか 私は最近VOICEVOXを知ったためこれまで音声合成ソフトを触ったことがなく,またpython関連の知識も殆どない状態なので,頓珍漢なことを質問していたら訂正してください. 現状,voicevoxのエンジンはサーバ機能とTTS機能が別れておらず( #119 (comment) ),このissueはサーバ機能も合わせてサードパーティ製のエンジンを実装しようとしているように思えます. サーバ機能とTTS機能を同梱させることの問題点として,
つまり,上記のような決定をしたからにはこれらを軽微なデメリットと考えているか,これを上回るメリットが有るはずであり,それを聞きたい,というのが私の質問です. |
@amamama 理由は色々ありますが、現状の実装から工数最小で実装できるというのが大きいです。 |
@Hiroshiba 返信ありがとうございます.理解しました. |
@shirowanisan こちらどうでしょう・・・?👀 |
@Hiroshiba すみません。年末年始にあまり時間が取れず遅れています。 |
@Hiroshiba
これにより、mac-cpu-mock, windows-cpu-mock, linux-cpu-mockのような新たなビルドがリリースにできあがるイメージです。 しかし、今思うと当初はCOEIROINKエンジンでサードパーティテストをしたいモチベーションでやっていましたが、mockの場合は、わざわざ作成せずとも良いのではと思いました。 run.exeにport引数を与えることで違うportで起動できるのため、これをサードパーティ制と見立てた方が、github actionやreleseページが綺麗なのではと考えた次第です。
VOICEVOX起動時にバックグランドで「サードパーティrun.exe」を自動で起動するような形を実装するならば、「mock-engine」が必要になる可能性もあります。 以上の理由で、 |
なるほどです!
目的をちょっと振り返ってみると、「COEIROINKエンジンをVOICEVOXからも利用できる」というのが僕個人としては一番到達したいことでした。 となると、もう初手からCOEIROINKエンジンを作成して頂いちゃって、そのエンジンを借りてエディタ側を開発すると、楽しくて、かつゴールまでが最短なのかなと感じました。 最短だと感じている理由は、VOICEVOXエンジンとCOEIROINKエンジンの仕様違いを吸収するコードをVOICEVOXエディタ側に実装できるためです。 COEIROINKは今熱くてお忙しいかもですが、いかがでしょうか・・・?👀 |
@Hiroshiba なるほどです。 具体的には まずは、私のgithubレポジトリでCOEIROINKコアモジュールを作成し、 そして、forkした私のレポジトリ「shirowanisan/voicevox_engine」のreleaseに ここで、「COEIROINKエンジンのpreview」は「VOICEVOX/voicevox_engine」のreleaseにもあった方が良いでしょうか?
個人的には頑張りたいと思っていますが、いつも作業が遅くなってしまい申し訳ありません💦 |
ありがとうございます!!
了解です!
ゴール感一緒です!
こちら、意図をお聞きしたいかもです。
問題なさそうです! |
こちらはヒホさんがイメージしている形の認識を合わせたかったので、色々な可能性を確認したく、質問させていただきました。
こちらで認識があっているのであれば、私としても問題ありません。 私もVOICEVOXにはとても感謝していて、COEIROINKがVOICEVOXに貢献できるよう頑張りたいです。 |
なるほどです、ありがとうございます!ぜひその形で進めて頂ければと思います。 |
@Hiroshiba とりいそぎ、今のvoicevox_engineのmasterからcoeiroink_engineを作成しました。 一旦、coeiroink coreモジュールはbranchに直書きし、github actionもまだ対応できていません。 その他、ご要望があれば対応します。 |
@shirowanisan 現行のVOICEVOXエディタと(無理やり)結合して動かしてみました! voicevox.2022-01-24.01-40-10.mp4ちょっとまだ設計しきれてないのですが、エンジンができること・できないことをリスト化して受け取るAPIみたいなのを用意していただくかもしれません。(例えば「話速変更が可能か」とかです。) あとはロゴとか、エンジンIDのAPIとかも必要になるかもです。 |
@Hiroshiba
はい、こちら問題ありません。
あまり新しいアイデアが出ていないかもしれませんが、ひとまずまとめてみました。
こちらも問題ありません。確かにエンジンのiconなどが表示されると楽しいですね!
うーん、今上げたもの以上のことはすみませんがパッと思いつきませんでした。 自分は開発速度が遅くて申し訳ないのですが、voicevox_engineの追加実装が必要ならば自分も協力できると思います! |
列挙ありがとうございます、参考になります!! |
@shirowanisan おまたせしました!!
ちょっと追加で相談したいのが1つあります。 例えば、話速変更に非対応なエンジンであっても、QueryのaudioSpeedに何らかの値(1.0とか2.0とか)が含まれて渡ってくる感じです。 なので一旦、非対応のパラメータであってもオプショナルにせず、実態が渡ってきてしまうようにして、エンジン側には無視していただくというのを考えているのですが、どうでしょう・・・? |
はい、そちらがあるとサードパティに備わっている機能がユーザにも伝わり、サードパーティを作っている側からするとすごく助かりそうです!
こちら、他のサードパーティ参加者はわかりませんが、私としては、ただ使わないだけなので不都合ないです! |
エンジンのプラグイン化プロジェクトを管理しているこちらのissueに上記内容を追記してみました! ということで本issueは目的達成なのでcloseしたいと思います。 |
内容
複数のエンジンで音声合成できるようにするために
「別キャラクターのエンジンを用意する」
関連
VOICEVOX/voicevox#429
要件
結論
以下を満たすビルド済みパッケージを用意すれば良さそう。
実現方法
以下のビルドをGithub Actionsに追加して、擬似サードパーティ製エンジンをGithub Releaseに含める。
VOICEVOXのバージョン
0.9.0や0.10.0で追加したいマイルストーンです。
The text was updated successfully, but these errors were encountered: