We read every piece of feedback, and take your input very seriously.
To see all available qualifiers, see our documentation.
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
3秒~11秒ぐらいの音声を500個以上あつめて、有音部合計50分以上データセットで学習してるんですが、そもそもまともに綺麗に喋るにはどれくらい必要なんでしょうか? 自分が知らないだけで60個とかでも普通に綺麗にできるんですか?
The text was updated successfully, but these errors were encountered:
場合によりますが、合計1分くらいでもできたという報告はあります。ただ一般的にどれほどのデータ量があれば綺麗にできるかは断言はできず主観によるので、基準を述べることはできません。
Sorry, something went wrong.
すみません、ありがとうございます。了解です。 個人用メモ [昔から伝統的には、MyCoeiroinkやずんだもん界隈、AI音声合成界隈全体を昔から見るに、2から10秒前後の声を250~600個ぐらい用意してきた]
No branches or pull requests
3秒~11秒ぐらいの音声を500個以上あつめて、有音部合計50分以上データセットで学習してるんですが、そもそもまともに綺麗に喋るにはどれくらい必要なんでしょうか? 自分が知らないだけで60個とかでも普通に綺麗にできるんですか?
The text was updated successfully, but these errors were encountered: