Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

日本語g2pにunidic3.10を使う #161

Open
wants to merge 14 commits into
base: dev
Choose a base branch
from
Open

Conversation

WariHima
Copy link

変更点

fugashi(最新のmecabラッパー)とunidic3.10を使用してg2pを部分実装し、その出力をpyopenjtalkの出力と合成して読みがより正確になるよう変更。
NHK日本語アクセント辞典を参考にした、九州方言、近畿方言と京阪式アクセントの内部サポート

依存環境が増えまして、

pip install fugashi[unidic]
python -m unidic download

する必要があります。

@WariHima WariHima changed the title Dev 日本語g2pにunidic3.10を使う Aug 30, 2024
@WariHima
Copy link
Author

同音異義語読み推定機能を追加しました。
以下のライブラリを使用
https://github.com/passaglia/yomikata
依存関係のバージョンが固定されているので
yomikata --no-deps
speach
pynvml
でいれる必要があります。
後、windowx環境ではデフォルトの文字エンコードがcp932なので、ライブラリののopen()にutf-8を指定するよう書き換える必要があります
yomikataの修正バージョンを出す必要がありそうですね

python -m yomikata download でモデルをいれる必要もあります

あと機能追加に伴い依存関係が増えました
jaconv

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

1 participant