since 2023-04-25
AIボイスチェンジャーの話題を追う。
その1
https://www.techno-edge.net/article/2023/04/09/1130.html
https://eyatu-vrc.hatenablog.com/entry/2023/04/06/193512
https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/releases
RVC-beta.7z = 2.9GB
マルチモーダルデータベース
https://zunko.jp/multimodal_dev/login.php
VC Client
https://github.com/w-okada/voice-changer
vc-client クイックスタート(マニュアル)
https://zenn.dev/wok/books/0004_vc-client-v_1_5_1_x/viewer/003-1_quick-start
その2
https://togetter.com/li/2131337
https://note.com/omiz_aiart/n/n558e45e36e13
voice-changer のチュートリアル
https://github.com/w-okada/voice-changer/blob/master/tutorials/tutorial_rvc_ja.md
https://huggingface.co/lj1995/VoiceConversionWebUI/tree/main
その3
いろいろ大きなファイルを落としたり眺めたりしているが、そもそもソースは??
https://github.com/RVC-Project
https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI
日本語
https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/blob/main/docs/README.ja.md
VITS
VITS: Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech
https://github.com/jaywalnut310/vits
https://jaywalnut310.github.io/vits-demo/index.html
Audio Samples from "Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech"
Ultimate Vocal Remover
https://github.com/Anjok07/ultimatevocalremovergui
Windows で環境構築
Python 3.8.10 はまだ Windows インストーラーが入手できる(セキュリティ修正はその後も行われているがインストーラーが提供されていない)
書かれているので poetry を入れておく
(Invoke-WebRequest -Uri https://install.python-poetry.org -UseBasicParsing).Content | py -3.8
py -3.8 -m venv venv38 venv38\scripts\activate pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117
依存パッケージの勉強をしておく
https://pytorch.org/vision/stable/index.html
https://pytorch.org/audio/stable/index.html
こうしろということか
git clone https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI.git cd Retrieval-based-Voice-Conversion-WebUI poetry install
こんなのもあるのか
https://parselmouth.readthedocs.io/en/stable/
あれ
Updating torch (2.0.0+cu117 → 2.0.0)
cu117 に戻さなくては?
python infer-web.py すると前述「その1」の RVC-beta.7z と同じようなものが動いた。
だが「対応するNVIDIAグラフィックカードが見つからない」みたいになる。
pip uninstall torch torchvision torchaudio pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117
これで戻った。記録しておく。
pip freeze > requirements-230425.txt