https://anond.hatelabo.jp/20241104075316
面白い考察ではあった。ただ、このモデルの素性は、
① エロゲーの台詞・音声で事前学習
② ①を声優毎にファインチューニング
じゃないかなあ。
①の学習は例えデータセットが市販されているエロゲーの台詞・音声という著作物であっても合法。①のモデルは「特定の声優の声」を再現するためのモデルではなくて、「エロゲみたいな台詞を喋る」モデルとなるはずなので。
②は声優(ボイスパートナー)に有償で台詞収録を依頼し、得られたデータセットで①をファインチューニングしてるはず。
こういうプロセスでモデルを作製している限りは、著作権問題や、声の権利の問題は発生しないと思う。というか②を声優の許可無く、エロゲーから学習してたら大問題だ。あり得ないと思う。
データの透明性という観点でいえば、DMMボイスでは②のデータセットを提供した声優を公開すべきだが、逆に声優側から非公開にしたいという要請もあるのだと思う。エロゲーに声を入れる声優が、別名義を名乗るのと同じ理由で。
ただ、ファインチューニングは声優に対価が支払われている(もしくは同意を得ている)、という点は公表した方が良さそうだ。ボイスパートナー募集フォームなんてものがあるくらいだし、そんなのは自明だと思うんだけど、この増田みたいな捉え方をする人が居るなら問題だと思うんだよね。