Whisperの学習元データもしかしてYouTubeの字幕?

どうやら入力の音声の長さが増えるほど精度が悪化するっぽい
これが長時間の動画を投稿する人に付いてる字幕なのか

ログインして会話に参加
Fedibird

様々な目的に使える、日本の汎用マストドンサーバーです。安定した利用環境と、多数の独自機能を提供しています。