"The NewYork Timesの指摘によると、OpenAIは2021年時点でネット上にある「信頼できる英文テキスト」を使い果たし、次のAI開発にあたって新たなテキストが必要になったとのこと。 そのため、高精度な文字起こしを実現する「Whisper」を開発。 そして、Whisperを用いてYouTubeにある動画の文字起こしを行い、AI用のトレーニング素材を入手したそうです。 YouTubeの動画を用いることについて、OpenAIでも議論はあったものの、グレッグ・ブロックマン社長も個人的にデータ収集に協力し、結果として生まれたのがGPT-4だとのこと" https://gigazine.net/news/20240408-openai-and-google-use-a-million-hours-of-youtube-videos/