Google colabを使って、音声認識AIの「Whisper」で"文字起こし

という記事。
これを使えば、Zoom勉強会の資料作りが劇的に早くなるかも
note.com/dngri/n/n2f2302c253a9

フォロー

いろいろ調べた結果、音声ファイルがデフォルトで25MBまでと。これだと、講義の文字起こしは難しいな。2時間ほどの音声ファイルがほとんど。機械的に分割してしまうとおそらく文脈がずたずたになって認識精度が落ちてしまうだろう。
platform.openai.com/docs/guide

ログインして会話に参加
Fedibird

様々な目的に使える、日本の汎用マストドンサーバーです。安定した利用環境と、多数の独自機能を提供しています。