Google colabを使って、音声認識AIの「Whisper」で"文字起こし
という記事。これを使えば、Zoom勉強会の資料作りが劇的に早くなるかもhttps://note.com/dngri/n/n2f2302c253a9?sub_rt=share_pw
いろいろ調べた結果、音声ファイルがデフォルトで25MBまでと。これだと、講義の文字起こしは難しいな。2時間ほどの音声ファイルがほとんど。機械的に分割してしまうとおそらく文脈がずたずたになって認識精度が落ちてしまうだろう。https://platform.openai.com/docs/guides/speech-to-text/longer-inputs
様々な目的に使える、日本の汎用マストドンサーバーです。安定した利用環境と、多数の独自機能を提供しています。
いろいろ調べた結果、音声ファイルがデフォルトで25MBまでと。これだと、講義の文字起こしは難しいな。2時間ほどの音声ファイルがほとんど。機械的に分割してしまうとおそらく文脈がずたずたになって認識精度が落ちてしまうだろう。
https://platform.openai.com/docs/guides/speech-to-text/longer-inputs