フォロー

RT @yutatatatata@twitter.com

日本語特化の音声認識モデルReazonSpeech
research.reazon.jp/projects/Re

✓ Whisper large-v2と精度ほぼ同等
✓ パラメータ数はWhisperの約1/15
✓ Hugging Faceからモデル利用可. 商用利用可
✓ ワンセグ放送の録画データから音声コーパス1万9千時間分を作成、公開

日本語音声認識のステージが変わった

🐦🔗: twitter.com/yutatatatata/statu

ログインして会話に参加
Fedibird

様々な目的に使える、日本の汎用マストドンサーバーです。安定した利用環境と、多数の独自機能を提供しています。