RT @yutatatatata@twitter.com
日本語特化の音声認識モデルReazonSpeech
https://research.reazon.jp/projects/ReazonSpeech/
✓ Whisper large-v2と精度ほぼ同等
✓ パラメータ数はWhisperの約1/15
✓ Hugging Faceからモデル利用可. 商用利用可
✓ ワンセグ放送の録画データから音声コーパス1万9千時間分を作成、公開
日本語音声認識のステージが変わった
🐦🔗: https://twitter.com/yutatatatata/status/1616075638074638337