ブーストした記事ですが、こういう検証動画はありがたい。
くずし字のOCR認識が実用段階に入り、国立国会図書館所蔵の古典籍が検索可能になったというニュースがあり、しかしその認識率はどんなものかという検証はなされてこなかった。この動画は国文系の研究者が検証してくれたもののようです。
先進的なタリン氏の研究でくずし字の文字認識が日進月歩で向上しつつあることは、先日の日本語学会の講演でも聞いたところでした(参考:近藤泰弘「AIくずし字認識について―過大評価と過小評価のその先へ―」,https://bungaku-report.com/blog/2021/09/ai-3.html)。
miwoも何度か使ったことがあります。個人的な所感では、人間が読めそうな文字はAIも読める、人間もこれは無理だろうと思える文字はAIも読めない。ということは、「これ何て読むんだっけなあ」という記憶の引き出しが開かない時には役立つが、「えっこれ読める?」というときは厳しい感じ。
すでにそういう研究に進んでいるかもですが、たぶん次に飛躍的に認識度が向上するのは文脈情報をAIが学習したときでしょう。人間が読むときも、実際文字だけを読むことはなくて、文脈で推測することが多い。そこまで研究が進むこともそう遠いことではないでしょう。