もともと私はテレビを全く見ないのですが、最近は Abema TV を見ることが増えてきました。だいたい食事をしながら Abema News を見ることが多いのですが、画面の下に「AI ポン」によるリアルタイム字幕が表示されていて、これがなかなか健闘しているなぁ、という印象を受けています。
(参考記事: ビジネス + IT「テレビ局3社が語る「自動字幕」の裏側 AbemaのAIポンはすでに実用レベル?」)
https://www.sbbit.jp/article/cont1/36795#head2
番組の内容や話者によってはうまく行かないこともありますし、ネットでも結構酷評されている記事が目立ちますが、ニュース番組ではかなり正確にテキスト化されていると思います。
「けやきヒルズ」ではアナウンサーとゲストコメンテーターとの対話がありますが、コメンテーターが話しているときよりもアナウンサーが話しているときのほうが、誤変換がかなり減るように思います。こういう状況をみることで、いかにアナウンサーが正確に、はっきり話すように訓練されているか、ということが改めて分かりました。