Podcastle の講演

聞いてきました。

http://wikibana.socoda.net/wiki.cgi?Wiki%BE%AE%CF%C3%2FVol.7

Podcastle でぐぐると、まだ「もしかして」が出てしまう。がんばれ！

さて、内容ですが興味のあった音声認識は全体の１／４位で、サーバーありのクライアントありのプロジェクトの総括ありの、もりだくさんはいいけど少し希薄になってしまった。もうちょっと時間あったら良かったですね。認識まわりはざっくり、本当にざっくり説明されただけでちょっと消化不良。やっぱり懇親会行けば良かったかな。どう考えても激しくがんばらないと作れないはず(と思っている）の音声モデルに対して、言語モデルが単純な単語 bigram というのは変にアンバランスな気がしたわけですが。世の中そんなものなのか。「それ bigram と精度変わらないよ」なんだろうか。

それから、皆さん激しくプレゼンがうまい。とりわけ brazil さんは口を開くたびに大爆笑だった。いや、プレゼンがうまいんだけじゃなくて普通に話すのがうまいんだ。あの周到な用意ぶりと聴衆へのリードの取り方は見習うものがある。

個人的におもしろいというか、気になったのは、実用的なアプリケーションに仕上げるときには、すごく些末な問題がたくさん発生するということ。とりわけこうした問題の場合、未知語の処理をどうにかこうにかするのが大変そうだ。未知語だらけのテキストを分かち書きするのも大変だろうし、とりわけ音声に応用すると読み方を推定しないといけない。固定されたデータと固定された正解セットで実験しているといろいろ忘れてしまう問題を見直さないと。