小論文の自動採点

昨日の朝日新聞に載っていた。一瞬で採点されるそうな。だいたいやってることと言えば、構文解析して、各文書間の論理構成が妥当かどうか、それから漢字と語彙の使用頻度を調べるみたいな感じなのかな。たぶん、世間一般には認められないような感があるんだろうけど、実際の運用上の問題は別として、採用されると言うことはこのシステムが採点に対して十分妥当に働くことが検証されてるってわけだよね。つまり、人間が採点した結果とかなり高確率で結果が一致すると。そう考えると、小論文はある種の(かつ少数の)ルールに基づいて善し悪しが決定される、そんなところですか? 欧米なんかだとそうしたテクニックの学習も盛んなそうで、そうしたものを(世間的に)嫌う傾向のある(気がする)日本では流行らんのだろうか。なんか、自然言語処理は優秀な人間のみに許された高貴な活動であって、他の動物や機械が扱っていいものではなく、また決してまねできるものではないとするような風潮ってありますよね。ありませんか。どうでもいいですが。
大量の新聞記事などから学習させてるみたいですね。どういった情報をとるんだろ。漢字と語彙はまぁいいとして、言い回しとか論理的な構成とかか。接続詞を正しく使いつつ、関連単語をばんばん並べ、論理に用いられる単語を使って、矛盾しないことを書けば、高得点? まぁ、そんな単純なことでもなさそうな。