2011-09-03[n年前へ]
■難しい漢字を書く人・書かない(書けない)人
小学生の頃、毎朝行われる漢字ドリル(テスト)が苦手でした。「読み」は不得意でなかったような気がしますが、「書く」ことがとにかく駄目だったのです。何しろ、7回連続(5点満点中)0点を取り、小学校六年生から五年生に「(バツとして)落第」したこともあったほどでした。
「小学生の頃」と書きましたが、今でも漢字を書くのは大の苦手です。苦手という言葉では美化し過ぎなほどで、私が手書きするメモはひらがなだらけ、ほとんど相田みつを状態です。だから、「漢字が書けなくたっていいじゃないか(ホントは良くない!)…だってにんげんだもの」とつぶやきつつ、いつもひらがなとごくごく簡単な漢字だけを書き連ねています。
いわゆる普通の日本語を書くときに、いったいどのくらい難しい漢字が使われているものかを知りたくなりました。そこで、Rubyで「テキスト中で使われている文字の平均画数」を算出するコードを書き、試しにいくつかの文章に対して解析を行ってみました。その結果が、たとえば、下の5つです(ちなみに、普通に使われる範囲のかな・漢字全体で平均画数を算出してみるとおよそ12画になります)。
- 「日本国憲法」平均6.8画
- 小栗虫太郎「失楽園殺人事件」平均5.5画
- 夏目漱石「吾輩は猫である」平均5.0画
- 太宰治「走れメロス」平均4.7画
- 相田みつを「にんげんだもの」平均3.4画
なるほど、日本国憲法は漢字が多いな、と当たり前のことを実感させられます。小栗虫太郎は漢字を多用しそうですし、漱石は太宰より漢字が多く、漢字が比較的少ない太宰よりも相田みつをはさらに漢字が少ない、という結果です。やはり、相田みつをは「画数少ない選手権のトップ1」です。
今回は5つほどのテキストのみをノミネートし、文章の「(平均)画数少ない選手権」を行ってみました。次回はもっと多くの各種文章に対し解析を行ってみようと思います。
漢字が書けなくたっていいじゃないか、
だってワープロじゃないにんげんだもの。
(いや、よくない)