1999-07-22[n年前へ]
■失楽園殺人事件の犯人を探せ
文章構造可視化ソフトのバグを取れ
今回は
夏目漱石は温泉がお好き? - 文章構造を可視化するソフトをつくる - (1999.07.14)
の続きである。やりたいことは以下の3つ
- WordFreqのバグを取る。
- 定量化に必要な数値を出す。
- とにかく遊んでみる。
WordFreq.exe 1999.07.21Make版 wordfreq.lzh 338kB
本WEBサイトのモットーは「質より量」である。...これはちょっと何だな...「下手な鉄砲も数撃ちゃ当たる」...これもちょと...「転がる石に...(もちろん日本版でなくて西洋版のだ)」といった方がニュアンスが良いかな?... 転がる石は精度を求めないのである。数をこなせば精度が悪くてもいい方角に転がっていくと思っているのだ。モンテカルロ理論である。「遊び」だし。というわけで、これはバグがあった言い訳である。
さて次は、「定量化に必要な数値を出す」である。前回の題目で使った「ホトトギス」版「坊っちやん」のダウンロード元のWEBの作成者である木村功氏より、前回の話以後にいくつかアドバイスを頂いた。それが「定量化するにはどのようにしたら良いか」ということであった。それについては、最低限の機能をつけてみた。やったのはただひとつ。出現頻度の分散を計算するようにしただけである。この数値と出現平均値を用いて、色々な文章を解析すれば、このプログラムの返す値の出現分布の分散・平均値・有意水準などを導くことができるだろう。色々な時代の、色々な作家の、色々なジャンルの文章を解析し、それらから得られた値を調べてみればもしかしたら面白いことがわかるかもしれない。
それでは、今回のプログラムを使って遊んでみよう。
今回用いるテキストは小栗虫太郎の「失楽園殺人事件」だ。
青空文庫 ( http://www.aozora.gr.jp/)
から手に入れたものだ。今回のタイトルどおり、「失楽園殺人事件」において「犯人」を探してみよう。
ラストのほうに向かうに従い犯人の登場が増えて、山場を迎えているのがわかるだろう。「犯人」で検索したら次は探偵の番だ。「法水」で検索し、探偵がきちんと働いているか見てみよう。
なかなか出ずっぱりで活躍している。もちろん、探偵役もラストでは活躍しているようだ。
ここまで見ていただくとわかるだろうが、画面は前回のバージョンとほとんど同じである。前回は、1物理行あたり検索単語は1個までしか見つからなかったが、今回はきちんと複数見つかっているのがわかると思う。1物理行中でもきちんと結果が出るようになったおかげで、文章中から「。」を検索すると、物理行(段落と近いもの)中に含まれる「文」の数を調べることが出来る。妙に長い文節の出現頻度などを調べることが出来るのだ。こういったものは定量化にふさわしいのではないだろうか?
また、C++プログラマーのあなたは自分のプログラム中から「//」などを検索すると面白いのではないだろうか。コメントの出現頻度が手に取るようにわかるだろう。
というわけで、今回はバグ修正のご報告である。
1999-10-18[n年前へ]
■沸点と数学の挑戦状
みつからない「解決編」
いったい、いつから疑問に思うことをやめてしまったのでしょうか? いつから、与えられたものに納得し、状況に納得し、色々なこと全てに納得してしまうようになってしまったのでしょうか? いつだって、どこでだって、謎はすぐ近くにあったのです。 何もスフィンクスの深遠な謎などではなくても、例えばどうしてリンゴは落ちるのか、どうしてカラスは鳴くのか、そんなささやかで、だけど本当は大切な謎はいくらでも日常にあふれていて、そして誰かが答えてくれるのを待っていたのです....。 加納朋子 ななつのこ より |
加納朋子の「ななつのこ」という小説を読んだ。創元推理文庫から出ているのだから、ミステリといっても良いだろう。私の好きな北村薫の「空飛ぶ馬」に始まる「円紫さんと私」シリーズによく似た雰囲気を持つ本である。
それを読んで、ふと思い出した。
私が通っていたM高校の話だ。M高校は武蔵野の玉川上水のほとりにある。
そのことを聞いたのは月曜の朝だ。日曜日の昼間に変質者が現れたというのである。目撃した人によれば、変質者は生徒用の上履きを履いていて、手には白い布を持っていたという。顔などはよくわからなかったそうだ。目撃者に驚いた変質者は逃げてしまい、白い布を落としていった、というのだ。
それだけなら、「単なる変な奴がいた」ということで話は終わった筈だ。問題は、その白い布に麻酔薬が含ませてあったという点だった。悪ふざけではすまない。
私は友人の鴨志田とその事件について話をしていた。気になることがあったからだ。変質者が目撃された場所が問題だったのだ。図に描くとこんな感じだ。
そこは2階の中では職員室から一番遠い。一番校門に近い玄関を揚がった所である。そして、生物室の隣だった。
生物室は、普通の教室とは違う。通常は鍵がかかっているし、それは鍵がかけられるということでもある。
生物部の部長・副部長は生物室の鍵を使える立場にあった。そして、鴨志田は生物部の部長だった。
「変質者は生物室に出入りできる奴かな?」これはどうにも重大な問題だったのである。
「生物の部長・副部長経験者ってこと?」
「うーん。」
「麻酔薬ってクロロホルムとか、かな?」と鴨志田にぼくが言うと、「立て板に水」状態で、彼の推論を聞かせてくれた。
「いや、きっとエーテルだね。」なるほど説得力はある。いや、ありすぎるといっても良い程だ。コイツ、むちゃくちゃ怪しいヤツである。犯人候補No.1である。一朝一夕で考えた理屈とは思えない。
「今時、クロロホルムなんて使われていないんだよ。」
「副作用もあるしさ。」
「あと、沸点を考えてみろよ。」
「エーテル、つまりジエチルエーテルDiethyl Ether ( (C2H5)2O )は沸点が34.6℃だ。」
「それに対して、クロロホルムChloroform ( CHCl3 )は沸点が61.7℃だ。」
「ハンカチにクロロホルムを含ませて顔に当ててもなにもおきない。」
「だけど、エーテルは人間の顔にあてたら、体温のせいで瞬間的に気化するんだよ。」
「つまり、エーテルの気体で顔の周りが覆われるわけだ。」
「呼吸なんかしたらエーテルを吸わざるをえないだろ。」
「だから、クロロホルムとかよりエーテルのほうが、変な用途には向いているんじゃないかな。」
「もっとも、即座に気を失うとは思えないけどね。」
「そういうことって生物部の部員ならみんなわかるもの?」と聞くと、
「部長・副部長をやるくらいの人は確実にわかる。けど、他の人でもわかるやつはきっと多いよ。」また、部長・副部長経験者である。
「ところで、生物室にエーテルはある?」と訊くと、
「うん、あるよ。」とのお答え。やはり、生物室の「鍵」である。
「生物室に入れる人なら手に入ると思うよ。」
「せめて靴の先の色がわかれば。」そう靴の先の色は赤・黄・緑と色分けされており、それで1,2,3年生の区別がつくのだ。もっとも、それと関係ないサンダルを履いている人のほうが実際は多いのであるが。それに、靴を履いていたから学内の生徒とは限らないが。
「学年がわかるね。」
次に、ぼくらは覚えたばかりの数学の知識をひけらかす(まだ高校生だから)話をしていた。
犯人(変質者)の条件
- 男
- 生徒用の上履きを履いてた。
- 麻酔薬に関する知識がある。
- 麻酔薬を手に入れられる。
- 生物室に入れる。
- 一人
ここで、私は
「ぼくは生物室の鍵を持っていないから、必要条件を満たしていないな。」
つまり、「生物室に入れる=鍵を使える=生物の部長・副部長経験者」であるから、「ぼくは必要条件のひとつを満たしていない」と主張したのだが、鴨志田は聞き入れなかった。。
「オマエに鍵なんか必要ないだろう。」
そう、物理部の部長(私のこと)になるには「錠前破りが得意」でなければならなかったのである。すなわち、物理部の部長経験者であると「生物室に入れる。」ということの「十分条件」をもれなく手にしてしまうのである。イヤーなおまけである。もっとも、私は生物・化学は苦手であるので、必要条件を満たしていない。
一方犯人の「十分条件」を考えてみるとこんなものがある。
- 生物部の部長・副部長
「ところで、こんなミステリがあったらどう思う? 探偵がめちゃくちゃ論理的なヤツでさ。」さてさて、普通ならばここに「読者への挑戦状」が入るところだろう。だから、この話にも入れてみる。ただ、少し定型とは違う。
「コンパクト群の表現論なんかで語られてさ。」
「犯人を指摘する所なんか、数式だらけな話。」
「作家はMathematicaをワープロ代わりにしててさ。」
「......なんか、一般受けしそうにないな...おれにすら面白くないぞ...」
ここまでに、犯人を示す証拠が全ての証拠がそろっているとは思わないし、そもそも、犯人が登場しているかどうかすら私にはわからない。いや、実際のところ登場していないと100%確信している。しかし、名探偵のあなたなら、きっと犯人を指摘してくれるに違いない。私と鴨志田の懸念を吹き飛ばしてくれるに違いない、と思うのだ。 犯人は一体誰なのだ... |
1999-11-05[n年前へ]
■草迷宮・空間'99
ネコの目から見た世界
「猫の視点から世界を眺める」という本や漫画は実に多い。漱石の「我輩は猫である」を始め、大島弓子の「綿の国星」がそうだ。そして、今回のタイトルになっている内田善美の「草迷宮・草空間」もそうだ。
犬を擬人化して語られる物語もある。例えば、「のらくろ」を始めアニメの「名探偵ホームズ」もそうだ。しかし、私としては「猫の視点」で語られる物語に軍配を上げたい。どうも、犬の視点から語られる物語には、主観性が感じられないのである。好きではないのだ。
その猫と犬の違いは、ドラえもんとヤッターワンの違いといっても良いだろう。このニュアンスが伝わるかどうかは多いに疑問であるが。
さて、HOT WIRED JAPAN に
- 「ネコの視覚の再現ビデオ」(http://www.hotwired.co.jp/news/news/technology/story/3213.html )
ネコの視床にある177の神経細胞に電極を取り付け、神経細胞の興奮パターンからネコが見ている画像を再構成した、という研究報告である。
そのオリジナルの報告は
- InformationProcessing in the Visual System ( http://deas.harvard.edu/~gstanley/research/vision/vis.html)
せっかくなので、「できるかな?」でもネコが見ている世界モドキの画像を作成してみることにした。先のWEBを参考にして、モドキを作ってみる。以下の手順を納得する(あるいは納得しない)ためには、先のWEBを読むことが前提となる。
まずは、ネコの神経細胞の視野に対応する電極位置を確認してみる。
視野に対応する電極の位置。赤はその内部に正の反応を持ち、青はその外部に正の反応を持つ。(ここらへん、私の理解は少しアヤシイ) |
この画像から、赤と青に対応する部分を抽出してみる。
Red | Blue |
うーん、Blueの方はずいぶんと取りこぼしが多い。それは、赤は丁寧にやったんだけど、青は雑にやったからである。青は、あまり重要でない(と私が考えた)からである。その理由は赤と違ってあまり狭い空間分布を持たないからである。
次に、Redと(Blueを反転したもの)を足して(黒を正として)、ガウス分布のぼかしをかける。青で示された電極を反転させたのは、それが負の反応を持つ電極であるからだ。
その計算結果がネコの視覚モドキのフィルターである。
この画像と任意の画像をPhotoshopで「スクリーン演算」するのが、「できるかな?」的ネコ視覚フィルターである。
ためしに、適当な画像を見てみよう。海沿いにいる人物を「もしネコが見ていたら、どう見える?」という場合である。
こう見えるのだ(保証はしないけど)。
「ネコが私を見るとどうなるか?」と思ったことは、何回かあるが、まさかその答が手に入るとは思わなかった。科学、恐るべし、だ。