■恋の力学 恋の相関分析編
「明暗」の登場人物達の行方
「恋の力学」シリーズである。前書き編が登場したきりで、なかなか本編に入らない「恋の固体物理学」シリーズではない。今回は、
の続き、ということになる。以前、
の中で書いたように、恋の力学シリーズは夏目漱石の影響を多大に受けている。そして、同様に夏目漱石の影響を受けているシリーズがある。それは「文章構造可視化シリーズ」である。何しろ、「文章構造可視化シリーズ」は夏目漱石をきっかけとして、始まっているのである。また、シリーズの中の話を見ればわかるように、
- 夏目漱石は温泉がお好き?- 文章構造を可視化するソフトをつくる - (1999.07.14)
- 失楽園殺人事件の犯人を探せ- 文章構造可視化ソフトのバグを取れ - (1999.07.22)
- 「こころ」の中の「どうして?」 -漱石の中の謎とその終焉 - (1999.09.10)
- 「星の王子さま」の秘密- 水が意味するもの - (1999.11.15)
そのための準備として、まずは「文章構造可視化シリーズ」で作成した"wordfreq"をバージョンアップしてみた。その動作画面を以下に示す。
赤丸で示したボタンに「ファイル出力」と書いてあるのがわかると思う。つまり、文章中に「任意の単語」が出現した出現頻度を解析した結果をファイル出力する機能を持たせたのだ。1段落中に「任意の単語」が出現した数をテキスト形式で出力するようにしてある。このファイル出力結果を他のソフトに読み込めば、色々な解析ができるわけだ。いつものように、このソフトはここ
においておく。言うまでもないが、アルファ版の中のアルファ版だ。さて、今回用いるテキストは
でも登場した「明暗」である。そこで、「青空文庫」から「明暗」の電子テキストをダウンロードした。そして、バージョンアップした"wordfreq"で- 津田
- お延
- 清子
- 吉川
しかし、これだけでは、よくわからない。せいぜい「清子」が小説の後半(といっても、未完であるが)に登場しているなぁ、という位だろう。しかし、さらに解析を加えてみると、もう少し面白いことがわかる。
今回は、これらの登場人物間のお互いの関わりを調べたいのである。であるならば、これらの「登場人物」の出現分布の間の相関を調べてみると面白いだろう。互いの関係を示す「相関」を調べてみるのである。異なる「登場人物」が同じような出現をしているならば、それは無関係ではない。きっと、その登場人物の間には何らかの関係があるに違いないのだ。
そこで、「明暗」を時系列的に6つの部分に分けて、津田と他の登場人物の出現分布間の相関を調べてみたのが次のグラフである。
このグラフでは、横軸が時系列であり、縦軸が相関を示している。縦軸で上になればなるほど相関が高い、すなわち、「関係がある」のだ。「相関」は本人の場合で「1」である。だから、例えば最後の部分の清子の「0.6」という結果は関係がアリアリということを示しているわけだ。
また、「清子」と「吉川(ここでは夫人を意図している)」の相関が逆であることが面白いだろう。「吉川」が活躍(暗躍?)した後に、「清子」が登場するわけだ。
そして、この「明暗」が盛り上がっていくようすすら、見えてはこないだろうか?全く血の通っていないPCが解析した結果が、漱石の描こうとした「こころ」の動きを読みとっているような気が(少しは)しはしないだろうか?そして、このグラフの延長線上に、漱石の描くはずだった、「明暗」の結末はあるはずなのだ。
さて、このグラフを見ていると、
で計算した恋の多体(三体)問題の計算結果を思い出してしまう。 漱石は、きっと恋の三体問題を意識しながら「明暗」を書いたのである。だから、ある意味当然なのではあるが、科学と文学の一体化した世界が感じられ、とても面白い気分である。さて、この解析結果を元にして、まだまだ色々とやってみたのであるが、それは次回である。