hirax.net::恋の力学 恋の相関分析編::(2000.04.01)

恋の力学 恋の相関分析編 

「明暗」の登場人物達の行方

 「恋の力学」シリーズである。前書き編が登場したきりで、なかなか本編に入らない「恋の固体物理学」シリーズではない。今回は、

の続き、ということになる。

 以前、

の中で書いたように、恋の力学シリーズは夏目漱石の影響を多大に受けている。そして、同様に夏目漱石の影響を受けているシリーズがある。それは「文章構造可視化シリーズ」である。

 何しろ、「文章構造可視化シリーズ」は夏目漱石をきっかけとして、始まっているのである。また、シリーズの中の話を見ればわかるように、

この「文章構造可視化シリーズ」の半分は「漱石」に関係しているのである。そこで、今回はこの「文章構造可視化シリーズ」と「恋の力学シリーズ」を繋げてみたい、と思う。文学も科学も「ごった煮」にしてみたいのである。

 そのための準備として、まずは「文章構造可視化シリーズ」で作成した"wordfreq"をバージョンアップしてみた。その動作画面を以下に示す。
 

ファイル出力をつけたwordfreqの動作画面

 赤丸で示したボタンに「ファイル出力」と書いてあるのがわかると思う。つまり、文章中に「任意の単語」が出現した出現頻度を解析した結果をファイル出力する機能を持たせたのだ。1段落中に「任意の単語」が出現した数をテキスト形式で出力するようにしてある。このファイル出力結果を他のソフトに読み込めば、色々な解析ができるわけだ。いつものように、このソフトはここ

においておく。言うまでもないが、アルファ版の中のアルファ版だ。

 さて、今回用いるテキストは

でも登場した「明暗」である。そこで、「青空文庫」から「明暗」の電子テキストをダウンロードした。そして、バージョンアップした"wordfreq"で
  1. 津田
  2. お延
  3. 清子
  4. 吉川
という4つの名前の出現分布を解析してみた。その出力結果をExcelに読み込んでグラフにしたのが次のグラフである。「明暗」の中の「津田」、「お延」、「清子」、「吉川」の出現分布を示したものである。つまり、主人公「津田」と、彼をめぐる三人の女性の出現の状況を示したものだ。
 
「明暗」の中の「津田」、「お延」、「清子」、「吉川」の出現分布

 しかし、これだけでは、よくわからない。せいぜい「清子」が小説の後半(といっても、未完であるが)に登場しているなぁ、という位だろう。しかし、さらに解析を加えてみると、もう少し面白いことがわかる。

 今回は、これらの登場人物間のお互いの関わりを調べたいのである。であるならば、これらの「登場人物」の出現分布の間の相関を調べてみると面白いだろう。互いの関係を示す「相関」を調べてみるのである。異なる「登場人物」が同じような出現をしているならば、それは無関係ではない。きっと、その登場人物の間には何らかの関係があるに違いないのだ。

 そこで、「明暗」を時系列的に6つの部分に分けて、津田と他の登場人物の出現分布間の相関を調べてみたのが次のグラフである。
 

津田と他の登場人物の出現分布間の相関
横軸->時系列、縦軸->相関

 このグラフでは、横軸が時系列であり、縦軸が相関を示している。縦軸で上になればなるほど相関が高い、すなわち、「関係がある」のだ。「相関」は本人の場合で「1」である。だから、例えば最後の部分の清子の「0.6」という結果は関係がアリアリということを示しているわけだ。
 また、「清子」と「吉川(ここでは夫人を意図している)」の相関が逆であることが面白いだろう。「吉川」が活躍(暗躍?)した後に、「清子」が登場するわけだ。

 そして、この「明暗」が盛り上がっていくようすすら、見えてはこないだろうか?全く血の通っていないPCが解析した結果が、漱石の描こうとした「こころ」の動きを読みとっているような気が(少しは)しはしないだろうか?そして、このグラフの延長線上に、漱石の描くはずだった、「明暗」の結末はあるはずなのだ。

 さて、このグラフを見ていると、

で計算した恋の多体(三体)問題の計算結果を思い出してしまう。
 
恋の多体(三体)問題の計算結果の一例

 漱石は、きっと恋の三体問題を意識しながら「明暗」を書いたのである。だから、ある意味当然なのではあるが、科学と文学の一体化した世界が感じられ、とても面白い気分である。さて、この解析結果を元にして、まだまだ色々とやってみたのであるが、それは次回である。
 

この記事と関係がある他の記事