hirax.net::Keywords::「螺旋」のブログ



1999-07-14[n年前へ]

夏目漱石は温泉がお好き? 

文章構造を可視化するソフトをつくる


 先週は新宿で開催されていた可視化情報シンポジウム'99を見ていた。参加者の世界が狭い(ジャンルが狭いという意味ではない)し、学生の発表が多すぎるように思ったが、少なくとも本WEBのようなサイトで遊ぶには面白い話もあった。というわけで、これから何回か「可視化情報シンポジウム'99」記念の話が続くかもしれない。とりあえず、今回は「小説構造を可視化しよう」という話だ。

 まずは、「可視化情報シンポジウム'99」の発表の中から一番笑わせて(笑ったのはいい意味ですよ。決して皮肉ではないですよ。しつこいようですが、ホントホント。私のツボに見事にはまったのだからしょうがない。)もらった発表のタイトルはこれである。
文学作品における文体構造の可視化 - 宮沢賢治「銀河鉄道の夜」の解析-
白百合女子大学大学院の金田氏らによる発表だ。予稿集から、その面白さを抜き出してみよう。まずは過去の研究の紹介をしている部分だ。

作品(hirax注:夏目漱石の「虞美人草」と「草枕」)の始まりから終わりまでを時系列で捉えると(hirax注:話法に関する解析をすると)、二作品はともに円環構造、つまり螺旋構造を描きながら、物語が進行していくことが、四次元空間上に表現された。
中略
これは、作品の解析結果を可視化することで、夏目漱石の思考パターンと内面の揺れが明らかにされたことを意味する。
 

 なんて、面白いんだ。この文章自体がファンタジーである。こういうネタでタノシメル人にワタシハナリタイ。おっと、つい宮沢賢治口調になってしまった。そして、今回の発表の内容自体は、宮沢賢治の「銀河鉄道の夜」の中に出てくる単語、「ジョバンニ・カンパネルラ・二」という三つの出現分布を調べて構成を可視化してみよう、そしてその文学的観点を探ろう、という内容だ。

 本サイトは実践するのを基本としている。同じように遊んでみたい。まずは、そのためのプログラムを作りたい。名づけて"WordFreq"。文章中の単語の出現分布を解析し可視化するソフトウェアである。単語検索ルーチンにはbmonkey氏の正規表現を使った文字列探索/操作コンポーネント集ver0.16を使用している。

ダウンロードはこちらだ。もちろんフリーウェアだ。しかし、バグがまだある。例えば出現平均値の計算がおかしい。時間が出来次第直すつもりだ。平均睡眠時間5時間が一月続いた頭の中は、どうやらバグにとって居心地が良いようなのだ。
wordfreq.lzh 336kB  バグ有り版

バグ取りをしたものは以下だ(1999.07.22)。とりあえず、まだ上のプログラムは削除しないでおく。

失楽園殺人事件の犯人を探せ - 文章構造可視化ソフトのバグを取れ - (1999.07.22)

 動作画面はこんな感じだ。「ファイル読みこみ」ボタンでテキストファイルを読みこんで、検索単語を指定して、「解析」ボタンを押すだけだ。そうすれば、赤いマークでキーワードの出現個所が示される。左の縦軸は1行(改行まで)辺りの出現個数だ。そして、横軸は文章の行番号である。すなわち、左が文章の始めであり、右が文章の終わりだ。一文ではなく一行(しかもコンピュータ内部の物理的な)単位の解析であることに注意が必要だ。あくまで、改行までが一行である。表示としての一行を意味するものではない。なお、後述の木村功氏から、「それは国語的にいうとパラグラフ(段落)である。」という助言を頂いている。であるから、国語用の解析を行うときには「行」は「段落」と読み替えて欲しい。また、改行だけの個所には注意が必要だ。それも「一行」と解釈するからである。

WordFreqの動作画面

 「スムージング解析」ボタンを押せば、その出現分布をスムージングした上で、1行辺りに「キーワード」がどの程度出現しているかを解析する。
 そう、この文章は長い文章の中でどのように特定の単語が出現するか解析してくれるのである。

 それでは、試しに使ってみよう。まずは、結構好きな夏目漱石の小説で試してみたい。
電脳居士@木村功のホームページ 
から、「ホトトギス」版 「坊っちやん」のテキストを手に入れる。そして解析をしてみよう。まずは、この画面は夏目漱石の「坊っちやん」の中で「マドンナ」という単語がどのような出現分布であるかを解析したものである。

夏目漱石の「坊っちやん」の中の「マドンナ」という単語の出現分布

 文章の中ほどで「マドンナ」は登場してくるが、それほど重要なキャラクターでないことがわかる(このソフトがそう言っているんで、私が言っているのではない。だから、文句メールは送らないで欲しい)。

 それでは、「湯」というキーワードで解析してみよう。「坊っちやん」と言えば道後温泉であるからだ。

夏目漱石の「坊っちやん」の中の「湯」という単語の出現分布

 おやおや、「マドンナ」よりもよっぽどコンスタント(安定して、という意味で)に「湯」という単語は出現するではないか。出現平均値は「マドンナ」の方が多いが、安定度では「湯」の方が上だ。夏目漱石は「マドンナ」よりも「湯」すなわち温泉によっぽど興味があるようだ。

 主人公を育てた重要人物「清」を調べてみると、こんな感じだ。

夏目漱石の「坊っちやん」の中の「清」という単語の出現分布

 小説の初めなんか出ずっぱりである。あと小説のラストにも登場している。

 どうだろうか。見事に小説の可視化に成功しているだろう。結構、この解析は面白い。すごく簡単なのである。
 これから新聞、WEB、小説、ありとあらゆる文章を可視化し、構造解析していくつもりだ。みなさんも、このソフトを使って面白い解析をしてみるとよいのではないだろうか? とりあえず、高校(もしかしたら大学の教養)の文学のレポートくらいは簡単に書けそうである。もし、それで単位が取れたならば、メールの一本でも送って欲しい。

 というわけで、今回はソフトの紹介入門編というわけで、この辺りで終わりにしたいと思う。

2000-09-07[n年前へ]

草枕で遊ぶ 

それが人間の科学なんだよ、と誰かが言った

 どうしても割り切らないではいられない話だと知った時、それが人間の科学なんだよ、と...(半神)


 私が大好きな演劇の一つに「半神」がある。レイ・ブラッドベリ・萩尾望都・野田秀樹の共作とも言うべきこの「半神」の中で1/2+ 1/2 = 2/4 という「螺旋方程式」の謎に対して

「その謎はひとごと(他人事)ではない。」
「ひとごと(人ごと)でないのだから、その謎は化け物に関わることだ。」
というレトリックが使われていた。ここでは「ひとごと」という言葉の意味を巧みに切り替えて、「論理をすり替え」ている。こんなレトリックが私は気持ち良くて大好きだ。急斜面のコブを巧みにすり抜けていくスキーのモーグル選手みたいで、爽快な感じがするのである。

 ところで野田秀樹ほど言葉遊びが巧みな人もそうそういないだろうが、この

「ひとごと(人ごと)でないのだから、その謎は化け物に関わることだ。」
というもののオリジナルはもちろん夏目漱石の草枕の冒頭部だろう。その草枕の冒頭部分を部分的に抜粋するとこんな感じになる。

 智に働けば角が立つ。情に棹させば流される。意地を通せば窮屈だ。とかくに人の世は住みにくい。人の世を作ったものは神でもなければ鬼でもない。やはり向う三軒両隣りにちらちらするただの人である。ただの人が作った人の世が住みにくいからとて、越す国はあるまい。あれば人でなしの国へ行くばかりだ。人でなしの国は人の世よりもなお住みにくかろう。

 この

人の世が住みにくい」
->「人が作った世が住みにくいならば、人でないものの世なら住みやすいだろうか」
-> 「人でなしの国へ行くばかり」
-> 「人でなしの国は人の世よりもなお住みにくい」
という巧みな論理はどうだろうか?私には実に爽快な自然な飛躍に感じられる。目的とする場所へ、巧みに言葉を切り替えていくことで自然に辿り着くこんなやり方がとても気持ちが良い、と私は思う。

 ところで、以前

でも挙げたとても面白い
  • 「漱石とあたたかな科学」小山慶太著 講談社学術文庫
  • の中でもこの草枕冒頭部の論理のすり替えについて触れられていて、その中で漱石の「文学評論」中の
     花は科学じゃない、しかし植物学は科学である。鳥は科学じゃない、しかし動物学は科学である。文学はもとより科学じゃない、しかし文学の批評または歴史は科学である。
    というレトリックに対しても
    「文学のどこに観察、実験、数理解析が施せるのであろうか。」
    と書かれている。もちろん、「文学を味わうのは心であるべき」ということは言うまでもない。しかし、「文学のどこに観察、実験、数理解析が施せるのであろうか。」というところで思考を停止してしまうのは、実に残念であると私は思う。そこで、今回は「草枕」を題材に採って、いつものように単語解析をすることで、適当な考察をしてみることにした。「草枕」に対して数理解析をして遊んでみたい、と思うのである。

     「草枕」は青年画家がブラブラしたり、ボうっと色々なことを考えたりする話だ。そして、いかに芸術が生まれるかということに考えてみたりするのである。例えば、冒頭では

     住みにくさが高じると、安い所へ引き越したくなる。どこへ越しても住みにくいと悟った時、詩が生れて、画が出来る。
    という具合である。また、途中の部分では
    して見ると四角な世界から常識と名のつく、一角を磨滅して、三角のうちに住むのを芸術家と呼んでもよかろう。
    というように書かれている。

     一体、青年画家がどんな時に「画」を書くのかどうかを知るために、他の単語の出現分布と「画」の出現分布を調べてみることにした。今回、ノミネートしてみた単語は「角」・「男」・「女」である。

     角が立つ四角い人の世の中で三角のうちに住むのが芸術家であるならば、その「角」と「画」の相関は調べてみたいと思うハズである。また、これまでに様々な「男」と「女」の関係を考えてきた「できるかな?」であるから、やはりここは「男」と「女」もノミネートしないわけにはいかないだろう。

     そこで、「画」・「角」・「男」・「女」の各語の出現分布を調べてみたのが次の各図である。もちろん、今回も前回

    と同じく、wordfreqを使って解析を行った。
     
    「画」・「角」・「男」・「女」の各語の出現分布
    「画」
    「角」
    「男」
    「女」

     次に、「画」の出現分布に対するそれぞれの言葉の出現分布の相関値を計算してみよう(なお、計算の安定のために、適当な平滑化をここでは行っている。)主人公の青年画家がどんな時に「画」について考えたり、描こうとしたりするかを考えてみるわけである。その計算結果が次の表である。
     

    「画」の出現分布に対するそれぞれの言葉の出現分布の相関値
     
    相関係数
    0.08
    0.09
    0.21

     そして、さらにこれをグラフにしてみたものが、下のグラフである。
     

    「画」の出現分布に対するそれぞれの言葉の出現分布の相関値のグラフ

     おやおや、困ったなぁ。ちょっと、この「画」と「女」の相関の高さはちょっと異常だなぁ。「角」や「男」の出現分布の「画」に対する相関は0.1以下であるが、何と「女」は0.2を越えている。最初は、「画」と「角」を強引に結びつけて話を終わらせるつもりでいたのになぁ。これじゃぁ、主人公はヒロインを前にするときだけ芸術家になるみたいじゃないの。おかしいなぁ、こんな狙いじゃなかったのになぁ...まるで、「草枕」は漱石の前田卓へのラブレターみたいに思えてきてしまうではありませんか...
     う〜ん、これはどっか間違えたかなぁ。まぁ、いいや。今日はもう眠いし。
     

     ところで、「草枕」ではどのようにして文学・音楽・絵画などのさまざまな芸術が生まれて来るかが書かれている。そして、冒頭の「半神」でも、シャム双生児の姉妹とともに「螺旋方程式」の謎を追いかけるうちに、人の心を動かす孤独と音が生まれてくるようすが語られていく。
     

    孤独は、ヒトになる子にあげよう。代わりに、おまえには音をつくってあげよう。
    ( 夢の遊眠社 半神 )

     今回の相関解析では、「芸術は女を前にしたときに生まれる」というフザケタ結果に終わってしまったが、その真偽についてはまたいつか考えてみることにして、とりあえず今回は草枕の中の台詞で話を強引に終わらせたいと思う。
     

     越す事のならぬ世が住みにくければ、住みにくい所をどれほどか、寛容て、束の間の命を、束の間でも住みよくせねばならぬ。ここに詩人という天職が出来て、ここに画家という使命が降る。あらゆる芸術の士は人の世を長閑にし、人の心を豊かにするが故に尊とい。

    2000-11-19[n年前へ]

    螺旋階段のアリス 加納朋子 

     今日、買った本。「だってそうでしょう?箱は開けてみなきゃ、中身はわからない。電話は出てみなきゃ、相手はわからない… 少なくとも、旧式の電話はね。人の心だってそうよ。こうして…」「-ノックしてみないと、わからないの」

    2001-01-24[n年前へ]

    The right equation is not always right for left side. 

     一年間の英語研修も終わりに近づき、今は毎日レポートを宿題で一個書いて、それについての話を研修時間中にしている。といっても、レポートの内容はWEBに書いた記事を組み合わせ直して書いているだけだ。といっても、英語オンチな私には結構キツイ。しかし、話の展開によっては英語で書く方が楽だったりするのが面白いところである。ちなみに今日書いた話は、「Pandora's box + 掌の中の答え + Right Eye」。螺旋方程式はtwins equationということにして、その方程式の右辺と左辺の話にRightとLeftをからめた。 もし野田秀樹が英語で書いていたら、stageの左右も加わって素晴らしい世界を作るのだろうなぁ。

    2004-01-19[n年前へ]

    ある夜灯台が 

    1 そういえば、去年の年末近いある夜に「日本海沿いの灯台が土台だけを残して消失してしまった」という不思議な事件があった。もちろん、そんな話を聞くとブラッドベリあるいは萩尾望都の霧笛を思い出すわけです。海の底から、「千マイルもの向こうの二十マイルも深い海底から百万年もの時を経てゆっくり目覚めたもの」が灯台の霧笛に呼ばれてやってきて、そして、霧笛の途絶えた灯台を壊してしまった、という霧笛を思い出すわけです。

     霧笛と言えば、このリンク先の批評はなかなかに読み応えがあります。もし、ブラッドベリや萩尾望都の霧笛、あるいは萩尾望都や野田秀樹の半神を好きであれば、読んでみることをお勧めします。

    これまでぼくはずっと、たったひとつの音を発し続ける装置について考え続けていた。あらゆる海、あらゆる時間、あらゆる霧の中を押し分けて、剥き出しのまま届きぼくのなかに響く声、…引き剥がすことのできない声を発する装置。「霧笛」だ。  萩尾望都・野田秀樹の戯曲「半神」には、「霧笛」のある一部分が引用されていて、交錯するこのふたつのテクストは、まるで「霧笛」のなかの灯台とそれに相対する怪物の声のように、それぞれぼくの霧の中で深い孤独のうちに呼応しあっている。「半神」は孤独、決定的なひとつの不在を生きること、について描き、「霧笛」はその孤独な他者へ呼びかける声の乗り越えられなさを描いていると言っていいかもしれない。ともかくどちらも、深い愛についての話だ。
     こんな「何かに対する見方の一つ」を与えてくれて、しかもその見方から見える世界が「とても深い世界」になっているというのは、とても素晴らしい批評だと思う。元の何かに対する価値を高めてくれる批評というものは、実に素晴らしい批評だと思う。

     演劇「半神」の中には「1/2+1/2=2/4」という螺旋方程式が出てくる。「1/2+1/2=2/2」ではない。「1/2+1/2=2/4」であって、その答えは割り切らなければならないがために、その結果は「1/2+1/2=2/4=1/2」となる。スフィンクスの問いを踏まえて言えば、その螺旋方程式の答えは「一人+一人=一人」になる。シャム双生児を別れさせたならば、その結果は一人だけしか生き残ることはできないということ。あるいは、DNAの二重螺旋の二本の鎖がいくら絡み合っても、結局のところ決して交わらないということ。だけど、やはりそれでも左辺のように足し算をしたくなるということ。そういった色んなことを示しているようにも見える。もっと、シンプルに言ってしまえば、いやそれが「1/2+1/2=2/4」という数式になるのか。

     そんなわけで、もう少し引用しておこう。
    眠りを呼びさます、その場所から引き剥がす「声」なじんだ場所、体の張り付いてしまった所から引き剥がされることは、快楽でありながら 時として耐え難い痛みを伴うものだ。まして「百万年も待っていた」なら、なおさらのことだ。しかし目覚めないわけにはいかない。「声」が届いた、あるいは届けられてしまったのだから。 彼は深く沈んだ海の重み、強い耐え難さの中を耐えながら上昇してくる。「一時間ごとに数フィートずつ昇っては、ゆっくりとその体を慣らしたあげく、やっと水面に近づいても生きていられるようになる。だから、水面へ出るまでに三ヶ月はたっぷりかかり、さらに、それから灯台まで冷たい海を泳いで何日もかかる」 そして破壊のあとに、怪物は鳴く。灯台はなくなってしまっていた。百万年の向こうから怪物に呼びかけていたものはなくなってしまったのだ。言うまでもなく、ここでは怪物における不在、かつて「存在したが(今では)なくなってしまったもの」という存在が、彼の声帯に繋がれているのだ。



    ■Powered by yagm.net