hirax.net::Keywords::「寺田寅彦」のブログ



1999-09-10[n年前へ]

「こころ」の中の「どうして?」 

漱石の中の謎とその終焉

 考えてみると、www.hirax.netには夏目漱石が時々顔を出す。例えば、

などだ。もともと、夏目漱石は寺田寅彦・ロゲリギストといった物理学者の流れの源と言っても良いものだから、その影響を多々受けている私のWEB中に出てくるのは自然なのだろう。

 というわけで、今回こそは夏目漱石がメインの話である。漱石の「こころ」を「夏目漱石は温泉がお好き?- 文章構造を可視化するソフトをつくる - (1999.07.14)」「失楽園殺人事件の犯人を探せ- 文章構造可視化ソフトのバグを取れ - (1999.07.22) 」で作成した文章構造可視化ソフトWordFreqで解析してみるのだ。そして、「こころ」で繰り返し問われる謎がどのようにして終焉を迎えていったかを考察してみたい。いや、考察というほどのものではなく、考えてみたい、それだけだ。

 何故、私がそういう気持ちになったかといえば、それは小山慶太著の「漱石とあたたかな科学」講談社学術文庫を読んだせいである。

 今回のテキストである漱石の「こころ」は

から集英社文庫によるj.utiyama、伊藤時也 らによる作成のものを入手した。

 言うまでも無いと思うが、「こころ」は学生である「私」と「先生」との間で進む物語である。「私」が先生と出会い、そして「先生」の物語が語られる。
 それでは、「先生」と「私」の出現分布を可視化してみる。両者とも1100行辺りで大きく変化しているのがわかる。これは、ここから「下 先生と遺書」に入るからである。一人称である「私」は学生の「私」ではなく、「先生」である「私」になる。ここからは「先生」である「私」の物語になるのである。
 また、冒頭をピークとして「先生」の出現頻度は単調に低下していく。学生である「私」から、先生である「私」への視点の移り変わりはもしかしたら冒頭から形作られているのかもしれない。

先生(左)、私(右)の出現分布 (水平軸は左->小説の始め、右->小説の終わり)

 ところで、「こころ」は「どうして」という謎と「解らない」という答えの繰り返しである。それは、下のようにどうして(左)、解(右)の出現分布を見ればわかる。もちろん、「どうして」には「どうして...」も含まれれば、「どうしても」なども含まれる。また、「解」には「解らない、解る、誤解」などが含まれる。しかし、それらは大きく見れば実は同じようなものである、と思う。

どうして(左)、解(右)の出現分布

 どうして(左)、解(右)の出現分布がよく似ているのがわかると思う。「どうして」と問いと「わからない」という答えはいつも対になるのである。

 これらとちょうど反対の分布を示すのが「死、卒業」というキーワードだ。

死(左)、卒業(右)の出現分布

 「どうして」(左)、「解」(右)という言葉が出現しない時には、「死」(左)、「卒業」(右)という言葉が現れるのである。また、この「死」(左)、「卒業」(右)という言葉が現れる時は、「先生」と「先生」である「私」があまり登場しない時でもある。学生である「私」から「先生」である「私」への過渡期であり、それは同時に「死」(左)、「卒業」(右)ということを浸透させる時期でもあるのだ。

 結局、「どうして、解、死、卒業」は小説の最後において、同時に出現する。それらは最後に重なるのだ。それが答えなのか、あるいは答えがどこかに消えてしまったのか、どちらなのかはわからないままだ。

2000-08-13[n年前へ]

WEBの時間、サイトの寿命 

ゆっくり長く続けましょうか?

 以前、

でロゲルギストが
  • 第五物理の散歩道 ロゲルギスト著 岩波新書  「通信を考える」
の中で「信号の伝わる速度と距離と処理速度の関係」を論じていることについて触れた。例えば、計算機は処理速度を高めるためには回路の大きさを小さくしなければならないとか、人間の頭脳の働きの速さから集団生活の広がりの限界があるんじゃないか、という話について論じている部分である。短く言ってしまうと、「通信を考える」の中で、ロゲルギスト達は「ある系」について
  • その系の情報処理の単位時間
  • その系の信号の伝わる速度
  • その系の空間スケール
には
  • 空間スケール < 情報処理の単位時間 × 信号の伝わる速度
という関係が成り立つだろう、と論じていたのである。速いコンピュータを作るためには、コンピュータのサイズを小さくしなければならない(信号の伝わる速度= 光速度は一定で情報処理の単位時間を短くすると、空間スケールは小さくならざるをえない)、なんてのはこの一例である。また、このロゲルギストの推論からは、人と人の間の情報伝達の速度が同じなら、
  • 大人数から構成される企業のスピードは、少人数から構成される企業のそれには遙かに及ばない
などのごく当たり前の事実が導かれるわけだ。
 
 

 ところで、ロゲルギスト達はある系の「単位時間・信号伝達速度・大きさ」の間の関係について、

  • 「単位時間・信号伝達速度」を入力値として、「大きさ」を考える
  • 「大きさ・信号伝達速度」を入力値として、「単位時間」を考える
ということをしていた。ところが、この話の30年以上前に実は似たようなことを考え、この話をさらに展開していた人がいる。それはもちろん寺田寅彦である。この手の話題を考えるときには、どうしても夏目漱石-> 寺田寅彦 -> ロゲルギストという流れを意識せざるをえない、と私は思う。

 さて、寺田寅彦が「単位時間・信号伝達速度・大きさ」について、さらにどのようなことを展開していたかというと、それはある系の「大きさ・寿命」についての関係である。寺田寅彦は

  • 空想日録 三 身長と寿命 (寺田寅彦随筆集 第四巻 岩波文庫 小宮豊隆編)
の中で
  • 人体感覚について振動感覚の限界を調べた実験データ、 - 人は自らの体の固有振動周波数の振動に対してもっとも過敏である- 、というものをきっかけとして、
  • 生物の時間の長さの単位は相対的なものである
  • ある系の「時間の長さの感覚 = 相対的な単位」はその系の固有周期と密接な関係がある(振り子時計なんてわかりやすいだろう)
  • ある系の「寿命」を測る単位は、その系の「時間の相対的な単位」、すなわち、その系の固有周期だと想像してみよう。
  • その場合、ある系の固有周期はその系の大きさに比例するから、大きい動物ほどその系の「時間の相対的な単位」は長いものとなり、見かけ上の「寿命」はその動物の「大きさ」に比例するだろう。
という想像を展開している。

 なるほど、サイズが小さい動物(すなわち固有振動の波長の短い動物)にとっては、ほんの小さな変化も大きな変化である。ということは、その動物の感じる「時間単位」は短くなければ、生き残れないだろう。逆に、サイズの大きな動物は俊敏な動きはできないわけで、その動物の「時間単位」は長くならざるをえないだろう。
 ゾウのような大きい動物は「時間単位」が長く、一見「寿命」が長いように見え、ノミのような小さな動物は「時間単位」が短く、一見「寿命」が短く見えるというわけだ。実は、ゾウもノミもその動物自身の「時間単位」を基準にすると、同じ寿命を生き抜いているということになる。

 本川達雄の中公新書「ゾウの時間 ネズミの時間」では- 体重の4分の1乗に比例して「その動物の時間単位=生理的時間」が長くなる-と述べられているが、昭和八年に既に寺田寅彦は体重は身長の3乗に比例する、逆に言えば体重は身長の3分の1乗に比例するから、「体重の3分の1乗に比例して時間が長くなるだろう」と想像を巡らせているのである。素晴らしい、想像力である。
 

 さて、寺田寅彦はロゲルギストと違って、「単位時間・大きさ」については言及しているが「信号伝達速度」については触れていない(その替わり、さらに「寿命」にまで触れているわけであるが)。もっとも、私があえて書き加えてみるならば、ある系の固有振動にはその系の中での弾性が密接に関係するし、弾性はその中での弾性波の速度も密接に関係する。つまり、ある系の固有振動の周期というものには「その系中での波の伝達速度」が暗に隠されていて、寺田寅彦は単にそれを一定とおいていたわけで、寺田寅彦が述べた内容は実はロゲルギスト達の述べた内容を包括している、と私は思うのである。
 

 このような「単位時間・大きさ・信号伝達速度・寿命」に関する話は動物に限るものではない。

  • ロゲルギストが「信号伝達速度=光速度」として、「処理速度を確保する」ための人類の行動範囲について論じたり、
  • 私(いきなり自分を例に出すのも何だが)が「信号伝達速度の変化」と「大きさ(人口)の変化」から人類の処理速度の変化について論じたり
したように、集合体に対してもその適用が可能であると思う。ここらへんは、ロゲルギスト達が寺田寅彦の想像しえた範囲を越えている部分でもあり、時の流れを感じさせる部分でもある。
 

 さて、前振りが長くなった。前回、

では、単に「信号伝達速度の変化」と「大きさ(人口)の変化」を並べて「処理速度」の変化について考えてみただけだった。今回は寺田寅彦が考えたのと同じく、「信号伝達速度」と「大きさ(人口)」から「寿命」が決まると考えることにより、「人類」の「寿命」の変化について考えてみることにしたいと思う

 まずは、前回使った「人類の大きさ=人口」の変化が次のグラフである。ただし、この人口は全然正確ではないし、むしろかなり不正確なものであることは先に断っておく。ここでは、細かな値を使うのが目的ではないので別に構わないだろう。
 

「人類の大きさ=人口」の変化

 そして、「人類」の中での「情報伝達速度」の変化を示したものが次のグラフである。この速度が「人類」という集合体の中での波の進行速度を決めるのである。
 

「情報伝達速度」の変化

 それでは、「人類」という集合体の固有振動はどうやって扱うかというと、この

  • 「人類の大きさ=人口」
  • 「情報伝達速度」
から求めることができる。「人類の大きさ=人口」をその内部での波の速度「情報伝達速度」で割った
  • 人口 / 情報伝達の速度
というものが、「人類の固有時間」の目安となるのである。この「人類の固有時間」が短くなれば、人類の時間の流れは速くなり、それに応じて見かけの「寿命」は短くなる。これが逆に、「人類の固有時間」が長くなれば、人類の時間の流れは遅くなり、それに応じて見かけの「寿命」は長くなるのである。

 その、人口 / 情報伝達の速度 = 「人類の固有時間」を計算してみたものを次に示してみよう。
 

固有「時間単位」の変化

 こうしてみると、人類というヒトの集合体においては、どんどん時間の流れは速くなり、それに応じて見かけの「寿命」は短くなっている、ということがわかる。人類はまさに生き急いでいるのである。もし、この流れを止めようと思ったら、どうしたら良いだろうか?それには、今回の計算から言えば情報転送速度を遅くするか、人類の大きさを大きくするしかない。情報転送速度を遅くするのはなんとも後ろ向き(byわきめも)だし、人口を減らすというのもなんとも後ろ向きだ。だとしたら、宇宙へでも人類が進出して、人類の空間的なスケールを大きくしていくしかないのだろうか?これもまた難しい話である。
 

 さて、最近、大好きなWEBサイトが閉鎖してしまったり、更新速度が遅くなっていたりしていて少しさみしい。だけど、もしかしたら各WEBサイトにも、「更新速度が速いと、WEBサイトの寿命が短い」なんて法則が実はあるのかもしれない。更新速度が速いということは、そのWEBサイトの固有時間が速く流れているということで、限られた寿命をどんどん使い果たしているのかもしれない。

 だとしたら、更新速度が遅いということはそのWEBサイトの寿命が長くなるということだから、それはそれで良いのかなぁ、などと思ってみたりする。「太くて短い寿命」も「細くて長い寿命」も実は本人からすればどちらも同じ長さなのかもしれないけれど、外から見ている私は「細くても良いから長く続いて欲しいなぁ」なんて思ってもみたりするのである。
 

2000-09-13[n年前へ]

化け物の進化 

 化け物がないと思うのはかえってほんとうの迷信である。宇宙は永久に怪異に満ちている。あらゆる科学の書物は百鬼夜行絵巻物である。それをひもといてその怪異に戦慄する心持ちがなくなれば、もう科学は死んでしまうのである。

寺田寅彦

人でなしの世界 

 化け物の出入りする世界は科学の世界である。同時にまた芸術の世界ででもある。

寺田寅彦

2001-02-19[n年前へ]

ひとりで書いてるだけだから。 

ヘッポコ文章を直したい


   面白い情報を探しにと「お笑いパソコン日誌」を眺めていると、「ウエヤマの事件簿」の「他人の日記をオモチャにしよう!」が紹介されていた。「お笑いパソコン日誌」に〜『できるかな?』風ネタであります〜と紹介されてあった通り、実に私好みの話だった。ウエヤマ氏が「自分で書いてる日記の文章」を解析して、文字の出現頻度を調べてみたものである。

 「できるかな?」は画像や科学の関連の話が多いように見える。しかし、実はそれだけではなくて文章や日記に関する話も多い。例えば、これまでに出てきた話を振り返ってみると、

に始まり、と続く、「文学の世界を眺めてみよう」という話など、あるいは「WEBページで見かける文体の特徴を解析しよう」としたなど、あるいは「WEB日記の文化を眺めて見たい」というなどの話があった。「技術サイト」という分類をされることも多い本サイトではあるのだけど、非技術的な話に強引に技術的な話を持ち込みたくなったり、技術的な話なのに何故かとても私的で非技術的な話が入ってしまったりするのが、良くも悪くも「できるかな?」の特徴だろう。もちろん、良いことでは全然無いのだけれど、こうでも書かないと悲しい気分になってしまうので、「良くも悪くも」と書いているのである。

 そういったhirax.netの特長ならぬ特徴は私が書く文章が下手なせいなわけで、そんなヘッポコ文章から脱出するべく、私の書く文章の特徴を調べて反省してみることにした。もちろん、自分のヘッポコ文章だけを眺めてみてもしょうがない。他の素晴らしい文章を書く書き手と比較しなければならないだろう。そこで、今回はいくつかの文章を品詞解析し、その結果の特徴を調べることにする。そして、書き手による文章の特徴が眺めながら、私のヘッポコ文章の欠点を調べ、さらには誰もが思わず涙がこぼしてしまうような素晴らしい文章を書けるようになりたい、と思うのである。
 

 さて、まずは目標を決めよう。私がヘッポコ文章を脱出してどんな文章を目指すかを、何より先に決めなくてはならない。となれば、あまりにも大それた目標ではあるのだが、やはり日本の文豪、夏目漱石は外せないだろう。そして、その教え子でもある寺田寅彦もやはり外すわけにはいかない。一応私も理系のはしくれ、日本の理系文章の流れを作ったこの二人を目標にしなくてなんとしよう。ヘッポコ文章を脱出していきなり、夏目漱石と寺田寅彦というところに無理があるが、そんなことを考えていては駄目なのである。「少年よ大志を抱け」とクラーク博士も言ったのである。もう少年と言うにはどう考えても年齢的に無理があるのだが、気持ちはまだまだ少年で目標は大きく持ってみたいと思うのである。

 そして、もう一人の目標は「ちゃろん日記(仮)」をマイペースに書き続ける「ななゑ」さんである。私は彼女の書く文章を読むたびにとても素晴らしい理系的センスが感じ続けているのである。しかも、理系的でありつつも笑いと涙のペーソスたっぷりの「ちゃろん文体」という独自の確固とした文体を築いているところも尊敬していたりするのである。

 というわけで、今回の文章の比較は

  1. 夏目漱石
  2. 寺田寅彦
  3. ちゃろん日記(仮) ななゑ
  4. 「できるかな?」 jun hirabayashi
の四人の書き手の文章を適当に二つずつピックアップして、その文章を品詞解析して簡単に特徴を眺めてみることにした。各書き手に対して、それぞれピックアップした文章はである。なお、夏目漱石と寺田寅彦は「青空文庫」から入手した。そして、これらの文章を日本語形態素解析システム茶筌&perlで解析後、Excelでさらに解析・表示を行ってみることにしよう。

 ところで、形態素解析とはどのようなものだろうか。まずは、例を挙げよう。例えば、

私が好きな書き手達は、夏目漱石、寺田寅彦、ななゑさんです。
という文章を茶筌で分解すると、
  1. 私 名詞-代名詞-一般
  2. が 助詞-格助詞-一般
  3. 好き 名詞-形容動詞語幹
  4. な 助動詞
  5. 書き手 名詞-一般
  6. 達 名詞-接尾-一般
  7. は 助詞-係助詞
  8. 、 記号-読点
  9. 夏目 名詞-固有名詞-人名-姓
  10. 漱石 名詞-固有名詞-人名-名
  11. 、 記号-読点
  12. 寺田 名詞-固有名詞-人名-姓
  13. 寅彦 名詞-固有名詞-人名-名
  14. 、 記号-読点
  15. ななゑ 名詞-固有名詞-人名-名
  16. さん 名詞-接尾-人名
  17. です 助動詞
  18. 。 記号-句点
というようになる。このように各文章を品詞毎に分解して、その出現分布から特徴を調べてみるのである。なお、今回注目した品詞は
  1. 読点
  2. 形容詞
  3. フィラー
  4. 感動詞
の四つである。この四つを選んだ理由は、読点は明確な決まりがないだけに書き手の感覚が入りやすいと思われ、形容詞、フィラー・感動詞に関しては書き手の気持ちが素直に現れやすいと思われるからである。ちなみに、フィラーとはから引用すれば、「あのー」「えー」といった語句ということになる。まずは各文章が書き手によってどのくらい特徴づけられるかのイメージを掴むために、形容詞の出現頻度とフィラーの出現頻度を軸にとり、各文章を二次元の世界に配置してみた結果を図示してみよう。
 
形容詞の出現頻度とフィラーの出現頻度を軸にとって、
各文章を二次元の世界に配置した結果

 結構、同じ書き手による文章が同じような位置に配置されることがわかると思う。ちゃろん日記(仮)などは、二つの独立した文章がほとんど同じ位置に配置されている。もう、ちゃろん文体は安定しまくっていて完成されているのである。そしてまた、「文豪」夏目漱石の場合も、「我が輩は猫である」と「坊っちゃん」がかなり近い位置に配置されていることがわかる。

 なるほど、結構書き手による特徴はこんないかにも雑な解析でも評価できるものなのかもしれない(あくまで「遊び」だけどね)。そして、形容詞の出現頻度などは、「雪だるまがいる景色」と「自然と生物」以外は大体同じようなものである。寺田寅彦の「自然と生物」は妙に形容詞の出現頻度が高いところが面白いところである。私の「雪だるまがいる景色」はあまり技術的な話ではなくて、確かに形容詞が多そうな話ではあるのだが、一体「自然と生物」はどうだっただろうか?

 ちなみに、「できるかな?」からの二つの文章は共にフィラーが一個も出てこない。その他の6つの文章にはフィラーが出てくるのであるが、何故か「できるかな?」の二つの文章にはフィラーが含まれていないのである。この差がなければ、寺田寅彦の二編と「できるかな?」はかなり似た場所に位置するのであるが、このフィラーは特に違うのである。

 さて、上の図ではフィラーと形容詞の出現頻度だけを眺めてみたが、読点、感動詞の出現頻度も加えて、クラスター分析を行ってみた。つまり、「読点・形容詞・フィラー・感動詞」の出現分布が似ているものを分類してみたわけである。クラスター分析にはExcelアドイン工房「早狩」の統計解析アドインを使用させて頂いた。ちなみに、クラスターの結合はウォード法を用い、非類似度計算法には標準化ユークリッド平方距離を使用した。その結果が下の図である。
 

クラスター分析の結果

 このクラスター分析の結果を示す図は近い文章をまとめていったものを示している。つまり、文章の「近さ」あるいは「似ている度」を示しているのである。ちゃろん日記(仮)の二編は本当によく似ていて、また夏目漱石の書いた二編も互いに似ている。そして、それより「近い度」は低いが「新宿駅は電気羊の夢を見るか?」は「科学について」に近くて、「雪だるまがいる景色」は「自然と生物」に近い。おして、さらに似ているものを探せば、ちゃろんの二編と「新宿駅は電気羊の夢を見るか?」・「科学について」は似ているといえなくもない、さらに言えばその四編と夏目漱石の二編が似ている。

 ここでは、四人の書き手がいるということが私には判っているので、あえて四つのクラスターに分解してみると、

1.
    • 「雪だるま」がいる景色
    • 自然と生物
    2.
    • 新宿駅は電気羊の夢を見るか?
    • 科学について
    3.
    • ちゃろん日記1998(仮)11月上旬
    • ちゃろん日記1999(仮)6月上旬
    4.
    • 我が輩は猫である
    • 坊ちゃん
という風になる。やはり夏目漱石とちゃろん日記に関してはこんなチープなごく少数の品詞解析でも、「作者の文体が同じである」と解析されてしまうのである。なかなか、スゴイとは思わないだろうか?数多くの解析をしてみるのもなかなか面白いと思う。高校生のレポートくらいだったら、これで何とか書けそうである。

 しかし、その一方で考えてみれば寺田寅彦の名随筆と「できるかな?」のヘッポコ文章が「文体が近い」と解析されてしまっているわけなので、実はこの解析の信頼性はかなり低いと言わざるを得ないところもあるのである。いや、もしかしたら「文体は同じやけど、内容が全然違いますがな」というような冷たいアドバイスを解析結果は言わんとしているのかもしれないが、もうそれは哀しすぎる事実なので考えたくないのである。

 さて、そう言えば一番最初の図で「できるかな?」と寺田寅彦の差はフィラーの出現分布だったわけであるが、「大学の講義における文科系の日本語と理科系の日本語-- 「フィラー」に注目して --」では、「聞き手への働きかけのあるフィラーが多いということは聞き手への配慮が大きいということにつながる」と書いてあった。ということは、フィラーの出現分布は聞き手への配慮に比例するというわけで、「できるかな?」の文章にフィラーが出てこない、ということは読み手に対する配慮がない、なんてことなのかなと思ってしまったりするのである。

 そんなことを考え出すと、ホラどうせひとりで書いてるだけだから読み手のことなんか考えていないのさと、思わず涙がこぼれてしまうような哀しい気持ち、になったのである。う〜む、最初は誰もが思わず涙がこぼしてしまうような素晴らしい文章を書けるようになりたいと思ったったのに、何でこんな結論になるんだろう?

 答え: それは文才がないからです。ハイ。
 
 



■Powered by yagm.net