1999-07-10[n年前へ]
■新宿駅は電気羊の夢を見るか
意識とは何か
今回は思考実験である。頭の中だけで実験を行うのだ。実際には何もしないのと同じである。手抜きだと言ってもらっても構わない。手抜きではあるが以前から気に懸かっていたことなのだ。しかも、新宿で呑む度に思うことなのだ。
考えたいことは「意識とは何か?」である。人造人間に意識は存在するのであろうか?
「人造人間なんてそんな精密なものは作ることができないから、考えてもしょうがない」と、言う人も多いだろう。確かに精密なものを作るのは難しいだろう。であれば、でっかくて大雑把なものならば、いつか作ることができるだろう。それに、まるっきりそのままの働きでなくても構わないだろう。例えば、赤血球と白血球のどちらがバイ菌と戦うか、なんて逆になったところで、やはり人間に意識はあるだろう。別に酸素を運びながら戦ってくれても構わないのだ。
それならば、細胞1個が1m位の大きさであっても構わない。実際の人間の細胞は10um程度の大きさである。それが1mになるなら1000000倍だ。その大きさが1m位の大きさの細胞で人造人間を作るとどうなるだろう。もし身長が170cmの人であれば、人造人間化するとサイズが1000000倍になるのだから、身長1700kmになる。まるで、日本列島に横たわるガリバーだ。
そういう風にして、人造人間を作ったときには果たして意識を持っているのだろうか? それが問題なのだ。私には答えは、もちろん「わからない」。
ところで、細胞1個が1m位の大きさということは、ちょうどあなたくらいの大きさだ。別に人造細胞を機械で作る必要はない。あなたが、細胞の役割を担っても良いのだ。人造酸素を持ち歩く仕事なんて簡単だろう。人造酸素は、そう「お金」で代用しよう。お金を運んで色々なところへ渡す。警棒を持っている人は白血球だろうか。NTTやIDOは神経細胞であるし、JRなんかは大動脈だ。人造細胞たちをせっせと運ぶ。時には犯罪を犯す、すなわちガン細胞も発生するだろう。それら人造パーツたちは相互に作用しながら活動していく。
おやおや、こうしてみると、まるで街というのは人造人間そのものではないか。街にも寿命がある。昔華やかだった街もいまは廃れて、老後を過ごしていることもある。また、生まれたばかりの若い街もある。旅に出てしまった街もいるだろう。
街、例えば新宿はまさに1個の生命体である。先ほど作ろうとしていた人造人間とそれほど異なるものではない。であるならば、新宿という街に意識があったところで驚くには値しない。新宿駅を中心とする人造脳細胞から携帯電話という神経網を通して生体信号が行き来し、それらはもしかしたら意識の一部かもしれない。
こうして、このWEBを見ているあなたも単なる神経細胞の一つかもしれないのだ。
こうして新宿で飲んで、アルコールが脳細胞に染み入るたびに考えてしまうのだ。
「果たして、新宿駅は電気羊の夢をみるのだろうか?」
1999-07-14[n年前へ]
■夏目漱石は温泉がお好き?
文章構造を可視化するソフトをつくる
先週は新宿で開催されていた可視化情報シンポジウム'99を見ていた。参加者の世界が狭い(ジャンルが狭いという意味ではない)し、学生の発表が多すぎるように思ったが、少なくとも本WEBのようなサイトで遊ぶには面白い話もあった。というわけで、これから何回か「可視化情報シンポジウム'99」記念の話が続くかもしれない。とりあえず、今回は「小説構造を可視化しよう」という話だ。
まずは、「可視化情報シンポジウム'99」の発表の中から一番笑わせて(笑ったのはいい意味ですよ。決して皮肉ではないですよ。しつこいようですが、ホントホント。私のツボに見事にはまったのだからしょうがない。)もらった発表のタイトルはこれである。
文学作品における文体構造の可視化 - 宮沢賢治「銀河鉄道の夜」の解析-
白百合女子大学大学院の金田氏らによる発表だ。予稿集から、その面白さを抜き出してみよう。まずは過去の研究の紹介をしている部分だ。
作品(hirax注:夏目漱石の「虞美人草」と「草枕」)の始まりから終わりまでを時系列で捉えると(hirax注:話法に関する解析をすると)、二作品はともに円環構造、つまり螺旋構造を描きながら、物語が進行していくことが、四次元空間上に表現された。
中略
これは、作品の解析結果を可視化することで、夏目漱石の思考パターンと内面の揺れが明らかにされたことを意味する。
なんて、面白いんだ。この文章自体がファンタジーである。こういうネタでタノシメル人にワタシハナリタイ。おっと、つい宮沢賢治口調になってしまった。そして、今回の発表の内容自体は、宮沢賢治の「銀河鉄道の夜」の中に出てくる単語、「ジョバンニ・カンパネルラ・二」という三つの出現分布を調べて構成を可視化してみよう、そしてその文学的観点を探ろう、という内容だ。
本サイトは実践するのを基本としている。同じように遊んでみたい。まずは、そのためのプログラムを作りたい。名づけて"WordFreq"。文章中の単語の出現分布を解析し可視化するソフトウェアである。単語検索ルーチンにはbmonkey氏の正規表現を使った文字列探索/操作コンポーネント集ver0.16を使用している。
ダウンロードはこちらだ。もちろんフリーウェアだ。しかし、バグがまだある。例えば出現平均値の計算がおかしい。時間が出来次第直すつもりだ。平均睡眠時間5時間が一月続いた頭の中は、どうやらバグにとって居心地が良いようなのだ。
wordfreq.lzh 336kB バグ有り版
バグ取りをしたものは以下だ(1999.07.22)。とりあえず、まだ上のプログラムは削除しないでおく。
失楽園殺人事件の犯人を探せ - 文章構造可視化ソフトのバグを取れ - (1999.07.22)
動作画面はこんな感じだ。「ファイル読みこみ」ボタンでテキストファイルを読みこんで、検索単語を指定して、「解析」ボタンを押すだけだ。そうすれば、赤いマークでキーワードの出現個所が示される。左の縦軸は1行(改行まで)辺りの出現個数だ。そして、横軸は文章の行番号である。すなわち、左が文章の始めであり、右が文章の終わりだ。一文ではなく一行(しかもコンピュータ内部の物理的な)単位の解析であることに注意が必要だ。あくまで、改行までが一行である。表示としての一行を意味するものではない。なお、後述の木村功氏から、「それは国語的にいうとパラグラフ(段落)である。」という助言を頂いている。であるから、国語用の解析を行うときには「行」は「段落」と読み替えて欲しい。また、改行だけの個所には注意が必要だ。それも「一行」と解釈するからである。
「スムージング解析」ボタンを押せば、その出現分布をスムージングした上で、1行辺りに「キーワード」がどの程度出現しているかを解析する。
そう、この文章は長い文章の中でどのように特定の単語が出現するか解析してくれるのである。
それでは、試しに使ってみよう。まずは、結構好きな夏目漱石の小説で試してみたい。
電脳居士@木村功のホームページ
から、「ホトトギス」版 「坊っちやん」のテキストを手に入れる。そして解析をしてみよう。まずは、この画面は夏目漱石の「坊っちやん」の中で「マドンナ」という単語がどのような出現分布であるかを解析したものである。
文章の中ほどで「マドンナ」は登場してくるが、それほど重要なキャラクターでないことがわかる(このソフトがそう言っているんで、私が言っているのではない。だから、文句メールは送らないで欲しい)。
それでは、「湯」というキーワードで解析してみよう。「坊っちやん」と言えば道後温泉であるからだ。
おやおや、「マドンナ」よりもよっぽどコンスタント(安定して、という意味で)に「湯」という単語は出現するではないか。出現平均値は「マドンナ」の方が多いが、安定度では「湯」の方が上だ。夏目漱石は「マドンナ」よりも「湯」すなわち温泉によっぽど興味があるようだ。
主人公を育てた重要人物「清」を調べてみると、こんな感じだ。
小説の初めなんか出ずっぱりである。あと小説のラストにも登場している。
どうだろうか。見事に小説の可視化に成功しているだろう。結構、この解析は面白い。すごく簡単なのである。
これから新聞、WEB、小説、ありとあらゆる文章を可視化し、構造解析していくつもりだ。みなさんも、このソフトを使って面白い解析をしてみるとよいのではないだろうか? とりあえず、高校(もしかしたら大学の教養)の文学のレポートくらいは簡単に書けそうである。もし、それで単位が取れたならば、メールの一本でも送って欲しい。
というわけで、今回はソフトの紹介入門編というわけで、この辺りで終わりにしたいと思う。
1999-11-01[n年前へ]
■踊る人形
郵便カスタマバーコードFontを作る
久しぶりの新宿の東急ハンズでこんなものを買った。
紫外線を発光する蛍光灯である。ブラックライトという名称の方が通りが良いかもしれない。ブラックライトを車につけている人も多いらしい(私の趣味には実に合わないのだが)。スケルトンという所が今風である。
さて、このブラックライトを使って「何か手元にあるものでテストをしよう」というわけで、はがきを照らしてみた。すると、「踊る人形」のような模様が浮かび上がる。
自宅に届いたはがきをブラックライトで照らしてみる。 | |
照らす前 | 照らしているところ バーコードが見える |
もちろん、これはバーコードである。これは、郵便局の新型区分機により印刷される不可視の「局内バーコード」と「IDバーコード」だ。真っ直ぐな線が続いているのが、「局内バーコード」で、「踊る人形」みたいのが「IDバーコード」である。
一番、目に触れているであろう「カスタマバーコード」(料金割引を受けようとする際に、差出者が郵便物に印字するバーコード)の写真を出したかったが、手元にないのだ。私の自宅にバーコード付きで手紙を出してくる人なんかいないのである。じゃぁ、勤務先はどうかというと、こちらは実に田舎で「字(あざ)」まであるのだ。困ったものだ。というわけで、こちらにも「カスタマバーコード」を印字したものは届いていない。
最初は、「局内バーコード」と「IDバーコード」を解読しようかと思ったのだが、探してみると詳細な情報がすでにある。
- 郵便バーコード (http://www2.biglobe.ne.jp/~t-iwata/barcode/bar_code.htm )
当初は、「局内バーコード」と「IDバーコード」のフォントを作成するつもりだった。不可視のフォントという所にロマンが感じられる。しかも、普通の人は使わなく、作っても無駄なところが本WEBにぴったりである。しかし、あまりに用途が限られてしまうので、まずは「カスタマバーコード」のフォントを作成することにした。もちろん、「局内バーコード」と「IDバーコード」も近いうちに作成する予定である。
それでは、まずは
- TTEditの紹介( http://www.interq.or.jp/www1/anzawa/ttedit.htm )
そして、作成したのフォントが以下である。「バーコード」のような、文字数が少ないものは作成するのは簡単である。 フォントの対応を下に示す。
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 0 | - | CC1 | CC2 | CC3 | CC4 | CC5 | CC6 | CC7 | CC8 | Start | Stop |
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 0 | - | : | ; | < | = | > | ? | @ | A | B | C |
ところで、カスタマバーコードの規格は結構厳しいらしい。このフォントが規格をみたしているかどうかは、怪しいものだ。自分で言うのもなんだが、テストすらしていない。テストするのは「またいつかの回」ということにしておこう。あるいは、動作確認、不動作確認などして下さった方がいらっしゃれば、ご一報頂けると幸いである。
2000-01-13[n年前へ]
■WEBサイトの絆
WEBの世界を可視化しよう
目に見えないものを実感できるものにしようと思うことは多い。「直接感じることが出来ないものを感じられる形にする」という作業とその結果には非常にわくわくさせられる。それは、きっと私だけではないと思う。
目に見えないものは色々ある。可視化して見てみたいものは多々あるのだが、以前、
の時に扱った、WEBのトポロジーなどもその最たるものである。WEBページはもちろん目に見えるわけではあるが、それらがどう繋がっているか、すなわち、WEB[= クモの巣(状の物);織物 ]そのものは目には見えない。ネットワークという目に見えない世界でWEBサイト同士がどう繋がっているか、それは企業のWEBサイト同士であれば企業間の繋がりを示すかもしれないし、公的機関のWEBであれば公的機関内部の繋がりが見えてくるかもしれない。そして、個人WEBであれば、個人どうしの繋がりが見えてくるだろう。そして、さらに考えを進めるならば、それが「WEBの繋がりだ」と端的に言い切ってしまっても良いと思う。
そういう色々なWEBサイト同士が互いに結びつき合う、つまりWEBそのものを今回は可視化してみたい。その結果はきっと「WEBサイトの絆」を私に見せてくれるはずだ。
例えば、ファイルシステムを可視化するものであれば、
- xcruise( http://tanaka-www.cs.titech.ac.jp/~euske/index-j.html )
そして、今回の本題のWEBサイトのHyperlink構造を可視化するソフトウェアも、少し探しただけでも結構ある。例えば、
- Site Manager
- ( http://www.sgi.com/software/sitemgr.html )
- HyperLINKWWW Visualization/Navigation
- ( http://www.acl.lanl.gov/%7Ekeahey/c3/navigate/navigate.html )
しかし、よく調べていないので間違っているかもしれないが、この辺りのソフト(appleを除く)はWEBサイト内のリンクのみに限られるようである。それでは、今回の目的とは違う。何しろ、今回知りたいのはWEBサイト同士のリンクの度合いである。WEBのトポロジーなのである。
そこで、もう少し探してみる。すると、今回の目的にかなり近い情報が
- Web構造の把握 宮久地博臣 都立科学技術大学大学院 平成9年度修士論文
- ( http://home2.highway.ne.jp/miyakuji/shuron.html )
やり方はどうしたら良いだろうか?宮久地氏と同じようにWeb Robotを作成して、データを集めるのが理想的だろう。しかし、「perl入門」を昨日やっと買ったばかりの私にはとても難しそうである。いや、もしそんなことをしたらとんでもないことになるに違いない。
そこで、perlのlwp-rgetを用いて各WEBの内容をローカルのPC内にダウンロードした上で、勉強がてらperlで解析を行うことにした。と、思ったのだが、lwp-rgetが上手く動いてくれない。まだドキュメントをちゃんと読んでいないせいだろうか?何故か、ダウンロードの途中で終了してしまう。仕方がないので、急遽作戦を変更し、ダウンロード作業はlwp-rgetではなくてwgetを用いることにした。
行った手順は以下のようになる。
- 5つのWEBサイトを広いWEB内から適当に選択する
- 選んだ各WEBサイト内のファイルについて、相互のハイパーリンクを抽出し、その数を解析する
- その結果を可視化する
以下に、解析を行った結果、すなわちサイトA,B,C,D,Eの相互に対するリンク数を示す。
↓から→へのリンク数 | |||||
0 | 2 | 0 | 27 | ||
1 | 0 | 13 | 273 | ||
20 | 2 | 0 | 43 | ||
0 | 11 | 0 | 285 | ||
1 | 1 | 1 | 1 | ||
合計 | 22 | 14 | 3 | 14 | / |
サイトE「日記猿人」へのリンクがムチャクチャ多いのは投票ボタンという形で、他のサイトからリンクがなされているからである。
さて、上の表からではWEBの絆を実感できないので、「WEBの絆」を3次元空間に可視化するJavaアプレットを以下に張り付けておく。WEBサイトが5つあるので、それぞれのサイトをピラミッド構造(四角柱状)に配置した。
各WEBサイトの表示色は、
- A = 赤
- B = 緑
- C = 青
- D = 黄
- E = 灰
それぞれのサイトから伸びる直線の長さは、そのサイトから他のサイトへ向かうリンク数に比例したものにしている。また、直線の太さもリンク数に比例させている。また、それぞれのWEBサイトを示す立方体の大きさは自分へ向かうリンク数に比例させている。ただし、サイトEの大きさはあまりにも巨大なため、リンク数に比例したものにはなっていない。また、サイトE、すなわち「日記猿人」、へのリンクは省略し、全てサイトEからの直線リンクを表示するだけにした。
さぁ、WEBサイトの構造を自分の目でみて、そしてグリグリ動かして見てもらいたい。このグラフの操作方法は
- 操作 = 作用
- マウス左ボタンドラッグ = 回転
- シフトキー + 垂直ドラッグ = ズームイン・アウト
- シフトキー + 水平ドラッグ = 垂直軸についての回転
- コントロールキー + 垂直ドラッグ = 焦点距離の変更
- マウス右ボタン垂直ドラッグ = 部品除去
- "s"キー = ステレオ画像作成
Java表示が上手く動かない人のために、静止画も一応張り込んでおく。
どうだろう?この5つのWEB間のWEB構造から何が見えるだろうか?こういう解析を数多くのサイトに行うと非常に面白い結果が得られそうである。特に「日記猿人」のようなコミュニティーに対して行うと興味深い結果が得られるはずだ。
私のような「日記猿人」の日記はほとんど読まない(サイトAに関しては大ファンであるが)人間にとっても興味深いのであるから、関係者にとってはきっと...の筈だ。
さて、今回はテストのためにごく少数(5つ)のWEBの解析を行ってみた。いつか、こういった解析を広い範囲で行い、そして、時系列的な変化をも調べようと思う。銀河のvoid構造が観測され、可視化されたものを見たときもとてもわくわくしたものだが、WEBの構造・変化ならばどうだろうか?
不思議なことに、そういうことを考えていると、「新宿都庁」と「思い出横町」が頭の中に浮かんできてしまうのは何故だろうか?押井守の影響だろうか。謎である。
そして、こうも思う。WEBネットワークの中でWEBサイトは何を感じているのだろうか?これらのWEBサイトはもしかしたら孤独を感じているのだろうか、それとも繋がりを感じているのだろうか?あの時のページの中の一フレーズがその答えの一つなのかもしれない。
2000-02-27[n年前へ]
■「文学論」と光学系
漱石の面白さ
前回、
でさて、モナリザと言うと、夏目漱石と「モナリサ」にも言及しなければならないだろう。と書いた。何しろ
- 恋の力学 三角関係編 - 恋の三体問題 - (1999.12.27)
- 草迷宮・空間'99 - ネコの目から見た世界- (1999.11.05)
- 「こころ」の中の「どうして?」-漱石の中の謎とその終焉 - (1999.09.10)
- 夏目漱石は温泉がお好き? -文章構造を可視化するソフトをつくる - (1999.07.14)
- [Scraps]人静月同照 - ぼくらが旅に出る理由- (1999.06.17)
その漱石は「永日小品(リンク先は青空文庫)」(リンク先は青空文庫)の「モナリサ」中で
「モナリサの唇には女性(にょしょう)の謎(なぞ)がある。原始以降この謎を描き得たものはダ・ヴィンチだけである。この謎を解き得たものは一人もない。」と書いている。女性には興味がなかったとも言われ、ずっと付き添っていた男性との関係も噂されるダ・ヴィンチである。ここらへんは、果たしてどうか?とも思う。むしろ、新宿のホストクラブのホストの方が女性(にょしょう)の謎(なぞ)については詳しいのではないかとも私は考えたりもする。
が、そんなことはどうでも良い。漱石はレオナルド・ダ・ビンチのモナリザに興味を持ち、小品を書き上げたのである。そこで、漱石とダ・ヴィンチの相似点を考えてみたい。
レオナルド・ダ・ビンチの著作には「文学論」というものがある。漱石にも同じ名前の「文学論」がある。この「文学論」はこれまで読んだことがなかったのだが、
- 「漱石の美術愛」推理ノート 新関公子 平凡社 ISBN4-582-82927-9
- 遠近法
- 漱石の文学論の「公式」
これが、とても面白い。仮名遣いが古いため、なかなか目に入ってこないのであるが、とても面白い。これは絶対に文庫本にすべきである。眺めているだけでも面白い。
まずは、冒頭のフレーズがいきなりこうである。
およそ文学的内容の形式は(F+f)なることを要す。Fは焦点的印象又は観念を意味し、fはこれに付着する情緒を意味す。まるで、理系の教科書である。そして、目次(編)を大雑把にさらってみる。
- 文学的内容の分類
- 文学的内容の数量的変化
- 文学的内容の特質
- 文学的内容の相互関係
- 集合的F
また、「文学論」中では、例えば、浪漫派と写実派の違いについて数値的な比較を通じて述べられていたりする。実に「科学的」な思考による「文学論」である。いや本当に漱石は凄い。
さて、中の文章を解説する力は私にはない。そこで、中の図表を示してみることにする。そこで適当に思うことなどを書いてみようと思う。
次に示すのは、「文学論」の冒頭の方で「意識の焦点・波形」を説明した図である。
漱石全集第十一巻より |
この図は人間が何かを感じるときには焦点にピークがある、そして、その周りはぼやけたものが連続的に続いているということを示したものだ。これなど、
の時の「恋のインパルス応答」を彷彿とさせる。あの時の「恋のインパルス応答」を次に示してみる。 この意識される恋心(f)は先の「意識の波形」と全く同じである。ある出来事(F)と、それに付着する情緒(f)を示したものとなるわけだ。付着する情緒(f)というのは中心が一番大きく、その周りにぼやけたものが繋がっているというわけである。人間の感じ方・情緒を光学系と結びつけているわけだ。
いやはや、「恋のインパルス応答」と同じようなことを考える人はやはりいるものである。まさかそれが漱石だとは思いもしなかった。しかも時代を考えると凄まじい、としか言いようがない。
そして、さらに次に示すのは
およそ文学的内容の形式は(F+f)なることを要す。Fは焦点的印象又は観念を意味し、fはこれに付着する情緒を意味す。ということを示す図である。先の - 「漱石の美術愛」推理ノート - ではこの図と遠近法の関連が述べられている。
漱石全集第十一巻より |
ここで、縦軸は「時間」となっており、横軸は「色々な出来事」である。ある人が感じた「色々な出来事」を時間方向に収斂させていくと、そこには「作者自身の視点がある」というわけだ。これが漱石の言う「文学論」の中心である。
この図などカメラや望遠鏡の光学系を彷彿とさせる。「光学系の一例」を以下に示す。
先の「文学の焦点」を示した図はレンズで光を焦点に集めるのと全く同じだ。いや、「焦点から光を投光する」のと同じと言った方が良いだろうか。以前、
で、景色に焦点を合わせて、フィルムに結像させるのがカメラだ。しかし、フィルムに写っているのは単なる景色ではない。カメラの光が集まる焦点にフィルムが位置していると思い込むとわからなくなる。逆から考えてみれば簡単に判るはずだ。カメラの視点にフィルムが位置しているのだ。フィルムに景色が写っているのではなく、フィルムが景色を選び、景色を切り取っているのである。と書いたのと全く同じである。その光学系には歪みもあるかもしれないし、色フィルターもかかっているかもしれない。しかし、とにかく焦点にはその人自身がいるのである。写真に写っているのは、撮影者の視点なのである。写真を見れば、撮影者が、どこに立ち、何を見てるかが浮かび上がってくるはずである。フィルムに写っているのは撮影者自身なのだ。
写真でも文章でもとにかく何であっても、色々感じたことを表現していく時、その焦点には表現者自身がいる。私の大好きなこの2000/2/25の日記なんか、実にそれを感じるのである。