hirax.net::Keywords::「電気羊」のブログ



1999-07-10[n年前へ]

新宿駅は電気羊の夢を見るか 

意識とは何か

 今回は思考実験である。頭の中だけで実験を行うのだ。実際には何もしないのと同じである。手抜きだと言ってもらっても構わない。手抜きではあるが以前から気に懸かっていたことなのだ。しかも、新宿で呑む度に思うことなのだ。

新宿の高層ビル

考えたいことは「意識とは何か?」である。人造人間に意識は存在するのであろうか?

 「人造人間なんてそんな精密なものは作ることができないから、考えてもしょうがない」と、言う人も多いだろう。確かに精密なものを作るのは難しいだろう。であれば、でっかくて大雑把なものならば、いつか作ることができるだろう。それに、まるっきりそのままの働きでなくても構わないだろう。例えば、赤血球と白血球のどちらがバイ菌と戦うか、なんて逆になったところで、やはり人間に意識はあるだろう。別に酸素を運びながら戦ってくれても構わないのだ。

 それならば、細胞1個が1m位の大きさであっても構わない。実際の人間の細胞は10um程度の大きさである。それが1mになるなら1000000倍だ。その大きさが1m位の大きさの細胞で人造人間を作るとどうなるだろう。もし身長が170cmの人であれば、人造人間化するとサイズが1000000倍になるのだから、身長1700kmになる。まるで、日本列島に横たわるガリバーだ。

 そういう風にして、人造人間を作ったときには果たして意識を持っているのだろうか? それが問題なのだ。私には答えは、もちろん「わからない」。

 ところで、細胞1個が1m位の大きさということは、ちょうどあなたくらいの大きさだ。別に人造細胞を機械で作る必要はない。あなたが、細胞の役割を担っても良いのだ。人造酸素を持ち歩く仕事なんて簡単だろう。人造酸素は、そう「お金」で代用しよう。お金を運んで色々なところへ渡す。警棒を持っている人は白血球だろうか。NTTやIDOは神経細胞であるし、JRなんかは大動脈だ。人造細胞たちをせっせと運ぶ。時には犯罪を犯す、すなわちガン細胞も発生するだろう。それら人造パーツたちは相互に作用しながら活動していく。

動き回る人造赤血球たち

 おやおや、こうしてみると、まるで街というのは人造人間そのものではないか。街にも寿命がある。昔華やかだった街もいまは廃れて、老後を過ごしていることもある。また、生まれたばかりの若い街もある。旅に出てしまった街もいるだろう。

 街、例えば新宿はまさに1個の生命体である。先ほど作ろうとしていた人造人間とそれほど異なるものではない。であるならば、新宿という街に意識があったところで驚くには値しない。新宿駅を中心とする人造脳細胞から携帯電話という神経網を通して生体信号が行き来し、それらはもしかしたら意識の一部かもしれない。
 こうして、このWEBを見ているあなたも単なる神経細胞の一つかもしれないのだ。

 こうして新宿で飲んで、アルコールが脳細胞に染み入るたびに考えてしまうのだ。

 「果たして、新宿駅は電気羊の夢をみるのだろうか?」


人造血管の中で人造赤血球が撮影した写真

2000-07-23[n年前へ]

WEBページの文体を調べてみよう 

「ノリノリ文体」の秘密!?

今日もまたいつものように

へ面白い情報を読みに行った。何しろ、私はあまり眺めるWEBページを新規開拓したりしないので、こういうページ無しには情報の孤島に取り残されてしまうのである。

 すると、

というスレッドが紹介されていた。これはなかなか面白い試みだ。

 以前から、私も文体について調べてみたい、と思っていた。それも普通の文体ではなくて、WEBページの文体である。色々な面白いWEBページを読むたびに、「この面白さ・ノリの良さの秘密はどこにあるのだ?」と思っていたのである。そして、できることならば「そのノリノリ文体の秘密をこの目で見てみたい!」と切望さえしていたのである。もちろん、本当のところは「ノリノリ文体の秘密」が明らかになったならば、「そのノリノリ文体をパクッてやろう」という気持ちが私の中にあるのだ。文体だけ真似しても、「面白いページ」にはならないと言う気もするが、そんなことは考えてみてもしょうがないのだ。まずは、形から入ろうというわけだ。

 そこで、今回は「ノリノリ文体」を書いているWEBサイトの文章をいくつかピックアップして、その「ノリノリ文体の秘密」を調べてみることにした。今回、ピックアップした文章はまず次の三つである。

  • そりを言ってはお終いなのよ fromちゃろん日記(仮) ななゑ さん
    • ( http://www.alpha.dti2.ne.jp/~nanae/nikki1999_8m.htm )
  • 娘よ from 我が妻との闘争呉エイジ さん
    • ( http://www.117.ne.jp/~kure/waga/yome12.html )
  • 半角カナを使え! fromとろん 南野 輝 さん
    • ( http://www2.justnet.ne.jp/~chic/TRON005.HTML )
 ちゃろん日記(仮)はWEBページの文体を考えるときには絶対に外せないだろう。笑いと涙で日常を描くまるでチャップリンの喜劇のような「ちゃろん文体」である。今回は数多い話の中から「男心と女心のギャップ」を鋭く描いた「そりを言ってはお終いなのよ」に注目してみた。

 そして、次に「男心と女心のギャップ」を全く違う視点から描く、まさに涙ナミダの物語「我が妻との闘争」から涙無しには読めない「娘よ」にも注目したい。

 涙でなくて「笑い」と言えば、当然「お笑いパソコン日誌」から辿り、「半角カナを使え!」にも注目してみたい。本当はこの作者が文章を書いている印刷物も手元にあるので、その印刷物とWEBの文章とを比較してみたかったりもしたのだが、今回はパスさせて頂いた。

 そして、WEBページの文章ではないが、当然この人

  • 私の個人主義 夏目漱石
もノミネートしてみた。漱石には失礼だと思うのだが、素晴らしい文章ではあるが、WEBページというものがない時代のまだ「ノリノリ」でない例として用いてみたい。そして最後に、本hirax.netの中の文章を二つ程選び、「ノリノリ文体」になっていないWEBページの文章例として用いることにした。なお、この二つは数式などをなるべく用いていないものという観点で選んでみた。

 さて、今回は「文体の特徴の解析」の手段として、「文章構造可視化シリーズ」で作成した"wordfreq"を少し改造して使ってみることにした。以前、のバージョンから少し変えて、ファイルに落とす結果はスムージングをかけないそのままの結果にしてみただけである。とりあえず、そんな"wordfreq"を使い、WEBページの「一段落中の句点(。)と読点( 、)の数」を調べてみたのである。

 何故、「一段落中の句点( 。)と読点( 、)の数」に注目したかというと、私はどうも読点の使い方が判らないのだ。文章の各部分が他のどの部分にかかるのかをちゃんと示したいのだが、どうも私の文章は変なのだ。もういっそのこと、文章の各部分がどこにかかるかわかるように各個とか矢印とか使いたくなるくらい、読点の使い方がわからないのである。その結果、読点をどうも多く打ってしまうような気がしているのである。

 そこで、その勉強も兼ねて「一段落中の句点( 。)と読点( 、)の数」に注目しながら、WEBページの「ノリノリ文体」を調べてみたいと思うわけだ。
 

一段落中の句点( 。)と読点( 、)の数
ノミネートされた文章一段落中の句点( 。)の数一段落中の読点( 、)の数
私の個人主義
7.6
11
コンクリートの隙間に
4.4
7.6
新宿駅は電気羊の夢を見るか
3.9
2.8
半角カナを使え!
1.8
2.1
娘よ
1.4
0.5
そりを言ってはお終いなのよ
0.4
0.9

 この結果を見てみると、「ちゃろん文体」などは圧倒的に一段落中の句点(。)の数が少ない。また、同じように一段落中の読点( 、)の数も少ない。そして、「我妻文体」も同じように、一段落中の句点(。)の数が少ない。こちらの「我妻文体」は、一段落中の読点( 、)の数の少なさでは今回No.1である。

 それに対して、偉大なる漱石の「私の個人主義」では「一段落中の句点(。)と読点( 、)の数」も実に多い。そして、私の書いた文章においても、その数はやはり多い。上の表は「一段落中の句点(。)の数」が多い順に並べてみたが、私の文章は二つとも、漱石の次に「一段落中の句点(。)と読点( 、)の数」が多い。

 上の表では
私の個人主義 >> コンクリートの隙間に, 新宿駅は電気羊の夢を見るか >>半角カナを使え!, 娘よ >> そりを言ってはお終いなのよ
となっているが、これはWEBの「ノリノリ文体」とかなり良い一致をするのではないだろうか?つまり、

  • WEBの「ノリノリ文体」は一段落中の句点( 。)と読点( 、)の数が少ない程良い
という推定がここから可能だと思うのだ。

 その推定を用いて「娘よ」の文章中における一段落中の読点( 、)の数の変化を眺めてみると面白いことが判る。文章中で、段々と「一段落中の読点(、)の数」が少なくなってきているのである。これは、きっと作者 呉氏が文章を書いている内に、気分が「ノリノリ」になってきて、その心の変化が「ノリノリ文体」としての特徴- 一段落中の読点( 、)の数が少ない - を示し始めたのではないだろうか?
 

「娘よ」の文章中における一段落中の読点( 、)の数の変化

 さて、今回はWEBページの「ノリノリ文体の秘密」を簡単に調べてみた。これからも引き続き、その秘密のさらなる姿を見てみたいと思う。そして、いつかその「ノリノリ文体」を私は身につけ、ノリノリWEBページなどを書いてみたりするのである。

 とはいえ、それぞれの「文体」には作者の性格も強く現れているわけで、私の性格を直さないことにはそんな「ノリノリ」文体を身につけられないような気もするし、文体だけ真似しても「面白いページ」にはならないとか、形から入ってどうするとかいう声が聞こえそうであるが、それを言ってはダメなのだ。
 

2000-07-28[n年前へ]

新宿駅は電気羊の夢を見るか 

そう言えば、あのアルコールの夜からもう一年経ったんですね。(リンク

2000-09-02[n年前へ]

もうすぐ二歳の「できるかな?」 

初心に帰ってみましょうか?


  「できるかな?」が始まったのは二年近く前の秋のことだった。

でも触れたが、当初(実は今も続いているが)は某社内の某サーバー内でこっそりと始めてみたのだった。それから二年あまりでずいぶんと色々な話が増えた。某社サーバー内でしかアップしていない
  • プリンタドライバーは仮免
  • 続 電子写真プロセスを分数階微分で解いてみよう
  • 続々 電子写真プロセスを分数階微分で解いてみよう
等の外部未公開の話も含めれば、もうすぐ200回近くになる。そして、公開場所の変化もあってずいぶんと話の傾向も変わってきた。最近では「ここのところの話題は何か変じゃないですか?hirabayashiさんどうかしたんですか?」とか、「大丈夫?hirabayashiくん?」などと言われる始末である。

 そして話が増えてきたせいか、自分自身でも「アレッ、あの話はどこにあったけ?」というように迷ってしまうことが多々ある。迷うどころか、最後まで見つからないこともしばしばあるのだ。そして、それは私でもない他の人であればましてやそうだろう。というわけで、

では簡単にそれまでの話の紹介をしたし、ではhirax.net内の全文検索機能を付けてみた。

 今回は、これまでの話題をもう一度自分で読み直して、その中から「自分のお気に入り」を調べてみたいと思う。そして、最近少し話題が変になってしまっている反省をして、もう一度初心に帰ってみようと思うのだ。

 まずは、1998年の話題からいくと

というあたりが、良い感じだ。京都の風物詩である「鴨川カップル」達が人目を気にしながら寄り添う合う姿を考えてみたものだ。後の「恋の力学」シリーズなどはここらへんから始まっていた、といっても良いだろう。そしてこの頃の[Scraps]系の話題としては、がある。少し前に、この「さなえちゃん」を描いた漫画の作者からメールを頂いたのがとても私には印象深かった。

 そして、1999年の上半期から選んでみると、まずは

というところだろう。ハードディスクの情報を可視化することで情報圧縮・エントロピーを考えてみた一話である。そして、同じような「可視化シリーズ」の一つであるはこの後「感温液晶はどこで売っていますか?」という質問メールを多々頂くことになった。そして、[Scraps]系のが私の「お気に入り」でもある。ここら辺から「できるかな?」の中に全然技術的な話題でない物が登場し初めたような気がする。

 そして、1999年の下半期はもう自分で言うのも何だが傑作揃いである。大体、書いているペースが自分でも驚くくらいのハイペースだ。月当たりの話の数を数えてみると、

  •  7月 9話
  •  8月 9話
  •  9月 8話
  • 10月 8話
  • 11月 11話
  • 12月 9話
という感じでいやもうビックリしてしまう。平均すると三日に一話である。どうも、本業が忙しいとそれに比例して制作ペースが増加するという、「恐怖の睡眠時間減少の法則」が成り立つようだ。

 この頃の「お薦めの話」はいっぱいある。例えば、

に始まった「文章可視化シリーズ」や、で始まった「ASCIIアートシリーズ」だろう。から始まる「江戸五色不動シリーズ」は江戸にロケまで行ったので、とても思い出深い話の一つである。しかも、妙な偶然のせいでまるで小説の中に迷い込んだような気持ちになったものだ。

 そして、WEBページを作る上では

などもどうしても外せない。そして、この後結構続くことになるという「恋の力学」シリーズもこの時期に始まっている。そして、この頃の一番人気が何と言ってもだろう。この「ミニスカート」系の話の流れは以降も続くことになるのが自分では意外でもあり、残念でもある。それはさておき、ナンセンス系ではなんてのも面白い話だと思う。そして、1999年の終わりはやはりこれが「お気に入り」の話である。また、[Scraps]系の話がこの時期にはやたらいっぱいあるのが面白いところだ。その内からいくつかピックアップするとこんな感じだろうか? さて、2000年上半期にもなると、すいぶんとペースも内容も落ち着いてしまう。その中でも、「恋の力学」シリーズに夏目漱石をトッピングしてみたという辺りは「文学と科学が合体」した話で、自分の中では書いてて結構面白かった話である。そして、ナンセンス系のもクダラナイところところが外せないと思う。そして、この辺りで始まり未だ継続中のは最近の変な流れを予感させるのが哀しいところである。

 さて、今回は2000年上半期までの話の中から「私の好きな話」を振り返ってみた。とはいえ、私の好きな話=他の人の好きな話ではないようだし、他の話も適当に眺めて頂いたら良いかなぁ(私が)、と思うのだった。
 

2001-02-19[n年前へ]

ひとりで書いてるだけだから。 

ヘッポコ文章を直したい


   面白い情報を探しにと「お笑いパソコン日誌」を眺めていると、「ウエヤマの事件簿」の「他人の日記をオモチャにしよう!」が紹介されていた。「お笑いパソコン日誌」に〜『できるかな?』風ネタであります〜と紹介されてあった通り、実に私好みの話だった。ウエヤマ氏が「自分で書いてる日記の文章」を解析して、文字の出現頻度を調べてみたものである。

 「できるかな?」は画像や科学の関連の話が多いように見える。しかし、実はそれだけではなくて文章や日記に関する話も多い。例えば、これまでに出てきた話を振り返ってみると、

に始まり、と続く、「文学の世界を眺めてみよう」という話など、あるいは「WEBページで見かける文体の特徴を解析しよう」としたなど、あるいは「WEB日記の文化を眺めて見たい」というなどの話があった。「技術サイト」という分類をされることも多い本サイトではあるのだけど、非技術的な話に強引に技術的な話を持ち込みたくなったり、技術的な話なのに何故かとても私的で非技術的な話が入ってしまったりするのが、良くも悪くも「できるかな?」の特徴だろう。もちろん、良いことでは全然無いのだけれど、こうでも書かないと悲しい気分になってしまうので、「良くも悪くも」と書いているのである。

 そういったhirax.netの特長ならぬ特徴は私が書く文章が下手なせいなわけで、そんなヘッポコ文章から脱出するべく、私の書く文章の特徴を調べて反省してみることにした。もちろん、自分のヘッポコ文章だけを眺めてみてもしょうがない。他の素晴らしい文章を書く書き手と比較しなければならないだろう。そこで、今回はいくつかの文章を品詞解析し、その結果の特徴を調べることにする。そして、書き手による文章の特徴が眺めながら、私のヘッポコ文章の欠点を調べ、さらには誰もが思わず涙がこぼしてしまうような素晴らしい文章を書けるようになりたい、と思うのである。
 

 さて、まずは目標を決めよう。私がヘッポコ文章を脱出してどんな文章を目指すかを、何より先に決めなくてはならない。となれば、あまりにも大それた目標ではあるのだが、やはり日本の文豪、夏目漱石は外せないだろう。そして、その教え子でもある寺田寅彦もやはり外すわけにはいかない。一応私も理系のはしくれ、日本の理系文章の流れを作ったこの二人を目標にしなくてなんとしよう。ヘッポコ文章を脱出していきなり、夏目漱石と寺田寅彦というところに無理があるが、そんなことを考えていては駄目なのである。「少年よ大志を抱け」とクラーク博士も言ったのである。もう少年と言うにはどう考えても年齢的に無理があるのだが、気持ちはまだまだ少年で目標は大きく持ってみたいと思うのである。

 そして、もう一人の目標は「ちゃろん日記(仮)」をマイペースに書き続ける「ななゑ」さんである。私は彼女の書く文章を読むたびにとても素晴らしい理系的センスが感じ続けているのである。しかも、理系的でありつつも笑いと涙のペーソスたっぷりの「ちゃろん文体」という独自の確固とした文体を築いているところも尊敬していたりするのである。

 というわけで、今回の文章の比較は

  1. 夏目漱石
  2. 寺田寅彦
  3. ちゃろん日記(仮) ななゑ
  4. 「できるかな?」 jun hirabayashi
の四人の書き手の文章を適当に二つずつピックアップして、その文章を品詞解析して簡単に特徴を眺めてみることにした。各書き手に対して、それぞれピックアップした文章はである。なお、夏目漱石と寺田寅彦は「青空文庫」から入手した。そして、これらの文章を日本語形態素解析システム茶筌&perlで解析後、Excelでさらに解析・表示を行ってみることにしよう。

 ところで、形態素解析とはどのようなものだろうか。まずは、例を挙げよう。例えば、

私が好きな書き手達は、夏目漱石、寺田寅彦、ななゑさんです。
という文章を茶筌で分解すると、
  1. 私 名詞-代名詞-一般
  2. が 助詞-格助詞-一般
  3. 好き 名詞-形容動詞語幹
  4. な 助動詞
  5. 書き手 名詞-一般
  6. 達 名詞-接尾-一般
  7. は 助詞-係助詞
  8. 、 記号-読点
  9. 夏目 名詞-固有名詞-人名-姓
  10. 漱石 名詞-固有名詞-人名-名
  11. 、 記号-読点
  12. 寺田 名詞-固有名詞-人名-姓
  13. 寅彦 名詞-固有名詞-人名-名
  14. 、 記号-読点
  15. ななゑ 名詞-固有名詞-人名-名
  16. さん 名詞-接尾-人名
  17. です 助動詞
  18. 。 記号-句点
というようになる。このように各文章を品詞毎に分解して、その出現分布から特徴を調べてみるのである。なお、今回注目した品詞は
  1. 読点
  2. 形容詞
  3. フィラー
  4. 感動詞
の四つである。この四つを選んだ理由は、読点は明確な決まりがないだけに書き手の感覚が入りやすいと思われ、形容詞、フィラー・感動詞に関しては書き手の気持ちが素直に現れやすいと思われるからである。ちなみに、フィラーとはから引用すれば、「あのー」「えー」といった語句ということになる。まずは各文章が書き手によってどのくらい特徴づけられるかのイメージを掴むために、形容詞の出現頻度とフィラーの出現頻度を軸にとり、各文章を二次元の世界に配置してみた結果を図示してみよう。
 
形容詞の出現頻度とフィラーの出現頻度を軸にとって、
各文章を二次元の世界に配置した結果

 結構、同じ書き手による文章が同じような位置に配置されることがわかると思う。ちゃろん日記(仮)などは、二つの独立した文章がほとんど同じ位置に配置されている。もう、ちゃろん文体は安定しまくっていて完成されているのである。そしてまた、「文豪」夏目漱石の場合も、「我が輩は猫である」と「坊っちゃん」がかなり近い位置に配置されていることがわかる。

 なるほど、結構書き手による特徴はこんないかにも雑な解析でも評価できるものなのかもしれない(あくまで「遊び」だけどね)。そして、形容詞の出現頻度などは、「雪だるまがいる景色」と「自然と生物」以外は大体同じようなものである。寺田寅彦の「自然と生物」は妙に形容詞の出現頻度が高いところが面白いところである。私の「雪だるまがいる景色」はあまり技術的な話ではなくて、確かに形容詞が多そうな話ではあるのだが、一体「自然と生物」はどうだっただろうか?

 ちなみに、「できるかな?」からの二つの文章は共にフィラーが一個も出てこない。その他の6つの文章にはフィラーが出てくるのであるが、何故か「できるかな?」の二つの文章にはフィラーが含まれていないのである。この差がなければ、寺田寅彦の二編と「できるかな?」はかなり似た場所に位置するのであるが、このフィラーは特に違うのである。

 さて、上の図ではフィラーと形容詞の出現頻度だけを眺めてみたが、読点、感動詞の出現頻度も加えて、クラスター分析を行ってみた。つまり、「読点・形容詞・フィラー・感動詞」の出現分布が似ているものを分類してみたわけである。クラスター分析にはExcelアドイン工房「早狩」の統計解析アドインを使用させて頂いた。ちなみに、クラスターの結合はウォード法を用い、非類似度計算法には標準化ユークリッド平方距離を使用した。その結果が下の図である。
 

クラスター分析の結果

 このクラスター分析の結果を示す図は近い文章をまとめていったものを示している。つまり、文章の「近さ」あるいは「似ている度」を示しているのである。ちゃろん日記(仮)の二編は本当によく似ていて、また夏目漱石の書いた二編も互いに似ている。そして、それより「近い度」は低いが「新宿駅は電気羊の夢を見るか?」は「科学について」に近くて、「雪だるまがいる景色」は「自然と生物」に近い。おして、さらに似ているものを探せば、ちゃろんの二編と「新宿駅は電気羊の夢を見るか?」・「科学について」は似ているといえなくもない、さらに言えばその四編と夏目漱石の二編が似ている。

 ここでは、四人の書き手がいるということが私には判っているので、あえて四つのクラスターに分解してみると、

1.
    • 「雪だるま」がいる景色
    • 自然と生物
    2.
    • 新宿駅は電気羊の夢を見るか?
    • 科学について
    3.
    • ちゃろん日記1998(仮)11月上旬
    • ちゃろん日記1999(仮)6月上旬
    4.
    • 我が輩は猫である
    • 坊ちゃん
という風になる。やはり夏目漱石とちゃろん日記に関してはこんなチープなごく少数の品詞解析でも、「作者の文体が同じである」と解析されてしまうのである。なかなか、スゴイとは思わないだろうか?数多くの解析をしてみるのもなかなか面白いと思う。高校生のレポートくらいだったら、これで何とか書けそうである。

 しかし、その一方で考えてみれば寺田寅彦の名随筆と「できるかな?」のヘッポコ文章が「文体が近い」と解析されてしまっているわけなので、実はこの解析の信頼性はかなり低いと言わざるを得ないところもあるのである。いや、もしかしたら「文体は同じやけど、内容が全然違いますがな」というような冷たいアドバイスを解析結果は言わんとしているのかもしれないが、もうそれは哀しすぎる事実なので考えたくないのである。

 さて、そう言えば一番最初の図で「できるかな?」と寺田寅彦の差はフィラーの出現分布だったわけであるが、「大学の講義における文科系の日本語と理科系の日本語-- 「フィラー」に注目して --」では、「聞き手への働きかけのあるフィラーが多いということは聞き手への配慮が大きいということにつながる」と書いてあった。ということは、フィラーの出現分布は聞き手への配慮に比例するというわけで、「できるかな?」の文章にフィラーが出てこない、ということは読み手に対する配慮がない、なんてことなのかなと思ってしまったりするのである。

 そんなことを考え出すと、ホラどうせひとりで書いてるだけだから読み手のことなんか考えていないのさと、思わず涙がこぼれてしまうような哀しい気持ち、になったのである。う〜む、最初は誰もが思わず涙がこぼしてしまうような素晴らしい文章を書けるようになりたいと思ったったのに、何でこんな結論になるんだろう?

 答え: それは文才がないからです。ハイ。
 
 



■Powered by yagm.net