hirax.net::Keywords::「データベース」のブログ



2000-01-13[n年前へ]

WEBサイトの絆 

WEBの世界を可視化しよう




 目に見えないものを実感できるものにしようと思うことは多い。「直接感じることが出来ないものを感じられる形にする」という作業とその結果には非常にわくわくさせられる。それは、きっと私だけではないと思う。

 目に見えないものは色々ある。可視化して見てみたいものは多々あるのだが、以前、

の時に扱った、WEBのトポロジーなどもその最たるものである。WEBページはもちろん目に見えるわけではあるが、それらがどう繋がっているか、すなわち、WEB[= クモの巣(状の物);織物 ]そのものは目には見えない。

 ネットワークという目に見えない世界でWEBサイト同士がどう繋がっているか、それは企業のWEBサイト同士であれば企業間の繋がりを示すかもしれないし、公的機関のWEBであれば公的機関内部の繋がりが見えてくるかもしれない。そして、個人WEBであれば、個人どうしの繋がりが見えてくるだろう。そして、さらに考えを進めるならば、それが「WEBの繋がりだ」と端的に言い切ってしまっても良いと思う。

 そういう色々なWEBサイト同士が互いに結びつき合う、つまりWEBそのものを今回は可視化してみたい。その結果はきっと「WEBサイトの絆」を私に見せてくれるはずだ。

 例えば、ファイルシステムを可視化するものであれば、

  • xcruise( http://tanaka-www.cs.titech.ac.jp/~euske/index-j.html )
といったファイルシステムを宇宙空間に見たてて、表示するようなものがある。また、そこまで派手でなくても通常のファイラーやエクスプローラのツリー表示などもファイルシステムの構造を可視化しているといっても良いだろう。(そういえば、かつて富士XeroxがWindowsのファイルシステム中のドキュメントを色々面白い3次元表示で表示、検索してくれるソフトを扱っていた。なかなか面白いソフトだったと思うのだが、今ではどうなっているのか?)

 そして、今回の本題のWEBサイトのHyperlink構造を可視化するソフトウェアも、少し探しただけでも結構ある。例えば、

といったところだ。確かappleもこういったツールの開発を行っていたように思うが、どこに情報があるのか忘れてしまった。
 しかし、よく調べていないので間違っているかもしれないが、この辺りのソフト(appleを除く)はWEBサイト内のリンクのみに限られるようである。それでは、今回の目的とは違う。何しろ、今回知りたいのはWEBサイト同士のリンクの度合いである。WEBのトポロジーなのである。

 そこで、もう少し探してみる。すると、今回の目的にかなり近い情報が

に見つかった。perlでWeb Robotを作成し、"*.go.jp"のサイトに放ち、ハイパーリンクのデータベースを作成し、それを解析・可視化したものである。その結果のハイパーリンクの具合を可視化した図が、リンク切れで見ることができないのが実に残念だが、非常に役に立つ情報が満載である。ほとんど、私のしてみたいことそのものである。しかし悔しいことに、その結果の図を見ることが出来ない。そこで、同じようなことを自分でやってみることにした。

 やり方はどうしたら良いだろうか?宮久地氏と同じようにWeb Robotを作成して、データを集めるのが理想的だろう。しかし、「perl入門」を昨日やっと買ったばかりの私にはとても難しそうである。いや、もしそんなことをしたらとんでもないことになるに違いない。

 そこで、perlのlwp-rgetを用いて各WEBの内容をローカルのPC内にダウンロードした上で、勉強がてらperlで解析を行うことにした。と、思ったのだが、lwp-rgetが上手く動いてくれない。まだドキュメントをちゃんと読んでいないせいだろうか?何故か、ダウンロードの途中で終了してしまう。仕方がないので、急遽作戦を変更し、ダウンロード作業はlwp-rgetではなくてwgetを用いることにした。

 行った手順は以下のようになる。

  1. 5つのWEBサイトを広いWEB内から適当に選択する
  2. 選んだ各WEBサイト内のファイルについて、相互のハイパーリンクを抽出し、その数を解析する
  3. その結果を可視化する
 今回選択したWEBサイトはA,B,C,D,Eという5つのサイトである。A〜Dについては、サイト内の全てのページについて解析を行った。Eに関しては、サイト内の特定の1ページについてのみ解析を行った。A〜Dのサイトに関しては、名前は伏せておく。サイトEに関してのみ名前を明らかにしよう。Eは日記猿人というサイトの中の「今月の得票数」を示すページである。そう、今回選択したWEBは全て「日記猿人」という一風変わったコミュニティー内のサイト群から抽出したのである。

以下に、解析を行った結果、すなわちサイトA,B,C,D,Eの相互に対するリンク数を示す。

A,B,C,D,Eの相互に対するリンク数
↓から→へのリンク数
A
B
C
D
E
A
-
0
2
0
27
B
1
-
0
13
273
C
20
2
-
0
43
D
0
11
0
-
285
E
1
1
1
1
-
合計
22
14
3
14
/

 サイトE「日記猿人」へのリンクがムチャクチャ多いのは投票ボタンという形で、他のサイトからリンクがなされているからである。

 さて、上の表からではWEBの絆を実感できないので、「WEBの絆」を3次元空間に可視化するJavaアプレットを以下に張り付けておく。WEBサイトが5つあるので、それぞれのサイトをピラミッド構造(四角柱状)に配置した。
 各WEBサイトの表示色は、

  • A = 赤
  • B = 緑
  • C = 青
  • D = 黄
  • E = 灰
という五色を用いた。そういつぞやと同じ五色である。imacも五色(6?)だが、今回のターゲットサイトも五色なのである。

 それぞれのサイトから伸びる直線の長さは、そのサイトから他のサイトへ向かうリンク数に比例したものにしている。また、直線の太さもリンク数に比例させている。また、それぞれのWEBサイトを示す立方体の大きさは自分へ向かうリンク数に比例させている。ただし、サイトEの大きさはあまりにも巨大なため、リンク数に比例したものにはなっていない。また、サイトE、すなわち「日記猿人」、へのリンクは省略し、全てサイトEからの直線リンクを表示するだけにした。

 さぁ、WEBサイトの構造を自分の目でみて、そしてグリグリ動かして見てもらいたい。このグラフの操作方法は

  • 操作 = 作用
  • マウス左ボタンドラッグ = 回転
  • シフトキー + 垂直ドラッグ = ズームイン・アウト
  • シフトキー + 水平ドラッグ = 垂直軸についての回転
  • コントロールキー + 垂直ドラッグ = 焦点距離の変更
  • マウス右ボタン垂直ドラッグ = 部品除去
  • "s"キー = ステレオ画像作成
である。表示をステレオ画像にして、WEBの世界へダイビングしてみよう。

 Java表示が上手く動かない人のために、静止画も一応張り込んでおく。

WEB構造を可視化したもの

 どうだろう?この5つのWEB間のWEB構造から何が見えるだろうか?こういう解析を数多くのサイトに行うと非常に面白い結果が得られそうである。特に「日記猿人」のようなコミュニティーに対して行うと興味深い結果が得られるはずだ。
 私のような「日記猿人」の日記はほとんど読まない(サイトAに関しては大ファンであるが)人間にとっても興味深いのであるから、関係者にとってはきっと...の筈だ。

 さて、今回はテストのためにごく少数(5つ)のWEBの解析を行ってみた。いつか、こういった解析を広い範囲で行い、そして、時系列的な変化をも調べようと思う。銀河のvoid構造が観測され、可視化されたものを見たときもとてもわくわくしたものだが、WEBの構造・変化ならばどうだろうか?

 不思議なことに、そういうことを考えていると、「新宿都庁」と「思い出横町」が頭の中に浮かんできてしまうのは何故だろうか?押井守の影響だろうか。謎である。

 そして、こうも思う。WEBネットワークの中でWEBサイトは何を感じているのだろうか?これらのWEBサイトはもしかしたら孤独を感じているのだろうか、それとも繋がりを感じているのだろうか?あの時のページの中の一フレーズがその答えの一つなのかもしれない。

2000-05-06[n年前へ]

みんなで一緒に「なんでやねん。」 

関西弁の音声学 第一回

->いつもの口調編
->大阪弁編(http://hp.vector.co.jp/authors/VA014135/osaka.htmによるもの)へ

 もう五月や。四月に新しい生活が始まりそれがちーとばかし落ち着いてきた、ちう人も多いやろうわ。関西やらなんやらでは、この時期になると妙な関西弁が伝染しだす。新しく関西で生活し始めたヤカラ、すなわち、関西弁ビギナーが増え始めることが原因であるちゅうわけや。いたるトコで、「そウやろ」、「チゃうちゃウ」やらなんやらの変な関西弁が響き始めるちゅうわけや。また、「オノレ」ちう言葉の一人称・二人称の解釈の違い(関西では一般的に二人称として用いられ、関東では一般的に一人称として持ちられる)により、いさかいが起きたりするちゅうわけや。

 そういった関西弁ビギナー達を救うために、これまで「関西弁」の研究は数ようけされてきたちゅうわけや。例あげたろか,たとえばやなあ、

を始めとして、素晴らしい報告が多々あるちゅうわけや。

 せやけどダンさん、やはり文字を表現手段に使う報告がようけ、音声を考えるちう点においては、まだまだ不十分な点があるちゅうわけや。例あげたろか,たとえばやなあ、「こういうシチュエーションで言うべし」とか、「こういうときにはこういう言葉」とか、「同じ言葉でも意味がちゃう」ちうようなことは伝えられるちゅうわけや。せやけどダンさん、関西弁ネイティブになるための重要な「発音・アクセント」については、まだまだ研究の余地があるのではおまへんやろうか。

 ほんで、今回はツッコミの基本の一つである「なんでやねん。」の発音に着目してみたいと思うわ。自然なアクセントで「なんでやねん。」を発音するにはどうしたらええか、これについてちびっと考えてみたいと思うのであるちゅうわけや。ちうわけで、目指せ、関西弁ネイティブのスタートであるちゅうわけや。題して、「関西弁の音声学」であるちゅうわけや。

 さて、一言で「関西弁」と言っても色々あるちゅうわけや。あまりに大雑把なくくり方であるちゅうわけや。ゴチャゴチャゆうとる場合やあれへん,要は、関東弁と言った場合のあいまいさと同じくらいの程度の大雑把さであるちゅうわけや。今回は大阪と京都の中間に位置するベットタウンに居住する被験者3人を用いとるちゅうわけや。ここら辺だと、京都弁ではおまへんし、大阪弁と言うのもどうかと思うわ。ほんで、あいまいであることを承知の上で、あえて「関西弁」ちう言葉を用いたいと思うわ。

 なお、毎日毎晩壱年中のことであるが本「できるかな?」は「質より量」がモットーであるちゅうわけや。また、意図的にウソを混ぜることもあるちゅうわけや。ちうわけで、情報は各自取捨選択してもらいたいちゅうわけや。

 まずは、京都市の西の辺りに居住する人の「なんでやねん。」を示してみようわ。ちーとばかし、ツッコミの気持ちが強い「なんでやねん。」であるちゅうわけや。ツッコミの気持ちが強いために、前半「なん」と後半「でやねん。」がちびっと分離気味であるちゅうわけや。
 

京都市の西の辺りに居住する人の「なんでやねん。」

 この場合の関西弁ネイティブの「なんでやねん。」の特徴は

  1. 前半
    • 第一フォルマント(赤)の上昇と下降
    • 第二フォルマント(青)はフラット
  2. 後半
    • 第一フォルマント(赤)の上昇
    • 第二フォルマント(青)の下降
であるちゅうわけや。この上昇と下降がネイティブの「なんでやねん。」を作るのであるちゅうわけや。いかにこの「上昇と下降」を発音することができるかが重要やのであるちゅうわけや。

 それに対して、関西弁ビギナーの「なんでやねん。」を示してみるちゅうわけや。彼の場合は自然な「上昇と下降」を発音することができておらへん。
 

関西弁ビギナーの「なんでやねん。」

 橙色で囲ったあたりに無理が感じられるちゅうわけや。妙に力の入った「なんでやねん。」であるちゅうわけや。不自然な「なんでやねん。」であるちゅうわけや。オノレでは自然だと思うのであるが、ネイティブに言わせると「なんかちゃうな。」と言われてしまうわ。オノレではわかりまへんが、きっとこの妙に力の入った辺りに不自然さがあるのやろうわ。

 ほなら、京都と大阪の境辺りに居住する人の「なんでやねん。」も示す。ウチは、もうちびっとくだけた「なんでやねん。」であるちゅうわけや。ナチュラルな「なんでやねん。」であるちゅうわけや。この場合には、ちびっと抗議っぽいニュアンスが感じられ、「なんでやねん。」の前半と後半の分離がないちゅうわけや。
 

京都と大阪の境辺りに居住する人の「なんでやねん。」

 ウチは、「なんでやねん。」全体が一体化し、全体を通してのスムーズな「上昇と下降」があることがわかるちゅうわけや。この自然な「上昇と下降」と、ニュアンスの違いによる「間」のとり方やらなんやらを意識することにより、あんはんも自然な「なんでやねん。」をしゃべることができるようになるのではおまへんやろうか?

 ちうわけで、これからもきっと「関西弁の音声学」は続くやろうわ。たまにだけれど。それにより、科学的に関西弁ネイティブに近づく方法を探ってみたいと思うわ。ほな、さいなら。

2001-01-04[n年前へ]

世界の国からこんにちは 

hirax.net版GeoWhoisを作る


 VisualC++ MFCを使ったWindowsプログラミングはどうもお気楽という感じにはいかない。もちろん、「子供の科学」にすらMFCを使ったプログラミング入門が連載(何故、VisualC++で!?)されるくらいであるから、別にそれが難しいわけではないのかもしれない。しかし、VisualC++MFCでWindowsプログラミングがキライになる人は絶対いるはずだ。現に突撃実験室のwebmasterはかつてVisualC++と闘った結果、「俺は永遠に組み込み屋じゃっ」と叫んでいたらしい(C.突撃実験室)。

 私も含めて、そんなWindowsプログラミング難民達を優しく女神のように迎えてくれるのがBorlandC++Builderである。いや、女神は必ずしも私たちを優しく迎えてくれるわけではない。むしろ、女神は私達を冷たくあしらうことの方が多いので、実は女神よりもC++Builderの方が優しいと言っても良いくらいである。しかも、C++Builderは自然にWindowsプログラミング(そして嫌でもDdelphi)を覚えさせてくれるところが実にありがたい。そして、そんなC++Builder(Delphi)ユーザー達にとって実に便利なのがTorry'sDelphi Pages.だ。

 というわけで、先日Torry's Delphi Pages.をチェックしていると、とても面白いコンポーネントがあった。それはYehudaSharvit.による

である。ドメインネームから地理的な位置座票への変換を、地理データベースを持っているイリノイ大学の"cello.cs.uiuc.edu"を使って行い、そしてゼロックスのパロアルト研究所(parc)の"mapweb.parc.xerox.com"から地図画像をダウンロードして表示するコンポーネントである。ドメインネーム->持ち主の住所(WHOIS)→位置座票("cello.cs.uiuc.edu")->地図表示("mapweb.parc.xerox.com")という流れでドメインが位置している場所を表示するわけだ。

 例えば、DelphiでGeographicWhois Componentを使ってapple.comを検索・表示してみたのが次の画像である。
 

GeographicWhois Componentを使ってapple.comを検索・表示してみたもの

 もちろん、「ドメインが位置している場所」と言っても、ドメインの登録者の住所を表示するわけで、必ずしもそのドメインのサーバーが位置する場所を表示するわけではない。だけど、そもそも「ドメインが位置する場所」というのは「実際のドメインのサーバーが位置する場所」ではなくて、「ドメインの登録者の住所」だと私は思うのでこれはこれで良いのである。そしてまた、「ネットワーク上であまり意識することのない地理的な位置情報を表示する」というのがかなり面白いと私は思う。

 日頃、ちょこちょことブラブラと色々なサイトを巡回して楽しんでいる(といっても実は多くはない)のだが、そのサイト達は世界中のどこにいるのだろう?なんて時折と思うことがある。以前、

でネットワーク上を自分の家からロンドンまでヒッチハイクしてみたけど、そんなヒッチハイクも地理的な位置情報が判れば、それはもっと楽しいかもしれない。WEBで辿る「世界一周の旅」なんてのも簡単にできることだろう。そしてまた、「インターネット上の距離」と「地理的な距離」を並べて見てみるのも面白いだろう。というわけで、今回は色々なサイトがどんな場所に位置しているかを表示するアプリケーションを作ってみることにした。
 

 ところで、先のGeographicWhois Component自体はDelphi用のコンポーネントでC++Builder用ではない。もちろん、C++BuilderはPascalで書かれたDelphi用のコンポーネントだって読み込めるわけだが、とりあえずこのコンポーネントはそのままではC++Builderには取り込めない。それだけではなく、地図の縮尺や位置などの指定をすることができないため、このままでは色々なサイトの位置を重ねて表示することはできない。

 そこで、「ドメインネーム->持ち主の住所(WHOIS)→位置座票("cello.cs.uiuc.edu")->地図表示("mapweb.parc.xerox.com")というルーチン」をC++Builderで自分用に作り、できあがったアプリケーションがこれである。

もちろん、いつものように数回だけの動作(不?)確認しかしてない完全無保証版である。

 GeoWhois.exeの動作画面が次の図である。ドメインの場所を検索しその結果が上の方の画像に表示される。また、検索履歴が下の画像に表示される。検索履歴画像の方はSaveボタンでbmpファイルとして保存することができる。
 

GeoWhois.exeの動作画面
ドメインの場所を検索し、その結果が上の方の画像に表示される。
検索履歴が下の画像に表示される。

 ちなみに、上の画像の検索履歴は私のよく見に行くところである。結構世界の各地に広がっているような気もするし、広がっていないような気もする。こんなプロットをもっともっと重ねてみて、あとリンクの様子も線でプロットしてみたりすればかなり面白いグラフができることだろう。

 さて、ドメイン名から位置座票への変換("cello.cs.uiuc.edu")はあまり色々な場所が登録されているわけではないので、少なくとも日本などでは東京くらいしか変換することができない。だから、当然のごとくtomoya.comやhirax.netは表示されない。だから、実際のところ私が良く見に行く個人サイトは本当はあまり検索することができない。もちろん、プロバイダー内にWEBページを持っているようなところは検索・表示することができるのだけれど、そんなところはみんな東京になってしまうのである。しかも「WEBページの持ち主= ドメインの持ち主」でもないので、そもそも「そのドメインの位置情報 = WEBページの位置情報」では全然無い。だけど、そもそもそんな日本国内の「ご近所さんを探せ!」コーナーではないのだから、もうそれはそれで良いのである。遙か遠くの国のサーバーを地図で眺めることができる、というところが良いのである。

 このGeoWhoisを応用していけば色んな遊び方があると思うのだが、今回はこのアプリケーションを作ってみたところで終わりにしたいと思う。次回以降(といってもいつになるか判らないけど)で、「インターネット上の距離」と「地理的な距離」でも調べてみたいと思う。

 それにしても、こんな地図を眺めていると、本当に旅行したい気分になってきたぞ〜
 

2001-06-25[n年前へ]

タイムマシーンにお願い 

 私はこの手の古い海外TVドラマの大ファンなのだけれど、この手のビデオを入手できるところはないのでしょうか? というわけで、リンク先は「海外ドラマ総合データベース」から。もっとも、「タイムマシーンにお願い」というのは私は見ていたわけではなくて、単に偶然私が「タイムマシーンにお願い」という検索をかけた結果だったりする。(リンク

2001-10-12[n年前へ]

D30レンズデータベース 

 DC30用レンズ評価など。from Fast & First雑記(リンク)(リンク



■Powered by yagm.net