1999-12-04[n年前へ]
■WEBの世界の「力の法則」
「ReadMe!JAPAN」と「日記猿人」に見るWEBアクセス数分布
以前、
の中で書いたように、「Webの成長のダイナミクスとトポロジは,物理学の世界のPower(累乗)Lawとして知られている法則に従っている」という面白い話が世の中にはある。これは、「ごく少数のWEBサイトへのアクセス、あるいはリンクが他を圧倒する程の割合を示す。」ということである。「インターネットのほとんどのアクセスというものは、ごく少数の特定のサイトへのものである。」ということだ。宇多田ヒカルの売り上げが演歌の総売上をはるかに超えるという話とよく似ている。実社会でもそういうことは実に多い。どうも、マイナー趣味である私には、Power(累乗) Lawというのはいま一つ面白くない話ではあるが、
- InternetEcologies
- http://www.parc.xerox.com/spl/groups/dynamics/www/internetecologies.html
- Paperson small-world networks
- http://www.ncrg.aston.ac.uk/~vicenter/smallworld.html
まずは、考えるためのデータを採取してることにした。欲しいデータは色々なWEBサイトへのアクセス数である。もちろん、自分のWEBサイトへのアクセスではないのだから、何らかの公開データを探さなければならない。
そこで、ReadMe!Japan(http://readmej.com/)と日記猿人(http://wafu.netgate.net/ne/)という二つのランキングシステムを用いてみた。ReadMe!Japanは日本語の「読み物」を主体としたWEBランキングである。また、日記猿人は名前の通り「日記」をターゲットとしたWEBランキングである。
一見、同じように見えるReadMe!Japanと日記猿人のランキングであるが、かなり違ったシステムである。以下に、Readme!Japanと日記猿人のランキングシステムを示してみる。
- Readme!Japan 登録したWEBページに、一日の間にアクセスしたIPアドレスの数。
- 日記猿人 「投票」ボタンを押した人(ブラウザー)の数、一日の間に一人の人(ブラウザー)が同一の日記に対して複数回の投票は行うことが出来ない。
一方、Readme!JapanはIPアドレスベースであるから、同一のProxyなどを経由したアクセスの場合、何人からアクセスがあろうと1pointである。しかし、読者に「投票ボタンを押す」というような作業は要求されない。
それでは、日記猿人とReadMe!JAPANの得票ランキングの例を示してみる。横軸はランク(順位)であり、縦軸が得票数である。ここでは縦軸・横軸共に線形軸を用いている。
なお、 Readme!Japanは11/30日のものであり、日記猿人は(ほぼ)11月分の得票数分である。
このグラフを眺めてみると、日記猿人とReadMe!JAPAN共によく似ている。なるほど、少しランクが下がっただけで、急激に得票数が少なくなっている。もう、縦軸で言うならば下に張りついてしまっている。「ごく少数のWEBサイトへのアクセス、あるいはリンクが他を圧倒する程の割合を示す。」という「WEBの世界の力(累乗)の法則」は日記猿人とReadMe!JAPANでも当てはまるようである。
さて、ここまでランクに対して得票数が変化するとなると、グラフの軸は線形軸でなくて対数軸の方が良いだろう。そこで、グラフの軸を対数軸に変えたものを以下に示す。
こうすると、日記猿人とReadMe!JAPANのどちらも、
- 上位のランク(例えば、1位から1000位程度まで)では傾きがほぼ1である。すなわち、ランクが一桁下がると、アクセス数も一桁下がる。
また、ReadMe!JAPANでは、ランクが極めて大きい所では得票数が0に近い。おそらく、その影響と考えられるが、ランクと得票数の関係が直線でなくなっている。
それと同じことは日記猿人でも言えるだろう、ただし、「ランクとポイントの関係が直線でなくなる」のがReadMe!JAPANよりも早いような気がする。しかし、それは誤差かもしれない。参加数もかなり異なっているので、誤差の可能性が高いと思われる。
さて、これまでは日記猿人とReadMe!JAPANのランキングの数字を直接用いてきたわけである。しかし、得票数の全く違うものをそのまま比較してもしょうがない。ある程度条件をそろえた上で比較をすべきであろう。そこで、縦軸を正規化して比較をしてみることにした。得票数の合計が1であるような単位に変換してみるのである。
ここで、横軸はランクのLog_10を用いている。本来、ランク(順位)も何らかの正規化の変換をすべきであろうが、今回はやり忘れた。きっと、頭が疲れているせいである。
また、グラフを見ればわかると思うが、それぞれについて近似曲線を計算している。
次に、ここで得られた「ランクとポイントの関係」を示す近似関数
- ReadMe!JAPAN y = -0.001x^5 + 0.0119x^4 - 0.0534x^3 + 0.1186x^2 - 0.1355x+ 0.0683
- 日記猿人 y = -0.0005x^5 + 0.0054x^4 - 0.0222x^3 + 0.0472x^2 - 0.0589x+ 0.0391
R eadMe!JAPANでも日記猿人でも横軸が2以上(すなわち100位以下)の場所などでは、ほとんどポイントはゼロみたいなものである。すなわち、100位より下のWEBのアクセス(本WEBへのアクセスも含めて)は誤差みたいなものなのだ。何しろ、一位(トップ)のポイントが0.07とか0.04とかなのだ。それは「一位のWEBサイトへのアクセスが全部のサイトへのアクセスの1割弱を占める」ということなのである。20位までのサイトへのアクセスを合計すると全アクセスの50%以上を占めてしまう。これが、恐るべきWEBの世界の"PowerLaw"、すなわち、「力(累乗)の法則」である。
ところで、日記猿人では上位サイト(すなわち、横軸で0に近いところ)での関係式の傾きがReadMe!JAPANよりも小さい。すなわち、上位サイトの得票数が拮抗している。これは一体何故だろうか?
私はこの理由を、
- 日記猿人の読者が割と似ている趣味を持っている
- 日記猿人の参加WEBサイトが似たような内容を持っている
日記猿人の参加WEBサイトが似ており、読者同士が割と似ている趣味を持っていれば(私も含めて)、得票数というのは当然横並びになるだろう。上位サイトにはほとんどの人が見に行き、そしてほとんどの人が「投票」ボタンを押せば、上位サイトはみな同じような得票数を示すことになる、と思うのである。
それは、違う傾向を示すReadMe!JAPANの中でも、読者層も作者も似ている「Fast&First」と「今日の必ずトクする一言」はとても近い得票数を示している、ということがその根拠の一つである。
それに対して、ReadMe!JAPANが比較的広いジャンルの「読み物」が集まっているのでそういう現象が見られないのだろう、と考えるのである。しかも、実際には「読み物」ですらないものも集まっているので、なおさらジャンルとしてはバラけている。だから、「WEBの世界の力(累乗)の法則」を素直に反映していると考えるのである。
私としては、ごく一部のWEBサイトへの集中が生じるのはツマラナイと感じてしまうのであり、「WEBの世界の力(累乗)の法則」はキライである。だからといって、趣味が似た人ばかりというのもツマラナイように思う。うーん、どういうのがツマラナクナイのだろうか?
それはきっと、「色々な趣味の人が色々なWEBへアクセスする」というのが私の好みだ。実現は難しいのだろうけど...いや、そんなことはないか。
2000-07-15[n年前へ]
■外の世界を眺めてみれば
ビデオ入力を活用しよう
先日、トランジスタ技術の2000/07号を読み直していた。読み直していたのは「色センサー」の記事である。有限会社レンテックが視覚障害者用の製品として発売しているものである。PICをよく使う人だったら、この記事を読んでいなかったとしても、多分よく知っている話だと思う。何しろ昨年の「第三回PICmicroデザイン・コンテスト」で優勝した作品だからである。PICと音声ICの数多い制限と、測定上の制限の中で、「(使用用途を考えた上での)安定した色名決定」を行うルーチンがとても苦労していて、読んでいてとても面白い。
個人的には、この「第三回PICmicroデザイン・コンテスト」で入賞している「マルチ・チャンネル分光器」と
みたいなものを組み合わせて、「5000円でできるパーソナル・マルチ・チャンネル分光器」なんてものを作ってみたいと思っているのだけれど、こちらはなかなか作業が進んでいない。それはさておき、この「色センサー」のように、持ち歩いて色々なところですぐに調べることのできる測定器というのはとても便利なものだ。そして何より、それを作っている側からしても面白いものである。そこで、私も試しに作ってみることにした。といっても、計測器を作り出すと仕事と区別がつかなくなってしまうので、ハード的に作業をするのは気分が全然のらない。そこで、PCに接続されているビデオカメラを用いて、ソフト的に作ってみることにした。やってみたことは、以前作成した「色覚モドキソフト」を、ビデオカメラからのリアルタイム入力用に作ってみただけである。
以前
ではインターネット上にある画像ファイルに対して、画像処理をかける「色覚モドキソフト」を作ってみた。コンピュータにネットワーク上のものが見える「色覚」を持たせて、ネットワーク上の画像について考えてみたわけだ。そして、ではそれを自分のPCの中にある画像ファイルをいじるようにしてみた。つまり、コンピュータに自分の中のものが見える「色覚」を持たせて、自分の中を覗いてみたのである。そして、今回はPCに接続されているビデオカメラを用いて、コンピュータに現実社会を眺める「色覚」を持たせてみることにしたのである。そんな現実社会を眺めることができて個性を持つコンピュータを通して、現実社会を眺めてみたいと思うわけだ。
最近の持ち歩き用の小型ノートPCにはビデオカメラが取り付けられているものが多い。例えば、こんな感じだ。
私もCasioのPalm-sizePCは使っているし、ノートPCにもUSB接続のビデオキャプチャーを取り付けている。こういう持ち歩けるPCに取り付けてあるビデオカメラを活用しないのは勿体ない、というわけで、以前作った
を改造し、で作ったtruecolorを合体させて、ちょこちょこっと作ってみたのがこれだ。- truecolor5.exe ( truecolor5.lzh 746kB)
例えば、次の画面はTVで放映している「ターミネーター」を見ているところである。一番左の画面がコンピュータのビデオカメラに写っているそのままの画面だ。そして、真ん中がリアルタイムに色調変換をかけている画面である。つまりは、「色覚に個性を持つ」コンピュータが眺めている「ターミネーター」である。また、一番右はシャッターを押したときに取り込まれた静止画像である。
くれぐれも勘違いしないで欲しいのだが、上の一番左の画面で「赤い」部分が、真ん中の色調変換をかけた後では緑っぽく見えているからといって、このコンピュータがそこを「緑」と認識しているわけではない。あなたが、この真ん中の画面を見て何かを解釈しようとした瞬間に、それはコンピュータの感覚に加えてあなたの感覚が混入してしまうのである。もし、それでもそう考えたくなる人がいれば、そもそも「赤」とか「緑」という言葉はどういう意味なのかを考えてみると良い、と思う。
また、今回のL,M,S(これは具体的な何かを指すわけではないので、この意味についてはあえてここでは説明しない)の各スライダーの感度パーセンテージを以前のような0〜100%ではなくて、0〜200%の範囲で動かせるようにしてみた。もし、あなたのPCのモニタがこのLに対応するところが弱くなりがちならば、このLのスライダーをいじってやって、Lに関する情報を増幅してやることができる、と考える人もいるだろう。といっても、いじってみるとわかると思うが、そもそもモニタの出力可能な限界と画像フォーマット上の限界があるわけで、なかなかそういうわけにはいかない。ただ、色々と実験してみるのには面白いかもしれない。
ちなみに、次の画面は「週間アスキー」の広告を眺めている画面だ。おやおや、この広告はこのコンピュータには今ひとつアピールしないようだ。
さて、先ほど
そもそも「赤」とか「緑」という言葉はどういう意味なのかを考えてみると良い、と思う。とあっさり書いたが、「言葉」とか、「現実」とか、あるいは「感覚」といったものはすこしづつ重なり合ってはいるけれど、それは一致し得ないものだと私は思っている。まして、それらは一人の人の中で完結できるものでもないし、同時に万人にとって同じでもない。以前書いた「クジラは哺乳類か魚か?」とかと同じで、心底考えてみることに意味があるんじゃないか、と思ってたりするのだ。
2007-07-04[n年前へ]
■オカルトと「説明・制御への欲望」
MatLabで制御工学に浸っていると、「物理系の類似性」なんていう言葉が出てくる。電気系・力学系…全く異なる対象なのに、なぜか似通った関係・同じような描写がされるものは多い。それと同じように、全然違う分野の本を読んでいても、なぜか少しづつ重なることが書かれていることが頻繁にある。制御工学に浸かりながら思い浮かべたのは、こんな言葉だ。
科学と現代オカルトに共通するものは何か。それは原理への欲望とコントロール願望であろう。 「科学とオカルト」P.143 現代オカルトは科学の鏡である科学とオカルト(池田清彦 講談社学術文庫)」が書く「原理への欲望」と「制御への欲望」を言い換えるなら、それは「説明が欲しい・納得したい」という欲望と「望むような自分になりたい・世界を変えたい(制御したい)」という欲望だろう。少なくとも、原始の科学やオカルトは、「原理」と「制御」という欲望の下に、完全に同じものだったに違いない。
1入出力系システムで可制御行列が正則でなければ、可制御、すなわち、任意の状態に制御することはできない。
1入出力系システムで可観測行列行列が正則でなければ、可観測、すなわち、状態量を正確に知ることはできない。現在では、むしろ科学の方が原理・説明や制御において、「できないこと」を声高らかに謳うようになった。今では、「原理的にできないこと」が証明されることを面白く感じる人もきっと多いことだろう。
科学は、原理的に説明できない現象は説明できないままに放置せざるを得ない。それは科学の欠点ではなく最大の美点である。 「科学とオカルト」P.145 現代オカルトは科学の鏡であるとはいえ、「科学」という広い言葉より実社会にもう少し近い、工学としての科学という側面においては、やはり「できないこと」「制御できないこと」「説明できないこと」が、表だって語られることは少ないと思う。
オカルトは、科学では説明できない現象を説明すると称して、いとも簡単にこの禁欲を破ってしまう。 …一回性の出来事を説明できない科学に、頼りなさを感じている人々の一部は、こういったオカルトに引きつけられてゆくのであろう。 「科学とオカルト」P.145 現代オカルトは科学の鏡である科学を使って何かを把握・制御しようとする人の行動も、「科学は老化の原理を教えてくれても、人が生きる意味は教えてくれない」と思う人の行動も、それらの行動や言葉の原動力は、いずれも「説明と制御への欲望」であるという一点で、ピタリと重なり合うものなのかもしれない。
2007-07-06[n年前へ]
■「物語」と「市場経済」
現代は大衆民主主義と資本主義と科学技術の時代である。人々は原則平等という権利と引き替えに、細かい差異化過程に巻き込まれ序列化されることを余儀なくされる。「科学とオカルト(池田清彦 講談社学術文庫)」は科学という積み木と隣り合うオカルトという積み木の姿を描く。そして、それと同時にこの本が描くのは、科学だけでなく資本主義と大衆民主主義という積み木とも隣接するオカルトの姿でもある。
「科学とオカルト 」P.7 はじめに
本屋に置いてある雑誌や駅に置いてあるフリーペーパーを眺めてみれば、たくさんのファッション・スタイルや数限りないグルメスポットが掲載されている。そんなたくさんの選択肢から自分なりのものを選んで自分に振りかけてみても、他人と自分の違いは、スターバックスで注文するコーヒーかホットドッグのトッピング程度の違いしかないことだって多い。
宗教という大きな公共性も身分制という規範も存在しない現代では、自分が何者なのかということを教えてくれるものは何もない。唯一、最大の公共性であり科学は、そういう問いには原理的に答えることができない。元サッカー日本代表の中田英寿は「自分探しの旅」へと出かけてしまい、須藤元気は格闘技のリングから「スピリチュアルな世界」へと舞台を変えた。「僕って何」という問いかけをする「一見さんに対し」、ほとんど全てのものが明確な答えを与えることはしないように、科学が一見さんが抱えるその問いに答えることはない。
「科学とオカルト 」P.148 現代オカルトは科学の鏡である
お客様は神様です。 三波春夫「お客様は神様です」という言葉とともに、スーパーにはたくさんのものが並び、私たちは自分が持っているお金の範囲で自由に商品を選ぶことができる。現代社会は、お金を持っている限り有効の神様チケットを持った人で満ちあふれている。それと同時に、そんな神様たちは「選択」という価格の付けられたチケットを持ってはいるけれども、選択に迷いがちで自分を見つけられない存在でもある。
幸か不幸か、社会はこの現実社会にはないものを物語という形で流布する。「かけがえのない私」というのも、こういった物語の一つである。消費者が望むものを誰かが生産する。需要のあるところには、必ず供給が生まれる。科学が生産できないものを現代の消費者が望むなら、そこには、必ず別の供給者が現れる。それが自由市場主義で動く現代社会なのだろう。消費者という神様は欲しいものに応じ、時には科学を選び、時にオカルトを選ぶのである。お客様という神様たちと、そんな神様たちの欲望に応える供給者が作り出していくのが、21世紀の世界なのだろうか。
「科学とオカルト 」P.149 現代オカルトは科学の鏡である
(「科学とオカルト」を書いた)池田の著書は、自分で考えるとはどういうことか、結局はそれを教えてくれる本なのである。
養老孟司
2009-03-10[n年前へ]
■(日本の)学校で正解が一つの問題ばかり解き続けること
週刊SPA! 鴻上尚二 ドン・キホーテのピアス 707 「騒動になった熊本県の社会科」テストを考える の一部を要約するとこうなる。
人生の正解は一つに決まらないにも関わらず、(日本の)学校では(用意された)正解が一つの問題ばかり解き続ける。そして、実社会に出たら、正解は一つじゃないという当たり前のことに気づき、愕然とする。