hirax.net::Keywords::「読者層」のブログ



1999-12-04[n年前へ]

WEBの世界の「力の法則」 

「ReadMe!JAPAN」と「日記猿人」に見るWEBアクセス数分布

 以前、

の中で書いたように、「Webの成長のダイナミクスとトポロジは,物理学の世界のPower(累乗)Lawとして知られている法則に従っている」という面白い話が世の中にはある。これは、「ごく少数のWEBサイトへのアクセス、あるいはリンクが他を圧倒する程の割合を示す。」ということである。「インターネットのほとんどのアクセスというものは、ごく少数の特定のサイトへのものである。」ということだ。宇多田ヒカルの売り上げが演歌の総売上をはるかに超えるという話とよく似ている。実社会でもそういうことは実に多い。

 どうも、マイナー趣味である私には、Power(累乗) Lawというのはいま一つ面白くない話ではあるが、

といった所を眺めていくと、どうやら事実であるようだ。ここらへんのWEBはとても読んでいて面白い。そのせいか、似たようなことで遊んでみたくなった。そこで、今回はその"PowerLaw"、すなわち、「力の法則」について考えてみたい。ところで、本来ここでの意味は"Power"=「累乗の法則」となるが、ここでは「力の法則」としておく。

 まずは、考えるためのデータを採取してることにした。欲しいデータは色々なWEBサイトへのアクセス数である。もちろん、自分のWEBサイトへのアクセスではないのだから、何らかの公開データを探さなければならない。

 そこで、ReadMe!Japan(http://readmej.com/)と日記猿人(http://wafu.netgate.net/ne/)という二つのランキングシステムを用いてみた。ReadMe!Japanは日本語の「読み物」を主体としたWEBランキングである。また、日記猿人は名前の通り「日記」をターゲットとしたWEBランキングである。

 一見、同じように見えるReadMe!Japanと日記猿人のランキングであるが、かなり違ったシステムである。以下に、Readme!Japanと日記猿人のランキングシステムを示してみる。

  • Readme!Japan 登録したWEBページに、一日の間にアクセスしたIPアドレスの数。
  • 日記猿人 「投票」ボタンを押した人(ブラウザー)の数、一日の間に一人の人(ブラウザー)が同一の日記に対して複数回の投票は行うことが出来ない。
 したがって、Readme!Japanに対して、日記猿人は「投票ボタンを押す」という作業が余計に必要となる。単純に「読まれた数=得票」ではないのである。読者に「投票ボタンを押そう」という気持ちを生じさせることが必要とされるのである。
一方、Readme!JapanはIPアドレスベースであるから、同一のProxyなどを経由したアクセスの場合、何人からアクセスがあろうと1pointである。しかし、読者に「投票ボタンを押す」というような作業は要求されない。

それでは、日記猿人とReadMe!JAPANの得票ランキングの例を示してみる。横軸はランク(順位)であり、縦軸が得票数である。ここでは縦軸・横軸共に線形軸を用いている。

日記猿人とReadMe!JAPANの得票ランキングの例 (線形軸)

 なお、 Readme!Japanは11/30日のものであり、日記猿人は(ほぼ)11月分の得票数分である。
このグラフを眺めてみると、日記猿人とReadMe!JAPAN共によく似ている。なるほど、少しランクが下がっただけで、急激に得票数が少なくなっている。もう、縦軸で言うならば下に張りついてしまっている。「ごく少数のWEBサイトへのアクセス、あるいはリンクが他を圧倒する程の割合を示す。」という「WEBの世界の力(累乗)の法則」は日記猿人とReadMe!JAPANでも当てはまるようである。

 さて、ここまでランクに対して得票数が変化するとなると、グラフの軸は線形軸でなくて対数軸の方が良いだろう。そこで、グラフの軸を対数軸に変えたものを以下に示す。

日記猿人とReadMe!JAPANの得票ランキングの例 (対数軸)

 こうすると、日記猿人とReadMe!JAPANのどちらも、

  • 上位のランク(例えば、1位から1000位程度まで)では傾きがほぼ1である。すなわち、ランクが一桁下がると、アクセス数も一桁下がる。
というようなことがわかる。まさに、「力(累乗)の法則」である。確かに"Power"である。

 また、ReadMe!JAPANでは、ランクが極めて大きい所では得票数が0に近い。おそらく、その影響と考えられるが、ランクと得票数の関係が直線でなくなっている。

 それと同じことは日記猿人でも言えるだろう、ただし、「ランクとポイントの関係が直線でなくなる」のがReadMe!JAPANよりも早いような気がする。しかし、それは誤差かもしれない。参加数もかなり異なっているので、誤差の可能性が高いと思われる。

 さて、これまでは日記猿人とReadMe!JAPANのランキングの数字を直接用いてきたわけである。しかし、得票数の全く違うものをそのまま比較してもしょうがない。ある程度条件をそろえた上で比較をすべきであろう。そこで、縦軸を正規化して比較をしてみることにした。得票数の合計が1であるような単位に変換してみるのである。

 ここで、横軸はランクのLog_10を用いている。本来、ランク(順位)も何らかの正規化の変換をすべきであろうが、今回はやり忘れた。きっと、頭が疲れているせいである。

 また、グラフを見ればわかると思うが、それぞれについて近似曲線を計算している。

日記猿人とReadMe!JAPANの得票ランキングの例
(得票数の合計が1であるような単位に変換したもの)

 次に、ここで得られた「ランクとポイントの関係」を示す近似関数

  • ReadMe!JAPAN  y = -0.001x^5 + 0.0119x^4 - 0.0534x^3 + 0.1186x^2 - 0.1355x+ 0.0683
  • 日記猿人 y = -0.0005x^5 + 0.0054x^4 - 0.0222x^3 + 0.0472x^2 - 0.0589x+ 0.0391
を重ねて示してみる。
ReadMe!JAPANと日記猿人の「ランクとポイントの関係」近似関数の比較

R eadMe!JAPANでも日記猿人でも横軸が2以上(すなわち100位以下)の場所などでは、ほとんどポイントはゼロみたいなものである。すなわち、100位より下のWEBのアクセス(本WEBへのアクセスも含めて)は誤差みたいなものなのだ。何しろ、一位(トップ)のポイントが0.07とか0.04とかなのだ。それは「一位のWEBサイトへのアクセスが全部のサイトへのアクセスの1割弱を占める」ということなのである。20位までのサイトへのアクセスを合計すると全アクセスの50%以上を占めてしまう。これが、恐るべきWEBの世界の"PowerLaw"、すなわち、「力(累乗)の法則」である。

 ところで、日記猿人では上位サイト(すなわち、横軸で0に近いところ)での関係式の傾きがReadMe!JAPANよりも小さい。すなわち、上位サイトの得票数が拮抗している。これは一体何故だろうか?
私はこの理由を、

  • 日記猿人の読者が割と似ている趣味を持っている
  • 日記猿人の参加WEBサイトが似たような内容を持っている
ということではないか、と考えている。

 日記猿人の参加WEBサイトが似ており、読者同士が割と似ている趣味を持っていれば(私も含めて)、得票数というのは当然横並びになるだろう。上位サイトにはほとんどの人が見に行き、そしてほとんどの人が「投票」ボタンを押せば、上位サイトはみな同じような得票数を示すことになる、と思うのである。
 それは、違う傾向を示すReadMe!JAPANの中でも、読者層も作者も似ている「Fast&First」と「今日の必ずトクする一言」はとても近い得票数を示している、ということがその根拠の一つである。

 それに対して、ReadMe!JAPANが比較的広いジャンルの「読み物」が集まっているのでそういう現象が見られないのだろう、と考えるのである。しかも、実際には「読み物」ですらないものも集まっているので、なおさらジャンルとしてはバラけている。だから、「WEBの世界の力(累乗)の法則」を素直に反映していると考えるのである。

 私としては、ごく一部のWEBサイトへの集中が生じるのはツマラナイと感じてしまうのであり、「WEBの世界の力(累乗)の法則」はキライである。だからといって、趣味が似た人ばかりというのもツマラナイように思う。うーん、どういうのがツマラナクナイのだろうか?
それはきっと、「色々な趣味の人が色々なWEBへアクセスする」というのが私の好みだ。実現は難しいのだろうけど...いや、そんなことはないか。

2005-09-11[n年前へ]

n年日記と技術雑誌の特集記事システム 

inside out   n年日記と呼ばれるシステムがあります。何年か前の同じ日の日記を表示するシステムです。例えば、この日記で言うと、日付の右側にあるn年前へというリンク・テキストです。このn年日記をもっと進化させてみたいな、と思うことがあります。n年前の同じ時期の記事をもっと積極的に見せたいな、と思ったりするのです。

役にたつエレクトロニクスの総合誌 トランジスタ技術学研:科学と学習 技術雑誌なんかは、一年周期で同じような特集記事が繰り返されています。例えば、C マガジン、トランジスタ技術…、どの雑誌でも5月号辺りは必ず「新人フレッシャーズのための…」という感じです。2月号辺りだと、画像関係の特集という感じでしょうか。「学研の科学と学習」の雑誌が、毎年同じような特集を繰り返すのと同じです。雑誌の読者層は入れ替わっていくので、毎年同じような特集を繰り返していても、「読者にとってはいつも新鮮」であるわけです(そう思わない古い読者はいずれ読者でなくなる)。

 ブログと呼ばれる個人サイトでも、昔見たネタが少しの時間をおいて流行ることが多いように見えます。古くから眺めている人にとって見れば、飽き飽きしたネタが繰り返し流行ることもしばしばなんだろうと思います。しかし、それを「技術雑誌の特集記事」のように新陳代謝に対応するためだと考えてみれば、少し面白いような気がします。時折、n年日記システムを眺めながら、そんな「技術雑誌の特集記事」式ブログを想像したりします。

2007-09-11[n年前へ]

新陳代謝と海面を歩く 

 「ソースティン・ヴェブレンというアメリカの経済学者」を知ったのは、つい最近だ。ヘアカタログを題材にしたプログラムを書くために、グラント・マクラッケンが書いた「ヘア・カルチャー(もうひとつの女性文化論)」を読んでいるときに、そのソースティン・ヴェブレンという名前に出会った。

 ブログと呼ばれる個人サイトでも、昔見たネタが少しの時間をおいて流行ることが多いように見えます。古くから眺めている人にとって見れば、飽き飽きしたネタが繰り返し流行ることがよくあります。
 この本の原題は、"Big Hair (A jouney into the transformation of self)"だ。
 夕暮れ近くの海を自転車で巡る。潮が満ちてきて、防波堤が海に沈む。防波堤の上を歩いていく人がいる。防波堤はずっと波に洗われているから、その人はまるで波の上を歩いているように見える。
 その原題にも入っている"Big Hair"に関する章の中に、"代理消費"ヴェブレンがいた。黒柳徹子や横浜銀蠅や、ツッパリ・ハイスクール・ロックンロールたちの源流が解説される中で、ヴェブレンの姿を見かけた。
 今まさに誰かが傷んでいるまだ飛べない雛たちみたいに僕はこの非力を嘆いている
 どんなミステリーも、どんな構造物も、すべては螺旋階段のようだ、とある時に聞いた。何度も同じような景色を、けれど少しづつ違うところから眺めていくものだ、と聞いた。
 一年の周期で、技術雑誌が同じような特集記事を繰り返す。どの雑誌でも5月号は必ず「新人フレッシャーズのための」という特集を組み、それから少し時を経た2月号辺では、画像関係の特集を組む。「学研の科学と学習」が、毎年同じような特集を繰り返すのと同じだ。
 それは、ウンベルト・エーコが書いたバラの名前を輪講で読んでいる時だったか、レイモンド・カーバーを読んでいるときだったか、そんな教室で聞いた言葉だった気がする。
 不思議だけれど、「海面を歩くこと」が当たり前のように見える場所もある。
 グルグル回る螺旋階段のように、技術雑誌は一年周期で、必ず同じような特集記事を繰り返す。それは、絵に描いたような「何度も同じような景色を、少しづつ違うところから眺める」というビューティフル・ドリーマーな景色だ。
「会社にはメカ・ソフト・電気の三人がいれば十分です」
 三人編成のバンドっていいな、と良く思う。見た目のバランスもいいし、音もなかなか飽きない。
 雑誌の読者層は入れ替わっていきますから、毎年同じ特集を繰り返しても、「読者にはいつも新鮮な記事」になります。そう思わない古い読者は、いずれ読者ではなくなるのです。
 色んな人たちがいる。朝顔の蔓のように、DNAが形作る螺旋階段を時をおいて昇る色んな人がいる。
 バーベキューをしている人もいるし、パラグライダーで空に浮いている人もいる。走っている人もいて、スケートで滑っている人もいる。 そして、海辺でゴルフをしている人もいる。
 海の水面を歩く人もいるし、月面を歩く人もいる。仕事が終わらなくて唸っている人もいる。
 しかし、それを技術雑誌の特集記事のように新陳代謝に対応するためだと考えてみれば、少し面白いような気がします。
 そう思わない古い読者は、いずれ読者ではなくなるのです。

2008-09-13[n年前へ]

「雑誌DE流行マップ」始めました 

 先日作ったWEBアプリケーションに少し手を入れたアップデート版を動かし始めました。下の動画は、WEBアプリを操作している時の画面をキャプチャしてみたものです。

 ファッション・ライフスタイル雑誌は、私たちの毎日を映し出したり、作り出したりする媒体のひとつです。同じ雑誌を毎号必ず買って読む人もいれば、特集記事・掲載モデル・付録など内容に応じて、「つまみ食い」のように時によって違う雑誌を買う人もいます。どんな雑誌を選ぶかということの積み重ねが、私たち自身や私たちの毎日を作り出していきます。
 「どんな雑誌のどの号にどんな情報が載っているのかを、特集記事・キーワード・掲載モデル・流行度比較・読者年齢や読者層といったポジショニングマップ・読者分布地図…といったさまざまな視点から眺めることができる」のが「雑誌DE流行マップ」です。あなたが「知りたいこと」「なりたいもの」「手に入れたいもの」が載っている雑誌を「雑誌DE流行マップ」を使えば楽しく見つけ出す・眺めることができます。

2008-09-15[n年前へ]

雑誌の「読者年齢vs.購買力」マップを眺めてみると!? 

 右に貼り付けた説明スライドのように、「雑誌DE流行マップ」の狙いは雑誌や流行りというものを色々な見方で眺めたいということです。 だから、たとえば、雑誌タイトルの一覧ページでは10種ほどの眺め方ができるわけです。

 さまざまな軸で雑誌を眺めたり、言葉を眺めたり、あるいはそこに登場する人たちを眺め直してみることで、流行りや流行らないことの全体像を見てみたい、あるいはその全体の中に各部分がどう位置しているかを眺めてみたい、と思いました。そこで、そんなことができるツールを作ってみたのです。

 ツールを作ってみたので、まずは「読者の年齢」「読者の購買力」「読者の数」という三つの軸で雑誌や流行を眺めてみることにしました。ここで、「読者の年齢」というのは「その雑誌を買っている読者の平均年齢」で、「読者の購買力」というのは「その雑誌を買っている読者がファッション・余暇などに費やしているお金の量」で、「読者の数」というのは「その雑誌を買っている人たちの数」です。

 右の散布図は、雑誌の「読者の年齢vs.読者の購買力」チャート表示をしてみたところです。横軸が「読者の年齢」で、縦軸が「読者の購買力」です。バラツキはもちろんありますが、大雑把には右上がりの傾向を示しています。つまり、「年齢が高い方が購買力も高い」という単純な傾向です。ただ、そこにはバラツキもあって、そのバラツキこそが「読者の年齢vs.読者の購買力」というポジショニングマップから見えてくる雑誌読者層、雑誌の読者の姿、ということになります(いずれの値も独自の適当ロジックで算出している推定値ですから、正確な姿からはほど遠いとは思います。ただ、「読者の購買力」推定と「読者年齢推定」は独立に推定していることは付記しておきます)。

 このグラフを見ると、non-noJJLEONが一直線に並んでいたりして、少し面白いです。年齢が高くなっても若い頃のままの購買力の増加を保ち続けているのが、LEONなんだろうかとか想像したくなります。また、同じ赤文字・女子大生系でも、JJよりCanCamの購買力が低い!?なんていう姿が見えたりします。さらに、CanCamAneCanもほぼ一直線上に並んでいて、その先にはSTORYがいます。つまり、「CanCamAneCanという道を真っ直ぐにそのまま進んでいくと40歳を過ぎる頃にはSTORYを読んでいるかもしれない!?」というような想像ができたりするわけです。

「読者年齢vs.購買力」スライド2散布図1








■Powered by yagm.net