1999-05-03[n年前へ]
■「私と好みが似てる人」 その2
ログ解析の6ヶ月点検
本サイトが公に公開されるようになってから6ヶ月経った。新車でも購入してから半年経てば、6ヶ月点検があるのだから、本サイトについても6ヶ月点検を行ってみたい。
まずは、週別のアクセス量変動を挙げてみる。
Overall Accesses |
アクセス数は割に順調に伸びているようである。1999/02下旬辺りにネットワーク不調とログ解析失敗などによるデータ欠損が見られるが、それ以外ではほぼ線形に増加している。1999/4上旬に増加の傾きが変化しているのはinfoseekにページを登録したことによるものと考えられる。
次に、時間別アクセス量である。以下に示すのは、1999/4/18-24の時間別アクセス量である。
これを見ると、深夜3時位にアクセス数がぐんと減ることがわかる。深夜3時位に眠りにつく人が多いのだろうか。
そして、早朝5時過ぎからアクセス数が増えていくことがわかる。5時過ぎくらいから活動を始める人も多いようだ。そして、昼の12時辺りにひとつピークがある。これは、企業の昼休み時間にアクセスしている人達によるものだろう。次に15時位に大きなピークがある。これは、何だろうか?まさか、おやつの時間ではあるまい。企業ユーザーが一服しているのだろうか?小さい18時辺りのピークも、企業ユーザーの就業時間の終わりを示すものと思われる。
そもそも、こういった昼間の時間別アクセス数から見えてくるユーザーというものは、時間に縛られる企業ユーザーになってしまうのだろう。
さて、次はアクセス数のサイトランキングである。ただし、ここでのサイト=IPアドレスであり、ドメイン解析は行っていない。したがって、同じドメインからアクセスがあっても、IPアドレスが異なれば違うサイトとして計算している。そのため、proxyを使っているような所が、ランクインしやすいということになる。もちろん、proxyを使っていれば、実際よりアクセス数は少なくなるわけだが、今回の比較においては、明らかに同じサイトと判断される分有利なのである。
それでは、最近4週間分のトップ10を示してみる。
Rank | 4/18-24 | 4/11-17 | 4/4-10 | 3/28-4/3 |
---|---|---|---|---|
1 | KyotoPneT | MeshNet厚木 | 阪大レーザー核融合研 | KyotoPneT |
2 | 東大情報システム工学研 | キヤノン裾野 | Hewlett Packerd | キヤノン裾野 |
3 | セイコーインスツルメンツ | オーイーシー | キヤノン裾野 | 千葉大情報数理 |
4 | Fermi-lab | 岡山理科大 電子工学 | ホンダエンジニアリング | PSINet |
5 | OCN | 北大 電子科学研究所 | ベッコアメ福岡 | シチズン |
6 | アスキー | NTT PC-Com 諏訪 | 鹿児島大 情報工学 | 東北大加齢医学研 |
7 | 明治大学総合情報ネットワーク | ワコー | デジタルアーツ | 生協インターネット大阪 |
8 | RICOH | IIJ4U | 藤沢インターネット | 九州大学医 耳鼻咽喉科 |
9 | WEB静岡 | 龍谷大情報NetworkSystem | 通商産業省 | InfoPepper府中 |
10 | KansaiMultimediaService | OCN千葉館山 | アレスネット | DTI熊本 |
トップ1に4回中2回も位置しているのはKyotoPneTである。このサイトは京都周りのネットワーク総合体のようだ。色々集まっている分、アクセス数が多いのだろう。
それでは、週別にコメントをつけてみたい。
3/28-4/3 医学関係が2つランクインしている。おや、九州大学医学部耳鼻咽喉科と言えば、私の一番大好きな「今日の必ずトクする一言」で有名な「バーチャル耳鼻咽喉科」と同じサブドメインである。
4/4-10 通商産業省は公益機関のランクインが少ない中でなかなか健闘している。阪大レーザー核融合研究所はこの2週後のFermi研究所と関係あるのだろうか?
4/11-17 MeshNetの厚木からアクセスされている方が一位である。個人のアクセスというのは非常に嬉しい。この週は個人の方が多い。喜ばしいことだ。
4/18-24 常連だったキヤノン裾野が消え、RICOHがランクインしている。このあと、WEBページは会社の顔色- WEBページのカラーを考える 2 - (1999.04.26) でRICOHのWEBのデザインに苦言を呈しただけに、反応が気にかかるところである。おやおや、ASCIIもランクインしている。
それでは、3ヶ月前に「私と好みが似てる人」 - analog Windows版用のサブドメイン解析ソフトを作る- (1999.01.24) の時に調べたドメインランキングとの比較をしてみる(こちらは、ドメインランキングであって、今回のサイトランキングとは異なる。今回の場合、同じ人がアクセスしても、IPアドレスが異なれば、違う人としてカウントしていることになる)。
1: canon.co.jp (キヤノン)
2: sony.co.jp (SONY)
3: atr.co.jp (株式会社国際電気通信基礎技術研究所)
4: infocom.co.jp (日商岩井)
5: waco.co.jp (ワコービジネス)
6: odn.ad.jp (オープンデータネットワーク)
7: nttpc.ne.jp (ISP事業者向けネットワーク提供サービス)
8: att.ne.jp (日本AT&T株式会社)
9: saitama-u.ac.jp (埼玉大学)
10: kokushikan.ac.jp (国士舘大学)
今回と共通してトップ10入りしているのはキヤノンとワコーである。前回も今回も技術系のサイトばかりである。私が技術マニアであるからしょうがないか。それこそ、「私と好みが似てる人」達なのだろう。
次は「できるかな」内の人気ランキングである。こうしてみると、
- 本人が便利なものは、他人も便利(ex./dekirukana/server/)
- 本人はいまいちだが、読まれている(ex./dekirukana/java/)。
- 本人は気に入っているのに、人気がない(ex./dekirukana/harddisk/)。
#reqs: %bytes: last date: file-----: ------: --------------: ---- 4185: 18.07%: 99/05/15 07:49: / 13: 0.04%: 99/05/12 13:51: /? 1855: 2.18%: 99/05/15 02:33: /dekirukana/java/ 1093: 1.24%: 99/05/15 07:38: /dekirukana/server/ 839: 1.74%: 99/05/15 07:08: /dekirukana/snif/ 789: 0.68%: 99/05/15 04:01: /dekirukana/dorae/ 762: 0.58%: 99/05/15 02:36: /dekirukana/screensave/ 633: 0.83%: 99/05/15 05:32: /dekirukana/photoshop/ 623: 1.20%: 99/05/15 07:20: /dekirukana/whois/ 577: 0.99%: 99/05/15 04:20: /dekirukana/1999/ 543: 0.64%: 99/05/14 22:53: /dekirukana/tire/ 501: 0.80%: 99/05/15 01:55: /dekirukana/digicame/ 435: 0.52%: 99/05/15 00:51: /dekirukana/e55/ 435: 1.22%: 99/05/15 02:23: /dekirukana/ufo/ 427: 0.37%: 99/05/15 04:15: /dekirukana/ocilo/ 392: 0.43%: 99/05/15 06:53: /dekirukana/screensave2/ 373: 0.50%: 99/05/15 05:23: /dekirukana/fem2/ 321: 0.63%: 99/05/15 02:49: /dekirukana/wavelet/ 320: 0.56%: 99/05/15 05:28: /dekirukana/ekisyo2/ 279: 0.32%: 99/05/14 22:30: /dekirukana/hamaphoto/ 267: 0.37%: 99/05/14 23:25: /dekirukana/real97/ 264: 0.36%: 99/05/15 02:28: /dekirukana/karaoke/ 263: 0.16%: 99/05/15 02:25: /dekirukana/ocilo2/ 260: 0.41%: 99/05/15 01:15: /dekirukana/moire3/ 256: 0.81%: 99/05/14 21:07: /dekirukana/onkai2/ 256: 0.44%: 99/05/15 01:48: /dekirukana/sacchan/ 252: 0.29%: 99/05/15 05:52: /dekirukana/toolplus/ 247: 0.24%: 99/05/15 03:02: /dekirukana/server2/ 243: 0.63%: 99/05/15 00:17: /dekirukana/bunsukai/ 216: 0.42%: 99/05/15 06:52: /dekirukana/haidi/ 195: 0.06%: 99/05/15 00:24: /dekirukana/1999_2/ 194: 0.41%: 99/05/15 04:05: /dekirukana/kamogawa/ 186: 0.38%: 99/05/15 01:02: /dekirukana/bunpu/ 185: 0.39%: 99/05/15 04:21: /dekirukana/ufo2/ 185: 0.28%: 99/05/15 05:30: /dekirukana/ekisyo/ 180: 0.38%: 99/05/15 07:42: /dekirukana/moire2/ 171: 0.33%: 99/05/15 02:48: /dekirukana/wavelet2/ 169: 0.17%: 99/05/14 20:48: /dekirukana/rocket/ 164: 0.16%: 99/05/15 04:04: /dekirukana/dorae2/ 160: 0.31%: 99/05/14 15:03: /dekirukana/probe/ 155: 0.14%: 99/05/15 07:08: /dekirukana/tamago/ 144: 0.20%: 99/05/14 21:53: /dekirukana/onkai/ 141: 0.23%: 99/05/13 20:15: /dekirukana/ 126: 0.26%: 99/05/15 01:34: /dekirukana/harddisk/ 124: 0.18%: 99/05/15 02:03: /dekirukana/watari/ 122: 0.29%: 99/05/14 20:49: /dekirukana/webcolor2/ 121: 0.59%: 99/05/15 01:29: /dekirukana/moire/ 118: 0.10%: 99/05/14 14:08: /dekirukana/hori/ 118: 0.18%: 99/05/14 09:21: /dekirukana/bunsukai2/ 116: 0.10%: 99/05/14 21:05: /daily/9904.html 105: 0.19%: 99/05/15 07:34: /dekirukana/favicon/ 105: 0.24%: 99/05/15 06:29: /dekirukana/log9905/ 99: 0.20%: 99/05/14 20:49: /dekirukana/webcolor/ 98: 0.05%: 99/05/15 07:08: /dekirukana/photoshop2/ 79: 0.38%: 99/05/14 09:58: /index_e.html 61: 0.01%: 99/05/13 18:27: /dekirukana/fem2/math/ 46: 0.01%: 99/05/12 19:50: /dekirukana/fem2/math/indexlnk1.html 42: 0.07%: 99/05/12 19:53: /dekirukana/fem2/math/indexlnk4.html 37: 0.03%: 99/05/12 19:51: /dekirukana/fem2/math/indexlnk2.html 33: 0.08%: 99/05/13 18:28: /dekirukana/fem2/math/indexlnk3.html 32: 0.02%: 99/05/14 14:22: /dekirukana/toolplus/readme/readme.html 31: 0.05%: 99/05/12 19:54: /dekirukana/fem2/math/indexlnk5.html 25: 0.06%: 99/05/15 00:22: /dekirukana/harddisk/math/ 21: 0.03%: 99/05/12 19:49: /dekirukana/onkai/math/ 4070: 55.84%: 99/05/15 05:52: [not listed: 34 files]こうしてみると、興味が発散している作者であることがよくわかる。
次にログ解析をするのは、おそらく半年先だろう。 その時、健やかに育っているのだろうか?
1999-12-04[n年前へ]
■WEBの世界の「力の法則」
「ReadMe!JAPAN」と「日記猿人」に見るWEBアクセス数分布
以前、
の中で書いたように、「Webの成長のダイナミクスとトポロジは,物理学の世界のPower(累乗)Lawとして知られている法則に従っている」という面白い話が世の中にはある。これは、「ごく少数のWEBサイトへのアクセス、あるいはリンクが他を圧倒する程の割合を示す。」ということである。「インターネットのほとんどのアクセスというものは、ごく少数の特定のサイトへのものである。」ということだ。宇多田ヒカルの売り上げが演歌の総売上をはるかに超えるという話とよく似ている。実社会でもそういうことは実に多い。どうも、マイナー趣味である私には、Power(累乗) Lawというのはいま一つ面白くない話ではあるが、
- InternetEcologies
- http://www.parc.xerox.com/spl/groups/dynamics/www/internetecologies.html
- Paperson small-world networks
- http://www.ncrg.aston.ac.uk/~vicenter/smallworld.html
まずは、考えるためのデータを採取してることにした。欲しいデータは色々なWEBサイトへのアクセス数である。もちろん、自分のWEBサイトへのアクセスではないのだから、何らかの公開データを探さなければならない。
そこで、ReadMe!Japan(http://readmej.com/)と日記猿人(http://wafu.netgate.net/ne/)という二つのランキングシステムを用いてみた。ReadMe!Japanは日本語の「読み物」を主体としたWEBランキングである。また、日記猿人は名前の通り「日記」をターゲットとしたWEBランキングである。
一見、同じように見えるReadMe!Japanと日記猿人のランキングであるが、かなり違ったシステムである。以下に、Readme!Japanと日記猿人のランキングシステムを示してみる。
- Readme!Japan 登録したWEBページに、一日の間にアクセスしたIPアドレスの数。
- 日記猿人 「投票」ボタンを押した人(ブラウザー)の数、一日の間に一人の人(ブラウザー)が同一の日記に対して複数回の投票は行うことが出来ない。
一方、Readme!JapanはIPアドレスベースであるから、同一のProxyなどを経由したアクセスの場合、何人からアクセスがあろうと1pointである。しかし、読者に「投票ボタンを押す」というような作業は要求されない。
それでは、日記猿人とReadMe!JAPANの得票ランキングの例を示してみる。横軸はランク(順位)であり、縦軸が得票数である。ここでは縦軸・横軸共に線形軸を用いている。
なお、 Readme!Japanは11/30日のものであり、日記猿人は(ほぼ)11月分の得票数分である。
このグラフを眺めてみると、日記猿人とReadMe!JAPAN共によく似ている。なるほど、少しランクが下がっただけで、急激に得票数が少なくなっている。もう、縦軸で言うならば下に張りついてしまっている。「ごく少数のWEBサイトへのアクセス、あるいはリンクが他を圧倒する程の割合を示す。」という「WEBの世界の力(累乗)の法則」は日記猿人とReadMe!JAPANでも当てはまるようである。
さて、ここまでランクに対して得票数が変化するとなると、グラフの軸は線形軸でなくて対数軸の方が良いだろう。そこで、グラフの軸を対数軸に変えたものを以下に示す。
こうすると、日記猿人とReadMe!JAPANのどちらも、
- 上位のランク(例えば、1位から1000位程度まで)では傾きがほぼ1である。すなわち、ランクが一桁下がると、アクセス数も一桁下がる。
また、ReadMe!JAPANでは、ランクが極めて大きい所では得票数が0に近い。おそらく、その影響と考えられるが、ランクと得票数の関係が直線でなくなっている。
それと同じことは日記猿人でも言えるだろう、ただし、「ランクとポイントの関係が直線でなくなる」のがReadMe!JAPANよりも早いような気がする。しかし、それは誤差かもしれない。参加数もかなり異なっているので、誤差の可能性が高いと思われる。
さて、これまでは日記猿人とReadMe!JAPANのランキングの数字を直接用いてきたわけである。しかし、得票数の全く違うものをそのまま比較してもしょうがない。ある程度条件をそろえた上で比較をすべきであろう。そこで、縦軸を正規化して比較をしてみることにした。得票数の合計が1であるような単位に変換してみるのである。
ここで、横軸はランクのLog_10を用いている。本来、ランク(順位)も何らかの正規化の変換をすべきであろうが、今回はやり忘れた。きっと、頭が疲れているせいである。
また、グラフを見ればわかると思うが、それぞれについて近似曲線を計算している。
次に、ここで得られた「ランクとポイントの関係」を示す近似関数
- ReadMe!JAPAN y = -0.001x^5 + 0.0119x^4 - 0.0534x^3 + 0.1186x^2 - 0.1355x+ 0.0683
- 日記猿人 y = -0.0005x^5 + 0.0054x^4 - 0.0222x^3 + 0.0472x^2 - 0.0589x+ 0.0391
R eadMe!JAPANでも日記猿人でも横軸が2以上(すなわち100位以下)の場所などでは、ほとんどポイントはゼロみたいなものである。すなわち、100位より下のWEBのアクセス(本WEBへのアクセスも含めて)は誤差みたいなものなのだ。何しろ、一位(トップ)のポイントが0.07とか0.04とかなのだ。それは「一位のWEBサイトへのアクセスが全部のサイトへのアクセスの1割弱を占める」ということなのである。20位までのサイトへのアクセスを合計すると全アクセスの50%以上を占めてしまう。これが、恐るべきWEBの世界の"PowerLaw"、すなわち、「力(累乗)の法則」である。
ところで、日記猿人では上位サイト(すなわち、横軸で0に近いところ)での関係式の傾きがReadMe!JAPANよりも小さい。すなわち、上位サイトの得票数が拮抗している。これは一体何故だろうか?
私はこの理由を、
- 日記猿人の読者が割と似ている趣味を持っている
- 日記猿人の参加WEBサイトが似たような内容を持っている
日記猿人の参加WEBサイトが似ており、読者同士が割と似ている趣味を持っていれば(私も含めて)、得票数というのは当然横並びになるだろう。上位サイトにはほとんどの人が見に行き、そしてほとんどの人が「投票」ボタンを押せば、上位サイトはみな同じような得票数を示すことになる、と思うのである。
それは、違う傾向を示すReadMe!JAPANの中でも、読者層も作者も似ている「Fast&First」と「今日の必ずトクする一言」はとても近い得票数を示している、ということがその根拠の一つである。
それに対して、ReadMe!JAPANが比較的広いジャンルの「読み物」が集まっているのでそういう現象が見られないのだろう、と考えるのである。しかも、実際には「読み物」ですらないものも集まっているので、なおさらジャンルとしてはバラけている。だから、「WEBの世界の力(累乗)の法則」を素直に反映していると考えるのである。
私としては、ごく一部のWEBサイトへの集中が生じるのはツマラナイと感じてしまうのであり、「WEBの世界の力(累乗)の法則」はキライである。だからといって、趣味が似た人ばかりというのもツマラナイように思う。うーん、どういうのがツマラナクナイのだろうか?
それはきっと、「色々な趣味の人が色々なWEBへアクセスする」というのが私の好みだ。実現は難しいのだろうけど...いや、そんなことはないか。
2000-02-21[n年前へ]
■「私の心」の円グラフ
私と好みが似てる人 その4
これまで、「できるかな?」では
- 「私と好みが似てる人」 その3- ドメイン一覧とreferer log - (1999.08.29)
- 「私と好みが似てる人」 その2- ログ解析の6ヶ月点検 - (1999.05.03)
- 「私と好みが同じ人」 - analogWindows版用のサブドメイン解析ソフトを作る - (1999.01.24)
前回から半年以上の時間が経ったので、今回も、「私と好みが似てる人」の解析を行ってみたい。今回の着目点は次のようなことである。
HIRAX.NETで記録されるreffer_logはHIRAX.NETへリンクが貼られているサイトのアドレスが記録されている。例えば、
http://umz.pos.to/Link/info.html -> /index.htmlというものであれば、「果テシナク続ク複数ノ零 」(きっと、Think Difficultを読んでいたのだろう。)を読んだ後にHIRAX.NETに訪れた、ということがわかるし、
http://www.hirax.net/index.html -> /dekirukana/moire2/index.htmlであれば、HIRAX.NET内の移動であることがわかる。また、
bookmarks -> /index.htmlであれば、ブックマークを使うことで、HIRAX.NETへ訪れたことが判るわけである。
また、実はリンクもブックマークでもなくて、「単に前にただ読んでいただけ(他のWindowで開かれているサイトでリンクが貼られていた場合など)」というものもたまには記録される。
このようにして、「私と好みが似てる人」達がどんなサイトを読んでいるかがわかるのである。最後に書いたように、reffer_logに記録されるのは、HIRAX.NETへリンクを貼っているサイトだけではないので、訪れる前に読んでいたサイトが(ある程度だであるが)わかるのである。
前回の、
では「HIRAX.NETへリンクを貼っているWEB作者を探る視点」から眺めた。今回は「私と好みが似てる人達がどんなサイトを読んでいるか」という視点から眺めてみたい。そして、「私と好みが似てる人」=「私」と考えて、私の好みを第三者的に考えてみたいのである。 話が変わるように思えるかもしれないが、私は「結果が全て」であると考えている(少なくとも、今の瞬間は)。「心の中で思っていて」も、口に出さなければ「思っていない」のと同じである。「掌の中の答え」は掌を開いてみなければわからない。
だから、他の人が自分に対して抱くイメージとは違う「ホントのオレ」があると主張してもしょうがない、と思うのである。「他の人が自分に対して抱くイメージ」=「ホントのオレ」であると思うのである。もちろん、「他の人が自分に対して抱くイメージ」をどう変えるかは自分次第だ。「掌の中の答え」は自分が決めるのだが、「掌の中の答え」を他の人に見せて、やっと「答え」になるのである。
話が長くなったが、「自分の好みはこうだ」と自分で言うのもなんなので、第三者的に「自分の好み」を探ってみることにしたのである。その材料はHIRAX.NETを読んでいる方(つまり、あなた)の読んでいるサイトである。これを読んでいるあなた自身がリトマス紙なのである。「私の好み」は「あなた自身の好み」でもあるのだ。
というわけで、今月前半のreffer_logよりHIRAX.NET外からリンクされた(あるいは移動してきた)、3276アクセスに対して解析を行った。reffer元を私が読んで、大雑把な分類をしてみた。用いた分類は、
- 読み物
- 検索
- コンピュータ
- 日記
- 雑情報
- エロ
- ニュース
- 画像
- 色
- 音楽
- ランキング
- 科学
- 深津絵里
- 製品情報
- イントラ内サイト
- 自然
- 文学
- ゲーム
例えば、
- 読み物 今日の必ずトクする一言 etc.
- コンピュータ お笑いパソコン日誌 etc.
- 雑情報 Fast & First etc.
reffer_logのreffer元がHIRAX.NETでない3276アクセスを分類したもの |
なるほど、「読み物(あぁ、なんて大雑把なくくりだ)」が三分の一を占め、以下「情報検索サイト(infoseekなど)」が1/5程を閉めている。そして、コンピュータ情報等だ。なるほど、それが「私の心の中の興味」と言われれば納得するものである。「科学」や「自然」がずいぶんと下位であるのが不思議なところであるが、まぁしょうがない。まぁ、こんなところだろう。
が、問題は次である。何故か、「エロ」サイトが6位にいるのである。これは、「IO= アイオー」ではない。「エロ = えろ=すけべぇ」である。
reffer_logのreffer元がHIRAX.NETでない3276アクセスを分類したもの |
これは、困った事態である。私としては、「オレはエロサイトよりニュースサイトの方をよく見るぞ!」と主張したいところである。いや、ホントに。しかし、先ほど
他の人が自分に対して抱くイメージとは違う「ホントのオレ」があると主張してもしょうがないと書いた所でもあるし、黙って受け入れなければならないだろう。何か、最近「できるかな?ってあれでしょ。ミニスカートの研究をしているスケベサイトでしょ。」と言われてたりするような気がしてしょうがないのだ… それも、また受け入れなければならないのだろうが…少し、悩んでしまう。
それとも、エロサイトを読んだ後に、心の清涼剤として「できるかな?」を読んでいるのだろうか?なるほど、それならわかる。納得だ。 うん、そういうことで納得しておきたい。
というわけで、先のグラフがが「私=これを読んでいるあなたの心の円グラフ」である。私の悩み=あなたの悩みでもあるはずだ。あなたの心の中には「エロ」が堂々6位に登場しているハズである。あなたの心はニュースより「すけべぇ」が好きなのだ。がんばれ、「私と好みが似てる人」。せめて、「ニュース」の方が上位に来るようにしてくれ…
2002-06-08[n年前へ]
■アレフ・ゼロ
「某ランキングサイトと某宗教団体との関係を疑う」という話がTOMOYA.COMであった。その後、F&Fで「2ちゃんねる」の管理にもそんな関連があるのでは、という話があった。ninki.netを疑うのであれば、繋がりとしては確かに自然な推論かもしれない。とはいえ、この手のところにはどうにも怪しいところは数限りなくあるので、この推論が本当であるかどうかは判らない。が、名前のアレフ・ゼロ(有限会社ゼロ、宗教団体アレフ)繋がりというのもきっと氏の推論の材料の一つであったに違いない。
2002-12-15[n年前へ]
■引っ越し前の大掃除
私と好みが似てる人 その6
hirax.netが生まれたのが1998年の年末だったから、はや四年も経ったことになる。最初の頃、ほんの少しの間だけは共用サーバーで動かしていたのけれども、しばらくしてからは専用サーバーに移行したのだった。といっても、別に好き好んで移転したわけではなくて、単に転送量超過料金が怖かったからである。何しろ、その頃借りていた共用サーバーは1GB/月までは一定料金なのだけれど、それを超えると8円/1MBで追加料金がかかるのである。例えば、2GB/月になってしまうと、追加料金で+8000円かかることになるし、それが3GB/月では+16000円になってしまうというなかなかにシビアな料金体系だったのである。
そんなこともあって移行した先のサーバーマシンは、今となってはかなり心許ないスペックのPentium133MHz, RAM 32MBというスペックであったのだけれど、これまでは特に問題もなく今までせっせと動いてきた。ファイルをただただ転送している分には、こんなスペックのマシンでもノープロブレムだったし、何より転送量を気にしなくていいのが安心できた。
しかし、最近では「いろいろ」ページのCGIが重くなったりしたこともあって、CGIページなどにアクセスが集中したりすると、マシンの反応が悪くなってしまうことが多くなった。そして、ひどい時にはメールチェックすらできなくなったりするようになってしまったのである。本来ならば、ログ解析でもしてボトルネックになっているところを改善でもすれば良かったのかもしれないけれど、元々が無精であるし、何より面倒くさいことが大キライなので、サーバーをいっそのこともう少し速いものに交換してしまうことにしたのである。とはいえ、サーバー交換記念に今回恒例のログ解析-私と好みが似てる人 -を二年半ぶりにやってみようと思う。ということで、「引っ越し前の大掃除、私と好みが似てる人その6」を始めようと思う。
ところで、大掃除とは言っても、残念ながら以前のログは残っていないので、先月('02/11)の一ヶ月間のログを解析してみると、hirax.netへは45万ページ/月ほどのアクセスがあったようだ。データ転送量で言うとちょうど1GB/日になる。月の転送量が30GBということは、一番最初のレンタルサーバー会社なら+23万2千円/月の追加料金ナリということになるので、サーバーを移転しておいて良かったとしか言いようがないのである。
そして、まずはこれらのアクセスのアクセス元のドメインを見てみると次のグラフのようになる。異文化コミュニケーション能力に欠けるワタシは日本語ページしか作っていないので、ほとんどのアクセス、おおよそ4分の3が.jpドメインからとなっている。そして、さまざまな国から1%弱(とはいえ、5000ページ/月くらいか)のアクセスが海外の日本人(あるいは各国のロボット)からあるようだ。
そして、ドメイン毎の円グラフを眺めてみると、YahooBBの躍進に驚く。一割近くがYahooBB(bbtec.bet)からのアクセスだった。そして、自宅などからのアクセスが企業や学校からのアクセスを凌駕していることも判る。
ところで、hirax.netへのアクセスの中でおよそ半分の20万ページほどが「できるかな?」へのアクセスで、残りの25万ページアクセスが「いろいろ」ページへのものだった。「いろいろ(最近はタイトルがinsideoutなんて変わっているけれど)」の方は時折り単なる写真日記になっていたりするし、単なるメモ帳になっていたりもするので、そのページを読む人が判ったところでその人たちが「どんな好み」なのかは結局のところよく判らないとしか言いようがない。そこで、とりあえず「できるかな?」ディレクトリへのアクセスだけを抽出して、"co.jp"と"ac.jp"からのそれぞれのアクセスランキングを調べてみた。そうすれば、「hirax.netと好みが似てる」企業や教育機関、「hirax.netに門戸を開いているところ」が判るというわけである。
まずは、「できるかな?」への"co.jp"アクセスランキングを下に示してみよう。トップ10までの企業のアクセス分で過半数を超えていることが面白いところだ。三位までの富士通、ソニー、富士ゼロックスといった辺りのメンツは前回もトップ10入りしていた「できるかな?」の常連である。そして、昨今の企業や学校・公共機関などで盛んになっている「アクセス制限」をhirax.netに対して行っていない心の広い企業なのである。
次は、「できるかな?」への日本の教育機関"ac.jp"からのアクセスである。こちらの方もトップ10までで過半数を超えている。こちらの方も先の企業と同じく「アクセス制限」をhirax.netに対して行っていない心のゆとりがある学校なのである。
そして、各々のトップ10を並べて、アクセスランキングを見てみると次の表のようになる。
というわけで、これが「2002/11の「できるかな?」へのアクセスランキング」である。つまりは、2002年版「hirax.netと好みが似てるとこ」ということで、もしも大学進学や就職活動を考える人がいるならば、このhirax.netお勧めランキングの辺りでも何かの参考にしてもらえればと思うのである。
さてさて、何はともあれ今週からhirax.netは引っ越し作業に入ります。というわけで、何か不具合やリンク切れなど見かけましたら、ぜひワタシ(jun@hirax.net)お知らせ下さい。リンク切れなんかはログ見れば判るはずと思われるかもしれないですが、何しろこんな感じでログ解析をろくにしないワタクシなものですから、ぜひぜひよろしくお願いします。今回は引っ越しの告知代わりの単なるログ解析でした。次回の「できるかな?」は新サーバーからになるか、旧サーバーからになるかは判りませんが、とにかく引っ越し中でどたばたしているのでした、ハイ。