hirax.net::Keywords::「サービス」のブログ



1999-01-24[n年前へ]

「私と好みが同じ人」 

analog Windows版用のサブドメイン解析ソフトを作る

はじめに

 http://www.hirax.net/(このサイト)にどのような人がアクセスしているか知りたくなった。何しろ、作者の私でさえ辿り着くのにかなり苦労するようなサイトである。そこにわざわざ辿り着くような人はどんな人なのか、知りたいと思うのは自然の摂理である。その人達は私と好みが似ている人かもしれない。

analog windows版(日本語)

 このサイトではhttpサーバーとしてApacheが使われている。このログ解析をするために、ログ解析ソフトであるanalogを使ってみる。そこで、まずは

http://jolt.ime.yamagata-cit.ac.jp/

からanalogのwindows版(日本語)をダウンロードする。

 これを使うと例えば、

analogのwindows版(日本語)で曜日解析をしたもの

というような解析ができる。もちろん、上の画像は結果のごく一部である。

 ドメイン解析をするためには、analogの設定ファイルである"Analog.cfg"の中に、

DNSFILE dnsfile.txt
DNS LOOKUP
DNS WRITE

と記述をしてやる。これをしないとIPアドレスからドメイン名への検索をしてくれない。

 そうすると、こんな感じになる。

canon.co.jp
sony.co.jp
atr.co.jp
infocom.co.jp
saitama-u.ac.jp
kokushikan.ac.jp
ritsumei.ac.jp
keio.ac.jp
rr.com

 しかし、これでもまだよくわからない。日本人としては漢字で、しかも、もっとわかりやすい名前で知りたい。
 そこで、"Analog.cfg"の中でサブドメインの指定をしてやる。こういう記述である。

SUBDOMAIN aichi-gakuin.ac.jp '愛知学院大学'
SUBDOMAIN aitech.ac.jp '愛知工業大学'
SUBDOMAIN anabuki-c.ac.jp '穴吹情報専門学校'
SUBDOMAIN ashigei '芦屋芸術情報専門学校'
SUBDOMAIN aist-nara.ac.jp '奈良先端科学技術大学院大学'

 そうするとこうなる。

canon.co.jp
sony.co.jp
atr.co.jp
infocom.co.jp
saitama-u.ac.jp (埼玉大学)
kokushikan.ac.jp (国士舘大学)
ritsumei.ac.jp (立命館大学)
keio.ac.jp (慶應義塾大学)
rr.com

Whois解析プログラムをつくる

 acドメインなどはanalogのwindows版(日本語)に付属のもので間に合うのだが、co.jpドメインなどはほとんど記述されていない。そのため、coドメインに関しては何らかの方法で"Analog.cfg"の中の記述を補充してやる必要がある。

 そこで、ドメイン名から詳しい名称を調べて、"Analog.cfg"用に加工するソフトをつくることにした。
私の設定ではanalogはdnsfile.txtというファイルにアクセスしてきたdomainのリストを出力する。
DNSFILE dnsfile.txt
という指定のためである。そこで、このファイルを元に
whois プロトコル
でそれぞれドメインの詳細を調べてやれば良いだろう。

まずはwhoisプロトコルの情報を

rfc-jp ML (http://www.imasy.or.jp/~masaka/rfc-jp/)

から辿って

Referral WhoisProtocol (RWhois) (http://www.imasy.or.jp/archives/rfc/rfc1714.txt)

を手に入れる。また、whoisのサーバーとしては
whois.nic.ad.jp
にポート43でアクセスする。あとはプログラムを組むだけである。

 今回はC++Builder Professional版を使うので、TCP/IP関連にはあまり気を遣う必要がない。日本語コード、改行コードの変換には、

EarthWave Soft(IKEDA Takahiro)氏作成の
Delphi 用 文字コード変換ライブラリユニット  jconvert.pas 1.4
http://www.os.rim.or.jp/~ikeda/

を使用してやる。今回はjpドメインの検索だけにした。それ以外のドメインについては検索をしない。

 以下の画像が今回作成したプログラムの動作中の画面である。ドメインの詳細について解析しているのがわかるだろう。

WhoisPro.exeの動作画面

 これが今回作成したプログラムである。

WhoisPro.exe (whoispro.lzh 165kB) プログラム本体
domain.txt (domain.lzh 2kB) ドメインの詳細のキャッシュファイル

 これらを解凍したものを"analog.exe"と同じディレクトリ(つまり、dnsfile.txtと同じディレクトリ)において実行すればよい。解析のスピードはトラックバーで変えることができる(はずだ.しかし、.あまり早くすると動作しなくなるだろう。)。
 解析が終わったら解析結果を手動でコピーして"Analog.cfg"に貼り付けてやれば良い。最後の所は手動の方が安心できて良い。何しろ自分のプログラムほど信用できない物はないからである。

 このプログラムは解析が終了するのに、かなりの時間がかかる。何しろ一つのドメインあたり数秒かかる。したがって、このようなプログラムを使えるのはアクセスがほとんど無いようなサイトだけだろう。アクセスが激しいサイトでは、とても使えないと思う。また、whois.nic.ad.jpに負担がかかってしまうだろう。

「私と好みが似てる人」

 さて、このプログラムを使い、"Analog.cfg"を補充した上でanalogで解析した結果の一部が以下である。これが「私と好みが似てる人」である。もっとも、この中の一つはそうとも言えないのだが...

: 16.61%: canon.co.jp (キヤノン)
: 15.64%: sony.co.jp (SONY)
: 5.60%: atr.co.jp (株式会社国際電気通信基礎技術研究所)
: 4.22%: infocom.co.jp (日商岩井)
: 2.80%: waco.co.jp (ワコービジネス)
: 5.44%: odn.ad.jp (オープンデータネットワーク)
: 4.22%: nttpc.ne.jp (ISP事業者向けネットワーク提供サービス)
: 1.26%: att.ne.jp (日本AT&T株式会社)
: 5.76%: saitama-u.ac.jp (埼玉大学)
: 1.08%: kokushikan.ac.jp(国士舘大学)
: 0.90%: ritsumei.ac.jp (立命館大学)
: 0.50%: keio.ac.jp (慶應義塾大学)

 関西系の大学が多いのは「鴨川カップル」のせいだろうか? また、慶應義塾大学といっても、全てがSFC(湘南キャンパス)であったのは面白かった。

1999-05-03[n年前へ]

「私と好みが似てる人」 その2 

ログ解析の6ヶ月点検

 本サイトが公に公開されるようになってから6ヶ月経った。新車でも購入してから半年経てば、6ヶ月点検があるのだから、本サイトについても6ヶ月点検を行ってみたい。

 まずは、週別のアクセス量変動を挙げてみる。

1998/12/13-1999/4/24の週別アクセス量
Overall Accesses

 アクセス数は割に順調に伸びているようである。1999/02下旬辺りにネットワーク不調とログ解析失敗などによるデータ欠損が見られるが、それ以外ではほぼ線形に増加している。1999/4上旬に増加の傾きが変化しているのはinfoseekにページを登録したことによるものと考えられる。

 次に、時間別アクセス量である。以下に示すのは、1999/4/18-24の時間別アクセス量である。
 これを見ると、深夜3時位にアクセス数がぐんと減ることがわかる。深夜3時位に眠りにつく人が多いのだろうか。
 そして、早朝5時過ぎからアクセス数が増えていくことがわかる。5時過ぎくらいから活動を始める人も多いようだ。そして、昼の12時辺りにひとつピークがある。これは、企業の昼休み時間にアクセスしている人達によるものだろう。次に15時位に大きなピークがある。これは、何だろうか?まさか、おやつの時間ではあるまい。企業ユーザーが一服しているのだろうか?小さい18時辺りのピークも、企業ユーザーの就業時間の終わりを示すものと思われる。
 そもそも、こういった昼間の時間別アクセス数から見えてくるユーザーというものは、時間に縛られる企業ユーザーになってしまうのだろう。

1999/4/18-24の時間別アクセス量

 さて、次はアクセス数のサイトランキングである。ただし、ここでのサイト=IPアドレスであり、ドメイン解析は行っていない。したがって、同じドメインからアクセスがあっても、IPアドレスが異なれば違うサイトとして計算している。そのため、proxyを使っているような所が、ランクインしやすいということになる。もちろん、proxyを使っていれば、実際よりアクセス数は少なくなるわけだが、今回の比較においては、明らかに同じサイトと判断される分有利なのである。
 それでは、最近4週間分のトップ10を示してみる。

1999/3/28-4/24のアクセス量における週別サイトランキング
Rank4/18-244/11-174/4-103/28-4/3
1KyotoPneTMeshNet厚木阪大レーザー核融合研KyotoPneT
2東大情報システム工学研キヤノン裾野Hewlett Packerdキヤノン裾野
3セイコーインスツルメンツオーイーシーキヤノン裾野千葉大情報数理
4Fermi-lab岡山理科大 電子工学ホンダエンジニアリングPSINet
5OCN北大 電子科学研究所ベッコアメ福岡シチズン
6アスキーNTT PC-Com 諏訪鹿児島大 情報工学東北大加齢医学研
7明治大学総合情報ネットワークワコーデジタルアーツ生協インターネット大阪
8RICOHIIJ4U藤沢インターネット九州大学医 耳鼻咽喉科
9WEB静岡龍谷大情報NetworkSystem通商産業省InfoPepper府中
10KansaiMultimediaServiceOCN千葉館山アレスネットDTI熊本

 トップ1に4回中2回も位置しているのはKyotoPneTである。このサイトは京都周りのネットワーク総合体のようだ。色々集まっている分、アクセス数が多いのだろう。
 それでは、週別にコメントをつけてみたい。
3/28-4/3 医学関係が2つランクインしている。おや、九州大学医学部耳鼻咽喉科と言えば、私の一番大好きな「今日の必ずトクする一言」で有名な「バーチャル耳鼻咽喉科」と同じサブドメインである。
4/4-10 通商産業省は公益機関のランクインが少ない中でなかなか健闘している。阪大レーザー核融合研究所はこの2週後のFermi研究所と関係あるのだろうか?
4/11-17 MeshNetの厚木からアクセスされている方が一位である。個人のアクセスというのは非常に嬉しい。この週は個人の方が多い。喜ばしいことだ。
4/18-24 常連だったキヤノン裾野が消え、RICOHがランクインしている。このあと、WEBページは会社の顔色- WEBページのカラーを考える 2 - (1999.04.26) でRICOHのWEBのデザインに苦言を呈しただけに、反応が気にかかるところである。おやおや、ASCIIもランクインしている。

 それでは、3ヶ月前に「私と好みが似てる人」 - analog Windows版用のサブドメイン解析ソフトを作る- (1999.01.24) の時に調べたドメインランキングとの比較をしてみる(こちらは、ドメインランキングであって、今回のサイトランキングとは異なる。今回の場合、同じ人がアクセスしても、IPアドレスが異なれば、違う人としてカウントしていることになる)。

1: canon.co.jp (キヤノン)
2: sony.co.jp (SONY)
3: atr.co.jp (株式会社国際電気通信基礎技術研究所)
4: infocom.co.jp (日商岩井)
5: waco.co.jp (ワコービジネス)
6: odn.ad.jp (オープンデータネットワーク)
7: nttpc.ne.jp (ISP事業者向けネットワーク提供サービス)
8: att.ne.jp (日本AT&T株式会社)
9: saitama-u.ac.jp (埼玉大学)
10: kokushikan.ac.jp (国士舘大学)

 今回と共通してトップ10入りしているのはキヤノンとワコーである。前回も今回も技術系のサイトばかりである。私が技術マニアであるからしょうがないか。それこそ、「私と好みが似てる人」達なのだろう。

次は「できるかな」内の人気ランキングである。こうしてみると、

など、面白いものである。/dekirukana/java/を読んでいるのは「踊る大捜査線」をキーワードにして辿りついた方だろう。/dekirukana/snif/が人気があるのは、セキュリティー意識が高いせいか、あるいは好奇心が高いせいか、どちらだろうか?。
#reqs: %bytes:      last date: file-----: ------: --------------: ---- 4185: 18.07%: 99/05/15 07:49: /   13:  0.04%: 99/05/12 13:51:   /? 1855:  2.18%: 99/05/15 02:33: /dekirukana/java/ 1093:  1.24%: 99/05/15 07:38: /dekirukana/server/  839:  1.74%: 99/05/15 07:08: /dekirukana/snif/  789:  0.68%: 99/05/15 04:01: /dekirukana/dorae/  762:  0.58%: 99/05/15 02:36: /dekirukana/screensave/  633:  0.83%: 99/05/15 05:32: /dekirukana/photoshop/  623:  1.20%: 99/05/15 07:20: /dekirukana/whois/  577:  0.99%: 99/05/15 04:20: /dekirukana/1999/  543:  0.64%: 99/05/14 22:53: /dekirukana/tire/  501:  0.80%: 99/05/15 01:55: /dekirukana/digicame/  435:  0.52%: 99/05/15 00:51: /dekirukana/e55/  435:  1.22%: 99/05/15 02:23: /dekirukana/ufo/  427:  0.37%: 99/05/15 04:15: /dekirukana/ocilo/  392:  0.43%: 99/05/15 06:53: /dekirukana/screensave2/  373:  0.50%: 99/05/15 05:23: /dekirukana/fem2/  321:  0.63%: 99/05/15 02:49: /dekirukana/wavelet/  320:  0.56%: 99/05/15 05:28: /dekirukana/ekisyo2/  279:  0.32%: 99/05/14 22:30: /dekirukana/hamaphoto/  267:  0.37%: 99/05/14 23:25: /dekirukana/real97/  264:  0.36%: 99/05/15 02:28: /dekirukana/karaoke/  263:  0.16%: 99/05/15 02:25: /dekirukana/ocilo2/  260:  0.41%: 99/05/15 01:15: /dekirukana/moire3/  256:  0.81%: 99/05/14 21:07: /dekirukana/onkai2/  256:  0.44%: 99/05/15 01:48: /dekirukana/sacchan/  252:  0.29%: 99/05/15 05:52: /dekirukana/toolplus/  247:  0.24%: 99/05/15 03:02: /dekirukana/server2/  243:  0.63%: 99/05/15 00:17: /dekirukana/bunsukai/  216:  0.42%: 99/05/15 06:52: /dekirukana/haidi/  195:  0.06%: 99/05/15 00:24: /dekirukana/1999_2/  194:  0.41%: 99/05/15 04:05: /dekirukana/kamogawa/  186:  0.38%: 99/05/15 01:02: /dekirukana/bunpu/  185:  0.39%: 99/05/15 04:21: /dekirukana/ufo2/  185:  0.28%: 99/05/15 05:30: /dekirukana/ekisyo/  180:  0.38%: 99/05/15 07:42: /dekirukana/moire2/  171:  0.33%: 99/05/15 02:48: /dekirukana/wavelet2/  169:  0.17%: 99/05/14 20:48: /dekirukana/rocket/  164:  0.16%: 99/05/15 04:04: /dekirukana/dorae2/  160:  0.31%: 99/05/14 15:03: /dekirukana/probe/  155:  0.14%: 99/05/15 07:08: /dekirukana/tamago/  144:  0.20%: 99/05/14 21:53: /dekirukana/onkai/  141:  0.23%: 99/05/13 20:15: /dekirukana/  126:  0.26%: 99/05/15 01:34: /dekirukana/harddisk/  124:  0.18%: 99/05/15 02:03: /dekirukana/watari/  122:  0.29%: 99/05/14 20:49: /dekirukana/webcolor2/  121:  0.59%: 99/05/15 01:29: /dekirukana/moire/  118:  0.10%: 99/05/14 14:08: /dekirukana/hori/  118:  0.18%: 99/05/14 09:21: /dekirukana/bunsukai2/  116:  0.10%: 99/05/14 21:05: /daily/9904.html  105:  0.19%: 99/05/15 07:34: /dekirukana/favicon/  105:  0.24%: 99/05/15 06:29: /dekirukana/log9905/   99:  0.20%: 99/05/14 20:49: /dekirukana/webcolor/   98:  0.05%: 99/05/15 07:08: /dekirukana/photoshop2/   79:  0.38%: 99/05/14 09:58: /index_e.html   61:  0.01%: 99/05/13 18:27: /dekirukana/fem2/math/   46:  0.01%: 99/05/12 19:50: /dekirukana/fem2/math/indexlnk1.html   42:  0.07%: 99/05/12 19:53: /dekirukana/fem2/math/indexlnk4.html   37:  0.03%: 99/05/12 19:51: /dekirukana/fem2/math/indexlnk2.html   33:  0.08%: 99/05/13 18:28: /dekirukana/fem2/math/indexlnk3.html   32:  0.02%: 99/05/14 14:22: /dekirukana/toolplus/readme/readme.html   31:  0.05%: 99/05/12 19:54: /dekirukana/fem2/math/indexlnk5.html   25:  0.06%: 99/05/15 00:22: /dekirukana/harddisk/math/   21:  0.03%: 99/05/12 19:49: /dekirukana/onkai/math/ 4070: 55.84%: 99/05/15 05:52: [not listed: 34 files]
 こうしてみると、興味が発散している作者であることがよくわかる。
 次にログ解析をするのは、おそらく半年先だろう。 その時、健やかに育っているのだろうか?

1999-08-29[n年前へ]

「私と好みが似てる人」 その3 

ドメイン一覧とreferer log

 www.hirax.netはレンタルサーバー上で稼動している。1999/6月からレンタルサーバー業者を変えた。業者を変えた一番目の理由は、それまで依頼していた業者の規約で定められているデータ転送量を超えてしまう恐れがあったことである。もし、転送量を超えると割に高額な追加料金が発生してしまうのであった。安い居酒屋がある瞬間からボッタクリバーに早変わりしてしまうのである。

 今回、レンタルサーバー業者を変えた後の3ヶ月間のLog解析をしてみた。以前、

私と好みが似てる人 - analog Windows版用のサブドメイン解析ソフトを作る- (1999.01.24)

でドメイン名から機関名への変換ソフトを作成したが、何しろ32kBまでのドメインリストにしか対応していないのでほとんど役に立たない。むしろ役に立ってしまっては(WHOISサーバーの負荷上)困るのである。従って、前回と同様のドメイン名とその名称の解析をするためには、ドメイン名リストの一覧を手に入れる必要がある。今回ドメイン解析をするために、「日本ドメイン一覧」を手に入れることにした。

 かつてはJPNICの公開文書( ftp://ftp.nic.ad.jp/pub/jpnic/)から日本ドメイン一覧等の文書は自由に手に入れることができた。しかし、現在はフリーでは公開されていない。ftp://ftp.nic.ad.jp/pub/jpnic/domain-list.txtの中から引用すると、

 これまで JPNIC では、JP ドメイン名リストと IP アドレスリストを ftpサービスによって一般公開してきましたが、プライバシー保護およびセキュリティ保全のため、1999年5月11日(火) より原則的に一般非公開といたしました。 JPドメイン名リスト、IPアドレスリストの利用申請については以下のURL をご覧下さい。
http://www.nic.ad.jp/jp/db/application.html関連文書: 『JPドメインのDNSゾーン情報・逆引き情報転送停止および JPドメインリスト等の配布停止について』
http://www.nic.ad.jp/jp/topics/archive/19990401-01.html
というような状態である。

 しかし、FTPsearchで探してみると、その残骸らしきものがいくつかあった。例えば、

6.3M 1999 Feb 19 ftp.web.ad.jp /pub/Internet-Document/jpnic/domain/domain-list.txt

などだ。

 このファイルを見ると、将来(といってもこのファイルはすでに現在のものではないが)使用されるであろうドメイン名が予約されており、面白い。

    (hichiyahigashi-e     # *予約ドメイン名* 日知屋東小学校)(hida-sh              # *予約ドメイン名* 岐阜県立飛騨養護学校)(hida-sh-b            # *予約ドメイン名* 岐阜県立飛騨養護学校高山日赤分校)(hidaka-ao-e          # *予約ドメイン名* 阿尾小学校)(hidaka-chisaka-e     # *予約ドメイン名* 千栄小学校)(hidaka-fuchu-e       # *予約ドメイン名* 府中小学校)
といったように小学校などもずらずら羅列されている。

今回はこのファイルを加工して、Logファイル解析ソフトのanalogで使用することにした。そうすると、日本国内のドメインからのわかりやすいアクセス解析をすることができる。試しにCO.JPドメインとAC.JPドメインの解析サンプルを示してみる。

    %PAGE %Bytes
    1205: 1.51%: SONY.CO.JP (ソニー株式会社)
    794: 1.99%: NEC.CO.JP (日本電気株式会社)
    607: 0.12%: SQUARE.CO.JP (株式会社スクウェア)
    600: 1.09%: ADVANTEST.CO.JP(株式会社アドバンテスト)
    548: 0.75%: HITACHI.CO.JP(株式会社日立製作所)
    410: 0.66%: CANON.CO.JP (キヤノン株式会社)
    395: 0.42%: FUJITSU.CO.JP(富士通株式会社)
    313: 0.68%: FUJIXEROX.CO.JP(富士ゼロックス株式会社)
    279: 0.54%: TOSHIBA.CO.JP(株式会社東芝)
    267: 0.34%: SHARP.CO.JP (シャープ株式会社)
    234: 0.30%: RICOH.CO.JP (株式会社リコー)

 企業の人数の割にSONY,SQUARE,ADVANTESTといった企業はアクセス数が多いように思う。「私と好みが似ている人」が多いようである。また、namcoもこのすぐ下に位置しているので、SQUARE,Namco,Sonyというゲーム関係の企業が「私と好みが似ている」のかもしれない。

 下は、AC.JPドメイン。

    %PAGE %Bytes
    761: 1.16%: U-TOKYO.AC.JP(東京大学)
    672: 1.92%: KYUSHU-U.AC.JP(九州大学)
    425: 1.09%: CHITOSE.AC.JP(千歳科学技術大学)
    330: 0.45%: KYOTO-U.AC.JP(京都大学)
    329: 0.32%: WASEDA.AC.JP (早稲田大学)
    265: 0.39%: OSAKA-U.AC.JP(大阪大学)
    230: 0.30%: HOKUDAI.AC.JP(北海道大学)
    205: 0.39%: CHIBA-U.AC.JP(千葉大学)
    168: 0.23%: HIROSHIMA-U.AC.JP(広島大学)
    164: 0.80%: TSUKUBA.AC.JP(筑波大学)
    163: 0.53%: TITECH.AC.JP (東京工業大学)

 WEBのLog解析をして何が一番面白いかというと、知らなかった面白いことが載っているWEBを知ることができることである。どこかのWEBページからwww.hirax.netへのリンクがされて、それによりwww.hirax.netへ辿りつく様子はrefererlogを見ればわかるのである。試しにreferer logを解析した結果のサンプルを示してみる。

    #reqs: URL
    ----- ---
    1132: http://www.maqmakmac.com/
    355: http://www.cds.co.jp/ff/bbs/minibbs.cgi
    155: http://freebee.saccess.co.jp/~gridman/gfx/99summer.html
    147: http://www.cds-co.com/ff/main.html
    138: http://www.cds.co.jp/ff/main.html
    114: http://www.jin.gr.jp/~nahi/link-misc.html
    114: http://www2s.biglobe.ne.jp/~chic/pilot.html
    82: http://www.puppenhaus.co.jp/mirror-site/fukatsu-eri.htm
    63: http://www.cds-co.com/ff/zakki.htm
    57: http://www.t3.rim.or.jp/~munemasa/links.html
    57: http://www2.saccess.co.jp/~gridman/gfx/99summer.html

そして、そのrefer元の持つ情報は私にとってとても面白いのである。www.hirax.netにリンクを貼っているページの作者というのは大抵「私と好みが似てる人」であるし、なおかつ、私ではない。ということは、そこには

  • 私の好みに合っていて、
  • 私がちっとも知らないこと
が載っているのである。
 そういったWEBを探そうと思っても、それはとても困難である。何しろ、キーワード検索ができないのである。キーワードで調べるにも「私がちっとも知らないこと」であるから、そのキーワードを私が思いつくはずがないのである。というわけで、「好みに合っていて、(私のちっとも知らないことが多い)新鮮なページを見つけるのは難しい」のであった。
 しかし、それも今では違う。www.hirax.netのreferer logを見るとそういったWEBを見つけることができるのである。これがとても嬉しいのである。

1999-10-23[n年前へ]

新聞記事をデコンボリューションしよう 

プロバイダーの実効アクセス数を知りたい

 今回は、新聞記事の内容を再確認してみたい。

 今回のタイトルからすると、「新聞記事のアミ点をどうにかしたい」という話だろう、と思う人もいるだろうが、そういう話ではない。そういう話はいつかまた別の機会にやってみたいとは思っている。とりあえず、今回は別の話である。

 新聞記事、特にネットワークに関する記事などには、時々どうにも首を傾げてしまうものがある。例えば、.comドメインと.jpドメインの数の差から、日本とアメリカのネットワークについて語るような記事などである。日本にサーバーがあるから、*.jpドメインと決めかかっているような記事だ。

 そういう新聞記者のフィルターがかかっている記事(別にそのことが悪いとは私は思わない)を、自分なりに再構成して、再確認してみたいのである。

 今回は、朝日新聞の10月20日の「インターネット接続サービスの会員数」というグラフに関して調べてみたい。この記事は富士通系のniftyとInfoWebが一体化することに伴い、インターネット接続サービスがどう変化していくか、ということに関する記事である。

朝日新聞の10月20日の「インターネット接続サービスの会員数のグラフ」
 本題とはまったく関係なのであるが、左の写真ではモアレが発生している。本来は、下のようなアミ点画像である。

今回のタイトルからすると、「新聞記事のアミ点をどうにかしたい」という話に思えるかもしれないが、全く関係ないのである。念の為。

 このグラフは一位のniftyと三位のInfowebが合併して、巨大なネットワーク接続サービスが生まれると言いたいようである。また、一位のniftyと二位のBiglobeはとにかく巨大で、三位以降とずいぶんと差があるように思えてしまう。

 しかし、niftyの「インターネット接続サービス」に関する数字として、この300万人弱という数字を出しても良いものだろうか? 確かに、nifty経由でインターネットにつなぐ人もいるだろうが、その数ははるかに少ないのではないだろうか?ちょっと数字の使い方が違うように思う。
 nifty会員であるとしても、それはインターネット接続サービスを使用しているという意味とは違うだろう。私もniftyには加入しているが、nifty経由でインターネットに接続することはほとんどない。ただ会員であるだけで、インターネット接続サービスは使っていないかもしれない。一体、nifty会員のどれだけがnifty経由でインターネットを使っているのだろうか?

 また、一位・二位と三位以降の差はそれほどあるのだろうか? ネットワーク上で見かけるアドレスのほとんどがniftyかBiglobeであるような気がしないのである。

 こういった疑問を、HIRAX.NETへの最近1ヶ月のログ解析の結果から調べて見ることにした。つまりは、「私と好みが似てる人」の"*.ne.jp,*.or.jp, *.ad.jp"バージョンである。何しろ、これまで*.ac.jpや*.co.jpの解析ばかりであったので、たまには他のものもしてみたかったのである。だから、今回の話は単なる雑談なのである...
 HIRAX.NETはアクセス数が多いサイトではない。だから、得られる結果は全然正確なものではない。また、母集団自体が偏りを持っている恐れは十分にある。いや、あるだろうとさえ思っているのである。偏りがあるならあるで結構である。

 それでは、"*.ne.jp, *.ad.jp,s *,or.jp"からの最近1月のアクセス数(Page)のグラフを下に示す。これは、HIRAX.NET内の全ページに対するものである。したがって、HIRAX.NET内のページを沢山よんだ人がいたならば、その人の属するプロバイダーはより多くの数の「アクセス数(Page)」をカウントされることになる。

*.ne.jp, *.ad.jp,s *,or.jpからのアクセス数(Page)

 ログ解析をした中で"*.nifty.ne.jp"からのアクセスは一つも見つからなかった。これは、

  • niftyからインターネット接続でHIRAX.NETへ訪れている人が一人もいない
  • niftyからインターネット接続でHIRAX.NETへ接続した場合に、nifty.ne.jpからのアクセスという風には記録されない
という可能性がある。しかし、そのうちのどちらであるのだろう? と、書いておけば知ってる人が教えてくれるかもしれない...

 さて、ここからは追記である。期待通り協力してくれた方がいた。やはり、書いてみるものである。協力者:べっきさんが接続してくださった。そのniftyからつないだ状態では、HIRAX.NETにはfrom ***.ppp.infoweb.ne.jpと記録されていた。ということは、infoweb経由のようである。すると、nifty+infowebでもso-netに負けているということになる。(追記 ここまで)

 先の朝日新聞の記事と重なるのは、Biglobe(mesh.ad.jp)とso-net、InfoWeb位である。

 so-netは朝日新聞の記事のグラフよりも、他と比較して、多いように感じる。so-netのユーザーは比較的にインターネット環境を活用している人が多いのだろう。まさか、PostPetのせいではないだろうな? 恐るべし、So-net。

 さて、NEC系であるBiglobeはここではmesh.ad.jpと表示されているようだ。Biglobeも先の朝日新聞の記事ほどアクセス数は多くないように思われる。また、富士通系であるInfowebのアクセス数もそ朝日新聞の記事よりは少ない。もしかしたら、富士通やNEC系のプロバイダーに加入している人というのは、

  1. コンピューターを買う
  2. その製造元系のプロバイダーに加入
  3. だけど、あんまり使わない
という行動パターンなのかもしれない。何しろ、パソコンショップでも「タッチおじさん」や「バザールでこざーる」の景品を欲しいがために、パソコンを買いたがる人もいる位だ。バリバリ使うとはとても思えない。

 今回のグラフを見る限りにおいては、一位・二位が三位以降を引き離しているという感じではないし、富士通、NECが主催するインターネット接続サービスが活用されているという感じでもないようだ(少なくとも本WEBに関する限りは)。しかし、Sony主催のSo-netは活用されているようなのだ。

 強引ではあるが、「富士通、NEC、Sonyの主催するネットワーク接続サービスの活用度の違いに何か意味はないのだろうか?いや、きっとある。」と思ってしまう(少しだけだけど...)。

 今回は、とりあえず偏見出まくりの結論で終わってしまうのでも、オチもない...あぁ、しかもInfowebやBiglobeに入っているパワーユーザーがいたらどうする気なのだ。いや、きっといるぞ。先にゴメンと言っておこう。だから、抗議メールは遠慮のココロだ。


2000-07-27[n年前へ]

あなたと好みが似てるトコ 

私と好みが似てる人 その5

 
 

 もう暑い夏が始まったようだ。東京にいた頃は、夏ともなれば就職活動中の学生を数多く見かけたものであるが、引っ越してしまってからはそんな風物詩も見かけなくなってしまった。田舎に住んでいる私には判らないが、今でもリクルートスーツに身をくるんだ学生が街の中を歩いていることだろう。

 HIRAX.NETにも様々な学校からのアクセスがある。その中には今年就職活動をしている学生や、数年後に就職を控えた学生もきっといるのではないだろうか?そこで、今回は就職を控えた学生のためにHIRAX.NETへのアクセス数が多い会社を調べて、「あなたと好みが似ている会社」を調べてみたい、と思う。また、いつもと同じく*.ac.jpからのアクセス順位も調べてみることで、大学入試を控えた学生・その他の人のために「あなたと好みが似ている学校」も調べてみることにしたいと思う。

 そう、今回は題して「あなたと好みが似てるトコ」である。さて、前回HIRAX.NETへのアクセス元を解析してみた

の時は、*.co.jpドメインのトップ11は
%PAGE %Bytes
1205: 1.51%: SONY.CO.JP (ソニー株式会社)
 794: 1.99%: NEC.CO.JP (日本電気株式会社)
 607: 0.12%: SQUARE.CO.JP (株式会社スクウェア)
 600: 1.09%: ADVANTEST.CO.JP (株式会社アドバンテスト)
 548: 0.75%: HITACHI.CO.JP (株式会社日立製作所)
 410: 0.66%: CANON.CO.JP (キヤノン株式会社)
 395: 0.42%: FUJITSU.CO.JP (富士通株式会社)
 313: 0.68%: FUJIXEROX.CO.JP (富士ゼロックス株式会社)
 279: 0.54%: TOSHIBA.CO.JP (株式会社東芝)
 267: 0.34%: SHARP.CO.JP (シャープ株式会社)
 234: 0.30%: RICOH.CO.JP (株式会社リコー)
となっていたし、*.ac.jpドメインは
%PAGE %Bytes
 761: 1.16%: U-TOKYO.AC.JP (東京大学)
 672: 1.92%: KYUSHU-U.AC.JP (九州大学)
 425: 1.09%: CHITOSE.AC.JP(千歳科学技術大学)
 330: 0.45%: KYOTO-U.AC.JP (京都大学)
 329: 0.32%: WASEDA.AC.JP (早稲田大学)
 265: 0.39%: OSAKA-U.AC.JP (大阪大学)
 230: 0.30%: HOKUDAI.AC.JP (北海道大学)
 205: 0.39%: CHIBA-U.AC.JP (千葉大学)
 168: 0.23%: HIROSHIMA-U.AC.JP (広島大学)
 164: 0.80%: TSUKUBA.AC.JP (筑波大学)
 163: 0.53%: TITECH.AC.JP (東京工業大学)
となっていた。つまり、1999年度の「あなたと好みが似てるトコ」ベスト1はソニー株式会社であったし、「あなたと好みが似てる学校」は東京大学であった。それでは、最近はどうなっているのだろうか?

 先月の2000/06の一ヶ月の間にHIRAX.NETへは計174,914ページのページ・アクセスがあった。そして、アクセス数が多いアクセス元はこんな感じになる。電気OA機器メーカーからのアクセスが多いのが本サイトの特徴でもある。といっても、技術系サイトであればそれはどこも同じなのだろう。なお、おそらく有限会社回路設計サービスに関してはロボットだと想像している。

 こうしてみるとアクセス数の多いところは、前回とそれほど変わっていないことがわかる。ただし、前回のダントツ一位(そして技術系学生には人気No.1)のSONYが少し落ちてきているのが残念である。

 #reqs: %bytes: domain
------: ------: ------
162873: 87.13%: .jp (Japan)
 89828: 41.35%:   ne.jp (日本のネットワークサービス)
 31709: 20.72%:   co.jp (日本の企業(または営利法人))
  1577:  1.72%:     nec.co.jp (日本電気)
  1520:  3.02%:     cds.co.jp (有限会社回路設計サービス)
   764:  0.57%:     hitachi.co.jp(株式会社日立製作所)
   726:  1.65%:     canon.co.jp(キヤノン)
   670:  0.33%:     toshiba.co.jp(東芝)
   588:  0.33%:     sony.co.jp(SONY)
   539:  0.31%:     fujitsu.co.jp(富士通)
   385:  0.04%:     square.co.jp(square.co.jp)
   370:  0.20%:     fujixerox.co.jp(富士ゼロックス株式会社)
   369:  0.18%:     mei.co.jp(松下電器産業株式会社)
   304:  0.22%:     sharp.co.jp(シャープ 株式会社)
   244:  0.13%:     ricoh.co.jp(リコー)
   218:  0.16%:     ibm.co.jp(IBM Japan)
   211:  0.27%:     ntt.co.jp(NTT)
   152:  0.09%:     epson.co.jp(Epson)
 ......

 13997:  8.46%:   ac.jp (日本の教育および学術機関)
  2740:  0.70%:     KYOTO-U.AC.JP(京都大学)
   941:  0.68%:     U-TOKYO.AC.JP(東京大学)
   592:  1.13%:     BUNKYO.AC.JP(文教大学)
   536:  0.14%:     HOKUDAI.AC.JP(北海道大学)
   395:  0.16%:     NAGAOKAUT.AC.JP(長岡技術科学大学)
   358:  0.29%:     KYUSHU-U.AC.JP(九州大学)
   352:  0.12%:     JAIST.AC.JP(北陸先端科学技術大学院大学)
   318:  0.20%:     OSAKA-U.AC.JP(大阪大学)
   295:  0.32%:     TITECH.AC.JP(東京工業大学)
   256:  0.24%:     TOHOKU.AC.JP(東北大学)
 .......

 13811:  8.23%:   or.jp (日本の団体)
 11156:  7.23%:   ad.jp (日本のJPNIC会員ネットワーク)
   761:  0.48%:   go.jp (日本国政府機関)
  480:  0.10%:   gr.jp (日本の法人格を有しない団体)
 10662:  6.80%: [unresolved numerical addresses]
  4294:  2.19%: .net (Network)
  3855:  2.25%: .com (Commercial)
  3685:  0.11%: .org (Non-Profit Making Organisations)
  2321:  0.72%: [domain not given]
   192:  0.19%: .edu (USA Educational)
    82:  0.17%: .gov (USA Government)
    61:  0.04%: .be (Belgium)
    45:  0.03%: .fr (France)
    44:  0.04%: .de (Germany)
    38:  0.02%: .to (Tonga)
    34:  0.03%: .my (Malaysia)
    22:  0.03%: .arpa (Old style Arpanet)
    22:  0.02%: .uk (United Kingdom)
    20:  0.02%: .ca (Canada)
    20:  0.02%: .br (Brazil)
  .......

 ただ、こうしてしまうとどうしても人数の多いトコロはアクセス数が増えてしまう。もちろん、人数が多いところはProxyのキャッシュなども結構あるので、見かけ上のアクセス数はかなり減るだろう。ただ、それにしても人数の多いトコロはどうしてもアクセス数が増えざるをえない。

 そこで、アクセス数上位の企業の従業員数を調べて、「従業員一人あたりのアクセスページ数の順位」を調べてみた。それが次の表である。
 

従業員一人あたりのアクセスページ数の順位を調べてみると...
ページアクセス数順位会社名ページアクセス数従業員数従業員一人あたりのアクセスページ数従業員一人あたりのアクセスページ数の順位
1NEC1577370780.042532
2回路設計サービス1520???
3日立製作所764596920.012807
4キヤノン726210230.034533
5東芝670567460.0118110
6SONY588191870.030654
7富士通539436270.012359
8SQUARE3856860.561221
9富士ゼロックス370152580.024255
10松下電器3692759620.0013413
11シャープ304238000.012778
12リコー244673000.0036312
13IBM Japan218214010.0101911
14NTT211???
15Epson152110000.013826

 ただし、

  • 有限会社回路設計サービス
  • NTT (こちらは私が調べるのを面倒くさがっただけ)
に関しては人数がよくわからなかったので、「従業員一人あたりのアクセスページ数の順位」からは外している。ただ、技術系の人にとっては、有限会社回路設計サービスといったサイトを通して、知らない人はいないことと思う。おそらく、「回路設計サービス」からのアクセス数の殆どがロボットだとしても、そんなことはどうでもいいのである。

 さて、結局「従業員一人あたりのアクセスページ数の順位」で一位となったのは、SQUAREでなんと従業員一人あたり、0.56ページ/月を見ていることになる。おやおや、これはおかしい。かなり、多すぎる。こりゃ、SQUAREも更新チェック用のロボットかな。それ以外の企業の場合だと「従業員一人あたりのアクセスページ数」は大体0.0*ページ/月である。平均すると、100人いたらその内の数人が一回見に来たことがある、という感じか。まぁ、実際にはもっと少ないだろうが。

 前回、アクセス数一位だったSONYはアクセス数では6位にランクを落とし、「従業員一人あたりのアクセスページ数の順位」ではそれでも4位と健闘しているが、それでも苦戦していると言えるだろう。いやいや、これはもしかしたら先月の「できるかな?」のコンテンツ

  • オッパイ星人の力学 - 胸のヤング率編 - (2000.06.29)
  • カラープリンターの選手宣誓 - ICCファイルを眺めてみよう その2 - (2000.06.28)
  • 「色っぽい声」の秘密 - キャバクラ嬢は英語が上手い!? - (2000.06.24)
  • プリクラの中の物語 - プリクラもどきソフトを作ろう 第一回 - (2000.06.19)
  • ヘルメットの色空間分布 - 学生運動の色空間とグラフ配置 - (2000.06.16)
  • [Scraps]コンクリートの隙間に - 足元にあるカメラオブスクラ - (2000.06.13)
  • 毛髪力のガウスの法則 - ハゲの物理学 「第五の力」編 - (2000.06.07)
  • WEBページの迷路の中で - 未来の地図を手に持って - (2000.06.04)
の傾向に技術のSONY魂がそっぽを向いてしまったのかもしれない。これはマズイ。確かに、ここ最近ちょっとマズイ。二年ほど前の「できるかな?」が始まった頃の初々しい内容から少し、いやかなりズレてしまっている。いや、本当にマズイ。

 うーん、この場を借りて言っておきたいのだが、先月の6月後半から今月に至るまでのコンテンツについては、ある事情により「私の趣味」とはかなり異なるものが多い。それを強くここに断っておきたい。いや、本当に本当なのです。

 ちなみに*.ac.jpドメインに関しては、新顔「文教大学」が登場している以外は定番どころが集まっている。ちょっと不思議なのが、慶応大学・早稲田大学のような人数も多いマンモス校が11位、14位とトップ10に入っていないことである。何故だろう?

 とりあえず、今回の結論は「あなたと好みが似てるトコ」ベスト1は学校で言えば京都大学で、企業で言うとSQUARE(とりあえず)ということになる。また、大学に関しては人数比率からすれば文教大学もお薦めかもしれない。なお、念のために書いておくが、本サイトはその真偽については保証しないの。念のため。
 



■Powered by yagm.net