2000-05-21[n年前へ]
■hixの歩き方
全文検索をしてみよう
hirax.netのコンテンツ、といっても今のところ「できるかな?」しかない、も数が増えてきた。ページ数は増えてきたが、ごく短いページがほとんどである。というわけで、残念ながら内容はたいしてないのが残念である。しかし、内容がなくてもページ数が増えてくると、どの記事をどこに書いたか判らなくなる。あるいは、読むほうも同じだろう。「今日の必ずトクする一言」の「本ページのメニューシステムと逆リンクのナゾ」には
章があまりページに細分化されていない方がむしろ検索効率が良い。と喝破しているがその通りである。私もトップのメニューだけは「ウナギの寝床メニュー(copyrightwww.tomoya.com)」を採用しているが、各コンテンツはそれぞれディレクトリを作って細分化させてしまっている。画像ファイルやバックデータとしてのデータファイルも使用する場合があるため、どうしてもそうなってしまう。
もちろん、infoseekなどにも登録はしてあるから、ある程度の内容を検索することはできるのだが、残念ながらそれほど詳しい検索はできない。自分でも不便に思っていたこともあるし、この「できるかな?」を書き始めるきっかけを作って下さった方からアドヴァイスされたこともあり、、全文検索システム"namazu"をhirax.netにインストールしてみることにした。
そこで、できた検索ページがここ(http://www.hirax.net/cgi-bin/namazu.cgi)である。こんなページである。
使い方の詳細は"namazu"の検索式の詳細(http://www.namazu.org/doc/manual.html#query)を見て頂くことにして、まずは使ってみたい。「できるかな?」は科学サイトだと思われることも多い。いや、自分でもたまにそう思うこともあるのだが、全文検索をかけてみると少し違う結果が出た。
なんと、13ページしかヒットしないのである。おやおや?と思い、いくつかのキーワードで検索をかけてみた。それをヒット数順に並べたのが下のリストである。
- 画像 = 74
- 色 = 51
- 可視化 = 23
- 心 = 21
- プログラム = 16
- 科学 = 13
- 恋 = 12
- 漱石 = 10
- 水着 = 5
というわけで、「あれっ、あの話はどこにあったかな?」とか「この言葉に関係した話はあったっけ?」などと考えの際はここで調べてもらいたい、と思う。
さて、こういう「検索システム」は「レーダー」と良く似ている。広大な霧の中から探しているものを見つけてくれるのである。この話の時に触れた富士山レーダーを思い出してしまう。
いや、本当のことを言えば実は話の流れは逆である。新田次郎の小説「富士山頂」、いや元気象庁観測部測器課長であった藤原寛人の富士山レーダー建設を題にとって書いた私小説と言った方が良いか、の最後を読んでいて、検索ページを作ってみることにしたのである。小説の最後で主人公(藤原寛人)は自分を自由に泳がせてくれていた直属の上司と一緒に仕事ができなくなることに呆然とする。富士山レーダー建設をさせてくれたのもその上司あってのことだと感じるわけだが、時折私が強く感じることと重なってしまって(以下、略。)
2000-06-04[n年前へ]
■WEBページの迷路の中で
未来の地図を手に持って
WEBアドベンチャーというものがある。私が個人的に好きなのは、HyperTextのリンク構造を用いて、WEB上でアドベンチャーゲームをするものだ。例えば、
- Mirag(みらげ)->Adventure( http://www.ceres.dti.ne.jp/~mayo/entrance.html )
私は、HTMLのリンクを用いただけのWEBアドベンチャーは好きだが、JavaScriptやFlashを使ったものはそれほど好きではない(し、やらない)。せっかちな私は、場面切り替えの効果などの待ち時間を耐えられないのである。そういった効果は不必要だと思うのだ。
ところで、WEB上でアドベンチャーゲームなどをよくやる人は「地図書き(マッピング)」をするらしい。自分が辿った道筋や話の筋を書き留めておくのである。そうすれば、あまり迷わなくてすむし、あとで自分が辿った道筋を振り返ることができる。
ところが、私はそういうことは全くしない。どうも、面倒でできないのである。その結果、WEBページに張られたリンクの迷路の中でやたらに迷ってしまう。そして、一体自分がどういう道筋を辿ったのか思い出せないことも多い。困ったことである。
そこで、少し考えてみると、良い方法があるではないか。以前、
で書いたように、世の中には色々な「WEBサイトのHyperlink構造を可視化するソフトウェア」がある。それで「WEBアドベンチャー」の「WEBページのHyperlink構造を可視化」すれば良いのである。そうすれば、その「WEBアドベンチャー」の中の世界が浮かび上がってくるハズである。自分がさ迷い歩いた世界の姿が、きっと私の目にも見える形となるはずだ。というわけで、「WEBサイトのHyperlink構造を可視化するソフトウェア」を私も使ってみたかったので、
- Cleo Sofware Development Inc.( http://www.cleosoftware.com/ )
- Apple ( http://www.apple.com/)
AppleのサイトのWebリンクが「目に見える形」になっているのがわかる。もう少し、他のサイトも見てみることにする。例えば、次が科学技術省の英語のトップページからのWEBページの繋がりを眺めてみたものである。中心のトップページから、色々なトピックスや他サイトのWEBページのリンクが張られていることがよくわかる。よく眺めてみれば、NASDA,RIKEN,などのよく目にする文字があるのが判ると思う。
さて、Site Mapper2000を使ってみたわけであるが、WEBアドベンチャーにこういった解析をしてみたかというと、実はしていない。そんなことをしたら、何かつまらなくなってしまう、と思うのだ。「WEBアドベンチャー」の中の世界、WEBページの迷路の中で彷徨うのもそれはそれで楽しいものだ、と思ってしまうのだ。
と、終わらせるのも何なので、適当なサンプルだけは示してみることにした。それが次の図である。主人公の現在位置から、前後左右に世界が繋がっているのがわかると思う。このあとどっちにゴールがあるかは秘密である。
こんな簡単な例を作るのでも思うのだが、「WEBアドベンチャー」の世界を作っていく人達にはとても役に立つものなのかもしれない。そういう複雑に繋がった世界を作り上げる人達には、世界が頭の中に見えていないと、とても不便だろう。きっと、頭の中の未来の地図がなく、先が見えずにただ作り上げようとしてもなかなか完成しないのだろう、と私は想像したりするのである。
2000-07-23[n年前へ]
■WEBページの文体を調べてみよう
「ノリノリ文体」の秘密!?
今日もまたいつものように
- お笑いパソコン日誌 ( http://www2s.biglobe.ne.jp/~chic/pilot.html )
すると、
- 文体模写してください( http://mentai.2ch.net/test/read.cgi?bbs=book&key=963421916 )
以前から、私も文体について調べてみたい、と思っていた。それも普通の文体ではなくて、WEBページの文体である。色々な面白いWEBページを読むたびに、「この面白さ・ノリの良さの秘密はどこにあるのだ?」と思っていたのである。そして、できることならば「そのノリノリ文体の秘密をこの目で見てみたい!」と切望さえしていたのである。もちろん、本当のところは「ノリノリ文体の秘密」が明らかになったならば、「そのノリノリ文体をパクッてやろう」という気持ちが私の中にあるのだ。文体だけ真似しても、「面白いページ」にはならないと言う気もするが、そんなことは考えてみてもしょうがないのだ。まずは、形から入ろうというわけだ。
そこで、今回は「ノリノリ文体」を書いているWEBサイトの文章をいくつかピックアップして、その「ノリノリ文体の秘密」を調べてみることにした。今回、ピックアップした文章はまず次の三つである。
- そりを言ってはお終いなのよ fromちゃろん日記(仮) ななゑ さん
- ( http://www.alpha.dti2.ne.jp/~nanae/nikki1999_8m.htm )
- 娘よ from 我が妻との闘争呉エイジ さん
- ( http://www.117.ne.jp/~kure/waga/yome12.html )
- 半角カナを使え! fromとろん 南野 輝 さん
- ( http://www2.justnet.ne.jp/~chic/TRON005.HTML )
そして、次に「男心と女心のギャップ」を全く違う視点から描く、まさに涙ナミダの物語「我が妻との闘争」から涙無しには読めない「娘よ」にも注目したい。
涙でなくて「笑い」と言えば、当然「お笑いパソコン日誌」から辿り、「半角カナを使え!」にも注目してみたい。本当はこの作者が文章を書いている印刷物も手元にあるので、その印刷物とWEBの文章とを比較してみたかったりもしたのだが、今回はパスさせて頂いた。
そして、WEBページの文章ではないが、当然この人
- 私の個人主義 夏目漱石
さて、今回は「文体の特徴の解析」の手段として、「文章構造可視化シリーズ」で作成した"wordfreq"を少し改造して使ってみることにした。以前、のバージョンから少し変えて、ファイルに落とす結果はスムージングをかけないそのままの結果にしてみただけである。とりあえず、そんな"wordfreq"を使い、WEBページの「一段落中の句点(。)と読点( 、)の数」を調べてみたのである。
何故、「一段落中の句点( 。)と読点( 、)の数」に注目したかというと、私はどうも読点の使い方が判らないのだ。文章の各部分が他のどの部分にかかるのかをちゃんと示したいのだが、どうも私の文章は変なのだ。もういっそのこと、文章の各部分がどこにかかるかわかるように各個とか矢印とか使いたくなるくらい、読点の使い方がわからないのである。その結果、読点をどうも多く打ってしまうような気がしているのである。
そこで、その勉強も兼ねて「一段落中の句点( 。)と読点( 、)の数」に注目しながら、WEBページの「ノリノリ文体」を調べてみたいと思うわけだ。
ノミネートされた文章 | 一段落中の句点( 。)の数 | 一段落中の読点( 、)の数 |
私の個人主義 | 7.6 | 11 |
コンクリートの隙間に | 4.4 | 7.6 |
新宿駅は電気羊の夢を見るか | 3.9 | 2.8 |
半角カナを使え! | 1.8 | 2.1 |
娘よ | 1.4 | 0.5 |
そりを言ってはお終いなのよ | 0.4 | 0.9 |
この結果を見てみると、「ちゃろん文体」などは圧倒的に一段落中の句点(。)の数が少ない。また、同じように一段落中の読点( 、)の数も少ない。そして、「我妻文体」も同じように、一段落中の句点(。)の数が少ない。こちらの「我妻文体」は、一段落中の読点( 、)の数の少なさでは今回No.1である。
それに対して、偉大なる漱石の「私の個人主義」では「一段落中の句点(。)と読点( 、)の数」も実に多い。そして、私の書いた文章においても、その数はやはり多い。上の表は「一段落中の句点(。)の数」が多い順に並べてみたが、私の文章は二つとも、漱石の次に「一段落中の句点(。)と読点( 、)の数」が多い。
上の表では
私の個人主義 >> コンクリートの隙間に, 新宿駅は電気羊の夢を見るか >>半角カナを使え!, 娘よ >> そりを言ってはお終いなのよ
となっているが、これはWEBの「ノリノリ文体」とかなり良い一致をするのではないだろうか?つまり、
- WEBの「ノリノリ文体」は一段落中の句点( 。)と読点( 、)の数が少ない程良い
その推定を用いて「娘よ」の文章中における一段落中の読点( 、)の数の変化を眺めてみると面白いことが判る。文章中で、段々と「一段落中の読点(、)の数」が少なくなってきているのである。これは、きっと作者 呉氏が文章を書いている内に、気分が「ノリノリ」になってきて、その心の変化が「ノリノリ文体」としての特徴- 一段落中の読点( 、)の数が少ない - を示し始めたのではないだろうか?
さて、今回はWEBページの「ノリノリ文体の秘密」を簡単に調べてみた。これからも引き続き、その秘密のさらなる姿を見てみたいと思う。そして、いつかその「ノリノリ文体」を私は身につけ、ノリノリWEBページなどを書いてみたりするのである。
とはいえ、それぞれの「文体」には作者の性格も強く現れているわけで、私の性格を直さないことにはそんな「ノリノリ」文体を身につけられないような気もするし、文体だけ真似しても「面白いページ」にはならないとか、形から入ってどうするとかいう声が聞こえそうであるが、それを言ってはダメなのだ。
2000-07-27[n年前へ]
■あなたと好みが似てるトコ
私と好みが似てる人 その5
もう暑い夏が始まったようだ。東京にいた頃は、夏ともなれば就職活動中の学生を数多く見かけたものであるが、引っ越してしまってからはそんな風物詩も見かけなくなってしまった。田舎に住んでいる私には判らないが、今でもリクルートスーツに身をくるんだ学生が街の中を歩いていることだろう。
HIRAX.NETにも様々な学校からのアクセスがある。その中には今年就職活動をしている学生や、数年後に就職を控えた学生もきっといるのではないだろうか?そこで、今回は就職を控えた学生のためにHIRAX.NETへのアクセス数が多い会社を調べて、「あなたと好みが似ている会社」を調べてみたい、と思う。また、いつもと同じく*.ac.jpからのアクセス順位も調べてみることで、大学入試を控えた学生・その他の人のために「あなたと好みが似ている学校」も調べてみることにしたいと思う。
そう、今回は題して「あなたと好みが似てるトコ」である。さて、前回HIRAX.NETへのアクセス元を解析してみた
の時は、*.co.jpドメインのトップ11は%PAGE %Bytesとなっていたし、*.ac.jpドメインは
1205: 1.51%: SONY.CO.JP (ソニー株式会社)
794: 1.99%: NEC.CO.JP (日本電気株式会社)
607: 0.12%: SQUARE.CO.JP (株式会社スクウェア)
600: 1.09%: ADVANTEST.CO.JP (株式会社アドバンテスト)
548: 0.75%: HITACHI.CO.JP (株式会社日立製作所)
410: 0.66%: CANON.CO.JP (キヤノン株式会社)
395: 0.42%: FUJITSU.CO.JP (富士通株式会社)
313: 0.68%: FUJIXEROX.CO.JP (富士ゼロックス株式会社)
279: 0.54%: TOSHIBA.CO.JP (株式会社東芝)
267: 0.34%: SHARP.CO.JP (シャープ株式会社)
234: 0.30%: RICOH.CO.JP (株式会社リコー)
%PAGE %Bytesとなっていた。つまり、1999年度の「あなたと好みが似てるトコ」ベスト1はソニー株式会社であったし、「あなたと好みが似てる学校」は東京大学であった。それでは、最近はどうなっているのだろうか?
761: 1.16%: U-TOKYO.AC.JP (東京大学)
672: 1.92%: KYUSHU-U.AC.JP (九州大学)
425: 1.09%: CHITOSE.AC.JP(千歳科学技術大学)
330: 0.45%: KYOTO-U.AC.JP (京都大学)
329: 0.32%: WASEDA.AC.JP (早稲田大学)
265: 0.39%: OSAKA-U.AC.JP (大阪大学)
230: 0.30%: HOKUDAI.AC.JP (北海道大学)
205: 0.39%: CHIBA-U.AC.JP (千葉大学)
168: 0.23%: HIROSHIMA-U.AC.JP (広島大学)
164: 0.80%: TSUKUBA.AC.JP (筑波大学)
163: 0.53%: TITECH.AC.JP (東京工業大学)
先月の2000/06の一ヶ月の間にHIRAX.NETへは計174,914ページのページ・アクセスがあった。そして、アクセス数が多いアクセス元はこんな感じになる。電気・OA機器メーカーからのアクセスが多いのが本サイトの特徴でもある。といっても、技術系サイトであればそれはどこも同じなのだろう。なお、おそらく有限会社回路設計サービスに関してはロボットだと想像している。
こうしてみるとアクセス数の多いところは、前回とそれほど変わっていないことがわかる。ただし、前回のダントツ一位(そして技術系学生には人気No.1)のSONYが少し落ちてきているのが残念である。
#reqs: %bytes: domainただ、こうしてしまうとどうしても人数の多いトコロはアクセス数が増えてしまう。もちろん、人数が多いところはProxyのキャッシュなども結構あるので、見かけ上のアクセス数はかなり減るだろう。ただ、それにしても人数の多いトコロはどうしてもアクセス数が増えざるをえない。
------: ------: ------
162873: 87.13%: .jp (Japan)
89828: 41.35%: ne.jp (日本のネットワークサービス)
31709: 20.72%: co.jp (日本の企業(または営利法人))
1577: 1.72%: nec.co.jp (日本電気)
1520: 3.02%: cds.co.jp (有限会社回路設計サービス)
764: 0.57%: hitachi.co.jp(株式会社日立製作所)
726: 1.65%: canon.co.jp(キヤノン)
670: 0.33%: toshiba.co.jp(東芝)
588: 0.33%: sony.co.jp(SONY)
539: 0.31%: fujitsu.co.jp(富士通)
385: 0.04%: square.co.jp(square.co.jp)
370: 0.20%: fujixerox.co.jp(富士ゼロックス株式会社)
369: 0.18%: mei.co.jp(松下電器産業株式会社)
304: 0.22%: sharp.co.jp(シャープ 株式会社)
244: 0.13%: ricoh.co.jp(リコー)
218: 0.16%: ibm.co.jp(IBM Japan)
211: 0.27%: ntt.co.jp(NTT)
152: 0.09%: epson.co.jp(Epson)
......13997: 8.46%: ac.jp (日本の教育および学術機関)
2740: 0.70%: KYOTO-U.AC.JP(京都大学)
941: 0.68%: U-TOKYO.AC.JP(東京大学)
592: 1.13%: BUNKYO.AC.JP(文教大学)
536: 0.14%: HOKUDAI.AC.JP(北海道大学)
395: 0.16%: NAGAOKAUT.AC.JP(長岡技術科学大学)
358: 0.29%: KYUSHU-U.AC.JP(九州大学)
352: 0.12%: JAIST.AC.JP(北陸先端科学技術大学院大学)
318: 0.20%: OSAKA-U.AC.JP(大阪大学)
295: 0.32%: TITECH.AC.JP(東京工業大学)
256: 0.24%: TOHOKU.AC.JP(東北大学)
.......13811: 8.23%: or.jp (日本の団体)
11156: 7.23%: ad.jp (日本のJPNIC会員ネットワーク)
761: 0.48%: go.jp (日本国政府機関)
480: 0.10%: gr.jp (日本の法人格を有しない団体)
10662: 6.80%: [unresolved numerical addresses]
4294: 2.19%: .net (Network)
3855: 2.25%: .com (Commercial)
3685: 0.11%: .org (Non-Profit Making Organisations)
2321: 0.72%: [domain not given]
192: 0.19%: .edu (USA Educational)
82: 0.17%: .gov (USA Government)
61: 0.04%: .be (Belgium)
45: 0.03%: .fr (France)
44: 0.04%: .de (Germany)
38: 0.02%: .to (Tonga)
34: 0.03%: .my (Malaysia)
22: 0.03%: .arpa (Old style Arpanet)
22: 0.02%: .uk (United Kingdom)
20: 0.02%: .ca (Canada)
20: 0.02%: .br (Brazil)
.......
そこで、アクセス数上位の企業の従業員数を調べて、「従業員一人あたりのアクセスページ数の順位」を調べてみた。それが次の表である。
ページアクセス数順位 | 会社名 | ページアクセス数 | 従業員数 | 従業員一人あたりのアクセスページ数 | 従業員一人あたりのアクセスページ数の順位 |
1 | NEC | 1577 | 37078 | 0.04253 | 2 |
2 | 回路設計サービス | 1520 | ? | ? | ? |
3 | 日立製作所 | 764 | 59692 | 0.01280 | 7 |
4 | キヤノン | 726 | 21023 | 0.03453 | 3 |
5 | 東芝 | 670 | 56746 | 0.01181 | 10 |
6 | SONY | 588 | 19187 | 0.03065 | 4 |
7 | 富士通 | 539 | 43627 | 0.01235 | 9 |
8 | SQUARE | 385 | 686 | 0.56122 | 1 |
9 | 富士ゼロックス | 370 | 15258 | 0.02425 | 5 |
10 | 松下電器 | 369 | 275962 | 0.00134 | 13 |
11 | シャープ | 304 | 23800 | 0.01277 | 8 |
12 | リコー | 244 | 67300 | 0.00363 | 12 |
13 | IBM Japan | 218 | 21401 | 0.01019 | 11 |
14 | NTT | 211 | ? | ? | ? |
15 | Epson | 152 | 11000 | 0.01382 | 6 |
ただし、
- 有限会社回路設計サービス
- NTT (こちらは私が調べるのを面倒くさがっただけ)
さて、結局「従業員一人あたりのアクセスページ数の順位」で一位となったのは、SQUAREでなんと従業員一人あたり、0.56ページ/月を見ていることになる。おやおや、これはおかしい。かなり、多すぎる。こりゃ、SQUAREも更新チェック用のロボットかな。それ以外の企業の場合だと「従業員一人あたりのアクセスページ数」は大体0.0*ページ/月である。平均すると、100人いたらその内の数人が一回見に来たことがある、という感じか。まぁ、実際にはもっと少ないだろうが。
前回、アクセス数一位だったSONYはアクセス数では6位にランクを落とし、「従業員一人あたりのアクセスページ数の順位」ではそれでも4位と健闘しているが、それでも苦戦していると言えるだろう。いやいや、これはもしかしたら先月の「できるかな?」のコンテンツ
- オッパイ星人の力学 - 胸のヤング率編 - (2000.06.29)
- カラープリンターの選手宣誓 - ICCファイルを眺めてみよう その2 - (2000.06.28)
- 「色っぽい声」の秘密 - キャバクラ嬢は英語が上手い!? - (2000.06.24)
- プリクラの中の物語 - プリクラもどきソフトを作ろう 第一回 - (2000.06.19)
- ヘルメットの色空間分布 - 学生運動の色空間とグラフ配置 - (2000.06.16)
- [Scraps]コンクリートの隙間に - 足元にあるカメラオブスクラ - (2000.06.13)
- 毛髪力のガウスの法則 - ハゲの物理学 「第五の力」編 - (2000.06.07)
- WEBページの迷路の中で - 未来の地図を手に持って - (2000.06.04)
うーん、この場を借りて言っておきたいのだが、先月の6月後半から今月に至るまでのコンテンツについては、ある事情により「私の趣味」とはかなり異なるものが多い。それを強くここに断っておきたい。いや、本当に本当なのです。
ちなみに*.ac.jpドメインに関しては、新顔「文教大学」が登場している以外は定番どころが集まっている。ちょっと不思議なのが、慶応大学・早稲田大学のような人数も多いマンモス校が11位、14位とトップ10に入っていないことである。何故だろう?
とりあえず、今回の結論は「あなたと好みが似てるトコ」ベスト1は学校で言えば京都大学で、企業で言うとSQUARE(とりあえず)ということになる。また、大学に関しては人数比率からすれば文教大学もお薦めかもしれない。なお、念のために書いておくが、本サイトはその真偽については保証しないの。念のため。
2000-08-20[n年前へ]
■メールはなかなか書けません...
WEBページのを書くよりも、メールを書く方が実は時間がかかる。WEBページを書くときは「もう書かなくても判ってくれるぐらいの人」を仮想読者にしてしまっているのだけれど、メールの場合はそうはいかない。そうすると、ちゃんと書こうと思えば思うだけ書けなくなるのだった。