hirax.net::Keywords::「重複度」のブログ



2009-08-31[n年前へ]

スラッシュドットの「関連ストーリー」作成アルゴリズムは・・・!? 

 ふと、『スラッシュドットの各記事に対する「関連ストーリー」作成アルゴリズムはどのようになっているのか』が知りたくなりました。

 私のサイトでも、各記事に対して「関連お勧め記事」を表示しています。関連記事の抽出は、各記事に付けられたキーワードの重複度を基準にしています。一人の人が書くサイトの場合には、こういった単純なアルゴリズムで充分な精度が得られるように思います。

 スラッシュドットのシステムを支えているコード”Slash”を眺める前に、ためしに、「スラッシュドット AND 関連ストーリー」で検索をかけると、こんな投稿が見つかりました。

 関連ストーリーは URL をチェックしていて、 /. のストーリーもしくはコメントしか入れられません。
 ・・・ということは、スラッシュドットの「関連ストーリー」作成アルゴリズムは「(編集者の記憶と推敲作業を結晶させた)ガッツで手作業」で実現されているのでしょうか。スラッシュドットを動かす、ソースコード”Slash”の詳細を眺めるのは大変そうなので、まずは概略を知りたい今日この頃です。



■Powered by yagm.net