hirax.net::Keywords::「重複度」のブログ

トップページ"hirax.net" へ　/　サイトBlog "inside out" へ

「重複度」に関する最新記事　/　「重複度」に関する「説明」「記事の一覧」

2009-08-31[n年前へ]

　ふと、『スラッシュドットの各記事に対する「関連ストーリー」作成アルゴリズムはどのようになっているのか』が知りたくなりました。

　私のサイトでも、各記事に対して「関連お勧め記事」を表示しています。関連記事の抽出は、各記事に付けられたキーワードの重複度を基準にしています。一人の人が書くサイトの場合には、こういった単純なアルゴリズムで充分な精度が得られるように思います。

　スラッシュドットのシステムを支えているコード”Slash”を眺める前に、ためしに、「スラッシュドット AND 関連ストーリー」で検索をかけると、こんな投稿が見つかりました。

　関連ストーリーは URL をチェックしていて、 /. のストーリーもしくはコメントしか入れられません。

　・・・ということは、スラッシュドットの「関連ストーリー」作成アルゴリズムは「（編集者の記憶と推敲作業を結晶させた）ガッツで手作業」で実現されているのでしょうか。スラッシュドットを動かす、ソースコード”Slash”の詳細を眺めるのは大変そうなので、まずは概略を知りたい今日この頃です。

この記事の「関連お勧め記事」を読む >>

キーワード(ブログ):スラッシュドット|重複度|関連度|編集者|システム

最新の「重複度」に関する記事へ

>>「重複度」に関する「説明」「記事の一覧」

■Powered by yagm.net