hirax.net::inside out::2009年10月15日

最新記事(inside out)へ  |   年と月を指定して記事を読む(クリック!)

2009年9月 を読む << 2009年10月 を読む >> 2009年11月 を読む

2009-10-15[n年前へ]

「身長・体重・スリーサイズ」で「今昔アイドル」をクラスタリングしてみよう 

 最近、色々挑戦してみた結果、(無料の)Mathematica Playerと(.NET実装の)Iron Rubyを使ってさまざまなことができるようになりました。今回は「体重を公表しているアイドルのスリーサイズ」のデータを使い、「身長(cm)、体重(kg)、B(cm)、W(cm)、H(cm)」を特徴量として、「アイドル」をクラスタリングしてみることにしました。使う関数は、MathematicaのFindClustersです。具体的なコードを、簡単のために(Player版ではない)Mathematicaで書くと、

data = Flatten[ Import["c:\\actress.xls"], 1];
data2 = Drop[data, None, {1}];
FindClusters[data2 -> data, 10]
という具合です。これで、「アイドル」が特徴が似ている10グループに分類されます。

 ちなみに、結果は、こんな感じです。カッコ{}で囲まれているのが、似ているグループ=クラスタです。

{{{川崎カイヤ,藤原紀香,斎藤陽子,かたせ梨乃,児島明子,山田誉子,}{松島菜々子,高見恭 子,大沢逸美,浅野ゆう子,波乃ひろみ,辺見えみり,青田典子,}{神田うの,松下由樹,吹石一 恵,大石恵,遠藤久美子,内田友紀,田中美里,}{一色紗英,飯島直子,瀬戸朝香,井上晴美,渡 辺満里奈,飯星景子,吉本多香美,高岡早紀,深田恭子,}{水野美紀,伊藤絹子,生田智子,西田 ひかる,松原千明,樹まり子,}{細川ふみえ,駒木なおみ,岩崎ひろみ,加山なつ子,梨花,}{石 田ゆり子,雛形あきこ,三井ゆり,東ちずる,水野真紀,ビビアンスー,}{桜庭あつこ,中條か な子,舞坂ゆい,斎藤由貴,飯島愛,嘉門洋子,有賀美穂,アグネス・ラム,武田久美子,工藤ひ とみ,}{石田ひかり,菅野美穂,井森美幸,沢口靖子,石田ひかり,古手川裕子,河合奈保子,マ ルシア,原日出子,小泉今日子,松本明子,}{桂木真理子,安西ひろこ,奥村チヨ,岩崎良美,柏 原芳恵,石田えり,五月みどり,吉沢京子,島崎和歌子,榊原郁恵,山田まりあ,}}}
 もちろん、このクラスタリングは、「身長(cm)、体重(kg)、B(cm)、W(cm)、H(cm)」で行ったものですから、体型でのグループ分けにすぎません。けれど、こうして眺めてみると、なんだか特徴が出てくるような気がするようにも思えます。

 けれど、そんな体型というものも、アイドルにとってはきっと重要なファクターであるはずです。また同時に、このデータには、さまざまな時代のアイドルが混じっています。しかし、だからこそ、「あぁ、なるほど、この(今の)アイドルとかつてのあのアイドルは立ち位置が似ているんだな」と、「身長(cm)、体重(kg)、B(cm)、W(cm)、H(cm)」だけからも想像できたりするかもしれません。

 さて、あなたの好きな「アイドル・クラスタ」は一体どのクラスタでしょうか? もちろん、まだまだ俳優編・声優編などなど、色々試してみようと思います。