hirax.net::Keywords::「分類」のブログ



2009-10-15[n年前へ]

「身長・体重・スリーサイズ」で「今昔アイドル」をクラスタリングしてみよう 

 最近、色々挑戦してみた結果、(無料の)Mathematica Playerと(.NET実装の)Iron Rubyを使ってさまざまなことができるようになりました。今回は「体重を公表しているアイドルのスリーサイズ」のデータを使い、「身長(cm)、体重(kg)、B(cm)、W(cm)、H(cm)」を特徴量として、「アイドル」をクラスタリングしてみることにしました。使う関数は、MathematicaのFindClustersです。具体的なコードを、簡単のために(Player版ではない)Mathematicaで書くと、

data = Flatten[ Import["c:\\actress.xls"], 1];
data2 = Drop[data, None, {1}];
FindClusters[data2 -> data, 10]
という具合です。これで、「アイドル」が特徴が似ている10グループに分類されます。

 ちなみに、結果は、こんな感じです。カッコ{}で囲まれているのが、似ているグループ=クラスタです。

{{{川崎カイヤ,藤原紀香,斎藤陽子,かたせ梨乃,児島明子,山田誉子,}{松島菜々子,高見恭 子,大沢逸美,浅野ゆう子,波乃ひろみ,辺見えみり,青田典子,}{神田うの,松下由樹,吹石一 恵,大石恵,遠藤久美子,内田友紀,田中美里,}{一色紗英,飯島直子,瀬戸朝香,井上晴美,渡 辺満里奈,飯星景子,吉本多香美,高岡早紀,深田恭子,}{水野美紀,伊藤絹子,生田智子,西田 ひかる,松原千明,樹まり子,}{細川ふみえ,駒木なおみ,岩崎ひろみ,加山なつ子,梨花,}{石 田ゆり子,雛形あきこ,三井ゆり,東ちずる,水野真紀,ビビアンスー,}{桜庭あつこ,中條か な子,舞坂ゆい,斎藤由貴,飯島愛,嘉門洋子,有賀美穂,アグネス・ラム,武田久美子,工藤ひ とみ,}{石田ひかり,菅野美穂,井森美幸,沢口靖子,石田ひかり,古手川裕子,河合奈保子,マ ルシア,原日出子,小泉今日子,松本明子,}{桂木真理子,安西ひろこ,奥村チヨ,岩崎良美,柏 原芳恵,石田えり,五月みどり,吉沢京子,島崎和歌子,榊原郁恵,山田まりあ,}}}
 もちろん、このクラスタリングは、「身長(cm)、体重(kg)、B(cm)、W(cm)、H(cm)」で行ったものですから、体型でのグループ分けにすぎません。けれど、こうして眺めてみると、なんだか特徴が出てくるような気がするようにも思えます。

 けれど、そんな体型というものも、アイドルにとってはきっと重要なファクターであるはずです。また同時に、このデータには、さまざまな時代のアイドルが混じっています。しかし、だからこそ、「あぁ、なるほど、この(今の)アイドルとかつてのあのアイドルは立ち位置が似ているんだな」と、「身長(cm)、体重(kg)、B(cm)、W(cm)、H(cm)」だけからも想像できたりするかもしれません。

 さて、あなたの好きな「アイドル・クラスタ」は一体どのクラスタでしょうか? もちろん、まだまだ俳優編・声優編などなど、色々試してみようと思います。

2010-02-19[n年前へ]

「分かれること」「繋がること」への欲求 

 人には「分ける」「差異を見出す」ということへの欲求があるのだろうか。そんな分類・区別・差別化することへの欲求が人の底にはあるのではないか、と強く感じてしまうくらいに、理系と文系・科学と非科学・人文科学と自然科学・科学者と技術者…そんな話は何百年も前から、無限ループのように繰り返し続けられている。

 ひとつのものには、そのひとつのものの中に、色んな側面がある。たとえば、科学は、応用を通じて実生活に関わる面もあれば、知的追求という点からこころの喜びにも関わる面も持っている(この一節はリンク先の本の「あとがき」にある言葉である)。何かを分けようとするとき、それはあくまでひとつの側面を描こうとしているに過ぎない。

 しかし、悪い人間という一種の人間が世の中にあると君は思っているんですか?そんな 鋳型に入れたような悪人は世の中にあるはずがありませんよ。

夏目漱石 「心」

 「ひとつのものには複数の側面がある」という言い方も、それもまた「分ける」ということへの欲求と表裏一体でもある。「分ける」ということは、「重ねる」ということと真逆なようで、実はよく似ている。

 「分ける」という言葉の裏に寄り添う「統一する」ということへの欲求に、「ひとつのものには複数の側面がある」という言葉は繋がるのかもしれない。そんな、「分ける」「繋げる」ということの繰り返しで、私たちの世界観は進んできたのではないだろうか。

 その主語・目的語を、明示的に私自身とした時には、それは「分かれること」「繋がること」への欲求ということになる。そう考えてみても、その繰り返しで私たちの世界は時を進めてきたのかもしれない、とふと思う。

2010-03-06[n年前へ]

ミカンの隣にリンゴを置くと果物だが、ボールを置けば… 

 非ユークリッド写真連盟(森田信吾+糸崎公郎)「フォトモ―路上写真の新展開 」を読んでいるとセザンヌのこんな言葉に出会う。

 ミカンの隣にリンゴを置くと果物になる。しかし、ボールを置くとそれは球体になる。
 人は、類似性を見つけたがり、そして、分類をしたがる指向を持っているのかもしれない。

 人が二人並んで歩いている時、あるいは、人と何かが並んでいる時、私たちはその中にある類似性を見つけ出す本能を持っているのだろうか。

2012-10-16[n年前へ]

身長とスリーサイズでアイドルをクラスタリングしてみよう!? 

 「アイドルプロフィール(スリーサイズ、カップ情報)」のデータを使い、各アイドルを「身長・B・W・H」という4次元情報をもとにクラスタリング(クラスタ分析)してみました。登場するアイドルは総勢395人!ということで、解析した結果はテキストファイルとしてここ(idolClusters.txt)に置いておきます。

 20クラスタほどに「分けて」はみたものの、果たして「上手く分かれている」のか「ほどよく分かれているわけでないのか」…それが全くわかりません。アイドルの顔を見ることはあっても、あまり身長やスリーサイズは眺めたり意識したりといったことをしていないのかもしれません。

{{{"逢沢りな"}, {"岡安麗奈"}, {"川村虹花"}, {"小池里奈"}, {"小池凛"}, {"指原莉乃"}, {"澤田リサ"}, {"志田友美"}, {"高柳明音"}, {"久本彩奈"}, {"渡辺麻友"}, {"黒川智花"}, {"酒井萌衣"}, {"戸田恵梨香"}, {"中田彩"}, {"平嶋夏海"}, {"福田沙紀"}, {"前田敦子"}, {"前田希美"}, {"松井玲奈"}, …(中略)…{"七色あん"}, {"MARI"}, {"中川朋美"}, {"水樹たま"}}}

 ざっと眺めると、"MEGUMI"や"手島優"は、同じクラスタ(グループ)だと自然に納得できますが、これは「アイドル」とはいっても「グラビアアイドル」という属性を持つがためにスリーサイズ的なイメージが頭に浮かぶ、のかもしれません。



■Powered by yagm.net