2007-12-22[n年前へ]
■アフィニティサイエンス、探索的データ解析ソフト「Aabel 2.4」を発売
アフィニティサイエンス、探索的データ解析ソフト「Aabel 2.4」を発売。統計解析と探索的データ解析、科学グラフの作成、主題地図の作成という異なる3つのソフトを統合したパッケージ製品。
2009-05-09[n年前へ]
■「野球の統計データ」を通して眺める「統計解析の基本と仕組み」
山口和範「図解入門 よくわかる統計解析の基本と仕組み―統計データ分析入門 」は、わかりやすい本です。けれど、この本の読んでいて感じる面白さは「わかりやすさ」より、「心で感じることができる楽しさ」にあると思います。
どういうことかというと、この本にに出てくる例は「現実に即した例」で、それが工場の不良品率とかいった役に立つけれど「私たちの仕事から離れた趣味」とは必ずしも繋がらないような例ではなく、「私たちの私たちの趣味」と繋がるような、「(本当に)実際の野球選手にまつわるさまざまなデータ」なのです。不思議なくらい、そんなデータで「相関」や「主成分分析」などの話題が説明されていくのです。面白い本です。
まずは、本塁打とフォアボールの数の関係を示したグラフが下の図になります。たとえば、このデータの場合イは、「本塁打を打つ選手は(に対しては)、フォアボールが多い」という直観・実感に即したデータです。ホームランバッターにはボール球を多く投げたくなる状況が多いでしょうから、これはごく自然なデータでしょう。ちなみに、ここで言うホームランバッターというのは、本塁打数が20本を超えるような選手だということがこのグラフからわかります。
ところが、次の「本塁打」と「死球(デッドボール)」の関係グラフを眺めてみると、少し意外に感じます。ホームランバッターには危険球ぎみのボールを投げ、その結果デッドボールが多くなるかと思いきや、そういうわけではないようです。・・・考えてみれば、死球が多く、その結果怪我をしがちだったりしたら、ホームラン(本塁打)を多く打つことができなくなってしまうわけですから、これもよくよく考えてみればあたり前なのかもしれません。
というわけで、ここまでは、よくよく考えてみると自然に納得できるデータです。次のまだ「関係がよくわからないデータ」は、打率と三振の関係を示したデータです。高打率を誇る選手は三振が少なそうに思えるのですが、そういうわけではないようです。どういう状況があることで、こういう関係が成り立っているのでしょうか。
直接私たちの何かの役に立つわけでもない「野球の統計データ」を通し、私たちが直接役に立てることができる「統計解析の基本と仕組み」を学ぶのは、何だか楽しく思えます。