hirax.net::Keywords::「パトロール」のブログ



2013-08-21[n年前へ]

「雑誌の読者プレゼント」と「ベンフォードの法則」 

 「雑誌の読者プレゼント」でプレゼントが読者に送付されておらず、雑誌に「プレゼント当選者」として記されていた人たちの氏名(名字と名前)は、適当に作られた架空のものだったというニュースを見て、こんなことを考えました。

 名字や名前の比率がわかっていれば(さらには、県別年齢別のそういった比率などがわかっていれば)、雑誌に記されている「プレゼント当選者」たちの名前が統計的に見て「自然であるか、それとも不自然であるか」がわかりそうです。

 世の中にある多くの数字に対して「最初の桁が1である確率は30パーセントにもなる。さらに、最初の桁に現れる数字は小さな数値ほど確率が高い」というベンフォードの法則が成り立ちます(参考:「大学入試問題」と「ベンフォードの法則」)。たとえば、右のグラフは「2011年にhirax.netからAmazon広告経由で販売された商品データ一覧」を使って、「商品の値段の一桁目の数字は何か?」を調べてみた結果です「一桁目の数字の3割は”1”である」という「ベンフォードの法則」にほぼ沿っていることがわかります。逆に言えば、こんな風に数字の統計データを眺めてみた時に、「ベンフォードの法則」に沿っていなければ、「あれ?何だか不自然だな…何か隠れた理由があるんだな」ということに気がつくことができるわけです。

 雑誌の読者プレゼント当選者たちの名前を「統計的に自然であるか・自然でないか」を自動チェックしたら、一体どんな風になるのでしょうか。たとえば、鈴木・佐藤・田中…といった名字を持つ「当選者」の比率は、現実の比率に沿ったものなのでしょうか。あるいは、名前の比率は自然なのでしょうか?…ちょっと調べてみたくなりますね。

 もしかしたら、将来の電脳世界では、電脳世界中にあるリストデータたちに対して、そういったリストの中身が「自然か不自然か」を判断するパトロール・ロボットが存在し、電脳世界を日夜取り締まりしていたりするかもしれません。



■Powered by yagm.net