hirax.net::Keywords::「時系列」のブログ



2010-05-16[n年前へ]

hodrick prescott excel add-in  share on Tumblr 

hodrick prescott excel add-in

 The Hodrick Prescott Filter Add-In was written by Kurt Annen. This program is freeware.

Hodrick-Prescott フィルタのナゾ!?  share on Tumblr 

 経済オンチ解消のため、まずは景気動向を眺めてみようとふと思い、景気データを解析する手法について調べてみました。その作業をする中で、景気データから周期成分を取り除き、トレンド成分を導く手法の"Hodrick-Prescott filter"が気になり、頭から離れなくなりました。

 " Hodrick-Prescott filter"というのは、離散的な時系列データy(t)が与えられたとき、そのトレンド成分をτ(t)とすると、下記のような評価関数を最小化するようにτ(t)を定める、というものです。ちなみに、y(t)、および、τ(t)は、景気データを対数(log)値で示したものになります。

 この式を眺めれば、第二項は二階微分を中心差分でとり、その結果をデータ全域にわたり積分したものだということがすぐわかります。つまり、(景気データを対数軸で示したときの)直線からのズレ・ジグザグ度合いです。その直線からのズレ度合いに定数λを掛けたものです。ちなみに、このλは離散データが三か月ごとのデータであれば、(多くの場合)1600が使われます。もしも、サンプリング間隔が密になれば、二階微分の結果が小さくなるので、それを補うように大きな値が用いられます。また、サンプリング間隔が疎であれば、二階微分の結果は大きくなるということで、ラムダには小さな値が用いられます。たとえば、サンプリング間隔が1年なら、(多くの場合…は以下省略します)λは100が用いられますし、月ごとのデータであれば、14400が用いられますが、これは「二階微分値に対し自乗をとっている」ことを考えれば(その自乗分に比例定数λを合わせようと思うなら)、なるほど、と思えるはずです。

 また、第一項目は、トレンド成分と実データのズレ=取り除きたい周期成分、をデータ全域にわたり積分したものです。ということは、このHodrick-Prescott フィルタは、「実データにトレンド成分がなるべく沿うようにした上で(第一項)、トレンド成分がなるべく対数軸上で直線になるようにする(第二項)」というものであることがわかります。そして、その第一項目と第二項目に対するバランス(評価関数の重み)が、第二項に掛けられてるλで与えられる、というわけです。λが大きければ、「実データから”周期成分”を大きく取り除く=対数軸上で直線になるようにする」ことになりますし、ラムダが小さければ、「対数軸上での直線からのズレが大きくなってもいいから、実データに沿う=”周期成分”をあまり取り除かない」ということになります。

 解説論文を読んだ印象は、この式のλは「米国景気データをもとにした合わせ込み(上手くつじつまがあうようにλを設定する)」で求められた結果であり、また、「対数軸上で景気動向は直線になる」という前提(背景)のもとに作られている、という具合です。(参考:「トレンドとサイクルの分解」の「実際には単位根の問題や成長率を問題にすべき点から、対数階差を原系列データにほど こしてから分析すべき」という辺り)

 このHodrick-Prescott フィルタが頭から離れなくなったのは、「Hodrick-Prescottフィルターをかける前の変数変換」という、専門の先生による記事を読んだからです。この記事では、Hodrick-Prescottフィルタは「そのままの値」にかけるのか、「対数変換した値」にかけるのか、それは「対数変換した値」が一般的だろう、と説明された上で、

 そのままの値にH-Pフィルターをかけた結果と対数変換した値にH-Pフィルターをかけた結果は基本な形状は変わらないはずですが、スケールが変わってしまうので注意が必要ではないかと思います。
と書かれています。この説明を数式できちんと理解することができず(私は経済オンチであるのと同時に数学オンチでもあるので)、頭をひねっているのです。

 疑問を何とか形にしてみると、それはHodrick-Prescottフィルタの評価関数が「対数軸上で景気動向は直線になる」という考えのもとに作られているの(ように見える)に対し(しかも、評価関数の第二項目は単に景気のトレンドを(与えられた軸で)直線にしようとする働きしか持たないにも関わらず)、線形値に対してHodrick-Prescottフィルタを掛けた場合、「対数軸上で現した場合に景気動向が直線になる」ようなトレンド成分が得られるのだろうか?本当に「基本な形状は変わらない」のだろうか?という疑問です。この評価関数を最小化しようとした場合に、対数軸でも線形軸でも「基本な形状は変わらない」のはどうしてだろう?という疑問です。

 きっと、式を追いかけてみれば、あるいは、いくつかの例を解いてみれば、この疑問は解消する(理解できる)はず…と思えます。というわけで、とりあえず、この「Hodrick-Prescott フィルタのナゾ!?を解く(きちんと理解する)」ことを、メモ帳のTo Doリストに書き入れておこうと思います。

Hodrick-Prescottフィルタ






2015-09-27[n年前へ]

実写 進撃の巨人 後編のYahoo!映画ユーザ・レビュー点数を「投稿時間・点数」で散布図にしてみた  share on Tumblr 

 実写映画「進撃の巨人 ATTACK ON TITAN エンド オブ ザ ワールド」のYahoo!映画ユーザ・レビューの点数が低い。ふと、ユーザー投稿時間がレビュー点数に影響を与える可能性があるだろうか?と考えて、640人分のレビューを「投稿時間・点数」で散布図にしてみました。点数は20,40,60,100点という20点おきだったので、散布点が見やすいように点数に若干のランダムノイズを加えてみました。

 結果は、単純に夜3時から朝6時くらいまでは(点数に関わらず)投稿数が少ない…という普通の結果になりました。 深夜の投稿は(気分がハイになって)点数が高くなるとか(その逆に)低くなる…といった傾向はみられませんでした。

 ちなみに、Yahoo!映画ユーザ・レビュー655人分を、日時順に並ぶ時系列で点数変化を眺めてみたのが下図になります。眺めていると、各レビュアーの行動パターンが感じられて面白いかもしれません。

実写 進撃の巨人 後編のYahoo!映画ユーザ・レビュー点数を「投稿時間・点数」で散布図にしてみた








■Powered by yagm.net