ビットコインの時間ベースのべき乗則は、2014年にGiovanni Santostasi氏によって最初に提案され、2019年に私たちによって再表現されました(回廊と3パラメータモデルの両方として)。具体的には、このモデルは、ビットコインの創設ブロックからの日数の対数とビットコインUSD価格の対数の間の線形関係を記述します。
このモデルには、マルセル・バーガー氏、ティム・ストルテ氏、ニック・エンブロー氏など、多くの批判者が集まっています。は、それぞれこのモデルに対する「反論」を書いている。この論文では、これら3人の批評家それぞれの主要な論点の1つである、時間と価格の間にコインテグレーションがないとされる点を解剖することを目的とする。
本稿では、この疑問を徹底的に検証する。その結果、厳密に言えば、私たちのモデルも含めて、時間依存モデルには共和分(cointegration)は存在しないという結論に達する。とはいえ、時間依存のべき乗モデルには、カイネグレーションに必要な統計的性質のひとつが存在することは否定できない。したがって、我々は、時間ベースのべき乗則は緩やかな意味では共和分であり、我々の批判は間違っており、このモデルは完全に有効であると結論づける。この結論は、ストックフロー(S2F)モデルにも、長期的な株式市場指数価格で観察される指数関数的成長にも同様に当てはまることを示す。
迷っていますか?もしかしたら、「共分散」という言葉は初耳かもしれませんね?心配しないでください。因果推論と非スプリアス関係の専門家であり、『The Book of Why』の著者であるジュデア・パールは、このテーマについて何も知らないと主張しています。私たちは、目の前の問題に関連する用語を完全に明らかにするよう努めます。
興味深く、魅力的なのは、#ビットコイン空間内でのXに関する白熱した共分散の議論であり、その主題の表面的なレベルによって特徴付けられる。ストックフローやべき乗則の信奉者の多くが混乱している。興味のある読者は、Xで「共分散とは 」という検索フレーズを入力することで、これを自分の目で確かめることができる。時間の経過とともに理解を深め、洗練されてきたと思われる投稿者がいる一方で、混乱したままだったり、鞍替えしたり、道を踏み外したりしている投稿者もいる。私たちがこのトピックについて議論し始めたのは今になってからだ。
確率過程には確率変数が含まれます。確率変数の値はあらかじめ決まっているわけではありません。対照的に、決定論的過程は事前に正確に予測することができます。株価のようなものは確率過程であり、資産価格を事前に予測することはできないからである。したがって、株価やビットコイン価格のような時系列は、確率変数の観測と考えます。
平滑過程は、緩やかに言えば、時間にわたって同じ特性を持つ確率過程です。このような特性の例としては、平均と分散があり、平滑過程では定義され安定しています。滑らかな時系列の同義語はI(0)である。滑らかな過程からの時系列は「ドリフト」せず、平均、通常はゼロに戻る傾向があるはずです。非定常過程の例として、物理学におけるブラウン運動や粒子拡散を記述するランダムウォークがあります。非平滑過程の特性(平均や分散など)は時間と共に変化したり、定義されなかったりする。非平滑過程はI(1)以上であるが、通常はI(1)である。非定常過程に由来する時系列は、時間とともに「ドリフト」する、すなわち、どのような固定値からも離れる傾向がある。
記号I(1)は、時系列が定常状態に達する前に「発散」する必要のある頻度を指します。この差は、時系列のある値とその前の値との差である。これは導関数を取ることとほぼ同じである。滑らかな時系列はすでに滑らかであり、滑らかになる前に0回差分する必要があるので、I(0)となる。 I(1) 時系列が滑らかになる前に1回差分する必要がある。
上の図は、青い時系列を得るためにオレンジの時系列を1回差分することによって構成されています。同様に、オレンジの時系列は青の時系列を積分することで得られます。
ここでいう単位根過程とは、自己回帰モデル(より正確にはAR(1)型)のことで、rhoパラメータは1に等しいと推定される。推定の結果は「ルート」値である。
rhoの値は、プロセスが以前の値をどの程度覚えているかを示します。
単位根過程はランダムな放浪であり、非平滑である。ルート」またはrho値が1以下の過程はドリフトしない傾向があり、したがって定常的です。長期的には、1に近い(しかし1を下回る)値であっても、(ドリフトするのではなく)平均回帰する傾向がある。したがって、単位根過程は、その振る舞いが根の値が1に非常に近い過程とは根本的に異なるので、特別です。下の図は、4つの既知の自己回帰過程によって生成されたデータの4つのサンプルを示しており、それぞれ異なるrho値を持っています。
2つのシグナルの共線性 2つの確率変数(我々の場合は時系列)の間に共分散が存在するか、または存在すること。この場合、時系列)は、互いに共分散しているか、または共分散していないかである。このペアが共積分であるためには、両者が同じ次数で積分され、かつ非平滑でなければならない。さらに(ここが重要なのですが)、2つの時系列の滑らかな線形結合が存在しなければなりません。
共和分なしのシグナルの例 2つの時系列が非平滑である場合、線形結合(この場合、単に2つの時系列の差を選択する)も通常は非平滑です。
共和分シグナルの例 2つの非平滑時系列が長期の場合もし2つの非定常時系列が長い間「同じように」ドリフトするならば、線形結合(ここではr2-0.5*r1を選ぶ)は定常的でありうる:
Tu et al [1] describe cointegration well and intuitively:
「時系列間のコインテグレーションの存在は、それらが共通の確率的ドリフトを共有していることを意味する。ドリフトを共有することを意味する。"
なぜ2つの非定常時系列が滑らかな線形結合を持つと便利なのでしょうか?モデル誤差はxとyの線形結合で与えられます:モデル誤差=y - a - b*x。私たちは、このモデル誤差が安定していること、つまり長期的にドリフトしないことを望みます。もしモデル誤差が長期的にドリフトするならば、それは我々のモデルが悪いことを意味します。
Details make the difference より正式な定義は、Engle and Grangerの "Cointegration and Error Correction: Representation, Estimation, and Tests" [2]にあります(Grangerはコインテグレーションの概念の発明者です)。は2003年にノーベル経済学賞を受賞している)には、重要な概念とコインテグレーション検出のための検定が定義されている。この論文の鍵は、時系列が確率的で決定論的要素を持たないという仮定です(この点については後述します)。
時間とビットコイン価格への応用 時間ベースのべき乗則の場合、次の2つの変数があります。
log_time: ブロックの作成からの日数の対数
log_price : 価格の対数
EngleとGrangerの定義に基づき、両変数はランダムである必要があり、決定論的要素を持たず、非定常である必要があります。さらに、2つの変数の滑らかな線形結合を見つけることができなければならない。そうでなければ、2つの変数の間にコインテグレーションは存在しない。
詳細に入る前に、平滑性やコインテグレーションの概念なしで、モデルデータ自体のグラフをいくつか示すことから始めましょう。時間ベースのべき乗則によって生成されたフィットは、視覚的に非常によく見えることに注意してください。残差ベクトルはすぐにドリフトを示すものではない。
さらに、このモデルは優れたサンプル外パフォーマンスを示しています(下記参照)。スプリアス相関に基づくモデルは、スプリアス、つまり正確な予測ができないということになります。サンプル外性能は、限られた量のデータ(ある日付まで)にモデルをフィットさせ、モデルがフィットしない期間を予測することでテストできます(クロス・バリデーションに似ています)。サンプル外の期間中、観測価格はモデル化された価格を頻繁に横切り続け、観測価格の最大オフセットはモデル化された価格から系統的に離れることはありませんでした。
モデルが発表された後(2019年9月)、モデルのパフォーマンスをより批判的に見ることができる。--事後的にモデルを変更することはできないからだ。
モデルの予測力は、偽りの相関関係のみに基づいているという主張に対しては、塩を振って受け止めるべきである。
共同積分のステップ・バイ・ステップ log_timeとlog_priceの間に可能な共同積分が存在するためには、両方の変数が確率変数の同じ次数の積分でなければならず、少なくとも次数は1でなければなりません。
変数log_price
log_priceは滑らかな時間系列なのでしょうか?ニックは、指定されていないスタイルのADF検定(非平滑性検定)とKPSS検定(平滑性検定)を用いると、log(price)は疑いなく非平滑であり、したがってI(1)以上であると結論付けています。彼は、異なる期間でADF検定(非平滑性検定)を行い、状況が明確でないことを指摘しています。"したがって、非平滑性をしっかりと棄却することはできず、対数価格の非平滑性を示していると結論づけることはできません。"
独自の分析をしてみよう。Tim Stolteと同様に、異なる時間窓でADF検定を適用します:常に利用可能な最初の日付から開始し、1日ごとに1日を追加します(日次データを使用します)。こうすることで、ADF検定の結果が時間とともにどのように変化するかを見ることができる。しかし、ティムやニックとは異なり、我々はどのバージョンのADF検定を実行するかを指定する。ウィキペディアによると、DFテストとADFテストには3つの主なスタイルがあります。
これら3つのバージョンの違いは、異なる傾向に適応できる(排除できる)ということです。これは、決定論的トレンドを除去するというEngleとGrangerの要求に関連しており、これらの3つのバージョンは、3つの単純なタイプの決定論的トレンドを除去することができます。最初のバージョンは、過去のlog_priceデータのみを使用して日々のlog_priceの変化を記述しようとします。2番目のバージョンは、定数項の使用を許可し、その効果は、log_priceが線形トレンド(上昇または下降)を持つことができるということです。3番目のバージョンは、2次(放物線)成分を許容します。
ティムとニックがどのバージョンを実行したかは分かりませんが、3つとも実行してみましょう。
ADFテストでは最大ラグ1を使っていますが、それ以上のラグを使っても結果と結論は大きく変わりません。pythonのstatsmodels.tsa.stattools.adfuller関数を使用し、"maxlag "は1で、"n "を使用します、"c "と "ct "を "回帰 "パラメータとして使用する(上記のWikipediaに記述されている3つのスタイルに相当する)。下の図では、検定によって返されるp値(統計的有意性の尺度)を示しており、値が低いほど平滑である可能性が高いことを意味します(通常、0.05のしきい値を使用します)。
最初のスタイル(緑の線)は、log_price時系列が非定常であると明確に結論付けていることがわかります。3番目のバージョン(オレンジ色の線)も同じ結論を出していますが、決定的ではありません。興味深いことに、定数項を考慮した検定(青い線)は、時系列が平滑であるかどうかを決定することができません(ティムは定数項を用いたADF検定も使用したようです)。なぜ3つのバージョンはこれほど違うのでしょうか?特に、なぜ定数項を考慮したバージョンはlog_priceが平滑であることを除外できないのでしょうか?
説明は一つしかありません:log_priceの差に定数項だけを使う(log_priceに線形項が生じる)と、時系列に「非常によく」適合し、その結果、ほぼ定常的に見える残差が生じます。その結果、残差はほぼ定常的に見える。今のところ、log_priceで決定論的傾向をまったく使わない、あるいは2次項の決定論的効果を使うというのはうまくいっていません。
これはすでに、時間とlog_priceの間に関係があることを強く示唆しています。実際、定数項を使ったADF検定で信号が平滑であると結論づけられた場合、これは線形時間項がlog_priceを十分に近似し、平滑な残差が得られることを意味します。滑らかな残差を得ることは、スプリアスでない関係(すなわち、正しい説明変数が見つかったこと)のサインなので、望ましいことです。線形時間トレンドは、我々が必要とするものではありませんが、近いようです。
我々の結論は、(別の投稿で)次のように指摘したマルセル・ベルクの結論とは著しく異なります:
以前の分析で、私はビットコインの価格が一次積分であることを示しました。ビットコインは時間の経過に伴う価格の進化において決定要因を示さない。"
線形時間はビットコインの経時的な価格行動を完全には説明できないと結論づけますが、log_priceが決定論的な時間要素を持つことは絶対的に明らかです。さらに、(EngelとGrangerが要求するように)適切な決定論的要素を取り除くと、log_priceがI(1)であることは明らかではありません。代わりに、トレンド平滑化されているように見えますが、適切な決定論的成分はまだ見つける必要があります。
もし私たちが共和分を探しているのであれば、log_priceがI(1)でないことはすでに問題であり、2つの変数が共和分であるためには、両方ともI(1)以上でなければならないからです。
log_time変数
それでは、log_time変数を見てみましょう。は、log_timeが6次の積分であるように見えると結論づけています(彼は数値的な問題に遭遇するまでその差を保持します)。彼がlog_timeのような数学的関数に、完全に決定論的な変数からランダムな変数への変換を期待する方法は馬鹿げている。
ニックはlog_timeとlog_price変数について同じ結論に達しています。これらは驚くべき発言である!積分次数と共分散は、確率変数の概念を参照し、そこから決定論的傾向を取り除きます(上記のEngleとGranger [2]を参照)。注意:決定論的変数の値は事前に知られているが、確率変数の値は知られていない。時間は(明らかに)完全に決定論的であり、対数関数もそうであり、したがってlog_timeも完全に決定論的である。
エングルとグレンジャーに従い、log_timeから決定論的トレンドを取り除くと、ゼロのベクトルが残ります。log(x)-log(x)=0、つまり完全に決定論的なシグナルが残っているからです。完全に決定論的な変数log_timeを確率変数に変換することができないので、EngleとGrangerのフレームワークを使うことができないのです。
コインテグレーション分析において完全に決定論的な変数を持つことがいかに問題であるかを理解するもう1つの方法は、平滑性検定(例えば、ディッキー・フラー検定)がそれをどのように扱うかを考えることです。最も単純なケースを考えてみましょう(ここで、yは関心のある変数、rhoは推定される係数、uはホワイトノイズと仮定される誤差項です)。watermarknone.png" title="7176496" alt="9Kt9k87BY85E04P2Z0CKNHjit7p5IQbWphsY97Rz.png">
どうなるでしょうか?tのすべての値について、誤差項u_{t}は0です。なぜならランダムな要素がないからです。しかし、log_timeは時間の非線形関数なので、rhoの値も時間に依存しなければなりません。
ランダム変数の場合、変数rhoが以前のランダム値の記憶の度合いを捉えるので、このモデルはより有用です。しかしランダムな値がない場合、このモデルは無意味である。
他のタイプのテストも決定論的変数と同じ問題を抱えている。
したがって、完全決定論的変数は、コインテグレーション分析の一部ではない。言い換えれば、決定論的なシグナルにはコインテグレーション分析は適用されず、シグナルの1つが決定論的である場合、偽の関係を主張するための時代錯誤のツールです。
どうすればよいのでしょうか? 共同積分は、両方がI(d)である2つの変数の間でのみ定義されます。log_timeがI(0)か、I(1)か、I(6)かはわかりません。また、log_priceはI(1)ではなく、トレンド平滑です。
log_timeとlog_priceの間に未定義の共分散があるという事実は、時間ベースのべき乗則が統計的に無効か偽であることを意味するのでしょうか?
どのような適切な統計分析においても、決定論的変数とトレンド平滑化変数の混在の使用は完全に有効です。批評家たちが信じようとしているように、コインテグレーションは統計的関係分析の中心点ではありません。
だから、コインテグレーションは不可能なのだ。しかし、べき乗モデルに適用される平滑性分析の場所はまだあるかもしれません。これをさらに探ってみよう。
入力変数間の共和分分析から始めた理由は、2つの滑らかな線形結合を見つけたかったからです。決定論的変数(log_time)と傾向平滑変数(log_price)を組み合わせて平滑変数を得ることができない根本的な理由はありません。したがって、(残差は2つの入力信号の線形結合に過ぎないので)厳密な意味での共和分(cointegration)を探す代わりに、単に残差が平滑かどうかをテストすることができます。残差が平滑であれば、Engel-Grangerの共和分検定に厳密に従わなくとも、平滑な線形結合(これが共和分の目的である)を見つけることができる。
より詳細な研究 ジェームス・G・マッキノンは、論文 "Critical Values of Cointegration Tests"[3]の中で、このことを正確に説明しています。もし "coointegrating" regression(log_timeとlog_priceをリンクする回帰)が実行されたなら、 coointegrationの検定(Engle Granger検定)は、残差の平滑性の検定(DF検定またはADF検定)と同じです:
マッキノンは、log_timeとlog_priceをつなぐパラメータが先験的にわかっている なら、それを省略できるという主張を繰り返している。
つまり、以下の2つのアプローチのどちらかを使うことができます。
log_timeをlog_priceにフィットさせ、残差(誤差)を計算する。その残差に基づいて、DFまたはより良いADF検定を計算します。結果の統計量は、残差が平滑かどうかを教えてくれます。
log_timeとlog_priceがI(1)であると仮定し、Engle-Granger共同継起検定を実行します。結果の統計量は、残差が平滑かどうかも教えてくれます。
ADF検定には、pythonのstatsmodels.tsa.stattools.adfuller関数を使います。両関数とも、定数を使用しない(時間的に一定のドリフトがない)フレーバーを使用します。なぜなら、残差は時間的に一定のドリフトを含んではならないからです(これはモデルが時間的に価格を過大または過小評価し始めることを意味するからです)。
ADF検定とEngle-Granger検定は等価であると書きましたが、これは完全には正しくありません。は自由度の尺度である)。確率変数は、別の確率変数または決定論的変数の影響を受けることができるが、決定論的変数は確率変数の影響を受けることができない。したがって、我々のケース(決定論的変数log_timeが1つだけある)では、ADF検定(N=1の確率変数を仮定)によって返される統計量が好ましいです。原理的には、Engle-Granger 検定とADF 検定は矛盾するかもしれませんが、実際には、時間ベースのモデルではそうではありません。以下に示すように、結論は同じです:我々は滑らかな残差ベクトルを得ます。
どちらのテストも、最初は滑らかな残差を示さないのが普通です。これは、残差信号の中に低周波成分が存在するためであり、非平滑信号と間違われる可能性があります。平均残差が著しく回復し、事実上定常的になるのは時間の経過によるものです。
S2Fと長期株価指数 S2Fモデルは一般に無視されてきたようだが、それは厳密な意味での共同継合が、時間ベースのべき乗則と同様の理由で不可能であることが証明されたからである:(部分的な)決定論的インプット変数を用いている。しかし、このモデルは非常に安定しているように見える残差を生成する。
実際、Engle-Granger共同継起検定と安定性のADF検定(決定論的変数と確率変数があるので好ましい)の両方がは、0に非常に近いp値を出す。したがって、「共統合の欠如」(これは事実上「平滑性の欠如」を意味する)の根拠は、S2Fモデルのために除外されるべきではない。
しかし、2020年初頭に指摘したように、S2Fモデルが維持されるべきではないという示唆は他にもある。BTCUSD価格がS2Fモデルの予測よりも低くなるという我々の予測は、先見の明があったことが証明された。
長期的な株価指数を時間に対して見るのも興味深い(この場合は配当再投資なしのS&P500)。主要な株式市場の株価指数が平均約7%の指数関数的な速度で成長することはよく知られている。実際、指数回帰でこれを確認した。
ここでも決定論的変数(時間)があります。)は、約0.0075のp-値を生成します(しかし、これらの値は、選択された正確な期間に大きく依存します)。繰り返しになるが、残差は平滑である。株価の指数的な時間トレンドは有効です。
含意 S2Fモデルは当初、その健全な計量経済学的基礎(特にコヒーネグレーションの存在)が高く評価されました(特にMarcel BurgerとNick Emblowによって)。.潮目が変わり、S2Fモデルに(厳密な意味での)共和分(cointegration)が存在し得ないことが明らかになると、マルセルとニックの両氏は船から飛び降り、S2Fモデルの無効を宣言した。この出来事の後、S2Fモデルに対する認識は変わったようだ。エリック・ウォールが、この出来事の変遷を簡潔にまとめている。
私たちは説明し、計量経済学の文献(MacKinnon [3])も私たちに同意しています。この洞察に基づけば、S2Fモデルには共和分・平滑性の問題はなく、したがって共和分の欠如を仮定してS2Fモデルに対する見方を変えるのは誤りである。我々はS2Fモデルが間違っていることに同意するが、それはコインテグレーションの欠如以外の理由で間違っているのだ。
ビットコインの時間ベースのべき乗則は、log_timeとlog_priceの関係をスプリアスと称し、共和分性の欠如を批判されてきました。我々は、ビットコインの時間ベースのべき乗則が明らかに定常残差を持っていることを示しました。
ビットコインの時間ベースのべき乗則モデルは有効で、安定しており、頑健です。いつものように。