Y→X因果関係は何回かやりますと有意であったり、有意でなかったりします。これは式上、フィードバック的な因果関係を持たしていないが、別の論文でこのようなカオス時系列について、なぜか因果関係があるようになってしまう解説があるようです。 いずれにしても因果関係の強さはX→Yの方向よりも低いと[参考1]の結果と一致しています。 検証の続きがありますが、長くなってしまいますので検証はここまでにしておきましょう。
考察
立役者はいうまでもなく、NPMRモデルにあります。本家の資料を見た限り利用シナリオは、モデル対象のデータが十分に多く、予測要因がお互いに影響しあって、その関係性がハッキリわかっていなくて、どうしようもない時に、最後のリソースとして利用するものとしています。ところで[参考1]では、NPMRモデルの適用可能な範囲が意外と広いと判明、めでたく因果関係検出に適していると報告されました。
実際にやってみたところ、おもちゃのようなテストケースは問題なく再現できました。あくまで、NPMRモデルの最適化をしなくても因果関係のパターンを正しく検出できる範囲で用意されたにすぎません。論文の第4節「Discussion」では、注意事項やベストプラクティス、さらには、課題となっているケースなどが念入りに語られています。初期の発見ではありますが、因果関係検出としての様々な可能性を見せています。アイディア次第でコスパのよいツールに拡張できそうな気がします。
[参考1]の手法が簡単で高度な知識が必要としませんでしたが、計算量はデータの長さの二乗オーダーでしたね。長い時系列の場合はちょっと時間がかかります。スケールしにくいかもしれませんが、処理工程の依存関係があまりなく、並列処理は簡単にできそうです。
最後に
前編後編全て読んでいただいた方、心から尊敬しております。弊社近くまで来られた際には、是非ランチでも行きましょう。
参考
- Nicolaou Nicoletta, Constandinou Timothy G.: "A Nonlinear Causality Estimator Based on Non-Parametric Multiplicative Regression", Frontiers in Neuroinformatics vol.10, 2016 https://doi.org/10.3389/fninf.2016.00019
- Ryan G. James, Nix Barnett, James P. Crutchfield: "Information Flows? A Critique of Transfer Entropies", Phys. Rev. Lett. 116, 238701 (2016)
- McCune, Bruce: "Non-parametric habitat models with automatic interactions", Journal of Vegetation Science 17: 819-830, 2006