従来型に比べ約7,000分の1の計算量で正確な天気予報を生成するAIモデル

ワシントン大学とマイクロソフトリサーチの共同研究では、人工知能が過去の気象パターンを分析して、現在の技術よりもはるかに効率的に、そして潜在的にはいつの日かより正確に未来の出来事を予測できると主張した。

従来型に比べ約7,000分の1の計算量で正確な天気予報を生成するAIモデル

ワシントン大学とマイクロソフトリサーチの共同研究では、人工知能が過去の気象パターンを分析して、現在の技術よりもはるかに効率的に、そして潜在的にはいつの日かより正確に未来の出来事を予測できると主張した。

ワシントン大学教授Dale R. Durran、同ポスドクのJonathan Weyn、マイクロソフトリサーチのシニアプリンシパルリサーチャーのRich Caruanaによる研究では、新しく開発された全球気象モデルは、詳細な物理学的計算ではなく、過去40年分の気象データに基づいて予測を行う。今年の夏にJournal of Advances in Modeling Earth Systemsに発表された論文によると、シンプルなAIモデルは、従来の気象モデルと同様に、1つの予測から次の予測へと同じようなステップを繰り返すことで、地球上の1年間の天気をより迅速に、ほぼ同じようにシミュレートすることができるとのことだ。

この新しいモデルは、当然のことながら、今日のトップの伝統的な予測モデルよりも精度が低いが、現在のAI設計では、地球上の同じポイント数の予測を作成するために、約7,000分の1の計算量しか使用していない。これは「アンサンブル予測」と呼ばれる技術で、例えばハリケーンが襲う可能性のある場所など、気象イベントの予想される結果の範囲を網羅した気象予測を可能にする。

人工知能アルゴリズムは、物理学の方程式ではできないような異なる変数間の関係を考え出すことができ、使用する変数を大幅に減らすことができるため、より高速なモデルを作ることができる、と論文は記述している。

成功したAI技術と天気予報を融合させるために、チームは立方体の6つの面を地球上にマッピングし、建築紙のモデルのように立方体の6つの面を平らにした。予測精度を向上させるための一つの方法として、北極の面を天候に特有の役割を持つため、異なる扱いにした。

次に著者らは、天気予報の標準的な変数である500ヘクトパスカル気圧の世界的な高さを12時間ごとに1年間予測することで、そのモデルをテストした。Weynが共著者として参加した最近の論文では、データ駆動型の天気予報のベンチマークテストとしてWeatherBenchを紹介している。その予測テストでは、3日間の予測のために開発されたこの新しいモデルは、トップパフォーマーの1つだ。

データ駆動型モデルは、既存の運用予測に対抗するためには、より詳細な情報が必要であると著者らは述べているが、このアイデアは、特に以前の予測や気象観測の量が増えている中で、天気予報を生成するための代替的なアプローチとして有望であることを示している。

衛星観測から得られる信頼性の高い気象データが数十年にわたって蓄積され、MLのための広く利用可能なオープンソースのソフトウェア、および効率的なグラフィックス処理装置(GPU)コンピューティングによって、最近の研究では、大気力学や物理学を支配する既知の物理法則を明示的に強制することなく、ディープラーニングのような高度なMLアルゴリズムを用いて、純粋にデータ駆動型のモデルを開発して天気を予測することが可能であるかどうかという問題にも取り組み始めている。

DuebenとBauer(2018)は、数年間の再解析データ上で訓練されたディープニューラルネットワーク(DNN)を用いて、地球上の500hPaのジオポテンシャル高度を比較的粗い6°の分解能で予測し、MLが適度に熟練した大気予測を生成する能力を実証した。畳み込みニューラルネットワーク(CNN)を用いて、Scher(2018)とScherとMessori(2019)は、ベースラインメトリクスを大幅にアウトパフォームし、簡略化された一般循環モデル(GCM)からのシミュレーション上でアルゴリズムを訓練し、簡略化されたGCMのダイナミクスを効果的に捉えた。

Weynらは20年以上の過去の再解析データを用いて、Scher(2018)とScher and Messori(2019)と同様のCNNを訓練し、北半球の500hPa高度と300~700hPa厚さの予測を作成した。彼らの最高のCNN定式化は、予測リードタイムの約5日までの500hPa高度領域で、根平均二乗誤差(RMSE)の気候学的ベンチマークをアウトパフォームすることができた。しかし、WDC19モデルは緯度経度グリッド上の北半球のみに適用されており、北極と赤道の境界条件が適切に設定されていなかった。

最も注目すべきは、緯度経度グリッドからのグローバルデータを立方体球上に投影し、立方体面上で動作するCNNを設計するために体積保存的マッピングを用い、MLコミュニティで360°画像を処理するために用いられている同様の手法を改良することである。立方体球マッピングは、平面畳み込みアルゴリズムの歪みを最小化するのに役立つと同時に、立方体面のエッジに閉じた境界条件を提供する。

彼らは、WDC19で使用されているCNNエンコーダ-デコーダアーキテクチャをさらに改良し、より長い時間スケールでの予測を改善するためにシーケンス予測技術を採用したとし、運用予測において非常に重要なパラメータである地表面温度の予測を提供するために、地表面ベースの大気圏を追加した、と說明している。

Photo by NASA on Unsplash