JP7828696B2 - コンピュータプログラム、コンピュータ実装方法、装置(気候データのモデリングのための機械学習の使用) - Google Patents

コンピュータプログラム、コンピュータ実装方法、装置(気候データのモデリングのための機械学習の使用)

Info

Publication number
JP7828696B2
JP7828696B2 JP2022187043A JP2022187043A JP7828696B2 JP 7828696 B2 JP7828696 B2 JP 7828696B2 JP 2022187043 A JP2022187043 A JP 2022187043A JP 2022187043 A JP2022187043 A JP 2022187043A JP 7828696 B2 JP7828696 B2 JP 7828696B2
Authority
JP
Japan
Prior art keywords
climate
data
climate data
machine learning
computer program
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022187043A
Other languages
English (en)
Other versions
JP2023080032A (ja
Inventor
スミトクマー ナロタンバイ マーヴァニヤ
テジャス インデュラル ダーメカ
ジテンドラ シン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2023080032A publication Critical patent/JP2023080032A/ja
Application granted granted Critical
Publication of JP7828696B2 publication Critical patent/JP7828696B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01WMETEOROLOGY
    • G01W1/00Meteorology
    • G01W1/10Devices for predicting weather conditions
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01WMETEOROLOGY
    • G01W1/00Meteorology
    • G01W2001/006Main server receiving weather information from several sub-stations
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2111/00Details relating to CAD techniques
    • G06F2111/04Constraint-based CAD
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Environmental & Geological Engineering (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Atmospheric Sciences (AREA)
  • Ecology (AREA)
  • Environmental Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Description

気候の変化、および、例えば、ハリケーンまたは荒天などの破壊的な気候関連事象は、小売、金融および公共事業の空間におけるものを含む多数の用途に影響を与える可能性がある。気候の傾向を理解し、気候活動を正確に予測することは、公共および民間の企業活動を効果的に予報することにとって重要である。
本発明の実施形態は、気候データをモデリングするために機械学習を使用する技術を提供する。
気候の傾向を理解し、気候活動を正確に予測することは、公共および民間の企業活動を効果的に予報することにとって重要である。
1つの例示的な実施形態において、コンピュータ実装方法は、複数の空間成分と複数の時間成分とを含む気候データを受信する段階と、気候データの一部をマスキングする段階とを備える。機械学習モデルは訓練され、訓練は気候データのマスキングされた部分に少なくとも部分的に基づく。気候データのベクトル表現は機械学習モデルを介して生成される。
さらなる例示的な実施形態は、プロセッサによって実行される際に、プロセッサに上記コンピュータ実装方法を実行させる実行可能なプログラムコードをその内部に具現化した非一時的コンピュータ可読を備えるコンピュータプログラム製品の形態で提供される。またさらに、例示的な実施形態は、上記コンピュータ実装方法を実行するように構成されているプロセッサおよびメモリを有する装置またはシステムを備える。
本明細書に記載された実施形態のこれらおよび他の特徴および利点は、添付の図面および以下の詳細な記載からより明らかになるであろう。
例示的な実施形態に係る、気候データをモデリングするためのシステムを示す図である。 例示的な実施形態に係る、気候データについての機械学習モデルの訓練のブロック図を示す図である。
例示的な実施形態に係る、気候データのモデリングに関連付けられた時空間位置埋め込みのブロック図を示す図である。
例示的な実施形態に係る、気候データのモデリングに関連して使用される気候トークンの一例を示す図である。
例示的な実施形態に係る、気候データのモデリングおよびタスク固有の微調整の動作フローを示す図である。
例示的な実施形態に係る、温度のヒストグラムを示す図である。
例示的な実施形態に係る、気温予報のヒストグラムを示す図である。
例示的な実施形態に係る、気候データモデリングプロセスフローを示す図である。
例示的な実施形態に係る、例示的な情報処理システムを示す図である。
例示的な実施形態に係るクラウドコンピューティング環境を示す図である。
例示的な実施形態に従う抽象化モデル層を示す図である。
例示的な実施形態は、例示的な情報処理システムおよび関連付けられたコンピュータ、サーバ、記憶装置並びに他のプロセッシングデバイスを参照して、本明細書に説明される。しかしながら、実施形態は、示された特定の例示的なシステムおよびデバイス構成での使用に限定されないことが理解される。したがって、本明細書において使用されるとき、「情報処理システム」という用語は、一例として、クラウドコンピューティングとストレージシステムとを有する処理システム、および物理的、仮想的、若しくはその組み合わせの処理リソースの様々な組み合わせを有する他の種類の処理システムである広範な処理システムを包含するように、広義に解釈されることが意図されている。
上記の背景部分で言及したように、気候の傾向を理解し、気候活動を正確に予測することは、企業活動を効果的に予報することに対して重要である。例えば、一部の小売業者は、彼らの需要予報における気象の影響を認識しており、例えば、洪水、干ばつ、ハリケーンおよび荒天などの気象に関連する危険への対処計画を実施するために、短期の気象予報に依存している可能性がある。しかしながら、中長期季節性気象データをユースケース機械学習モデルにエンコードすることは課題である。例えば、異なる地理的エリアおよび一時変数に基づく中長期気象データに関連付けられた不確実性により、気候事象を予測する機械学習モデルの生成および訓練、並びに、例えば、需要供給チェーンの予報などの下流ユースケースでの予測の使用における複雑性が生じる。
本実施形態は、有利には、領域、地域、若しくは時間枠、またはその組み合わせにわたる気候を意識した(climate-aware)予報ユースケースを効率的に解決するために、時空間気候データをベクトル表現にエンコードする技術を提供する。エンコーディングは、気候データツーベクトル(「climate2vec」)機械学習モデルを事前訓練するための、気候マスキング技術と次期気候予報モデルとを使用して実行される。本実施形態は、さらに、例えば、サプライチェーン内の小売ノードにおける需要予測およびリードタイム予報を含むが必ずしもこれに限定されない気候を意識した予報など、様々な下流アプリケーションを実施するためにclimate2vecモデルを微調整するための技術を提供する。
図1は、例示的な実施形態に係る、気候データをモデリングするためのシステム100を示す図である。図1において直線若しくは矢印またはその組み合わせによって示されるように、システム100の構成要素は互いに、例えば、ワイヤ、直接電気接触接続、若しくはその組み合わせなどの物理的な接続、及び/または、例えば、WiFi、Bluetooth(登録商標)、IEEE802.11、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、セルラネットワーク、アドホックネットワーク(例えば、無線アドホックネットワーク(WANET))、衛星ネットワーク若しくはインターネットを含むが、これらに限定されない他のネットワーク若しくはその組み合わせなどの無線接続を介して動作的に接続される。例えば、ネットワークは、特徴再構成エンジン110を、気候を意識した予報エンジン120およびその構成要素に動作的にリンクさせることができる。
システム100は、トランスフォーマ事前訓練層111と、マスク気候予報層112と、不確実性表現層113と、次期気候予報予測層114と、時空間位置埋め込み層115とを有する特徴再構成エンジン110を備える。
図1に示されるように、気象予報データ102と極端事象データ104とを含む気候予報データは特徴再構成エンジン110に入力される。気象予報データ102は、例えば、1つまたは複数の期間(例えば、時間、日、週、月、季節、10年単位など)にわたって、1つまたは複数の地理的地域(例えば、市、州、県、国、大陸またはその他の地域グループ(例えば、沿岸部および内陸部、半球など))に結び付けられた、温度、湿度、風速および風向、降水量(例えば、雪、雨など)、気圧並びに他の気象関連の特徴情報を含む。気象予報データ102は、不確実性要素をさらに含む。例えば、予報は、温度、湿度、若しくは降水量、またはその組み合わせなどの項目について、特定の不確実性範囲内の予測を含んでよいが、必ずしもこれらの項目に限定されるものではない。不確実性は、中期から長期の気候変動性に関連付けられてよい。極端事象データ104は、1つまたは複数の期間および1つまたは複数の地理的地域に結び付けられた、例えば、ハリケーン、荒天、トルネード、熱波、寒波、台風、または他の極端な気象事象を含むが必ずしもこれに限定されない極端な事象の予報を含む。また、特徴再構成エンジン110に入力されるデータは、例えば、異なる地理的地域について、1時間ごと、日ごと、週ごと、月ごと、季節ごとまたは10年ごとベースの、例えば、温度、湿度、風速および風向、降水量、気圧並びに他の気象関連特徴の繰り返し測定による気象観測の集合を含む時系列データ形式の過去の気象観測データを含む過去の気象データ106を含んでいる。また、いくつかの実施形態において、将来の時系列データは、過去の時系列データとともに特徴再構成エンジン110に入力されてよい。
特徴再構成エンジン110に入力される気候予報データ102、104および過去の気象データ106(本明細書において「気候データ」とまとめて称されてよい)は、地理空間的特徴および時空間的特徴を含む。本明細書において使用されるとき、「地理空間的」という用語は、例えば地理的位置を指すものとして広義に解釈される。本明細書において使用されるとき、「時空間的」という用語は、例えば、空間(例えば、位置)および時間の両方に存在することを指すものとして広義に解釈される。例えば、本実施形態は、地理(米国、インド、アフリカなど)および期間(例えば、2000年から2021年まで)にわたって気候データをモデリングする。入力された気候データ102、104、106に関連付けられたいくつかの気候帯は、熱帯、乾燥、温帯、大陸、極地、沿岸、内陸、都市、田舎、海抜高度、農業、非農業、森林、住宅、商業のうちの1つまたは複数の指標を使用して定義されてよい。
非限定的な例において、入力された気候データ102、104若しくは106またはその組み合わせは、異なる地理および期間にわたる地理空間的、気候データシーケンスS={S,S,...,S}のセットを含んでよい。各シーケンスSは気候の時系列データを捕捉する。例えば、S={Ct1 ,Ct2 ,...,Ctk }とする。セットSは、位置および期間にわたる時空間データを含む。したがって、気候データ102、104若しくは106またはその組み合わせは、複数の空間成分と、複数の時間成分とを含む。
図1を参照すると、マスク気候予報層112、次期気候予報予測層114、および時空間位置埋め込み層115は、トランスフォーマ事前訓練層111によって、トランスフォーマベースのニューラルネットワーク機械学習モデルの複数のトランスフォーマを事前訓練するために使用される。本明細書において使用されるとき、「トランスフォーマ」は、入力データの一部の重要性を示差的に重み付けする深層学習モデルを指すものとして広義に解釈される。リカレントニューラルネットワーク(RNN:Recurrent Neural Network)と同様に、トランスフォーマは順次入力データを管理する。しかしながら、トランスフォーマは必ずしもデータを順番に処理するわけではなく、入力シーケンスにおける任意の位置に対してコンテキストを提供するメカニズムを利用している。コンテキストを識別することによって、トランスフォーマはデータシーケンスの先頭を、データシーケンスの最後より先に処理する必要がないため、RNNよりも多くの並列化を可能にして訓練時間を短縮することができる。本実施形態によって使用され得るトランスフォーマベースのニューラルネットワーク機械学習モデルの非限定的な例は、両方向からのコンテキストを使用し、トランスフォーマのエンコーダ部分を使用して各トークンに対する表現を学習するトランスフォーマからの双方向エンコーダ表現(BERT:Bidirectional Encoder Representations from Transformers)モデルである。
マスク気候予報層112は、気象予報データ102、極端事象データ104、または過去の気象データ106をマスキングしながら、ある時間枠について様々な地域に対する気候予測性を予め判断するための気候学データを使用する、気象予報データ102、極端事象データ104または過去の気象データ106に対するマスキング戦略を実施する。マスク気候予報層112は、どの程度の気象予報データ102、極端事象データ104または過去の気象データ106をマスキングするか(例えば、割合)、どの部分をマスキングするか、を判断する。マスキング戦略は、気象予報データ102、極端事象データ104、または過去の気象データ106の粒度(例えば、毎日、毎週、毎時など)に基づいて変化する。図2における気候データの機械学習モデルの訓練のブロック図211を参照すると、1つまたは複数の実施形態において、マスキングされた気候モデルは、第1のタイムスタンプTaに対する入力された気象予報データ102、極端事象データ104、または過去の気象データ106の部分(「タイムスタンプTaに対する気候データ」)および第2のタイムスタンプTbに対する入力された気象予報データ102または極端事象データ104の部分(「タイムスタンプTbに対する気候データ」)をマスキングして、それらのコンテキスト(例えば、周囲の気候データ)を使用してマスキングされた部分を予測しようと試みる。図2で述べたように、入力された気象予報データ102、極端事象データ104、または過去の気象データ106は、ラベルのない気候データのペアを含む。また、入力された気候データを日数に基づいた時系列で示したが、本実施形態はこれに限定されず、他の粒度(例えば、時間、週、月など)を使用することができる。
マスキングに加えて、トランスフォーマ事前訓練層111は、複数のトランスフォーマの事前訓練に関連して、ラベルのない気候データに対して次期気候予報予測技術を使用する。例えば、気象予報データ102、極端事象データ104、または過去の気象データ106からの気候データ点の様々なペアが、気候学および過去の気象データ106に基づいて生成される。例えば、所与のペアでは、所与の期間(例えば1週間)の前半の気候属性に、所与の期間(例えば1週間)の後半の気候属性が続く。次期気候予報予測層114は、期間の後半の気候属性を予測する。次期気候予報予測は、気候予報の関係を理解することができるモデルを訓練するために、次期気候予報をコーパスからのランダムな気候予報に置き換える。例えば、一部の時間で次期気候予報は元の次期気候予報であり、一部の時間で元の次期気候予報をコーパスからのランダムな気候予報に置き換える。所与の気候データシーケンスに対して、トランスフォーマ事前訓練層111は、マスキングされた気候データを予測し、気候データシーケンス順序(例えば、正しいシーケンスまたはシーケンスの順序を変更する必要があるかどうか)を判断し、次のタイムスタンプについての気候データを予測し(例えば、K個のタイムスタンプについての気候データが与えられ、次のタイムスタンプの気候データを予測し)ようと試みる。
図2を参照すると、トランスフォーマベースのニューラルネットワークの事前訓練に関連して、2つの異なるタイムスタンプTaおよびTbについての気候データは同時に管理される。例えば、気候データのペアは、ペアの各部分の間に分離[SEP]がある状態で機械学習モデルに入力される。入力の第1のトークンは[CLS]として表され、これは、事前訓練(「C」)の後、集約シーケンス表現に使用でき、分類に採用することができる。図2における「E」は、入力埋め込みを指す。[SEP]トークン前の第1のシーケンスは、異なる粒度での気候データの任意の連続したスパンであることができる。さらに、時空間位置埋め込み層115に関連してより詳細に説明されるように、トークンは、あるトークンが気候データのペアの第1の部分に属するか、または第2の部分に属するかを示す学習された埋め込みを有する。
図3に関連してより詳細に説明されるように、入力埋め込みは、例えば、位置埋め込みベクトル、季節性埋め込みベクトルおよび気候属性埋め込みベクトルを含む複数の埋め込みベクトルに基づく。
トランスフォーマベースのニューラルネットワークの事前訓練は教師なしであり、訓練データは、気候予報データ102、104若しくは過去の気象データ106またはその組み合わせを含む。マスク気候予報(図2において、マスク気候法「マスクCM209-1および209-2」)および次期気候予報予測(図2において、次期気候予測「NCP208」)は、訓練に使用する教師なしの方法である。1つまたは複数の実施形態において、入力された気候データが与えられると、マスク気候予報層112は、入力された予報のいくつかの部分をランダムにマスキングし、そのコンテキストを使用してマスキングされた気候トークンを予測する。
次期気候予報予測タスクにおいて、2つのタイムスタンプ(例えば、タイムスタンプTa、Tb)に対する気候予報データが与えられると、次期気候予報予測層114は、第2のタイムスタンプ(例えば、タイムスタンプTb)に対する気候予報データが第1のタイムスタンプ(例えば、タイムスタンプTa)に対する気候予報データに従っているか否かを予測する。訓練の際に、一定割合の時間で、第2のタイムスタンプの気候予報データは第1のタイムスタンプの気候予報データに正しく追従するが、残りの割合の時間で、第2のタイムスタンプの気候予報データはコーパスからのランダム予報である。マスク気候予報と次期気候予報予測タスクとは組み合わされ、トランスフォーマベースのニューラルネットワークモデルは組み合わせた損失関数130(図1を参照)で訓練される。損失関数130は、例えば、三重項損失関数、クロスエントロピ損失関数、再構成コスト損失関数、若しくはデータ損失関数、またはその組み合わせを含む。この訓練は、自己回帰モデルに依存し、自己回帰モデルが、次のタイムステップの値を予測するために、先行タイムステップの観測値を回帰アルゴリズムの入力として使用する時系列モデルである。
図2および図3を参照すると、時空間位置埋め込み315の一例では、入力埋め込み「E」205は、例えば、1つまたは複数の位置埋め込みベクトル(POS)316、1つまたは複数の季節性埋め込みベクトル(SEA)317、および1つまたは複数の気候属性(CA)埋め込みベクトル318を含む複数の埋め込みベクトルに基づく。図2および3における「TC」は、気候トークン203および303を指す。図4を参照すると、気候トークン403と、気候トークン403のうちの特定の1つ(TC)の表現400とが描かれている。本実施形態に従って、時間および空間情報は、各気候トークンに関連付けられている。気候トークン(TC,TC,TC,...,TC)は、異なる時間的および空間的粒度を使用して気候データを表すことができる。気候トークンTCは、過去の観測された気候データ、予報、ヒンドキャスト、またはそれらの組み合わせを含むことができる。1つまたは複数の実施形態において、季節性予報の確率的な性質から、一連の派生特徴(例えば、ヒストグラム、範囲、分位点など)が構築される。例えば、図6Aおよび図6Bは、入力に関連付けられる不確実性を含む、ヒストグラム601および602を使用する温度予報表現を示す図である。例えば、上述のように、気象予報データ102は、温度、湿度若しくは降水量、またはその組み合わせなどの項目について、特定の不確実性範囲内の予測を含んでよいが、必ずしもこれらの項目に限定されるものではない。ヒストグラム601および602に示すように、温度(例えば、10℃~11℃,11℃~12℃,...,19℃~20℃)は、異なる確率に関連付けられている。不確実性表現層113は、気候変動および破壊的事象のパラメータに対する不確実性スコアを生成する不確実性認識モデルを有する。
図6Aにおけるヒストグラム601は、複数のアンサンブルモデルによる気温予報の分布の一例を示している。各気候変数についての各アンサンブルは、気候モデルの初期条件を変化させて複数回のシミュレーションを行うことで作成され、予測は不確実である。例えば、欧州中距離気象予報センタ(ECMWF)の季節性スケール予報には、6ヶ月先までの気候属性ごとに50個のアンサンブルが入っており、毎月更新される。図6Bにおけるヒストグラム602は、ヒストグラムベースのアプローチを使用して複数のアンサンブルを分析しながら、温度変動の不確実性を表現する一例を示している。示されたパーセンテージ値はアンサンブル予報の一致度を表す。パーセンテージ値は、アンサンブル全体であまり一致しないため、不確実性が高いことを示している。このようにして、特徴再構成エンジン110の機械学習モデルを訓練しながら、気候予報の不確実性もエンコードすることができる。
図4に戻って参照すると、例えば最小、最大、平均などの関係性制約と、例えば毎時、毎日などの階層性制約とが気候トークン(TC)に組み込まれることがある。例えば、気候トークンTCの表現400において、気候トークンTCは、異なる時間における最低温度並びに最高温度若しくは湿度またはその組み合わせ、毎日の降水量値、平均風速、および大気汚染データ、交通データおよび最低温度、降水量並びに極端な事象のPDFを含む。マスク気候予報層112は、周囲の左右の気候トークン情報を利用して、マスキングされた気候トークンの潜在表現を学習する。特徴再構成エンジン110は、気候属性の予測可能性(例えば、温度と比較して降水量に対して低い)、および上述の関係性制約並びに階層性制約を考慮した代理損失関数130を最小化することによって、気候トークンを予測しようと試みる。
図2および図3に戻って参照すると、時空間位置埋め込み層115は、トランスフォーマベースのニューラルネットワーク機械学習モデルを学習しながら、埋め込み空間における時空間的特徴を含む異なる種類の埋め込みを捕捉する。位置埋め込み316は、2つの異なる種類の位置特性を捕捉する可能性がある:(i)位置固有、若しくは(ii)データ固有、またはその組み合わせである。位置固有の埋め込みは、グローバルポジショニングシステム(GPS:global positioning system)位置、都市、地域、州、データの解像度など、気候属性の位置を捕捉するが、必ずしもこれらに限定されるものではない。データ固有の埋め込みは、気候帯、農業地域対非農業地域、都市対田舎地域、住宅地対商業地など、データ固有の特徴を捕捉するが、必ずしもこれらに限定されるものではない。1つまたは複数の実施形態において、位置埋め込みは、座標系の関数である。
季節性埋め込み317は、気候データにおける時間的傾向固有の特徴に対応する。季節性埋め込みは、事前訓練状態にある間に気候表現を学習しながら、気候地理空間データの時間的傾向変化を学習することを容易にする。季節性埋め込みは、日中、毎週、季節、毎年など、複数の異なる粒度で指定することができるが、必ずしもこれらに限定されるものではない。気候属性埋め込み318は、地理空間的気候属性の潜在表現を捕捉する。1つまたは複数の実施形態において、タイムスタンプの埋め込みは、外生要因埋め込み、位置埋め込みおよび時間的埋込みの加算である。CLS埋め込み319は、特定の期間(例えば、日、週、月など)に対する気候属性埋め込みを生成するために、すべての気候トークン(TC)にわたる全体のベクトル表現の学習を指す。図2において、TおよびT'(207)は、タイムスタンプTaおよびTbの気候データのペアのトークンiの最終的な非表示表現を指す。
図1に戻って参照すると、気候を意識した予報エンジン120は、サプライチェーンにおける小売ノードでの需要予測およびリードタイム予報などの様々な下流アプリケーションの実施に関連して、特定の気候を意識した予報を行うために、訓練済みのトランスフォーマベースのニューラルネットワーク機械学習モデルの微調整を行うが、必ずしもこれらに限定されるものではない。1つまたは複数の実施形態において、同じ事前訓練済のパラメータは、入力層および出力層がどのように使用されるかに対応して修正された状態で、複数の下流タスクに使用される。トランスフォーマベースのニューラルネットワーク機械学習モデルは事前訓練済のパラメータで初期化され、気候を意識した予報エンジン120は望ましい下流タスクのためのパラメータを微調整する。例えば、入力では、気候データのペアの2つの部分は、タスクに応じて異なってよい。例えば、粒度、位置、気象データの種類(例えば、温度、降水量、極端な事象など)、一時的データなどは、所与の下流タスクに対応して変化することができる。出力では、トークン表現は、トークンレベルのタスクのための出力層に使用される。
特徴再構成エンジン110は、訓練済の機械学習モデルを使用して、気候を意識した予報エンジン120が異なるドメイン、地域若しくは時間枠、またはその組み合わせにわたる気候を意識した予報ユースケースを効率的に解決できるように、複雑な時空間気候データをベクトル表現にエンコードする。
本明細書に説明されたように、climate2vecモデルは、所与の位置のための気候データ(上述のS)の時系列、事前訓練済のトランスフォーマベースの気候モデルが与えられると、複数の地理的位置における気候データのd次元ベクトル表現が推定されるように、時空間位置エンコーディングと気候マスキング戦略とを使用する。気候を意識した予報エンジン120に関連して、climate2vecモデルは、下流タスクを解決するための別のモデルを学習するために使用できる事前訓練済みの気候埋め込みを生成する。
有利に、climate2vecモデルは、ラベル付けのデータセットを明示的に必要とせず、気候データの時空間的関係を潜在空間にエンコードすることができる。本実施形態は、下流タスクへの依存性を取り除き、気候データを使用して潜在表現をゼロから訓練することなく、下流タスクの解決に気候埋め込みを使用し、微調整を行うことができる。
図5における動作フロー500を参照すると、気候予報データ501は、特徴再構成エンジン110と同じまたは同様である特徴再構成エンジン510に入力される。特徴再構成エンジン510による気候予報データ501の分析後、特徴再構成エンジン510から出力された事前訓練済みの機械学習モデルおよびパラメータは、気候を意識した予報エンジン120と同じまたは同様である気候を意識した予報エンジン520によって使用されて、タスク固有の微調整を行う。気候を意識した予報エンジン520からの出力は、フィードフォワードネットワーク(FFN)580、および逆正規化および差分化層551および552に提供される。時系列ウィンドウデータ545は差分化層550に提供され、その出力は正規化層560および逆差分化層552に提供される。正規化層560からの出力は、FFN580および逆正規化層551に提供される。逆差分化層552からの出力は予測590を含む。図5における動作フロー500から理解できるように、第1段階の一部として、気候データのコンパクトな表現は、下流の予測タスクとは独立で特徴再構成エンジン510で学習される。第2段階において、気候を意識した予報エンジン520は、(第1段階の一部として学習された)事前訓練済のトランスフォーマベースの機械学習モデルを使用することによって気候埋め込み(例えば、climate2vec)を使用することによって下流タスクを解決し、下流問題の解決に使用される予測値590(例えば、小売需要、ピーク負荷など)をもたらす。
差分化および正規化層550および560は、例えば、過去の製品需要(例えば、売上)のような時系列特徴を効率的に表し、時系列間での転送を可能にするために使用される。差分化層550は時系列ウィンドウ内の相対的な傾向を捕捉するが、正規化層は、各データポイントをウィンドウ正規化し、各入力ウィンドウが複数の入力にわたって同等のスケールとなるよう変換することに役立つ。
差分化層550に関連して、時間ウィンドウw=(x1,...,xn)に対して、差分化されたウィンドウw_diffは、w_diff=(x2-x2,...,xi-x(i-1),...,xn-x(n-1))として定義される。x1を保存することで手順を反転させることができる。
正規化層560に関連して、時間ウィンドウw=(x1,...,xn)に対して、μwはその経験的平均を指す(σwはベッセルの補正なしの、その経験的標準偏差を指す)。正規化ウィンドウノルムは、w_norm=((x1-μw)/σw,...,(xi-μw)/σw,...,(xn-μw)/σw)と定義される。μwおよびσwを伝送することで正規化を反転させることができる。
一実施形態に従って、特徴再構成エンジン510は、気候マスキング技術を使用して事前訓練済のトランスフォーマベースのモデルを使用して、時空間気候特徴を効率的にエンコードするために使用される。1つまたは複数の実施形態において、特徴再構成エンジン510は、地球全体の気候データの汎用コーパスを使用して事前に訓練され、例えば、小売需要予測、再生可能エネルギー予測などの下流タスクのために、トランスフォーマモデルの最後の数層の重みを更新することによって微調整を必要とする場合がある。
FFN580は、下流タスクを解決するための特徴再構成エンジンを使用して生成されたウィンドウ正規化時系列特徴とコンパクトな気候特徴とを連結して訓練される。
本明細書に記載された上記および他の特徴を考慮すると、図7は、気候を意識した予報ユースケースを効率的に解決するために、時空間気候データをベクトル表現にエンコードする気候データモデリング方法論700を示す。
段階702において、複数の空間成分と複数の時間成分とを含む気候データは受信される。複数の空間成分は複数の地理的位置を含み、複数の時間成分は複数の期間を含む。複数の空間成分および複数の時間成分は異なる粒度を含む。気候データは1つまたは複数の気候属性をさらに含む。
段階704において、気候データのある部分はマスキングされる。気候データのマスキングされた部分の潜在表現は、気候データの1つまたは複数の隣接するマスキングされていない部分を利用することによって学習される。気候データのマスキングされた部分の潜在表現を学習する際に、1つまたは複数の制約を考慮する損失関数は最小化される。
段階706において、機械学習モデルは訓練され、訓練は気候データのマスキングされた部分に少なくとも部分的に基づく。機械学習モデルはトランスフォーマベースのニューラルネットワークを含む。
段階708において、気候データのベクトル表現は、機械学習モデルを介して生成される。ベクトル表現は、複数の地理的位置で気候データの1つまたは複数のd次元ベクトル表現を含み、ここで、dは整数である。
方法において、気候データの位置特性を捕捉するために、機械学習モデルの訓練に関連して位置埋め込みは実行される。位置埋め込みは、位置固有の埋め込み手順を有し、位置特性は、気候データに関連付けられた1つまたは複数の位置の位置情報を含む。また、位置埋め込みは、データ固有の埋め込みを含み得、位置特性は気候データに関連付けられた1つまたは複数の気候帯についての気候帯情報を含む。
方法において、気候データの時間的傾向特性を捕捉するために、機械学習モデルの訓練に関連して季節性埋め込みは実行される。また、気候属性埋め込みは、気候データの1つまたは複数の潜在空間表現を捕捉するために、機械学習モデルの訓練に関連して実行されてよい。
本実施形態に従って、1つまたは複数の企業固有の予測タスクを実行するために、機械学習モデルは微調整される。複数の時間成分は複数のタイムスタンプを有し、機械学習モデルは、複数のタイムスタンプの最後のタイムスタンプに続くタイムスタンプに関連付けられた気候の予測に使用される。
図1~図7に描かれた技術はまた、本明細書に記載されたように、システムを提供することを含み得、システムは、別個のソフトウェアモジュールを含み、別個のソフトウェアモジュールのそれぞれは、有形コンピュータ可読記録可能な記憶媒体上に具現化される。例えば、モジュールの全部(またはその任意のサブセット)は、同じ媒体上にあることができ、またはそれぞれ異なる媒体上にあることができる。モジュールは、図に示された、若しくは本明細書に記載された、またはその組み合わせである、構成要素のいずれかまたは全部を含むことができる。本発明の一実施形態において、モジュールは、例えば、ハードウェアプロセッサ上で実行することができる。次に、方法段階は、上述したように、システムの別個のソフトウェアモジュールを使用して実行され、ハードウェアプロセッサ上で実行され得る。さらに、コンピュータプログラム製品は、別個のソフトウェアモジュールを有するシステムのプロビジョニングを含む、本明細書に記載された少なくとも1つの方法段階の実行のために実施されるように適合されたコードを有する有形コンピュータ可読記録可能な記憶媒体を含むことができる。
さらに、図1~図7に描かれた技術は、データ処理システム内のコンピュータ可読記憶媒体に格納され、コンピュータ使用可能プログラムコードが遠隔データ処理システムからネットワークを介してダウンロードされたコンピュータ使用可能プログラムコードを含むことができるコンピュータプログラム製品を介して実施することができる。また、本発明の一実施形態において、コンピュータプログラム製品は、サーバデータ処理システムにおいてコンピュータ可読記憶媒体に格納されるコンピュータ使用可能プログラムコードを含むことができ、コンピュータ使用可能プログラムコードは、遠隔システムとのコンピュータ可読記憶媒体での使用のためにネットワークを介して遠隔データ処理システムへダウンロードされる。
本発明の一実施形態またはその要素は、メモリと、メモリに結合され、例示的な方法段階を実行するように構成された少なくとも1つのプロセッサとを含む装置の形態で実施することができる。
さらに、本発明の一実施形態は、コンピュータまたはワークステーション上で実行されるソフトウェアを利用することができる。図8を参照すると、そのような実装は、例えば、プロセッサ802、メモリ804、および、例えば、ディスプレイ806並びにキーボード808によって形成された入力/出力インタフェースを採用することができる。本明細書において使用されるとき、「プロセッサ」という用語は、例えば、マルチコアCPU、GPU、FPGA、もしくは1つまたは複数のASIC、またはその組み合わせなどの他の形態の処理回路を含むものなど、任意の処理デバイスを含むことを意図している。さらには、用語「プロセッサ」は、2つ以上の個別のプロセッサを指す場合がある。「メモリ」という用語は、例えば、RAM(ランダムアクセスメモリ)、ROM(リードオンリメモリ)、固定記憶装置(例えば、ハードディスク)、取り外し可能な記憶装置(例えば、ディスケット)、フラッシュメモリなどのプロセッサ(例えば、CPU、GPU、FPGA、ASICなど)に関連するメモリを含むことを意図するものである。また、本明細書において使用されるとき、「入力/出力インタフェース」という語句には、例えば、処理ユニットにデータを入力するメカニズム(例えば、マウス)、および処理ユニットに関連付けられた結果を提供するメカニズム(例えば、プリンタ)などが含まれることを意図している。プロセッサ802、メモリ804、ディスプレイ806およびキーボード808などの入力/出力インタフェースは、データ処理ユニット812の一部として、例えばバス810を介して相互接続することができる。例えば、バス810を介した適切な相互接続は、コンピュータネットワークとインタフェースするために提供され得るネットワークカードなどのネットワークインタフェース814、および媒体818とインタフェースするために提供され得るディスケットまたはCD-ROMドライブなどの媒体インタフェース816に提供されることもできる。
したがって、本明細書に記載されたような本発明の実施形態の方法論を実行するための命令またはコードを含むコンピュータソフトウェアは、関連メモリデバイス(例えば、ROM、固定メモリまたは取り外し可能メモリ)に格納され、利用する準備ができたときに、一部または全部を(例えば、RAMに)ロードしてCPUによって実行され得る。そのようなソフトウェアとしては、ファームウェア、常駐ソフトウェア、マイクロコードなどが含まれる可能性あるが、それに限定されない。
プログラムコードを記憶する若しくは実行する、またはその両方に好適なデータ処理システムは、直接的にまたは間接的にシステムバス810を介してメモリ要素804に結合される少なくとも1つのプロセッサ802を含む。メモリ要素には、プログラムコードの実際の実装時に採用されるローカルメモリ、バルクストレージ、および実装時にバルクストレージからコードを取得する回数を減らすために少なくとも一部のプログラムコードの一時的な格納を提供するキャッシュメモリを含むことができる。
入力/出力またはI/Oデバイス(キーボード808、ディスプレイ806、ポインティングデバイスなどを含むが、これらに限定されない)は、直接(バス810経由など)または介在するI/Oコントローラ(明確化のため省略)を介してシステムに結合されることができる。
ネットワークインタフェース814などのネットワークアダプタも、データ処理システムが、介在するプライベートネットワークまたはパブリックネットワークを通じて他のデータ処理システムまたはリモートプリンタまたは記憶装置に結合されることを可能にするために、システムに結合されることができる。モデム、ケーブルモデム、イーサネット(登録商標)カードは単に、現在利用可能なネットワークアダプタの種類のほんの一部である。
特許請求の範囲を含め、本明細書において使用されるとき、「サーバ」には、サーバプログラムを実行中の物理的なデータ処理システム(例えば、図8に示されるようなシステム812)が含まれる。そのような物理的なサーバは、ディスプレイおよびキーボードを含んでもよいし、含んでいなくてもよいことを理解されたい。
本発明は、任意の可能な技術詳細レベルでの統合におけるシステム、方法、若しくはコンピュータプログラム製品、またはその組み合わせになり得る。コンピュータプログラム製品は、プロセッサに本発明の態様を実行させるコンピュータ可読プログラム命令を有するコンピュータ可読記憶媒体(または複数の媒体)を含んでよい。
コンピュータ可読記憶媒体は、命令実行デバイスにより使用されるように命令を保持および記憶することができる有形デバイスであってよい。コンピュータ可読記憶媒体は、限定することはないが、例えば、電子記憶装置、磁気記憶装置、光学記憶装置、電磁記憶装置、半導体記憶装置、または前述したものの任意の好適な組み合わせでよい。コンピュータ可読記憶媒体のより具体的な例に関する完全に網羅されていないリストには、以下のものが含まれる。すなわち、ポータブルコンピュータディスケット、ハードディスク、ランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)、消去可能プログラム可能なリードオンリメモリ(EPROMまたはフラッシュメモリ)、スタティックランダムアクセスメモリ(SRAM)、ポータブルコンパクトディスクリードオンリメモリ(CD-ROM)、デジタル多用途ディスク(DVD)、メモリスティック、フロッピディスク、パンチカードまたは溝の中にあって記録された命令を有する隆起構造体等の機械的にエンコードされたデバイス、および前述したものの任意の好適な組み合わせである。コンピュータ可読記憶媒体は、本明細書において使用されるとき、電波若しくは他の自由に伝搬する電磁波、導波路若しくは他の伝送媒体を通して伝搬する電磁波(例えば、光ファイバケーブルを通過する光パルス)、またはワイヤを通して伝送される電気信号などの一時的な信号それ自体とは解釈されるべきではない。
本明細書に説明されるコンピュータ可読プログラム命令が、コンピュータ可読記憶媒体からそれぞれのコンピューティング/処理デバイスに、またはネットワーク(例えば、インターネット、ローカルエリアネットワーク、ワイドエリアネットワーク、若しくは無線ネットワーク、またはその組み合わせ)を介して外部コンピュータ若しくは外部記憶装置にダウンロードされてよい。ネットワークは、銅伝送ケーブル、光伝送ファイバ、無線伝送、ルータ、ファイアウォール、スイッチ、ゲートウェイコンピュータ、若しくはエッジサーバ、またはその組み合わせを含んでよい。各コンピューティング/処理デバイス内のネットワークアダプタカードまたはネットワークインタフェースは、ネットワークからコンピュータ可読プログラム命令を受信し、当該コンピュータ可読プログラム命令を、それぞれのコンピューティング/処理デバイス内のコンピュータ可読記憶媒体に格納するために転送する。
本発明の動作を実行するコンピュータ可読プログラム命令は、アセンブラ命令、命令セットアーキテクチャ(ISA)命令、機械命令、機械依存命令、マイクロコード、ファームウェア命令、状態設定データ、集積回路の構成データであってもよく、Smalltalk(登録商標)またはC++等のようなオブジェクト指向プログラミング言語、および「C」プログラミング言語または同様のプログラミング言語のような手続き型プログラミング言語を含む1つまたは複数のプログラミング言語の任意の組み合わせで記述したソースコードまたはオブジェクトコードであってもよい。コンピュータ可読プログラム命令は、ユーザのコンピュータ上で完全に実行されてもよいし、スタンドアロンソフトウェアパッケージとしてユーザのコンピュータ上で部分的に実行されてもよいし、部分的にユーザのコンピュータ上で、かつ、部分的にリモートコンピュータ上で実行されてもよいし、リモートコンピュータ若しくはサーバ上で完全に実行されてもよい。後者のシナリオでは、リモートコンピュータが、ローカルエリアネットワーク(LAN)またはワイドエリアネットワーク(WAN)を含む任意の種類のネットワークを介してユーザのコンピュータに接続されてもよいし、その接続が、(例えば、インターネットサービスプロバイダを使用してインターネットを介して)外部コンピュータに対して行われてもよい。いくつかの実施形態において、例えば、プログラム可能なロジック回路、フィールドプログラム可能なゲートアレイ(FPGA)、またはプログラム可能なロジックアレイ(PLA)を含む電子回路は、本発明の態様を実行するために、コンピュータ可読プログラム命令の状態情報を利用することによってコンピュータ可読プログラム命令を実行して、電子回路をパーソナライズしてよい。
本発明の態様が、本発明の実施形態による方法、装置(システム)、およびコンピュータプログラム製品のフローチャート図若しくはブロック図またはその組み合わせを参照して、本明細書に説明されている。フローチャート図若しくはブロック図、またはその両方の各ブロック、並びに、フローチャート図若しくはブロック図、またはその両方のブロックの組み合わせは、コンピュータ可読プログラム命令によって実装することができることが理解されよう。
これらのコンピュータ可読プログラム命令を、コンピュータのプロセッサまたは他のプログラム可能なデータ処理装置に提供して機械を作ることができ、その結果、コンピュータのプロセッサまたは他のプログラム可能なデータ処理装置を介して実行される命令が、フローチャート若しくはブロック図の、またはその両方のブロックで指定された機能/動作を実装するための手段を作成する。また、これらのコンピュータ可読プログラム命令は、コンピュータ可読記憶媒体に記憶されてよく、当該命令は、コンピュータ、プログラム可能なデータ処理装置若しくは他のデバイス、またはその組み合わせに対し、特定の方式で機能するよう命令することができ、それにより、命令を記憶したコンピュータ可読記憶媒体は、フローチャート若しくはブロック図、またはその両方の単数または複数のブロックで指定された機能/動作の態様を実装する命令を含む製品を含むようになる。
コンピュータ可読プログラム命令はまた、コンピュータ、他のプログラム可能なデータ処理装置、または他のデバイスにロードされ、コンピュータ、他のプログラム可能な装置、または他のデバイス上で一連の動作段階を実行させて、コンピュータ実装プロセスを生み出し得て、その結果、コンピュータ、他のプログラム可能な装置、または他のデバイス上で実行される命令が、フローチャート若しくはブロック図またはその両方のブロックで指定された機能/動作を実装する。
図面におけるフローチャートおよびブロック図は、本発明の様々な実施形態に係るシステム、方法、およびコンピュータプログラム製品の可能な実装のアーキテクチャ、機能、および動作を示す。この点で、フローチャートまたはブロック図内の各ブロックは、指定された論理機能を実装するための1つまたは複数の実行可能な命令を含む命令のモジュール、セグメント、またはある部分を表し得る。いくつかの代替実装形態では、ブロック内で示された機能が、図で示された順序以外で発生することもある。例えば、連続して示される2つのブロックは、実際には、1つの段階として実現されても、部分的にまたは全体的に時間重複する方法で同時に、実質的に同時に実行されてもよいし、または、ブロックは、場合によっては、関与している機能に依存して逆の順序で実行されてもよい。ブロック図若しくはフローチャート図またはその両方の各ブロック、並びに、ブロック図若しくはフローチャート図またはその両方のブロックの組み合わせが、指定された機能または動作を実行するか、または特殊用途ハードウェアとコンピュータ命令との組み合わせを実行する、特殊用途ハードウェアベースのシステムにより実装され得ることにも留意されたい。
本明細書に記載された方法のいずれもが、コンピュータ可読記憶媒体上に具現化された別個のソフトウェアモジュールを含むシステムを提供する追加の段階を含み得ることに留意されたい。モジュールは、例えば、本明細書に詳述した構成要素のいずれかまたはすべてを含み得る。次に、方法段階は、上述したように、システムの別個のソフトウェアモジュール若しくはサブモジュールまたはその組み合わせを使用して実行され、ハードウェアプロセッサ802上に実行されることができる。さらに、コンピュータプログラム製品は、別個のソフトウェアモジュールを有するシステムのプロビジョニングを含む、本明細書に記載された少なくとも1つの方法段階の実行のために実施されるように適合されたコードを有するコンピュータ可読記憶媒体を含むことができる。
任意の場合において、本明細書に示された構成要素は、例えば、特定用途向け集積回路(ASIC)、機能回路、関連メモリを有する適切にプログラムされたデジタルコンピュータなど、ハードウェア、ソフトウェア、またはそれらの組み合わせの様々な形態で実装され得ることが理解されるべきである。本明細書で提供される本発明の教示を考慮すると、関連技術の通常のスキルを有するものは、本発明の構成要素の他の実装を企図することができるであろう。
本開示はクラウドコンピューティングに関する詳細な説明を含むが、本明細書に記載される教示の実装はクラウドコンピューティング環境に限定されるものではないことを理解されたい。むしろ、本発明の実施形態は、現在知られているまたは将来開発される任意の他の種類のコンピューティング環境と組み合わせて実装することが可能である。
クラウドコンピューティングは、管理の労力またはサービスのプロバイダとの相互作用を最小限に抑えながら迅速に提供およびリリースできる構成可能なコンピューティングリソース(例えば、ネットワーク、ネットワーク帯域幅、サーバ、処理、メモリ、ストレージ、アプリケーション、仮想機械、およびサービス)の共有プールに対する便利なオンデマンドネットワークアクセスを可能にするための、サービス提供モデルである。このクラウドモデルは、少なくとも5つの特性、少なくとも3つのサービスモデル、および少なくとも4つの展開モデルを含み得る。
特性は以下のとおりである。
オンデマンドセルフサービス:クラウド利用者は、サービスプロバイダとの人的やり取りを必要とすることなく、必要に応じて自動的に、サーバ時間およびネットワークストレージなどのコンピューティング能力を一方的に提供することができる。
幅広いネットワークアクセス:様々な能力は、ネットワークを通じて利用可能であり、且つ標準メカニズムでアクセスできるので、異なる種類のシンクライアントプラットフォームまたはシッククライアントプラットフォーム(例えば、携帯電話、ラップトップ、およびPDA)による利用が促進される。
リソースプーリング:プロバイダのコンピューティングリソースは、マルチテナントモデルを使用して複数の利用者にサービスを提供するようにプールされており、異なる物理リソースおよび仮想リソースが需要に従って動的に割り当てられ、また再割り当てされる。利用者は一般に、提供されるリソースの正確な位置に対して制御または知識を有さないという点で位置の独立性という意味合いがあるが、より高い抽象化レベル(例えば、国、州、またはデータセンタ)では位置を特定できる場合がある。
速やかな拡張性:様々な能力を速やかに且つ伸縮自在に、場合によっては自動的に提供し、即座にスケールアウトすることも、速やかに解消して即座にスケールインすることもできる。利用者にとって、多くの場合、プロビジョニングに利用可能な能力は無制限に見え、任意の時間に任意の量で購入することができる。
測定されるサービス:クラウドシステムは、サービスの種類(例えば、ストレージ、処理、帯域幅、およびアクティブユーザアカウント)に対して適切な或る抽象化レベルでのメータリング能力を利用して、リソース使用を自動的に制御して最適化する。リソース使用量は、監視され、制御され、また報告されるので、利用されるサービスのプロバイダおよび利用者の両方に透明性を提供することができる。
サービスモデルは以下のとおりである。
サービスとしてのソフトウェア(SaaS):利用者に提供される能力は、クラウドインフラストラクチャ上で動作するプロバイダのアプリケーションを利用することである。アプリケーションは、ウェブブラウザ(例えばウェブベースの電子メール)などのシンクライアントインタフェースを通じて様々なクライアントデバイスからアクセス可能である。利用者は、ネットワーク、サーバ、オペレーティングシステム、ストレージ、または個々のアプリケーション機能さえも含む基礎となるクラウドインフラストラクチャを管理することも、制御することもないが、限定的なユーザ固有のアプリケーション構成設定は例外となる場合がある。
サービスとしてのプラットフォーム(PaaS):利用者に提供される能力は、プロバイダによりサポートされるプログラミング言語およびツールを使用して作成される、利用者が作成したまたは取得したアプリケーションをクラウドインフラストラクチャ上に展開することである。利用者は、ネットワーク、サーバ、オペレーティングシステム、またはストレージを含む基礎となるクラウドインフラストラクチャを管理することも、制御することもないが、展開したアプリケーション、および場合によってはアプリケーションをホストする環境設定に対する制御権を有する。
サービスとしてのインフラストラクチャ(IaaS):利用者に提供される能力は、処理、ストレージ、ネットワーク、および他の基礎的なコンピューティングリソースを提供することであり、利用者は、オペレーティングシステムおよびアプリケーションを含み得る任意のソフトウェアを展開して実行することができる。利用者は、基礎となるクラウドインフラストラクチャを管理または制御しないが、オペレーティングシステム、ストレージ、展開したアプリケーション、および、場合によっては、選択したネットワーキング構成要素(例えばホストファイアウォール)の限定的な制御に対する制御を有する。
展開モデルは以下のとおりである。
プライベートクラウド:クラウドインフラストラクチャは、一組織のためだけに運用される。プライベートクラウドは、その組織または第三者によって管理されてよく、オンプレミスまたはオフプレミスで存在してよい。
コミュニティクラウド:クラウドインフラストラクチャは、いくつかの組織によって共有され、関心(例えば、ミッション、セキュリティ要件、ポリシ、およびコンプライアンス考慮事項)を共有する特定のコミュニティをサポートする。コミュニティクラウドは、それらの組織または第三者によって管理されてよく、オンプレミスまたはオフプレミスで存在してよい。
パブリッククラウド:クラウドインフラストラクチャは、一般大衆または大規模な業界団体に利用可能になり、クラウドサービスを販売する組織により所有されている。
ハイブリッドクラウド:クラウドインフラストラクチャは、独自のエンティティのままであるが、データおよびアプリケーションポータビリティ(例えば、クラウド間の負荷バランスを取るためのクラウドバースティング)を可能にする標準化されたまたは独自技術によって結び付けられた2またはそれより多くのクラウド(プライベート、コミュニティ、またはパブリック)の複合である。
クラウドコンピューティング環境は、ステートレス性、低結合性、モジュール性、およびセマンティック相互運用性を重視したサービス指向型である。クラウドコンピューティングの中心には、相互接続されたノードのネットワークを含むインフラストラクチャがある。
ここで図9を参照すると、例示的なクラウドコンピューティング環境950が示されている。示されるように、クラウドコンピューティング環境950は、クラウド利用者によって使用されるローカルコンピューティングデバイス、例えば、パーソナルデジタルアシスタント(PDA)またはセルラ電話954A、デスクトップコンピュータ954B、ラップトップコンピュータ954C若しくは自動車コンピュータシステム954Nまたはその組み合わせなどが通信し得る1つまたは複数のクラウドコンピューティングノード910を含む。ノード910は、互いに通信し得る。それらは、本明細書の上記で説明されたようなプライベートクラウド、コミュニティクラウド、パブリッククラウド、若しくはハイブリッドクラウド、またはこれらの組み合わせなどの、1つまたは複数のネットワーク内で物理的にまたは仮想的にグループ化されてよい(図示せず)。これにより、クラウドコンピューティング環境950は、サービスとしてインフラストラクチャ、プラットフォーム、若しくはソフトウェア、またはその組み合わせを提供することが可能になり、こうしたもののために、クラウド利用者がローカルコンピューティングデバイス上にリソースを保持する必要はない。図9に図示されるコンピューティングデバイス954A-Nの種類は、専ら例示的なものを意図し、コンピューティングノード910およびクラウドコンピューティング環境950は、任意の種類のネットワーク若しくはネットワークアドレス指定可能な接続(例えば、ウェブブラウザを使用して)またはその両方を通して、任意の種類のコンピュータ化されたデバイスと通信可能であることを理解されたい。
ここで、図10を参照すると、クラウドコンピューティング環境950(図9)によって提供される機能抽象化層のセットが示される。図10に示された構成要素、層、および機能が、例示のみを意図するものであり、本発明の実施形態がそれに限定されることはないことを、前もって理解されるべきである。示されているように、以下の層および対応する機能が設けられている。
ハードウェアおよびソフトウェア層1060は、ハードウェアおよびソフトウェア構成要素を含む。ハードウェア構成要素の例は、メインフレーム1061と、RISC(Reduced Instruction Set Computer,縮小命令セットコンピュータ)アーキテクチャベースサーバ1062と、サーバ1063と、ブレードサーバ1064と、記憶装置1065と、ネットワークおよびネットワーキング構成要素1066とを含む。いくつかの実施形態において、ソフトウェア構成要素には、ネットワークアプリケーションサーバソフトウェア1067およびデータベースソフトウェア1068が含まれている。
仮想化層1070は、抽象化層を提供し、ここから、以下の例の仮想エンティティ、すなわち、仮想サーバ1071、仮想ストレージ1072、仮想プライベートネットワークを含む仮想ネットワーク1073、仮想アプリケーションおよびオペレーティングシステム1074、並びに仮想クライアント1075が提供され得る。
一例では、管理層1080は、以下に説明する機能を提供し得る。リソースプロビジョニング1081は、コンピューティングリソース、および、クラウドコンピューティング環境内でタスクを実行するために利用される他のリソースの動的な調達を提供する。メータリングおよび価格設定1082は、リソースがクラウドコンピューティング環境内で用いられる際のコスト追跡およびこれらのリソースの消費に対する課金または請求書作成を提供する。
一例では、これらのリソースは、アプリケーションソフトウェアライセンスを含み得る。セキュリティでは、クラウド利用者およびタスクの同一性確認、並びにデータおよび他のリソースの保護を行う。ユーザポータル1083は、利用者およびシステム管理者に対し、クラウドコンピューティング環境へのアクセスを提供する。サービスレベル管理1084は、要求されるサービスレベルが満たされるように、クラウドコンピューティングリソース割り当ておよび管理を提供する。サービスレベルアグリーメント(SLA)計画および履行1085は、SLAに従い将来の要件が予期されるクラウドコンピューティングリソースに対する事前取り決めおよび調達を提供する。
ワークロード層1090は、クラウドコンピューティング環境が利用され得る機能性の例を提供する。この層から提供され得るワークロードおよび機能の例には、本発明の1つまたは複数の実施形態に従って、マッピングおよびナビゲーション1091、ソフトウェア開発およびライフサイクル管理1092、仮想教室教育の提供1093、データ分析処理1094、トランザクション処理1095、および気候データモデリングおよび予報1096が含まれる。
本明細書で使用される用語は、特定の実施形態を説明することのみを目的としており、本発明を限定することを意図するものではない。本明細書において使用されるとき、コンテキストが明確にそうではないと指示しない限り、単数形「1つの(a)」、「1つの(an)」および「その(the)」は複数形を同様に含むように意図されている。「含む(comprises)」若しくは「含む(comprising)」またはその両方の用語は、本明細書で使用される場合、明示された特徴、段階、動作、要素若しくはコンポーネントまたはその組み合わせの存在を指定するが、他の特徴、段階、要素、コンポーネント若しくはそのグループまたはその組み合わせの存在または追加を除外するわけではないことをさらに理解されたい。
本発明の少なくとも1つの実施形態は、例えば、気候を意識した予報に関連して使用される時空間的な不確実性認識気候ベクトル表現を学習するためのフレームワーク(例えば、1つまたは複数のフレームワーク構成のセット)などの有益な効果を提供し得る。従来技術とは異なり、本実施形態は、入力された地理空間気候データの時空間変動を捕捉するために、複数の面からのコンテキスト的気候データに基づいて、深層双方向トランスフォーマモデルの事前訓練を行うことを提供する。
本実施形態は、有利には、深層学習のためのアテンション機構を可能にする。例えば、本実施形態は、マスキングされた気候モデルを使用して、深層トランスフォーマベースの双方向表現の事前訓練を可能にする。さらに、本実施形態は、climate2vecモデルの事前訓練のために、地理空間データ特性(例えば、位置およびデータ固有の特徴)を効率的に捕捉するための時空間位置埋め込みを利用する。
さらなる利点として、本実施形態は、気候を意識した需要予測、気候を意識したエネルギー予測、および他の企業関連タスクなど(必ずしもこれらに限定されない)の大規模な下流タスクの気候を意識したユースケースへのアプリケーションのためにclimate2vecモデルを微調整している。この微調整は、climate2vecモデルの最後のいくつかの出力層を、タスク固有の気候を意識した予報ユースケース用に再訓練することで行われる。
1つまたは複数の実施形態において、時空間気候予報の出力は、中長期季節性気候予報と過去の観測結果をエンコードされた表現を学習することにより、ニューラルネットワークを使用して表現および変換される。気候学(例えば、気候および時間の経過による変化の研究)は、モデル訓練に関連して、あるタイムスタンプ(例えば、時間、日、週など)の気候予報をマスキングして、本来の気候予報を予測するために使用される。時空間位置エンコーディングにより、複雑な時空間的気候変動および異なる地理空間的データ(例えば、大気汚染および交通データ)の特性を容易に捕捉することができる。
また、機械学習モデルは、季節性予報に関連付けられた不確実性情報(平均、分散、標準偏差、四分位分布など)を効率的に捕捉するために、階層性制約を施行することが有利に働く。
本発明の様々な実施形態の説明は、例示の目的で提示されるが、網羅的であることとも、開示される実施形態に限定されることも意図されていない。記載されている実施形態の範囲および趣旨から逸脱することなく、多くの修正および変形が当業者には明らかとなるであろう。本明細書において使用される専門用語は、実施形態の原理、市場で見られる技術の実用的な応用若しくはそれに対する技術的改善を最も良好に説明し、または、本明細書において開示される実施形態を他の当業者が理解することを可能にするように選択されている。

Claims (20)

  1. プログラム命令を備えるコンピュータプログラムであって、前記プログラム命令は、1つまたは複数のプロセッサに
    複数の空間成分と複数の時間成分とを含む気候データを受信する手順と、
    前記気候データの一部をマスキングする手順と、
    機械学習モデルを訓練する手順であって、前記訓練は、前記気候データの前記マスキングされた部分に少なくとも部分的に基づく、手順と、
    前記機械学習モデルを介して、前記気候データのベクトル表現を生成する手順と
    を実行させるように、前記1つまたは複数のプロセッサによって実行可能である、コンピュータプログラム。
  2. 前記複数の空間成分は複数の地理的位置を含み、前記複数の時間成分は複数の期間を含む、請求項1に記載のコンピュータプログラム。
  3. 前記ベクトル表現は、前記複数の地理的位置における前記気候データの1つまたは複数のd次元ベクトル表現を含む、請求項2に記載のコンピュータプログラム。
  4. 前記機械学習モデルは、トランスフォーマベースのニューラルネットワークを含む、請求項1に記載のコンピュータプログラム。
  5. 前記プログラム命令は、前記気候データの位置特性を捕捉するために、前記1つまたは複数のプロセッサに、前記機械学習モデルの前記訓練に関連して位置埋め込み手順をさらに実行させる、請求項1に記載のコンピュータプログラム。
  6. 前記位置埋め込み手順は、位置固有の埋め込み手順を有し、前記位置特性は、前記気候データに関連付けられた1つまたは複数の位置の位置情報を含む、請求項5に記載のコンピュータプログラム。
  7. 前記位置埋め込み手順は、データ固有の埋め込み手順を含み、前記位置特性は前記気候データに関連付けられた1つまたは複数の気候帯についての気候帯情報を含む、請求項5に記載のコンピュータプログラム。
  8. 前記プログラム命令は、前記気候データの時間的傾向特性を捕捉するために、前記1つまたは複数のプロセッサに、前記機械学習モデルの前記訓練に関連して季節性埋め込み手順をさらに実行させる、請求項1に記載のコンピュータプログラム。
  9. 前記プログラム命令は、前記気候データの1つまたは複数の潜在空間表現を捕捉するために、前記1つまたは複数のプロセッサに、前記機械学習モデルの前記訓練に関連して気候属性埋め込み手順をさらに実行させる、請求項1に記載のコンピュータプログラム。
  10. 前記プログラム命令は、1つまたは複数の企業固有の予測タスクを実行するために、前記1つまたは複数のプロセッサに、前記機械学習モデルを微調整する手順をさらに実行させる、請求項1に記載のコンピュータプログラム。
  11. 前記複数の空間成分および前記複数の時間成分は異なる粒度を含む、請求項1に記載のコンピュータプログラム。
  12. 前記気候データは1つまたは複数の気候属性をさらに含む、請求項1に記載のコンピュータプログラム。
  13. 前記プログラム命令は、前記1つまたは複数のプロセッサに、前記気候データの1つまたは複数の隣接するマスキングされていない部分を利用することによって、前記気候データの前記マスキングされた部分の潜在表現を学習する手順をさらに実行させる、請求項1に記載のコンピュータプログラム。
  14. 前記気候データの前記マスキングされた部分の前記潜在表現を学習することにおいて、前記プログラム命令は、前記1つまたは複数のプロセッサに、1つまたは複数の制約を考慮する損失関数を最小化する手順を実行させる、請求項13に記載のコンピュータプログラム。
  15. 前記複数の時間成分は複数のタイムスタンプを含み、前記プログラム命令は、前記1つまたは複数のプロセッサに、前記機械学習モデルを使用して前記複数のタイムスタンプのうちの最後のタイムスタンプに続くタイムスタンプに関連付けられた気候を予測する手順をさらに実行させる、請求項1から14のいずれか一項に記載のコンピュータプログラム。
  16. 複数の空間成分と複数の時間成分とを含む気候データを受信する段階と、
    前記気候データの一部をマスキングする段階と、
    機械学習モデルを訓練する段階であって、前記訓練は、前記気候データの前記マスキングされた部分に少なくとも部分的に基づく、段階と、
    前記機械学習モデルを介して、前記気候データのベクトル表現を生成する段階と
    を備え、
    プログラムコードを実行する際に、メモリに結合されたプロセッサを有する少なくとも1つの処理デバイスによって実行される、コンピュータ実装方法。
  17. 前記気候データの位置特性を捕捉するために、前記機械学習モデルの前記訓練に関連して位置埋め込みを実行する段階をさらに備える、請求項16に記載のコンピュータ実装方法。
  18. 前記気候データの1つまたは複数の隣接するマスキングされていない部分を利用することによって、前記気候データの前記マスキングされた部分の潜在表現を学習する段階をさらに備える、請求項16または17に記載のコンピュータ実装方法。
  19. メモリに結合されたプロセッサを有する少なくとも1つの処理デバイスを備える装置であって、プログラムコードを実行する際に、前記少なくとも1つの処理デバイスは、
    複数の空間成分と複数の時間成分とを含む気候データを受信し、
    前記気候データの一部をマスキングし、
    機械学習モデルを訓練し、前記訓練は、前記気候データの前記マスキングされた部分に少なくとも部分的に基づき、
    前記機械学習モデルを介して、前記気候データのベクトル表現を生成する
    ように構成されている、装置。
  20. 前記プログラムコードを実行する際に、前記少なくとも1つの処理デバイスは、前記気候データの1つまたは複数の隣接するマスキングされていない部分を利用することによって、前記気候データの前記マスキングされた部分の潜在表現を学習するようにさらに構成されている、請求項19に記載の装置。
JP2022187043A 2021-11-29 2022-11-24 コンピュータプログラム、コンピュータ実装方法、装置(気候データのモデリングのための機械学習の使用) Active JP7828696B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US17/536,477 2021-11-29
US17/536,477 US20230168411A1 (en) 2021-11-29 2021-11-29 Using machine learning for modeling climate data

Publications (2)

Publication Number Publication Date
JP2023080032A JP2023080032A (ja) 2023-06-08
JP7828696B2 true JP7828696B2 (ja) 2026-03-12

Family

ID=86446878

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022187043A Active JP7828696B2 (ja) 2021-11-29 2022-11-24 コンピュータプログラム、コンピュータ実装方法、装置(気候データのモデリングのための機械学習の使用)

Country Status (3)

Country Link
US (1) US20230168411A1 (ja)
JP (1) JP7828696B2 (ja)
CN (1) CN116187154A (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230086461A (ko) * 2021-12-08 2023-06-15 경희대학교 산학협력단 시계열 데이터의 이상 탐지 방법 및 이를 수행하기 위한 컴퓨팅 장치
US12225499B2 (en) * 2022-01-20 2025-02-11 Dell Products L.P. Adaptive sensor position determination for multiple mobile sensors
US20240370802A1 (en) * 2023-05-05 2024-11-07 Riskthinking.Ai Inc. System and method for physical climate risk indicators
US12561628B2 (en) * 2024-04-12 2026-02-24 Dell Products L.P. Branch and bound for combinatorial optimization in partially observable environments

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020166622A (ja) 2019-03-29 2020-10-08 三菱重工業株式会社 発電量予測装置、発電量予測方法、およびプログラム
WO2021007352A1 (en) 2019-07-08 2021-01-14 Indigo Ag, Inc. Crop yield forecasting models

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190367019A1 (en) * 2018-05-31 2019-12-05 TuSimple System and method for proximate vehicle intention prediction for autonomous vehicles
KR102875113B1 (ko) * 2020-11-12 2025-10-23 광주과학기술원 기온예측시스템
CN114912497A (zh) * 2021-01-29 2022-08-16 伊姆西Ip控股有限责任公司 用于模型更新的方法、设备和程序产品
US20230087777A1 (en) * 2021-09-20 2023-03-23 International Business Machines Corporation Machine learning system designs for patterning models with online and/or decentralized data

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020166622A (ja) 2019-03-29 2020-10-08 三菱重工業株式会社 発電量予測装置、発電量予測方法、およびプログラム
WO2021007352A1 (en) 2019-07-08 2021-01-14 Indigo Ag, Inc. Crop yield forecasting models

Also Published As

Publication number Publication date
JP2023080032A (ja) 2023-06-08
CN116187154A (zh) 2023-05-30
US20230168411A1 (en) 2023-06-01

Similar Documents

Publication Publication Date Title
JP7828696B2 (ja) コンピュータプログラム、コンピュータ実装方法、装置(気候データのモデリングのための機械学習の使用)
CN112116155B (zh) 基于智能决策的人口流动预测方法、装置及计算机设备
CN111247532B (zh) 利用多任务学习进行特征提取
US11386496B2 (en) Generative network based probabilistic portfolio management
CN111066021B (zh) 使用随机文档嵌入的文本数据表示学习
JP7372012B2 (ja) 所望の特性を有する材料を見つけるための機械学習フレームワーク
US10732319B2 (en) Forecasting solar power output
US11488083B2 (en) Risk failure prediction for line assets
US11423051B2 (en) Sensor signal prediction at unreported time periods
US12561555B2 (en) Network of tensor time series
US11810209B2 (en) Outage restoration time prediction during weather events and optimized solutions for recovery
CN117616436A (zh) 机器学习模型的联合训练
CN115688547A (zh) 模拟天气情景和极端天气预测
JP2023513885A (ja) 共有可能な位置を変更する方法、システム、プログラム
US20220342115A1 (en) Regionalized climate models using physics-informed neural networks
US20230177385A1 (en) Federated machine learning based on partially secured spatio-temporal data
US12321828B2 (en) Domain adaptation
US12353990B2 (en) Time-window based attention long short-term memory network of deep learning
JP2023543704A (ja) 機械学習を用いたシフトレフトトポロジ構築および情報拡張
US20230408726A1 (en) Weather forecasting using teleconnections
WO2023066073A1 (en) Distributed computing for dynamic generation of optimal and interpretable prescriptive policies with interdependent constraints
US11586705B2 (en) Deep contour-correlated forecasting
US20220374701A1 (en) Differentiable temporal point processes for spiking neural networks
US20230136564A1 (en) Agent assisted model development
US12242021B2 (en) Automatic weather event impact estimation

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20250415

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20260128

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20260210

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20260217

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20260226

R150 Certificate of patent or registration of utility model

Ref document number: 7828696

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150