JP2020531970A - スケーラブルな時空密度データの融合 - Google Patents

スケーラブルな時空密度データの融合 Download PDF

Info

Publication number
JP2020531970A
JP2020531970A JP2020508531A JP2020508531A JP2020531970A JP 2020531970 A JP2020531970 A JP 2020531970A JP 2020508531 A JP2020508531 A JP 2020508531A JP 2020508531 A JP2020508531 A JP 2020508531A JP 2020531970 A JP2020531970 A JP 2020531970A
Authority
JP
Japan
Prior art keywords
data
format
vector
grid
computer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020508531A
Other languages
English (en)
Other versions
JP7300797B2 (ja
Inventor
アルブレヒト、コンラート
フライターグ、マーカス、オリバー
ハーマン、ヘンドリック
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2020531970A publication Critical patent/JP2020531970A/ja
Application granted granted Critical
Publication of JP7300797B2 publication Critical patent/JP7300797B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/173Customisation support for file systems, e.g. localisation, multi-language support, personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Remote Sensing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Instructional Devices (AREA)
  • Processing Or Creating Images (AREA)

Abstract

【解決手段】データベース・システムは、第1のフォーマットされたデータを受信する電子ハードウェア・コントローラを有する処理サブシステムと、第2のデータ・フォーマットに対応する座標値を第1のフォーマットされたデータに付与する電子ハードウェア・コントローラを有する電子ファイル・フォーマッティング・サブシステムとを含む。ファイル・フォーマッティング・サブシステムは、第1のフォーマットされたデータを、第2のデータ・フォーマットに対応する座標値と互いに融合するデュアル・フォーマット・データ・ファイルを生成する。データベース・システムは、デュアル・フォーマット・データ・ファイルを記憶するように構成されたデータ記憶ユニットを有する記憶サブシステムをさらに含む。【選択図】図7

Description

本発明は、概して、データベース・システムに関し、より詳細には、データベース・システム内の大量のデータを処理することに関する。
空間データ・セットは、位置、関連付けられたタイムスタンプ、サイズ等などの、地理学的エンティティ(例えば、建物、湖、山、または市街地等)の特性を表現することができる。さらに、例えば、気温、風、速度等などの連続量を空間および時間的に索引付けすることができる。地理空間データは2つの種類、「ラスタ」および「ベクトル」に類別し得るであろう。前者は、例えば、衛星画像の光反射強度に関連付けられた対応する値を有する地理空間座標の(規則的な)グリッドに対応する。後者は、例えば、気温を測定する不規則に分布した気象観測所、所与の交通密度を有する道路、または所与の(平均)人口密度を有する郡などの、関連付けられた値を有する、単一の座標、または線状の、不規則な、開いた/閉じた座標の列を指す。
例えば、地理情報システム(Ggeographic information system、GIS)などの空間データ・システムは、異なる投影および解像度(ラスタ・データの場合)を有する地理または空間データ・セットを取得し、それらを重なり合うレイヤとして表示することができる。重なり合った位置合わせを得るために、通例、数回の計算反復およびデータ・セットの複数のレイヤ上への再投影が遂行される。その後、重ね合わされたデータ・セットが、膨大な量のデータで急速に満たすことができる、ハード・ディスク・ドライブ上、または関係データベース内に記憶される。このような大量のデータの分析、特に、それらの空間および時間的相互相関の分析は、時として、「ビッグ(地理空間)データ分析」と呼ばれる。
このようなデータの管理はフォーマットの相違と管理を必要とする大量のデータに起因する問題がある。したがって、上述の問題に対処することが当技術分野において必要とされている。
第1の態様から見ると、本発明は、データベース・システムであって、第1のフォーマットされたデータを受信する電子ハードウェア・コントローラを含む処理サブシステムと、第2のデータ・フォーマットに対応する座標値を第1のフォーマットされたデータに付与し、第1のフォーマットされたデータを、第2のデータ・フォーマットに対応する座標値と互いに融合するデュアル・フォーマット・データ・ファイルを生成する電子ハードウェア・コントローラを含む電子ファイル・フォーマッティング・サブシステムと、デュアル・フォーマット・データ・ファイルを記憶するように構成されたデータ記憶ユニットを含む記憶サブシステムと、を備えるデータベース・システムを提供する。
さらなる一態様から見ると、本発明は、データベース・システムを動作させるコンピュータ実施方法であって、コンピュータ実施方法が、電子ハードウェア・コントローラを含む処理サブシステムにおいて、第1のフォーマットされたデータを受信することと、電子ファイル・フォーマッティング・サブシステムを用いて、第2のデータ・フォーマットに対応する座標値を第1のフォーマットされたデータに付与することと、ファイル・フォーマッティング・サブシステムを用いて、第1のフォーマットされたデータを、第2のデータ・フォーマットに対応する座標値に相互に関連付けるデュアル・フォーマット・データ・ファイルを生成することと、データ記憶ユニット内において、デュアル・フォーマット・データ・ファイルを記憶することと、を含むコンピュータ実施方法を提供する。
さらなる一態様から見ると、本発明は、問い合わせ結果を生成するためにデータベース・システムを動作させるコンピュータ実施方法であって、本方法が、電子ハードウェア・コントローラを含むファイル・フォーマッティング・サブシステムを介して、第1のデータ・フォーマット(ラスタ)に対応する座標値を、第1のデータ・フォーマットとは異なる第2のデータ・フォーマット(ベクトル)を有する初期データ・セット内に含まれるデータ・オブジェクトに付与することと、ファイル・フォーマッティング・サブシステムを用いて、デュアル・フォーマット・データ・ファイルを生成するために、第2のデータ・フォーマットを有するデータ・オブジェクトを、第1のデータ・フォーマットに対応する座標値に相互に関連付けるデュアル・フォーマット・データ・ファイルを生成することと、データ記憶ユニット内において、デュアル・フォーマット・データ・ファイルを記憶することと、初期データ・セット内に含まれる少なくとも1つのデータ・オブジェクトのための問い合わせを受信することであって、少なくとも1つのデータ・オブジェクトが第2のデータ・フォーマットを有する、受信することと、データ記憶ユニット内に記憶された複数のデュアル・データ・ファイルから第2のデータ・フォーマットを有する少なくとも1つのデータ・オブジェクトを含む少なくとも1つのデュアル・フォーマット・データ・ファイルを識別することと、少なくとも1つのデュアル・フォーマット・データ・ファイル内に記憶された対応する座標値に基づいて少なくとも1つのデータ・オブジェクトを出力することと、を含む方法を提供する。
さらなる一態様から見ると、本発明は、問い合わせ結果を生成するためにデータベース・システムを動作させるコンピュータ実施方法であって、本方法が、電子ハードウェア・コントローラを含む処理サブシステムを用いて複数のラスタ・グリッド・セルを初期ベクトル・データ・セット上にオーバレイすることであって、各ラスタ・グリッド・セルがそれにグリッド座標のセットを付与されている、オーバレイすることと、電子ハードウェア・コントローラを実装されたファイル・フォーマッティング・サブシステムを介して、ベクトル・データ・セット内に含まれるベクトル・オブジェクトをオーバレイする少なくとも1つのラスタ・グリッド・セルに対応するグリッド座標の選択されたセット、およびベクトル・オブジェクトを識別するオブジェクト識別情報の両方を含む融合されたデータ・ファイルを生成することと、ベクトル・データ・セット内に含まれる少なくとも1つのターゲット・ベクトル・オブジェクトのための問い合わせを受信することと、電子ハードウェア・コントローラを含む処理サブシステムを介して、ターゲット・ベクトル・オブジェクトに基づいて基準ベクトル・オブジェクトを決定し、基準ベクトル・オブジェクトと複数のグリッド・セルとの間の比較に基づいてベクトル・オブジェクトに対応するグリッド座標の少なくとも1つのセットを決定する画像認識動作を遂行することと、グリッド座標の選択されたセットを記憶する融合されたデータ・ファイルからオブジェクト識別情報を出力することと、を含むコンピュータ実施方法を提供する。
さらなる一態様から見ると、本発明は、問い合わせ結果を生成するためにデータベース・システムを動作させるコンピュータ実施方法であって、本方法が、電子ハードウェア・コントローラを含む処理サブシステムを介して、複数のグリッド・セルを含むグリッド・システムを生成し、グリッド・セルを、第1のデータ・フォーマットを有する初期データ・セット上にオーバレイすることであって、各グリッド・セルが、第2のデータ・フォーマットを有し、グリッド座標のセットが付与されたデータを表現する、オーバレイすることと、電子ハードウェア・コントローラを含むファイル・フォーマッティング・サブシステムを介して、第2のデータ・フォーマットに対応する座標値を、第1のデータ・フォーマットを有する初期データ・セット内に含まれるデータ・オブジェクトに付与することと、デュアル・フォーマット・データ・ファイル内において、第1のフォーマットを有する選択されたデータ・オブジェクトの識別情報を、選択されたデータ・オブジェクトの上に重なる選択されたグリッド・セルに対応する座標の選択されたセットと共に記憶することと、第2のデータ・フォーマットを有する少なくとも1つのターゲット・データ・オブジェクトのための問い合わせを受信し、問い合わせに基づいて第1のデータ・フォーマットを有する基準データ・オブジェクトを生成することと、基準データ・オブジェクトと複数のグリッド・セルとの間の比較に基づいて第2のデータ・フォーマットを有する少なくとも1つのターゲット・データ・オブジェクトを出力することと、を含むコンピュータ実施方法を提供する。
さらなる一態様から見ると、本発明は、データベースを動作させるためのコンピュータ・プログラム製品であって、コンピュータ・プログラム製品が、処理回路によって可読であり、本発明のステップを遂行するための方法を遂行するための処理回路による実行のための命令を記憶するコンピュータ可読記憶媒体を備える、コンピュータ・プログラム製品を提供する。
さらなる一態様から見ると、本発明は、コンピュータ可読媒体上に記憶され、デジタル・コンピュータの内部メモリ内にロード可能であるコンピュータ・プログラムであって、プログラムがコンピュータ上で実行されると、本発明のステップを遂行するためのソフトウェア・コード部分を含む、コンピュータ・プログラムを提供する。
本発明の諸実施形態はデータベース・システムを対象とする。データベース・システムは、第1のフォーマットされたデータを受信する電子ハードウェア・コントローラを有する処理サブシステムと、第2のデータ・フォーマットに対応する座標値を第1のフォーマットされたデータに付与する電子ハードウェア・コントローラを有する電子ファイル・フォーマッティング・サブシステムとを含む。ファイル・フォーマッティング・サブシステムは、第1のフォーマットされたデータを、第2のデータ・フォーマットに対応する座標値と互いに融合するデュアル・フォーマット・データ・ファイルを生成する。データベース・システムは、デュアル・フォーマット・データ・ファイルを記憶するように構成されたデータ記憶ユニットを有する記憶サブシステムをさらに含む。本発明の諸実施形態は、データベース・システムを動作させるコンピュータ実施方法を対象とする。
データベース・システムを動作させる非限定的な例示的なコンピュータ実施方法は、電子ハードウェア・コントローラを含む処理サブシステムにおいて、第1のフォーマットされたデータを受信することと、電子ファイル・フォーマッティング・サブシステムを用いて、第2のデータ・フォーマットに対応する座標値を第1のフォーマットされたデータに付与することとを含む。本方法は、ファイル・フォーマッティング・サブシステムを用いて、第1のフォーマットされたデータを、第2のデータ・フォーマットに対応する座標値に相互に関連付けるデュアル・フォーマット・データ・ファイルを生成することと、データ記憶ユニット内において、デュアル・フォーマット・データ・ファイルを記憶することとをさらに含む。
問い合わせ結果を生成するために、データベース・システムを動作させる別の非限定的なコンピュータ実施方法が提供される。本方法は、電子ハードウェア・コントローラを含むファイル・フォーマッティング・サブシステムを介して、第1のデータ・フォーマット(ラスタ)に対応する座標値を、第1のデータ・フォーマットとは異なる第2のデータ・フォーマット(ベクトル)を有する初期データ・セット内に含まれるデータ・オブジェクトに付与することを含む。本方法は、ファイル・フォーマッティング・サブシステムを用いて、デュアル・フォーマット・データ・ファイルを生成するために、第2のデータ・フォーマットを有するデータ・オブジェクトを、第1のデータ・フォーマットに対応する座標値に相互に関連付けるデュアル・フォーマット・データ・ファイルを生成することをさらに含む。本方法は、データ記憶ユニット内において、デュアル・フォーマット・データ・ファイルを記憶することと、初期データ・セット内に含まれる少なくとも1つのデータ・オブジェクトのための問い合わせを受信することとをさらに含む。少なくとも1つのデータ・オブジェクトは第2のデータ・フォーマットを有する。本方法は、データ記憶ユニット内に記憶された複数のデュアル・データ・ファイルから第2のデータ・フォーマットを有する少なくとも1つのデータ・オブジェクトを含む少なくとも1つのデュアル・フォーマット・データ・ファイルを識別することと、少なくとも1つのデュアル・フォーマット・データ・ファイル内に記憶された対応する座標値に基づいて少なくとも1つのデータ・オブジェクトを出力することとをさらに含む。
問い合わせ結果を生成するためにデータベース・システムを動作させる別の非限定的なコンピュータ実施方法が提供される。本方法は、電子ハードウェア・コントローラを含む処理サブシステムを用いて複数のラスタ・グリッド・セルを初期ベクトル・データ・セット上にオーバレイすることを含む。各ラスタ・グリッド・セルはそれにグリッド座標のセットを付与されている。本方法は、電子ハードウェア・コントローラを実装されたファイル・フォーマッティング・サブシステムを介して、ベクトル・データ・セット内に含まれるベクトル・オブジェクトをオーバレイする少なくとも1つのラスタ・グリッド・セルに対応するグリッド座標の選択されたセット、およびベクトル・オブジェクトを識別するオブジェクト識別情報の両方を含む融合されたデータ・ファイルを生成することをさらに含む。本方法は、ベクトル・データ・セット内に含まれる少なくとも1つのターゲット・ベクトル・オブジェクトのための問い合わせを受信することをさらに含む。本方法は、電子ハードウェア・コントローラを含む処理サブシステムを介して、ターゲット・ベクトル・オブジェクトに基づいて基準ベクトル・オブジェクトを決定し、基準ベクトル・オブジェクトと複数のグリッド・セルとの間の比較に基づいてベクトル・オブジェクトに対応するグリッド座標の少なくとも1つのセットを決定する画像認識動作を遂行することをさらに含む。本方法は、グリッド座標の選択されたセットを記憶する融合されたデータ・ファイルからオブジェクト識別情報を出力することをさらに含む。
問い合わせ結果を生成するためにデータベースを動作させる別の非限定的なコンピュータ実施方法が提供される。本方法は、電子ハードウェア・コントローラを含む処理サブシステムを介して、複数のグリッド・セルを含むグリッド・システムを生成し、グリッド・セルを、第1のデータ・フォーマットを有する初期データ・セット上にオーバレイすることを含む。各グリッド・セルは、第2のデータ・フォーマットを有し、グリッド座標のセットが付与されたデータを表現する。本方法は、電子ハードウェア・コントローラを含むファイル・フォーマッティング・サブシステムを介して、第2のデータ・フォーマット(ラスタ)に対応する座標値を、第1のデータ・フォーマット(ベクトル)を有する初期データ・セット内に含まれるデータ・オブジェクトに付与することをさらに含む。本方法は、デュアル・フォーマット・データ・ファイル内において、第1のフォーマットを有する選択されたデータ・オブジェクトの識別情報を、選択されたデータ・オブジェクトの上に重なる選択されたグリッド・セルに対応する座標の選択されたセットと共に記憶することをさらに含む。本方法は、第2のデータ・フォーマットを有する少なくとも1つのターゲット・データ・オブジェクトのための問い合わせを受信し、問い合わせに基づいて第1のデータ・フォーマットを有する基準データ・オブジェクトを生成することをさらに含む。本方法は、基準データ・オブジェクトと複数のグリッド・セルとの間の比較に基づいて第2のデータ・フォーマットを有する少なくとも1つのターゲット・データ・オブジェクトを出力することをさらに含む。
別の非限定的実施形態は、データベース・システムを動作させるためのコンピュータ・プログラム製品を提供する。コンピュータ・プログラム製品は、プログラム命令が具現化されたコンピュータ可読記憶媒体を備える。プログラム命令は、処理回路に、電子ハードウェア・コントローラを含む処理サブシステムへのフォーマットされたデータを受信することと、電子ファイル・フォーマッティング・サブシステムを用いて、ファイル・フォーマッティング・サブシステムを介して、第2のデータ・フォーマットに対応する座標値を第1のフォーマットされたデータに付与することと、を行わせる処理回路によって実行可能である。命令は、ファイル・フォーマッティング・サブシステムを用いて、第1のフォーマットされたデータを、第2のデータ・フォーマットに対応する座標値に相互に関連付けるデュアル・フォーマット・データ・ファイルを生成し、データ記憶ユニット内において、デュアル・フォーマット・データ・ファイルを記憶するためにさらに実行可能である。
本発明の技法を通じてさらなる技術的特徴および利点が実現される。本発明の諸実施形態および諸態様が本明細書において詳細に説明され、クレームされている主題の一部と考えられる。さらなる理解のために、詳細な説明および図面を参照されたい。
本明細書に記載される独占権の詳細は、本明細書の最後の請求項において具体的に指摘され、明確にクレームされる。本発明の1つまたは複数の実施形態の、上述の、および他の特徴および利点は、添付の図面と併せて以下の詳細な説明から明らかである。
本発明の諸実施形態に係るデータベース・システムのブロック図を示す。 本発明の諸実施形態に係る、空間対時間問い合わせのための時空密度(ρf)と時空「体積」(dΔt’)との間の相互関係を示す概略図を示す。 本発明の諸実施形態に係る、フィルタリングされたラスタ・データをベクトル・データと互いに融合するプロセスを示す図である。 本発明の諸実施形態に係る、データベース・システムによって、ジオリファレンスされたラスタ・データから「ベクトル化されたラスタ・データ」を得るために遂行される動作を示すプロセス・フロー図を示す。 図4の続きの図である。 本発明の諸実施形態に係る、データベース・システムによって、画像認識分析に基づいて、ジオリファレンスされたラスタ・データから「ベクトル化されたラスタ・データ」を得るために遂行される動作を示すプロセス・フロー図を示す。 図6の続きの図である。 本発明の諸実施形態に係る、データベース・システムによって、ジオリファレンスされたベクトル・データから「ラスタ化されたベクトル・データ」を得るために遂行される動作を示すプロセス・フロー図を示す。 図8の続きの図である。 本発明の諸実施形態に係るクラウド・コンピューティング環境を示す図である。 本発明の諸実施形態に係る抽象化モデル・レイヤを示す図である。 本発明の諸実施形態に係る通信装置を示す図である。
本明細書において示される図は例示である。本発明の範囲から逸脱することなく、図、または図に記載された動作に対する多くの変形が存在し得る。例えば、アクションを異なる順序で遂行するがことができるか、またはアクションを追加、削除、もしくは変更することができる。また、用語「結合される(coupled)」およびその変形は、2つの要素の間の通信経路を有することを記述し、要素間に介在要素/接続を有しない要素間の直接接続を含意しない。これらの変形は全て本明細書の一部と考えられる。
添付の図面、および本記載の諸実施形態の以下の詳細な説明において、図に示される様々な要素は2または3桁の参照符号を与えられている。わずかな例外を除いて、各参照符号の左端の桁(単数または複数)は、その要素が最初に示されている図に対応する。
簡潔にするために、データベース処理および分析に関連する従来の技法は本明細書において詳細に説明される場合もあり、説明されない場合もある。さらに、本明細書において説明される様々な動作およびプロセス・ステップは、本明細書において詳細に説明されていない追加のステップまたは機能性を有するより包括的な手順またはプロセス内に組み込むことができる。例えば、画像認識などのいくつかのデータ分析動作はよく知られており、そのため、簡潔にするために、多くの従来のステップは本明細書において手短に説明されるのみとなるか、またはよく知られたプロセスの詳細を与えることなく、完全に省略されることになる。
次に、本発明の様々な非限定的実施形態の諸態様により具体的に関連する技術の概要に目を向けると、衛星、気象観測所、光検知測距(Light Detection and Ranging、LiDAR)スキャニング、測量等などの様々なソースからの地理空間情報のグローバル分析は、膨大な量のデータ(例えば、テラバイト〜ペタバイトのデータ)の処理を必要とする。例えば、アメリカ航空宇宙局(National Aeronautics and Space Administration)の(NASAの)Landsat8衛星は、1日当たり半テラバイトのオーダーのデータを生成する。ヨーロッパ南天天文台(European Southern Observatory)の(ESOの)Sentinel−2衛星プログラムは、画像解像度が10メートルのピクセル密度を生成することができ、これは、約10倍増大した空間解像度に対応する。WorldView−4などのデジタルグローブ(R)の衛星は、サブメーター・レベルに至るまでの画像を提供することによって、空間解像度をおおよそ100倍増大させることができる。
空間情報は伝統的にラスタ・ベースのデータとして得られ、ベクトル・フォーマットを伴う。ラスタ・データの例としては、限定するものではないが、気象データ、気温データ、土壌データ、地形データ、および電磁スペクトルの赤色、緑色、青色、もしくは近赤外線域の強度が挙げられる。ラスタ・データは、地理的領域を、セルの規則的なグリッドに分割された表面として表現することができる。ラスタ・モデルは、航空写真、衛星画像、化学濃度面(surface of chemical concentrations)、または標高面(elevation surface)の場合のように、連続的に変化するデータを記憶するために有用である。
ベクトル・データは、ポイント、ライン、およびポリゴンを用いて地理的領域内のデータを表現する。ベクトル・モデルは、国境、土地区画、および街路/道路などの、不連続の境界を有するデータを記憶するために有用である。
地理的または空間的セットのためのソース/オリジナル・データ(例えば、個々のデータ・レイヤ)は無数のデータベース上でホストされ、各データベースはその固有の問い合わせ言語およびデータ検索ツールを有する。重ね合わされた空間データ・セットとして記憶されると、その後の問い合わせを用いて個々のレイヤを探索し、再統合することが困難になり得る。多くの場合、データ検索は、かなり時間のかかるプロセスをもたらすか、またはさらには、発見不可能にさえなり、したがって、新たな問い合わせが遂行可能になるまでにかなりの準備を必要とする。
例えば、土壌の深度に関して分解された豊富な属性数を包含する、指定されたデータ抽出境界(例えば、ポリゴン状境界)を包含する、米国(United States、U.S.)の全国土壌データベース(SSURGO)を考える。データベースの純粋なファイル・サイズはおよそ70ギガバイト(GB)である。土壌特性にアクセスするために、データ・テーブルが構造化問い合わせ言語(Structured Query Language、SQL)ベースの方式で結合されるが、これは、結合されたテーブルに関する情報の指数関数的増大をもたらし得る。別の例では、米国政府、およびOpenStreetMapのような群衆ベースのプロジェクトは、人的インフラストラクチャに関するセンサス関連情報およびベクトル・データを頻繁に公開している。
伝統的なデータまたは文書の発見はキーワード問い合わせ探索に頼る。キーワード問い合わせ探索および検索プロセスは、通例、キーワードの短いセットを提示し、問い合わせへの関連性(多くの場合、人気およびページ・ランキングに基づく)の順にランク付けされた、文書またはデータ・セットのリストを返すことを伴う。しかし、データベース内に包含されるデータ量が増大するに従い、返される探索結果の範囲(scope)は減少する。それゆえ、目標データまたは文書を識別することができるまでに、探索結果を絞るためにさらなる分析が遂行されなければならない。
幅広い量のデータを包含するデータベースからのデータの発見および抽出を容易にするために、質問応答(Question answering、QA)システムが開発された。これらのQAシステムは、要求されたデータを識別し、抽出するために、限定するものではないが、自然言語処理、情報検索、知識表現、自動推論、および機械学習技術を含む高度のデータ処理技法を適用する。上述された伝統的な問い合わせ探索と異なり、QAシステムは、自然言語で表された入力された質問を受信し、質問をさらに詳細に理解しようと務め、質問への的確な応答を返す。こうして、その後のデータ分析が大きく低減される。例えば、入力された質問表現「どの土地が、所与の作物(例えば、大豆)を栽培するために、法律的に(例えば、センサス・データ)、および物理的に(例えば、土壌データ、気象データ等)適格ですか?」に応答するために、入力された質問に関連付けられたベクトル・データおよびラスタ・データが互いに融合される、すなわち、レイヤ化される。
次に、本発明の諸態様の概要を参照すると、本発明の1つまたは複数の実施形態は、例えば、IBM(R)物理分析統合データ・リポジトリおよびサービス(Physical Analytics Integrated Data Repository and Service、PAIRS)などの、ビッグ・データ分析プラットフォームを利用し、ベクトル・データおよびラスタ・データを互いに融合することができる「時空密度」データベース・システムを提供することによって、従来技術の上述の欠点に対処する。データベース・システムは、地理空間および時間に基づいてビッグ・データを索引付けするように構成されている。IBMは、全世界の多くの管轄体において登録されたInternational Business Machines Corporationの商標である。このように、時空密度システムは、ラスタ・データおよびベクトル・データに関するクロス・レイヤ問い合わせをスケーラブルにサポートすることができる。本発明の1つまたは複数の非限定的実施形態では、地理空間システムは、Apache(TM) Hadoop(R)によって提供されているHadoop分散ファイル・システム(Hadoop Distributed File System、HDFS(TM))などの分散ファイル・システムを実施する。分散ファイル・システムはデータ・ファイルを大きなブロックに分割し、それらをクラスタ内のノードにわたって分散させることができ、パッケージ化されたコードをノード内に転送し、データを並列に処理することができ、これにより、ノードが、それらがアクセスすることができるデータを操作することができるデータ局所性を活かす。したがって、分散ファイル・システムは、MapReduce/Apache(TM) Hadoop(R)、およびApache Hbase(TM)、およびApache Spark(TM)に少なくとも部分的に基づいて、個々のラスタ問い合わせを提示してラスタ・データを得るとともに、個々のベクトル問い合わせを提示してベクトル・データを得ることも可能にする。
本発明の1つまたは複数の非限定的実施形態に係るデータベース・システムはまた、ラスタ・データおよびベクトル・データ・フォーマットを融合する能力を有する。ラスタ・データおよびベクトル・データの融合は、両方のデータ・フォーマット形式(すなわち、ラスタ・フォーマットおよびベクトル・フォーマット)の複数のデータ・セットにわたる分析を遂行するためのリンクを提供する。例えば、初期ラスタ・データ・セットを分析してベクトル化し、「ベクトル化されたラスタ」データの結果を生成することができる。換言すれば、初期ラスタ・データ・セットに基づいてベクトル・データの解を生成することができる。同様に、初期ベクトル・データ・セットを分析してラスタ化し、「ラスタ化されたベクトル」データの結果を生成することができる。すなわち、初期ベクトル・データ・セットに基づいてラスタ・データの解を生成することができる。したがって、膨大な量のデータを包含するデータベースから両方のデータ・フォーマットに従ってレイヤ化された地理空間データを抽出する能力を有する独自のデータ・エコシステムがもたらされる。
次に、本発明の諸態様のより詳細な説明を参照すると、図1は、本発明の諸実施形態に係る時空密度データベース・システム100を示す。データベース・システム100は、記憶サブシステム102と、処理サブシステム104と、アプリケーション・サブシステム106と、ファイル・フォーマッティング・サブシステム108とを含む。サブシステム102、104、106および108の数および配置は例として示されており、データベース・システム100を、サブシステムのいかなる特定の配置または数あるいはその両方に限定することも決して意図されていない。
記憶サブシステム102は分散ファイル・システム110および分散データベース112を含む。記憶サブシステム102は、様々なファイル・フォーマットによるデータをロードまたは記憶するようファイル・フォーマッティング・サブシステム108と連動して動作することができる。本発明の1つまたは複数の実施形態では、ASCIIファイル生成器がASCIIベース・ファイルを生成する。プレーンASCIIテキスト・ファイルを直接用いる代わりに、データのアップロードは、プレーンASCIIテキスト・ファイルをHDFS(TM)110内の既存のファイルに付加することによって実施される。ASCIIベース・ファイルは列編成のApache Parquet(TM)ファイル・フォーマット生成器111を介して列ベースのデータ・ファイルに変換することができ、HDFS(TM)フレームワークに従ってApache Parquet(TM)ファイルからデータ・フレームをロードすることができる。加えて、Apache Parquet(TM)ファイルは、ベクトル・データに対するさらなるデータ分析を遂行することを可能にする、PySpark(TM)によって利用されるSQL問い合わせを用いて直接アクセスすることができる。
分散ファイル・システム110は、例えば、複数のサーバ上に同時に搭載されることによって共有され得るクラスタ化ファイル・システムを含む。本発明の1つまたは複数の実施形態では、分散ファイル・システム110は、Apache(TM) Hadoop(R)アーキテクチャ・フレームワークに係るHDFS(TM)として実施される。
例えば、HDFS(TM)に従って分散ファイル・システム110を実施するときには、ファイル名規約「<ma>_<n>−<Z>−<t>.pvd」に従って、対応するHDFSファイルが作成される。ここで、拡張子「pvd」は、新しく定義された「PAIRS Vector Data」ファイル形式、以下、略して「PVD」、を指示する。パラメータ「<ma>」は、我々が全てのベクトル・データを分類する主属性、例えば、街路、住宅、ツイート等を表す。パラメータ「<n>」は所与の「仮想」解像度レイヤを表す。パラメータ「<Z>」は地理空間領域のための索引の役割を果たす。パラメータ「<t>」は、Unix(R)エポック・タイム、例えば、1970年1月1日午前0時(0時間、0分、0秒)からの経過秒数によって、グリッド化されたタイムスタンプ(t’)を表す。厳密なタイムスタンプtを有するデータを、例えば、tが時間間隔[t’,t’+Δt’)以内にあるように、辞書パラメータ(式1参照)として記憶することができる。時間間隔長Δt’は、データの種類に応じて定められるべきパラメータである。
本発明の1つまたは複数の実施形態では、パラメータ「<Z>」は、所与の解像度レイヤ<n>における地理空間索引(Zn)の(符号なしの)整数表現をもってこれに代えることができる。解像度レイヤ<n>における地理空間索引(Zn)は、緯度−経度空間(x,y)における地理空間マス目を規定する。すなわち、所与の解像度(d)、例えば「0.5度の経度/緯度」について、xn<x<xn+d、およびyn<y<yn+dである。別の言い方をすれば、各Znは2つの地理空間座標(xn,yn)に一意的に関連付けることができ、索引nは、対応する一意の解像度dを指定する。それゆえ、ベクトル・データを、以上において指定されたHDFSファイル(すなわち、<ma>_<n>−<Z>−<t>.pvd)内に記憶することによって、融合されたラスタ−ベクトル相互関係を確立することができる。
本発明の1つまたは複数の実施形態によれば、ASCIIベースのPVDテキスト・ファイルの各ラインはベクトル・データをpythonオブジェクトとして表現する。それゆえ、ASCIIベースのPVDテキスト・ファイルは以下のデータ構造に従う:
R={「i」:id,「g」:P,「a」:A,「q」:Q} [式1]
パラメータ「R」はPython辞書パラメータを参照する。記憶を低減するために単一文字が用いられる。パラメータ「i」はベクトル・データ識別子を表す。パラメータ「g」は地理空間ベクトル・データを表す。パラメータ「a」は任意選択的なベクトル・データ属性を表す。パラメータ「q」は、例えば、4分木構造データ・パラメータなどの、任意選択的なツリー・データ構造パラメータを表す。パラメータ「id」は、併合する複数のファイルの複製を識別する固有オブジェクト識別子である。
PVDテキスト・ファイルは、Znの定義に基づいてベクトル・データを分散ファイル・システム110内に記憶するための異なる選択肢を提供する。第1の選択肢によれば、Znに関連付けられた「仮想」領域/マス目と重なり合い、付与されたタイムスタンプが、PVDファイル名パラメータ<t>によって表されるグリッド化されたタイムスタンプt’の時間間隔[t,t+Δt’)内に含まれる全ての境界抽出形状(例えば、ポリゴン)がPVDテキスト・ファイル内に記憶される。この手順は境界抽出形状を複製する。第2の選択肢によれば、データが仮想領域/マス目の境界に対して切り取られる(cropped)。どちらの場合にも、この動作を逆にするために、式1からの固有idが必要とされる。
第1の選択肢は、典型的な面積(a)と境界ボックス面積(a)との比が1に近い、すなわち、a/a≒1である、ポリゴン状抽出境界のために有用である。さらに、面積の分散(δa)が緩やかであるか、または少なくとも、ポリゴンの面積の平均(a’)と比べてより小さい、すなわちδa/a’<1でなければならない。これは、通例、例えば、住宅および建物などの組織的な定着物形状に対して当てはまる。
例えば、平方単位(例えば、ft)で測定された住宅面積などの組織的定着物面積(a’)が速度(f)で建設されていると仮定し、ライン数(N)による最大ファイル・サイズ制限を所与とすると、解像度レイヤ「<n>」を次式に従って決定することができる:
=a’・N/f・Δt’ [式2]
第1の選択肢のためのパラメータが未知であるときには、第2の選択肢を用いることができる。一例として、山野を曲がりくねって進む道路を挙げることができる。最悪の場合には、それは所与の解像度レイヤ<n>において全てのZnを相互に連結させ、これにより、複製が最大になる。上述された選択肢2を用いると、複製が作成されないよう、全てのベクトル・データが切断される。しかし、複数のZnを包含する領域を問い合わせた際の元のライン/ポリゴンが再構築されなければならない。この目的を達成するために、「id」パラメータが複製データ要素を識別することができる。
本発明の1つまたは複数の実施形態では、単位面積当たりの平均または推定オブジェクト数を決定するために密度データを利用することができる。密度データは次式に従って決定することができる:
ρ=N/d f・Δt’ [式3]
住宅または建物を表現するデータの観点から見ると、例えば、住宅は通例、空間的に重なり合わないと仮定すると、ポリゴンの面積(a’)は、逆密度、すなわち、住宅面積当たり1軒の住宅、として識別することができる。
ラスタ・データとベクトル・データとの間のリンクを確立すると、ベクトル・データの地理空間分割/索引付けがもたらされる。このように、分析されるべきデータ量が低減され、その一方で、所与の時間間隔内における関心のある地理空間領域をももたらす。本質的に、ファイル名規約は、次式のように表すことができる時空体積を規定する:
Δt’ [式4]
後述されるとおりの最適なシステム性能を確立する適切なPVDファイル・サイズ(NSに比例)の制約の下で、t’およびdnを、それらの積が一定にとどまるように変化させることができる。例えば、ρおよびfを所与とすると、ベクトル・データに対応する固定された時空密度を生成することができ、今度はこれを用いて、次式に基づいて最大ファイル・サイズ制限(N)を決定することができる:
=ρfd Δt’〜d Δt’=一定値、 [式5]
ここで、ρfは、ベクトル・データに対応する、所与の、または固定された時空密度である。
固定された積ρf(ここでは「時空密度」と呼ばれる)が既知であることを所与とすると、ベクトル・データのために予想される問い合わせに依存して、PVDファイルにわたるベクトル・データの分割を調整するようΔt’およびdを変化させることができる。ρおよびfが別個に既知である場合には、fΔt’がρd よりもはるかに大きい場合には(制約、式5を所与とする)、PVDファイルは、互いに空間的に近いデータの時系列を支配的に包含することになるであろう。代替的に、fΔt’がρd よりもはるかに小さい場合には、データの空間スナップショットが、対応するPVDファイルによって蓄積される。しかし、時空密度自体を用いて、式5によってdおよびΔt’を関係付けることができる。これは、例えば、例として、自動車などの、移動オブジェクトに関連付けられたベクトル・データのために有用性をもたらす。システム100は、上述された両方の問い合わせタイプの間の妥協、すなわち、fΔt’〜ρd となるときをもたらすよう動作させることができることを理解されたい。
図2は、時空密度(ρf)200が、空間対時間問い合わせのために1次元時空体積(dΔt’)へのリンク(すなわち、相互関係)をどのように確立することができるのかを示す概略図である。個々のデータ・ポイント202の経路は、移動するベクトル・オブジェクト206、例えば、自動車の軌跡204を表すことができる。データ・ファイル対象範囲領域208は、所与のρf200が所与のHDFSデータ・ファイルによって対象範囲に含まれるかどうかを決定する。しかし、図2に示される例はポイント・データに限定されないことを理解されたい。
図1に戻ると、分散データベース112は、物理的コンポーネントを共有しないいくつかの独立したデータ記憶サイトを含むことができる。データは異なる記憶サイトから抽出し、結果をもたらすために組み合わせることができる。記憶サイトは、同じ物理位置に位置する、複数のコンピュータ、データ・サーバ等内で利用することができるか、または相互接続されたコンピュータのネットワークにわたって散在していることができる。したがって、個々のデータ記憶サイトのネットワークが分散データベース112を規定することができる。プロセッサが密接に結合され、単一のデータベース・システムを構成する、並列システムとは異なり、分散データベース112は、物理的コンポーネントを共有しない緩やかに結合されたサイトとして実施することができる。このように、(例えば、データベース内の)データの大きな集合を複数の物理位置または記憶サイトにわたって分散させることができる。
本発明の1つまたは複数の実施形態では、分散データベース112はApache Hbase(TM)112として実施され、分散ファイル・システム110がHDFS(TM)として実施されているときには、分散ファイル・システム110と連動して実行する。Hbase(TM)112は列指向のkey−value分散データベースである。Hbase(TM)112内のテーブルには、アプリケーション・サブシステム106内に含まれる、ウェブ・インターフェース115または様々なAPI117(例えば、PAIRS API)あるいはその両方を介してアクセスすることができる。Hbase(TM)112は、高いスループットかつ低い入力/出力待ち時間を有する大きなデータ・セット上におけるより高速な読み取りおよび書き込み動作のためによく適している。このように、Hbase(TM)112は、大量の疎データを記憶するフォールト・トレラントな方式を提供することができる。疎データは、時として「ノイズ」と呼ばれる、空の、または重要でないデータの大きな集合内に捕えられた少量の情報として言及される。疎データの例としては、20億個のレコードのグループ内の50個の最も大きな項目を識別すること、または巨大なデータ集合の0.1%未満を表すゼロ以外の項目を決定することが挙げられる。本発明の1つまたは複数の実施形態では、Hbase(TM)112は、SQL問い合わせエンジンを有する構造化問い合わせ言語(SQL)レイヤ、ならびに様々な分析およびビジネス・インテリジェンス・アプリケーションと統合することができるJava(R) Database Connectivity(JDBC)ドライバなどのデータベース接続APIを含む。Java(R)ならびに全てのJava(R)ベースの商標およびロゴは、Oracleまたはその関連会社あるいはその両方の商標または登録商標である。
処理サブシステム104は、並列ベクトル・データ(parallel vector data、PVD)プロセッサ114、MapReduceプロセッサ116、およびデータ融合プロセッサ118を含む。PVDプロセッサ114、MapReduceプロセッサ116、およびデータ融合プロセッサ118のうちの任意のものは、メモリ、ならびにメモリ内に記憶されたアルゴリズムおよびコンピュータ可読プログラム命令を実行するように構成されたプロセッサを含む電子ハードウェア・コントローラとして構築することができる。
PVDプロセッサ114は、暗黙のデータ並列性およびフォールト・トレランスを備えたクラスタ(例えば、コンピュータ・クラスタ)全体をプログラムするためのインターフェースを含む分散コンピューティングおよびクラスタ−コンピューティング・フレームワークに従って構築することができる。本発明の1つまたは複数の実施形態では、PVDプロセッサ114は、Apache Spark(TM)/PySpark(TM)フレームワークに従って実施される。したがって、PVDプロセッサ114は、耐障害耐性分散データ・セット(resilient distributed dataset、RDD)115と呼ばれるデータ構造を中心としたアプリケーション・プログラミング・インターフェースを提供することができる。RDD115は、マシンのクラスタにわたって分散したデータ項目の読み取り専用マルチセットであり、フォールト・トレラントな方式で維持され得る。スケーラブルなプラットフォームであるため、PVDプロセッサ114は、計算クラスタのメモリ(例えば、分散したメモリ)内に1つまたは複数のRDD115をロードすることができる。PVDプロセッサ114がApache Spark(TM)フレームワークに従って実施されるときには、所与のRDDに作用する変換のシーケンス({f1,f2,...fn})は次式のように定義することができる:
RDD→f1(RDD)→f2(f1(RDD))→... [式6]
1つまたは複数のRDD115は様々なソースからロードすることができる。1つの選択肢は、分散ファイル・システム110(例えば、HDFS)を用いて、クラスタ・ノードの間で分散したASCIIテキスト・ファイルを組み込むことである。したがって、PVDプロセッサ114はテキストの各ラインに個々に作用し、シーケンス{fn}を適用することができる。テキストのラインは、例えば、例として、対応する属性を有するポリゴンなどの境界形状を規定する、式1において定義されたデータ構造のJSON表現を含むことができる。
Apache Spark(TM)フレームワークに従って実施されるときには、PVDプロセッサ114はまた、例えば、PySpark(TM)などのスクリプト言語APIを含む。PySpark(TM) APIは、SQL操作を通じたデータ・テーブル(すなわち、データフレーム)に対する操作を可能にする、様々な地理空間パッケージへのアクセスを可能にする。SQL操作を利用する能力はまた、例えば、Apache Parquet(TM)ファイル・フォーマット生成器111などの列指向のデータベース管理システム(database management system、DBMS)への直接アクセスも可能にする。
MapReduceプロセッサ116は、クラスタ上の並列分散アルゴリズムを用いてビッグ・データ・セットを処理および生成するように構成されている。MapReduceプロセッサ116は、MapプロセスおよびReduceプロセスを遂行するように構成されている。Mapプロセス(例えば、アルゴリズム)は、例えば、学生をファースト・ネームによって、名前ごとに1つのキューのキュー群にソートすることなどの、フィルタリングおよびソーティングを遂行する。Reduceプロセスは、例えば、各キュー内の学生数を数え、名前頻度を得ることなどの、要約操作を遂行する。したがって、MapReduceプロセッサ116は、限定するものではないが、分散したサーバを整理すること、様々なタスクを並列に実行すること、システムの様々な部分の間の全ての通信およびデータ転送を管理すること、ならびに冗長性およびフォールト・トレランスを与えることを含む様々な動作を遂行することによって、データを処理することができる。
データ融合プロセッサ118は、フィルタリングされたラスタ・データを得、フィルタリングされたラスタ・データをベクトル・データの集合と互いに融合する(例えば、レイヤ化する)ように構成されている。本発明の1つまたは複数の実施形態では、データ融合プロセッサ118は、IBM(R)によって提供されているPAIRSに従って実施される。ラスタ・データがベクトル・データと互いに融合されるため、データ融合プロセッサ118は、ベクトル問い合わせを受信し、融合されたデータをラスタ化し、ラスタ・データ結果を生成することができる。データ融合プロセッサ118は、(データがベクトル化されている場合には)データをプレーンASCIIとしてHDFS内に記憶することができるが、標準動作モードでは、問い合わせ結果は、例えば、GeoJSON(ベクトル・データ)およびGeoTiff(ラスタ・データ)としてさらなる消費のために115または117へ転送される。
データ融合プロセッサ118はまた、ラスタ問い合わせを受信し、融合されたデータをベクトル化し、ベクトル・データ結果を生成することもできる。ジオリファレンスされたラスタ・データから「ベクトル化されたラスタ・データ」を得、ジオリファレンスされたベクトル・データから「ラスタ化されたベクトル・データ」を得る能力に関するさらなる詳細が後述される。本発明の1つまたは複数の実施形態では、データ融合プロセッサ118は時空間ラスタ・データをベクトル・フォーマット・オブジェクトにリンクする。データ融合プロセッサによって処理されたベクトル・データは、(1)ポイント、(2)ライン、および(3)境界形状を含む。ポイントは、単一の地理空間座標(x,y)、例えば、ジオタグ付きのツイート、店の位置等を含む。ラインは一連の地理空間座標{(xn,yn)}n=1...Nを含む。ここで、(x1,y1)は(xN,yN)と等しくなく、これは、例えば、街路、河川、移動軌跡等を表す。例えば、ポリゴンなどの境界形状はラインと同様であるが、例えば、建物、湖等を指示する一致した最後と最初の座標を含む。さらに、穴を表現する内部座標に対応する、(x’1,y’1)=(x’M,y’M)である、系列{(x’n,y’n)}n=1...Mが存在し得る。時空間ラスタ・データをベクトル・フォーマット・オブジェクトにリンクするプロセスは、フィルタリングされたラスタ・データをベクトル・データと互いに融合すること(すなわち、レイヤ化すること)を含む。
図3を参照すると、本図は、本発明の1つまたは複数の非限定的実施形態に係る、フィルタリングされたラスタ・データをベクトル・データと互いに融合する(すなわち、レイヤ化する)プロセスを示す。データ融合プロセッサ118は、PVDファイル(例えば、<ma>_<n>−<Z>−<t>.pvd)によって規定される仮想グリッド110に対応するラスタ・グリッド300を生成する。ラスタ・グリッド300は複数のラスタ・セル(Z1)302を含む。各ラスタ・セル302は、座標の対応するセット(例えば、緯度座標、経度座標)によって識別することができる。ベクトル・オブジェクト(例えば、ポイント、ライン、境界形状等)を包含するラスタ・セルが識別され、包含されたベクトル・オブジェクトに所与のラスタ・セルの座標が付与される。したがって、ベクトル・データ(すなわち、ラスタ化されていないデータ)は空間ラスタ・データに相互に関連付けられる。
本発明の1つまたは複数の実施形態では、ベクトル・データは、ベクトル・オブジェクト、またはベクトル・オブジェクトの部分に対する1つまたは複数のラスタ・セル302の位置合わせに基づいてグリッド座標情報を付与される。例えば、例として、ポイント、ライン、または境界形状(例えば、ポリゴン)、あるいはその組み合わせなどの、少なくとも1つのベクトル・オブジェクトを含む、初期ベクトル・データ・セットが受信される。ラスタ・グリッド300がベクトル・データ・セット上にオーバレイされ、複数のセル302を規定する。ラスタ・グリッド300は、グリッドの横軸に付与された一連の緯度座標(m−2,m−1,m,m+1等)、およびグリッドの縦軸に付与された一連の経度座標(n−2,n−1,n,n+1等)を含む。緯度および経度座標のセット(例えば、m+1;n−2)が複数のセルの中のセルを規定する。このように、ベクトル・オブジェクト、またはベクトル・データの少なくとも一部分(例えば、306a)を包含する所与のセル(例えば、m+1;n−2)を識別することができる。次に、ベクトル・オブジェクトまたはその部分は所与のセルの緯度および経度座標のセットを付与される。
各PVDファイルは、設定解像度レベル(例えば、レベルl)において所与のラスタ・セル302に付与される。したがって、ポイント304a、304b、304c...304nはグリッド300に自動的にリンクされる。複数のラスタ・セル302を共有するライン306および境界形状308(例えば、ポリゴン)は、複数のベクトル・オブジェクト(ライン・セグメント306aおよび306b参照)に分割されるか、あるいはファイル内で複製される(複製境界形状308aおよび308b参照)。複製された要素(例えば、308aおよび308b)は、上述されたASCIIベースのPVDテキスト・ファイル(すなわち、R={「i」:id,「g」:P,「a」:A,「q」:Q})内に含まれる「id」パラメータを用いて識別することができる。
図4および図5に示されるプロセス・フロー図は、時空密度データベース・システム100の、ジオリファレンスされたラスタ・データから「ベクトル化されたラスタ・データ」を得る能力を示す。動作400を参照すると、データベース・システム100は、ラスタ・データに基づくベクトル化されたデータ結果のための問い合わせを受信する。ラスタ・データをベクトル化することから得られたベクトル化されたデータは、本明細書において、「ベクトル化されたラスタ・データ」と呼ばれる。ベクトル化されたデータの問い合わせを受信したことに応じて、データベース・システム100は、ジオリファレンスされたラスタ・データをラスタ・データ・ソースから得る。ラスタ・データ・ソースは、例えば、衛星画像、2次元(2−dimensional、2−D)気象マッピング・データ等を含む。ラスタ・データ420は複数の個々のピクセル422a、422b、422c、422d、422nを含む。ピクセルは、ラスタ・データ420内に含まれる様々な要素またはオブジェクトを表現することができる。例えば、第1のピクセル422bは住宅を表現することができる。ピクセル422cの第2のグループは河川を表現することができる。ピクセル422dの第3のグループは、森林または樹木に覆われた区域を表現することができる。ラスタ・データ420は、限定するものではないが、UTM(Universal Transverse Mercator(万国横メルカトル))、BNG(British National Grid)、およびUSNG(U.S. National Grid)を含む様々な地理空間投影において与えることができる。ラスタ・データ420はまた、例えば、画像がラスタ・データ・ソースによって取り込まれた時刻または日付あるいはその両方などのタイムスタンプ情報を含む。
動作402を参照すると、データベース・システム100は、動作404において示されるように、グリッド・システム424をピクセル422a〜422n上にオーバレイする地理空間グリッド再投影を遂行する。したがって、ピクセル422a〜422nは、グリッド・システム424とのそれらの位置合わせに基づく値を付与される。本発明の1つまたは複数の実施形態では、グリッド・システム424は、例えば、4分木データ構造などのツリー・データ構造に従って分割され、緯度座標m−1、m、m+1、m+2等、および経度座標n、n+1、n+2等を付与される。このように、ピクセル422a〜422nはグリッド・システム424の座標に従って索引付けされる。
動作406を参照すると、ラスタ・データ420の時空間情報を用いて、問い合わせに従ってラスタ・データ420をフィルタリングする。したがって、1つまたは複数のフィルタリングされたピクセル422a’および422c’が初期ラスタ・データ・セット420から識別および抽出され、動作408において示されるように、ラスタ・データ問い合わせ結果(すなわち、フィルタリングされたラスタ・データ)を生成する。動作410において、フィルタリングされたピクセル422a’および422c’をベクトル化し、ベクトル・データを生成する。動作412において示されるように、ラスタ・データ問い合わせ結果、すなわち、フィルタリングされたピクセル422a’および422c’を表現する、ベクトル化されたラスタ・データ426および428が提供される。例えば、ベクトル形状426および428はラスタ・データ問い合わせ結果を示し、初期ラスタ・データ・セット420から抽出されたフィルタリングされたラスタ・ピクセル422a’および422c’に基づいて生成することができる。このように、データベース・システム100は、初期のジオリファレンスされたラスタ・データ・セット420から「ベクトル化されたラスタ・データ」426および428を生成する。
図6および図7に示されるプロセス・フロー図は、時空密度データベース・システム100の、画像認識分析に基づいて、ジオリファレンスされたラスタ・データから「ベクトル化されたラスタ・データ」を得る能力を示す。動作500、502および504は、図4〜図5に関して上述された動作と同様であり、したがって、それらの説明は繰り返されない。動作506を参照すると、時空間問い合わせが受信され、データベース・システム100は、動作504において生成されたピクセル422a、422b、422cおよび422の地理空間グリッド再投影に対して様々な画像認識分析プロセスを遂行する。データベース・システム100は、初期ラスタ・データ・セット420からシーン、オブジェクト、および要素を識別するために、様々な深層学習アルゴリズムおよび画像認識アルゴリズムを実施することができる。例えば、問い合わせを用いて、ラスタ・データ・セットから1つまたは複数の目標オブジェクト(例えば、住宅、河川、森林等)を識別することができる。問い合わせに基づいて、データベース・システム100は画像認識プロセスをラスタ・データに適用し、問い合わせに対応するオブジェクトを識別し、動作508において画像認識結果を「ベクトル化されたラスタ・データ」として生成する。ベクトル化されたラスタ・データは、入力された問い合わせを満足する1つまたは複数の認識されたオブジェクト520a、520b、520cを表現する。このように、データベース・システム100は、画像認識分析に基づいて、ジオリファレンスされたラスタ・データ420から「ベクトル化されたラスタ・データ」520を生成する。
図8および図9に示されるプロセス・フロー図は、データベース・システム100の、ジオリファレンスされたベクトル・データから「ラスタ化されたベクトル・データ」を得る能力を示す。動作600において、データベース・システム100は、初期ベクトル・データ・セットに基づくラスタ化されたデータ結果のための問い合わせを受信する。ベクトル・データをラスタ化することから得られたラスタ化されたデータは、本明細書において、「ラスタ化されたベクトル・データ」と呼ばれる。ラスタ化されたデータの問い合わせを受信したことに応じて、データベース・システム100は、ジオリファレンスされたベクトル・データを、例えば、OpenStreetMapなどのベクトル・データ・ソースから得る。ベクトル・データ・ソースは、例えば、ポイント620、ライン622、または境界形状624(例えば、ポリゴン)、あるいはその組み合わせを含む。ベクトル・ポイント620は、例えば、住宅を表現することができ、ベクトル・ライン622は、例えば、河川を表現することができ、ポリゴン624は、例えば、住宅地を表現することができる。ベクトル・データ620、622および624は、限定するものではないが、UTM、BNG、およびUSNGを含む様々な地理空間投影において与えることができる。ベクトル・データ620、622および624はまた、例えば、近隣の境界が画定された日付、または街路が建設された日付などのタイムスタンプ情報を含むこともできる。
動作602を参照すると、データベース・システム100は、動作604において示されるように、グリッド・システム626をベクトル・データ620、622および624上にオーバレイする地理空間グリッド再投影を遂行する。したがって、ベクトル・データ620、622および624は、グリッド・システム424とのそれらの位置合わせに基づく値を付与される。本発明の1つまたは複数の実施形態では、グリッド・システム626は、例えば、4分木データ構造などのツリー・データ構造に従って分割され、緯度座標m−1、m、m+1、m+2等、および経度座標n、n+1、n+2等を付与される。このように、ベクトル・データ620、622および624はグリッド・システム626の座標に従って索引付けされる。次に、索引付けされたベクトル・データ620、622および624は、PVDファイルの単一ライン群として分散ファイル・システム110(例えば、HDFS(TM))内に記憶される。本発明の1つまたは複数の実施形態では、ベクトル・オブジェクト(例えば、ライン622)は、複数のグリッド・セル626を横切るときには、個々の部分要素622aおよび622b(例えば、ライン・セグメント)に分割される。
動作606を参照すると、入力された問い合わせの時間的および空間的対象範囲に対応する1つまたは複数のPVDファイルが選択される。動作608において、索引データがPVDファイルから抽出され、PVDプロセッサ114は、耐障害耐性分散データ・セット(RDD)115に対応するそれを中心としたアプリケーション・プログラミング・インターフェースを提供する。動作610において、選択されたASCIIファイルに対応するベクトル・データ620、622および624が、入力された問い合わせに従ってフィルタリングされ、動作612において、フィルタリングされたベクトル問い合わせ結果が生成される。図8〜図9に示される例では、フィルタリングされたベクトル問い合わせ結果は境界形状624(例えば、ポリゴン)をもたらす。動作614において、フィルタリングされたベクトル問い合わせ結果は、設定解像度レベルにおけるツリー・データ構造(例えば、4分木)表現に変換される。したがって、動作616において、フィルタリングされたベクトル問い合わせ結果、すなわち、フィルタ・ポリゴン624によって境界されたラスタ化されたデータ・ピクセル628を含む、ラスタ化されたベクトル・データが生成される。
本明細書において説明される教示の実施はいかなる特定のコンピューティング環境にも限定されないことが理解される。むしろ、本発明の諸実施形態は、現在知られている、または将来開発される任意の他の種類のコンピューティング環境と連動して実施される能力を有する。
本発明の1つまたは複数の実施形態は、例えば、クラウド・コンピューティング・システムにおいて実施することができる。クラウド・コンピューティングは、最小限の管理労力またはサービスのプロバイダとの対話をもって迅速にプロビジョニングし、解放することができる構成可能なコンピューティング・リソース(例えば、ネットワーク、ネットワーク帯域幅、サーバ、処理、メモリ、ストレージ、アプリケーション、仮想機械、およびサービス)の共有プールへの簡便なオン・デマンド・ネットワーク・アクセスを可能にするためのサービス提供のモデルである。このクラウド・モデルは、少なくとも5つの特徴、少なくとも3つのサービス・モデル、および少なくとも4つの展開モデルを含み得る。
特徴は以下のとおりである:
オン・デマンド・セルフ・サービス:クラウド消費者は、サーバ時間およびネットワーク・ストレージなどの、コンピューティング能力を、サービスのプロバイダとの人的対話を必要とすることなく、必要に応じて自動的に、一方的にプロビジョニングすることができる。
幅広いネットワーク・アクセス:能力はネットワークを通じて利用可能であり、異種のシンまたはシック・クライアント・プラットフォーム(例えば、携帯電話、ラップトップ、およびPDA)による利用を促進する標準的な機構を通じてアクセスされる。
リソース・プーリング:プロバイダのコンピューティング・リソースが、マルチテナント・モデルを用いて複数の消費者に対応するためにプールされる。異なる物理および仮想リソースが要求に従って動的に割り当てられ、再割り当てされる。消費者は、概して、提供されるリソースの厳密な位置を制御できない、または知らないが、より高い抽象化レベルにおける位置(例えば、国、州、またはデータセンタ)を指定することが可能であり得るという点で、位置独立と言える。
迅速な弾力性:能力を、素早くスケール・アウトするために迅速かつ弾力的に、場合によっては自動的にプロビジョニングし、素早くスケール・インするために迅速に解放することができる。消費者にとって、プロビジョニングのために利用可能な能力は、多くの場合、無制限であるように見え、任意の時間に任意の量で購入することができる。
度数制(measured service):クラウド・システムは、サービスの種類(例えば、記憶、処理、帯域幅、およびアクティブ・ユーザ・アカウント)に適した何らかの抽象化レベルにおけるメータリング能力を活用することによって、リソース使用を自動的に制御し、最適化する。リソース使用状況を監視、制御、および報告することができ、利用されるサービスのプロバイダおよび消費者の双方のために透明性をもたらす。
サービス・モデルは以下のとおりである:
Software as a Service(SaaS):消費者に提供される能力は、クラウド・インフラストラクチャ上で実行するプロバイダのアプリケーションを使用することである。アプリケーションは、ウェブ・ブラウザ(例えば、ウェブ・ベースの電子メール)などのシン・クライアント・インターフェースを通じて様々なクライアント・デバイスからアクセス可能である。消費者は、場合によっては、限定的なユーザ固有のアプリケーション構成設定を例外として、ネットワーク、サーバ、オペレーティング・システム、ストレージ、またはさらに、個々のアプリケーション能力を含む、基礎をなすクラウド・インフラストラクチャを管理または制御しない。
Platform as a Service(PaaS):消費者に提供される能力は、プロバイダによってサポートされたプログラミング言語およびツールを用いて作成された、消費者作成または取得アプリケーションをクラウド・インフラストラクチャ上に展開することである。消費者は、ネットワーク、サーバ、オペレーティング・システム、またはストレージを含む、基礎をなすクラウド・インフラストラクチャを管理または制御しないが、展開されたアプリケーション、および場合によっては、環境構成をホストするアプリケーションを制御する。
Infrastructure as a Service(IaaS):消費者に提供される能力は、処理、ストレージ、ネットワーク、および他の基本的コンピューティング・リソースをプロビジョニングすることであり、消費者は、オペレーティング・システムおよびアプリケーションを含み得る、任意のソフトウェアを展開および実行することが可能である。消費者は、基礎をなすクラウド・インフラストラクチャを管理または制御しないが、オペレーティング・システム、ストレージ、展開されたアプリケーションを制御し、場合によっては、選択されたネットワーキング・コンポーネント(例えば、ホスト・ファイアウォール)を限定的に制御する。
展開モデルは以下のとおりである:
プライベート・クラウド:このクラウド・インフラストラクチャは組織のためにのみ運用される。それは、その組織または第三者によって管理されてもよく、構内または構外に存在してもよい。
コミュニティ・クラウド:このクラウド・インフラストラクチャはいくつかの組織によって共有され、共有関心事(例えば、任務、セキュリティ要求、ポリシー、およびコンプライアンスの考慮事項)を有する特定のコミュニティをサポートする。それは、その組織群または第三者によって管理されてもよく、構内または構外に存在してもよい。
パブリック・クラウド:このクラウド・インフラストラクチャは公衆または大規模な業界団体に対して利用可能にされ、クラウド・サービスを販売する組織によって所有される。
ハイブリッド・クラウド:このクラウド・インフラストラクチャは、固有エンティティのままであるが、データおよびアプリケーションの可搬性を可能にする標準または独占技術(例えば、クラウド間のロード・バランシングのためのクラウド・バースティング)によって互いに結合された、2つ以上のクラウド(プライベート、コミュニティ、またはパブリック)の合成である。
クラウド・コンピューティング環境は、ステートレス性、疎結合性、モジュール性、および意味的相互運用性に重点を置いて指向されたサービスである。クラウド・コンピューティングの中核には、相互接続されたノードのネットワークを備えるインフラストラクチャがある。
図10に関して、例示的なクラウド・コンピューティング環境50が示されている。図示のように、クラウド・コンピューティング環境50は、例えば、パーソナル・デジタル・アシスタント(personal digital assistant、PDA)もしくはセルラー電話54A、デスクトップ・コンピュータ54B、ラップトップ・コンピュータ54C、または車載コンピュータ・システム54N、あるいはその組み合わせなどの、クラウド消費者によって用いられるローカル・コンピューティング・デバイスが通信し得る、1つまたは複数のクラウド・コンピューティング・ノード10を含む。ノード10は互いに通信し得る。それらは、上述されたとおりのプライベート、コミュニティ、パブリック、またはハイブリッド・クラウド、あるいはこれらの組み合わせなどの、1つまたは複数のネットワークにおいて物理的または仮想的にグループ化されてもよい(図示せず)。これは、クラウド・コンピューティング環境50が、インフラストラクチャ、プラットフォーム、またはソフトウェア、あるいはこの組み合わせを、クラウド消費者がリソースをローカル・コンピューティング・デバイス上に維持することを必要としないサービスとして提供することを可能にする。図10に示されるコンピューティング・デバイス54A〜Nの種類は例示を意図されているにすぎず、コンピューティング・ノード10およびクラウド・コンピューティング環境50は、(例えば、ウェブ・ブラウザを用いて)任意の種類のネットワーク、またはネットワーク・アドレス可能接続、あるいはその両方を通じて任意の種類のコンピュータ化デバイスと通信することができることが理解される。
次に図11を参照すると、クラウド・コンピューティング環境50(図10)によって提供される機能抽象化レイヤのセットが示されている。図11に示されるコンポーネント、レイヤ、および機能は例示を意図されているにすぎず、本発明の諸実施形態はこれらに限定されないことをあらかじめ理解されたい。図示のように、以下のレイヤおよび対応する機能が提供される。
ハードウェアおよびソフトウェアレイヤ60はハードウェアおよびソフトウェア・コンポーネントを含む。ハードウェア・コンポーネントの例は、メインフレーム61、RISC(Reduced Instruction Set Computer(縮小命令セット・コンピュータ))アーキテクチャ・ベースのサーバ62、サーバ63、ブレード・サーバ64、記憶デバイス65、ならびにネットワークおよびネットワーキング・コンポーネント66を含む。実施形態によっては、ソフトウェア・コンポーネントは、ネットワーク・アプリケーション・サーバ・ソフトウェア67およびデータベース・ソフトウェア68を含む。
仮想化レイヤ70は抽象化レイヤを提供する。抽象化レイヤからは仮想エンティティの以下の例が提供され得る:仮想サーバ71、仮想ストレージ72、仮想プライベート・ネットワークを含む、仮想ネットワーク73、仮想アプリケーションおよびオペレーティング・システム74、ならびに仮想クライアント75。
一例では、管理レイヤ80は、後述される機能を提供し得る。リソース・プロビジョニング81は、コンピューティング・リソース、およびクラウド・コンピューティング環境内でタスクを遂行するために利用される他のリソースの動的調達を提供する。計量および価格決定82は、リソースがクラウド・コンピューティング環境内で利用される際のコスト追跡、ならびにこれらのリソースの消費のための請求書またはインボイスの作成送付を提供する。一例では、これらのリソースはアプリケーション・ソフトウェア・ライセンスを含み得る。セキュリティは、クラウド消費者およびタスクのための識別確認、ならびにデータおよび他のリソースのための保護を提供する。ユーザ・ポータル83は、消費者およびシステム・アドミニストレータのためのクラウド・コンピューティング環境へのアクセスを提供する。サービス・レベル管理84は、要求サービス・レベルが満たされるよう、クラウド・コンピューティング・リソースの割り当ておよび管理を提供する。サービス品質保証(Service Level Agreement、SLA)計画および達成85は、SLAに従って、将来の要求が予想されるクラウド・コンピューティング・リソースのための事前準備、およびその調達を提供する。
作業負荷レイヤ90は、クラウド・コンピューティング環境が利用され得る機能性の例を提供する。このレイヤから提供され得る作業負荷および機能の例は、マッピングおよびナビゲーション91、ソフトウェア開発およびライフサイクル管理92、仮想教室教育配信93、データ分析処理94、トランザクション処理95、ならびに入力データ分析96を含む。
図12を参照すると、本発明の1つまたは複数の実施形態に係る、ラスタ・データ・フォーマットおよびベクトル・データ・フォーマットを互いに融合する能力を有するコンピューティング・システム900が示されている。コンピューティング・システム900は、サーバ、ラップトップ・コンピュータ、タブレット・コンピュータ、電話、および同様のものなどの、コンピュータを含むことができる。
コンピューティング・システム900は、コンポーネントの中でもとりわけ、プロセッサ905と、メモリ・コントローラ915に結合されたメモリ910と、ローカルI/Oコントローラ935を介して通信可能に結合された、周辺もしくは制御デバイスなどの、1つまたは複数の入力デバイス945または出力デバイス940あるいはその両方とを含む。これらのデバイス940および945は、例えば、バッテリ・センサ、位置センサ(高度計40、加速度計42、GPS44)、インジケータ/識別ライト、および同様のものを含み得る。従来のキーボード950およびマウス955などの入力デバイスがI/Oコントローラ935に結合され得る。I/Oコントローラ935は、例えば、当技術分野において知られているとおりの、1つまたは複数のバスまたは他の有線もしくは無線接続であり得る。I/Oコントローラ935は、通信を可能にするために、コントローラ、バッファ(キャッシュ)、ドライバ、リピータ、および受信器などの、簡潔にするために省略された、追加の要素を有し得る。
I/Oデバイス940、945は、入力および出力の両方を通信するデバイス、例えば、ディスクおよびテープ・ストレージ、(他のファイル、デバイス、システム、またはネットワークにアクセスするための)ネットワーク・インターフェース・カード(network interface card、NIC)または変調器/復調器、無線周波数(radio frequency、RF)または他のトランシーバ、電話インターフェース、ブリッジ、ルータ、ならびに同様のものをさらに含み得る。
プロセッサ905は、ハードウェア命令またはソフトウェア、特に、メモリ910内に記憶されたものを実行するためのハードウェア・デバイスである。プロセッサ905は、特別製もしくは市販のプロセッサ、中央処理装置(central processing unit、CPU)、コンピューティング・システム900に関連付けられたいくつかのプロセッサの間の補助プロセッサ、(マイクロチップもしくはチップ・セットの形態の)半導体ベースのマイクロプロセッサ、マクロプロセッサ、または命令を実行するための他のデバイスであり得る。プロセッサ905は、限定するものではないが、実行可能命令フェッチの速度を上げるための命令キャッシュ、データ・フェッチおよび記憶の速度を上げるためのデータ・キャッシュ、ならびに実行可能命令およびデータの両方のための仮想アドレスから物理アドレスへの変換速度を上げるために用いられるトランスレーション・ルックアサイド・バッファ(translation lookaside buffer、TLB)を含み得る、キャッシュ970を含む。キャッシュ970は、より多くのキャッシュ・レベル(L1、L9など)の階層として組織化されてもよい。
メモリ910は、揮発性メモリ要素(例えば、DRAM、SRAM、SDRAMなどの、ランダム・アクセス・メモリ、RAM)、ならびに不揮発性メモリ要素(例えば、ROM、消去可能プログラマブル・リード・オンリー・メモリ(erasable programmable read only memory、EPROM)、電気的消去可能プログラマブル・リード・オンリー・メモリ(electronically erasable programmable read only memory、EEPROM)、プログラマブル・リード・オンリー・メモリ(programmable read only memory、PROM)、テープ、コンパクト・ディスク・リード・オンリー・メモリ(compact disc read only memory、CD−ROM)、ディスク、ディスケット、カートリッジ、カセット、または同様のもの)のうちの1つまたはこれらの組み合わせを含み得る。さらに、メモリ910は、電子、磁気、光、または他の種類の記憶媒体を組み込み得る。メモリ910は、様々なコンポーネントが互いに遠隔に配置されているが、プロセッサ905によってアクセスされ得る、分散アーキテクチャを有し得ることに留意されたい。
メモリ910内の命令は、論理機能を実施するための実行可能命令の順序付けられたリスティングを各々含む、1つまたは複数の別個のプログラムを含み得る。図12の例では、メモリ910内の命令は好適なオペレーティング・システム(operating system、O/S)911を含む。O/S911は、本質的に、他のコンピュータ・プログラムの実行を制御し、スケジューリング、入力−出力制御、ファイルおよびデータ管理、メモリ管理、ならびに通信制御および関連サービスを提供し得る。
例えば、プロセッサ905のための命令、または他の検索可能情報を含む、追加のデータが、ハード・ディスク・ドライブまたはソリッド・ステート・ドライブなどの記憶デバイスであり得る、ストレージ990内に記憶されてもよい。メモリ910内またはストレージ990内に記憶された命令は、プロセッサが、本明細書において説明されるシステムおよび方法の1つまたは複数の態様を実行することを可能にするものを含み得る。
コンピューティング・システム900は、ユーザ・インターフェースまたはディスプレイ930に結合されたディスプレイ・コントローラ995をさらに含み得る。実施形態によっては、ディスプレイ930はLCDスクリーンであり得る。他の実施形態では、ディスプレイ930は複数のLEDステータス・ライトを含み得る。実施形態によっては、コンピューティング・システム900は、ネットワーク965への結合のためのネットワーク・インターフェース960をさらに含み得る。ネットワーク965は、ブロードバンド接続を介した、コンピューティング・システム900と、外部サーバ、クライアントおよび同様のものとの間の通信のためのIPベースのネットワークであり得る。一実施形態では、ネットワーク965は衛星ネットワークであり得る。ネットワーク965はコンピューティング・システム900と外部システムとの間でデータを伝送および受信する。実施形態によっては、ネットワーク965は、サービス・プロバイダによって運営される、管理されたIPネットワークであり得る。ネットワーク965は、例えば、WiFi(R)、WiMax(R)、衛星、または任意の他のものなどの無線プロトコルおよび技術を用いて、無線方式で実施され得る。ネットワーク965はまた、ローカル・エリア・ネットワーク、ワイド・エリア・ネットワーク、メトロポリタン・エリア・ネットワーク、インターネット、または他の同様の種類のネットワーク環境などの、パケット交換ネットワークであり得る。ネットワーク965は、固定された無線ネットワーク、無線ローカル・エリア・ネットワーク(local area network、LAN)、無線ワイド・エリア・ネットワーク(wide area network、WAN)、パーソナル・エリア・ネットワーク(personal area network、PAN)、仮想私設ネットワーク(virtual private network、VPN)、イントラネット、または他の好適なネットワーク・システムであり得、信号を受信および伝送するための機器を含み得る。
本発明の様々な実施形態が本明細書において関連図面を参照して説明されている。本発明の範囲から逸脱することなく代替的な諸実施形態を考案することができる。以下の説明および図面においては、要素間の様々な接続および位置関係(例えば、上(over)、下(below)、隣接(adjacent)等)が説明されるが、当業者は、たとえ、向きが変更されても、説明された機能性が維持されるときには、本明細書において説明される位置関係の多くは向きに依存しないことを認識するであろう。これらの接続または位置関係あるいはその両方は、別途指定されない限り、直接的または間接的なものであることができ、本発明はこの点において限定的であることを意図されていない。したがって、エンティティ同士の結合は直接結合または間接結合のどちらかを指すことができ、エンティティ間の位置関係は直接的または間接的位置関係であることができる。間接的位置関係の一例として、本説明における、レイヤ「A」をレイヤ「B」の上に形成することへの言及は、1つまたは複数の中間レイヤ(例えば、レイヤ「C」)が、レイヤ「A」およびレイヤ「B」の関連した特徴および機能性が中間レイヤ(単数または複数)によって実質的に変更されない限りにおいて、レイヤ「A」とレイヤ「B」との間にある状況を含む。
以下の定義および略語が請求項および本明細書の解釈のために用いられることになる。本明細書で使用するとき、用語「備える(comprises)」、「備える(comprising)」、「含む(includes)」、「含む(including)」、「有する(has)」、「有する(having)」、「包含する(contains)」、または「包含する(containing)」、あるいはこれらの任意の他の変形は、非排他的包含を包括することを意図されている。例えば、要素のリストを含む合成物、混合物、プロセス、方法、物品、または装置は必ずしもそれらの要素のみに限定されず、明示的に列挙されていない、またはこのような合成物、混合物、プロセス、方法、物品、または装置に固有の他の要素を含むことができる。
加えて、用語「例示的(exemplary)」は、本明細書において、「例、実例、または例示の役割を果たすこと」を意味するように使用される。本明細書において「例示的」として説明される任意の実施形態または設計は、必ずしも、他の実施形態または設計に対して好ましい、または有利であると解釈されるべきではない。用語「少なくとも1つ(at least one)」および「1つまたは複数(one or more)」は、1以上の任意の整数、すなわち、1、2、3、4等を含むと理解される。用語「複数(a plurality)」は、2以上の任意の整数、すなわち、2、3、4、5等を含むと理解される。用語「接続(connection)」は間接「接続」および直接「接続」を含むことができる。
本明細書における「一実施形態(one embodiment)」、「一実施形態(an embodiment)」、「例示的な一実施形態(an example embodiment)」などへの言及は、説明されている実施形態は特定の特徴、構造、または特性を含み得るが、全ての実施形態はその特定の特徴、構造、または特性を含む場合もあり、含まない場合もあることを指示する。さらに、このような表現は必ずしも同じ実施形態に言及しているわけではない。さらに、特定の特徴、構造、または特性が一実施形態に関して説明されるときには、明示的に説明されているか否かにかかわらず、他の実施形態に関するこのような特徴、構造、または特性に影響することは当業者の理解の範囲のことであることが提示されている。
以下の説明の目的のために、用語「上方(upper)」、「下方(lower)」、「右(right)」、「左(left)」、「鉛直(vertical)」、「水平(horizontal)」、「上部(top)」、「底部(bottom)」、およびこれらの派生語は、図面の図において配向されているとおり、説明される構造および方法に関するものとする。用語「〜の上に横たわる(overlying)」、「〜の頂上にある(atop)」、「〜の上にある(on top)」、「〜の上に位置付けられる(positioned on)」、または「〜の頂上に位置付けられる(positioned atop)」は、第1の構造などの第1の要素が第2の構造などの第2の要素の上に存在することを意味し、インターフェース構造などの介在要素が第1の要素と第2の要素との間に存在することができる。用語「電気通信」は、限定するものではないが、有線接続または無線接続あるいはその両方を含む、電気信号を第1のノードから第2のノードへ転送する任意の手段を意味する。用語「約(about)」、「実質的に(substantially)」、「およそ(approximately)」、およびこれらの変形は、本出願の提出時に入手可能な機器に基づく特定の量の測定に付随する誤差の程度を含むことを意図されている。例えば、「約(about)」は所与の値の±8%または5%、または2%の範囲を含むことができる。
簡潔にするために、データベース記憶および処理に関連する技法は本明細書において詳細に説明される場合もあり、説明されない場合もある。例えば、特定の画像認識アルゴリズムまたは学習アルゴリズムあるいはその両方が、地理空間データベース・システムによって、様々なデータ問い合わせおよび分析を遂行するために実施され得る。本発明の1つまたは複数の実施形態の実施に用いられる特定の分析アルゴリズムの動作は個々に既知であり得るが、本発明の動作の上述の組み合わせまたは得られた構造あるいはその両方は独自のものである。それゆえ、本発明に係る地理空間データ分析に関して説明された動作の独自の組み合わせは、独自かつ新規のシステムを依然として提供しつつ、いくつかは直後の段落において説明される、種々の個々に既知のデータ処理および分析動作を実施することができる。
本発明は、任意の可能な技術的詳細統合レベルにおける、システム、方法、またはコンピュータ・プログラム製品あるいはその組み合わせであり得る。コンピュータ・プログラム製品は、プロセッサに本発明の諸態様を実施させるためのコンピュータ可読プログラム命令を有するコンピュータ可読記憶媒体(または媒体群)を含み得る。
コンピュータ可読記憶媒体は、命令実行デバイスによる使用のための命令を保持および記憶することができる有形のデバイスであることができる。コンピュータ可読記憶媒体は、例えば、限定するものではないが、電子記憶デバイス、磁気記憶デバイス、光記憶デバイス、電磁記憶デバイス、半導体記憶デバイス、または上述のものの任意の好適な組み合わせであり得る。コンピュータ可読記憶媒体のより具体的な例の非網羅的なリストは、以下のもの:ポータブル・コンピュータ・ディスケット、ハードディスク、ランダム・アクセス・メモリ(random access memory、RAM)、リード・オンリー・メモリ(read−only memory、ROM)、消去可能プログラマブル・リード・オンリー・メモリ(EPROMもしくはフラッシュ・メモリ)、スタティック・ランダム・アクセス・メモリ(static random access memory、SRAM)、ポータブル・コンパクト・ディスク・リード・オンリー・メモリ(compact disc read−only memory、CD−ROM)、デジタル多用途ディスク(digital versatile disk、DVD)、メモリ・スティック、フロッピー(R)・ディスク、穿孔カード、または命令が記録された溝内の隆起構造などの、機械的に符号化されたデバイス、ならびに上述のものの任意の好適な組み合わせを含む。コンピュータ可読記憶媒体は、本明細書で使用するとき、電波または他の自由伝搬する電磁波、導波路または他の伝送媒体を通って伝搬する電磁波(例えば、光ファイバ・ケーブルを通過する光パルス)、あるいは電線を通して伝送される電気信号などの、一過性信号自体であると解釈されるべきでない。
本明細書において説明されるコンピュータ可読プログラム命令は、コンピュータ可読記憶媒体からそれぞれのコンピューティング/処理デバイスに、あるいはネットワーク、例えば、インターネット、ローカル・エリア・ネットワーク、ワイド・エリア・ネットワーク、または無線ネットワーク、あるいはその組み合わせを経由して外部コンピュータまたは外部記憶デバイスにダウンロードすることができる。ネットワークは、銅伝送ケーブル、光伝送ファイバ、無線伝送、ルータ、ファイアウォール、スイッチ、ゲートウェイ・コンピュータ、またはエッジ・サーバ、あるいはその組み合わせを含み得る。各コンピューティング/処理デバイス内のネットワーク・アダプタ・カードまたはネットワーク・インターフェースがネットワークからコンピュータ可読プログラム命令を受信し、コンピュータ可読プログラム命令をそれぞれのコンピューティング/処理デバイス内のコンピュータ可読記憶媒体における記憶のために転送する。
本発明の動作を実施するためのコンピュータ可読プログラム命令は、アセンブラ命令、命令セット・アーキテクチャ(instruction−set−architecture、ISA)命令、機械命令、機械依存命令、マイクロコード、ファームウェア命令、状態設定データ、集積回路のための構成データ、あるいはSmalltalk(R)、C++、もしくは同様のものなどの、オブジェクト指向プログラミング言語、および「C」プログラミング言語もしくは同様のプログラミング言語などの、手続き型プログラミング言語を含む、1つまたは複数のプログラミング言語の任意の組み合わせで書かれた、ソース・コードまたはオブジェクト・コードのいずれかであり得る。コンピュータ可読プログラム命令は完全にユーザのコンピュータ上で実行するか、一部ユーザのコンピュータ上で実行するか、独立型ソフトウェア・パッケージとして実行するか、一部ユーザのコンピュータ上で、かつ一部リモート・コンピュータ上で実行するか、または完全にリモート・コンピュータもしくはサーバ上で実行し得る。後者のシナリオでは、リモート・コンピュータは、ローカル・エリア・ネットワーク(LAN)またはワイド・エリア・ネットワーク(WAN)を含む、任意の種類のネットワークを通じてユーザのコンピュータに接続され得るか、あるいは外部コンピュータへの接続が(例えば、インターネット・サービス・プロバイダを利用してインターネットを通じて)行われてもよい。実施形態によっては、例えば、プログラマブル論理回路機構、フィールド・プログラマブル・ゲート・アレイ(field−programmable gate array、FPGA)、またはプログラマブル論理アレイ(programmable logic array、PLA)を含む電子回路機構が、本発明の諸態様を遂行するために、コンピュータ可読プログラム命令の状態情報を利用して電子回路機構を個別化することによって、コンピュータ可読プログラム命令を実行し得る。
本発明の諸態様は、本明細書において、本発明の諸実施形態に係る方法、装置(システム)、およびコンピュータ・プログラム製品のフローチャート図またはブロック図あるいはその両方を参照して説明されている。フローチャート図またはブロック図あるいはその両方の各ブロック、ならびにフローチャート図またはブロック図あるいはその両方内のブロックの組み合わせは、コンピュータ可読プログラム命令によって実施され得ることが理解されるであろう。
これらのコンピュータ可読プログラム命令は、汎用コンピュータ、専用コンピュータ、または機械を作り出すための他のプログラム可能データ処理装置のプロセッサに提供され得、それにより、コンピュータまたは他のプログラム可能データ処理装置のプロセッサを介して実行する命令は、フローチャートまたはブロック図あるいはその両方のブロックまたはブロック群において指定された機能/行為を実施するための手段を生み出す。これらのコンピュータ可読プログラム命令はまた、内部に記憶された命令を有するコンピュータ可読記憶媒体が、フローチャートまたはブロック図あるいはその両方のブロックもしくはブロック群内で指定された機能/行為の諸態様を実施する命令を含む製造品を構成するように、コンピュータ、プログラム可能データ処理装置、または他のデバイスあるいはその組み合わせを特定の仕方で機能するように仕向けることができるコンピュータ可読記憶媒体内に記憶され得る。
コンピュータ可読プログラム命令はまた、コンピュータ、他のプログラム可能装置、または他のデバイス上で実行する命令が、フローチャートまたはブロック図あるいはその両方のブロックまたはブロック群において指定された機能/行為を実施するように、コンピュータ、他のプログラム可能データ処理装置、または他のデバイス上にロードされ、一連の動作ステップを、コンピュータ、他のプログラム可能装置または他のデバイス上で遂行させ、コンピュータ実施プロセスを作り出し得る。
図面におけるフローチャートおよびブロック図は、本発明の様々な実施形態に係るシステム、方法、およびコンピュータ・プログラム製品の可能な諸実装形態のアーキテクチャ、機能性、および動作を示す。この点に関して、フローチャートまたはブロック図における各ブロックは、指定された論理機能(単数または複数)を実施するための1つまたは複数の実行可能命令を含む、命令のモジュール、セグメント、または部分を表し得る。いくつかの代替的実装形態では、ブロック内に記された機能は、図面に記された順序に従わずに生じてもよい。例えば、連続して示された2つのブロックは、実際には、実質的に同時に実行されてもよく、またはブロックは、時として、含まれる機能性に依存して、逆の順序で実行されてもよい。また、ブロック図またはフローチャート図あるいはその両方の各ブロック、ならびにブロック図またはフローチャート図あるいはその両方におけるブロックの組み合わせは、指定された機能もしくは行為を遂行するか、あるいは専用ハードウェアおよびコンピュータ命令の組み合わせを実行する専用ハードウェア・ベースのシステムによって実施され得ることにも留意されたい。
本発明の様々な実施形態の説明が例示の目的のために提示されたが、網羅的であること、または説明された諸実施形態に限定されることを意図されてはいない。当業者には、上述の諸実施形態の範囲から逸脱することなく、多くの変更および変形が明らかであろう。本明細書において使用される術語は、諸実施形態の原理、実際の適用、または市場において見いだされる技術に対する技術的改善を最もうまく説明するため、あるいは他の当業者が、本明細書において説明される諸実施形態を理解することを可能にするために選定された。
100 時空密度データベース・システム
102 記憶サブシステム
104 処理サブシステム
106 アプリケーション・サブシステム
108 ファイル・フォーマッティング・サブシステム
110 分散ファイル・システム
112 分散データベース
114 並列ベクトル・データ(PVD)プロセッサ
115 ウェブ・インターフェース
116 MapReduceプロセッサ
117 API
118 データ融合プロセッサ

Claims (27)

  1. データベース・システムであって、
    第1のフォーマットされたデータを受信する電子ハードウェア・コントローラを含む処理サブシステムと、
    第2のデータ・フォーマットに対応する座標値を前記第1のフォーマットされたデータに付与し、前記第1のフォーマットされたデータを、第2のデータ・フォーマットに対応する前記座標値と互いに融合するデュアル・フォーマット・データ・ファイルを生成する電子ハードウェア・コントローラを含む電子ファイル・フォーマッティング・サブシステムと、
    前記デュアル・フォーマット・データ・ファイルを記憶するように構成されたデータ記憶ユニットを含む記憶サブシステムと、
    を備えるデータベース・システム。
  2. 前記第1のフォーマットされたデータがベクトル・データであり、前記第2のデータ・フォーマットがラスタ・データ・フォーマットである、請求項1に記載のデータベース・システム。
  3. 前記ファイル・フォーマッティング・サブシステムが、以下の動作、
    ベクトル・フォーマットを有し、少なくとも1つのベクトル・オブジェクトを含む前記第1のフォーマットされたデータを受信する動作、
    前記処理サブシステムによって、グリッド・システムを前記第1のフォーマットされたデータ上にオーバレイし、複数のセルを規定する動作であって、前記グリッド・システムが、前記グリッド・システムの横軸に付与された一連の緯度座標、および前記グリッド・システムの縦軸に付与された一連の経度座標を含み、緯度および経度座標のセットが前記複数のセルの中のセルを規定する、前記規定する動作、
    前記少なくとも1つのベクトル・オブジェクトの少なくとも一部分を包含する選択されたセルを識別する動作、ならびに前記選択されたセルの緯度および経度座標の前記セットを前記少なくとも1つのベクトル・オブジェクトに付与する動作、
    を遂行することによって、前記座標値を付与するように構成されている、請求項2に記載のデータベース・システム。
  4. 前記処理サブシステムが前記少なくとも1つのベクトル・オブジェクトのタイムスタンプ・データを決定し、
    前記ファイル・フォーマッティング・サブシステムが前記タイムスタンプ・データを前記デュアル・フォーマット・データ・ファイル内に記憶する、
    請求項3に記載のデータベース・システム。
  5. 選択されたタイムスタンプならびに緯度および経度座標の選択されたセットが前記複数のセルと前記第1のフォーマットされたデータとの間の時空密度関係を規定する、請求項4に記載のデータベース・システム。
  6. データベース・システムを動作させるコンピュータ実施方法であって、前記コンピュータ実施方法が、
    電子ハードウェア・コントローラを含む処理サブシステムにおいて、第1のフォーマットされたデータを受信することと、
    電子ファイル・フォーマッティング・サブシステムを用いて、第2のデータ・フォーマットに対応する座標値を前記第1のフォーマットされたデータに付与することと、
    前記ファイル・フォーマッティング・サブシステムを用いて、前記第1のフォーマットされたデータを、第2のデータ・フォーマットに対応する前記座標値に相互に関連付けるデュアル・フォーマット・データ・ファイルを生成することと、
    データ記憶ユニット内において、前記デュアル・フォーマット・データ・ファイルを記憶することと、
    を含むコンピュータ実施方法。
  7. 前記第1のフォーマットされたデータがベクトル・データであり、前記第2のデータ・フォーマットがラスタ・データ・フォーマットである、請求項6に記載のコンピュータ実施方法。
  8. 前記座標値を付与することが、
    ベクトル・フォーマットを有し、少なくとも1つのベクトル・オブジェクトを含む前記第1のフォーマットされたデータを受信すること、
    電子ハードウェア・コントローラを含む処理サブシステムを用いて、グリッド・システムを前記第1のフォーマットされたデータ上にオーバレイし、複数のセルを規定することであって、前記グリッド・システムが、前記グリッド・システムの横軸に付与された一連の緯度座標、および前記グリッド・システムの縦軸に付与された一連の経度座標を含み、緯度および経度座標のセットが前記複数のセルの中のセルを規定する、前記規定すること、
    電子ハードウェア・コントローラを含む前記処理サブシステムを用いて、前記少なくとも1つのベクトル・オブジェクトの少なくとも一部分を包含する選択されたセルを識別すること、ならびに
    ファイル・フォーマッティング・サブシステムを用いて、前記選択されたセルの緯度および経度座標の前記セットを前記少なくとも1つのベクトル・オブジェクトに付与すること、
    を含む、請求項7に記載のコンピュータ実施方法。
  9. 前記処理サブシステムを介して前記少なくとも1つのベクトル・オブジェクトのタイムスタンプ・データを決定することと、
    前記タイムスタンプ・データを前記デュアル・フォーマット・データ・ファイル内に記憶することと、
    をさらに含む、請求項8に記載のコンピュータ実施方法。
  10. 選択されたタイムスタンプ、ならびに緯度および経度座標の選択されたセットに基づいて、前記複数のセルと前記第1のフォーマットされたデータとの間の時空密度関係を規定することをさらに含む、請求項9に記載のコンピュータ実施方法。
  11. 問い合わせ結果を生成するためにデータベース・システムを動作させるコンピュータ実施方法であって、前記方法が、
    電子ハードウェア・コントローラを含むファイル・フォーマッティング・サブシステムを介して、第1のデータ・フォーマット(ラスタ)に対応する座標値を、前記第1のデータ・フォーマットとは異なる第2のデータ・フォーマット(ベクトル)を有する初期データ・セット内に含まれるデータ・オブジェクトに付与することと、
    前記ファイル・フォーマッティング・サブシステムを用いて、デュアル・フォーマット・データ・ファイルを生成するために、前記第2のデータ・フォーマットを有する前記データ・オブジェクトを、前記第1のデータ・フォーマットに対応する前記座標値に相互に関連付けるデュアル・フォーマット・データ・ファイルを生成することと、
    データ記憶ユニット内において、前記デュアル・フォーマット・データ・ファイルを記憶することと、
    前記初期データ・セット内に含まれる少なくとも1つのデータ・オブジェクトのための問い合わせを受信することであって、前記少なくとも1つのデータ・オブジェクトが前記第2のデータ・フォーマットを有する、前記受信することと、
    前記データ記憶ユニット内に記憶された複数のデュアル・データ・ファイルから前記第2のデータ・フォーマットを有する前記少なくとも1つのデータ・オブジェクトを含む少なくとも1つのデュアル・フォーマット・データ・ファイルを識別することと、
    前記少なくとも1つのデュアル・フォーマット・データ・ファイル内に記憶された前記対応する座標値に基づいて前記少なくとも1つのデータ・オブジェクトを出力することと、
    を含む方法。
  12. 前記第1のデータ・フォーマットがラスタ・データ・フォーマットであり、前記第2のデータ・フォーマットがベクトル・データ・フォーマットである、請求項11に記載のコンピュータ実施方法。
  13. 前記少なくとも1つのデータ・オブジェクトが、ポイント、ライン、および境界形状を含む群から選択されるベクトル・オブジェクトである、請求項12に記載のコンピュータ実施方法。
  14. 前記座標値が、前記初期データ・セットを、複数のラスタ・セルを規定するラスタ・グリッド・システムに索引付けする緯度および経度座標のセットを含む、請求項13に記載のコンピュータ実施方法。
  15. 前記問い合わせに応じて、前記少なくとも1つのデータ・オブジェクトを包含する選択されたラスタ・セルを識別するための緯度および経度座標の選択されたセットが決定される、請求項14に記載のコンピュータ実施方法。
  16. 問い合わせ結果を生成するためにデータベース・システムを動作させるコンピュータ実施方法であって、前記方法が、
    電子ハードウェア・コントローラを含む処理サブシステムを用いて複数のラスタ・グリッド・セルを初期ベクトル・データ・セット上にオーバレイすることであって、各ラスタ・グリッド・セルがそれにグリッド座標のセットを付与されている、前記オーバレイすることと、
    電子ハードウェア・コントローラを実装されたファイル・フォーマッティング・サブシステムを介して、前記ベクトル・データ・セット内に含まれるベクトル・オブジェクトをオーバレイする少なくとも1つのラスタ・グリッド・セルに対応するグリッド座標の選択されたセット、および前記ベクトル・オブジェクトを識別するオブジェクト識別情報の両方を含む融合されたデータ・ファイルを生成することと、
    前記ベクトル・データ・セット内に含まれる少なくとも1つのターゲット・ベクトル・オブジェクトのための問い合わせを受信することと、
    電子ハードウェア・コントローラを含む処理サブシステムを介して、前記ターゲット・ベクトル・オブジェクトに基づいて基準ベクトル・オブジェクトを決定し、前記基準ベクトル・オブジェクトと前記複数のグリッド・セルとの間の比較に基づいて前記ベクトル・オブジェクトに対応するグリッド座標の少なくとも1つのセットを決定する画像認識動作を遂行することと、
    グリッド座標の前記選択されたセットを記憶する前記融合されたデータ・ファイルから前記オブジェクト識別情報を出力することと、
    を含むコンピュータ実施方法。
  17. 前記ベクトル・オブジェクトが、ポイント、ライン、および境界形状を含む群から選択されるオブジェクトを含む、請求項16に記載のコンピュータ実施方法。
  18. 前記オブジェクト識別情報が、住宅、建物、河川、街路、湖、および土地の区画を含む群から選択される属性を含む、請求項17に記載のコンピュータ実施方法。
  19. 前記座標値が、前記初期ベクトル・データ・セットを前記グリッド・セルに索引付けする緯度および経度座標のセットを含む、請求項18に記載のコンピュータ実施方法。
  20. 前記画像認識動作が、
    少なくとも1つのグリッド・セルによって規定されるラスタ形状を有するラスタ・オブジェクトを決定することと、
    前記ラスタ形状を、前記基準ベクトル・オブジェクトによって規定されるベクトル形状と比較することと、
    前記ラスタ形状が前記ベクトル形状に一致したときに、グリッド座標の前記最小の1つのセットを決定することと、
    をさらに含む、請求項19に記載のコンピュータ実施方法。
  21. 問い合わせ結果を生成するためにデータベース・システムを動作させるコンピュータ実施方法であって、前記方法が、
    電子ハードウェア・コントローラを含む処理サブシステムを介して、複数のグリッド・セルを含むグリッド・システムを生成し、前記グリッド・セルを、第1のデータ・フォーマットを有する初期データ・セット上にオーバレイすることであって、各グリッド・セルが、第2のデータ・フォーマットを有し、グリッド座標のセットが付与されたデータを表現する、前記オーバレイすることと、
    電子ハードウェア・コントローラを含むファイル・フォーマッティング・サブシステムを介して、前記第2のデータ・フォーマットに対応する座標値を、前記第1のデータ・フォーマットを有する初期データ・セット内に含まれるデータ・オブジェクトに付与することと、
    デュアル・フォーマット・データ・ファイル内において、前記第1のフォーマットを有する選択されたデータ・オブジェクトの識別情報を、前記選択されたデータ・オブジェクトの上に重なる選択されたグリッド・セルに対応する座標の選択されたセットと共に記憶することと、
    前記第2のデータ・フォーマットを有する少なくとも1つのターゲット・データ・オブジェクトのための問い合わせを受信し、前記問い合わせに基づいて前記第1のデータ・フォーマットを有する基準データ・オブジェクトを生成することと、
    前記基準データ・オブジェクトと前記複数のグリッド・セルとの間の比較に基づいて前記第2のデータ・フォーマットを有する前記少なくとも1つのターゲット・データ・オブジェクトを出力することと、
    を含むコンピュータ実施方法。
  22. 前記第1のデータ・フォーマットがベクトル・データ・フォーマットであり、前記第2のデータ・フォーマットがラスタ・データ・フォーマットである、請求項21に記載のコンピュータ実施方法。
  23. 前記基準データ・オブジェクトが基準グリッド座標の少なくとも1つのセットによって規定され、前記処理サブシステムを介して、前記基準グリッド座標に対応する前記複数のグリッド・セルの中の個々のグリッド・セルを出力する、請求項22に記載のコンピュータ実施方法。
  24. 基準グリッド・セルの前記少なくとも1つのセットが境界形状を規定し、前記処理サブシステムが、前記境界形状内に包含される前記個々のグリッド・セルを出力する、請求項23に記載のコンピュータ実施方法。
  25. 前記個々のグリッド・セルが、センサス・データ、気象データ、気温データ、土壌データ、地形データ、土壌データ、およびエネルギー・スペクトル・データを含む群から選択されるラスタ・データを表現する、請求項23または24に記載のコンピュータ実施方法。
  26. データベース・システムを動作させるためのコンピュータ・プログラム製品であって、前記コンピュータ・プログラム製品が、処理回路によって可読であり、請求項6ないし25のいずれかに記載の方法を遂行するための前記処理回路による実行のための命令を記憶するコンピュータ可読記憶媒体を備える、コンピュータ・プログラム製品。
  27. コンピュータ可読媒体上に記憶され、デジタル・コンピュータの内部メモリ内にロード可能であるコンピュータ・プログラムであって、前記プログラムがコンピュータ上で実行されると、請求項6ないし25のいずれかに記載の方法を遂行するためのソフトウェア・コード部分を含む、コンピュータ・プログラム。
JP2020508531A 2017-08-18 2018-08-15 スケーラブルな時空密度データの融合 Active JP7300797B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US15/680,850 US11204896B2 (en) 2017-08-18 2017-08-18 Scalable space-time density data fusion
US15/680,850 2017-08-18
US15/816,357 2017-11-17
US15/816,357 US11210268B2 (en) 2017-08-18 2017-11-17 Scalable space-time density data fusion
PCT/IB2018/056117 WO2019034999A2 (en) 2017-08-18 2018-08-15 SPEEDABLE SPATIAL-TEMPORAL DENSITY DATA FUSION

Publications (2)

Publication Number Publication Date
JP2020531970A true JP2020531970A (ja) 2020-11-05
JP7300797B2 JP7300797B2 (ja) 2023-06-30

Family

ID=65361217

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020508531A Active JP7300797B2 (ja) 2017-08-18 2018-08-15 スケーラブルな時空密度データの融合

Country Status (6)

Country Link
US (2) US11204896B2 (ja)
JP (1) JP7300797B2 (ja)
CN (1) CN111052105B (ja)
DE (1) DE112018004214T5 (ja)
GB (1) GB2579331A (ja)
WO (1) WO2019034999A2 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11204896B2 (en) 2017-08-18 2021-12-21 International Business Machines Corporation Scalable space-time density data fusion
US10762250B2 (en) 2018-01-08 2020-09-01 Nuvolo Technologies Corporation Interpreter framework for a computer file
US11360970B2 (en) 2018-11-13 2022-06-14 International Business Machines Corporation Efficient querying using overview layers of geospatial-temporal data in a data analytics platform
CN112015929A (zh) * 2019-05-30 2020-12-01 阿里巴巴集团控股有限公司 栅格数据访问方法、装置、电子设备及计算机存储介质
US11783436B2 (en) * 2019-06-04 2023-10-10 Visa International Service Association Magellan: a context-aware itinerary recommendation system built only using card-transaction data
US11594004B2 (en) * 2019-12-26 2023-02-28 International Business Machines Corporation Distributed vector-raster fusion
CN111274454B (zh) * 2020-01-14 2023-03-21 北京明略软件系统有限公司 时空数据的处理方法、装置、电子设备和存储介质
US11798146B2 (en) * 2020-08-06 2023-10-24 Apple Inc. Image fusion architecture
US11775545B1 (en) * 2020-09-23 2023-10-03 Amazon Technologies, Inc. Cloud-based database for spatial data lifecycle management
CN113886402B (zh) * 2021-12-08 2022-03-15 成都飞机工业(集团)有限责任公司 一种基于分支的航空线束信息集成方法及可读存储介质
CN115510337B (zh) * 2022-09-14 2023-05-09 广西壮族自治区自然资源遥感院 一种三维立体注记调度显示的方法
CN117033366B (zh) * 2023-10-09 2023-12-29 航天宏图信息技术股份有限公司 基于知识图谱的泛在时空数据交叉验证方法及装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06230767A (ja) * 1993-01-29 1994-08-19 Hitachi Ltd 情報表示方法
US5487139A (en) * 1991-09-10 1996-01-23 Niagara Mohawk Power Corporation Method and system for generating a raster display having expandable graphic representations
JPH10171346A (ja) * 1996-12-09 1998-06-26 Matsushita Electric Ind Co Ltd 地図データの格納方法
JPH11258976A (ja) * 1998-03-13 1999-09-24 Matsushita Electric Ind Co Ltd ラスタ形式地図の格納方法
JP2003157287A (ja) * 2001-11-19 2003-05-30 New Industry Research Organization 空間情報データ構造に時間要素を付加した時空間情報システムとそのプログラム
JP2004240547A (ja) * 2003-02-04 2004-08-26 Hitachi Software Eng Co Ltd 画像処理プログラム
JP2006267228A (ja) * 2005-03-22 2006-10-05 Mitsubishi Electric Information Systems Corp ラスタ地図検索装置
US20070253642A1 (en) * 2006-04-27 2007-11-01 Mapinfo Corporation Method and apparatus for indexing, storing and retrieving raster (GRID) data in a combined raster vector system
JP2011065550A (ja) * 2009-09-18 2011-03-31 Hitachi Solutions Ltd 空中写真検索システム

Family Cites Families (61)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5761328A (en) * 1995-05-22 1998-06-02 Solberg Creations, Inc. Computer automated system and method for converting source-documents bearing alphanumeric text relating to survey measurements
US6396492B1 (en) 1999-08-06 2002-05-28 Mitsubishi Electric Research Laboratories, Inc Detail-directed hierarchical distance fields
US7426455B1 (en) 1999-09-13 2008-09-16 Science Applications International Corporation Optimal boolean set operation generation among polygon-represented regions
US6674445B1 (en) 1999-10-12 2004-01-06 Autodesk, Inc. Generalized, differentially encoded, indexed raster vector data and schema for maps on a personal digital assistant
US9280748B2 (en) 2012-06-22 2016-03-08 Knowm Tech, Llc Methods and systems for Anti-Hebbian and Hebbian (AHaH) feature extraction of surface manifolds using
US7107285B2 (en) 2002-03-16 2006-09-12 Questerra Corporation Method, system, and program for an improved enterprise spatial system
US7254271B2 (en) 2003-03-05 2007-08-07 Seadragon Software, Inc. Method for encoding and serving geospatial or other vector data as images
US7133054B2 (en) 2004-03-17 2006-11-07 Seadragon Software, Inc. Methods and apparatus for navigating an image
US7352892B2 (en) 2003-03-20 2008-04-01 Micron Technology, Inc. System and method for shape reconstruction from optical images
US7966301B2 (en) 2003-05-09 2011-06-21 Planeteye Company Ulc System and method for employing a grid index for location and precision encoding
CA2436312C (en) 2003-08-01 2011-04-05 Perry Peterson Close-packed, uniformly adjacent, multiresolutional, overlapping spatial data ordering
US20050234991A1 (en) * 2003-11-07 2005-10-20 Marx Peter S Automated location indexing by natural language correlation
US8675995B2 (en) 2004-07-09 2014-03-18 Terrago Technologies, Inc. Precisely locating features on geospatial imagery
US20060271281A1 (en) 2005-05-20 2006-11-30 Myron Ahn Geographic information knowledge systems
US7535473B2 (en) 2005-09-20 2009-05-19 Erdas, Inc. Collaborative environments in a graphical information system
US20070226314A1 (en) 2006-03-22 2007-09-27 Sss Research Inc. Server-based systems and methods for enabling interactive, collabortive thin- and no-client image-based applications
US7965902B1 (en) 2006-05-19 2011-06-21 Google Inc. Large-scale image processing using mass parallelization techniques
US20080046184A1 (en) 2006-08-16 2008-02-21 Zachary Bortolot Method for estimating forest inventory
US20090022359A1 (en) 2007-07-19 2009-01-22 University Of Delaware Vegetation index image generation methods and systems
US8099264B2 (en) 2007-09-28 2012-01-17 Harris Corporation Geospatial modeling system providing inpainting and error calculation features and related methods
JP2011511358A (ja) 2008-02-01 2011-04-07 ヒューレット−パッカード デベロップメント カンパニー エル.ピー. 自動赤目検出
US9235334B2 (en) 2008-05-09 2016-01-12 Genesis Industries, Llc Managing landbases and machine operations performed thereon
WO2009137967A1 (en) 2008-05-16 2009-11-19 Shanghai Hewlett-Packard Co., Ltd Provisioning a geographical image for retrieval
US9442960B2 (en) 2008-05-16 2016-09-13 Lawrence Livermore National Security, Llc High performance data layout and processing
US8175332B2 (en) 2008-05-22 2012-05-08 International Business Machines Corporation Upper troposphere and lower stratosphere wind direction, speed, and turbidity monitoring using digital imaging and motion tracking
US8179393B2 (en) 2009-02-13 2012-05-15 Harris Corporation Fusion of a 2D electro-optical image and 3D point cloud data for scene interpretation and registration performance assessment
US20110128288A1 (en) 2009-12-02 2011-06-02 David Petrou Region of Interest Selector for Visual Queries
US8176053B2 (en) 2010-02-17 2012-05-08 Lockheed Martin Corporation Query system for a hybrid voxel and feature database
US9025810B1 (en) 2010-04-05 2015-05-05 Google Inc. Interactive geo-referenced source imagery viewing system and method
US8504393B2 (en) * 2010-09-10 2013-08-06 State Farm Mutual Automobile Insurance Company Systems and methods for grid-based insurance rating
US9082188B2 (en) 2011-04-11 2015-07-14 Hid Global Corporation Optical topographic imaging
US8605998B2 (en) 2011-05-06 2013-12-10 Toyota Motor Engineering & Manufacturing North America, Inc. Real-time 3D point cloud obstacle discriminator apparatus and associated methodology for training a classifier via bootstrapping
US8582808B2 (en) 2011-06-16 2013-11-12 CSC Holdings, LLC Methods for identifying rooftops using elevation data sets
CN102368272B (zh) * 2011-11-15 2013-07-24 中国科学院地理科学与资源研究所 一种数据库系统实现栅格数据类型的方法及其系统
US9046363B2 (en) 2012-04-27 2015-06-02 SATOP GmbH Using multispectral satellite data to determine littoral water depths despite varying water turbidity
US9053161B2 (en) * 2012-08-30 2015-06-09 International Business Machines Corporation Database table format conversion based on user data access patterns in a networked computing environment
US9734220B2 (en) 2012-12-04 2017-08-15 Planet Os Inc. Spatio-temporal data processing systems and methods
US9436784B2 (en) 2013-02-08 2016-09-06 University Of Alaska Fairbanks Validating and calibrating a forecast model
US9710882B2 (en) * 2013-06-25 2017-07-18 Iteris Inc. Data overlay for animated map weather display and method of rapidly loading animated raster data
US20150317511A1 (en) 2013-11-07 2015-11-05 Orbeus, Inc. System, method and apparatus for performing facial recognition
US8761457B1 (en) 2013-11-27 2014-06-24 Google Inc. Aligning ground based images and aerial imagery
US20150371420A1 (en) 2014-06-19 2015-12-24 Samsung Electronics Co., Ltd. Systems and methods for extending a field of view of medical images
US20160379388A1 (en) 2014-07-16 2016-12-29 Digitalglobe, Inc. System and method for combining geographical and economic data extracted from satellite imagery for use in predictive modeling
US9418290B2 (en) 2014-12-12 2016-08-16 Omniearth, Inc. System and method for managing water
CA2892885C (en) 2015-02-20 2020-07-28 Tetra Tech, Inc. 3d track assessment system and method
US10685408B2 (en) 2015-03-27 2020-06-16 Omniearth, Inc. System and method for predicting crop yield
US20160299910A1 (en) 2015-04-09 2016-10-13 Umm Al-Qura University Method and system for querying and visualizing satellite data
US9842282B2 (en) 2015-05-22 2017-12-12 Here Global B.V. Method and apparatus for classifying objects and clutter removal of some three-dimensional images of the objects in a presentation
US10372705B2 (en) 2015-07-07 2019-08-06 International Business Machines Corporation Parallel querying of adjustable resolution geospatial database
SG10201506012SA (en) 2015-07-31 2017-02-27 Accenture Global Services Ltd Inventory, growth, and risk prediction using image processing
CN105787457A (zh) 2016-03-08 2016-07-20 浙江工商大学 一种modis卫星集成dem提高植被分类遥感精度的估算方法
DK3223191T3 (da) 2016-03-23 2021-08-16 Leica Geosystems Ag Skabelse af en 3d-bymodel ud fra skrå billeddannelses- og lidardata
US20170323028A1 (en) 2016-05-04 2017-11-09 Uncharted Software Inc. System and method for large scale information processing using data visualization for multi-scale communities
US10445877B2 (en) 2016-12-30 2019-10-15 International Business Machines Corporation Method and system for crop recognition and boundary delineation
US20180217233A1 (en) 2017-01-31 2018-08-02 Toyota Research Institute, Inc. Systems and methods for estimating objects using deep learning
US10410091B2 (en) 2017-08-10 2019-09-10 International Business Machines Corporation Detecting artifacts based on digital signatures
US11204896B2 (en) 2017-08-18 2021-12-21 International Business Machines Corporation Scalable space-time density data fusion
US20210090300A1 (en) 2017-12-12 2021-03-25 Oy Arbonaut Ltd. A method to quantify fire risk to structures
CN108681715A (zh) 2018-05-18 2018-10-19 三亚中科遥感研究所 海南热带天然林植被型组分类方法
US10839264B2 (en) 2018-11-09 2020-11-17 International Business Machines Corporation Scalable feature classification for laser scanning data and digital elevation models
US11360970B2 (en) 2018-11-13 2022-06-14 International Business Machines Corporation Efficient querying using overview layers of geospatial-temporal data in a data analytics platform

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5487139A (en) * 1991-09-10 1996-01-23 Niagara Mohawk Power Corporation Method and system for generating a raster display having expandable graphic representations
JPH06230767A (ja) * 1993-01-29 1994-08-19 Hitachi Ltd 情報表示方法
JPH10171346A (ja) * 1996-12-09 1998-06-26 Matsushita Electric Ind Co Ltd 地図データの格納方法
JPH11258976A (ja) * 1998-03-13 1999-09-24 Matsushita Electric Ind Co Ltd ラスタ形式地図の格納方法
JP2003157287A (ja) * 2001-11-19 2003-05-30 New Industry Research Organization 空間情報データ構造に時間要素を付加した時空間情報システムとそのプログラム
JP2004240547A (ja) * 2003-02-04 2004-08-26 Hitachi Software Eng Co Ltd 画像処理プログラム
JP2006267228A (ja) * 2005-03-22 2006-10-05 Mitsubishi Electric Information Systems Corp ラスタ地図検索装置
US20070253642A1 (en) * 2006-04-27 2007-11-01 Mapinfo Corporation Method and apparatus for indexing, storing and retrieving raster (GRID) data in a combined raster vector system
JP2011065550A (ja) * 2009-09-18 2011-03-31 Hitachi Solutions Ltd 空中写真検索システム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
中村春雄,外1名: "地図情報支援施設管理システム", 三菱電機技報, vol. 第67巻,第5号, JPN6007003994, 25 May 1993 (1993-05-25), JP, pages 63 - 68, ISSN: 0004988774 *
大塚 健太,外1名: "NTTグループにおけるOSSの活用 第4回 空間情報システムのOSSへの展開", BUSINESS COMMUNICATION, vol. 第49巻,第4号, JPN6019036784, 1 April 2012 (2012-04-01), JP, pages 8 - 11, ISSN: 0004988773 *

Also Published As

Publication number Publication date
JP7300797B2 (ja) 2023-06-30
US11204896B2 (en) 2021-12-21
US20190057109A1 (en) 2019-02-21
CN111052105B (zh) 2023-09-01
GB2579331A (en) 2020-06-17
GB202003659D0 (en) 2020-04-29
DE112018004214T5 (de) 2020-04-30
US11210268B2 (en) 2021-12-28
US20190057110A1 (en) 2019-02-21
CN111052105A (zh) 2020-04-21
WO2019034999A3 (en) 2019-06-27
WO2019034999A2 (en) 2019-02-21

Similar Documents

Publication Publication Date Title
JP7300797B2 (ja) スケーラブルな時空密度データの融合
US9158843B1 (en) Addressing mechanism for data at world wide scale
US20190102447A1 (en) System and method for metadata sandboxing and what-if analysis in a multidimensional database environment
Hongchao et al. Distributed data organization and parallel data retrieval methods for huge laser scanner point clouds
US10409814B2 (en) Network common data form data management
Olasz et al. A new initiative for tiling, stitching and processing geospatial big data in distributed computing environments
Jhummarwala et al. Parallel and distributed GIS for processing geo-data: an overview
Karimi et al. Exploring Real‐Time Geoprocessing in Cloud Computing: Navigation Services Case Study
CN104301354B (zh) 一种基于云计算的空间类业务数据gis化服务的实现方法和系统
Alfaqih et al. GIS Cloud: Integration between cloud things and geographic information systems (GIS) opportunities and challenges
CN106575296B (zh) 用于托管的分析的动态n维立方体
US10169083B1 (en) Scalable method for optimizing information pathway
Loukili et al. Geospatial Big Data Platforms: A Comprehensive Review
US20220043789A1 (en) Data deduplication in data platforms
Tripathi et al. A comparative analysis of conventional hadoop with proposed cloud enabled hadoop framework for spatial big data processing
Khosla et al. Big data technologies
US20160275154A1 (en) Efficient calculations within a hierarchically organized data structure
Rodriges Zalipynis et al. The wikience: community data science. Concept and implementation.
Azri et al. Crisp Clustering Algorithm for 3D geospatial vector data quantization
Rueda-Ruiz et al. SPSLiDAR: towards a multi-purpose repository for large scale LiDAR datasets
Gambs et al. Mapreducing gepeto or towards conducting a privacy analysis on millions of mobility traces
US10311019B1 (en) Distributed architecture model and management
KR20210074550A (ko) 스마트시티 서비스를 위한 시공간 빅데이터 처리 시스템
Lynnes et al. Archive management of NASA earth observation data to support cloud analysis
Xiong et al. HiGIS: An open framework for high performance geographic information system

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200904

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210122

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210813

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210921

RD12 Notification of acceptance of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7432

Effective date: 20211125

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211213

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20220502

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220517

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20220808

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221014

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230214

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230511

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230530

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20230530

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230616

R150 Certificate of patent or registration of utility model

Ref document number: 7300797

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150