JP6773412B2 - コロプレスマップの設計 - Google Patents

コロプレスマップの設計 Download PDF

Info

Publication number
JP6773412B2
JP6773412B2 JP2015242288A JP2015242288A JP6773412B2 JP 6773412 B2 JP6773412 B2 JP 6773412B2 JP 2015242288 A JP2015242288 A JP 2015242288A JP 2015242288 A JP2015242288 A JP 2015242288A JP 6773412 B2 JP6773412 B2 JP 6773412B2
Authority
JP
Japan
Prior art keywords
index
cluster
map
row
clustering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015242288A
Other languages
English (en)
Other versions
JP2016126771A (ja
JP2016126771A5 (ja
Inventor
ベルギッテ イスマエル
ベルギッテ イスマエル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dassault Systemes SE
Original Assignee
Dassault Systemes SE
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dassault Systemes SE filed Critical Dassault Systemes SE
Publication of JP2016126771A publication Critical patent/JP2016126771A/ja
Publication of JP2016126771A5 publication Critical patent/JP2016126771A5/ja
Application granted granted Critical
Publication of JP6773412B2 publication Critical patent/JP6773412B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/904Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computing Systems (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Algebra (AREA)
  • Remote Sensing (AREA)
  • Medical Informatics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は特に、地図設計の分野に関し、特に、コロプレスマップを設計するためのコンピュータ実装方法、コンピュータプログラム、およびシステムに関する。
コロプレスマップ(chloropeth map)は、地理的情報システム(GIS)に使用されることが多い。これは、統計的変数を地図上で表し、地図の各領域上のその変数の値が、色の明度(color intensity)によって表される課題に関係する。表示される統計的変数は、異なる性質(人口密度、居住者による車の数、降雨、病気の比率)の変数とすることができる。
このコンテキストでは、選択される明度の組の選択は、この表現において基本的なものである(primordial)。この選択に使用される背景技術の2つの主要なアルゴリズムは、Jenks/Fisherのnatural breaks optimization(非特許文献1および2の論文において説明される)、およびHead−tail breaks(非特許文献3、および非特許文献4または非特許文献5の論文において説明される)。それらの解決策は、実際に、クラスタ分析アルゴリズムに基づいている。クラスタ分析を使用するコロプレスマップシステムの他の例は、特許文献1、特許文献2および特許文献3の文書を含む。
コロプレスマップの設計は、ある意味で、量子化(すなわち、予め定められた距離に従って、予め定められた組の値の最も近い1つ値による入力値の置き換え)に関係する。実際に、地図の領域は、共にグループ化され、したがって、そのような領域に対する統計的変数の値は、グループを表す値によって置き換えられる。この全体のフレームワークは、クラスタ分析の更なる全体的な分野に関連する。
クラスタ分析は、グループ(クラスタと称される)におけるオブジェクトの組を区分化し、それによって、各グループにおいて、データが類似するようになる(非特許文献6の論文を参照)タスクに関係する。それは、データマイニング(非特許文献7の論文を参照)、機械学習(非特許文献8の論文を参照)、および大規模探索(非特許文献9の論文を参照)における主要な問題のように見える。クラスタ分析は、量子化、各クラスタに中心(center)を割り当て、1つは、そのクラスタの中心に各ポイントを量子化することにある単純な量子化を有する、重要なツールである。
K平均クラスタリング問題は、クラスタ分析の最も有名な問題であり、パルス符号変調のための技術として、1957年にBell研究所においてStuart Lloydによって導入されている。Lloydアルゴリズムは、p次元のポイントの集合を入力と見なし、および「全歪み」最小化することを目的とするそれらのポイントの区画(partition)を出力する。このアルゴリズムは、発見的問題解決(heuristic)であるにすぎない(最適なクラスタリングをもたらさない)。しかしながら、実際には、K平均クラスタリング問題が一次元でないケースにおけるNP困難(NP-hard)であるので、厳密なアルゴリズムを期待することはできない。Lloydアルゴリズムが最近では広く使用されている。幾つかの変形例がまた提案されている(非特許文献10を参照)。
1次元の適用が特に重要である。この問題に対する最も有名なアルゴリズムの1つは、上述した、1967年に開発されたJenks natural breaks optimizationであり(非特許文献11の論文を参照)、上述したように、地図製作を目的に導入されている。Lloydアルゴリズムとして、それは発見的問題解決であるにすぎない。2011年に、CK平均(CKmeans)と称される、厳密なアルゴリズムが、WangおよびSongによって開発されている(非特許文献12の論文を参照)。このアルゴリズムは、特許文献4の基礎(corner stone)である。それは時間O(K*n2)において実行し、Kは要求される数のクラスタであり、およびnは実数の数である。さらに最近では(2013年に)、Maarten Hilferinkが、より効率的なアルゴリズムを開発し、およびそれの実装を提供している。この実装は、コロプレスマップに対してより正確な、地図製作に実際に特化されているが、このアルゴリズムの文献のみは、Wikipediaのページである(非特許文献13)。
米国特許出願公開第2005/0278182号明細書 米国特許第8412419号明細書 米国特許第8510080号明細書 米国特許第1543036号明細書
"The Data Model Concept in Statistical Mapping", by Jenks, 1967 "On grouping for maximum homogeneity" by Fisher, 1958 "A comparison study on natural and head/tail breaks involving digital elevation models" by Lin and Yue, 2013 "Head/tail breaks for visualizing the fractal or scaling structure of geographic features" by Jiang and Bing, 2014 "Ht-index for quantifying the fractal or scaling structure of geographic features" Jain et al., "Data Clustering: A Review" Chen et al., "Data mining: an overview from a database perspective" book of Murphy, "Machine Learning, A Probabilistic Perspective" Goodrum, "Image Information Retrieval: An Overview of Current Research" J.A. Hartigan (1975), "Clustering algorithms", John Wiley & Sons, Inc." Jenks, "The Data Model Concept in Statistical Mapping", in International Yearbook of Cartography Wang and Wong, "Optimal k-means Clustering in One Dimension by Dynamic Programming" Fisher's Natural Breaks Classification, accessible at the following URL at the priority date: http://wiki.objectvision.nl/index.php/Fisher%27s_Natural_Breaks_Classification http://en.wikipedia.org/wiki/Choropleth_map#Color_progression Gray and Neuhoff, "Quantization" MacQueen, "Some Methods for classification and Analysis of Multivariate Observations" Bellman, "The theory of dynamic programming" Bradford and Reinert, "Lower Bounds for Row Minima Searching",1996 Alon and Azar, "Comparison-Sorting and Selecting in Totally Monotone Matrices" Cechlarova and Szabo, "On the Monge property of matrices" Bein, Golin, Larmore, and Zhang, "The Knuth-Yao quadrangle-inequality speedup is a consequence of total-monotonicity"
しかしながら、それらの既存の方法の全ては、最適なK平均クラスタリングを提供せず、非常に低速であることから、それらは限定されている。このコンテキスト内で、コロプレスマップを設計するための改善された解決策の必要性がいまだに存在する。
したがって、コロプレスマップを設計するためのコンピュータ実装方法が提供される。方法は、地図、および地図のそれぞれの領域において統計的変数を表す数値の数を設けるステップを備える。方法はまた、予め定められた数のクラスタに対する数値の最適K平均クラスタリングを算出するステップを備える。算出するステップは、予め定められた数のクラスタに対応する回数、数値の数に等しい次数の正方行列に適用される線形時間行最小検索アルゴリズムを反復することを含む。方法はまた、算出されたクラスタリングの各々のクラスタにそれぞれの配色(coloration)を割り当てるステップを備える。方法はまた、それぞれの数値が設けられる地図の全ての領域において、それぞれの数値が属するクラスタに割り当てられた配色を適用するステップを備える。
方法は以下のうちの1つまたは複数を備えてもよく、すなわち、
−方法は、予め定められた色を設けるステップをさらに備え、それぞれのクラスタに割り当てられた配色は、それぞれのクラスタの数値によって決まる予め定められた色の明度であり、
−それぞれのクラスタに割り当てられた配色は、それぞれのクラスタの中心の値によって次第に(increasingly)決まる予め定められた色の明度であり、
−その結果、数値がソートおよびインデックス付けされ、算出するステップ内で反復することは、正方行列に適用される線形時間行最小検索アルゴリズムに従って、各々のそれぞれの反復ランク(iteration rank)において、および数値の数未満のそれぞれのインデックスごとに、それぞれの反復ランクに対応するクラスタの数で、それぞれのインデックス未満でインデックス付けされた数値のサブセットに対して達成可能な最小全歪み(minimal total distortion)を算出することを含み、
−各々のそれぞれの反復ランクにおいて、および数値の数未満のそれぞれのインデックスごとに、行インデックスごと、および列インデックスごとに、行列エントリ(matrix entry)は、行インデックスに先行するインデックスに対する前の反復において算出された最小全歪みの合計、および行インデックスと列インデックスとの間の数値の連続するサブセットの歪みに対応し、
−方法は、各々のそれぞれの反復ランクにおいて、行最小検索アルゴリズムによって返されるインデックスを記憶するステップをさらに備え、
−方法は、算出するステップにおいて、記憶されたインデックスから最適なクラスタリングを判定するステップ、ならびに/または、
−記憶されたインデックスから最適なクラスタリングを判定するステップは、記憶されたインデックスにおいて、最後にインデックス付けされた数値から開始して、数値を反復して区分化する(partitioning)ステップであって、各々のそれぞれの反復ランクにおいて、現在形成されているクラスタの開始数値のインデックスは、予め定められた数のクラスタから、現在形成されているクラスタの最後にインデックス付けされた数値のインデックスに等しい行インデックスに対するそれぞれの反復ランクを減算したものに等しいランクの反復において、算出するステップ内で反復する間に記憶されたインデックスに等しい、ステップをさらに備える。
方法を実行するための命令を備えたコンピュータプログラムがさらに提供される。
コンピュータプログラムを記憶したコンピュータ可読記憶媒体がさらに提供される。
コンピュータプログラムを記憶した、メモリに結合されたプロセッサを備えたシステムがさらに提供される。
方法によって取得可能なコロプレスマップがさらに提供される。
コロプレスマップを記憶したデータ記憶媒体がさらに提供される。
本発明の実施形態は、非限定的な例によって、かつ添付図面を参照して説明される。
例示的な方法のフローチャートを示す。 例示的なシステムを示す。 例示的な方法を示す。 例示的な方法を示す。
図1のフローチャートを参照して、コロプレスマップを設計する(例えば、記述/作成/定義する)コンピュータ実装方法が提案される。方法は、(例えば、ブランクの(blank)および/または地理的な)地図(例えば、地理的領域を表す線の2次元表示(2D view of lines)を少なくとも含む)、ならびに地図のそれぞれの領域における統計的変数(すなわち、人口密度、居住者による車の数、降雨、病気の比率などの、任意の人口統計/地理的/地質学的/戦略地政学的/医療/商業/マーケティング変数)を表す(例えば、それらによってとられる値)数値の数(例えば、任意の数)(すなわち、数値の各々は、地図の局地的な範囲/領域を表す地図の位置と関連付けられ、よって、地図は、線およびそのような位置への参照(referential)を備えることができ、例えば、地図は、画素に関連付けられた地理的領域および数値の単純な描画であり、または地図は、正方形、長方形、円もしくは楕円面上で地球若しくはその一部を表す球体の投影(projection)を記述するデータを含む、さらなる複合的なデータの部分として設けられ、次いで、数値は、投影上の位置に対応する座標を備える)を設けるステップS10を備える。方法はまた、予め定められた数のクラスタに対する数値の最適K平均クラスタリングを算出するステップS20を備える。算出するステップS20は、予め定められた数のクラスタに対応する回数、数値の数に等しい次数の正方行列に適用される線形時間行最小検索アルゴリズムを反復するステップを含む。また、方法は、それぞれの配色を、算出されたクラスタリングの各々のクラスタに割り当てるステップ(S30)、およびそれぞれの数値が設けられる地図の全ての領域において、割り当てられた配色を、それぞれの数値が属するクラスタに適用し、それによって、視覚的詳細(visual details)を地図に追加する(すなわち、配色)ステップS40を備える。そのような方法は、コロプレスマップの設計を改善する。
特に、方法によって、従来技術によって既知であり、かつ提供されるように、コロプレスマップを設計するために統計的データの値をクラスタリングする(S20)ことが可能になる。方法は、最適K平均クラスタリングを算出する(S20)ことによって、そのようなクラスタリングを実行する(S30)ので、方法は、コロプレスマップを作成するためにK平均クラスタリングを通常目標にする地理的情報システムの分野において公知なように、比較的高品質のコロプレスマップを設計する。しかしながら、最も重要なことに、方法は、予め定められた数のクラスタに対応する回数、数値の数に等しい次数の正方行列に適用される線形時間行最小検索アルゴリズムを反復することによって、そのような算出S20を実行する。本方法によって実行されるこの特定のアルゴリズムのフレームワークによって、後述するように、最適K平均クラスタリングの算出が高速に実行される。
方法は、コンピュータによって実行される。これは、方法のステップ(すなわち、実質的に全てのステップ)が、少なくとも1つのコンピュータ、または同様の任意のシステムによって実行されることを意味する。よって、方法のステップは、場合によっては完全に自動で(例えば、設けるステップS10を除く全てのステップ)、または半自動でコンピュータによって実行される。例では、方法のステップの少なくとも一部をトリガすることは、ユーザ−コンピュータの対話を通じて実行される(例えば、設けるステップS10)。要求されるユーザ−コンピュータの対話のレベルは、予想される機械的動作(automatism)によって決まることがあり、およびユーザの要求を実装する必要性とのバランスをとられることがある。例では、このレベルは、ユーザにより定義されてもよく、または事前定義されてもよい。
コンピュータ実装方法の典型的な例は、この目的のために適合されたシステムで方法を実行することである。システムは、メモリに結合されたプロセッサを備えてもよく、メモリは方法を実行するための命令を備えたコンピュータプログラムを記憶している。メモリはまた、方法によって処理されるデータを維持するように適合されたデータベースを記憶している。メモリは、場合によっては幾つかの物理的に別個の部分(parts)(例えば、1つはプログラム用であり、場合によっては、1つはデータベース用である)を備えた、そのような記憶に適合された任意のハードウェアである。
図2は、システムの例を示し、システムは、クライアントコンピュータシステム、例えば、ユーザのワークステーションである。例示のクライアントコンピュータは、内部通信バス1000に接続された中央処理装置(CPU)1010、またバスに接続されたランダムアクセスメモリ(RAM)1070を備える。クライアントコンピュータはさらに、バスに接続されたビデオランダムアクセスメモリ1100と関連付けられたグラフィカルプロセシングユニット(GPU)1110が設けられる。ビデオRAM1100は、フレームバッファとしても本分野で知られている。大容量記憶装置コントローラ1020は、ハードドライブ1030などの大容量メモリデバイスへのアクセスを管理する。コンピュータプログラム命令およびデータを有形的に具体化するのに適切な大容量メモリデバイスは、例として、EPROM、EEPROM、およびフラッシュメモリデバイスなどの半導体メモリデバイス、内蔵ハードディスクおよび着脱可能ディスクなどの磁気ディスク、光磁気ディスク、ならびにCD−ROMディスク1040を含む、全ての形式の不揮発性メモリを含む。上述したことのいずれかは、特別に設計されたASIC(特定用途向け集積回路)によって補完されてもよく、またはそれに組み込まれてもよい。ネットワークアダプタ1050は、ネットワーク1060へのアクセスを管理する。クライアントコンピュータはまた、カーソル制御装置、またはキーボードなどの触覚デバイス1090を含んでもよい。カーソル制御装置は、ディスプレイ1080上の任意の所望の位置においてユーザが選択的にカーソルを位置付けることを可能にするために、クライアントコンピュータにおいて使用される。加えて、カーソル制御装置によって、ユーザは種々のコマンドを選択することが可能になり、および制御信号を入力することが可能になる。カーソル制御装置は、システムに制御信号を入力するための幾つかの信号生成デバイスを含む。概して、カーソル制御装置は、信号を生成するために使用されるマウス、マウスのボタンであってもよい。代わりに、または加えて、クライアントコンピュータシステムは、感知パッド、および/または感知スクリーンを備えてもよい。
コンピュータプログラムは、コンピュータにより実行可能な命令を備えてもよく、命令は、上記システムに方法を実行させる手段を備える。プログラムは、システムのメモリを含む、任意のデータ記憶媒体上で記録可能であってもよい。プログラムは、例えば、デジタル電子回路、またはコンピュータハードウェア、ファームウェア、ソフトウェア、もしくはそれらの組合せで実装されてもよい。プログラムは、装置、例えば、プログラム可能なプロセッサによって実行される機械可読記憶デバイスで有形的に具体化される製品として実装されてもよい。方法のステップは、入力データを操作し、および出力を生成することによって、方法の機能を実行するために、命令のプログラムを実行するプログラム可能プロセッサによって実行されてもよい。よって、プロセッサは、データ記憶システム、少なくとも1つの入力デバイス、および少なくとも1つの出力デバイスからデータおよび命令を受信し、ならびにそれらにデータおよび命令を送信するようにプログラム可能であってもよく、およびそれらに結合されてもよい。アプリケーションプログラムは、高レベル手続型プログラミング言語、もしくはオブジェクト指向プログラミング言語、または望ましい場合にアセンブリ言語もしくは機械語で実装されてもよい。いずれにしても、言語はコンパイル言語またはインタープリタ言語であってもよい。プログラムは、完全インストールプログラムまたはアップデートプログラムであってもよい。システム上のプログラムのアプリケーションは、方法を実行するための命令におけるいずれかのケースをもたらす。
方法は、特にコロプレスマップ設計に適用される、改善されたデータクラスタリングアルゴリズムを提案する。しかしながら、方法のアルゴリズム的な解決策を詳述する前に、そのコンテキスト(すなわち、その適用)がここで詳述される。
方法は、コロプレスマップを設計する。
上述したように、かつ従来技術から公知なように、このタイプの地図は、統計のサブ領域、統計のそれぞれの値に関連付けられた各々の配色、または統計の連続した範囲において統計的変数/測定値(measure)の値に従って地理的領域のそのようなサブ領域を異なる配色(例えば、色/テキスチャ)で表現/表示する、(主として、2次元、しかしながら場合によっては3次元)表示である。このコンテキストでは。用語「配色」(例えば、色/テキスチャ)は、概して、当該サブ領域上で展開される任意の視覚情報を指定する。主として、配色は、その明度が統計的変数の増加関数にある色(RGBまたはグレースケール)である。しかしながら、配色はまた、プリズムマップ(prism map)のケース(コロプレスマップの特定のケース)では、統計的変数に比例した高さである。図3は、地図の異なる領域に割り当てられた異なるグレースケールの明度で、方法によって取得することができるコロプレスマップの例を示す。概して、コロプレスマップの設計は、配色の値および統計的変数の値の予め定められた、順序付けされ、かつ1次元の組(よって、1次元の順序付けされた領域に関連付けられる(それに含まれない場合に))の間の予め定められた増加する関係(increasing relationship)に基づいてもよい。
そのような地図の設計は、方法のケースでは、従来技術の古典的パイプラインに従う。最初に、方法は、単純な曲線地図(contour map)(主としてブランクの)および地図のそれぞれの領域に関連付けられた統計的変数の値で、S10において開始する。目的は、統計のそのような数値表現を、単純かつ有意な視覚化を得る方法で変換することである。これは、クラスタリングが介入する場合である。実際に、コロプレスマップは、異なる配色を統計的変数の各々の値に理論上割り当てるが、これは、計算上の目的では重くないことがあり、これはまた、ユーザにとって非常に有意でないことがある(地図が非常に「ビジー」である)。
既知のように、K平均クラスタリングは特に、それが有効な方法で統計的変数の値を収集するので、意味的な観点から有利である。よって、統計的変数の値は、K平均クラスタリング(地図の観察者および/または設計者に応じたクラスタの数、それは、方法のコンテキストで事前に判定される)で方法によってクラスタリングされ、次いで、統計的変数の値に割り当てられた地図の各々の領域(場合によっては、S10において設けられたデータに応じた全ての領域)は、ここで、それぞれのクラスタ(その領域に対する統計的変数の値のクラスタ)に関連付けられる。ここで、方法は、算出されたクラスタリングの各々のクラスタにそれぞれの配色を割り当てるので(S30)、方法は、S40によってコロプレスマップを作成することができる。これは、全てが上述した従来技術において非常に古典的であり、かつ広範囲に説明される。
配色を実行する任意の古典的方法は、本方法によって実装されてもよい。古典的方法は、予め定められた色を設け、次いで、それぞれのクラスタに予め定められた色の明度を割り当てることである。例えば、色がRGBで設けられる場合、各々のそれぞれの明度は、RGBの重みに適用される因子(例えば、0〜1)に対応する。同じことは、グレースケールの色に対して実行されてもよい。予め定められた色の明度は、それぞれのクラスタの中心の値に応じて次第に決まってもよい。言い換えると、クラスタの中心(例えば、クラスタにおいてグループ化された統計的変数の平均値)は、適用される明度を次第に定義する(すなわち、明度が増すと、視覚化領域に対して統計的変数の値がより高くなることを意味する)。
非特許文献14(優先日に利用可能な)で説明されるような多くの他の方法が適用されてもよい)。
例では、方法は、0(黒)と255(白)との間の異なるグレースケールレベル(図3にあるような)を単純に適用してもよい。例えば、クラスタリングの結果がクラスタの中心c1、…、cK(c1<c2<…<cK)を提供する場合、方法は、c1を0(白)にマッピングし、およびcKを255(黒)にマッピングし、φ:ci→255*(ci−c1)/(cK−c1)、にするアフィン変換を適用してもよい。
これの全ては非常に古典的であり、さらに説明する必要はない。
ここで、本方法は、アルゴリズムの複雑度を低減して(従来技術の厳密な解アルゴリズムと比較して、および合理的な発見的解決法と比較してさえも)最適K平均クラスタリングを発見するので、最適K平均クラスタリングを使用してコロプレスマップを設計することが可能になる。これは、最適K平均クラスタリングにつながらない発見的問題解決、または実際に適用不可能な(複雑度が高すぎるので)発見的問題解決のいずれかを適用する従来技術とは異なる。特に、本方法は、例えば、10000の次数の1000よりも大きいnの値、特に、50よりも大きいkの値、さらに200よりも大きい、例えば、256に対して(グレースケール値の8ビットエンコーディングに対して)最適K平均クラスタリングを発見する。例えば、本方法は作用する。
本方法は、色マッピングレイヤが最適となり(標準目的関数である「全歪み」に関して)、最近の他の最適な量子化よりも高速になるように、地理的統計データの最適な量子化器を生成する。実際に、本方法の算出時間は、最良の発見的問題解決(最適でない量子化を生成する)に匹敵する(かつ、さらに高速であることが多い)
この点で、本方法およびその多くの例のコンテキストが提供されたが、本方法のさらなる詳細(すなわち、後の設計S30〜S40を定義する算出するS20のステップ)は示されていない。これは、以下で行われ、以下で提供される全ての実装の例が、上記提供された例示的な適用例のいずれかに適用されてもよいことに留意されたい。
前に示されたように、方法は、予め定められた数Kのクラスタに対する数値の最適K平均クラスタリングを算出するステップS20を備える。しかしながら、これは乱暴に(brutally)は行われない。実際に、算出するステップS20は、Kに対応する回数、線形時間行最小検索アルゴリズムを反復することを含む(後述する例では、K−1回)。行最小検索アルゴリズムの公知なカテゴリの任意の予め定められた線形時間アルゴリズムのその使用によって、算出するステップS20は、複雑度が低い。よって、方法は、K平均クラスタリング問題の新たな、かつアルゴリズムによる効率的な解決策を実装する。
算出するステップS20に関するさらなる詳細を提供する前に、量子化がここで議論される。実際に、例では、統計的値は、ある程度、S30〜S40の前に「量子化」されてもよい。各領域の統計的値は、それらの対応する領域がクラスタの配色に適用されるように、領域が本方法によって関連付けられるクラスタの中心によって置き換えられるものとして見ることができる。
公知であるように、スカラ量子化は、有限集合
を使用して、実際の値を近似させる算出ツールであり、デジタルステップと称されるVの要素は、近似値として使用される値である。スカラ量子化器は、マッピング
として数学的に定義され、それによって、xとq(x)との間の距離が小さくなり、距離は、ユークリッド距離などの任意の予め定められた距離である(距離の概念はコンテキストによって決まることがある)。
実際に、スカラ量子化器は、間隔(intervals)I1=]−∞,a1[,I2=[a1,a2[,…,IK=[aK-1,∞[(a1<…<aK-1)への、
次いで、各々の
に対する区画を通じて常に定義され、Iiはx∈Iiとなるような間隔のみを表し、値q(x)=ciを関連付ける。実際の数a1,…,aK-1は「閾値(decision bounds)」と称される。非特許文献15の論文は、量子化の完全な調査を与える。
方法は、例えば、最も広く使用されている、非特許文献16の論文で周知であり、かつ定義されたK平均法設定に焦点をあてる。この設定では、方法は、S20において、昇順にソートされた所与のタプル
、および所与の整数K(一般に、K=2bであり、bは各xiをエンコードするのに利用可能なビットの数である)を検索し、量子化器qは、最小全歪みを達成するKのデジタルステップを使用し、全歪みは、
として定義される。
この量を最小化するために、方法は、各々の実際の値xを、その最も近いデジタルステップにマッピングする量子化器を単に扱うことができることが明らかである。よって、問題はまさに、
を最小化するKの中心c1,…,cKを発見することに等しい。
図4は、10の値および4のデジタルステップに対する例を示す。最適な量子化は、集合{c1,…,cK}によって与えられ、それによって、
になる。
この全歪みを最小化することは、量子化ステップ(所与のKに対する)の間に失われる情報をできるだけ少なくすることを理解される必要がある。各ポイントxiがその最も近い中心に黙示的に割り当てられており、よって、方法は、クラスタへの区画を構築しており、各クラスタは、所与の中心に割り当てられたポイントの集合に対応する(よって、最良の量子化器を発見することは、「PCMにおける最小二乗量子化」におけるLloydによって説明されるように、クラスタリング問題である)。k∈{1,…,K}ごとに、中心ckに対応するクラスタをckによって表す。実際には、各々の中心がその対応するクラスタのポイントの平均であることを理解することは容易である。さらに、x1<…<xn、であることが想定されるので、各々のクラスタが、ポイントの連続するサブセットから構成されることに留意されたい。例えば、K=4のクラスタに区分化することを望む47の実数を有する場合、考えられる最適なクラスタリングは、
である。
全て1<=a<=b<=nの場合、表記(notation)
が導入され、また、
を表す。前の例の対応する全歪みは、
TD=disto(1,17)+disto(18,24)+disto(25,42)+disto(43,47)
として記述することができる。
上述したように、この問題の解は既に存在するが、それらは、本方法よりも低速であり、それらのほとんどがまさに発見的問題解決である(すなわち、最適な量子化を生成しない)。
したがって、方法の例示的な実装形態では、数値(x1,…,xn)がソートおよびインデックス付けされる。算出するステップS20内での反復は、各々のそれぞれの反復ランクkにおいて、および数値の数n未満のそれぞれのインデックスjごとに、正方行列Hに適用される線形時間行最小検索アルゴリズムに従って、それぞれの反復ランク(よってk)に対応するクラスタkの数での、j(よってi<=j)未満のインデックス付けされた数値xiのサブセットに対して達成可能な、TDmin(j,k)で表される最小全歪みの算出を含む。
この例では、各々のそれぞれの反復ランクkにおいて、および数値の数n未満のそれぞれのインデックスjごとに、行インデックスiごと、および各々の列インデックスjごとに、行列エントリH(i,j)は、
−行インデックスに先行するインデックス(i−1)に対する前の反復において算出された最小全歪み(TDmin(i−1,k−1))、および
−行インデックスと列インデックスとの間の数値の連続するサブセット(xi,…,xj)の歪み(disto(i,j))
の合計に対応してもよい。
そのような実装形態は、既存のクラスタリング方法よりも効率が良い(outperform)システム(それはまた、最適K平均クラスタリングを生成するが、特に時間O(K*n)においてより高速に実行するので)を提供する。一般的な使用では、例示的な方法は、「良好な」発見的問題解決よりも10倍以上高速に実行することに留意されたい。
例示的なクラスタリングアルゴリズムのさらなる完全な概要がここで議論される。
最適な区画を算出するために、方法は、ダイナミックプログラミングパラダイム(Dynamic Programming paradigm)(非特許文献17の論文で説明される)を使用する。特に、例示的な方法は、j∈{1,…,n}および各々のk∈{1,…,K}ごとに、jの第1のポイント(x1,…,xj)を単に考慮する場合に、最大でkのクラスタで達成することができる最小全歪みとして定義される値TDmin(j,k)を算出する。
定義によって、全てのj∈{1,…,K}に対し、TDmin(j,1)=disto(1,j)を有し、なぜならば、1つのクラスタにおいてポイントの組を区分化する唯一の方法がそれら全てをとることであるからである。さらに、全てのk∈{2,…,k}および全てのj∈{1,…,n}に対し、式
を有する。
この式は、最大でkのクラスタで(x1,…,xj)に対して達成することができる最小全歪みが、或るiに対し、最大でk−1のクラスタで、および最終(final)クラスタとしての[xi,…,xj]でi−1の第1のポイントの最適クラスタリングから構成されるという事実を表す。上記式は、本方法の主要部にある。所与のk∈{2,…,K}に対し、全てのjに対する値TDmin(j,k−1)を算出した場合、方法の1つは、上記式における全ての可能な(possible)i∈{1,…,j}を試験することによって、全てのjに対し、値TDmin(j,k)を算出してもよい。しかしながら、この仮説的な(hypothetical)技術は、非常に低速なアルゴリズムにつながることがある。
これを克服するために、方法は、特定の行列において行最小検索に対する特定のカテゴリのアルゴリズムを使用する。
ここで例示的な方法が依存する行最小検索および全単調性(Total monotonicity)の概念が議論される。
行最小検索アルゴリズムは(非特許文献18の論文で詳述されるように)、全ての1<=i<=R,1<=j<=Cに対し、値f(i,j)を一定時間で計算し、および整数p=(p1,…,pR)のベクトルを出力することでき、それによって
とすることができるように、
関数
を入力として見なすアルゴリズムである。
以下では、Fによって行列F=(f(i,j))i,jを表す。完全を期して、行列Fが特定の特性を有さない場合に、ベクトルpを算出するために全てのそのエントリが要求される場合があることに留意されたい。しかしながら、Fに関するある条件下では、抜本的により高速になるアルゴリズムを実装することができる。
行列Fは、それが次の条件を満たす場合に全体として単調(monotone)と称される。「i,j,k、i<jに対し、F(k,i)<F(k,j)の場合、全てのk'<=kに対し、F(k',i)<F(k',j)」。
全体的に単調な行列における行最小検索に対する線形−時間アルゴリズムが存在する(非特許文献19の論文で説明されるように)。そのような予め定められたアルゴリズム(すなわち、線形時間行最小検索アルゴリズム)のいずれかは、行列H上でS20における方法によって実装されてもよい。特に、発明者は、非特許文献19の論文で提示された、飛躍的に高速に集束する(with dramatically fast convergence)(従来技術と比較して)周知のSMAWKアルゴリズムを使用して当該方法を試験している。
ここで、方法を飛躍的に高速に実行することを可能にする基本的特性が議論される。その前に、この特性の特定がK平均クラスタリング問題と行最小検索に対して提供される周知かつ強力なアルゴリズムとの間の架け橋(bridge)を作成することにつながり、およびK平均クラスタリングに関する長年の研究がそのような架け橋を特定してこなかったことに留意されたい。
<定理>
全ての1<=i<j<nに対し、disto(i,j)+disto(i+1,j+1)<=disto(i,j+1)+disto(i+1,j)。
<証明>
まず第一に、1<=a<=b<=nに対し、disto(a,b)は、定義によって(b−a+1)と乗算した(xa,…,xb)の変数に等しい。
したがって、Konig−Huygens式から
有する。
1<=i<j<nとなるようにiおよびjを考える。
p=(b−a+1)、S=Σi<=l<=jl、α=xj+1および、β=xiを表し、上記特定から
を有する。
したがって、式(1)
である。
さらに、
である。
したがって、式(2)
である。
Δ=disto(i,j+1)−disto(i,j)+disto(i+1,j)−disto(i+1,j+1)を表す。
証明したい定理は、単純にΔ>=0と等しい。
さらに、式(1)と式(2)とを加算すると、
を得る。
目標は、Δ>=0を示すためにこの式を使用することである。
概念を失うことなく、問題は変換(translation)によって不変であるので、S=0であることを想定することができ(それは、
による全てのポイントを変換することに対応する)、それによって
とすることができ、
Δ'=−p(p+1)β2−p(p−1)α2+(p−1)(p+1)(α−β)2
である。
項(term)をグループ化して、
Δ'=−(p+1)β2+(p−1)α2−2(p+1)(p−1)αβ
と記述することができる。
全てのl∈{i+1,…,j}に対しα>=xlであるので、S=xi+…+xj=β+…+α<=β+(p−1)α(x1<…<xnであることが想起される)であることに留意されたい。S=0であることが想定されるので、
(p−1)α>=−β
が得られる。
さらに、ヌルである合計Sのより小さな項であるので、β<=0を明確に有し、よって、
−(p−1)αβ>=β2
に従う。
この不等式をΔの最後の式に再注入(reinject)すると、
Δ'>=−(p+1)β2+(p−1)α2+2(p+1)β2>=(p−1)α2+(p+1)β2
を得る。
よって、Δ'>=0であり、結果としてΔ>=0であり、立証を結論づける。
ここで、固定されたk∈{2,…,K}に対し、方法が全てのjに対して全てのTDmin(j,k−1)を算出したと推定される。関係
を通じて全てのjに対して(TDmin(j,k))jを取り出すことができることが想起される。
ここで、上述した特性がどのようにして、方法が時間O(n)において(TDmin(j,k−1))jから全ての(TDmin(j,k))jを算出することを支援するかが理解されよう。
最初に、H(i,j)=TDmin(i−1,k−1)+disto(i,j)を表す。
disto(i,j)+disto(i+1,j+1)<=disto(i,j+1)+disto(i+1,j)であるので、TDmin(i−1,k−1)+TDmin(i,k−1)の両側を加算することによって、
H(i,j)+H(i+1,j+1)<=H(i,j+1)+H(i+1,j)を得る。
この特性は、行列H=(H(i,j))i,jのMongeの特性と称され(非特許文献20の論文を参照)(実際に、方法は、j<iであるがそのような欠けた値(missing value)が実際に本当に問題にならないときに、H(i、j)の定義を無視してもよく、このことは、これ以上は論述されない)。一部の文献では、Knuth−Yao四角形不等式(quadrangle inequality)とも称される(例えば、非特許文献21の論文を参照)。
定理によって、行列Hは全体として単調であり、すなわち、i<jであるi,j,kに対し、H(k,i)<H(k,j)である場合、全てのk'<=kに対しH(k',i)<H(k',j)である。これは実際に、Mongeの行列の周知の特性であり、証明される必要はない。
ここで、(TDmin(j,k))jを算出することは、行列Hの行の各々の最小値を算出することに等しいことに留意されよう。例示的な方法は、時間O(n)において解決されるこの副課題に対して偶然に厳密に設計されることになる、任意の予め定められた線形時間行最小検索アルゴリズム(SMAWKアルゴリズムなど)を引き起こす。行列Hはサイズn×nの行列であるが、方法はそれを全体として構築する必要はない。方法は、単に、一定の時間で任意のHエントリを算出する方法をSMAWKサブルーチンに提供する。
よって、実際には、方法のアルゴリズムは最初に、第1の層(TDmin(j,0))jを算出してもよく、次いで、行最小検索(RMS)サブルーチンを使用して第2の層(TDmin(j,1))jを算出し、および方法が全ての(TDmin(j,k))j,kを取得する前に、第2の時間でRMSアルゴリズムなどを使用して第3の層(TDmin(j,2))jを算出する。Kの層の各々が、算出されることになる時間O(n)を要するので、アルゴリズム全体が時間O(Kn)で動作する。
この点において、例では、方法はさらに、各々のそれぞれの反復ランクkにおいて、例えば、専用行列Cutminに、行最小検索アルゴリズムによって返されるインデックスを記憶するステップを備えてもよい。この例示的な方法はさらに、算出するステップS20において、記憶されたインデックスから最適クラスタリングを判定するステップを含んでもよい。
単純かつ直接的な実装形態では、記憶されたインデックスから最適クラスタリングを判定するステップは、行列Cutmin内で作用するステップを備える。特に、例示的な方法は、最後にインデックス付けされた数値(Cutmin(n,K))から開始して、数値を反復して区分化する(partition)。各々のそれぞれの反復ランクqにおいて、現在形成されているクラスタの開始数値のインデックスは、ランクK−qの反復において(算出するステップS20内での反復の間に)記憶されたインデックスに等しい。
実際に、方法が毎回最小値を算出することに気付く場合、方法はまた、この最小値に到達するインデックスを得ることができることが明らかである。より正確には、(TDmin(j,k))j,kの各々の値は、そのインデックスを行列(Cutmin(j,k))j,kに記憶することができる最小値として算出される。そのことから、方法は、テーブルCutminを参照することのみで、最適な区分を容易に得ることができる。

Claims (11)

  1. コロプレスマップを設計するコンピュータにより実行される方法であって、
    地図、および前記地図のそれぞれの領域における統計的変数を表す数値(x1,…,xn)の数(n)を設けるステップと、
    予め定められた数(K)のクラスタに対し、前記数値の最適K平均クラスタリングを算出するステップであって、前記算出するステップは、前記予め定められた数のクラスタに対応する回数、前記数値の数に等しい次数(n)の正方行列に適用される線形時間行最小検索アルゴリズムを反復することを含む、ステップと、
    それぞれの配色を、前記算出されたクラスタリングの各々のクラスタに割り当てるステップと、
    それぞれの数値が設けられる前記地図の全ての領域において、前記それぞれの数値が属する前記クラスタに割り当てられた前記配色を適用するステップと
    を備えたことを特徴とする方法。
  2. 予め定められた色を設けるステップをさらに備え、それぞれのクラスタに割り当てられた前記配色は、前記それぞれのクラスタの前記数値によって決まる前記予め定められた色の明度であることを特徴とする請求項1に記載の方法。
  3. それぞれのクラスタに割り当てられた前記配色は、前記それぞれのクラスタの中心の値に応じて増加する前記予め定められた色の明度であることを特徴とする請求項2に記載の方法。
  4. 前記数値(x1,…,xn)は、記憶およびインデックス付けされ、前記算出するステップ内での反復は、それぞれの反復ランクにおいて、および前記数値の数(n)未満のインデックス(j)ごとに、前記正方行列(H)に適用される線形時間行最小検索アルゴリズムに従って、それぞれの反復ランクに対応するクラスタの数で、それぞれのインデックス(i<=j)未満でインデックス付けされた数値(xi)のサブセットに対して達成可能な最小全歪み(TDmin(j,k))の算出を含むことを特徴とする請求項1乃至3のいずれか一項に記載の方法。
  5. 各々のそれぞれの反復ランク(k)において、および前記数値の数(n)未満のインデックス(j)ごとに、行インデックス(i)ごと、および列インデックス(j)ごとに、行列エントリ(H(i,j))は、
    前記行インデックスに先行するインデックス(i−1)に対する前の反復において算出された最小全歪み(TDmin(i−1,k−1))と、
    前記行インデックスと前記列インデックスとの間の前記数値の連続するサブセットの歪み(disto(i,j))
    の合計に対応することを特徴とする請求項4に記載の方法。
  6. 各々のそれぞれの反復ランク(k)において、行最小検索アルゴリズムによって返されるインデックス(Cutmin(j,k))を記憶するステップをさらに備えたことを特徴とする請求項5に記載の方法。
  7. 前記算出するステップにおいて、前記記憶されたインデックスから最適クラスタリングを判定するステップをさらに備えたことを特徴とする請求項6に記載の方法。
  8. 前記記憶されたインデックスから前記最適クラスタリングを判定するステップは、前記記憶されたインデックス(Cutmin)において、最後にインデックス付けされた数値(Cutmin(n,K))から開始して、数値を区分化するステップを備え、各々のそれぞれの反復ランク(q)において、現在形成されているクラスタの開始数値のインデックスは、予め定められた数のクラスタから、現在形成されているクラスタの最後にインデックス付けされた数値のインデックスに等しい行インデックスに対するそれぞれの反復ランク(q)を減算したものに等しいランク(K−q)の反復において、前記算出するステップ内で反復する間に記憶されたインデックスに等しいことを特徴とする請求項7に記載の方法。
  9. コンピュータによって実行されるとき、前記コンピュータに、請求項1乃至8のいずれか一項に記載の方法を実行させるコンピュータ実行可能命令を備えたことを特徴とするコンピュータプログラム。
  10. 請求項9に記載のコンピュータプログラムを記憶したことを特徴とするデータ記憶媒体。
  11. メモリに結合されたプロセッサを備えたシステムであって、前記プロセッサは、前記メモリに記憶された、請求項9に記載の前記コンピュータプログラムを実行するように構成されていることを特徴とするシステム。
JP2015242288A 2014-12-27 2015-12-11 コロプレスマップの設計 Active JP6773412B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP14307193.4A EP3038019A1 (en) 2014-12-27 2014-12-27 Designing a choropleth map
EP14307193.4 2014-12-27

Publications (3)

Publication Number Publication Date
JP2016126771A JP2016126771A (ja) 2016-07-11
JP2016126771A5 JP2016126771A5 (ja) 2019-01-24
JP6773412B2 true JP6773412B2 (ja) 2020-10-21

Family

ID=52358570

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015242288A Active JP6773412B2 (ja) 2014-12-27 2015-12-11 コロプレスマップの設計

Country Status (4)

Country Link
US (1) US10083220B2 (ja)
EP (1) EP3038019A1 (ja)
JP (1) JP6773412B2 (ja)
CN (1) CN105740313B (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10678818B2 (en) * 2018-01-03 2020-06-09 Snap Inc. Tag distribution visualization system
CN109377402B (zh) * 2018-09-14 2021-08-20 深圳大学 社交网络数据的可视化方法、装置、设备及存储介质
US20210280320A1 (en) * 2020-03-03 2021-09-09 Parkland Center For Clinical Innovation Community Vulnerability Index Dashboard

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US1543036A (en) 1924-10-10 1925-06-23 Lawrence H Taylor Domestic press
US20050278182A1 (en) 2004-06-15 2005-12-15 Mcmahon Paul J Submarket analyst
US7801950B2 (en) * 2007-06-01 2010-09-21 Clustrmaps Ltd. System for analyzing and visualizing access statistics for a web site
US8412419B1 (en) 2009-09-17 2013-04-02 Helena Chemical Company System for mapping GIS layers
US8566348B2 (en) * 2010-05-24 2013-10-22 Intersect Ptp, Inc. Systems and methods for collaborative storytelling in a virtual space
CN101859324A (zh) * 2010-06-03 2010-10-13 大连理工大学 对聚类分析结果进行可视化的方法
CN101976348A (zh) * 2010-10-21 2011-02-16 中国科学院深圳先进技术研究院 图像聚类方法和系统
US8510080B2 (en) 2012-01-23 2013-08-13 Id Modeling, Inc. System and method for monitoring and managing utility devices
CN104737157B (zh) 2012-10-19 2019-02-05 瑞典爱立信有限公司 联合数据库系统

Also Published As

Publication number Publication date
US20160188697A1 (en) 2016-06-30
US10083220B2 (en) 2018-09-25
CN105740313B (zh) 2021-03-12
EP3038019A1 (en) 2016-06-29
JP2016126771A (ja) 2016-07-11
CN105740313A (zh) 2016-07-06

Similar Documents

Publication Publication Date Title
US10916333B1 (en) Artificial intelligence system for enhancing data sets used for training machine learning-based classifiers
US12034747B2 (en) Unsupervised learning to simplify distributed systems management
US10191967B2 (en) Clustering database queries for runtime prediction
Duczmal et al. A simulated annealing strategy for the detection of arbitrarily shaped spatial clusters
CN112514327B (zh) 大型网络可视化与维护的交互系统
JP6888484B2 (ja) 検索プログラム、検索方法、及び、検索プログラムが動作する情報処理装置
JP6380051B2 (ja) 有限要素演算プログラム、有限要素演算装置および有限要素演算方法
JP2015203946A (ja) ヒストグラムの重心を計算する方法
JP2020109660A (ja) 編集可能なフィーチャツリーの推測のためのデータ集合を形成すること
JP2020109659A (ja) 編集可能なフィーチャツリーの推測のためにニューラルネットワークを学習すること
JP6773412B2 (ja) コロプレスマップの設計
CN108540988A (zh) 一种场景划分方法及装置
JP2019191895A (ja) データ分析システム及びデータ分析方法
Shahneh et al. A-gwr: Fast and accurate geospatial inference via augmented geographically weighted regression
Khine et al. Predictive geospatial analytics using principal component regression
CN115659900B (zh) 用于呈现集成电路版图的方法、设备和介质
Beilschmidt et al. A linear-time algorithm for the aggregation and visualization of big spatial point data
WO2021220775A1 (ja) 材料の特性値を推定するシステム
JPWO2020121378A1 (ja) 学習装置および学習方法
JP2009265729A (ja) 推定装置および方法、並びにプログラム
KR20180119443A (ko) 가우시안 프로세스 회귀분석을 이용한 클러스터링 방법 및 그 장치
JP2018028823A (ja) クラスタリング装置およびクラスタリング方法
WO2023195152A1 (ja) 推奨データ生成装置、推奨データ生成方法、及び非一時的なコンピュータ可読媒体
Cordel II et al. Fast emulation of self-organizing maps for large datasets
JP7424509B2 (ja) 学習装置、識別装置、学習方法、識別方法、学習プログラム、及び識別プログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181206

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181206

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191001

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190927

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20200106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200326

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200901

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201001

R150 Certificate of patent or registration of utility model

Ref document number: 6773412

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250