JP7210086B2 - エリアの分割方法と装置、電子装置およびプログラム - Google Patents

エリアの分割方法と装置、電子装置およびプログラム Download PDF

Info

Publication number
JP7210086B2
JP7210086B2 JP2021519699A JP2021519699A JP7210086B2 JP 7210086 B2 JP7210086 B2 JP 7210086B2 JP 2021519699 A JP2021519699 A JP 2021519699A JP 2021519699 A JP2021519699 A JP 2021519699A JP 7210086 B2 JP7210086 B2 JP 7210086B2
Authority
JP
Japan
Prior art keywords
area
center point
data set
indicated
geographical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021519699A
Other languages
English (en)
Other versions
JP2022504597A (ja
Inventor
斐 黄
凡 ▲楊▼
燕▲純▼ 林
嘉 ▲劉▼
▲鋭▼ 郭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Publication of JP2022504597A publication Critical patent/JP2022504597A/ja
Application granted granted Critical
Publication of JP7210086B2 publication Critical patent/JP7210086B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • G06Q10/043Optimisation of two dimensional placement, e.g. cutting of clothes or wood
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2255Hash tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Description

本願は、2019年03月19日にて中国特許庁へ出願した、出願番号が201910209714.6で、出願の名称が「エリアの分割方法、装置、記憶媒体および電子装置」である中国特許出願の優先権を主張し、その内容を全て参照により本願に組み込むものとする。
本願は、コンピュータの分野に関し、具体的には、エリアの分割技術に関する。
従来からあるエリアの分割方法は、手作業で調べた店舗情報、店舗の出店密度又は店舗の取引情報等に基づいて、店舗があるエリアを分割するのがほとんどであり、具体的な過程は次の通りである。調査員はまず各地へ行って現地の店舗情報、店舗の出店密度又は店舗の取引情報等のエリアの分割に関する情報を調べて収集し、それから、これらの手作業で調べた店舗情報、店舗の出店密度又は店舗の取引情報等のエリアの分割に関する情報を利用して、店舗があるエリアを分割する。
本願の実施形態は、エリアの分割を効率的かつ正確に実現することができるエリアの分割方法、装置、記憶媒体および電子装置を提供する。
本願の実施形態の一態様によれば、第1のデータセットにおける緯度および経度を符号化して、第2のデータセットを取得するステップであって、前記第1のデータセットには、対応関係にある緯度および経度がNグループ記録されており、Nは正の整数で、N≧1であり、前記第2のデータセットには、N個の地域番号が記録されており、それぞれの前記地域番号は1つの地理的エリアを示すためのものである、ステップと、前記第2のデータセットに基づいて、第3のデータセットを取得するステップであって、前記第3のデータセットには、対応関係にある地域番号、前記地域番号で示される地理的エリアの中心点の緯度、前記地域番号で示される地理的エリアの中心点の経度がMグループ記録されており、Mは正の整数で、M≧1であり、かつMは前記地域番号の数である、ステップと、前記第3のデータセットに基づいて、M個の前記地域番号で示される地理的エリアをP個のエリアに分割するステップであって、Pは正の整数で、P≧1であり、それぞれの前記エリアには、前記地域番号で示される地理的エリアが少なくとも1つ含まれている、ステップとを含むエリアの分割方法を提供する。
本願の実施形態の一態様によれば、第1のデータセットにおける緯度および経度を符号化して、第2のデータセットを取得するための符号化モジュールであって、前記第1のデータセットには、対応関係にある緯度および経度がNグループ記録されており、Nは正の整数で、N≧1であり、前記第2のデータセットには、N個の地域番号が記録されており、それぞれの前記地域番号は1つの地理的エリアを示すためのものである、符号化モジュールと、前記第2のデータセットに基づいて、第3のデータセットを取得するための第1の取得モジュールであって、前記第3のデータセットには、対応関係にある地域番号、前記地域番号で示される地理的エリアの中心点の緯度、前記地域番号で示される地理的エリアの中心点の経度がMグループ記録されており、Mは正の整数で、M≧1であり、かつMは前記地域番号の数である、第1の取得モジュールと、前記第3のデータセットに基づいて、M個の前記地域番号で示される地理的エリアをP個のエリアに分割するための分割モジュールであって、Pは正の整数で、P≧1であり、それぞれの前記エリアには、前記地域番号で示される地理的エリアが少なくとも1つ含まれている、分割モジュールと、を備えるエリアの分割装置をさらに提供する。
任意選択で、前記装置は、処理対象となるN個の場所名を取得するための第2の取得モジュールと、地図アプリケーションのアプリケーションプログラミングインターフェースAPIを呼び出して、前記N個の場所名のそれぞれで示される場所が位置する緯度および経度を取得することで、対応関係にある場所名、緯度および経度をNグループ得るための第3の取得モジュールと、Nグループの前記対応関係にある場所名、緯度および経度から前記第1のデータセットを形成するための形成モジュールと、をさらに備えてもよい。
任意選択で、分割モジュールは、前記P個のエリアに第1のエリアが存在する場合、前記P個のエリアのうち前記第1のエリアに隣接する第2のエリアを決定するための第1の決定ユニットであって、前記第1のエリアに含まれている地理的エリアの数は第4の所定閾値よりも小さい第1の決定ユニットと、前記第1のエリアに含まれている地理的エリアを、前記第2のエリアに位置するように更新する更新ユニットと、を含んでもよい。
任意選択で、符号化モジュールは、前記第1のデータセットにおける緯度および経度をGEOHASH符号化して、前記第2のデータセットを取得するための符号化ユニットであって、前記第2のデータセットには、対応関係にある場所名およびGEOHASHコードがNグループ記録されており、前記地域番号は前記GEOHASHコードである符号化ユニットを含んでもよい。
任意選択で、第1の取得モジュールは、前記第2のデータセットに記録されているGEOHASHコードをクラスタリングして、互いに異なるM個のGEOHASHコードを得るためのクラスタリングユニットと、前記互いに異なるM個のGEOHASHコードのそれぞれで示される地理的エリアの中心点の緯度、および、それぞれで示される地理的エリアの中心点の経度を決定するための第2の決定ユニットと、対応関係にあるGEOHASHコード、前記GEOHASHコードで示される地理的エリアの中心点の緯度、前記GEOHASHコードで示される地理的エリアの中心点の経度をMグループ記録して、前記第3のデータセットを取得するための記録ユニットと、を含んでもよい。
任意選択で、前記装置は、前記P個のエリアに位置する対象エリアに含まれる場所名を取得して、場所名セットを得るための第4の取得モジュールと、前記場所名セットにおける各場所名を単語分割して、単語分割結果を得るための単語分割モジュールと、前記単語分割結果に出現回数が第3の所定閾値よりも大きい地名の単語が存在する場合、前記地名の単語を前記対象エリアのエリア名として決定するための決定モジュールと、をさらに備えてもよい。
任意選択で、前記第3のデータセットには、対応関係にある地域番号、前記地域番号で示される地理的エリアの中心点の緯度、前記地域番号で示される地理的エリアの中心点の経度、および前記地域番号で示される地理的エリアの場所数がMグループ記録されており、前記分割モジュールは、前記地域番号で示される地理的エリア毎の場所数、および、M個の前記地域番号で示される地理的エリアの中心点間の距離に基づいて、M個の前記地域番号で示される地理的エリアをP個のエリアに分割するための分割ユニットを含んでもよい。
任意選択で、分割ユニットは、前記地域番号で示される地理的エリア毎の場所数に基づいて、前記地域番号で示される地理的エリア毎の第1の中心点に対応する重み値を決定するための決定サブユニットと、各第1の中心点に対応する重み値、および、前記第1の中心点を中心とし、所定の半径値を半径とした範囲内に存在する前記第1の中心点以外の第2の中心点の数に応じて、前記第1の中心点をコアオブジェクト、非コアオブジェクト又はノイズオブジェクトとしてマークするためのマークサブユニットと、前記第1の中心点がコアオブジェクトとしてマークされ、かつ前記第1の中心点および前記範囲内に位置する第2の中心点のうちのいずれかが存在する地理的エリアは、対象エリア内に位置すると記録された場合、前記第1の中心点および前記範囲内に位置する第2の中心点が存在する地理的エリアを共に、前記対象エリアに位置すると記録し、前記第1の中心点がコアオブジェクトとしてマークされ、かつ前記第1の中心点および前記範囲内に位置する第2の中心点のそれぞれが存在する地理的エリアはいずれも、前記エリアに位置すると記録されていない場合、前記第1の中心点および前記範囲内に位置する第2の中心点が存在する地理的エリアを共に、同一のエリアに位置すると記録するための処理サブユニットと、を含んでもよい。
任意選択で、決定サブユニットは、すべての前記地域番号で示される地理的エリアの場所数の平均値、および、すべての前記地域番号で示される地理的エリアの場所数の標準偏差を決定し、前記地域番号で示される地理的エリア毎の場所数と前記平均値との差を決定し、前記差と前記標準偏差との比を、前記地域番号で示される地理的エリア毎の第1の中心点に対応する重み値として決定するために用いられてもよい。
任意選択で、マークサブユニットは、前記重み値が第1の所定閾値よりも大きい場合、前記第1の中心点をコアオブジェクトとしてマークし、前記重み値が前記第1の所定閾値よりも小さく、かつ第2の所定閾値よりも大きい場合、前記第1の中心点を中心とし、所定の半径値を半径とした範囲内に存在する前記第1の中心点以外の第2の中心点の数に応じて、前記第1の中心点をコアオブジェクト、非コアオブジェクト又はノイズオブジェクトとしてマークし、前記重み値が前記第2の所定閾値よりも小さい場合、前記第1の中心点を中心とし、所定の半径値を半径とした範囲内に存在する前記第1の中心点以外の第2の中心点の数に応じて、前記第1の中心点を非コアオブジェクト又はノイズオブジェクトとしてマークするために用いられてもよい。
任意選択で、前記装置は、クライアントに表示される電子地図上で、前記P個のエリア及び/又はM個の前記地域番号で示される地理的エリアをマークするための表示モジュール、をさらに備えてもよい。
本願の実施形態の一態様によれば、実行されると、上述した方法を実行させるように構成されるコンピュータプログラムが記憶されていることを特徴とする記憶媒体をさらに提供する。
本願の実施形態の一態様によれば、メモリとプロセッサとを備える電子装置であって、前記メモリにはコンピュータプログラムが記憶されており、前記プロセッサは、前記コンピュータプログラムによって上述した方法を実行するように構成されることを特徴とする電子装置をさらに提供する。
本願の実施形態の一態様によれば、コンピュータ上で実行されると、上述した方法を前記コンピュータに実行させる命令を含むコンピュータプログラム製品をさらに提供する。
本願の実施形態では、対応関係にある緯度および経度がNグループ(Nは正の整数で、N≧1である)記録されている第1のデータセットにおける緯度および経度を符号化して、それぞれが1つの地理的エリアを示すN個の地域番号が記録されている第2のデータセットを取得することと、第2のデータセットに基づいて、対応関係にある地域番号、地域番号で示される地理的エリアの中心点の緯度、地域番号で示される地理的エリアの中心点の経度がMグループ(Mは正の整数で、M≧1であり、かつMは地域番号の数である)記録されている第3のデータセットを取得することと、第3のデータセットに基づいて、M個の地域番号で示される地理的エリアを、それぞれが地域番号で示される地理的エリアを少なくとも1つ含むP個(Pは正の整数で、P≧1である)のエリアに分割することと、のように、場所の経緯度によって場所を示し、経緯度と地域番号との位置関係に基づいて、場所をその存在する地域に応じてクラスタリングして、クラスタリングされた地域を異なるP個のエリアに分割することができ、これにより、エリアの自動分割を実現し、このようにして人的資源を節約し、エリアの分割基準を統一し、タイムリーに更新でき、計算量が小さく、地図上でエリア範囲を描くことが容易であり、新しい場所が加入すれば、それが位置するエリアに直接追加することができるため、エリアの分割効率を高めるという技術効果を実現し、さらに、関連技術においてエリアの分割効率が低いという課題を解決する。
ここで説明される図面は、本願をさらに理解させるためのものであり、本願の一部を構成し、また、本願における模式的実施形態及びその説明は本願を説明するものであり、本願を不当に限定するものではない。図面において、
本願の実施形態による代替的なエリアの分割方法の応用環境模式図である。 本願の実施形態による代替的なエリアの分割方法の模式図である。 本願の実施形態によって提供されるGEOHASH文字列の模式図である。 本願の実施形態によって提供されるGEOHASH符号化の精度の模式図である。 本願の実施形態によって提供される、クライアントに表示される分割されたエリアの情報の模式図である。 本願の実施形態による代替的なエリアの分割装置の模式図である。 本願の実施形態による代替的なエリアの分割方法の模式図である。 本願の実施形態による代替的な電子装置の模式図である。
当業者に本願の構成をよりよく理解してもらうように、以下、本願の実施形態の図面を参照しながら本願の技術的構成を明瞭かつ完全に説明する。説明される実施形態は本願の実施形態の一部に過ぎず、全部ではないことは、言うまでもないことである。当業者が本願の実施形態に基づいて、創造的な労働無しに得られた他の実施形態も、全て本願の保護範囲内に含まれるべきである。
なお、本願の明細書及び特許請求の範囲並びに上記図面に言及された「第1」、「第2」等の用語は、類似した対象を区別するためのものであり、特定の順番又は前後順序を説明するためのものではない。ここで説明される本願の実施形態をここで示した又は説明した順番以外の順番で実施可能なものにするために、このように使用されたデータは適した場合であれば互いに取り替え可能なことは、理解されるべきである。また、用語である「含む」、「有する」及びそれらの如何なる変形は、排他的にならずに含まれたものをカバーすることがその意図であり、例えば、一連のステップ又はユニットを含めたプロセス、方法、システム、製品又は機器は、明確に示したステップ又はユニットに限定される必要がなく、これらのプロセス、方法、製品又は機器に対して明確に示していなかったり、固有であったりする他のステップ又はユニットを含むことができる。
従来のエリアの分割方法では、手作業で調べた店舗情報、店舗の出店密度又は店舗の取引情報等に基づいて、店舗があるエリアを分割してきたことが、本発明者が従来のエリアの分割についての検討により分かった。また、従来のエリアの分割方法において、データ収集が人的資源の浪費につながり、エリアの規模を統一することが難しく、タイムリーに更新できず、基準が高くて計算量が多く、そして、地図上で商圏の範囲を描くことが困難であり、新しいマーチャントが加入すると、再分割が必要である等の問題があるため、エリアの分割効率が低下するという課題がある。
上述した従来のエリアの分割方法に存在する課題に対して、本願の実施形態は、エリアの分割効率を高めることができるエリアの分割方法を提供する。
具体的には、本願の実施形態で提供されるエリアの分割方法において、まず、第1のデータセットにおける緯度および経度を符号化して、第2のデータセットを得る。それから、第2のデータセットに基づいて、第3のデータセットを取得し、第3のデータセットには、対応関係にある地域番号、地域番号で示される地理的エリアの中心点の緯度、地域番号で示される地理的エリアの中心点の経度がMグループ記録されており、Mは自然数、かつ地域番号の数である。最後に、第3のデータセットに基づいて、M個の地域番号で示される地理的エリアをP個のエリアに分割する。第1のデータセットには、対応関係にある緯度および経度がNグループ記録されており、Nは正の整数で、N≧1であり、第2のデータセットには、N個の地域番号が記録されており、それぞれの地域番号は1つの地理的エリアを示し、Pは正の整数で、P≧1であり、それぞれのエリアには、地域番号で示される地理的エリアが少なくとも1つ含まれている。このようにしてエリアの分割を効率的かつ正確に実現する。
本願の実施形態で提供されるエリアの分割方法は、例えば端末機器や、サーバなどのデータ処理装置に応用されることができ、端末機器は、具体的にはスマートフォン、コンピュータ、パーソナルデジタルアシスタント(Personal Digital Assistant、PDA)、タブレットコンピュータ等であってもよく、サーバは、具体的にはアプリケーションサーバであってもよいし、Webサーバであってもよく、また、実際に配置する際に、該サーバは独立サーバであってもよいし、クラスタサーバであってもよいことが理解されるであろう。
本願の実施形態で提供される技術的構成を理解しやすくするために、以下、本願の実施形態で提供されるエリアの分割方法のサーバへの応用を例として、本願の実施形態で提供されるエリアの分割方法が適用される応用場面について例示的に説明する。
本実施形態で提供されるエリアの分割方法は、図1に示されるサーバ202によって構成されるハードウェア環境に応用されることができる。図1に示すように、サーバ202は、まず、第1のデータセットにおける緯度および経度を符号化して、第2のデータセットを取得し、第1のデータセットには、対応関係にある緯度および経度がNグループ記録されており、Nは正の整数で、N≧1であり、第2のデータセットには、N個の地域番号が記録されており、それぞれの地域番号は1つの地理的エリアを示す。それから、サーバ202は、第2のデータセットに基づいて、第3のデータセットを取得し、第3のデータセットには、対応関係にある地域番号、地域番号で示される地理的エリアの中心点の緯度、地域番号で示される地理的エリアの中心点の経度がMグループ記録されており、Mは正の整数で、M≧1であり、かつMは地域番号の数である。最後に、サーバ202は、第3のデータセットに基づいて、M個の地域番号で示される地理的エリアをP個のエリアに分割し、Pは正の整数で、P≧1であり、それぞれのエリアには、地域番号で示される地理的エリアが少なくとも1つ含まれている。
なお、本実施形態では、上記エリアの分割方法は、分割対象となるエリアを複数のサブエリアに分割する場面に応用されることができるが、これに限られない。上記コンピュータ機器は、例えばオンライン教育アプリケーション、インスタントメッセージングアプリケーション、コミュニティー空間アプリケーション、ゲームアプリケーション、ショッピングアプリケーション、ブラウザアプリケーション、金融アプリケーション、マルチメディアアプリケーション、ライブブロードキャストアプリケーション、ナビゲーションアプリケーション、マーチャントレコメンデーションアプリケーション等、各種のアプリケーション用のサーバであってもよいが、これらに限られない。以上は一例に過ぎず、本実施形態では何ら限定されるものではない。
なお、本実施形態では、上記エリアは、商業エリア、都市街区、文化エリア、景観エリア、販売エリアなどを含むことができるが、これらに限られない。例えば、商業エリアを例とすると、単に商圏と呼ばれ、マーチャントが集まるエリアであり、都市では商店、ショッピングセンター、レストラン、オフィスビル、ホテルなどの商業施設と、通り、駅、歩道帯等の公共施設とを有機的に組み合わせてなるエリアを指し、都市で最も優れて賑わっているエリアである。商圏は、不動産開発の概念の1つであり、商業経営、小規模企業・零細企業のリスク管理、マーケティング、マーチャント検索等の場面で重要な用途がある。各商圏は、経営商品、交通要因、地理的位置、経営規模などで異なるため、規模、商圏形態に大きな差がある。
商業経営において、人の流れ、交通、インフラ、近隣の住宅や作業エリア、ユーザ群の違い、業界の分布などを含む商圏の特徴は、マーチャントの経営に重要な影響を及ぼし、マーチャントは、各商圏の情報を把握して立地選びを正しく行い、適切な経営戦略を採用する必要があるため、本実施形態で提供される商圏の分割方法は、マーチャントによる立地選び、マーチャントによる経営分析のシステムにおいて重要な基礎技術である。例えば、立地選びシステムに全国各地の商圏の範囲、マーチャント数が表示されることができ、また、例えば、プラットフォームの他のデータと併せると、例えば決済ユーザ数や、顧客の単価、マーチャントのタイプ、ユーザ群の特徴(性別、年齢、学歴など)といった商圏の様々な指標を構築することができるため、マーチャントの立地選び分析および経営分析に役立てる。
商業分析においても、マーチャントについての判断時に商圏情報および商圏の変化を把握する必要があり、マーチャントの経営リスクを正しく評価するのを支援する。本実施形態で提供される商圏の分割方法は、商圏の変動を迅速に識別することに寄与するため、小規模企業・零細企業のローン業務においてリスク管理能力の向上に寄与する。例えば、昨年、識別された商圏範囲は500マーチャントが収まった1000平方メートルであるが、今年の識別範囲は400マーチャントが収まった800平方メートルであるとすると、該商圏の人の流れや魅力が低下し、この場所でのマーチャントの経営能力も低下するリスクがある。
また、商圏情報は、マーケティング担当者がマーケティングのために立地選びを行ったり、オフラインで提携する商圏およびマーチャントを選択したりするのを支援することができ、インターネット事業の運営においても重要な役割を果たす。
本願の実施形態で提供されるエリアの分割方法を理解しやすくするために、以下、図面を参照しながら説明する。
本願の実施形態の一態様によれば、エリアの分割方法を提供し、図2に示すように、該方法は、次のS102~S106を含む。
S102:第1のデータセットにおける緯度および経度を符号化して、第2のデータセットを取得し、第1のデータセットには、対応関係にある緯度および経度がNグループ記録されており、Nは正の整数で、N≧1であり、第2のデータセットにはN個の地域番号が記録されており、それぞれの地域番号は1つの地理的エリアを示す。
S104:第2のデータセットに基づいて、第3のデータセットを取得し、第3のデータセットには、対応関係にある地域番号、地域番号で示される地理的エリアの中心点の緯度、地域番号で示される地理的エリアの中心点の経度がMグループ記録されており、Mは正の整数で、M≧1であり、かつMは地域番号の数である。
S106:第3のデータセットに基づいて、M個の地域番号で示される地理的エリアをP個のエリアに分割し、Pは正の整数で、P≧1であり、それぞれのエリアには、地域番号で示される地理的エリアが少なくとも1つ含まれている。
本願の実施形態で提供されるエリアの分割方法を理解しやすくするために、以下、S102、S104およびS106の関連内容および具体的な実施形態について説明する。
本実施形態では、第1のデータセットには、対応関係にある緯度および経度がNグループ記録されており、Nは正の整数で、N≧1である。例えば、第1のデータセット={(緯度1,経度1),(緯度2,経度2),・・・,(緯度N,経度N);Nはマーチャントの総数である}。
本実施形態では、第2のデータセットには、N個の地域番号が記録されている。例えば、地域番号がGEOHASHコードである場合、第2のデータセットにはN個のGEOHASHコードが記録されており、具体的には、第2のデータセット={(GEOHASHコード1),(GEOHASHコード2),・・・,(GEOHASHコードN);Nはマーチャント数である}。
本実施形態では、第3のデータセットには、対応関係にある地域番号、地域番号で示される地理的エリアの中心点の緯度、地域番号で示される地理的エリアの中心点の経度がMグループ記録されている。例えば、第3のデータセット={(GEOHASHコード1,中心点の緯度1,中心点の経度1),(GEOHASHコード2,中心点の緯度2,中心点の経度2),・・・,(GEOHASHコードM,中心点の緯度M,中心点の経度M);MはGEOHASHコード数、即ち上記対応関係のグループ数である}。
任意選択で、本実施形態では、M個の地域番号で示される地理的エリアを地域番号によってクラスタリングして、P個のエリアを取得するようにしてもよい。PはM以下であってもよい。
上記ステップの関連内容から分かるように、本願の実施形態では、場所の経緯度によって場所を示し、経緯度と地域番号との位置関係に基づいて、場所をその存在する地域に応じてクラスタリングして、クラスタリングされた地域を異なるP個のエリアに分割することができ、これにより、エリアの自動分割を実現し、このようにして人的資源を節約し、エリアの分割基準を統一し、タイムリーに更新でき、計算量が小さく、地図上でエリア範囲を描くことが容易であり、新しい場所が加入すれば、それが位置するエリアに直接追加することができるため、エリアの分割効率を高めるという技術効果を実現し、さらに、関連技術においてエリアの分割効率が低いという課題を解決する。
代替的な態様として、第1のデータセットにおける緯度および経度を符号化する前に、次のS1~S3をさらに含む。
S1:処理対象となるN個の場所名を取得する。
S2:地図アプリケーションのアプリケーションプログラミングインターフェース(Application Programming Interface、API)を呼び出して、N個の場所名のそれぞれで示される場所が位置する緯度および経度を取得することで、対応関係にある場所名、緯度および経度をNグループ得る。
S3:Nグループの対応関係にある場所名、緯度および経度から第1のデータセットを形成する。
任意選択で、本実施形態では、第1のデータセットには、対応関係にあるマーチャント名、緯度および経度がNグループ形成されてもよく、Nは正の整数で、N≧1である。例えば、第1のデータセット={(マーチャント名1,緯度1,経度1),(マーチャント名2,緯度2,経度2),・・・,(マーチャント名N,緯度N,経度N);Nはマーチャントの総数である}。
任意選択で、本実施形態では、N個の場所名は、既存の業務データに対するデータマイニング又はウェブサイトからのデータのクローリング等の方法によって取得されてもよい。例えば、アプリケーションの決済業務データから場所データをマイニングしたり、場所レコメンデーションといったウェブサイトから場所データをクローリングしたり等がある。
任意選択で、本実施形態では、地図アプリケーションのAPIインターフェースを呼び出して場所の位置決めを行うことで、場所の経緯度データを取得するようにしてもよいが、これに限られない。地図アプリケーションは、ナビゲーションのためのアプリケーション、又は、他のアプリケーションに組み込まれたナビゲーション機能であってもよい。
代替的な態様として、第3のデータセットに基づいて、M個の地域番号で示される地理的エリアをP個のエリアに分割することは、次のS21~S22を含む。
S21:P個のエリアに第1のエリアが存在する場合、P個のエリアのうち第1のエリアに隣接する第2のエリアを決定し、第1のエリアに含まれている地理的エリアの数は第4の所定閾値よりも小さい。
S22:第1のエリアに含まれている地理的エリアを、第2のエリアに位置するように更新する。
本実施形態では、小さなエリア(例えば、含まれている地理的エリアの数は第4の所定閾値(例えば、5又は10又は20など)よりも小さい)を、その周辺の大きなエリアに統合することができるか、或いは、その周辺の小さなエリアと同一のエリアになるように統合することができる。
代替的な態様として、第1のデータセットにおける緯度および経度を符号化して、第2のデータセットを取得することは、具体的には、次のように行われる。第1のデータセットにおける緯度および経度をGEOHASH符号化して、第2のデータセットを取得し、第2のデータセットには、対応関係にある場所名およびGEOHASHコードがNグループ記録されており、地域番号はGEOHASHコードである。
任意選択で、本実施形態では、符号化方式は、GEOHASH符号化を含んでもよいが、これに限られない。GEOHASH符号化は、2次元の経緯度を文字列に変換することであり、図3に示すように、北京の9つのエリアについて、それぞれWX4ER、WX4G2、WX4G3などであるGEOHASH文字列が表示されており、各文字列は、ある1つの矩形エリアを表す。GEOHASH符号化の精度は、文字列の長さによって調整されることができ、文字列が長いほど、表される範囲が正確になる。例えば、5ビットのコードは、10平方キロメートルの範囲の矩形エリアを表すことができ、一方、6ビットのコードはより細かいエリア(約0.34平方キロメートル)を表すことができる。GEOHASH符号化の精度を図4に示す。
任意選択で、本実施形態では、第1のデータセットにおける緯度および経度をGEOHASH符号化して、第2のデータセットを取得するようにしてもよく、第2のデータセットには、対応関係にあるマーチャント名およびGEOHASHコードがNグループ記録されており、この場合、地域番号はGEOHASHコードである。
任意選択で、本実施形態では、GEOHASHコードの精度は、所定の精度よりも大きく設定されていてもよい。
任意選択で、本実施形態では、第2のデータセットには、対応関係にあるマーチャント名および地域番号がNグループ記録されていてもよい。例えば、第2のデータセットには、対応関係にあるマーチャント名およびGEOHASHコードがNグループ記録されており、地域番号はGEOHASHコードである。第2のデータセット={(マーチャント名1,GEOHASHコード1),(マーチャント名2,GEOHASHコード2),・・・,(マーチャント名N,GEOHASHコードN);Nはマーチャント数である}。
代替的な態様として、第2のデータセットに基づいて、第3のデータセットを取得することは、次のS31~S33を含む。
S31:第2のデータセットに記録されているGEOHASHコードをクラスタリングして、互いに異なるM個のGEOHASHコードを得る。
S32:互いに異なるM個のGEOHASHコードのそれぞれで示される地理的エリアの中心点の緯度、および、それぞれで示される地理的エリアの中心点の経度を決定する。
S33:対応関係にあるGEOHASHコード、GEOHASHコードで示される地理的エリアの中心点の緯度、GEOHASHコードで示される地理的エリアの中心点の経度をMグループ記録して、第3のデータセットを取得する。
任意選択で、本実施形態では、第3のデータセットには、対応関係にある地域番号、地域番号で示される地理的エリアの中心点の緯度、地域番号で示される地理的エリアの中心点の経度、地域番号で示される地理的エリアにおけるマーチャント数がMグループ記録されていてもよい。例えば、第3のデータセット={(GEOHASHコード1,中心点の緯度1,中心点の経度1,マーチャント数1),(GEOHASHコード2,中心点の緯度2,中心点の経度2,マーチャント数2),・・・,(GEOHASHコードM,中心点の緯度M,中心点の経度M,マーチャント数M);MはGEOHASHコード数である}。
代替的な態様として、第3のデータセットに基づいて、M個の地域番号で示される地理的エリアをP個のエリアに分割した後、次のS11~S13をさらに含む。
S11:P個のエリアに位置する対象エリアに含まれる場所名を取得して、場所名セットを得る。
S12:場所名セットにおける各場所名を単語分割して、単語分割結果を得る。
S13:単語分割結果に出現回数が第3の所定閾値よりも大きい地名の単語が存在する場合、該地名の単語を対象エリアのエリア名として決定する。
任意選択で、本実施形態では、各エリアの中心点の経緯度を用いて、地図アプリケーションのオーペンAPIにより、逆アドレス解決を通じて、対象エリアに含まれる場所名を取得する。エリアに名前を付けるときは、「周辺の有名なエリア->商圏->郷・鎮・街道->一番ランドマーク->二番ランドマーク->交差点」という優先順位でエリアの名前を決定し、名前が同じであるエリアが複数ある場合、次の優先レベルに移行する。例えば、複数のエリアの有名なエリアはすべて同じである場合、商圏情報を利用し、商圏情報も同じである場合、郷・鎮・街道を利用し、以降同様である。結局、各エリアに一意の名前があるようになる。
任意選択で、本実施形態では、特徴的な名称だけを商圏名として残してもよい。
代替的な態様として、第3のデータセットには、対応関係にある地域番号、地域番号で示される地理的エリアの中心点の緯度、地域番号で示される地理的エリアの中心点の経度、および地域番号で示される地理的エリアの場所数がMグループ記録されている。
この場合、第3のデータセットに基づいて、M個の地域番号で示される地理的エリアをP個のエリアに分割することは、具体的には、次のように行われる。地域番号で示される地理的エリア毎の場所数、および、M個の地域番号で示される地理的エリアの中心点間の距離に基づいて、M個の地域番号で示される地理的エリアをP個のエリアに分割する。
任意選択で、本実施形態では、地理的エリア間の距離(例えば、地理的エリア間の距離を中心点間の距離で表す)に基づいてエリアを分割してもよいが、これに限られず、例えば、距離が遠い地理的エリアが異なるエリアに属し、距離が近い地理的エリアが同一のエリアに属する可能性がある。
代替的な態様として、地域番号で示される地理的エリア毎の場所数、および、M個の地域番号で示される地理的エリアの中心点間の距離に基づいて、M個の地域番号で示される地理的エリアをP個のエリアに分割することは、以下のS41~S3を含む。
S41:地域番号で示される地理的エリア毎の場所数に基づいて、地域番号で示される地理的エリア毎の第1の中心点に対応する重み値を決定する。
S42:各第1の中心点に対応する重み値、および、第1の中心点を中心とし、所定の半径値を半径とした範囲内に存在する第1の中心点以外の第2の中心点の数に応じて、第1の中心点をコアオブジェクト、非コアオブジェクト又はノイズオブジェクトとしてマークする。
3:第1の中心点がコアオブジェクトとしてマークされ、かつ第1の中心点および範囲内に位置する第2の中心点のうちのいずれかが存在する地理的エリアが、対象エリア内に位置すると記録された場合、第1の中心点および範囲内に位置する第2の中心点が存在する地理的エリアを共に、対象エリア内に位置すると記録し、第1の中心点がコアオブジェクトとしてマークされ、かつ第1の中心点および範囲内に位置する第2の中心点のそれぞれが存在する地理的エリアはいずれも、エリア内に位置すると記録されていない場合、第1の中心点および範囲内に位置する第2の中心点が存在する地理的エリアを共に、同一のエリアに位置すると記録する。
任意選択で、本実施形態では、各地理的エリア内のマーチャント数が異なるため、地理的エリア内のマーチャント数に基づいて決定された重み値Wを追加すると、クラスタ内の点の密度をよりよく記述し、クラスタリング結果を最適化することができる。
代替的な態様として、前記地域番号で示される地理的エリア毎の場所数に基づいて、前記地域番号で示される地理的エリア毎の第1の中心点に対応する重み値を決定することは、次のS51~S53を含む。
S51:すべての前記地域番号で示される地理的エリアの場所数の平均値、および、すべての前記地域番号で示される地理的エリアの場所数の標準偏差を決定する。
S52:前記地域番号で示される地理的エリア毎の場所数と前記平均値との差を決定する。
S53:前記差と前記標準偏差との比を、前記地域番号で示される地理的エリア毎の第1の中心点に対応する重み値として決定する。
例えば、重み値Wは、上記S51~S53により、次の式で表される標準化処理を実現したものである。

Figure 0007210086000001
ただし、Niは、i番目の地理的エリアの場所数(例えば、マーチャント数)であり、μは、すべての地理的エリアの場所数(例えば、マーチャント数)の平均値であり、σは、すべての地理的エリアの場所数(例えば、マーチャント数)の標準偏差である。
代替的な態様として、各第1の中心点に対応する重み値、および、前記第1の中心点を中心とし、所定の半径値を半径とした範囲内に存在する前記第1の中心点以外の第2の中心点の数に応じて、前記第1の中心点をコアオブジェクト、非コアオブジェクト又はノイズオブジェクトとしてマークすることは、
前記重み値が第1の所定閾値よりも大きい場合、前記第1の中心点をコアオブジェクトとしてマークすることと、
前記重み値が前記第1の所定閾値よりも小さく、かつ第2の所定閾値よりも大きい場合、前記第1の中心点を中心とし、所定の半径値を半径とした範囲内に存在する前記第1の中心点以外の第2の中心点の数に応じて、前記第1の中心点をコアオブジェクト、非コアオブジェクト又はノイズオブジェクトとしてマークすることと、
前記重み値が前記第2の所定閾値よりも小さい場合、前記第1の中心点を中心とし、所定の半径値を半径とした範囲内に存在する前記第1の中心点以外の第2の中心点の数に応じて、前記第1の中心点を非コアオブジェクト又はノイズオブジェクトとしてマークすることと、を含む。
任意選択で、本実施形態では、中心点がコアオブジェクトであるか否かを判断する際に、重みがある閾値よりも大きい(経験値は5であり、場所数(例えば、マーチャント数)が平均値よりも5σだけ大きいことを示す)場合、それを直接コアオブジェクトとしてマークする。重みが他の閾値よりも小さい(経験値は0であり、場所数(例えば、マーチャント数)が平均レベルよりも低いことを示す)場合、コアオブジェクトであるとは判断されない。
代替的な実施例では、商圏の分割を例として、M個の地域番号で示される地理的エリアの中心点に対して、地域番号で示される地理的エリア毎の中心点がマークされるまで、次のステップを繰り返して実行することにより、P個の商圏を得る。
S61:M個の中心点からマークされていない1つの中心点を現在中心点として選択する。
S62:現在中心点を中心とし、所定の半径値を半径とした範囲内に存在する現在中心点以外の中心点の数に応じて、現在中心点をコアオブジェクト、非コアオブジェクト又はノイズオブジェクトとしてマークする。
S63:現在中心点がコアオブジェクトとしてマークされ、かつ現在中心点および範囲内に位置する中心点のうちのいずれかが存在する地理的エリアが、対象商圏内に位置すると記録された場合、現在中心点および範囲内に位置する中心点が存在する地理的エリアを共に、対象商圏内に位置すると記録し、現在中心点がコアオブジェクトとしてマークされ、かつ現在中心点および範囲内に位置する中心点のそれぞれが存在する地理的エリアは、いずれも商圏内に位置すると記録されていない場合、現在中心点および範囲内に位置する中心点が存在する地理的エリアを共に、同一の商圏内に位置すると記録する。
任意選択で、本実施形態では、次のようにしてコアオブジェクト、非コアオブジェクト又はノイズオブジェクトをマークしてもよいが、これに限られない。
S71:現在中心点が存在する地理的エリアの場所数(例えば、マーチャント数)に基づいて、現在中心点に対応する重み値を決定する。
S72:重み値が第1の所定閾値よりも大きい場合、現在中心点をコアオブジェクトとしてマークする。
S73:重み値が第1の所定閾値よりも小さく、かつ第2の所定閾値よりも大きい場合、現在中心点を中心とし、所定の半径値を半径とした範囲内に存在する現在中心点以外の中心点の数に応じて、現在中心点をコアオブジェクト、非コアオブジェクト又はノイズオブジェクトとしてマークする。
S74:重み値が第2の所定閾値よりも小さい場合、現在中心点を中心とし、所定の半径値を半径とした範囲内に存在する現在中心点以外の中心点の数に応じて、現在中心点を非コアオブジェクト又はノイズオブジェクトとしてマークする。
任意選択で、本実施形態では、重み値が第1の所定閾値よりも小さく、かつ第2の所定閾値よりも大きい場合、次のようにしてコアオブジェクト、非コアオブジェクト又はノイズオブジェクトをマークしてもよいが、これに限られない。
S81:現在中心点を中心とし、所定の半径値を半径とした範囲内に存在する現在中心点以外の中心点の数が第5の所定閾値よりも大きい場合、現在中心点および範囲内に位置する中心点をマークし、現在中心点がコアオブジェクトとしてマークされる。
S82:現在中心点を中心とし、所定の半径値を半径とした範囲内に存在する現在中心点以外の中心点の数が第5の所定閾値以下であり、かつ1以上である場合、現在中心点を非コアオブジェクトとしてマークする。
S83:現在中心点を中心とし、所定の半径値を半径とした範囲内には、現在中心点のほか、何ら中心点はない場合、現在中心点をノイズオブジェクトとしてマークする。
任意選択で、本実施形態では、重み値が第1の所定閾値よりも小さく、かつ第2の所定閾値よりも大きい場合、密度準拠クラスタリングのアルゴリズム(Density-Based Spatial Clustering of Applications with Noise、DBSCAN)を用いて、それがコアオブジェクト、非コアオブジェクト又はノイズオブジェクトのどれであるかを決定してもよいが、これに限られない。
任意選択で、本実施形態では、重み値が第2の所定閾値よりも小さい場合、次のようにして非コアオブジェクト又はノイズオブジェクトをマークしてもよいが、これに限られない。
S1:現在中心点を中心とし、所定の半径値を半径とした範囲内に現在中心点以外の他の中心点が存在する場合、現在中心点を非コアオブジェクトとしてマークする。
S2:現在中心点を中心とし、所定の半径値を半径とした範囲内には、現在中心点のほか、何ら中心点はない場合、現在中心点をノイズオブジェクトとしてマークする。
任意選択で、本実施形態では、重み値が第2の所定閾値よりも小さい場合、DBSCANクラスタリングのアルゴリズムを用いてそれが非コアオブジェクト又はノイズオブジェクトであると決定してもよいが、これに限られない。
代替的な態様として、第3のデータセットに基づいて、M個の地域番号で示される地理的エリアをP個のエリアに分割した後、次のS1をさらに含む。
S1:クライアントに表示される電子地図上で、P個のエリア及び/又はM個の地域番号で示される地理的エリアをマークする。
任意選択で、本実施形態では、分割されたエリア情報をクライアントに伝送して表示してもよい。
例えば、図5に示すように、各枠は1つのGEOHASHエリアを示し、デジタルコードは所属エリアの番号を示す。
なお、上述した各方法実施形態において、説明の簡略化のために、一連の動作の組合せとして記述しているが、しかし、当業者であれば分かるように、本願は、説明された動作の順番に制限されず、本願によれば、一部のステップを他の順番で行うか或いは同時に行うこともできるのがその理由である。次に、明細書に記述された実施形態はいずれも好適な実施形態であり、言及された動作およびモジュールは、必ずしも本願に必須なものとは限られないことも、当業者であれば分かっている。
以上の実施形態で説明したように、上記実施形態による方法は、ソフトウェア及び必要な汎用ハードウェアフラップフォームを介して実現されることができ、もちろんハードウェアによって実現されることもできるが、多くの場合、前者がより適切な実施形態であることは、当業者にとって明らかである。このような理解に基づいて、本願の技術的構成は、本質上、或いは、関連技術に貢献する部分が、ソフトウェア製品の形で体現されることができ、このコンピュータソフトウェア製品は、記憶媒体(例えば、ROM/RAM、磁気ディスク、光ディスク)に記憶され、端末機器(携帯電話、コンピュータ、サーバ、又はネットワークデバイス等であってもよい)に本願の各実施形態の方法を実行させるための若干の命令を含む。
本願の実施形態の一態様によれば、上記エリアの分割方法を実施するためのエリアの分割装置をさらに提供する。図6に示すように、該装置は、
1)対応関係にある緯度および経度がNグループ(Nは正の整数で、N≧1である)記録されている第1のデータセットにおける緯度および経度を符号化して、それぞれが1つの地理的エリアを示すN個の地域番号が記録されている第2のデータセットを取得するための符号化モジュール62と、
2)前記第2のデータセットに基づいて、対応関係にある地域番号、前記地域番号で示される地理的エリアの中心点の緯度、前記地域番号で示される地理的エリアの中心点の経度がMグループ(Mは正の整数で、M≧1であり、かつMは前記地域番号の数である)記録されている第3のデータセットを取得するための第1の取得モジュール64と、
3)前記第3のデータセットに基づいて、M個の前記地域番号で示される地理的エリアを、それぞれが前記地域番号で示される地理的エリアを少なくとも1つ含むP個(Pは正の整数で、≧1である)のエリアに分割するための分割モジュール66と、を備える。
任意選択で、上記装置は、
処理対象となるN個の場所名を取得するための第2の取得モジュールと、
地図アプリケーションのAPIインターフェースを呼び出して、N個の場所名のそれぞれで示される場所が位置する緯度および経度を取得することで、対応関係にある場所名、緯度および経度をNグループ得るための第3の取得モジュールと、
Nグループの対応関係にある場所名、緯度および経度から第1のデータセットを形成するための形成モジュールと、をさらに備えてもよい。
任意選択で、分割モジュール66は、P個のエリアに第1のエリアが存在する場合、P個のエリアのうち第1のエリアに隣接する第2のエリアを決定するための第1の決定ユニットであって、第1のエリアに含まれている地理的エリアの数は第4の所定閾値よりも小さい第1の決定ユニットと、第1のエリアに含まれている地理的エリアを、第2のエリアに位置するように更新するための更新ユニットと、を含んでもよい。
任意選択で、符号化モジュール62は、第1のデータセットにおける緯度および経度をGEOHASH符号化して、第2のデータセットを取得するための符号化ユニットであって、第2のデータセットには、対応関係にある場所名およびGEOHASHコードがNグループ記録されており、地域番号はGEOHASHコードである符号化ユニット、を含んでもよい。
任意選択で、第1の取得モジュール64は、第2のデータセットに記録されているGEOHASHコードをクラスタリングして、互いに異なるM個のGEOHASHコードを得るためのクラスタリングユニットと、互いに異なるM個のGEOHASHコードのそれぞれで示される地理的エリアの中心点の緯度、および、それぞれで示される地理的エリアの中心点の経度を決定するための第2の決定ユニットと、対応関係にあるGEOHASHコード、GEOHASHコードで示される地理的エリアの中心点の緯度、GEOHASHコードで示される地理的エリアの中心点の経度をMグループ記録して、第3のデータセットを取得するための記録ユニットと、を含んでもよい。
任意選択で、装置は、P個のエリアに位置する対象エリアに含まれる店舗の場所名を取得して、場所名セットを得るための第4の取得モジュールと、場所名セットにおける各場所名を単語分割して、単語分割結果を得るための単語分割モジュールと、単語分割結果に出現回数が第3の所定閾値よりも大きい地名の単語が存在する場合、地名の単語を対象エリアのエリア名として決定するための決定モジュールと、をさらに備えてもよい。
任意選択で、第3のデータセットには、対応関係にある地域番号、地域番号で示される地理的エリアの中心点の緯度、地域番号で示される地理的エリアの中心点の経度、および地域番号で示される地理的エリアの場所数がMグループ記録されており、分割モジュールは、地域番号で示される地理的エリア毎の場所数、および、M個の地域番号で示される地理的エリアの中心点間の距離に基づいて、M個の地域番号で示される地理的エリアをP個のエリアに分割するための分割ユニット、を含んでもよい。
任意選択で、分割ユニットは、地域番号で示される地理的エリア毎の場所数に基づいて、地域番号で示される地理的エリア毎の第1の中心点に対応する重み値を決定するための決定サブユニットと、各第1の中心点に対応する重み値、および、第1の中心点を中心とし、所定の半径値を半径とした範囲内に存在する第1の中心点以外の第2の中心点の数に応じて、第1の中心点をコアオブジェクト、非コアオブジェクト又はノイズオブジェクトとしてマークするためのマークサブユニットと、第1の中心点がコアオブジェクトとしてマークされ、かつ第1の中心点および範囲内に位置する第2の中心点のうちのいずれかが存在する地理的エリアが、対象エリア内に位置すると記録された場合、第1の中心点および範囲内に位置する第2の中心点が存在する地理的エリアを共に、対象エリア内に位置すると記録し、第1の中心点がコアオブジェクトとしてマークされ、かつ第1の中心点および範囲内に位置する第2の中心点のそれぞれが存在する地理的エリアはいずれも、エリア内に位置すると記録されていない場合、第1の中心点および範囲内に位置する第2の中心点が存在する地理的エリアを共に、同一のエリアに位置すると記録するための処理サブユニットと、を含んでもよい。
任意選択で、決定サブユニットは、すべての地域番号で示される地理的エリアの場所数の平均値、および、すべての地域番号で示される地理的エリアの場所数の標準偏差を決定し、地域番号で示される地理的エリア毎の場所数と平均値との差を決定し、差と標準偏差との比を、地域番号で示される地理的エリア毎の第1の中心点に対応する重み値として決定するために用いられてもよい。
任意選択で、マークサブユニットは、重み値が第1の所定閾値よりも大きい場合、第1の中心点をコアオブジェクトとしてマークし、重み値が第1の所定閾値よりも小さく、かつ第2の所定閾値よりも大きい場合、第1の中心点を中心とし、所定の半径値を半径とした範囲内に存在する第1の中心点以外の第2の中心点の数に応じて、第1の中心点をコアオブジェクト、非コアオブジェクト又はノイズオブジェクトとしてマークし、重み値が第2の所定閾値よりも小さい場合、第1の中心点を中心とし、所定の半径値を半径とした範囲内に存在する第1の中心点以外の第2の中心点の数に応じて、第1の中心点を非コアオブジェクト又はノイズオブジェクトとしてマークするために用いられてもよい。
任意選択で、装置は、クライアントに表示される電子地図上で、P個のエリア及び/又はM個の地域番号で示される地理的エリアをマークするための表示モジュール、をさらに備えてもよい。
本願の実施形態で提供されるエリアの分割方法を理解しやすくするために、以下、具体的な応用場面を参照しながら例示的に説明する。
代替的な実施の態様として、上記エリアの分割方法は、図7に示されるマーチャントを対象とした商圏の分割場面に応用されることができるが、これに限られない。この場面において、マーチャントの位置データにより、GEOHASH及びDBSCANクラスタリングのアルゴリズムに基づいて、都市の商圏を分割する。マーチャントの経緯度データから各都市の商圏分割状況、商圏の地理的範囲を取得することができ、マーチャント名又は地図データが分かっていれば、商圏名を自動的に生成することもできる。各都市のオフライン調査を行ったり、他の次元のデータを収集したりする必要がなく、商圏の識別効率を大幅に向上させるとともに、タイムリーに更新でき、新しく加入したマーチャントが属する商圏を直接判断することができ、マーチャントの分析システム、マーケティング等の場面への商圏情報の使用をより効果的なものにすることができる。
この場面において、マーチャントの位置データに基づいて、都市の地理的エリアを分割し、商圏に名前を付ける。マーチャントの位置データは、地図に載っている情報であり、商圏は、各エリア範囲におけるマーチャント数、密度によって分割され、商圏の変化に伴いタイムリーに変更可能であり、商圏の結果は、エリアの判断であり、新しいマーチャントが加入すると、どの商圏に属するかを迅速に判断することができる。
図7に示すように、該フローは次のステップを含む。
ステップa:マーチャントの経緯度データを取得し、既存のマーチャント名データに基づいて、地図アプリケーションの開発APIによりマーチャントに対応する経緯度データを取得することができる。次のようなマーチャントの経緯度データセットを取得する。S={(マーチャント名1,緯度1,経度1),(マーチャント名2,緯度2,経度2),・・・,(マーチャント名N,緯度N,経度N);Nはマーチャントの総数である}。
ステップb:経緯度データをGEOHASH符号化する。符号化の精度は、データ品質に応じて調整されてもよく、データが十分な量を持っておりかつ正確である場合、細かい精度で行うことができ、それ以外の場合は粗い精度を選択することができる。例えば、図5に示される商圏の結果は、精度7で分割したものであり(即ち、各GEOHASHエリアが152.9m*152.4mを表す)、一部の都市の抜き打ち検査を行った結果、商圏の形状を良好に捕らえることができる。次のようなマーチャントのGEOHASHコードデータセットを取得する。S’={(マーチャント名1,GEOHASHコード1),(マーチャント名2,GEOHASHコード2),・・・,(マーチャント名N,GEOHASHコードN);Nはマーチャント数である}。
ステップc:各GEOHASHコードの中心点、マーチャント数を算出する。次のようなマーチャントGEOHASHコードデータセットを取得する。G={(GEOHASHコード1,中心点の緯度1,中心点の経度1,マーチャント数1),(GEOHASHコード2,中心点の緯度2,中心点の経度2,マーチャント数2),・・・,(GEOHASHコードM,中心点の緯度M,中心点の経度M,マーチャント数M);MはGEOHASHコード数である}。
ステップd:DBSCANアルゴリズムを用いたクラスタリングを行う。
ステップe:各GEOHASHエリアが属する商圏を得る。クラスタリング結果が出た後、さらに、実際の応用ニーズに応じて、クラスタリング結果の微調整を行って、分割結果を実際の認識に沿ったものにすることができ、微調整後、各GEOHASHエリアが属する商圏を得る。その調整を次の通り行う。
1)商圏の統合:商圏にはGEOHASHエリアが4つ以下しかない場合、他の大きな商圏と「隣接」するか否かを確認し、隣接していれば、大きな商圏に統合することで、商圏が散り散りばらばらになるのを回避する。
隣接するGEOHASHエリアの判断方法は、次の通りである。GEOHASHコードの復号化により該エリアの4隅の経緯度を取得し、これらの経緯度にGEOHASHの固定した長さと幅を加算すると、周囲の8つのGEOHASHエリアの中心の経緯度を取得することができ、さらにトランスコーディングすることで、各GEOHASHエリアの隣接するエリアを取得することができる。
2)パラメータの調整:異なるデータ状況に対して、GEOHASHの精度、クラスタリングのパラメータを適切に調整して、最適なパラメータを見つけることができる。パラメータ調整中に、マークが付けられている商圏のデータと比較するか、或いは、地図上で分割結果をプロットし、解析経験に基づいて判断することができる。様々なパラメータの組み合わせにより、最適なパラメータを見つけることができる。
ステップf:商圏の名称を識別する。データにマーチャントの名称が含まれている場合、マーチャント名データに基づいて、各商圏に名前を付けることができる。マーチャント名から商圏名らしい高頻度単語を抽出することにより行われることができ、商圏名は、例えば緑茶(海岸城店)、KFC-海岸城店のように、通常、支店名に現れる。マーチャント名を単語分割して候補となる単語を取得し、商圏の各単語が現れる頻度を算出し、頻度の閾値を設定し、条件を満たす地名の単語があれば、それを該商圏の名前とし、閾値は、データの品質に応じて調整する必要がある。また、各商圏の中心点の経緯度を用いて、地図アプリケーションのオーペンAPIにより、逆アドレス解決を通じて、周辺の有名なエリア、商圏、郷・鎮・街道、一番ランドマーク、二番ランドマーク、交差点を含む、座標位置を記述する情報を取得する。商圏に名前を付けるときは、「周辺の有名なエリア->商圏->郷・鎮・街道->一番ランドマーク->二番ランドマーク->交差点」という優先順位で商圏の名前を决定し、名前が同じである商圏が複数ある場合、次の優先レベルに移行する。例えば、複数の商圏の有名なエリアがすべて同じである場合、商圏情報を利用し、商圏情報も同じである場合、郷・鎮・街道を利用し、以降同様である。結局、各商圏に一意の名前があるようになる。
本願の実施形態の一態様によれば、上記商圏の分割を実施するための電子装置をさらに提供する。図8に示すように、該電子装置は、1つ又は複数(図において1つだけ示されている)のプロセッサ802、メモリ804、センサ806、エンコーダ808および伝送装置810を備え、該メモリにはコンピュータプログラムが記憶されており、該プロセッサは、コンピュータプログラムによって上記いずれかの方法実施形態におけるステップを実行するように構成される。
任意選択で、本実施形態では、上記電子装置は、コンピュータネットワークの複数のネットワークデバイスのうち少なくとも1つのネットワークデバイスに位置してもよい。
任意選択で、本実施形態では、上記プロセッサ802は、コンピュータプログラムによって、
第1のデータセットにおける緯度および経度を符号化して、第2のデータセットを取得するステップであって、第1のデータセットには、対応関係にある緯度および経度がNグループ記録されており、Nは正の整数で、N≧1であり、第2のデータセットには、N個の地域番号が記録されており、それぞれの地域番号は1つの地理的エリアを示すためのものである、ステップと、
第2のデータセットに基づいて、第3のデータセットを取得するステップであって、第3のデータセットには、対応関係にある地域番号、地域番号で示される地理的エリアの中心点の緯度、地域番号で示される地理的エリアの中心点の経度がMグループ記録されており、Mは正の整数で、M≧1であり、かつMは地域番号の数である、ステップと、
第3のデータセットに基づいて、M個の地域番号で示される地理的エリアをP個のエリアに分割するステップであって、Pは正の整数で、P≧1であり、それぞれのエリアには、地域番号で示される地理的エリアが少なくとも1つ含まれている、ステップと、を実行するように構成されてもよい。
任意選択で、図8に示される構造は一例に過ぎず、電子装置は、スマートフォン(例えば、Android携帯電話、iOS携帯電話等)、タブレットコンピュータ、パームトップコンピュータ、及びモバイルインターネットデバイス(Mobile Internet Devices、MID)、PAD等の端末機器であってもよいことが、当業者が理解するであろう。図8は、上記電子装置の構成を限定しない。例えば、電子装置は、図8に示すものよりも多いか少ないコンポーネント(例えば、ネットワークインターフェース、表示装置等)をさらに含むか、或いは、図8に示すものと異なる構成を有してもよい。
メモリ804は、ソフトウェアプログラム及びモジュール、例えば、本願の実施形態におけるエリアの分割方法および装置に対応するプログラム命令/モジュールを記憶することができ、プロセッサ802は、メモリ804に記憶されたソフトウェアプログラム及びモジュールを実行することで、様々な機能アプリケーション及びデータ処理を実行し、即ち、上述した対象コンポーネントの制御方法を実現する。メモリ804は、高速ランダムアクセスメモリを含むことができ、また、不揮発性メモリ、例えば、1つ又は複数個の磁性記憶装置、フラッシュメモリ、又は他の不揮発性ソリッドステートメモリを含むこともできる。一部の例において、メモリ804は、プロセッサ802に対して遠隔配置されたメモリをさらに含んでもよく、これらの遠隔メモリは、ネットワークを介して端末に接続されることができる。上記ネットワークの例は、インターネット、イントラネット、ローカルエリアネットワーク、移動通信網及びそれらの組み合わせを含むが、これらに限定されない。
上記伝送装置810は、ネットワークを介してデータの送受信を行う。上記ネットワークの具体例は、有線ネットワーク及び無線ネットワークを含むことができる。一例において、伝送装置810は、ケーブルを介して他のネットワーク機器及びルーターに接続されることでインターネット又はローカルエリアネットワークと通信可能であるネットワークアダプター(Network Interface Controller、NIC)を含む。一例において、伝送装置は、無線の方式によりインターネットとの通信を行う無線周波数(Radio Frequency、RF)モジュールである。
具体的には、メモリ804はアプリケーションプログラムを記憶する。
本願の実施形態は記憶媒体をさらに提供し、該記憶媒体にはコンピュータプログラムが記憶されており、該コンピュータプログラムは、実行されると、上記いずれかの方法実施形態におけるステップを実行するように構成される。
任意選択で、本実施形態では、上記記憶媒体は、
第1のデータセットにおける緯度および経度を符号化して、第2のデータセットを取得するステップであって、第1のデータセットには、対応関係にある緯度および経度がNグループ記録されており、Nは自然数であり、第2のデータセットには、N個の地域番号が記録されており、それぞれの地域番号は1つの地理的エリアを示すためのものである、ステップと、
第2のデータセットに基づいて、第3のデータセットを取得するステップであって、第3のデータセットには、対応関係にある地域番号、地域番号で示される地理的エリアの中心点の緯度、地域番号で示される地理的エリアの中心点の経度がMグループ記録されており、Mは自然数で、かつ地域番号の数である、ステップと、
第3のデータセットに基づいて、M個の地域番号で示される地理的エリアをP個のエリアに分割するステップであって、Pは自然数であり、それぞれのエリアには、地域番号で示される地理的エリアが少なくとも1つ含まれている、ステップと、を実行するためのコンピュータプログラムを記憶するように構成されてもよい。
任意選択で、記憶媒体は、さらに、上記実施形態における方法に含まれているステップを実行するためのコンピュータプログラムを記憶するように構成されてもよく、本実施形態ではその詳細を繰り返さない。
任意選択で、本実施形態では、上記実施形態の各種方法におけるステップの一部又は全部は、プログラムによって端末機器の関連するハードウェアを命令して完成させることができ、このプログラムがコンピュータ読み取り可能な記憶媒体に記憶されることができ、記憶媒体は、フラッシュディスク、リードオンリーメモリ(Read-Only Memory、ROM)、ランダムアクセスメモリ(Random Access Memory、RAM)、磁気ディスク又は光ディスク等を含みうることが、当業者が理解するであろう。
本願の実施形態は、命令を含むコンピュータプログラム製品をさらに提供し、サーバで実行されると、上記いずれかの実施形態で提供される方法をサーバに実行させる。
上記本願の実施形態の番号は説明のためのものに過ぎず、実施形態の優劣を示すものではない。
上記実施形態における集積したユニットは、ソフトウェア機能ユニットの形で実現されながら独立した製品として販売または使用される場合、コンピュータ読み取り可能な記憶媒体に記憶されることができる。このように理解すれば、本願の技術的構成は、本質的には、従来技術に貢献する部分、或いは、該技術的構成の全部又は一部をソフトウェア製品の形で表現することができ、該コンピュータソフトウェア製品は、コンピュータデバイス(パソコン、サーバまたはネットワークデバイス等であってもよい)に本願の各実施形態に記載の方法の全部又は一部を実行させるための若干の命令を含む記憶媒体に記憶される。
本願の上述した実施形態において、各実施形態に対する記述はそれぞれ独自の重点があり、ある実施形態について詳しく説明していない部分は、他の実施形態の関連記述を参照することができる。
本願で提供されるいくつかの実施形態において、開示されたクライアントを他の形態で実現可能なことは、理解されるべきである。以上で説明した装置実施形態はあくまでも概念的なものであり、例えば、上記ユニットの分類は論理的な機能によって分類したものであることができるが、実際の実現にあたり他の分類方式を用いてもよい。例えば、複数のユニット又はアセンブリを組み合わせたり、他のシステムに集積したりすることができ、或いは、いくつかの特徴を省略するか実行しなくてもよい。また、示された又は検討された部分同士の接続又は直接接続又は通信接続は、インターフェースを介して実現されることができ、また、ユニット又はモジュールの間接接続又は通信接続は電気的に又は他の形で実現されることができる。
上記分離した部材として説明したユニットは、物理的に分離したものであってもよいし、物理的に分離したものでなくてもよく、ユニットとして示した部材は、物理的ユニットであってもよいし、物理的ユニットでなくてもよく、つまり、同一場所に配置されてもよいし、複数のユニットに分布されてもよい。実際のニーズに応じて、その一部又は全てのユニットにより本実施形態の目的を達成することができる。
また、本願の各実施形態における各機能ユニットは、1つの処理ユニットに集積されてもよいし、それぞれのユニットごとに物理的に存在してもよく、或いは、2つ以上のユニットが1つのユニットに集積されてもよい。上記集積したユニットは、ハードウェアの形で実現されてもよいし、ソフトウェア機能ユニットの形で実現されてもよい。
以上、本願の好適な実施形態のみについて説明したが、当業者であれば、本願の原則から逸脱しない前提において若干の改善や修飾が可能であることは指摘されるべきである。これら改善や修飾も、本願の保護範囲内に含まれるべきである。
62 符号化モジュール
64 第1の取得モジュール
66 分割モジュール
802 プロセッサ
804 メモリ
806 センサ
808 エンコーダ

Claims (15)

  1. サーバが実行するエリアの分割方法であって、
    第1のデータセットにおける緯度および経度を符号化して、第2のデータセットを取得するステップであって、前記第1のデータセットには、対応関係にある緯度および経度がNグループ記録されており、Nは正の整数で、N≧1であり、前記第2のデータセットには、N個の地域番号が記録されており、それぞれの前記地域番号は1つの地理的エリアを示すためのものである、ステップと、
    前記第2のデータセットに基づいて、第3のデータセットを取得するステップであって、前記第3のデータセットには、対応関係にある地域番号、前記地域番号で示される地理的エリアの中心点の緯度、前記地域番号で示される地理的エリアの中心点の経度がMグループ記録されており、Mは正の整数で、M≧1であり、かつMは前記地域番号の数である、ステップと、
    前記第3のデータセットに基づいて、M個の前記地域番号で示される地理的エリアをP個のエリアに分割するステップであって、Pは正の整数で、P≧1であり、それぞれの前記エリアには、前記地域番号で示される地理的エリアが少なくとも1つ含まれている、ステップと、
    を含み、
    前記地域番号で示される地理的エリア毎の場所数に基づいて、前記地域番号で示される地理的エリア毎の第1の中心点に対応する重み値を決定し、
    前記重み値に基づいて、各第1の中心点に対応する重み値、および、前記第1の中心点を中心とし、所定の半径値を半径とした範囲内に存在する前記第1の中心点以外の第2の中心点の数に応じて、前記第1の中心点をコアオブジェクト、非コアオブジェクト又はノイズオブジェクトとしてマークすることを特徴とする、
    エリアの分割方法。
  2. 第1のデータセットにおける緯度および経度を符号化する前記ステップの前に、
    処理対象となるN個の場所名を取得するステップと、
    地図アプリケーションのアプリケーションプログラミングインターフェースAPIを呼び出して、前記N個の場所名のそれぞれで示される場所が位置する緯度および経度を取得することで、対応関係にある場所名、緯度および経度をNグループ得るステップと、
    Nグループの前記対応関係にある場所名、緯度および経度から前記第1のデータセットを形成するステップと、をさらに含む、請求項1に記載の方法。
  3. 前記第3のデータセットに基づいて、M個の前記地域番号で示される地理的エリアをP個のエリアに分割する前記ステップは、
    前記P個のエリアに第1のエリアが存在する場合、前記P個のエリアのうち前記第1のエリアに隣接する第2のエリアを決定するステップであって、前記第1のエリアに含まれている地理的エリアの数は第4の所定閾値よりも小さい、ステップと、
    前記第1のエリアに含まれている地理的エリアを、前記第2のエリアに位置するように更新するステップと、を含む請求項1に記載の方法。
  4. 第1のデータセットにおける緯度および経度を符号化して、第2のデータセットを取得する前記ステップは、
    前記第1のデータセットにおける緯度および経度をGEOHASH符号化して、前記第2のデータセットを取得するステップであって、前記第2のデータセットには、対応関係にある場所名およびGEOHASHコードがNグループ記録されており、前記地域番号は前記GEOHASHコードであるステップ、を含む請求項2に記載の方法。
  5. 前記第2のデータセットに基づいて、前記第3のデータセットを取得する前記ステップは、
    前記第2のデータセットに記録されているGEOHASHコードをクラスタリングして、互いに異なるM個のGEOHASHコードを得るステップと、
    前記互いに異なるM個のGEOHASHコードのそれぞれで示される地理的エリアの中心点の緯度、および、それぞれで示される地理的エリアの中心点の経度を決定するステップと、
    対応関係にあるGEOHASHコード、前記GEOHASHコードで示される地理的エリアの中心点の緯度、前記GEOHASHコードで示される地理的エリアの中心点の経度をMグループ記録して、前記第3のデータセットを取得するステップと、を含む請求項4に記載の方法。
  6. 前記第3のデータセットに基づいて、M個の前記地域番号で示される地理的エリアをP個のエリアに分割する前記ステップの後、
    前記P個のエリアに位置する対象エリアに含まれる場所名を取得して、場所名セットを得るステップと、
    前記場所名セットにおける各場所名を単語分割して、単語分割結果を得るステップと、 前記単語分割結果に出現回数が第3の所定閾値よりも大きい地名の単語が存在する場合、前記地名の単語を前記対象エリアのエリア名として決定するステップと、をさらに含む請求項1に記載の方法。
  7. 前記第3のデータセットには、対応関係にある地域番号、前記地域番号で示される地理的エリアの中心点の緯度、前記地域番号で示される地理的エリアの中心点の経度、および前記地域番号で示される地理的エリアの場所数がMグループ記録されており、
    前記第3のデータセットに基づいて、M個の前記地域番号で示される地理的エリアをP個のエリアに分割する前記ステップは、
    前記地域番号で示される地理的エリア毎の場所数、および、M個の前記地域番号で示される地理的エリアの中心点間の距離に基づいて、M個の前記地域番号で示される地理的エリアをP個のエリアに分割するステップ、を含む請求項1に記載の方法。
  8. 前記地域番号で示される地理的エリア毎の場所数、および、M個の前記地域番号で示される地理的エリアの中心点間の距離に基づいて、M個の前記地域番号で示される地理的エリアをP個のエリアに分割する前記ステップはさらに、
    前記第1の中心点がコアオブジェクトとしてマークされ、かつ前記第1の中心点および前記範囲内に位置する第2の中心点のうちのいずれかが存在する地理的エリアは、対象エリア内に位置すると記録された場合、前記第1の中心点および前記範囲内に位置する第2の中心点が存在する地理的エリアを共に、前記対象エリアに位置すると記録し、前記第1の中心点がコアオブジェクトとしてマークされ、かつ前記第1の中心点および前記範囲内に位置する第2の中心点のそれぞれが存在する地理的エリアはいずれも、前記エリアに位置すると記録されていない場合、前記第1の中心点および前記範囲内に位置する第2の中心点が存在する地理的エリアを共に、同一のエリアに位置すると記録するステップと、を含む請求項7に記載の方法。
  9. 前記地域番号で示される地理的エリア毎の場所数に基づいて、前記地域番号で示される地理的エリア毎の第1の中心点に対応する重み値を決定する前記ステップは、
    すべての前記地域番号で示される地理的エリアの場所数の平均値、および、すべての前記地域番号で示される地理的エリアの場所数の標準偏差を決定するステップと、
    前記地域番号で示される地理的エリア毎の場所数と前記平均値との差を決定するステップと、
    前記差と前記標準偏差との比を、前記地域番号で示される地理的エリア毎の第1の中心点に対応する重み値として決定するステップと、を含む請求項8に記載の方法。
  10. 各第1の中心点に対応する重み値、および、前記第1の中心点を中心とし、所定の半径値を半径とした範囲内に存在する前記第1の中心点以外の第2の中心点の数に応じて、前記第1の中心点をコアオブジェクト、非コアオブジェクト又はノイズオブジェクトとしてマークする前記ステップは、
    前記重み値が第1の所定閾値よりも大きい場合、前記第1の中心点をコアオブジェクトとしてマークするステップと、
    前記重み値が前記第1の所定閾値よりも小さく、かつ第2の所定閾値よりも大きい場合、前記第1の中心点を中心とし、所定の半径値を半径とした範囲内に存在する前記第1の中心点以外の第2の中心点の数に応じて、前記第1の中心点をコアオブジェクト、非コアオブジェクト又はノイズオブジェクトとしてマークするステップと、
    前記重み値が前記第2の所定閾値よりも小さい場合、前記第1の中心点を中心とし、所定の半径値を半径とした範囲内に存在する前記第1の中心点以外の第2の中心点の数に応じて、前記第1の中心点を非コアオブジェクト又はノイズオブジェクトとしてマークするステップと、を含む請求項8に記載の方法。
  11. 前記第3のデータセットに基づいて、M個の前記地域番号で示される地理的エリアをP個のエリアに分割する前記ステップの後、
    クライアントに表示される電子地図上で、前記P個のエリア及び/又はM個の前記地域番号で示される地理的エリアをマークするステップ、をさらに含む請求項1乃至10のうちいずれか一項に記載の方法。
  12. 第1のデータセットにおける緯度および経度を符号化して、第2のデータセットを取得するための符号化モジュールであって、前記第1のデータセットには、対応関係にある緯度および経度がNグループ記録されており、Nは正の整数で、N≧1であり、前記第2のデータセットには、N個の地域番号が記録されており、それぞれの前記地域番号は1つの地理的エリアを示すためのものである、符号化モジュールと、
    前記第2のデータセットに基づいて、第3のデータセットを取得するための第1の取得モジュールであって、前記第3のデータセットには、対応関係にある地域番号、前記地域番号で示される地理的エリアの中心点の緯度、前記地域番号で示される地理的エリアの中心点の経度がMグループ記録されており、Mは正の整数で、M≧1であり、かつMは前記地域番号の数である、第1の取得モジュールと、
    前記第3のデータセットに基づいて、M個の前記地域番号で示される地理的エリアをP個のエリアに分割するための分割モジュールであって、Pは正の整数で、P≧1であり、それぞれの前記エリアには、前記地域番号で示される地理的エリアが少なくとも1つ含まれている、分割モジュールと、
    を備え、
    前記地域番号で示される地理的エリア毎の場所数に基づいて、前記地域番号で示される地理的エリア毎の第1の中心点に対応する重み値を決定し、
    前記重み値に基づいて、各第1の中心点に対応する重み値、および、前記第1の中心点を中心とし、所定の半径値を半径とした範囲内に存在する前記第1の中心点以外の第2の中心点の数に応じて、前記第1の中心点をコアオブジェクト、非コアオブジェクト又はノイズオブジェクトとしてマークすることを特徴とする、
    エリアの分割装置。
  13. 処理対象となるN個の場所名を取得するための第2の取得モジュールと、
    地図アプリケーションのアプリケーションプログラミングインターフェースAPIを呼び出して、前記N個の場所名のそれぞれで示される場所が位置する緯度および経度を取得することで、対応関係にある場所名、緯度および経度をNグループ得るための第3の取得モジュールと、
    Nグループの前記対応関係にある場所名、緯度および経度から前記第1のデータセットを形成するための形成モジュールと、
    をさらに備える請求項12に記載の装置。
  14. メモリとプロセッサとを備える電子装置であって、
    前記メモリには、コンピュータプログラムが記憶されており、
    前記プロセッサは、前記コンピュータプログラムによって上記請求項1~11のうちいずれか一項に記載の方法を実行するように構成される、ことを特徴とする電子装置。
  15. コンピュータ上で実行されると、請求項1~11のうちいずれか一項に記載の方法を前記コンピュータに実行させる命令を含むコンピュータプログラム。
JP2021519699A 2019-03-19 2020-03-09 エリアの分割方法と装置、電子装置およびプログラム Active JP7210086B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201910209714.6A CN111723959B (zh) 2019-03-19 2019-03-19 区域的划分方法、装置、存储介质及电子装置
CN201910209714.6 2019-03-19
PCT/CN2020/078351 WO2020187070A1 (zh) 2019-03-19 2020-03-09 区域的划分方法、装置、存储介质及电子装置

Publications (2)

Publication Number Publication Date
JP2022504597A JP2022504597A (ja) 2022-01-13
JP7210086B2 true JP7210086B2 (ja) 2023-01-23

Family

ID=72519006

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021519699A Active JP7210086B2 (ja) 2019-03-19 2020-03-09 エリアの分割方法と装置、電子装置およびプログラム

Country Status (4)

Country Link
US (1) US11966424B2 (ja)
JP (1) JP7210086B2 (ja)
CN (1) CN111723959B (ja)
WO (1) WO2020187070A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021203728A1 (zh) * 2020-10-26 2021-10-14 平安科技(深圳)有限公司 一种展业区域的选址方法、装置、计算机设备和介质
CN112907275A (zh) * 2021-01-21 2021-06-04 长沙市到家悠享网络科技有限公司 商圈围栏配置方法、服务信息分配方法及设备、介质
CN113793171B (zh) * 2021-08-27 2023-11-07 浙江新再灵科技股份有限公司 基于多维数据的区域划分方法、装置、存储介质及设备
CN114385627A (zh) * 2021-12-08 2022-04-22 北京大数元科技发展有限公司 一种基于gis地图的数据分析方法、装置及存储介质
CN116132486B (zh) * 2023-04-13 2023-06-20 山东慧创信息科技有限公司 一种基于物联网高精度的天空地一体化数据获取系统
CN117195016B (zh) * 2023-11-07 2024-02-06 长江三峡集团实业发展(北京)有限公司 污水处理模式确定方法、装置、计算机设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012113625A (ja) 2010-11-26 2012-06-14 Sony Corp 情報処置装置、情報処置方法およびプログラム
JP2012168069A (ja) 2011-02-16 2012-09-06 Mic Ware:Kk 地図情報処理装置、ナビゲーション装置、地図情報処理方法、およびプログラム
JP2013003597A (ja) 2011-06-10 2013-01-07 Sony Corp 情報処理装置、情報処理方法及びプログラム
JP2013542478A (ja) 2010-08-25 2013-11-21 インターナショナル・ビジネス・マシーンズ・コーポレーション 地理空間データベース統合方法、およびデバイス
JP2015096867A (ja) 2008-10-22 2015-05-21 グーグル・インコーポレーテッド 個人情報のジオコーディング
JP2015225491A (ja) 2014-05-28 2015-12-14 日本電信電話株式会社 バースト領域抽出装置、バースト領域抽出方法及びバースト領域抽出プログラム
JP2016503937A (ja) 2013-01-18 2016-02-08 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited 活動領域の検索および決定
JP2016520896A (ja) 2014-02-28 2016-07-14 シャオミ・インコーポレイテッド クラスタリング方法、装置および端末装置

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6609062B2 (en) * 1996-08-22 2003-08-19 Wgrs Licensing Company, Llc Nesting grid structure for a geographic referencing system and method of creating and using the same
JP5155081B2 (ja) * 2008-09-29 2013-02-27 日本たばこ産業株式会社 巡回ポイント分類システムおよび巡回ポイント分類方法
US9141641B2 (en) * 2010-10-28 2015-09-22 Sap Se Aggregating based on hierarchy and scaling input
US8669884B2 (en) * 2011-02-02 2014-03-11 Mapquest, Inc. Systems and methods for generating electronic map displays with points of-interest information
US8983953B2 (en) * 2011-10-18 2015-03-17 Nokia Corporation Methods and apparatuses for facilitating interaction with a geohash-indexed data set
US11138243B2 (en) * 2014-03-06 2021-10-05 International Business Machines Corporation Indexing geographic data
GB2550783A (en) * 2015-02-10 2017-11-29 Beijing Didi Infinity Technology & Dev Co Ltd Order pushing method and system
IL238562B (en) * 2015-04-30 2019-05-30 Verint Systems Ltd A system and method for spatial grouping by lattices in several resolutions
US20160356603A1 (en) * 2015-06-07 2016-12-08 Apple Inc. Map application with transit navigation mode
CN107273376B (zh) * 2016-04-07 2020-08-04 阿里巴巴集团控股有限公司 目标位置搜索方法和装置
US11380441B1 (en) * 2016-05-10 2022-07-05 Privacy Analytics Inc. Geo-clustering for data de-identification
US11194873B1 (en) * 2016-05-18 2021-12-07 United Services Automobile Association (Usaa) Grid-based ranking of location data
CN106528597B (zh) * 2016-09-23 2019-07-05 百度在线网络技术(北京)有限公司 兴趣点的标注方法以及装置
US20180232840A1 (en) * 2017-02-15 2018-08-16 Uber Technologies, Inc. Geospatial clustering for service coordination systems
CN108540988B (zh) * 2017-03-06 2020-10-09 中国移动通信集团公司 一种场景划分方法及装置
CN107193918B (zh) * 2017-05-15 2020-07-14 浙江正泰中自控制工程有限公司 一种基于开源地图的分布式gis状态监控系统
CN108960694B (zh) * 2017-05-19 2022-04-12 北京京东振世信息技术有限公司 配送区域确定方法和装置
US11343817B2 (en) * 2017-08-28 2022-05-24 Konstantinos Amouris Multi-tier density-aware location-based channel assignment and adaptive power control method for mobile ad-hoc networks
CN108269087B (zh) * 2018-01-12 2020-07-28 阿里巴巴集团控股有限公司 位置信息的处理方法及装置
CN108363733A (zh) * 2018-01-17 2018-08-03 阿里巴巴集团控股有限公司 内容推荐方法及装置
CN109102334A (zh) * 2018-08-07 2018-12-28 长沙市到家悠享家政服务有限公司 商圈划分方法、装置及电子设备
CN109992633B (zh) * 2019-02-20 2020-08-07 北京三快在线科技有限公司 基于用户位置的地理围栏确定方法、装置、电子设备
US10848407B2 (en) * 2019-04-22 2020-11-24 Oath Inc. Efficient density based geo clustering
CN110335068A (zh) * 2019-06-18 2019-10-15 平安普惠企业管理有限公司 一种商户聚集区域确定方法及装置
US11349850B2 (en) * 2019-12-03 2022-05-31 Blackberry Limited Systems and methods for managing mobile devices based on device location data

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015096867A (ja) 2008-10-22 2015-05-21 グーグル・インコーポレーテッド 個人情報のジオコーディング
JP2013542478A (ja) 2010-08-25 2013-11-21 インターナショナル・ビジネス・マシーンズ・コーポレーション 地理空間データベース統合方法、およびデバイス
JP2012113625A (ja) 2010-11-26 2012-06-14 Sony Corp 情報処置装置、情報処置方法およびプログラム
JP2012168069A (ja) 2011-02-16 2012-09-06 Mic Ware:Kk 地図情報処理装置、ナビゲーション装置、地図情報処理方法、およびプログラム
JP2013003597A (ja) 2011-06-10 2013-01-07 Sony Corp 情報処理装置、情報処理方法及びプログラム
JP2016503937A (ja) 2013-01-18 2016-02-08 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited 活動領域の検索および決定
JP2016520896A (ja) 2014-02-28 2016-07-14 シャオミ・インコーポレイテッド クラスタリング方法、装置および端末装置
JP2015225491A (ja) 2014-05-28 2015-12-14 日本電信電話株式会社 バースト領域抽出装置、バースト領域抽出方法及びバースト領域抽出プログラム

Also Published As

Publication number Publication date
CN111723959B (zh) 2023-12-12
WO2020187070A1 (zh) 2020-09-24
US20210263957A1 (en) 2021-08-26
US11966424B2 (en) 2024-04-23
JP2022504597A (ja) 2022-01-13
CN111723959A (zh) 2020-09-29

Similar Documents

Publication Publication Date Title
JP7210086B2 (ja) エリアの分割方法と装置、電子装置およびプログラム
JP6141393B2 (ja) 目標位置を確定するための方法及び装置
US20230351445A1 (en) Determining locations of interest based on user visits
CN106462627B (zh) 根据多个位置数据报告分析语义地点和相关数据
CN103493044B (zh) 使用在区域中的3d模型活动对场所排名的扩展
US11835352B2 (en) Identifying, processing and displaying data point clusters
Sester et al. Integrating and generalising volunteered geographic information
US9049549B2 (en) Method and apparatus for probabilistic user location
US20130226667A1 (en) Methods and apparatus to analyze markets based on aerial images
US20140032271A1 (en) System and method for processing demographic data
JP6276106B2 (ja) 意思決定支援システムおよび意思決定支援方法
Vaz et al. Crowdsourced mapping of land use in urban dense environments: An assessment of Toronto
CN112861972B (zh) 一种展业区域的选址方法、装置、计算机设备和介质
US20220357176A1 (en) Methods and data processing systems for predicting road attributes
Herfort et al. A spatio-temporal analysis investigating completeness and inequalities of global urban building data in OpenStreetMap
US20230049839A1 (en) Question Answering Method for Query Information, and Related Apparatus
Zhang et al. Assessing OSM building completeness using population data
Moradi et al. Exploring five indicators for the quality of OpenStreetMap road networks: A case study of Québec, Canada
CN116437291A (zh) 一种基于手机信令的文化圈规划方法和系统
CN107291784B (zh) 地理围栏类别的获取方法、装置及业务设备
US20220292091A1 (en) Method, apparatus, and system for compression of sparse data for machine learning tasks
CN112748453A (zh) 道路侧定位方法、装置、设备及存储介质
CN114820960A (zh) 构建图谱的方法、装置、设备和介质
Chima et al. Assessment of Nigeriasat-1 satellite data for urban land use/land cover analysis using object-based image analysis in Abuja, Nigeria
McKeen et al. High-resolution gridded population datasets for Latin America and the Caribbean using official statistics

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210409

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210409

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220516

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220523

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220823

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230105

R150 Certificate of patent or registration of utility model

Ref document number: 7210086

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150