JP6877464B2 - 地図上の関心地点の略称を得る方法及び装置 - Google Patents

地図上の関心地点の略称を得る方法及び装置 Download PDF

Info

Publication number
JP6877464B2
JP6877464B2 JP2018554614A JP2018554614A JP6877464B2 JP 6877464 B2 JP6877464 B2 JP 6877464B2 JP 2018554614 A JP2018554614 A JP 2018554614A JP 2018554614 A JP2018554614 A JP 2018554614A JP 6877464 B2 JP6877464 B2 JP 6877464B2
Authority
JP
Japan
Prior art keywords
abbreviation
interest
phrase
point
full name
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018554614A
Other languages
English (en)
Other versions
JP2019503025A (ja
JP2019503025A5 (ja
Inventor
ヂォン,グァンハイ
リー,フゥイ
Original Assignee
アドバンスド ニュー テクノロジーズ カンパニー リミテッド
アドバンスド ニュー テクノロジーズ カンパニー リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アドバンスド ニュー テクノロジーズ カンパニー リミテッド, アドバンスド ニュー テクノロジーズ カンパニー リミテッド filed Critical アドバンスド ニュー テクノロジーズ カンパニー リミテッド
Publication of JP2019503025A publication Critical patent/JP2019503025A/ja
Publication of JP2019503025A5 publication Critical patent/JP2019503025A5/ja
Application granted granted Critical
Publication of JP6877464B2 publication Critical patent/JP6877464B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/36Input/output arrangements for on-board computers
    • G01C21/3679Retrieval, searching and output of POI information, e.g. hotels, restaurants, shops, filling stations, parking facilities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Remote Sensing (AREA)
  • Data Mining & Analysis (AREA)
  • Radar, Positioning & Navigation (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Automation & Control Theory (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Instructional Devices (AREA)
  • Navigation (AREA)

Description

本願は、2016年1月11日に出願され「許可管理及びリソース制御の方法及び装置」と題された中国特許出願第201610015852.7号の優先権を主張し、上記中国特許出願は参照によってその全体が本明細書に組み込まれる。
本願は、コンピュータ技術に関し、特に、地図上の関心地点の略称を得る方法及び装置に関する。
地図上の関心地点(POI、Point Of Interest)は、家屋、店舗、学校、バス停等である。地図でPOIを検索する場合、一般に用いられる検索方法は、POIを、その略称を用いて検索するという方法である。例えば、地図で「北京師范大学(Beijing Normal UNIVERSITY)」を検索する場合は、代わりに「北京師范大学」の略称である「北師大(BNU)」を入力してこの大学を地図で探すことができる。そのため、POIをその略称を用いて検索する方法をサポートできるように、POIのフルネームに対応する略称をいくつか得て、フルネームと略称との間のマッピング関係を確立する必要がある。これにより、地図のユーザが入力した略称に基づいて対応するフルネームを正確に特定し、ユーザが捜している目標である所在地をユーザへフィードバックすることができる。既存の技術では、通常、関心地点の略称は手作業(マニュアル)でのラベル付けによって得られるが、手作業でのラベル付けはかなりの作業量になり、効率もかなり低下する。地図のデータ量が増えるに従って、手作業でのラベル付けの効率は更に低下することになる。
既存の技術における課題を解決するために、本開示は、地図上の関心地点の略称を得る効率を高めるための、地図上の関心地点の略称を得る方法及び装置を提供する。
本開示の第1の実施の形態により、地図上の関心地点(POI)の略称を得る方法が提供され、当該方法は:地図上のPOIのフルネームに基づいて複数の評価対象略称を生成するステップと;前記POIの所定の範囲から、前記POIの前記フルネーム又は任意の前記評価対象略称を含む複数の住所名を得るステップと;前記住所名に基づいて目的語句の語句状態ベクトルを計算するステップであって、前記語句状態ベクトルは、前記住所名中での前記目的語句の位置状態を示すために用いられ、前記目的語句は、前記POIの前記フルネーム又は任意の前記評価対象略称である、計算するステップと;前記POIの前記フルネームの語句状態ベクトルと任意の前記評価対象略称の語句状態ベクトルとの間の類似度を別々に計算するステップと;所定の閾値よりも高い類似度に対応する評価対象略称を、前記POIの前記フルネームに対応する前記POIの略称として特定するステップと;を含む。
本開示の第2の実施の形態により、地図上のPOIの略称を得る装置が提供され、当該装置は:地図上のPOIのフルネームに基づいて複数の評価対象略称を生成するように構成された評価対象略称生成モジュールと;前記POIの所定の範囲から、前記POIの前記フルネーム又は前記評価対象略称を含む複数の住所名を得るように構成された関連アドレス取得モジュールと;前記住所名に基づき目的語句の語句状態ベクトルを計算するように構成された語句状態計算モジュールであって、前記語句状態ベクトルは、前記住所名中の前記目的語句の位置状態を示すために用いられ、前記目的語句は前記POIの前記フルネーム又は任意の前記評価対象略称である、語句状態計算モジュールと;前記POIの前記フルネームの語句状態ベクトルと任意の前記評価対象略称の語句状態ベクトルとの間の類似度を別々に計算するように構成された類似度計算モジュールと;所定の閾値よりも高い類似度に対応する評価対象略称を、前記POIの前記フルネームに対応する前記POIの略称として特定するように構成された略称特定モジュールと;を含む。
本開示の実施で提供される技術上の解決策は、以下の有益な効果を奏する。すなわち、本方法を用いることで、関心地点のフルネームを提供する際に、その関心地点付近の関連住所名を地図住所ライブラリから自動的に入手し、全ての利用可能な略称におけるフルネームの略称となり得る略称が住所名に基づいて計算されることで、略称が自動的に特定される。これにより、地図上の関心地点の略称を得る効率が向上する。
前述の一般的な説明および以下の詳細な説明は単なる例示および説明であり、本開示を限定するものではないことを理解されたい。
添付の図面は、本明細書に組み込まれ、本明細書の一部を構成し、本開示による実施を示し、本開示の原理を説明するために明細書とともに使用される。
図1は、例示の実施による、地図上の関心地点の略称を得る方法を示すフローチャートである。
図2は、例示の実施による、2次元空間におけるコサイン類似度計算の原理を示す図である。
図3は、例示の実施による、地図上の関心地点の略称を得る装置を示す図である。
例示的な実施例をここで詳細に説明し、例を添付の図面に示す。以下の説明が添付の図面を参照するとき、別段の指定がない限り、異なる図面における同一の番号は、同一または類似の要素を表す。以下の実施例で説明される実施例は、本開示と一致する全ての実施例を示すものではない。それどころか、添付の特許請求の範囲に記載された、本開示のいくつかの態様と一致する装置および方法の単なる例である。
本願の実施は、地図上の関心地点(POI)の略称を得る方法を提供する。この方法は、効率的に略称を得るために、手作業(マニュアル)によるラベル付けを行うのではなく、POIのフルネームに基づいて、対応する略称を自動的に得るための解決策である。
この略称取得方法は以下の原理に基づく。すなわち、住所の名前付けにPOIを用いると、そのPOIのフルネームと略称とが、詳細な住所の実質的に同様な場所に現れる。通常、フルネームと略称とは、同一の場所又は地理的に近い場所に対応する住所名で用いられる。
例えば、POIは学校である。学校のフルネームが「北京師范大学(Beijing Normal University)」であるとすると、通常、その大学内や周辺にはこの学校名を用いた住所名が多く存在する。これには、例えば、「北京師范大学食堂(Beijing Normal UNIVERSITY Cafeteria)」、「北師大書店(BNU Bookstore)」、「北京師范宿舍楼A区(Beijing Normal UNIVERSITY Section A)」、「北師教研室(BN Education Center)」などがある。(これらの名称は、本願の解決策を説明するための例に過ぎず、実際に存在するとは限らない点に留意されたい)。これで分かるように、住所名によっては、例えば「北京師范大学食堂(Beijing Normal UNIVERSITY Cafeteria)」の中にフルネーム、例えば「北京師范大学(Beijing Normal UNIVERSITY)」が用いられ、又、住所名によっては、例えば、「北師大書店(BNU Bookstore)」の中に「北師(BNU)」、「北師教研室(BN Education Center)」の中に「北師(BN)」というように、略称が用いられている。
先の実施例では、POI(Point of Interest)のフルネーム又は略称が住所名に適用され、このフルネーム及びこの略称は、上で述べた2つの態様を充たす。
第一に、フルネームと略称は、同一の場所又は地理的に近接した場所の住所名で用いられている。例えば、「北京師范大学食堂(Beijing Normal UNIVERSITY Cafeteria)」、「北師大書店(BNU Bookstore)」、「北京師范宿舍楼A区(Beijing Normal UNIVERSITY Section A)」などは全て「北京師范大学(Beijing Normal UNIVERSITY)」の敷地内又はその周辺にある。
第二に、POIのフルネームと略称は、詳細な住所における実質的に類似する場所に現れる。例えば、「北京師范大学(Beijing Normal UNIVERSITY)」を一例にとる。「北京師范大学(Beijing Normal UNIVERSITY)」の略称「北師大(BNU)」に対して、住所ライブラリ内で詳細な住所文字列が「北京市新街口外大街19号北京師范大学図書館(19 Xinjiekou Street,Beijing Normal University Library,Beijing)」と記述されている場合、「北京市新街口外大街19号北師大図書館(19 Xinjiekou Street,BNU Library,Beijing)」という住所文字列、又は、「北京新街口外大街北師大図書館(Xinjiekou Street,BNU Library,Beijing)」に類似した文字列が存在する可能性がある。これは、住所ライブラリ内でPOIのフルネームの場所と略称の場所とが実質的に類似していることを示し、言い換えれば、コンテキストが実質的に類似している。
例えば、規模の大きな住所テキストライブラリの場合、1対のフルネームと略称は前後に同一の語句(フレーズ)を持つことができる。例えば、先の例の住所ライブラリでは、フルネーム「北京師范大学(Beijing Normal University)」と、これに対応した略称「北師大(BNU)」とのいずれにも、前に「新街口外大街(Xinjiekou Street)」、後に「図書館(Library)」が付いている。例えば、1対のフルネームと略称との前後の語句には「食堂(Cafeteria)」、「図書館(Library)」、「教学楼(Building、教授校舎)」が含まれる。これらの語句はベクトル{食堂(Cafeteria),図書館(Library),教学楼(Building)}を形成でき、各々の語句はそのベクトルの次元である。
Figure 0006877464
表1に示す例では、フルネームを含む詳細な住所文字列中に「食堂(Cafeteria)」が117回現れ、略称を含む詳細な住所文字列中に「食堂(Cafeteria)」が32回現れる。同様に、フルネームと略称において、「図書館(Library)」がそれぞれ267回と71回現れ、「教学楼(Building)」がそれぞれ422回と112回現れる。これら3つの次元の出現回数は基本的に比例する。つまり、フルネーム「北京師范大学(Beijing Normal UNIVERSITY)」に対応するベクトルは{117,267,422}であり、略称「北師大(BNU)」に対応するベクトルは{32,71,112}である。2つのベクトル間のコサイン類似度を計算すると、コサイン値は1に非常に近いことがわかる。
先の原理に基づき、POIの略称を得る本方法の手順については図1を参照されたい。本方法は以下のステップを含む。
ステップ101:地図上のPOIのフルネームに基づいて複数の評価対象略称を生成する。
このステップでは、POIのフルネームに含まれる単語同士を、或る単語配列順序で組み合わせることで、任意数の単語の組み合わせを形成でき、ここで、各々の組み合わせは略称であり、複数の略称が得られる。
引き続き「北京師范大学(Beijing Normal University)」を例にとる。中国語ピンインによるこのフルネームは6つの単語「北(Bei)」、「京(Jing)」、「師(Shi)」、「范(Fan)」、「大(Da)」、「学(Xue)」を含む。次に、単語を組み合わせて、任意数の単語の組み合わせを形成する。単語数が2つである場合、2つの単語を組み合わせて、例えば、「北京(Beijing)」、「京師(Jingshi)」、「師范(Shifan)」、「范大(Fanda)」、「大学(Daxue)」、「北師(Beishi)」、「北范(Beifan)」等のようになる。組み合わせの中で、単語どうしは、フルネーム中の単語の配列順序にて組み合わせられることが分かる。つまり、組み合わせにおける各単語の順序は、フルネーム中の単語の順序と同じである。単語の数が3つである場合は、3つの単語を組み合わせて、「北京師(Beijingshi)」、「京師范(Jingshifan)」、「北師范(Beishifan)」等のようになる。
任意の組み合わせにより複数の略称を入手した後に、更に、複数の略称から、非POIの略称と特定された単語及びノイズ語句を除くことができ、残った略称が評価対象略称となる。このように、後続の処理ステップにが受け入れる評価対象略称の数を減らすことにより、手順の処理効率が向上する。単語は、先の「北(Bei)」、「京(Jing)」、「師(Shi)」他などであり、ノイズ語句は、「北京(Beijing)」、「師范(Shifan)」、「大学(Daxue)」他などである。ユーザが、一般に用いられる語句を「北京師范大学(Beijing Normal University)」の略称として入力することは普通ではあり得ない。
ステップ102:POIの所定の範囲から、POIのフルネーム又は任意の評価対象略称を含む複数の住所名を得る。
例えば、所定の範囲は、上に挙げた「北京師范大学食堂(Beijing Normal University Cafeteria)」、「北師大書店(BNU Bookstore)」、「北京師范宿舍楼A区(Beijing Normal Dormitory Section A)」、「北師教研室(BN Education Center)」のようなPOIの周辺500メートルの範囲であってよい。これらの住所名は、POIのフルネーム「北京師范大学(Beijing Normal University)」、又は、評価対象略称「北師大(BNU)」のいずれかを含む。評価対象略称は、ステップ101で特定した、地図上のPOIの略称である。
ステップ103:住所名に基づく目的語句の語句状態ベクトルを計算する。ここで、語句状態ベクトルは、住所名における目的語句の位置情報を示すために用いられ、目的語句はPOIのフルネーム、又は任意の評価対象略称である。
このステップで計算される語句状態ベクトルは、例えばn次元ベクトル(A1,A2,…,An)のような多次元ベクトルであってよい。加えて、対応する語句状態ベクトルは、POIのフルネームと評価対象略称の各々について、計算により入手できる。例えば、フルネーム「北京師范大学(Beijing Normal University)」に対応する語句状態ベクトルは(A1,A2,…,An)であり、略称のうちの1つ「北師大(BNU)」の語句状態ベクトルは(B1,B2,…,Bn)である。
語句状態ベクトルは、ステップ102で入手した複数の住所名に関連して計算でき、POIのフルネームの語句状態ベクトルを計算する方法は、評価対象略称の語句状態ベクトルを計算する方法と同じである。POIのフルネーム、又は、任意の略称を目的語句と称する場合、1つの目的語句の語句状態ベクトルを以下の方法で計算できる。
ステップ102で、例えば「北師大書店(BNU Bookstore)」、「北師教研室(BN Education Center)」などの住所名を複数入手できる。目的語句については、例えば、目的語句は「北師大(BNU)」であり、「北師大書店(BNU Bookstore)」のように「北師大(BNU)」を含んだ住所名が見つかる。目的語句を含む複数の住所名があり得る。目的語句の隣接語句を、この目的語句を含む各住所名から入手でき、又、隣接語句は目的語句の前後の語句を含む。
例えば、目的語句「北師大(BNU)」を含む住所名「北師大書店(BNU Bookstore)」において、目的語句の前の語句は「空(null)」であり(つまり、目的語句の前には語句がない)、目的語句の後の語句は「書店(Bookstore)」である。別の例として、目的語句「北師大(BNU)」を含む住所名「博文北師大書房(Bowen BNU Bookstore)」において、目的語句の前の語句は「博文(Bowen)」、後の語句は「書房(Bookstore)」である。統計集計の後に、目的語句を含む全ての住所名の中には、先に挙げた「空(null)」、「書店(Bookstore)」、「博文(Bowen)」、及び「書房(Bookstore)」のような、目的語句の隣接語句が複数ある。隣接語句を4つと仮定すると(実際には、更に多くの隣接語句があり得る)、この4つの語句はそれぞれ目的語句の語句状態ベクトルの1つのベクトル次元に対応し、ベクトル(空(null),書店(Bookstore),博文(Bowen),書房(Bookstore))は4次元ベクトルである。
語句の次元値は、その語句が住所名中に現れる頻度とすることができる。「書店(Bookstore)」を例にとる。ステップ102で10個の住所名を入手し、「書店(Bookstore)」が2回現れ、「書店(Bookstore)」の頻度または次元値が2であるとする。その他の次元値も同様に計算できるが、ここでは説明を繰り返さない。
ステップ104:POIのフルネームの語句状態ベクトルと任意の評価対象略称の語句状態ベクトルとの間の類似度を別々に計算する。
例えば、ステップ103でPOIのフルネームの語句状態ベクトルと任意の評価対象略称の語句状態ベクトルとを計算した後に、POIのフルネームの語句状態ベクトルと各々の評価対象略称の語句状態ベクトルとの間の類似度を計算する。この例で計算する類似性をコサイン類似度とすることができる。
図2を参照すると、図2は、2次元空間でのコサイン類似度の計算を示す、ここで、aとbは2つの2次元ベクトルである。aの座標は(x1,y1)であり、bの座標は(x2,y2)である。図2に示すように、2つのベクトルは座標値に基づいてベクトル空間内に描かれている。次に、2つの2次元ベクトルa、b間の角度に対応するコサイン値を計算する。このコサイン値を用いて2つのベクトル間の類似度を表すことができる。2つのベクトルの類似度が高いほど、2つのベクトル間の角度は小さくなり、コサイン値は1に近づき、両ベクトルの方向はより類似する。
この角度のコサイン値は、下記のベクトルドット積の式に基づいて計算される:
Figure 0006877464
上の式は、多次元ベクトル間のコサイン類似度を計算するように拡張できる。POIのフルネームの語句状態ベクトルがA=(A1,A2,…,An)であり、1つの評価対象略称の語句状態ベクトルが(B1,B2,…,Bn)である場合、2つのベクトル間のコサイン類似度は次式の通り計算できる:
Figure 0006877464
ステップ105:所定の閾値よりも高い類似度に対応する評価対象略称を、POIのフルネームに対応するPOIの略称として特定する。
例えば、所定の閾値が0.42であり、算出したコサイン類似度の値が0.42以上である場合、類似度に対応する評価対象略称を、POIのフルネームに対応するPOIの略称として特定できる。例えば、POIのフルネーム「北京師范大学(Beijing Normal University)」の語句状態ベクトルAと、1つの略称「北師大(BNU)」の語句状態ベクトルBとの間のコサイン類似度が0.7である場合、略称「北師大(BNU)」が、フルネーム「北京師范大学(Beijing Normal University)」の略称として用いられていると特定できる。
この例では、所定の閾値よりも高い略称が少なくとも1つ存在する。例えば、フルネーム「北京師范大学(Beijing Normal University)」の略称は、「北師大(BNU)」、「北師(BN)」、「北京師范(Beijing Normal)」のような複数の略称を含むことができる。
地図上のPOIの略称を得る方法では、POIのフルネームが提供されると、そのPOI付近の関連する住所名を地図住所ライブラリから自動的に得ることができ、全ての利用可能な略称のうち1つの略称を住所に基づいて計算でき、これにより、略称が自動的に特定される。これにより、略称を得る効率を向上させることができる。加えて、本方法は分散型計算プラットフォーム上で実行できるので、処理速度が更に向上する。
POIのフルネームと略称との間のマッピング関係が特定された後、このマッピング関係を、地図上でのPOIの検索や、住所入力に関連した別のシナリオに用いることができる。例えば、ユーザが「東外大街(Dongwai Avenue)」と入力した場合、フルネームと略称を比較することで、「東外大街(Dongwai Avenue)」のフルネームが「東直門外大街(Dongzhimen Avenue)」であることが判る。次に、ユーザは「東直門外大街(Dongzhimen Avenue)」を入力するかどうか質問される。加えて、次に、「東直門外大街(Dongzhimen Avenue)」付近のレストランやホテルのような、ユーザが選択できる、「東直門外大街(Dongzhimen Avenue)」に関連した、見込みのある詳細な住所がオートコンプリートオプションとして提供される。
本願の実施は、地図上のPOIの略称を得る装置を更に提供する。図3に示すように、この装置は、評価対象略称生成モジュール31、関連アドレス取得モジュール32、語句状態計算モジュール33、類似度計算モジュール34、及び略称特定モジュール35を含むことができる。
評価対象略称生成モジュール31は、地図上のPOIのフルネームに基づいて、複数の評価対象略称を生成するように構成される。
関連アドレス取得モジュール32は、POIの所定の範囲から、POIのフルネーム又は任意の評価対象略称を含む複数の住所名を得るように構成される。
語句状態計算モジュール33は、住所名に基づいて目的語句の語句状態ベクトルを計算するように構成される。ここで、語句状態ベクトルは、住所名中の目的語句の位置状態を示すために用いられ、目的語句はPOIのフルネーム、又は任意の評価対象略称である。
類似度計算モジュール34は、POIのフルネームの語句状態ベクトルと任意の評価対象略称の語句状態ベクトルとの間の類似度を別々に計算するように構成される。
略称特定モジュール35は、所定の閾値よりも高い類似度に対応する略称を、POIのフルネームに対応するPOIの略称として特定するように構成される。
実施例では、地図上のPOIのフルネームに基づいて複数の評価対象略称を生成する時に、評価対象略称モジュール31は以下を実行するように構成される。すなわち、POIのフルネームに含まれている単語を単語配列順序で組み合わせて任意数の単語の組み合わせを形成する。ここで、各組み合わせは略称であり、複数の略称が得られる。複数の略称から、非POIの略称と特定された単語とノイズ語句を除く。残りの略称が評価対象略称となる。
実施例では、住所名に基づいて目的語句の語句状態ベクトルを計算する場合、語句状態計算モジュール33は、任意の複数の住所名から目的語句の隣接語句を入手し、更に、各々の隣接語句が複数の住所名中に現れる頻度を、目的語句の語句状態ベクトルの1つのベクトル次元の次元値として用いるように構成される。
実施例では、類似度計算モジュール34は、POIのフルネームの語句状態ベクトルと任意の評価対象略称との間のコサイン類似度を計算するように構成される。
実施例では、所定の閾値よりも高い類似度に対応する評価対象略称が少なくとも1つ存在する。
当業者であれば、明細書を考慮して本開示を実施した後に、本開示の別の実施の形態を容易に理解することができる。本願は、本開示のあらゆる変形、機能、または適応的変更を包含することが意図されている。これらの変形、機能、または適応的変更は、本開示の一般原則に従うものであり、本願では開示されていない技術分野における共通知識または一般的に使用される技術的手段を含む。明細書および実施例は単なる例として考えられており、本開示の実際の範囲および精神は、添付の特許請求の範囲によって記載される。
本開示は、上記で説明され、添付の図面に示される構造に限定されず、本開示の範囲から逸脱することなく変更および変更がなされ得ることが理解されるべきである。本開示の保護範囲は、添付の特許請求の範囲によって定義される。
[第1の局面]
地図上の関心地点(POI)の略称を得る方法であって:
地図上のPOIのフルネームに基づいて複数の評価対象略称を生成するステップと;
前記POIの所定の範囲から、前記POIの前記フルネーム又は任意の前記評価対象略称を含む複数の住所名を得るステップと;
前記住所名に基づいて目的語句の語句状態ベクトルを計算するステップであって、前記語句状態ベクトルは、前記住所名中での前記目的語句の位置状態を示すために用いられ、前記目的語句は、前記POIの前記フルネーム又は任意の前記評価対象略称である、計算するステップと;
前記POIの前記フルネームの語句状態ベクトルと任意の前記評価対象略称の語句状態ベクトルとの間の類似度を別々に計算するステップと;
所定の閾値よりも高い類似度に対応する評価対象略称を、前記POIの前記フルネームに対応する前記POIの略称として特定するステップと;を備える、
地図上の関心地点(POI)の略称を得る方法。
[第2の局面]
地図上のPOIのフルネームに基づいて複数の評価対象略称を生成する前記ステップは:
前記POIの前記フルネーム中に含まれる単語を、単語配列順序で組み合わせて任意数の単語から成る組み合わせを形成するステップであって、それぞれの組み合わせは略称であり、複数の略称が得られる、前記POIの前記フルネーム中に含まれる単語を、単語配列順序で組み合わせて任意数の単語から成る組み合わせを形成するステップと;
前記複数の略称から、非POIの略称であると特定された単語及びノイズ語句を除くステップであって、残った略称が前記評価対象略称である前記複数の略称から、非POIの略称であると特定された単語及びノイズ語句を除去するステップと;を備える、
第1の局面に記載の方法。
[第3の局面]
前記住所名に基づいて目的語句の語句状態ベクトルを計算する前記ステップであって、前記語句状態ベクトルは前記住所名中の前記目的語句の位置情報を示すために用いられる、計算する前記ステップは:
任意の前記複数の住所名から前記目的語句の隣接語句を得るステップと;
前記複数の住所名中に各々の隣接語句が現れる頻度を、前記目的語句の前記語句状態ベクトルのベクトル次元の次元値として用いるステップと;を備える、
第1の局面に記載の方法。
[第4の局面]
前記POIの前記フルネームの語句状態ベクトルと任意の前記評価対象略称の語句状態ベクトルとの間の類似度を計算する前記ステップは:
前記POIの前記フルネームの前記語句状態ベクトルと任意の前記評価対象略称の前記語句状態ベクトルとの間のコサイン類似度を計算するステップを備える、
第1の局面に記載の方法。
[第5の局面]
前記所定の閾値よりも高い前記類似度に対応する評価対象略称が少なくとも1つ存在する、
第1の局面に記載の方法。
[第6の局面]
地図上のPOIの略称を得る装置であって:
地図上のPOIのフルネームに基づいて複数の評価対象略称を生成するように構成された評価対象略称生成モジュールと;
前記POIの所定の範囲から、前記POIの前記フルネーム又は前記評価対象略称を含む複数の住所名を得るように構成された関連アドレス取得モジュールと;
前記住所名に基づき目的語句の語句状態ベクトルを計算するように構成された語句状態計算モジュールであって、前記語句状態ベクトルは、前記住所名中の前記目的語句の位置状態を示すために用いられ、前記目的語句は前記POIの前記フルネーム又は任意の前記評価対象略称である、語句状態計算モジュールと;
前記POIの前記フルネームの語句状態ベクトルと任意の前記評価対象略称の語句状態ベクトルとの間の類似度を別々に計算するように構成された類似度計算モジュールと;
所定の閾値よりも高い類似度に対応する評価対象略称を、前記POIの前記フルネームに対応する前記POIの略称として特定するように構成された略称特定モジュールと;を備える、
地図上のPOIの略称を得る装置。
[第7の局面]
前記地図上の前記POIの前記フルネームに基づき前記複数の評価対象略称を生成する場合に、前記評価対象略称生成モジュールは:
前記POIの前記フルネーム中に含まれる単語を、単語配列順序で組み合わせて任意数の単語から成る組み合わせを形成し、それぞれの組み合わせが略称であり、複数の略称が得られるように構成されるとともに;
前記複数の略称から、非POIの略称と特定された単語とノイズ語句を除くように構成され;
残った略称が前記評価対象略称である;
第6の局面に記載の装置。
[第8の局面]
前記住所名に基づいて前記目的語句の前記語句状態ベクトルを計算する場合に、前記語句状態計算モジュールは:
任意の前記複数の住所名から前記目的語句の隣接語句を得て、前記複数の住所名中に前記隣接語句が現れる頻度を、前記目的語句の前記語句状態ベクトルのベクトル次元の次元値として用いるように構成された、
第6の局面に記載の装置。
[第9の局面]
前記類似度計算モジュールは、前記POIの前記フルネームの前記語句状態ベクトルと、任意の前記評価対象略称の前記語句状態ベクトルとの間のコサイン類似度を計算するように構成された、
第6の局面に記載の装置。
[第10の局面]
前記所定の閾値よりも高い前記類似度に対応する評価対象略称が少なくとも1つ存在する、
第6の局面に記載の装置。

Claims (10)

  1. コンピュータによって実施される、地図上の関心地点(POI、Point Of Internet)の略称を得るための方法であって
    地図上の関心地点のフルネームに基づいて複数の評価対象略称を生成するステップ(101)と
    前記関心地点の所定の距離内の範囲から、前記関心地点の前記フルネーム又は任意の前記評価対象略称を含む複数の住所名を取得するステップ(102)と
    前記住所名に基づいて目的語句の語句状態ベクトルを計算するステップであって、前記語句状態ベクトルは、前記住所名中での前記目的語句の位置状態を示すために用いられ、前記目的語句は、前記関心地点の前記フルネーム又は任意の前記評価対象略称であるステップ(103)と
    前記関心地点の前記フルネームの語句状態ベクトルと任意の前記評価対象略称の語句状態ベクトルとの間の類似度を別々に計算するステップ(104)と
    所定の閾値よりも高い類似度に対応する評価対象略称を、前記関心地点の前記フルネームに対応する前記関心地点の略称として特定するステップ(105)
    備える方法。
  2. 地図上の関心地点のフルネームに基づいて複数の評価対象略称を生成する前記ステップは
    前記関心地点の前記フルネーム中に含まれる単語を、単語配列順序で組み合わせて任意数の単語から成る組み合わせを形成するステップであって、それぞれの組み合わせは略称であり、複数の略称が得られるステップと
    前記複数の略称から、非関心地点の略称であると特定された単語及びノイズ語句を除去するステップであって、残った略称が前記評価対象略称である、テップと
    を備える請求項1に記載の法。
  3. 前記住所名に基づいて目的語句の語句状態ベクトルを計算するステップであって、前記語句状態ベクトルは、前記住所名中での前記目的語句の位置状態を示すために用いられる、テップが、
    任意の前記複数の住所名から前記目的語句の隣接語句を取得するステップと
    前記複数の住所名中に各々の隣接語句が現れる頻度を、前記目的語句の前記語句状態ベクトルのベクトル次元の次元値として用いるステップと
    を備える請求項1に記載方法。
  4. 前記関心地点の前記フルネームの語句状態ベクトルと任意の前記評価対象略称の語句状態ベクトルとの間の類似度を計算する前記ステップが、
    前記関心地点の前記フルネームの前記語句状態ベクトルと任意の前記評価対象略称の前記語句状態ベクトルとの間のコサイン類似度を計算するステップ
    備える請求項1に記載方法。
  5. 前記所定の閾値よりも高い前記類似度に対応する評価対象略称が少なくとも1つ存在する請求項1に記載方法。
  6. 地図で前記関心地点を検索することをサポートするために、前記特定された略称を提供するステップさらに備える、請求項1に記載方法。
  7. 前記関心地点のフルネームと、前記関心地点の前記特定された略称との間のマッピング関係を特定するステップと
    地図上で又は住所入力に関連した別のシナリオにおいて、前記関心地点を検索するために、前記特定されたマッピング関係を使用するステップと
    をさらに備えるU請求項1に記載方法。
  8. 地図上で又は住所入力に関連した別のシナリオにおいて、前記関心地点を検索するために、前記特定されたマッピング関係を使用する前記ステップが、
    ユーザにより入力された前記関心地点の前記略称を表すデータを受信するステップと
    確立された前記マッピング関係を使用して、前記関心地点に対応するフルネームを特定するステップと
    前記関心地点の前記特定された対応するフルネームを前記ユーザに提供するステップと
    備える請求項7に記載方法。
  9. 前記関心地点の前記特定された対応するフルネームに関連するアドレスを含む1つ以上の、ユーザが選択可能な、オートコンプリートオプションを前記ユーザに提供するステップさらに備える請求項8に記載方法。
  10. 請求項1〜9のいずれか1項に記載の方法を実行するように構成された、複数のモジュールを備える、地図上の関心地点の略称を得るための装置。
JP2018554614A 2016-01-11 2017-01-03 地図上の関心地点の略称を得る方法及び装置 Active JP6877464B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201610015852.7 2016-01-11
CN201610015852.7A CN106959958B (zh) 2016-01-11 2016-01-11 地图兴趣点简称获取方法和装置
PCT/CN2017/000018 WO2017121262A1 (zh) 2016-01-11 2017-01-03 地图兴趣点简称获取方法和装置

Publications (3)

Publication Number Publication Date
JP2019503025A JP2019503025A (ja) 2019-01-31
JP2019503025A5 JP2019503025A5 (ja) 2020-02-27
JP6877464B2 true JP6877464B2 (ja) 2021-05-26

Family

ID=59310764

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018554614A Active JP6877464B2 (ja) 2016-01-11 2017-01-03 地図上の関心地点の略称を得る方法及び装置

Country Status (10)

Country Link
US (2) US10816355B2 (ja)
EP (1) EP3404559A4 (ja)
JP (1) JP6877464B2 (ja)
KR (1) KR102157428B1 (ja)
CN (1) CN106959958B (ja)
MY (1) MY192478A (ja)
PH (1) PH12018501475A1 (ja)
SG (1) SG11201805938XA (ja)
TW (1) TWI661317B (ja)
WO (1) WO2017121262A1 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106959958B (zh) * 2016-01-11 2020-04-07 阿里巴巴集团控股有限公司 地图兴趣点简称获取方法和装置
CN107491537A (zh) * 2017-08-23 2017-12-19 北京百度网讯科技有限公司 Poi数据挖掘、信息检索方法、装置、设备及介质
CN108171529B (zh) * 2017-12-04 2021-09-14 昆明理工大学 一种地址相似度评估方法
CN110008300B (zh) * 2019-04-11 2021-07-09 北京百度网讯科技有限公司 Poi别名的确定方法、装置、计算机设备和存储介质
CN110543593B (zh) * 2019-08-01 2021-04-09 北京三快在线科技有限公司 数据处理方法、装置、电子设备及可读存储介质
CN111026937B (zh) * 2019-11-13 2021-02-19 百度在线网络技术(北京)有限公司 提取poi名称的方法、装置、设备和计算机存储介质
CN113495997B (zh) * 2020-04-01 2024-08-06 北京四维图新科技股份有限公司 Poi别名的探索方法、装置和车辆
CN112001172A (zh) * 2020-08-25 2020-11-27 杭州橙鹰数据技术有限公司 识别方法及装置
WO2022131740A1 (en) * 2020-12-14 2022-06-23 Samsung Electronics Co., Ltd. Methods and systems for generating abbreviations for a target word
CN113515944A (zh) * 2021-03-23 2021-10-19 汉海信息技术(上海)有限公司 兴趣点的别名挖掘方法、装置、设备及存储介质
CN113688628B (zh) * 2021-07-28 2023-09-22 上海携宁计算机科技股份有限公司 文本识别方法、电子设备和计算机可读存储介质

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS513051B1 (ja) 1969-04-04 1976-01-30
CN100559463C (zh) * 2002-11-11 2009-11-11 松下电器产业株式会社 声音识别用辞典编制装置和声音识别装置
US20070185650A1 (en) * 2006-02-04 2007-08-09 Tatsuo Yokota Method and apparatus for searching point of interest by name or phone number
US20070220037A1 (en) * 2006-03-20 2007-09-20 Microsoft Corporation Expansion phrase database for abbreviated terms
KR100849497B1 (ko) * 2006-09-29 2008-07-31 한국전자통신연구원 온톨로지 매핑을 이용한 단백질 이름 정규화 방법
JP5103051B2 (ja) 2007-04-17 2012-12-19 株式会社日立製作所 情報処理システム及び情報処理方法
US8892455B2 (en) * 2007-09-28 2014-11-18 Walk Score Management, LLC Systems, techniques, and methods for providing location assessments
JP4953459B2 (ja) * 2008-03-11 2012-06-13 ヤフー株式会社 文字ベクトルを用いた略語生成装置、方法及びプログラム
US8401771B2 (en) * 2008-07-22 2013-03-19 Microsoft Corporation Discovering points of interest from users map annotations
KR101590624B1 (ko) * 2009-02-20 2016-02-03 팅크웨어(주) 관심지점 시설물의 대표화 장치 및 그 방법
CN102460430B (zh) * 2009-04-29 2014-02-19 谷歌公司 简短兴趣点标题生成
US8583638B2 (en) * 2009-08-27 2013-11-12 Apple Inc. Adaptive mapping of search results
US8510348B2 (en) * 2010-03-03 2013-08-13 Wgrs Licensing Company, Llc Systems and methods for creating and using imbedded shortcodes and shortened physical and internet addresses
CN102789473A (zh) * 2011-05-18 2012-11-21 国际商业机器公司 标识符检索方法和设备
US8521539B1 (en) * 2012-03-26 2013-08-27 Nuance Communications, Inc. Method for chinese point-of-interest search
CN103390004B (zh) * 2012-05-11 2018-03-02 北京百度网讯科技有限公司 一种语义冗余的确定方法和装置、对应的搜索方法和装置
CN103514199A (zh) * 2012-06-25 2014-01-15 高德软件有限公司 Poi数据处理方法及其装置、poi检索方法及其装置
CN103885950B (zh) * 2012-12-19 2017-07-28 高德软件有限公司 一种获取缩略词与poi间对应关系的方法和装置
US9123259B2 (en) * 2013-03-14 2015-09-01 Microsoft Technology Licensing, Llc Discovering functional groups of an area
JP6044422B2 (ja) 2013-03-29 2016-12-14 富士通株式会社 略称生成方法および略称生成装置
CN104216895B (zh) * 2013-05-31 2018-01-30 高德软件有限公司 一种生成poi数据的方法及装置
CN104035948B (zh) * 2013-09-29 2016-04-06 腾讯科技(深圳)有限公司 地理位置显示方法及装置
CN105808609B (zh) * 2014-12-31 2020-04-14 高德软件有限公司 一种信息点数据冗余的判别方法和设备
CN104933171B (zh) * 2015-06-30 2019-06-18 百度在线网络技术(北京)有限公司 兴趣点数据关联方法和装置
CN105224660A (zh) * 2015-09-30 2016-01-06 北京奇虎科技有限公司 一种地图兴趣点poi数据的处理方法和装置
CN106959958B (zh) 2016-01-11 2020-04-07 阿里巴巴集团控股有限公司 地图兴趣点简称获取方法和装置
CN106909600A (zh) * 2016-07-07 2017-06-30 阿里巴巴集团控股有限公司 用户背景信息的收集方法及装置

Also Published As

Publication number Publication date
JP2019503025A (ja) 2019-01-31
PH12018501475A1 (en) 2019-03-11
CN106959958B (zh) 2020-04-07
US20210055124A1 (en) 2021-02-25
EP3404559A1 (en) 2018-11-21
MY192478A (en) 2022-08-23
US11255690B2 (en) 2022-02-22
US20180335313A1 (en) 2018-11-22
TW201740289A (zh) 2017-11-16
KR20180101443A (ko) 2018-09-12
SG11201805938XA (en) 2018-08-30
US10816355B2 (en) 2020-10-27
EP3404559A4 (en) 2019-08-21
TWI661317B (zh) 2019-06-01
WO2017121262A1 (zh) 2017-07-20
CN106959958A (zh) 2017-07-18
KR102157428B1 (ko) 2020-09-18

Similar Documents

Publication Publication Date Title
JP6877464B2 (ja) 地図上の関心地点の略称を得る方法及び装置
JP6745328B2 (ja) 点群データを復旧するための方法及び装置
CN110110020B (zh) 用于标识和传送位置的方法和装置
CN107832325B (zh) 一种poi数据校验方法与设备
TWI441538B (zh) 用於遊牧環境中較佳服務之系統及方法
CN109684005B (zh) 图形界面中组件相似度确定方法及装置
CN105630763B (zh) 用于提及检测中的消歧的方法和系统
JP2019503025A5 (ja)
US20170116787A1 (en) System and method for processing color of three-dimensional object
JP6136702B2 (ja) 場所推定方法、場所推定装置および場所推定プログラム
CN112860993B (zh) 兴趣点的分类方法、装置、设备、存储介质及程序产品
WO2016192284A1 (zh) 一种用于获取地图中的候选地址信息的方法和装置
CN107430631A (zh) 从位置报告确定语义地点名称
US20170032056A1 (en) Deep-learning based functional correlation of volumetric designs
US20170286494A1 (en) Computational-model operation using multiple subject representations
CN109034199A (zh) 数据处理方法及装置、存储介质和电子设备
CN111274348B (zh) 服务特征数据提取方法、装置及电子设备
CN113971307A (zh) 一种关联关系生成方法、装置、存储介质及电子设备
KR101706827B1 (ko) 개체 간 사회 관계 추출 장치 및 방법
JP5358290B2 (ja) 対象物検索装置及びその処理方法とプログラム
JP6979902B2 (ja) 情報処理装置、情報処理方法、およびプログラム
CN116308625A (zh) 一种商品匹配方法、装置、电子设备及存储介质
CN106462603A (zh) 对多个实体隐含的查询的歧义消除
US20220048197A1 (en) Ushering method, electronic device, and storage medium
KR20220130633A (ko) 지도 정보의 처리 방법, 장치, 전자 설비 및 저장 매체

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200106

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200106

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20200605

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201124

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20201228

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210210

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210405

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210427

R150 Certificate of patent or registration of utility model

Ref document number: 6877464

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE

Ref document number: 6877464

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250