JP7185023B2 - Poi名を抽出する方法、装置、デバイス、プログラム及びコンピュータ記憶媒体 - Google Patents

Poi名を抽出する方法、装置、デバイス、プログラム及びコンピュータ記憶媒体 Download PDF

Info

Publication number
JP7185023B2
JP7185023B2 JP2021513957A JP2021513957A JP7185023B2 JP 7185023 B2 JP7185023 B2 JP 7185023B2 JP 2021513957 A JP2021513957 A JP 2021513957A JP 2021513957 A JP2021513957 A JP 2021513957A JP 7185023 B2 JP7185023 B2 JP 7185023B2
Authority
JP
Japan
Prior art keywords
name
text
features
candidate
poi
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021513957A
Other languages
English (en)
Other versions
JP2022512269A (ja
Inventor
ファン,チーチョウ
ワン,ハイフォン
Original Assignee
バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド filed Critical バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド
Publication of JP2022512269A publication Critical patent/JP2022512269A/ja
Application granted granted Critical
Publication of JP7185023B2 publication Critical patent/JP7185023B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/909Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9532Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/35Categorising the entire scene, e.g. birthday party or wedding scene

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Remote Sensing (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本出願は、出願日が2019年11月13日、出願番号が201911105580.X、発明名称が「POI名を抽出する方法、装置、デバイス及びコンピュータ記憶媒体」である中国特許出願の優先権を請求した。
本出願は、コンピュータ技術分野に関し、特にビッグデータ分野においてPOI名を抽出する方法、装置、デバイス、プログラム及びコンピュータ記憶媒体に関する。
POI(Point of Interest)は関心ポイントを指し、地理情報システムにおける用語であり、ポイントとして抽象化できるすべての地理的な対象を一般的に指す。POIは、住宅、店舗、郵便ポスト、バス停、学校、病院などであって良い。POIの主な用途は、事物またはイベントの位置を記述することにより、事物またはイベントの位置に対する記述能力および検索能力を高めることにある。
POIは、インターネット地図のようなアプリケーションにおいて非常に重要な役割を果たす。POIを利用することにより、ユーザは地図上で興味のある場所やその場所までの経路を容易に見つけることができる。現実世界では、社会の発展により、新たなPOIが次々と出現しており、新たに出現したPOIをいかに全面的に、即時に、正確にマイニングするかは非常に重要な仕事である。一般的な方法としては、例えばストリートビュー画像等の画像データを採集し、採集された画像データからPOI名を抽出し、採集場所と組み合わせることにより、POI名と位置との相関関係を確立することができる。
なお、採集された画像データからPOI名を抽出する際に、従来技術は往々にして画像データに対して文字認識を行った後、人工による審査及び標識の方式でPOI名を確定する必要がある。この方式は、明らかに多大な労力が必要であり、コストが高い。
これに鑑み、本発明は、人件費を低減するPOI名を抽出する方法、装置、デバイスおよびコンピュータ記憶媒体を提供する。
第1の局面では、本発明は、POIの画像データから認識された2つ以上のテキストセグメントを取得し、前記テキストセグメントを使用して2つ以上の候補名を構築し、予め訓練された名称ソートモデルを用いて各候補名をソートし、ソート結果に基づいてPOI名を特定することを含み、前記名称ソートモデルは、各候補名から抽出された検索ウェブページ特徴、文書統計特徴、および語義特徴のうちの少なくとも1つを利用して、各候補名がPOI名となる確率を特定し、その確率に基づいて各候補名をソートする、関心ポイントPOI名を抽出する方法を提供する。
本発明の好ましい態様によれば、前記テキストセグメントを使用して2つ以上の候補名を構築することは、前記テキストセグメントに対して順列・組み合わせを行って2つ以上の候補名を得ることを含み、前記ソート結果に基づいてPOI名を特定することは、先頭の候補名を前記POI名とすることを含む。
本発明の好ましい態様によれば、前記テキストセグメントを使用して2つ以上の候補名を構築することは、前記テキストセグメントから支店情報セグメントを認識し、前記テキストセグメントにおける前記支店情報セグメントを除く他のテキストセグメントに対して順列・組合わせを行って2つ以上の候補名を得ることを含み、前記ソート結果に基づいてPOI名を特定することは、先頭の候補名と前記支店情報セグメントとを組み合わせて前記POI名を得ることを含む。
本発明の好ましい態様によれば、前記テキストセグメントから前記支店情報セグメントを認識することは、予め訓練された判別モデルを用いて各テキストセグメントを判別して、各テキストセグメントが支店情報セグメントであるか否かを判定することを含む。
本発明の好ましい態様によれば、前記判別モデルは、サンプルデータをPOIデータベースから取得し、支店情報テキストをポジティブサンプルとし、非支店情報テキストをネガティブサンプルとし、前記サンプルデータを用いて判別モデルを訓練する、ことにより予め訓練された。
本発明の好ましい態様によれば、候補名から検索ウェブページ特徴を抽出することは、候補名をqueryとして検索し、取得された検索結果をセマンティックコーディングして前記候補名の検索ウェブページ特徴として検索結果の隠れベクトルを得ることを含む。
本発明の好ましい態様によれば、前記取得された検索結果をセマンティックコーディングして検索結果の隠れベクトルを得ることは、上位N(Nは所定の正整数である)個の検索結果テキストを取得し、取得された各検索結果テキストをそれぞれセマンティックコーディングして各検索結果テキストの隠れベクトルを取得し、前記各検索結果テキストの隠れベクトルに対して統合処理を行った後、前記検索結果の隠れベクトルを得ることを含む。
本発明の好ましい態様によれば、候補名から文書統計特徴を抽出することは、ウェブページデータにおいて前記候補名の逆文書頻度を統計し、前記逆文書頻度の表現ベクトルを前記候補名の文書統計特徴とすることを含む。
本発明の好ましい態様によれば、候補名から語義特徴を抽出することは、候補名に含まれる各テキストセグメントの語義特徴、位置特徴及び文書統計特徴のうちの少なくとも1つに基づいて、各テキストセグメントの語義表現ベクトルを取得し、前記各テキストセグメントの語義表現ベクトルに対して統合処理を行って前記候補名の語義表現ベクトルを得ることを含む。
本発明の好ましい態様によれば、前記テキストセグメントの語義表現ベクトルは、テキストセグメントをセマンティックコーディングしてテキストセグメントの隠れベクトルを取得し、候補名におけるテキストセグメントの位置をベクトル空間にマッピングしてテキストセグメントの位置表現ベクトルを取得し、ウェブページデータにおいて前記テキストセグメントの逆文書頻度を統計して前記逆文書頻度の表現ベクトルを取得し、テキストセグメントの隠れベクトル、位置表現ベクトル及び逆文書頻度の表現ベクトルをスプライシングして当該テキストセグメントの語義表現ベクトルを得る、ことにより特定される。
第2の局面では、本発明は、POI名の正例および負例を含む訓練サンプルを取得し、各訓練サンプルから検索ウェブページ特徴、文書統計特徴および語義特徴のうちの少なくとも1つを抽出し、各訓練サンプルがPOI名となる確率を特定し、pairwiseアルゴリズムを用いて正例がPOI名となる確率と負例がPOI名となる確率との差を最大化することを訓練目標として訓練を行うことにより名称ソートモデルを得ることを含む名称ソートモデルを構築する方法を提供する。
本発明の好ましい態様によれば、訓練サンプルから検索ウェブページ特徴を抽出することは、訓練サンプルをqueryとして検索し、取得された検索結果をセマンティックコーディングして前記訓練サンプルの検索ウェブページ特徴として検索結果の隠れベクトルを得ることを含む。
本発明の好ましい態様によれば、前記取得された検索結果をセマンティックコーディングして検索結果の隠れベクトルを得ることは、上位N個(Nは所定の正整数である)の検索結果テキストを取得し、取得された各検索結果テキストをそれぞれセマンティックコーディングして各検索結果テキストの隠れベクトルを取得し、前記各検索結果テキストの隠れベクトルに対して統合処理を行った後、前記検索結果の隠れベクトルを得ることを含む。
本発明の好ましい態様によれば、訓練サンプルから文書統計特徴を抽出することは、ウェブページデータにおいて前記訓練サンプルの逆文書頻度を統計し、前記逆文書頻度の表現ベクトルを前記訓練サンプルの文書統計特徴とすることを含む。
本発明の好ましい態様によれば、訓練サンプルから語義特徴を抽出することは、訓練サンプルに含まれる各テキストセグメントの語義特徴、位置的特徴、および文書統計特徴のうちの少なくとも1つに基づいて各テキストセグメントの語義表現ベクトルを取得し、前記各テキストセグメントの語義表現ベクトルに対して統合処理を行って前記訓練サンプルの語義表現ベクトルを得ることを含む。
本発明の好ましい態様によれば、前記テキストセグメントの語義表現ベクトルは、テキストセグメントをセマンティックコーディングしてテキストセグメントの隠れベクトルを取得し、候補名におけるテキストフラグメントの位置をベクトル空間にマッピングしてテキストフラグメントの位置表現ベクトルを取得し、ウェブページデータにおいて前記テキストセグメントの逆文書頻度を統計して前記逆文書頻度の表現ベクトルを取得し、テキストセグメントの隠れベクトル、位置表現ベクトル、および逆文書頻度表現ベクトルをスプライシングして当該テキストセグメントの語義表現ベクトルを得る、ことにより特定される。
第3の局面では、本発明は、POIの画像データから認識された二つ以上のテキストセグメントを取得する取得ユニットと、前記テキストセグメントを用いて2つ以上の候補名を構築する構築ユニットと、予め訓練された名称ソートモデルを用いて各候補名をソートするソートユニットと、前記ソートユニットによるソート結果に基づいてPOI名を特定する特定ユニットと、を備え、前記名称ソートモデルは、各候補名から抽出された検索ウェブページ特徴、文書統計特徴、および語義特徴のうちの少なくとも1つを利用して、各候補名がPOI名となる確率を特定し、確率に基づいて各候補名をソートするPOI名を抽出する装置も提供する。
第4の局面では、本発明は、POI名の正例および負例を含む訓練サンプルを取得するサンプル取得ユニットと、各訓練サンプルから検索ウェブページ特徴、文書統計特徴及び語義特徴のうちの少なくとも1つを抽出し、各訓練サンプルがPOI名となる確率を特定し、pairwiseアルゴリズムを用いて正例がPOI名となる確率と負例がPOI名となる確率との差を最大化することを訓練目標として訓練を行うことにより名称ソートモデルを得るモデル訓練ユニットと、を備える名称ソートモデルを構築する装置も提供する。
第5の局面では、本発明は更に、少なくとも1つのプロセッサと、前記少なくとも1つのプロセッサと通信接続されたメモリと、を備え、前記メモリに前記少なくとも1つのプロセッサにより実行可能なコマンドが記憶されており、前記コマンドが前記少なくとも1つのプロセッサにより実行されると、前記少なくとも1つのプロセッサに前記のいずれか一つに記載の方法を実行させる電子デバイスを提供する。
第6の局面では、本発明は、コンピュータに前記の何れか一つに記載の方法を実行させるコンピュータコマンドが記憶される非一時的なコンピュータ可読記憶媒体も提供する。
以上の技術案から分かるように、本発明により提供される方法、装置、デバイスおよびコンピュータ記憶媒体は、以下の利点を有する。
1)本発明は、POIの画像データから認識されたテキストセグメントを用いて候補名を構築した後、候補名の検索ウェブページ特徴、文書統計特徴、語義特徴のうちの少なくとも1つを用いて、各候補名がPOI名となる確率を特定して各候補名をソートすることにより、高い精度でPOI名を自動的に抽出することを実現した。また、従来技術における人工による審査と標識の方式と比較して、人件費を低減した。
2)本発明は、まず支店情報セグメントを認識した後に、その支店情報セグメント以外の他のテキストセグメントを用いて候補名を構築してソートを行い、そして先頭の候補名と支店情報セグメントを用いてPOI名を得ることにより、POI名の抽出の正確度と効率をさらに向上させることができる。
3)本発明は、候補名の文書統計特徴、検索ページ特徴および語義特徴を用い、逆文書頻度、検索結果、各テキストセグメントの位置、逆文書頻度、語義などの候補名に対する表意能力記述をPOI名の確率の推定として候補名に導入することにより、POI名を最適に表意する候補名を選択する。
前記選択可能な方式における他の効果は、以下で具体的な実施例と合わせて説明する。
図面は、本技術案をより良く理解するためのものであり、本発明を制限するものではない。図面において、
本発明の実施形態が適用され得る方法または装置の例示的なシステムアーキテクチャを示す。 本発明の実施形態により提供される主要な方法のフローチャートである。 本発明の実施形態により提供されるPOI看板画像の実例図である。 本発明の実施形態により提供される好適な方法のフローチャートである。 本発明の実施形態により提供される名称ソートモデルのアーキテクチャの模式図である。 本発明の実施形態により提供されるソートモデルを構築する方法のフローチャートである。 本発明の実施形態により提供されるPOI名を抽出する装置の構成図である。 本発明の実施形態により提供される名称ソートモデルを構築する装置の構成図である。 本発明の実施形態に係る方法を実現するための電子デバイスのブロック図である。
以下、図面に基づいて、本発明の例示的な実施例を説明する。理解を容易にするために、本発明の実施例の様々な詳細が含まれており、それらは単なる例示と見なされるべきである。従って、当業者は、本発明の範囲及び思想から逸脱することなく、本明細書に記載の実施形態に対して様々な変更及び修正を行うことができることを認識するはずである。同様に、簡明のために、以下の説明では、よく知られた機能と構造の説明は省略される。
図1は、本発明の実施形態が適用され得る方法または装置の例示的なシステムアーキテクチャを示した。図1に示されたように、当該システムアーキテクチャは、端末デバイス101および102、ネットワーク103、およびサーバ104を含むことができる。ネットワーク103は、端末デバイス101、102とサーバ104との間に通信リンクの媒体を提供する。ネットワーク103は、有線、無線通信リンク、または光ファイバケーブルなどの様々なタイプの接続を含むことができる。
ユーザは、端末デバイス101、102を用いて、ネットワーク103を介してサーバ104とインタラクションすることができる。端末デバイス101、102には、地図系アプリケーション、ウェブブラウザアプリケーション、通信系アプリケーション等の各種アプリケーションがインストールされて良い。
端末デバイス101および102は、地図系アプリケーションを実行することができる様々な種類のユーザ装置であってよい。スマートフォン、タブレット、PC、スマートテレビなどが含まれるが、これらに限定されない。本発明で提供されるPOI名を抽出する装置および名称ソートモデルを構築する装置は、前記のサーバ104に設置、運行されても良く、サーバ104と別のデバイスに運行されても良い。これは、複数のソフトウェアまたはソフトウェアモジュールとして実現されてもよく(例えば、分散的なサービスを提供するために)、単一のソフトウェアまたはソフトウェアモジュールとして実現されてもよいが、ここで限定されない。サーバ104は、POIデータベース105とインタラクションして良い。具体的に、サーバ104は、POIデータベース105からデータを取得してもよく、POIデータベース105にデータを格納してもよい。POIデータベース105には、POI情報を含む地図データが格納されている。
例えば、POI名を抽出する装置は前記サーバ104に設置、運行される。サーバ104は、本発明の実施形態により提供される方法によりPOI画像データに基づいてPOI名の抽出を行った後に、取得したPOI名と当該POI画像データに対応する場所とでPOIデータベース105を更新する。サーバ104は、端末デバイス101、102の検索リクエストに応じて、POIデータベース105を検索し、検索されたPOIの情報を端末デバイス101、102に返信することができる。端末デバイス101、102は、POI画像データを採用し、POI画像データ及び対応する採集場所情報をサーバ104にアップロードしても良い。
サーバ104は、単一のサーバであっても良く、複数のサーバからなるサーバ群であってもよい。また、104は、サーバとして存在することに加えて、より高い演算性能を有する他のコンピュータシステムまたはプロセッサであってもよい。理解すべきなのは、図1における端末デバイス、ネットワーク、サーバ及びデータベースの数は単なる例示的なものである。実施の必要に応じて、任意の数の端末デバイス、ネットワーク、サーバ、データベースを備えることができる。
<実施形態1>
図2は、本発明の実施形態により提供される主要な方法のフローチャートである。図2に示されたように、当該方法は以下のステップを含むことができる。
201において、POIの画像データから2つ以上のテキストセグメントを認識する。
本発明のシナリオにおいて、POIの画像データが既に取得され、POIの画像データからPOI名を抽出する必要がある。本発明は、POIの画像データの採集方式に限定されるものではなく、専門の採集担当者がPOIに現地で採集したり、ユーザが端末デバイスを介して採集及びアップロードなどを行ったりすることもできる。このPOIの画像データは、通常、図3に示されたように、撮影されたPOIの看板画像である。
OCR(Optical Character Recognition、光学文字認識)などの方法でPOIの画像データに対してテキスト認識を行うことができる。本発明は、POIの看板画像に複数のテキストが含まれている場合に適用する。図3に示されたように、この画像から「三千店舗」、「エコダイエット」、「銀座ガーデン店」の3つのテキストセグメントが認識される。
また、説明すべきなのは、POIの画像データからテキストセグメントが1つだけ認識された場合には、そのテキストセグメントをそのままPOI名としてもよい。
202において、認識により得られたテキストセグメントを用いて2つ以上の候補名を構築する。
203において、予め訓練された名称ソートモデルを用いて各候補名をソートし、ソート結果に基づいてPOI名を特定する。
ここで、名称ソートモデルは、各候補名から抽出された検索ウェブページ特徴、文書統計特徴、および語義特徴の少なくとも1つを利用して、各候補名がPOI名となる確率を特定し、確率に基づいて各候補名をソートする。
一実施形態として、ステップ201で認識されたテキストセグメントに対して順列・組合わせを行った後に、2つ以上の候補名を取得し、そして予め訓練された名称ソートモデルを用いて各候補名称をソートし、先頭の候補名称をPOI名とすることができる。
しかしながら、好ましい実施形態としては、最初にステップ201で認識されたテキストセグメントに対して支店情報の認識を行い、その後に候補名を構築しソートして最終的なPOI名を得ることができる。この方式によれば、より正確なPOI名を提供することができる。以下で実施形態と合わせてこのような好ましい実施形態を詳しく説明する。
<実施形態2>
図4は、本発明の実施形態により提供される好適な方法のフローチャートである。図4に示されたように、当該方法は以下のステップを含むことができる。
401において、POIの画像データから二つ以上のテキストセグメントを認識する。
このステップはステップ201と同じであり、ここでは言及しない。
402では、認識されたテキストセグメントから支店情報セグメントを認識する。
本ステップでは、予め訓練された判別モデルを用いて各テキストセグメントを判別して各テキストセグメントが支店情報セグメントであるか否かを判定することができる。
本発明では、POIデータベースから予め訓練サンプルを取得し、例えば、POIデータベースからPOI名「海底撈鍋万柳店」を取得し、「海底撈鍋」と「万柳店」の2つのテキストセグメントに分割することができる。「海底撈鍋」を非支店情報セグメント、即ち反例として人工的に標識し、「万柳店」を支店情報セグメント、即ち正例として人工的に標識する。次に、訓練サンプルを用いて判別モデルを訓練する。なお、判別モデルは、ERNIE(Enhanced Representation from kNowledge IntEgration、知識強化語義表現モデル)、BERT(Bidirectional Encoder Representations from Transformers、Transformerによる双方向的エンコード表現)による判別モデル、GBDT(Gradient Boosting Decision Tree、勾配ブースティング決定木)モデルなどを採用することができるが、これらに限定されない。
訓練により判別モデルが得られた後、テキストセグメントを判別モデルに入力すると、判別モデルが出力する判別結果、即ちテキストセグメントが支店情報セグメントであるかどうかを得ることができる。
説明すべきなのは、予め訓練された判別モデルを用いて支店情報セグメントの認識を行う以外に、本発明で別の方式で支店の認識を行ってもよい。たとえば、テンプレートに基づく方式、キーワード辞書に基づく方式などである。例えば、「__支店」、「__支部」、「__分園」、「__分院」等のテンプレートを予め設定しておき、これらのテンプレートに合致するテキストセグメントを支店情報セグメントとして認識する。
403において、認識されたテキストセグメントのうち、支店情報セグメントを除く他のテキストセグメントに対して順列・組み合わせを行って二つ以上の候補名を得る。
認識されたテキストセグメントをm個とし、そのうちの一つの支店情報セグメントがtとして認識され、残りのm-1個のテキストセグメントの集合T1を{t},i=1,・・・,m-1とする。mは2以上の正整数であり、T1における各テキストセグメントに対して全順列・組み合わせを行って候補名集合Pを構築し、Pを{P}とする。つまり、PはT1からランダムにk個のテキストセグメントを抽出して順列・組合わせを行った和集合であり、kは1からm-1までの値をとる。
例えば、図3に示された画像から「三千店舗」、「エコダイエット」、「銀座ガーデン店」の3つのテキストセグメントが認識され、402において「銀座ガーデン店」が支店情報セグメントとして認識された。そして、残りのテキストセグメント「三千店舗」、「エコダイエット」に対して全順列・組み合わせを行って得られた集合Pは、{「三千店舗」、「エコダイエット」、「三千店舗エコダイエット」、「エコダイエット三千店舗」}である。つまり、「三千店舗」、「エコダイエット」、「三千店舗エコダイエット」、「エコダイエット三千店舗」という四つの候補名が得られ、この四つの候補名に対してPOI名となる確率のソートを行う必要がある。
404において、予め訓練された名称ソートモデルを用いて各候補名をソートする。
名称ソートモデルは、候補名から検索ウェブページ特徴、文書統計特徴、および語義特徴のうちの少なくとも1つを抽出し、候補名がPOI名となる確率を特定し、そして確率に基づいて候補名をソートする。好ましい実施形態として、本実施形態において、検索ウェブページ特徴、文書統計特徴、および語義特徴という三種類を抽出することを例として説明する。すなわち、各Pを名称ソートモデルに入力し、Pから検索ページ特徴、文書統計特徴、および語義特徴を抽出し、PがPOI名となる確率を得た後に、各Pの確率に基づいてソートを行う。
以下では、図5に示されたモデルアーキテクチャに合わせて、三種類の特徴の抽出についてそれぞれ詳しく説明する。
1)検索ページ特徴の抽出。
候補名Pから検索ウェブページ特徴を抽出する際には、候補名Pをquery(検索キーワード)として検索し、次に得られた検索結果をセマンティックコーディングして、検索結果の隠れベクトルを候補名Pの検索ウェブページ特徴として得られる。
演算量を削減するために、本実施形態では、検索結果のうち上位N個(Nは所定の正整数)の検索結果テキストを取ってよい。また、検索結果のタイトルは、一般的に検索結果テキストの意味をよく表すことができるため、上位N個の検索結果のタイトルテキストを取得することができる。例えば、上位N個の探索結果をR={d},k=1,・・・,Nと記す。
例えば、候補名「三千里エコダイエット」については、これをqueryとしてウェブページを検索し、検索結果から上位N個の検索結果のタイトルテキストを取得することで、大衆に理解されている当該POIの最も合理的な名称を得ることに寄与する。例えば、得られた検索結果のタイトルテキストには、「私はコメント_三千家エコダイエット」、「三千家エコダイエットしましょう」などが含まれる。そして、各タイトルテキストをそれぞれセマンティックコーディングして各検索結果のタイトルテキストの隠れベクトルを得る。
セマンティックコーディングを行う際には、POI名のロングテール現象を解決するために、文字粒度の言語モデルERNIEを用いてセマンティックコーディングを行うことができる。しかし、ERNIE以外にも、従来のword2vecモデル、gloveモデルなどを用いることができる。後続の実施形態に関連するセマンティックコーディングによる隠れベクトル抽出の方法は同様であってもよい。
例えば、検索結果のタイトルテキストdをセマンティックコーディングしてベクトルシーケンスを取得し、その後にベクトルシーケンスを平均化してタイトルテキストdの隠れベクトルhdkを得る。
そして、各検索結果のタイトルテキストの隠れベクトルに対して統合処理を行って検索結果の隠れベクトルを得る。なお、統合処理は、平均化等の処理方式であってよい。たとえば、Pの検索結果の隠れベクトルVdjは、
Figure 0007185023000001

である。
2)文書統計特徴の抽出。
ある場合に、幾つかの候補名が曖昧になる可能性があり、例えば候補名「三千店舗」について、「三千店舗エコダイエット」のPOI、「三千店舗茶店」のPOI、「三千店舗生乳茶」のPOIが存在する可能性がある。したがって、POI名として「三千店舗」を用いると、明らかに曖昧な問題がユーザに迷惑をかけることになる。本発明の実施形態では、候補名のIDF(inverse document frequency、逆文書頻度)特徴を導入して候補名の表意能力を記述することができる。もし候補名Pがネット全体に出現する頻度が少ないほど、稀有であり、独立にPOIを表現する能力が高いと示す。
以上の理論に基づいて、候補名Pから文書統計特徴を抽出する際には、ウェブページデータにおいて候補名PのIDFを統計し、IDFの表現ベクトルをPの文書統計特徴とすることができる。具体的には、PのIDFは、次の式を使用して計算することができる。
Figure 0007185023000002
ここで、DOC_NUMはウェブページの総数を表し、DFは候補名Pを含むウェブページ数を表し、pow(x、y)関数はxのy乗を求めるためのものである。αはスーパーパラメータであり、実験値を取っても良く、人工で調整しても良い。
候補名PのIDFが得られた後、IDFは連続した統計値であるため、モデルの安定性のためにIDFを離散化して埋め込み層(図5ではEmbと示された)を用いて密ベクトルに転換して示せれば、PのIDF表現ベクトルVidfjを取得することができる。
3)語義素性の抽出。
本発明では、候補名を直接にセマンティックコーディングして候補名の隠れベクトルを語義特徴として得ることができる。しかし、候補名は、全体として、文字列粒度のエンコーダでセマンティックコーディングを行うと、セグメントレベルの情報が欠落することになる。しかし、実際にはPOI画像データから抽出された名称セグメントは表意的な全体であるため、好ましい実施形態として、候補名の語義特徴の抽出は、主に2つのステップに分けられる。
S1、候補名に含まれる各テキストセグメントの語義特徴、位置特徴、文書統計特徴のうちの少なくとも1つに基づいて、各テキストセグメントの語義表現ベクトルを得る。
まず、候補名Pについては、それに含まれるテキストセグメントtごとに、語義特徴、位置的特徴、文書統計特徴のうちの少なくとも1つを抽出する必要があり、以下ではこれら3つの特徴の抽出を例に説明する。
テキストセグメントtの語義特徴を抽出する際に、テキストセグメントtをセマンティックコーディングして、テキストセグメントtの隠れベクトルVciを得ることができる。
テキストセグメントtの位置特徴を抽出する際には、候補名におけるテキストセグメントtの位置をベクトル空間にマッピングしてテキストセグメントtの位置表現ベクトルVposiを得る。
テキストセグメントtの文書統計特徴を抽出する際には、以前の候補名の文書統計特徴の抽出と同様に、ウェブページデータにおいてテキストセグメントのIDFを統計し、IDFを離散化して埋め込み層(図5ではEmbと示された)を利用して密ベクトルに転換して示せれば、tのIDF表現ベクトルVidfiを取得することができる。
最後に、Vci、Vposi、Vidfiをスプライシングしてテキストセグメントtの語義表現ベクトルVtiを得る。たとえば、Vti=[Vci,Vposi,Vidfi]である。ここで、[,]はその中のベクトルをスプライシングすることを示す。
S2、各テキストセグメントの語義表現ベクトルに対して統合処理を行って候補名の語義表現ベクトルを得る。
例えば、候補名Pの語義表現ベクトルVcj
Figure 0007185023000003

である。ここで、qはPに含まれるテキストセグメントの数である。
候補名Pの上記3つの特徴を完成させた後、得られたPの探索結果の隠れベクトルVdj、IDF表現ベクトルVidfjおよび語義表現ベクトルVcjをスプライシングしてPの特徴ベクトルVpjを得る。例えば、Vpj=[Vdj,Vidfj,Vcj]である。
そして、Pの特徴ベクトルVpjをMLP(multi-layer perceptron、多層パーセプトロン)を介してPOI名の確率ProbとしてPを得る。
以上は名称ソートモデルの動作原理であり、後続で実施形態3と合わせて名称ソートモデルの構築プロセスを詳しく説明する。
405において、先頭の候補名を支店情報セグメントと結合してPOI名を得る。
各Pの確率Probの大きい順で各Pをソートした後に、先頭の候補名を選択する。当該候補名は、POI名を構成するのに最も適合すると考えられる。
上記の例に続いて、仮に上記のプロセスにより特定された集合P{「三千店舗」、「エコダイエット」、「三千店舗エコダイエット」、「エコダイエット三千店舗」}のうち4つの候補名の確率は、大きい順に次のようになる。
三千店舗エコダイエット 0.93
三千店舗 0.82
エコダイエット 0.47
エコダイエット三千店舗 0.21
そこで、「三千店舗エコダイエット」と先に認識された支店情報セグメントである「銀座ガーデンショップ」とを組み合わせて最終的なPOI名である「三千店舗エコダイエット銀座ガーデンショップ」を得た。
最終的にPOI名が特定された後、そのPOIの画像データに対応する場所情報を採集することと組合わせ、POI名、住所、座標などの情報をPOIデータベースに格納することができる。後続のユーザが地図アプリケーションにおいて当該POIを検索すると、当該POI名、住所、座標等の情報に基づいてユーザにサービスを提供することができる。
<実施形態3>
図6は、本発明の実施形態により提供されるソートモデルを構築する方法のフローチャートである。図6に示されたように、当該方法は以下のステップを含むことができる。
601において、POI名の正例および負例を含む訓練サンプルを取得する。
本発明では、既存のPOIデータベースからPOI名を取得して良い。POIデータベースに既に存在しているPOI名は一般的に正しい名称であるため、それを正例とする。次に、POIデータベースに既に存在しているPOI名に基づいて、不正確な名称を反例として人工で構築する。
例として、仮にPOIデータベースから既存のPOI名「赤黄青幼稚園上地園」を取得して正例とする。ただし、実施形態2に対応するために、POI名から支店情報セグメントを削除して正例とし、すなわち「赤黄青幼稚園」を正例とすることが好ましい。そして、負例として「赤黄青」、「幼稚園赤黄青」、「幼稚園」などを人工的に構築する。この方式により多数の正例と負例を構築した後、訓練サンプルとする。
602において、各訓練サンプルから検索ウェブページ特徴、文書統計特徴および語義特徴のうちの1つを抽出し、各訓練サンプルがPOI名となる確率を特定する。
各訓練サンプルは、実施形態2のステップ404で提供される方法で、各訓練サンプル(すなわち、各正例および負例)について、検索ウェブページ特徴、文書統計特徴、および語義特徴のうちの少なくとも1つをそれぞれ抽出する。検索ページ特徴、文書統計特徴および語義特徴の抽出を例として、訓練サンプルごとの検索結果の隠れベクトル、IDF表現ベクトルおよび語義表現ベクトルを抽出してスプライシングした後、その訓練サンプルの特徴ベクトルを得る。そして、その訓練サンプルの特徴ベクトルをMLPを介してその訓練サンプルがPOI名となる確率を得る。具体的なプロセスは、実施形態におけるステップ404の記載を参照され、ここでは言及されない。
603において、pairwiseアルゴリズムを用いて正例がPOI名となる確率と負例がPOI名となる確率との差を最大化することを訓練目標として訓練することにより、名称ソートモデルを得る。
本発明ではモデル訓練にpairwiseアルゴリズムを利用する。すなわち、1つの訓練サンプルの正例と負例を用いてそれぞれ文書対を構成し、モデル訓練過程において正例がPOI名となる確率と負例がPOI名となる確率との差をできるだけ最大化する。たとえば、採用される損失関数Lossは、
Figure 0007185023000004

であって良い。
ここで、margin和γはスーパーパラメータであり、θはモデルパラメータの1つであり、Probは正例がPOI名となる確率であり、Probは負例がPOI名となる確率である。上記のLossでL2正則化法を用いてモデルのオーバーフィッティングを防止した。
訓練中にランダム勾配降下の方法を用いてモデルパラメータの最適化を行うことができる。
以上は、本発明で提供される方法の詳細な説明である。以下は、実施形態と合わせて本発明で提供される装置を詳しく説明する。
<実施形態4>
図7は、本発明の実施形態により提供されるPOI名を抽出装置の構成図である。図7に示されたように、当該装置は、取得ユニット01、構築ユニット02、ソートユニット03、および特定ユニット04を含んでもよく、更に認識ユニット05およびモデル訓練ユニット06を含んでもよい。これらの各構成単位の主な機能は次の通りである。
取得ユニット01は、POIの画像データから認識された二つ以上のテキストセグメントを取得する。本発明ではPOIの画像データからテキストセグメントを認識する方式に限定されるものではなく、例えばOCR方式で認識することができる。
構築ユニット02は、テキストセグメントを用いて二つ以上の候補名を構築する。
ソートユニット03は、予め訓練された名称ソートモデルを用いて各候補名をソートする。なお、名称ソートモデルは、各候補名から抽出された検索ページ特徴、文書統計特徴及び語義特徴のうちの少なくとも1つを利用して、各候補名がPOI名となる確率を特定し、確率に基づいて各候補名をソートする。
特定ユニット04は、ソートユニットによるソート結果に基づいてPOI名を特定する。
一実施形態として、構築ユニット02は、テキストセグメントに対して順列・組合わせを行って2つ以上の候補名を得ることができる。そして、特定ユニット04は、先頭の候補名を前記POI名とする。
しかしながら、好ましい実施形態として、認識ユニット05は、テキストセグメントから支店情報セグメントを最初に認識することができる。次に、構築ユニット02により、テキストセグメントのうち支店情報セグメントを除く他のテキストセグメントに対して順列・組合わせを行って二つ以上の候補名を得る。それに応じて、特定ユニット04は、先頭の候補名と支店情報セグメントとを結合してPOI名を得る。
具体的には、認識ユニット05は、予め訓練された判別モデルを用いて各テキストセグメントを判別して各テキストセグメントが支店情報セグメントであるか否かを判定してよい。
モデル訓練ユニット06は、予め判別モデルを訓練する役割を担う。具体的には、POIデータベースからサンプルデータを取得し、支店情報テキストをポジティブサンプルとし、非支店情報テキストをネガティブサンプルとし、サンプルデータを用いて判別モデルを訓練することができる。
ソートユニット03は、名称ソートモデルを用いて候補名称から検索ウェブページ特徴を抽出する際に、具体的に、候補名をqueryとして検索し、取得された検索結果をセマンティックコーディングして検索結果の隠れベクトルを前記候補名の検索ウェブページ特徴として得ることができる。
なお、ソートユニット03は、取得された検索結果をセマンティックコーディングして検索結果の隠れベクトルを得る際に、具体的に、上位N個(Nは所定の正整数)の検索結果テキストを取得し、取得された各検索結果テキストに対してそれぞれセマンティックコーディングを行い、各検索結果テキストの隠れベクトルを取得し、各検索結果テキストの隠れベクトルに対して統合処理を行って検索結果の隠れベクトルを得ることができる。
ソートユニット03は、名称ソートモデルを用いて候補名から文書統計特徴を抽出する際に、具体的に、ウェブページデータにおいて候補名の逆文書頻度を統計し、逆文書頻度の表現ベクトルを候補名の文書統計特徴とすることができる。
ソートユニット03は、名称ソートモデルを用いて候補名から語義特徴を抽出する際に、具体的に、候補名に含まれる各テキストセグメントの語義特徴、位置的特徴及び文書統計特徴のうちの少なくとも1つに基づいて、各テキストセグメントの語義表現ベクトルを取得し、各テキストセグメントの語義表現ベクトルに対して統合処理を行って候補名の語義表現ベクトルを得る。
ここで、ソートユニット03は、テキストセグメントをセマンティックコーディングしてテキストセグメントの隠れベクトルを取得し、候補名におけるテキストセグメントの位置をベクトル空間にマッピングしてテキストセグメントの位置表現ベクトルを取得し、ウェブページデータにおいて前記テキストセグメントの逆文書頻度を統計して前記逆文書頻度の表現ベクトルを取得し、テキストセグメントの隠れベクトル、位置表現ベクトルと逆文書頻度の表現ベクトルをスプライシングしてそのテキストセグメントの語義表現ベクトルを得ることにより、テキストセグメントの語義表現ベクトルを特定することができる。
<実施形態5>
図8は、本発明の実施形態により提供される名称ソートモデルを確立する装置の構成図である。図8に示されたように、当該装置は、サンプル取得ユニット11およびモデル訓練ユニット12を備えて良い。ここで、各構成要素の主な機能は次の通りである。
サンプル取得ユニット11は、POI名の正例および負例を含む訓練サンプルを取得する。
具体的に、既存のPOIデータベースからPOI名を取得することができる。POIデータベースに既に存在しているPOI名は一般的に正しい名称であるため、これを正例とする。次に、POIデータベースに既に存在しているPOI名に基づいて、幾つかの不正確な名称を負例として人工で構築する。好ましくは、POI名から支店情報セグメントを削除して正例とし、これに基づいて負例を構築してもよい。
モデル訓練ユニット12は、各訓練サンプルから検索ウェブページ特徴、文書統計特徴、および語義特徴のうちの少なくとも1つを抽出し、各訓練サンプルがPOI名となる確率を特定し、pairwiseアルゴリズムを用いて正例がPOI名となる確率と負例がPOI名となる確率との差を最大化することを訓練目標として訓練を行うことにより、名称ソートモデルを得る。
具体的には、モデル訓練ユニット12は、訓練サンプルから検索ウェブページ特徴を抽出する際に、具体的に、訓練サンプルをqueryとして探索し、取得された検索結果をセマンティックコーディングして検索結果の隠れベクトルを訓練サンプルの検索ページ特徴として得ることができる。
ここで、モデル訓練ユニット12は、取得された検索結果をセマンティックコーディングして検索結果の隠れベクトルを得る際に、具体的に、上位N(Nは所定の正整数)個の検索結果テキストを取得し、取得された各検索結果テキストに対してそれぞれセマンティックコーディングを行って各検索結果テキストの隠れベクトルを取得し、各検索結果テキストの隠れベクトルに対して統合処理を行って検索結果の隠れベクトルを得ることができる。
モデル訓練ユニット12は、訓練サンプルから文書統計特徴を抽出する際に、具体的に、ウェブページデータにおいて訓練サンプルの逆文書頻度を統計し、逆文書頻度の表現ベクトルを訓練サンプルの文書統計特徴とすることができる。
モデル訓練ユニット12は、訓練サンプルから語義特徴を抽出する際に、具体的に、訓練サンプルに含まれる各テキストセグメントの語義特徴、位置特徴及び文書統計特徴のうちの少なくとも1つに基づいて、各テキストセグメントの語義表現ベクトルを取得し、各テキストセグメントの語義表現ベクトルに対して統合処理を行って訓練サンプルの語義表現ベクトルを得る。
ここで、モデル訓練ユニット12は、テキストセグメントをセマンティックコーディングしてテキストセグメントの隠れベクトルを取得し、候補名におけるテキストセグメントの位置をベクトル空間にマッピングしてテキストセグメントの位置表現ベクトルを取得し、ウェブページデータにおいてテキストセグメントの逆文書頻度を統計して逆文書頻度の表現ベクトルを取得し、テキストセグメントの隠れベクトル、位置表現ベクトルと逆文書頻度の表現ベクトルをスプライシングしてそのテキストセグメントの語義表現ベクトルを得ることにより、テキストセグメントの語義表現ベクトルを特定することができる。
本発明の実施形態によれば、本発明は更に、電子デバイスおよび可読記憶媒体を提供する。
図9は、本発明の実施形態による方法の電子デバイスのブロック図である。電子デバイスは、様々な形式のデジタルコンピュータ、例えば、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、PDA、サーバ、ブレードサーバ、メインフレームコンピュータ、及び他の適切なコンピュータであることが意図される。電子デバイスは、様々な形式のモバイル装置、例えば、PDA、携帯電話、スマートフォン、ウェアラブルデバイス、及び他の類似するコンピューティング装置を示してもよい。本文で示された構成要素、それらの接続及び関係、ならびにそれらの機能は例示にすぎなく、本明細書において説明及び/又は請求される本発明の実現を限定することを意図するわけではない。
図9に示すように、この電子デバイスは、一つ又は複数のプロセッサ901、メモリ902、及び各構成要素に接続するための高速インターフェース及び低速インターフェースを含むインターフェースを備える。各構成要素は、異なるバスで相互接続され、そして、共通マザーボードに、又は必要に応じて、他の態様で実装されてもよい。プロセッサは、電子デバイス内で実行されるコマンドを処理してもよく、メモリに記憶される又はメモリ上で外部入力/出力装置(例えば、インターフェースに結合される表示装置)にグラフィカルユーザインターフェースのグラフィカル情報を表示するコマンドを含む。他の実施形態において、必要な場合に、複数のプロセッサ及び/又は複数のバスが、複数のメモリとともに用いられてもよい。同様に、複数の電子デバイスが接続されてもよく、それぞれのデバイスが必要な操作の一部を提供する(例えば、サーババンク、ブレードサーバの集まり、又はマルチプロセッサシステムとする)。図9において、一つのプロセッサ901を例とする。
メモリ902は、本発明で提供される非一時的コンピュータ可読記憶媒体である。なお、前記メモリには、少なくとも1つのプロセッサが本発明に提供された方法を実行するように、前記少なくとも1つのプロセッサに実行可能なコマンドが記憶されている。本発明の非一時的コンピュータ可読記憶媒体は、本発明に提供された方法をコンピュータに実行させるためのコンピュータコマンドを記憶している。
メモリ902は、非一時的コンピュータ可読記憶媒体として、非一時的ソフトウェアプログラム、非一時的コンピュータ実行可能なプログラム、モジュール、例えば、本発明の実施例における方法に対応するプログラムコマンド/ユニットを記憶するために用いられる。プロセッサ901は、メモリ902に記憶されている非一時的ソフトウェアプログラム、コマンド及びモジュールを実行することで、サーバの様々な機能アプリケーション及びデータ処理を実行し、即ち、上記の方法実施例における方法を実現する。
メモリ902は、プログラム記憶領域及びデータ記憶領域を含んでもよく、プログラム記憶領域はオペレーティングシステム、少なくとも一つの機能に必要なアプリケーションプログラムを記憶してもよく、データ記憶領域は電子デバイスの使用により作成されたデータなどを記憶してもよい。また、メモリ902は、高速ランダムアクセスメモリを含んでもよく、さらに非一時的メモリ、例えば、少なくとも一つの磁気ディスク記憶装置、フラッシュメモリ装置、又は他の非一時的固体記憶装置を含んでもよい。幾つかの実施例において、メモリ902は、プロセッサ901に対して遠隔設置されたメモリを選択的に含んでもよく、これらのリモートメモリは、ネットワークを介して電子デバイスに接続されてもよい。上記のネットワークの実例には、インターネット、イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク、及びそれらの組み合わせが含まれるが、これらに限定されない。
電子デバイスは、更に、入力装置903と出力装置904とを備えても良い。プロセッサ901、メモリ902、入力装置903及び出力装置904は、バス又は他の手段により接続されても良く、図9においてバスによる接続を例とする。
入力装置903は、入力された数字又はキャラクタ情報を受信し、電子デバイスのユーザ設定及び機能制御に関連するキー信号入力を生成でき、例えば、タッチスクリーン、キーパッド、マウス、トラックパッド、タッチパッド、ポインティングスティック、一つ又は複数のマウスボタン、トラックボール、ジョイスティックなどの入力装置である。出力装置904は、表示装置、補助照明装置(例えば、LED)、触覚フィードバック装置(例えば、振動モータ)などを含むことができる。当該表示装置は、液晶ディスプレイ(LCD)、発光ダイオードディスプレイ(LED)、及びプラズマディスプレイを含み得るが、これらに限定されない。いくつかの実施形態では、表示装置はタッチパネルであってもよい。
本明細書に説明されるシステム及び技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、専用ASIC(専用集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/又はそれらの組み合わせにおいて実現することができる。これらの様々な実施形態は、記憶システム、少なくとも一つの入力装置、及び少なくとも一つの出力装置からデータ及びコマンドを受信し、当該記憶システム、当該少なくとも一つの入力装置、及び当該少なくとも一つの出力装置にデータ及びコマンドを送信するようにつなげられた、特殊用途でもよく一般用途でもよい少なくとも一つのプログラマブルプロセッサを含む、プログラマブルシステム上で実行可能及び/又は解釈可能な一つ又は複数のコンピュータプログラムにおける実行を含んでもよい。
これらのコンピューティングプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、又は、コードとも称される)は、プログラマブルプロセッサの機械命令を含み、高水準のプロセス及び/又はオブジェクト向けプログラミング言語、及び/又はアセンブリ/機械言語で実行されることができる。本明細書で用いられる「機械可読媒体」及び「コンピュータ可読媒体」という用語は、機械可読信号としての機械命令を受け取る機械可読媒体を含むプログラマブルプロセッサに機械命令及び/又はデータを提供するのに用いられる任意のコンピュータプログラム製品、機器、及び/又は装置(例えば、磁気ディスク、光ディスク、メモリ、及びプログラマブル論理デバイス(PLD))を指す。「機械可読信号」という用語は、プログラマブルプロセッサに機械命令及び/又はデータを提供するために用いられる任意の信号を指す。
ユーザとのインタラクティブを提供するために、本明細書に説明されるシステムと技術は、ユーザに対して情報を表示するための表示装置(例えば、CRT(ブラウン管)又はLCD(液晶ディスプレイ)モニタ)、ユーザがコンピュータに入力を与えることができるキーボード及びポインティングデバイス(例えば、マウスや、トラックボール)を有するコンピュータ上に実施されることが可能である。その他の種類の装置は、さらに、ユーザとのインタラクションを提供するために使用されることが可能であり、例えば、ユーザに提供されるフィードバックは、任意の形態のセンシングフィードバック(例えば、視覚的なフィードバック、聴覚的なフィードバック、又は触覚的なフィードバック)であり取得し、ユーザからの入力は、任意の形態で(音響、音声又は触覚による入力を含む)受信され得る。
本明細書に説明されるシステムと技術は、バックエンド構成要素を含むコンピューティングシステム(例えば、データサーバとする)、又はミドルウェア構成要素を含むコンピューティングシステム(例えば、アプリケーションサーバ)、又はフロントエンド構成要素を含むコンピューティングシステム(例えば、グラフィカルユーザインターフェースもしくはウェブブラウザを有するクライアントコンピュータであり、ユーザは、当該グラフィカルユーザインターフェースもしくは当該ウェブブラウザを通じて本明細書で説明されるシステムと技術の実施形態とインタラクションすることができる)、そのようなバックエンド構成要素、ミドルウェア構成要素、もしくはフロントエンド構成要素の任意の組合せを含むコンピューティングシステムに実施されることが可能である。システムの構成要素は、任意の形態又は媒体のデジタルデータ通信(例えば、通信ネットワーク)によって相互に接続されることが可能である。通信ネットワークの例は、ローカルエリアネットワーク(「LAN」)、ワイド・エリア・ネットワーク(「WAN」)、インターネットワークを含む。
コンピュータシステムは、クライアントとサーバーを含み得る。クライアントとサーバーは、一般的に互いから遠く離れており、通常は、通信ネットワークを通じてインタラクトする。クライアントとサーバとの関係は、相応するコンピュータ上で実行され、互いにクライアント-サーバの関係を有するコンピュータプログラムによって生じる。
以上で示された様々な形式のフローを使用して、ステップを並べ替え、追加、又は削除できることを理解されたい。例えば、本発明に説明される各ステップは、並列の順序又は順次的な順序で実施されてもよいし、又は異なる順序で実行されてもよく、本発明で開示された技術案の望ましい結果が達成できる限り、ここで制限されない。
上記の具体的な実施形態は本発明の保護範囲に対する制限を構成しない。設計要件及び他の要因に従って、様々な修正、組み合わせ、部分的組み合わせ及び置換を行うことができることを当業者は理解するべきである。本発明の思想及び原則の範囲内で行われる修正、同等の置換、改善は、何れも本発明の保護範囲内に含まれるべきである。

Claims (29)

  1. コンピュータにより実行される、POI名を抽出する方法であって、
    POIの画像データから認識された2つ以上のテキストセグメントを取得し、
    前記テキストセグメントを使用して2つ以上の候補名を構築し、
    予め訓練された名称ソートモデルを用いて各候補名をソートし、ソート結果に基づいてPOI名を特定することを含み、
    前記名称ソートモデルは、各候補名から抽出された検索ウェブページ特徴、文書統計特徴、および語義特徴を利用して、各候補名がPOI名となる確率を特定し、その確率に基づいて各候補名をソートする、方法。
  2. 前記テキストセグメントを使用して2つ以上の候補名を構築することは、
    前記テキストセグメントに対して順列・組み合わせを行って2つ以上の候補名を得ることを含み、
    前記ソート結果に基づいてPOI名を特定することは、
    先頭の候補名を前記POI名とすることを含む、請求項1に記載の方法。
  3. 前記テキストセグメントを使用して2つ以上の候補名を構築することは、
    前記テキストセグメントから支店情報セグメントを認識し、
    前記テキストセグメントにおける前記支店情報セグメントを除く他のテキストセグメントに対して順列・組合わせを行って2つ以上の候補名を得ることを含み、
    前記ソート結果に基づいてPOI名を特定することは、
    先頭の候補名と前記支店情報セグメントとを組み合わせて前記POI名を得ることを含む、請求項1に記載の方法。
  4. 前記テキストセグメントから前記支店情報セグメントを認識することは、
    予め訓練された判別モデルを用いて各テキストセグメントを判別して、各テキストセグメントが支店情報セグメントであるか否かを判定することを含む、請求項3に記載の方法。
  5. 前記判別モデルは、
    サンプルデータをPOIデータベースから取得し、支店情報テキストをポジティブサンプルとし、非支店情報テキストをネガティブサンプルとし、
    前記サンプルデータを用いて判別モデルを訓練する、
    ことにより予め訓練して得たものである、請求項4に記載の方法。
  6. 候補名から検索ウェブページ特徴を抽出することは、
    候補名をqueryとして検索し、
    取得された検索結果をセマンティックコーディングして検索結果の隠れベクトルを得て、前記候補名の検索ウェブページ特徴とすることを含む、請求項1に記載の方法。
  7. 前記取得された検索結果をセマンティックコーディングして検索結果の隠れベクトルを得ることは、
    上位N(Nは所定の正整数である)個の検索結果テキストを取得し、
    取得された各検索結果テキストをそれぞれセマンティックコーディングして各検索結果テキストの隠れベクトルを取得し、
    前記各検索結果テキストの隠れベクトルに対して統合処理を行って、前記検索結果の隠れベクトルを得ることを含む、請求項6に記載の方法。
  8. 候補名から文書統計特徴を抽出することは、
    ウェブページデータにおいて前記候補名の逆文書頻度を統計し、
    前記逆文書頻度の表現ベクトルを前記候補名の文書統計特徴とすることを含む、請求項1に記載の方法。
  9. 候補名から語義特徴を抽出することは、
    候補名に含まれる各テキストセグメントの語義特徴、位置特徴及び文書統計特徴のうちの少なくとも1つに基づいて、各テキストセグメントの語義表現ベクトルを取得し、
    前記各テキストセグメントの語義表現ベクトルに対して統合処理を行って前記候補名の語義表現ベクトルを得ることを含む、請求項1に記載の方法。
  10. 前記テキストセグメントの語義表現ベクトルは、
    テキストセグメントをセマンティックコーディングしてテキストセグメントの隠れベクトルを取得し、
    候補名におけるテキストセグメントの位置をベクトル空間にマッピングしてテキストセグメントの位置表現ベクトルを取得し、
    ウェブページデータにおいて前記テキストセグメントの逆文書頻度を統計して前記逆文書頻度の表現ベクトルを取得し、
    テキストセグメントの隠れベクトル、位置表現ベクトル及び逆文書頻度の表現ベクトルをスプライシングして当該テキストセグメントの語義表現ベクトルを得る、ことにより特定される、請求項9に記載の方法。
  11. コンピュータにより実行される、名称ソートモデルを構築する方法であって、
    POI名の正例および負例を含む訓練サンプルを取得し、
    各訓練サンプルから検索ウェブページ特徴、文書統計特徴および語義特徴を抽出し、各訓練サンプルがPOI名となる確率を特定し、
    pairwiseアルゴリズムを用いて正例がPOI名となる確率と負例がPOI名となる確率との差を最大化することを訓練目標として訓練を行うことにより名称ソートモデルを得ることを含む、方法。
  12. 訓練サンプルから検索ウェブページ特徴を抽出することは、
    訓練サンプルをqueryとして検索し、
    取得された検索結果をセマンティックコーディングして検索結果の隠れベクトルを取得して、前記訓練サンプルの検索ウェブページ特徴とすることを含む、請求項11に記載の方法。
  13. 前記取得された検索結果をセマンティックコーディングして検索結果の隠れベクトルを得ることは、
    上位N個(Nは所定の正整数である)の検索結果テキストを取得し、
    取得された各検索結果テキストをそれぞれセマンティックコーディングして各検索結果テキストの隠れベクトルを取得し、
    前記各検索結果テキストの隠れベクトルに対して統合処理を行って、前記検索結果の隠れベクトルを得ることを含む、請求項12に記載の方法。
  14. 訓練サンプルから文書統計特徴を抽出することは、
    ウェブページデータにおいて前記訓練サンプルの逆文書頻度を統計し、
    前記逆文書頻度の表現ベクトルを前記訓練サンプルの文書統計特徴とすることを含む、請求項11に記載の方法。
  15. 訓練サンプルから語義特徴を抽出することは、
    訓練サンプルに含まれる各テキストセグメントの語義特徴、位置的特徴、および文書統計特徴のうちの少なくとも1つに基づいて各テキストセグメントの語義表現ベクトルを取得し、
    前記各テキストセグメントの語義表現ベクトルに対して統合処理を行って前記訓練サンプルの語義表現ベクトルを得ることを含む、請求項11に記載の方法。
  16. 前記テキストセグメントの語義表現ベクトルは、
    テキストセグメントをセマンティックコーディングしてテキストセグメントの隠れベクトルを取得し、
    候補名におけるテキストフラグメントの位置をベクトル空間にマッピングしてテキストフラグメントの位置表現ベクトルを取得し、
    ウェブページデータにおいて前記テキストセグメントの逆文書頻度を統計して前記逆文
    書頻度の表現ベクトルを取得し、
    テキストセグメントの隠れベクトル、位置表現ベクトル、および逆文書頻度表現ベクトルをスプライシングして当該テキストセグメントの語義表現ベクトルを得る、
    ことにより特定される請求項15に記載の方法。
  17. POI名を抽出する装置であって、
    POIの画像データから認識された二つ以上のテキストセグメントを取得する取得ユニットと、
    前記テキストセグメントを用いて2つ以上の候補名を構築する構築ユニットと、
    予め訓練された名称ソートモデルを用いて各候補名をソートするソートユニットと、
    前記ソートユニットによるソート結果に基づいてPOI名を特定する特定ユニットと、を備え、
    前記名称ソートモデルは、各候補名から抽出された検索ウェブページ特徴、文書統計特徴、および語義特徴を利用して、各候補名がPOI名となる確率を特定し、確率に基づいて各候補名をソートする、
    装置。
  18. 前記テキストセグメントから支店情報セグメントを認識する認識ユニットを更に備え、
    前記構築ユニットは、具体的に、前記テキストセグメントにおける前記支店情報セグメントを除く他のテキストセグメントに対して順列・組合わせを行って2つ以上の候補名を取得し、
    前記特定ユニットは、具体的に、先頭の候補名と前記支店情報セグメントとを組み合わせて前記POI名を得る、請求項17に記載の装置。
  19. 前記認識ユニットは、具体的に、予め訓練された判別モデルを用いて各テキストセグメントを判別して、各テキストセグメントが支店情報セグメントであるか否かを判定し、
    サンプルデータをPOIデータベースから取得し、支店情報テキストをポジティブサンプルとし、非支店情報テキストをネガティブサンプルとし、前記サンプルデータを用いて判別モデルを訓練するモデル訓練ユニットを更に備える、請求項18に記載の装置。
  20. 前記ソートユニットは、名称ソートモデルを使用して候補名から検索ウェブページ特徴を抽出する場合に、具体的に、
    候補名をqueryとして検索し、
    上位N(Nは所定の正整数である)個の検索結果テキストを取得し、
    取得された各検索結果テキストをそれぞれセマンティックコーディングして各検索結果テキストの隠れベクトルを取得し、
    前記各検索結果テキストの隠れベクトルに対して統合処理を行って検索結果の隠れベクトルを得て、前記候補名の検索ウェブページ特徴とする、
    請求項17に記載の装置。
  21. 前記ソートユニットは、名称ソートモデルを使用して候補名から文書統計特徴を抽出する場合に、具体的に、
    ウェブページデータにおいて前記候補名の逆文書頻度を統計し、
    前記逆文書頻度の表現ベクトルを前記候補名の文書統計特徴とする、
    請求項17に記載の装置。
  22. 前記ソートユニットは、名称ソートモデルを使用して候補名から語義特徴を抽出する場合に、具体的に、
    候補名に含まれる各テキストセグメントの語義特徴、位置特徴及び文書統計特徴のうちの少なくとも1つに基づいて、各テキストセグメントの語義表現ベクトルを取得し、
    前記各テキストセグメントの語義表現ベクトルに対して統合処理を行って前記候補名の語義表現ベクトルを得る、
    請求項17に記載の装置。
  23. 名称ソートモデルを構築する装置であって、
    POI名の正例および負例を含む訓練サンプルを取得するサンプル取得ユニットと、
    各訓練サンプルから検索ウェブページ特徴、文書統計特徴及び語義特徴を抽出し、各訓練サンプルがPOI名となる確率を特定し、pairwiseアルゴリズムを用いて正例がPOI名となる確率と負例がPOI名となる確率との差を最大化することを訓練目標として訓練を行うことにより名称ソートモデルを得るモデル訓練ユニットと、を備える、
    装置。
  24. 前記モデル訓練ユニットは、訓練サンプルから検索ウェブページ特徴を抽出する場合に、具体的に、
    訓練サンプルをqueryとして検索し、
    上位N(Nは所定の正整数である)個の検索結果テキストを取得し、
    取得された各検索結果テキストをそれぞれセマンティックコーディングして各検索結果テキストの隠れベクトルを取得し、
    前記各検索結果テキストの隠れベクトルに対して統合処理を行って検索結果の隠れベクトルを得て、前記訓練サンプルの検索ウェブページ特徴とする、請求項23に記載の装置。
  25. 前記モデル訓練ユニットは、訓練サンプルから文書統計特徴を抽出する場合に、具体的に、
    ウェブページデータにおいて前記訓練サンプルの逆文書頻度を統計し、
    前記逆文書頻度の表現ベクトルを前記訓練サンプルの文書統計特徴とする、請求項23に記載の装置。
  26. 前記モデル訓練ユニットは、訓練サンプルから語義特徴を抽出する場合に、具体的に、
    訓練サンプルに含まれる各テキストセグメントの語義特徴、位置特徴及び文書統計特徴のうちの少なくとも1つに基づいて、各テキストセグメントの語義表現ベクトルを取得し、
    前記各テキストセグメントの語義表現ベクトルに対して統合処理を行って前記訓練サンプルの語義表現ベクトルを得る、
    請求項23に記載の装置。
  27. 少なくとも1つのプロセッサと、
    前記少なくとも1つのプロセッサと通信接続されたメモリと、を備え、
    前記メモリに前記少なくとも1つのプロセッサにより実行可能なコマンドが記憶されており、前記コマンドが前記少なくとも1つのプロセッサにより実行されると、前記少なくとも1つのプロセッサに請求項1~16の何れか一つに記載の方法を実行させる、電子デバイス。
  28. コンピュータに請求項1~16の何れか一つに記載の方法を実行させるためのコンピュータコマンドが記憶された非一時的なコンピュータ可読記憶媒体。
  29. コンピュータに請求項1~16の何れか一つに記載の方法を実行させるためのコンピュータプログラム。
JP2021513957A 2019-11-13 2020-05-28 Poi名を抽出する方法、装置、デバイス、プログラム及びコンピュータ記憶媒体 Active JP7185023B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201911105580.XA CN111026937B (zh) 2019-11-13 2019-11-13 提取poi名称的方法、装置、设备和计算机存储介质
CN201911105580.X 2019-11-13
PCT/CN2020/092984 WO2021093308A1 (zh) 2019-11-13 2020-05-28 提取poi名称的方法、装置、设备和计算机存储介质

Publications (2)

Publication Number Publication Date
JP2022512269A JP2022512269A (ja) 2022-02-03
JP7185023B2 true JP7185023B2 (ja) 2022-12-06

Family

ID=70205572

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021513957A Active JP7185023B2 (ja) 2019-11-13 2020-05-28 Poi名を抽出する方法、装置、デバイス、プログラム及びコンピュータ記憶媒体

Country Status (5)

Country Link
US (1) US11768892B2 (ja)
EP (1) EP3848823A4 (ja)
JP (1) JP7185023B2 (ja)
CN (1) CN111026937B (ja)
WO (1) WO2021093308A1 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111026937B (zh) 2019-11-13 2021-02-19 百度在线网络技术(北京)有限公司 提取poi名称的方法、装置、设备和计算机存储介质
CN111666292B (zh) 2020-04-24 2023-05-26 百度在线网络技术(北京)有限公司 用于检索地理位置的相似度模型建立方法和装置
CN111666461B (zh) * 2020-04-24 2023-05-26 百度在线网络技术(北京)有限公司 检索地理位置的方法、装置、设备和计算机存储介质
CN111694919B (zh) * 2020-06-12 2023-07-25 北京百度网讯科技有限公司 生成信息的方法、装置、电子设备及计算机可读存储介质
CN112101165B (zh) * 2020-09-07 2022-07-15 腾讯科技(深圳)有限公司 兴趣点识别方法、装置、计算机设备和存储介质
CN112541496B (zh) * 2020-12-24 2023-08-22 北京百度网讯科技有限公司 提取poi名称的方法、装置、设备和计算机存储介质
CN113139110B (zh) * 2021-04-28 2023-09-22 北京百度网讯科技有限公司 区域特征处理方法、装置、设备、存储介质和程序产品
CN113704386A (zh) * 2021-10-27 2021-11-26 深圳前海环融联易信息科技服务有限公司 一种基于深度学习的文本推荐方法、装置及相关介质
CN113971407B (zh) * 2021-12-23 2022-03-18 深圳佑驾创新科技有限公司 语义特征提取方法及计算机可读存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005214961A (ja) 2004-02-02 2005-08-11 Equos Research Co Ltd ナビゲーション装置、ナビゲーションシステムおよびナビゲーション方法
JP2008287388A (ja) 2007-05-16 2008-11-27 National Institute Of Information & Communication Technology 情報抽出装置、情報抽出方法及び情報抽出プログラム
WO2008146456A1 (ja) 2007-05-28 2008-12-04 Panasonic Corporation 情報探索支援方法および情報探索支援装置
JP2009245179A (ja) 2008-03-31 2009-10-22 Nomura Research Institute Ltd 文書検索支援装置
JP2011191982A (ja) 2010-03-15 2011-09-29 Nippon Telegr & Teleph Corp <Ntt> 店舗名曖昧性解消装置、その方法、プログラム及び記録媒体
JP2017173900A (ja) 2016-03-18 2017-09-28 株式会社Nttドコモ 情報処理装置
WO2018213763A1 (en) 2017-05-19 2018-11-22 Salesforce.Com, Inc. Natural language processing using context-specific word vectors
JP2018195272A (ja) 2017-05-22 2018-12-06 トヨタ自動車株式会社 情報抽出装置
JP2019503025A (ja) 2016-01-11 2019-01-31 アリババ グループ ホウルディング リミテッド 地図上の関心地点の略称を得る方法及び装置

Family Cites Families (61)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6823084B2 (en) * 2000-09-22 2004-11-23 Sri International Method and apparatus for portably recognizing text in an image sequence of scene imagery
US6477460B2 (en) * 2001-02-27 2002-11-05 Metro One Telecommunications, Inc. Process and system for the annotation of machine-generated directions with easily recognized landmarks and other relevant information
US6766245B2 (en) * 2002-03-14 2004-07-20 Microsoft Corporation Landmark-based location of users
US7155336B2 (en) * 2004-03-24 2006-12-26 A9.Com, Inc. System and method for automatically collecting images of objects at geographic locations and displaying same in online directories
EP1794691A1 (en) * 2004-09-27 2007-06-13 Travelocity.com LP System, method and computer program product for searching amd retrieving ranked points of interest within a polygonal area of interest
US7917286B2 (en) * 2005-12-16 2011-03-29 Google Inc. Database assisted OCR for street scenes and other images
JP4788525B2 (ja) * 2006-08-30 2011-10-05 日本電気株式会社 物体識別パラメータ学習システム、物体識別パラメータ学習方法および物体識別パラメータ学習用プログラム
US8131118B1 (en) * 2008-01-31 2012-03-06 Google Inc. Inferring locations from an image
US8634796B2 (en) * 2008-03-14 2014-01-21 William J. Johnson System and method for location based exchanges of data facilitating distributed location applications
US8929877B2 (en) * 2008-09-12 2015-01-06 Digimarc Corporation Methods and systems for content processing
CN101350154B (zh) * 2008-09-16 2013-01-30 北京搜狐新媒体信息技术有限公司 一种电子地图数据的排序方法及装置
US8060302B2 (en) * 2009-03-31 2011-11-15 Microsoft Corporation Visual assessment of landmarks
US8589069B1 (en) * 2009-11-12 2013-11-19 Google Inc. Enhanced identification of interesting points-of-interest
US20150112981A1 (en) * 2009-12-14 2015-04-23 Google Inc. Entity Review Extraction
US8489325B2 (en) * 2010-01-19 2013-07-16 Apple Inc. Point of interest based directions in a mapping application
US20120092329A1 (en) * 2010-10-13 2012-04-19 Qualcomm Incorporated Text-based 3d augmented reality
US9305024B2 (en) * 2011-05-31 2016-04-05 Facebook, Inc. Computer-vision-assisted location accuracy augmentation
US10096033B2 (en) * 2011-09-15 2018-10-09 Stephan HEATH System and method for providing educational related social/geo/promo link promotional data sets for end user display of interactive ad links, promotions and sale of products, goods, and/or services integrated with 3D spatial geomapping, company and local information for selected worldwide locations and social networking
US11074495B2 (en) * 2013-02-28 2021-07-27 Z Advanced Computing, Inc. (Zac) System and method for extremely efficient image and pattern recognition and artificial intelligence platform
US11914674B2 (en) * 2011-09-24 2024-02-27 Z Advanced Computing, Inc. System and method for extremely efficient image and pattern recognition and artificial intelligence platform
US9165206B2 (en) * 2011-12-12 2015-10-20 Google Inc. Updating point of interest data based on an image
US8688377B1 (en) * 2012-02-17 2014-04-01 Google Inc. System and method of using automatically-identified prominent establishments in driving directions
US20140006408A1 (en) * 2012-06-29 2014-01-02 Yahoo! Inc. Identifying points of interest via social media
WO2014072767A1 (en) * 2012-11-06 2014-05-15 Nokia Corporation Apparatus and method for displaying image-based representations of geographical locations in an electronic text
CN103106272B (zh) * 2013-02-06 2016-04-06 腾讯科技(深圳)有限公司 兴趣点信息获取方法及装置
CN105283884A (zh) * 2013-03-13 2016-01-27 柯法克斯公司 对移动设备捕获的数字图像中的对象进行分类
CN103226601B (zh) * 2013-04-25 2019-03-29 百度在线网络技术(北京)有限公司 一种图片搜索的方法和装置
CN103336807B (zh) * 2013-06-25 2018-01-05 百度在线网络技术(北京)有限公司 一种显示兴趣点的方法及系统
US20160147826A1 (en) * 2013-07-18 2016-05-26 Nokia Technologies Oy Method and apparatus for updating points of interest information via crowdsourcing
CN104090970B (zh) * 2014-07-17 2018-02-02 百度在线网络技术(北京)有限公司 兴趣点的展现方法及装置
US9418283B1 (en) * 2014-08-20 2016-08-16 Amazon Technologies, Inc. Image processing using multiple aspect ratios
US9390315B1 (en) * 2015-06-25 2016-07-12 A9.Com, Inc. Image match for featureless objects
US20170109615A1 (en) * 2015-10-16 2017-04-20 Google Inc. Systems and Methods for Automatically Classifying Businesses from Images
CN105550169A (zh) * 2015-12-11 2016-05-04 北京奇虎科技有限公司 一种基于字符长度识别兴趣点名称的方法和装置
CN105550330B (zh) * 2015-12-21 2020-09-11 北京奇虎科技有限公司 兴趣点poi信息排序的方法和系统
CN105721629B (zh) * 2016-03-24 2019-04-26 百度在线网络技术(北京)有限公司 用户标识匹配方法和装置
CN107292302B (zh) * 2016-03-31 2021-05-14 阿里巴巴(中国)有限公司 检测图片中兴趣点的方法和系统
BR102016007265B1 (pt) * 2016-04-01 2022-11-16 Samsung Eletrônica da Amazônia Ltda. Método multimodal e em tempo real para filtragem de conteúdo sensível
US10323952B2 (en) * 2016-04-26 2019-06-18 Baidu Usa Llc System and method for presenting media contents in autonomous vehicles
US10506373B2 (en) * 2016-06-10 2019-12-10 Apple Inc. Harvesting labels for significant locations based on candidate points of interest and contextual data
US20180189228A1 (en) * 2017-01-04 2018-07-05 Qualcomm Incorporated Guided machine-learning training using a third party cloud-based system
CN107402954B (zh) * 2017-05-26 2020-07-10 百度在线网络技术(北京)有限公司 建立排序模型的方法、基于该模型的应用方法和装置
US10630639B2 (en) * 2017-08-28 2020-04-21 Go Daddy Operating Company, LLC Suggesting a domain name from digital image metadata
CN107992822B (zh) * 2017-11-30 2020-04-10 Oppo广东移动通信有限公司 图像处理方法和装置、计算机设备、计算机可读存储介质
CN109903065B (zh) * 2017-12-08 2023-05-26 阿里巴巴集团控股有限公司 一种确定候选点的候选分值的方法和装置
CN108090220B (zh) * 2017-12-29 2021-05-04 科大讯飞股份有限公司 兴趣点搜索排序方法及系统
CN108491421B (zh) * 2018-02-07 2021-04-16 北京百度网讯科技有限公司 一种生成问答的方法、装置、设备和计算存储介质
CN110321885A (zh) * 2018-03-30 2019-10-11 高德软件有限公司 一种兴趣点的获取方法及装置
CN108959551B (zh) * 2018-06-29 2021-07-13 北京百度网讯科技有限公司 近邻语义的挖掘方法、装置、存储介质和终端设备
US11103773B2 (en) * 2018-07-27 2021-08-31 Yogesh Rathod Displaying virtual objects based on recognition of real world object and identification of real world object associated location or geofence
CN109145219B (zh) * 2018-09-10 2020-12-25 百度在线网络技术(北京)有限公司 基于互联网文本挖掘的兴趣点有效性判断方法和装置
US10708708B2 (en) * 2018-10-16 2020-07-07 Uber Technologies, Inc. Reverse geocoding system
US11379502B2 (en) * 2018-11-09 2022-07-05 Uber Technologies, Inc. Place visibility scoring system
US20200193552A1 (en) * 2018-12-18 2020-06-18 Slyce Acquisition Inc. Sparse learning for computer vision
CN109783651B (zh) * 2019-01-29 2022-03-04 北京百度网讯科技有限公司 提取实体相关信息的方法、装置、电子设备和存储介质
CN109992638B (zh) * 2019-03-29 2020-11-20 北京三快在线科技有限公司 地理位置poi的生成方法、装置、电子设备和存储介质
CN110399568B (zh) * 2019-07-04 2022-09-30 Oppo广东移动通信有限公司 信息搜索方法、装置、终端及存储介质
US11308284B2 (en) * 2019-10-18 2022-04-19 Facebook Technologies, Llc. Smart cameras enabled by assistant systems
CN111026937B (zh) * 2019-11-13 2021-02-19 百度在线网络技术(北京)有限公司 提取poi名称的方法、装置、设备和计算机存储介质
US11915463B2 (en) * 2020-08-21 2024-02-27 Carnegie Mellon University System and method for the automatic enrollment of object images into a gallery
US20220383037A1 (en) * 2021-05-27 2022-12-01 Adobe Inc. Extracting attributes from arbitrary digital images utilizing a multi-attribute contrastive classification neural network

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005214961A (ja) 2004-02-02 2005-08-11 Equos Research Co Ltd ナビゲーション装置、ナビゲーションシステムおよびナビゲーション方法
JP2008287388A (ja) 2007-05-16 2008-11-27 National Institute Of Information & Communication Technology 情報抽出装置、情報抽出方法及び情報抽出プログラム
WO2008146456A1 (ja) 2007-05-28 2008-12-04 Panasonic Corporation 情報探索支援方法および情報探索支援装置
JP2009245179A (ja) 2008-03-31 2009-10-22 Nomura Research Institute Ltd 文書検索支援装置
JP2011191982A (ja) 2010-03-15 2011-09-29 Nippon Telegr & Teleph Corp <Ntt> 店舗名曖昧性解消装置、その方法、プログラム及び記録媒体
JP2019503025A (ja) 2016-01-11 2019-01-31 アリババ グループ ホウルディング リミテッド 地図上の関心地点の略称を得る方法及び装置
JP2017173900A (ja) 2016-03-18 2017-09-28 株式会社Nttドコモ 情報処理装置
WO2018213763A1 (en) 2017-05-19 2018-11-22 Salesforce.Com, Inc. Natural language processing using context-specific word vectors
JP2018195272A (ja) 2017-05-22 2018-12-06 トヨタ自動車株式会社 情報抽出装置

Also Published As

Publication number Publication date
CN111026937A (zh) 2020-04-17
JP2022512269A (ja) 2022-02-03
EP3848823A1 (en) 2021-07-14
US20220019632A1 (en) 2022-01-20
WO2021093308A1 (zh) 2021-05-20
US11768892B2 (en) 2023-09-26
CN111026937B (zh) 2021-02-19
EP3848823A4 (en) 2021-12-08

Similar Documents

Publication Publication Date Title
JP7185023B2 (ja) Poi名を抽出する方法、装置、デバイス、プログラム及びコンピュータ記憶媒体
CN110837550B (zh) 基于知识图谱的问答方法、装置、电子设备及存储介质
CN112507715B (zh) 确定实体之间关联关系的方法、装置、设备和存储介质
JP7214949B2 (ja) Poi状態情報を取得する方法、装置、デバイス、プログラム及びコンピュータ記憶媒体
WO2020232861A1 (zh) 命名实体识别方法、电子装置及存储介质
CN103491205B (zh) 一种基于视频搜索的关联资源地址的推送方法和装置
CN112329467B (zh) 地址识别方法、装置、电子设备以及存储介质
EP4075303A1 (en) Method and apparatus for obtaining poi state information
CN112100332A (zh) 词嵌入表示学习方法及装置、文本召回方法及装置
WO2019227581A1 (zh) 兴趣点识别方法、装置、终端设备及存储介质
CN112925883B (zh) 搜索请求处理方法、装置、电子设备及可读存储介质
CN111813874B (zh) 太赫兹知识图谱构建方法及系统
US20190236173A1 (en) Utilizing artificial intelligence to integrate data from multiple diverse sources into a data structure
Guo et al. Adaln: a vision transformer for multidomain learning and predisaster building information extraction from images
JP7160986B2 (ja) 検索モデルの訓練方法、装置、デバイス、コンピュータ記憶媒体、及びコンピュータプログラム
CN113139043B (zh) 问答样本生成方法、装置、电子设备和存储介质
CN109917456B (zh) 地震信息快速提取方法和系统
CN114860913B (zh) 智能问答系统构建方法、问答处理方法及装置
CN113807102B (zh) 建立语义表示模型的方法、装置、设备和计算机存储介质
Jaiswal et al. GeoCAM: A geovisual analytics workspace to contextualize and interpret statements about movement
Qiu et al. Integrating NLP and Ontology Matching into a Unified System for Automated Information Extraction from Geological Hazard Reports
EP3553696B1 (en) Generating a structured document based on a machine readable document and artificial intelligence-generated annotations
CN113220843A (zh) 确定信息关联关系的方法、装置、存储介质和设备
CN113535883A (zh) 商业场所实体链接方法、系统、电子设备及存储介质
US8943074B2 (en) Generating and displaying an image tour in response to a user search query

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210312

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210312

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220422

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220513

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220805

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221111

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221124

R150 Certificate of patent or registration of utility model

Ref document number: 7185023

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150