JP2022006166A - 地図上の目的地の決定方法、機器、及び記憶媒体 - Google Patents

地図上の目的地の決定方法、機器、及び記憶媒体 Download PDF

Info

Publication number
JP2022006166A
JP2022006166A JP2021106993A JP2021106993A JP2022006166A JP 2022006166 A JP2022006166 A JP 2022006166A JP 2021106993 A JP2021106993 A JP 2021106993A JP 2021106993 A JP2021106993 A JP 2021106993A JP 2022006166 A JP2022006166 A JP 2022006166A
Authority
JP
Japan
Prior art keywords
segment
model
map
segments
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021106993A
Other languages
English (en)
Other versions
JP7198312B2 (ja
Inventor
ジンシン ハオ、
Jinxin Zhao
リャンジュン ツァン、
Liangjun Zhang
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu USA LLC
Original Assignee
Baidu USA LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baidu USA LLC filed Critical Baidu USA LLC
Publication of JP2022006166A publication Critical patent/JP2022006166A/ja
Application granted granted Critical
Publication of JP7198312B2 publication Critical patent/JP7198312B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/387Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/909Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0268Control of position or course in two dimensions specially adapted to land vehicles using internal positioning means
    • G05D1/0274Control of position or course in two dimensions specially adapted to land vehicles using internal positioning means using mapping information stored in a memory device
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Mathematical Physics (AREA)
  • Library & Information Science (AREA)
  • Remote Sensing (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Instructional Devices (AREA)

Abstract

Figure 2022006166000001
【課題】地図上の目的地の決定方法、機器及び記憶媒体を提供する。
【解決手段】方法は、テキストのN個のセグメントを取得し、テキストのN個のセグメントの間の文法的な関係に基づいて、N個のセグメントの再帰的順序を決定し、N個のセグメントのそれぞれについて、該セグメントの意味に基づいて複数のモデルの中からマッチングモデルを選択し、再帰的順序に従って、各セグメントを、地図の初期領域又はマッチングモデルによって再帰的順序における該セグメントの前のセグメントについて出力される更新領域とともに該セグメントのマッチングモデルに入力し、マッチングモデルによって再帰的順序における最後のセグメントについて出力される更新領域を地図中の目的地として使用する。
【選択図】図1

Description

本開示の実施例は、全体的には、コンピュータの技術分野に関し、且つより具体的には、地図上の目的地の決定方法、機器、及びコンピュータ読み取り可能な記憶媒体に関する。
ヒューマンコンピュータインタラクションにおいて、自然言語は、ユーザとロボットの間の最も望ましいコミュニケーション形態の1つである。しかしながら、自然言語の解釈は、ロボットにとって依然として非常に難しい問題である。大きな問題の1つは、音声からテキストへの変換が成功したとしても、テキストとその適切な解釈との間にかなりのギャップがあることである。
第1の態様では、地図上の目的地の決定方法を提供する。該方法は、テキストのN個のセグメントを取得するステップであって、Nは1よりも大きい整数であるステップと、テキストのN個のセグメントの間の文法的な関係に基づいて、N個のセグメントの再帰的順序を決定するステップと、N個のセグメントのそれぞれについて、各セグメントの意味に基づいて複数のモデルの中からマッチングモデルを選択するステップであって、各セグメントのマッチングモデルは、全て入力テキストと地図の入力領域を入力として、入力テキストの意味と入力領域に基づいて地図の更新領域を出力するように構成されるステップと、再帰的順序に従って、各セグメントを、地図の初期領域又はマッチングモデルによって再帰的順序における該セグメントの前のセグメントについて出力される更新領域とともに該セグメントのマッチングモデルに入力するステップと、マッチングモデルによって再帰的順序における最後のセグメントについて出力される更新領域を地図中の目的地として使用するステップとを含む。
第2の態様では、地図上の目的地の決定機器を提供する。該機器は、1つの又は複数のプロセッサと、メモリとを含む。該メモリは、1つの又は複数のプロセッサによって実行可能な命令を記憶することで機器に以下の操作を実行させることに用いられ、該操作は、テキストのN個のセグメントを取得することであって、Nは1よりも大きい整数であることと、テキストのN個のセグメントの間の文法的な関係に基づいて、N個のセグメントの再帰的順序を決定することと、N個のセグメントのそれぞれについて、各セグメントの意味に基づいて複数のモデルの中からマッチングモデルを選択することであって、各セグメントのマッチングモデルは、全て入力テキストと地図の入力領域を入力として、入力テキストの意味と入力領域に基づいて地図の更新領域を出力するように構成されることと、再帰的順序に従って、各セグメントを、地図の初期領域又はマッチングモデルによって再帰的順序における該セグメントの前のセグメントについて出力される更新領域とともに該セグメントのマッチングモデルに入力することと、マッチングモデルによって再帰的順序における最後のセグメントについて出力される更新領域を地図中の目的地として使用することとを含む。
第3の態様では、命令を記憶する一時的なコンピュータ読み取り可能な記憶媒体を提供し、該命令はプロセッサによって実行されることで操作を実行し、該操作は、テキストのN個のセグメントを取得することであって、Nは1よりも大きい整数であることと、テキストのN個のセグメントの間の文法的な関係に基づいて、N個のセグメントの再帰的順序を決定することと、N個のセグメントのそれぞれについて、セグメントの意味に基づいて複数のモデルの中からマッチングモデルを選択することであって、各セグメントのマッチングモデルは全て入力テキストと地図の入力領域を入力として、入力テキストの意味と入力領域に基づいて地図の更新領域を出力するように構成されることと、再帰的順序に従って、各セグメントを、地図の初期領域又はマッチングモデルによって再帰的順序における該セグメントの前のセグメントについて出力される更新領域とともに該セグメントのマッチングモデルに入力することと、マッチングモデルによって再帰的順序における最後のセグメントについて出力される更新領域を地図中の目的地として使用することとを含む。
以下、図面を参照した詳細な説明において、本開示の実施形態の上記及び他の特徴、利点及び態様はより明らかになる。図面において、同一又は類似の図面の符号は同一又は類似の素子を表す。
本開示のいくつかの実施形態に係る地図上の目的地の決定方法のフローチャートである。 本開示のいくつかの実施形態に係るセグメントの再帰的順序を決定する実現形態の模式図である。 テキストセグメントのそれぞれのマッチングモデルへの入力の実現形態の模式図である。 テキストセグメントのそれぞれのマッチングモデルへの入力の適用例の模式図である。 本開示のいくつかの他の実施形態に係る地図上の目的地の決定方法のフローチャートである。 本開示のいくつかの実施形態に係る複数のモデルの更新関数のセマンティクス説明の模式図である。 本開示のいくつかの実施形態に係るテキストセグメントに対する計算実行の模式図である。 地図上の目的地の決定方法の適用シナリオである。 本開示のいくつかの実施形態に係る地図上の目的地の決定機器の模式図である。
以下、図面及び実施形態を参照しながら本開示をさらに詳細に説明する。理解すべきものとして、本明細書で説明される特定実施形態は関連する開示内容を解釈するために過ぎず、限定的な内容ではない。また、なお、説明の便宜上、図面には関連開示に関する部材だけが示されている。
さらに、なお、本開示における実施形態及び実施形態の特徴は、矛盾しない限り、互いに組み合わせることができる。以下、図面を参照して実施形態と組み合わせて、本開示の特徴を詳細に説明する。
現在、ロボット言語アドレッシングアルゴリズムはほとんど固定シナリオに対して限られたストラテジーセットを維持し、大量のデータ訓練を通じて画像又は地理情報と自然言語の間のマッチングを確立する。従来の技術のほとんどは、ニューラルネットワークの学習能力を利用して、大量のデータから言語と目標位置の間のマッチング関係を記憶する。このような方法は、言語の構造を十分に活用しておらず、自然言語での目的地記述の推論の性質を無視している。その欠点は、データに対する需要が膨大であること、記録されていない言語構造に汎用性がないこと、及び推論を必要とする位置の記述を理解しにくいことといったロボット制御の不便を引き起こす。
図1は本開示のいくつかの実施形態に係る地図上の目的地の決定方法のフローチャートである。該方法は、ステップ101~105を含む。
ステップ101:テキストのN個のセグメントを取得し、Nは1よりも大きい整数である。
いくつかの実施形態では、ユーザ入力に基づいてテキストを取得する。ユーザ入力は機械又はコンピュータにより受信可能な任意の入力であってもよい。いくつかの実施形態では、ユーザ入力は音声、キーボードによる入力、センサによる入力又はタッチスクリーンによる入力のうちの少なくとも1つを含む。
いくつかの実施形態では、N個のセグメントは位置を示すセグメントと位置関係を示すセグメントを含む。
いくつかの実施形態では、ユーザが「北出口近くの会議室に行く」というと、ロボットは音声を受信して、音声からテキスト「北出口近くの会議室に行く」を取得する。いくつかの実施形態では、テキストに対してセマンティクス分析を実行して位置記述に関するテキスト、例えば「北出口近くの会議室」を取得する。次に、テキストの複数のセグメント、即ち名詞セグメント(例えば、「会議室」と「北出口」)と前置詞セグメント(例えば、「近く」)を取得する。
ステップ102:テキストのN個のセグメントの間の文法的な関係に基づいて、N個のセグメントの再帰的順序を決定する。
いくつかの実施形態では、ステップ102は、図2に示すステップ1021と1022を含む。ステップ1021は、N個のセグメントの中から前置詞セグメントの前の名詞主語セグメント、前置詞セグメント、及び前置詞セグメントの目的語セグメントを決定するステップを含む。
いくつかの実施形態では、自然言語処理(NLP)ツールを使用してテキストを解析して主語uh、前置詞uprep、及び前置詞の目的語upobjを有する従属構造とする。
ステップ1022:前置詞セグメントの前の名詞主語セグメントを再帰的順序における第1のセグメントとして決定し、前置詞セグメントを再帰的順序における第2のセグメントとして決定し、目的語セグメントを再帰的順序における第3のセグメントとして決定する。
ステップ103:N個のセグメントのそれぞれについて、各セグメントの意味に基づいて複数のモデルの中からマッチングモデルを選択し、各セグメントのマッチングモデルは、全て入力テキストと地図の入力領域を入力として、入力テキストの意味と入力領域に基づいて地図の更新領域を出力するように構成される。
いくつかの実施形態では、複数のモデルは第1のタイプモデルと第2のタイプモデルを含み、ここで、第1のタイプモデルは、第1の地図領域と位置を示す第1のタイプテキストとを入力として、第1の地図領域内の第1の更新領域を出力するように構成され、第2のタイプモデルは、第2の地図領域と前記位置関係を示す第2のタイプテキストを入力として、第2の地図領域と位置関係に基づいて第2の更新領域を出力するように構成される。
いくつかの実施形態では、位置関係は近接関係を含み、且つ第2のタイプモデルは近接度モデルを含み、該近接度モデルは、第2の地図領域と近接関係を示す第2のタイプテキストを入力として、第2の地図領域に近接する第2の更新領域を出力するように構成される。
いくつかの実施形態では、位置関係は方向関係を含み、且つ第2のタイプモデルは方向モデルを含み、該方向モデルは、第2の地図領域と方向関係を示す第2のタイプテキストとを入力として、第2の地図領域の方向での第2の更新領域を出力するように構成される。
いくつかの実施形態では、前置詞セグメントの前の名詞セグメント、前置詞セグメント、及び目的語名詞セグメントとマッチングするモデルは、それぞれ以下の等式を使用してもよい。
Figure 2022006166000002
ここで、fθ*はθをパラメータとする基盤関数を示し、b0はダミー信頼度又は地図m全体にまたがる初期分布を示す。いくつかの実施形態では、等式(1)と等式(3)は同一関数を共用する。
ステップ104:再帰的順序に従って、各セグメントを、地図の初期領域又はマッチングモデルによって再帰的順序における該セグメントの前のセグメントについて出力される更新領域とともに各セグメントのマッチングモデルに入力する。
いくつかの実施形態では、ステップ104は図3に示すステップ1041とステップ1042を含む。
ステップ1041:再帰的順序における第1のセグメントと地図の初期領域を第1のセグメントのマッチングモデルに入力することにより、第1の更新領域を取得する。
ステップ1042:再帰的順序における第2のセグメント~第Nのセグメントのそれぞれについて、該セグメントとマッチングモデルによって再帰的順序における該セグメントの前のセグメントについて出力される更新領域とを該セグメントのマッチングモデルに入力することにより、該セグメント用の更新領域を取得する。
図4はステップ104の適用例を示す。図4において、等式(1)で定義したとおり、第1のセグメント「北出口」を地図の初期領域とともに第1のモデルに入力する。次に、等式(2)で定義したとおり、第2のセグメント「近く」を第1のモデルの出力とともに第2のモデルに入力する。最後に、等式(3)で定義したとおり、第3のセグメント「会議室」を第2のモデルの出力とともに第3のモデルに入力する。
ステップ105:再帰的順序に従う最後のセグメントのマッチングモデルによって出力される更新領域を地図中の目的地として使用する。
いくつかの実施形態では、図4における第3のモデルの出力は目的地として使用される。いくつかの実施形態では、地図の座標はロボットが地図上の目的地に基づいて決定し、次にロボットはロボットの現在の位置から地図での座標への経路を計画して、計画した経路に沿って移動する。
本開示のいくつかの実施形態に係る方法は、自然言語の構造の特徴を最大限に利用し、命令構造に従って完全なアドレッシングタスクを複数の独立した言語理解タスクに分割し、確率分布の形で抽出した情報を送信する。初期状態では、目標確率は地図の全範囲にわたり均等に分布している。確率分布は、独立した言語によって1つずつ理解されて更新され、最終的な目標位置を目指す。
本開示のいくつかの実施形態に係る方法は、解釈可能で、最適化が容易であり、且つ必要なデータがより少ないという特徴を有する。本開示のいくつかの実施形態に係る方法を利用すると、地図中の目的地の座標は、ロボットによってユーザの入力に基づいて容易に決定されてもよく、それにより、ユーザによるロボット制御を支援する。
図5は、本開示のいくつかの他の実施形態に係る地図上の目的地の決定方法のフローチャートである。該方法は、ステップ501~505を含む。
ステップ501は、テキストのN個のセグメントを取得するステップを含み、該N個のセグメントは、位置を示すセグメント、方向を示すセグメント、近接度を示すセグメント、及びいずれの位置又はいずれの位置関係も示さないセグメントを含む。
ステップ502は、テキストのN個のセグメントの間の文法的な関係に基づいて、N個のセグメントの再帰的順序を決定するステップを含む。ステップ502はステップ102と同じであり、関連記述についてはステップ102の記述を参照すればよい。
ステップ503は、N個のセグメントのそれぞれについてマッチングモデルを選択するステップであって、該選択は、位置を示すセグメントのマッチングモデルとして第1のタイプモデルを選択し、方向を示すセグメントのマッチングモデルとして方向モデルを選択し、近接度を示すセグメントのマッチングモデルとして近接度モデルを選択し、いずれの位置又はいずれの位置関係も示さないセグメントのマッチングモデルとして第3のタイプモデルを選択することを含むステップを含む。
本開示の以下の記述において、テキストのセグメントは修飾語とも呼ばれ、且つモデルの入力と出力はそれぞれ先験及び後験とも呼ばれる。表Iには、いくつかの実施形態に係る第1のタイプモデル(即ち、正確なモデル)、近接度モデル、方向モデル、及び第3のタイプモデル(即ち、ダミーモデル)とその利用可能な力、出力及び規則の例が示されている。
表I
更新タイプ
Figure 2022006166000003
いくつかの実施形態では、等式(1)~(3)は統一され、以下のような一般的な信頼度の更新チェーンとみなす。
Figure 2022006166000004
ここで、kはupobjとuprepの総数を示す。いくつかの実施形態では、テキストは文法に関連するセグメント(uk)のシーケンスに分解され、且つシーケンスのそれぞれは再帰的に適用されて、信頼度bの概念を更新する。
いくつかの実施形態では、1グループの学習可能な関数
Figure 2022006166000005
と分類器
Figure 2022006166000006
が構築される。等式(4)の更新関数は次のように表現できる。
Figure 2022006166000007
ここで、II(α)はインジケータ関数である。分類器cはニューラルネットワークを示し、次のように定義される。
Figure 2022006166000008
ここで、Φcはゲート付き回帰ユニット(GRU)層により抽出された隠れ状態を示し、且つWcはGRUの隠れ状態を生の分類重みにマッチングさせる線形層の重みを指す。図6は本開示のいくつかの実施形態に係る複数のモデルの更新関数のセマンティクス図示を示す。正確なモデル、方向モデル、近接度モデル及びダミーモデルの更新関数は次のように記述される。
正確なモデル
いくつかの実施形態では、地図m∈Mは1グループの関心のある領域
Figure 2022006166000009
に分けられ、各領域は地図境界B内に境界Bを有する。各領域aは一般的に言及される文字列のタプル(例えば、一意の領域id、領域カテゴリ及び領域名称(適用の場合))に関連付けられ、且つ各関心のあるの領域には多くともN個の単語が割り当てられる。
いくつかの実施形態では、領域情報内の各単語が固定長さの埋め込みに変換され、次に長さの埋め込みが連結される。結果は、
Figure 2022006166000010
で示される地図情報の行列表現である。Sは関心のある領域の数である。Nは領域記述子内のトークンの数を指す。Hは単語の埋め込みの次元である。いくつかの実施形態では、修飾語uは埋め込み行列
Figure 2022006166000011
として符号化される。いくつかの実施形態では、正確なモデルはSレベルの分類問題として形成され、地図中内の全ての領域で定義された離散分布wを生成する。各領域aの計算は次のとおりである。
Figure 2022006166000012
ここで、γ
Figure 2022006166000013
及びwk-1は次のように解釈する方向スケーリング係数、修飾語-地図注意、及び先験重みを示し、ηは正規化係数を指す。次に、w(i)を境界Bにより示される地図上の領域に割り当て、次に地図全体にわたり正規化を行うことで完全信頼度bを回復することができる。
γの使用は、主語の形容詞としての方向の一般的な使用によりトリガーされる(表1参照)。等式は以下のとおりである。
Figure 2022006166000014
ここで、σはシグモイド関数であり、xは領域aの重心であり、Bは地図の境界であり、eαkは予測される方向α∈[-π,π]の単位方向ベクトルであり、κ∈[0,1]はuに方向が使用されているか否かを示す訓練可能な変数であり、βはγのスケーリングファクターを調整する整形係数であり、εは正の定数である。方向形容詞が使用されている場合、κは1としてラベル付けられ、γは指数形式で表示され、該指数形式のγは、各領域aの重心の予測方向に沿った投影に従って各領域aを加重する。柔軟性を高めるために、βはオフセットして追加される。方向形容詞が含まれていない場合、κは0としてラベル付けられ、且つ全てのaについてγ(i)はεにプッシュされ、それにより、この判別項をキャンセルする。等式中、(9)のx及びb以外の全ての項は全ての領域重みにより共有され、学習可能な関数により次のように計算され得る。
Figure 2022006166000015
ここで、ф*はGRU層により抽出された隠れ状態を示し、且つW*はスカラー出力を生成する線形層の重みである。
等式(8)中の注意項
Figure 2022006166000016
は次のように示される。
Figure 2022006166000017
ここで、
Figure 2022006166000018
は正規化係数であり、
Figure 2022006166000019
は領域aに割り当てられた第j単語の埋め込みを指し、
Figure 2022006166000020
は修飾語
Figure 2022006166000021
における第l単語の埋め込みを示す、該項は、予め定義された領域情報と修飾語uの間のマッチング単語ペアをカウントすることにより、各領域aを加重する。正規化された埋め込みドット積を閾値λでフィルタリングすることで単語のマッチングをチェックする。
最後に、先験信頼度から各領域aの重みを収集することにより、次のように領域先験wk-1(i)を計算する。
Figure 2022006166000022
ここでu、vは地図座標を指し、且つηk-1は正規化係数である。
近接度モデル
近接関係に関する前置詞が存在する場合、後験は先験を中心とするガウス分布として表され、先験の領域サイズに比例する分散が割り当てられる。次に更新関数は次のように表現される。
Figure 2022006166000023
ここで、xk-1と|Bk-1|は先験bk-1により示される領域の重心座標とサイズであり、且つρはスケーリング定数である。
方向モデル
形容詞として使用されることに加えて、方向詞(例えば、「北」)、例えば、「会議室202の北」は主語として直接使用可能である。いくつかの実施形態では、先験はガウス分布で表わされるが、該分布は信頼度のみをuと一致に維持する追加のマスクが設定されている。図6の図示の説明を参照する。更新関数は次のように表現され得る。
Figure 2022006166000024
ここで、eαkは有効方向αの単位方向ベクトルである。Nk-1は等式(13)と同じ形式を採用する。Cos(・,・)は余弦相似度である。いくつかの実施形態では、αは、次のように、等式(10)と類似した学習可能な変数として示される。
Figure 2022006166000025
ダミーモデル
いくつかの実施形態では、ダミーモデル関数は同一のマッチングである。
いくつかの実施形態では、バックプロパゲーションによる特定タイプの損失を最小化させることによって、学習可能な関数を訓練することができる。いくつかの実施形態では、訓練用の地図は一般的な作業領域、会議室や、例えば娯楽領域などの指定領域からなる事務室の間取り図である。いくつかの実施形態では、部屋や指定領域などの既存の空間構造を再利用することに加えて、廊下などの一般的な公共空間も分割される。いくつかの実施形態では、地図全体は指定属性を有する80個の領域に分割される。まとめられた領域属性は表IIに示す。
表II
領域属性及び修飾語辞書
Figure 2022006166000026
更新タイプtごとに、K=10個の修飾語uは、予め定義された辞書に従ってランダムに生成され(表II参照)、各領域aはキー領域として使用される。
いくつかの実施形態では、3200個の更新サンプルは訓練に用いられる。各更新関数に基本訓練サンプルを生成するプロセスは前記のとおりである。
ダミーモデルの場合、先験信頼度と後験信頼度が省略され、且つ各訓練サンプルはタイプラベルt*=0の単項(u,)を有する。
近接度モデルの場合、先験bはキー領域内に均一に分布し、且つ後験bはキー領域を中心とするガウス分布であり、その標準偏差がキー領域のサイズに比例する。各訓練サンプルはタイプラベルt*=1を有するタプル(b,b,u)である。
方向モデルの場合、先験bはキー領域内に均一に分布し、方向角αは均一な[-π,π)からサンプリングされ、且つ近接度更新と類似したガウス分布を使用して後験bを生成するが、その半分はαで示される方向に垂直な分割線でマスクされる。最後に、αに基づいて修飾語uを決定する。各訓練サンプルはタイプラベルt*=2を有するタプル(b,b,u,α)である。
正確なモデルの場合、まず、先験bを生成して、キー字領域に基づく近接度更新又は方向更新の出力とする。次に、bから地図位置をサンプリングし、ほとんどのサンプリング位置を選択して上位の2つの領域a、aに入れる。次に、最小規則セットに基づいてaを一意に位置決めする修飾語uk(表III参照、括弧は利用可能な方法を示す)を生成する。また、方向詞が形容詞として使用される場合、κは1としてラベル付けられ、それ以外の場合、0としてラベル付けられる。後験bはα内に均一に分布している。各訓練サンプルは、タイプラベルt*=3を有するタプル(b,b,u,α,κ)である。
表III
修飾語生成規則
Figure 2022006166000027
等式(6)において設定された更新関数セットは、各種の更新関数タイプに適用可能な全ての教師あり項の合計損失を最小化することにより訓練される。全ての教師あり項の損失について次のように定義される。分類器cについて、クロスエントロピー損失Lは次のように使用される。
Figure 2022006166000028
方向αについて、限界l2損失は次のように使用される。
Figure 2022006166000029
インジケータκについて、クロスエントロピー損失κは次のように使用される。
Figure 2022006166000030
いくつかの実施形態では、訓練段階において、10%のデータはテストセットとして保持され、残りのサンプルについては訓練が実行される。各単語についてBert埋め込みだけを使用してテキスト命令を符号化し、長さH=768の単語埋め込みを生成する。いくつかの実施形態では、GRUの隠れサイズは8に設定され、1e-4学習速度を有するAdamは10個の時期について最適化を実行することに使用される。
いくつかの実施形態では、各信頼度更新には、入力は先験-修飾語タプル(b、u)であり、前記のように、各入力タプルは基盤真更新タイプt*及び必要な出力項とペアをなす。
ステップ504は、再帰的順序に従って、N個のセグメントのうちのそれぞれを各セグメントのマッチングモデルに入力するステップであって、N個のセグメントのうちのそれぞれは、地図の初期領域又はマッチングモデルによって再帰的順序における該セグメントの前のセグメントについて出力される更新領域を有するステップを含む。
図7はテキストセグメントに計算を実行する模式図を示す。
ステップ505は、マッチングモデルによって再帰的順序における最後のセグメントについて出力される更新領域を地図中の目的地として使用するステップを含む。
ステップ505はステップ105と同じであり、関連記述についてはステップ105の記述を参照すればよい。
図8は、地図上の目的地の決定方法の適用シナリオを示す。ロボットのスピカーによりナビゲーション命令を説明するようにユーザに要求する。応答として、ユーザは「娯楽領域近くの北の電話室にいく」という。ロボットはマイクロフォンを介してユーザの音声を受信し、音声をテキストに変換し、次に本開示のいくつかの実施形態に係る方法を使用してテキストに基づいて地図上の目的地を決定する。目的地を決定すると、ロボットは現在の位置から目的地までの経路を計画し、カメラ及びセンサを使用して計画した経路に沿って移動する。
図9に示すように、機器は、1つ又は複数のプロセッサ901、メモリ902及び各部材を接続するインターフェース(高速インターフェースと低速インターフェースを含む)を含む。各種の部材は異なるバスを用いて互いに接続されており、必要に応じてユニバーサルマザーボードに取り付けられたり、他の方法で取り付けられたりすることができる。プロセッサは、機器内で実行する命令、例えばメモリ内又はメモリ上に記憶された命令を処理することで、外部入力/出力機器(例えばインターフェースに接続される表示装置)上にGUIのグラフィカル情報を表示することができる。別の実施形態では、必要に応じて、複数のプロセッサ及び/又は複数のバスは複数のメモリとともに使用され得る。同様に、複数の電子機器が接続されてもよく、且つこれらの機器は一部の必須な操作を提供し、例えば、サーバアレイ、1グループのブレードサーバ又はマルチプロセッサシステムとして機能する。図9において、一例として、1つのプロセッサ901が使用されている。
メモリ902は、本開示による一時的なコンピュータ読み取り可能な記憶媒体である。メモリは少なくとも1つのプロセッサにより実行可能な命令を記憶し、該命令は、本開示の実施形態に係る地図上の目的地の決定方法を少なくとも1つのプロセッサに実行させる。本開示の一時的なコンピュータ読み取り可能な記憶媒体は、本開示の実施形態に係る地図上の目的地の決定方法をコンピュータに実行させるコンピュータ命令を記憶している。
一時的なコンピュータ読み取り可能な記憶媒体であるメモリ902は、非一時的なソフトウェアプログラム、非一時的なコンピュータ実行可能なプログラム及びモジュール、例えば本開示の実施形態に係る地図上の目的地の決定方法に対応するプログラム命令/モジュールを記憶することに用いられ得る。プロセッサ901は、メモリ902に記憶された非一時的なソフトウェアプログラム、命令及びモジュールを実行することで、サーバの各種の機能的アプリケーション及びデータ処理を実行し、即ち、本開示の実施形態に係る地図上の目的地の決定方法を実現する。
メモリ902は、プログラム記憶エリアとデータ記憶エリアを含むことができ、これらのうち、プログラム記憶エリアは、オペレーティングシステムと少なくとも1つの機能に必要なアプリケーションプログラムを記憶することができ、データ記憶エリアは本開示の実施形態に係る地図上の目的の決定方法の機器を使用して作成されるデータを記憶することができる。また、メモリ902は、高速ランダムアクセスメモリを含んでもよく、且つ非一時的なメモリ、例えば少なくとも1つの磁気ディスク記憶装置、フラッシュ装置又は他の非一時的な固体記憶装置をさらに含んでもよい。いくつかの実施形態では、メモリ902は、任意に、プロセッサ901に対して遠隔的に配置されたメモリを含み、且つこれらの遠隔メモリは本開示の実施形態に係る地図上の目的の決定方法の機器に接続されてもよい。上記ネットワークの例として、インターネット、イントラネット、ローカルエリアネットワーク、移動通信ネットワーク及びこれらの組み合わせが含まれるが、これらに制限されない。
本開示のいくつかの実施形態に係る地図上の目的地の決定方法を実行する機器は、入力機器903と出力機器904をさらに含んでもよい。プロセッサ901、メモリ902、入力機器903、及び出力機器904は、バス又は他の方法を通じて接続されてもよい。図9において、一例として、バスを介する接続が使用される。
入力機器903は、入力したデジタル又は文字情報を受信し、ユーザ設定及び知識表現を学習する方法用の機器の機能制御に関連するキー信号入力を生成することができ、入力機器903は、例えばタッチスクリーン、キーパッド、マウス、トラックパッド、タッチパッド、インジケータ、1つ又は複数のマウスボタン、トラックボール、ジョイスティックや他の入力機器である。出力機器904は、表示装置、補助照明機器(例えば、LED)、触覚フィードバック機器(例えば、振動モータ)などを含んでもよい。表示装置は、液晶ディスプレイ(LCD)、発光ダイオード(LED)ディスプレイやプラズマディスプレイを含んでもよいが、これらに制限されない。いくつかの実施形態では、表示装置はタッチスクリーンであってもよい。
なお、上記の様々な形式のプロセスを用いて、ステップを改めて並べ替えたり、追加したり、削除したりすることができる。例えば、本開示に記載のステップは、並行して実施しても、順次実施しても、異なる順次で実施してもよい。本開示で開示された技術案の所望の結果が達成できる限り、本明細書ではそれについて限定しない。
上記特定実施形態は、本開示の特許範囲に対する制限を構成するものではない。当業者にとって明らかなように、設計要件及び他の要因に応じて、様々な修正、組み合わせ、サブ組み合わせ、及び置換を行うことができる。本開示の精神及び原則の範囲内で行われた修正、同等の置換、及び改良であれば、本開示の特許範囲に含まれるものとする。

Claims (21)

  1. 地図上の目的地の決定方法であって、
    テキストのN個のセグメントを取得するステップであって、Nは1よりも大きい整数であるステップと、
    前記テキストのN個のセグメントの間の文法的な関係に基づいて、前記N個のセグメントの再帰的順序を決定するステップと、
    前記N個のセグメントのうちのそれぞれのセグメントについて、前記各セグメントの意味に基づいて複数のモデルの中からマッチングモデルを選択するステップであって、前記各セグメントのマッチングモデルは全て入力テキストと前記地図の入力領域を入力として、前記入力テキストの意味と前記入力領域に基づいて前記地図の更新領域を出力するように構成されるステップと、
    前記再帰的順序に従って、前記各セグメントを、前記地図の初期領域又は前記マッチングモデルによって前記再帰的順序における前記各セグメントの前のセグメントについて出力される更新領域とともに前記各セグメントのマッチングモデルに入力するステップと、
    前記マッチングモデルによって前記再帰的順序における最後のセグメントについて出力される前記更新領域を前記地図中の目的地として使用するステップとを含む方法。
  2. 前記文法的な関係に基づいて前記N個のセグメントの再帰的順序を決定するステップは、
    前記N個のセグメントの中から前置詞セグメントの前の名詞主語セグメント、前記前置詞セグメント及び前記前置詞セグメントの目的語セグメントを決定するステップと、
    前記名詞主語セグメントを前記再帰的順序における第1のセグメントとして決定し、前記前置詞セグメントを前記再帰的順序における前記第2のセグメントとして決定し、前記目的語セグメントを前記再帰的順序における前記第3のセグメントとして決定するステップとを含む、請求項1に記載の方法。
  3. 前記N個のセグメントは位置を示すセグメントと位置関係を示すセグメントを含み、
    前記複数のモデルは第1のタイプモデルと第2のタイプモデルを含み、
    前記第1のタイプモデルは、第1の地図領域と前記位置を示す第1のタイプテキストを入力として、前記第1の地図領域内の第1の更新領域を出力するように構成され、
    前記第2のタイプモデルは、第2の地図領域と前記位置関係を示す第2のタイプテキストを入力として、前記第2の地図領域と前記位置関係に基づいて第2の更新領域を出力するように構成され、
    前記再帰的順序に従って、前記各セグメントを、前記地図の初期領域又は前記マッチングモデルによって前記再帰的順序における前記各セグメントの前のセグメントについて出力される更新領域とともに前記各セグメントのマッチングモデルに入力するステップは、
    前記再帰的順序における第1のセグメントと前記地図の初期領域を前記第1のセグメントのマッチングモデルに入力することにより、前記第1の更新領域を取得するステップと、
    前記再帰的順序における第2のセグメント~第Nのセグメントのうちの前記各セグメントについて、前記各セグメントと前記マッチングモデルによって前記再帰的順序における前記各セグメントの前のセグメントについて出力される前記更新領域とを前記各セグメントのマッチングモデルに入力することにより、前記各セグメントの更新領域を取得するステップとを含む、請求項1に記載の方法。
  4. 前記位置関係は近接関係を含み、且つ前記第2のタイプモデルは近接度モデルを含み、前記近接度モデルは、前記第2の地図領域と前記近接関係を示す前記第2のタイプテキストとを入力として、前記第2の地図領域に近接する前記第2の更新領域を出力するように構成される、請求項3に記載の方法。
  5. 前記位置関係は方向関係を含み、且つ前記第2のタイプモデルは方向モデルを含み、前記方向モデルは、前記第2の地図領域と前記方向関係を示す前記第2のタイプテキストとを入力として、前記第2の地図領域の方向での前記第2の更新領域を出力するように構成される、請求項4に記載の方法。
  6. 前記複数のモデルは第3のタイプモデルを含み、前記第3のタイプモデルは第3の地図領域と第3のタイプテキストを入力として、前記第3の地図領域を出力するように構成され、前記第3のタイプテキストはいずれの位置又はいずれの位置関係も示さない、請求項5に記載の方法。
  7. 前記テキストのN個のセグメントを取得するステップは、前記位置を示す前記セグメント、方向を示すセグメント、近接度を示すセグメント、及びいずれの位置又はいずれの位置関係も示さないセグメントを取得することを含み、
    前記N個のセグメントのうちのそれぞれのセグメントについて、前記各セグメントの意味に基づいて前記第1のタイプモデルと前記第2のタイプモデルを含む複数のモデルの中からマッチングモデルを選択するステップは、
    前記位置を示す前記セグメントのマッチングモデルとして前記第1のタイプモデルを選択し、前記方向を示す前記セグメントのマッチングモデルとして前記方向モデルを選択し、前記位置を示す前記セグメントのマッチングモデルとして前記第1のタイプモデルを選択し、いずれの位置又はいずれの位置関係も示さない前記セグメントのマッチングモデルとして前記第3のタイプモデルを選択するステップを含む、請求項6に記載の方法。
  8. 前記位置関係は方向関係を含み、且つ前記第2のタイプモデルは前記方向モデルを含み、前記方向モデルは前記第2の地図領域と前記方向関係を示す前記第2のタイプテキストとを入力として、前記第2の地図領域の方向での前記第2の更新領域を出力するように構成される、請求項3に記載の方法。
  9. 前記N個のセグメントのうちのそれぞれのセグメントについて、前記各セグメントの意味に基づいて前記第1のタイプモデルと前記第2のタイプモデルを含む複数のモデルの中から前記マッチングモデルを選択するステップは、
    前記各セグメントの前記意味に基づいて、分類器によって前記N個のセグメントのうちのそれぞれのセグメントのタイプを決定するステップと、
    前記各セグメントのタイプと前記モデルのタイプに基づいて、前記各セグメントのマッチングモデルを決定するステップとを含む、請求項3に記載の方法。
  10. 前記地図中の目的地に基づいてロボットを移動制御するステップをさらに含む、請求項1に記載の方法。
  11. ユーザ入力に基づいて前記テキストを取得し、前記ユーザ入力は音声、キーボードによる入力、センサによる入力又はタッチスクリーンによる入力のうちの少なくとも1つを含む、請求項1に記載の方法。
  12. 地図上の目的地の決定機器であって、
    1つの又は複数のプロセッサと、
    前記1つの又は複数のプロセッサによって実行可能な命令を記憶することで前記機器に以下の操作を実行させるメモリとを含み、前記操作は、
    テキストのN個のセグメントを取得することであって、Nは1よりも大きい整数であることと、
    前記テキストの前記N個のセグメントの間の文法的な関係に基づいて、前記N個のセグメントの再帰的順序を決定することと、
    前記N個のセグメントのうちのそれぞれのセグメントについて、前記各セグメントの意味に基づいて複数のモデルの中からマッチングモデルを選択することであって、前記各セグメントのマッチングモデルは全て入力テキストと前記地図の入力領域を入力として、前記入力テキストの意味と前記入力領域に基づいて前記地図の更新領域を出力するように構成されることと、
    前記再帰的順序に従って、前記各セグメントを、前記地図の初期領域又は前記マッチングモデルによって前記再帰的順序における前記各セグメントの前のセグメントについて出力される更新領域とともに前記各セグメントのマッチングモデルに入力することと、
    前記マッチングモデルによって前記再帰的順序における最後のセグメントについて出力される前記更新領域を前記地図中の目的地として使用することとを含む、機器。
  13. 前記文法的な関係に基づいて前記N個のセグメントの再帰的順序を決定するステップは、
    前記N個のセグメントの中から前置詞セグメントの前の名詞主語セグメント、前記前置詞セグメント及び前記前置詞セグメントの目的語セグメントを決定するステップと、
    前記名詞主語セグメントを前記再帰的順序における第1のセグメントとして決定し、前記前置詞セグメントを前記再帰的順序における前記第2のセグメントとして決定し、前記目的語セグメントを前記再帰的順序における前記第3のセグメントとして決定するステップとを含む、請求項12に記載の機器。
  14. 前記N個のセグメントは位置を示すセグメントと位置関係を示すセグメントを含み、
    前記複数のモデルは第1のタイプモデルと第2のタイプモデルを含み、前記第1のタイプモデルは、第1の地図領域と前記位置を示す第1のタイプテキストを入力として、前記第1の地図領域内の第1の更新領域を出力するように構成され、前記第2のタイプモデルは、第2の地図領域と前記位置関係を示す第2のタイプテキストを入力として、前記第2の地図領域と前記位置関係に基づいて第2の更新領域を出力するように構成され、
    前記再帰的順序に従って、前記各セグメントを、前記地図の初期領域又は前記マッチングモデルによって前記再帰的順序における前記各セグメントの前のセグメントについて出力される更新領域とともに前記各セグメントのマッチングモデルに入力するステップは、
    前記再帰的順序における第1のセグメントと前記地図の初期領域を前記第1のセグメントのマッチングモデルに入力することにより、第1の更新領域を取得するステップと、
    前記再帰的順序における第2のセグメント~第Nのセグメントのうちの前記各セグメントについて、前記各セグメントと前記マッチングモデルによって前記再帰的順序における前記各セグメントの前のセグメントについて出力される前記更新領域とを前記各セグメントのマッチングモデルに入力することにより、前記各セグメントの更新領域を取得するステップとを含む、請求項12に記載の機器。
  15. 前記位置関係は近接関係を含み、且つ前記第2のタイプモデルは近接度モデルを含み、前記近接度モデルは、前記第2の地図領域と前記近接関係を示す前記第2のタイプテキストとを入力として、前記第2の地図領域に近接する前記第2の更新領域を出力するように構成される、請求項14に記載の機器。
  16. 前記位置関係は方向関係を含み、且つ前記第2のタイプモデルは方向モデルを含み、前記方向モデルは、前記第2の地図領域と前記方向関係を示す前記第2のタイプテキストとを入力として、前記第2の地図領域の方向での前記第2の更新領域を出力するように構成される、請求項14に記載の機器。
  17. 前記複数のモデルは第3のタイプモデルを含み、前記第3のタイプモデルは、第3の地図領域と第3のタイプテキストを入力として、前記第3の地図領域を出力するように構成され、前記第3のタイプテキストはいずれの位置又はいずれの位置関係も示さない、請求項16に記載の機器。
  18. 前記テキストのN個のセグメントを取得するステップは、前記位置を示す前記セグメント、方向を示すセグメント、近接度を示すセグメント、及びいずれの位置又はいずれの位置関係も示さないセグメントを取得することを含み、
    前記N個のセグメントのうちのそれぞれのセグメントについて、前記各セグメントの意味に基づいて前記第1のタイプモデルと前記第2のタイプモデルを含む複数のモデルの中からマッチングモデルを選択するステップは、
    前記位置を示す前記セグメントのマッチングモデルとして前記第1のタイプモデルを選択し、前記方向を示す前記セグメントのマッチングモデルとして前記方向モデルを選択し、前記位置を示す前記セグメントのマッチングモデルとして前記第1のタイプモデルを選択し、いずれの位置又はいずれの位置関係も示さない前記セグメントのマッチングモデルとして前記第3のタイプモデルを選択するステップを含む、請求項17に記載の機器。
  19. 前記操作は、前記地図中の目的地に基づいてロボットを移動制御することをさらに含む、請求項12に記載の機器。
  20. 命令を記憶する一時的なコンピュータ読み取り可能な記憶媒体であって、前記命令はプロセッサによって実行されることで前記プロセッサに操作を実行させ、前記操作は、
    テキストのN個のセグメントを取得することであって、Nは1よりも大きい整数であることと、
    前記テキストの前記N個のセグメントの間の文法的な関係に基づいて、前記N個のセグメントの再帰的順序を決定することと、
    前記N個のセグメントのうちのそれぞれのセグメントについて、前記各セグメントの意味に基づいて複数のモデルの中からマッチングモデルを選択することであって、前記各セグメントのマッチングモデルは全て入力テキストと前記地図の入力領域を入力として、前記入力テキストの意味と前記入力領域に基づいて前記地図の更新領域を出力するように構成されることと、
    前記再帰的順序に従って、前記各セグメントを、前記地図の初期領域又は前記マッチングモデルによって前記再帰的順序における前記各セグメントの前のセグメントについて出力される更新領域とともに前記各セグメントのマッチングモデルに入力することと、
    前記マッチングモデルによって前記再帰的順序における最後のセグメントについて出力される前記更新領域を前記地図中の目的地として使用することとを含む、一時的なコンピュータ読み取り可能な記憶媒体。
  21. コンピュータプログラムであって、プロセッサにより実行されると、請求項1~11の何れか一項に記載の方法を実行するコンピュータプログラム。

JP2021106993A 2020-12-30 2021-06-28 地図上の目的地の決定方法、機器、及び記憶媒体 Active JP7198312B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US17/138,380 2020-12-30
US17/138,380 US20220207235A1 (en) 2020-12-30 2020-12-30 Method, apparatus and storage medium for determining destination on map

Publications (2)

Publication Number Publication Date
JP2022006166A true JP2022006166A (ja) 2022-01-12
JP7198312B2 JP7198312B2 (ja) 2022-12-28

Family

ID=76522771

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021106993A Active JP7198312B2 (ja) 2020-12-30 2021-06-28 地図上の目的地の決定方法、機器、及び記憶媒体

Country Status (5)

Country Link
US (1) US20220207235A1 (ja)
EP (1) EP3872677A3 (ja)
JP (1) JP7198312B2 (ja)
KR (1) KR20210089604A (ja)
CN (1) CN113535869A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113672727B (zh) * 2021-07-28 2024-04-05 重庆大学 一种金融文本实体关系抽取方法及系统
CN116663938B (zh) * 2023-07-28 2023-12-12 珠海大横琴泛旅游发展有限公司 基于企业数据中台系统的信息化管理方法及其相关装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016524736A (ja) * 2013-04-17 2016-08-18 トムトム ナビゲーション ベスローテン フエンノートシャップTomTom Navigation B.V. デジタル地図に関連する場所の探索及び表示を容易にする方法、装置及びコンピュータソフトウェア
CN111859060A (zh) * 2020-01-10 2020-10-30 北京嘀嘀无限科技发展有限公司 一种信息查询方法、装置、电子设备和可读存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10073834B2 (en) * 2016-02-09 2018-09-11 International Business Machines Corporation Systems and methods for language feature generation over multi-layered word representation
CN106528526B (zh) * 2016-10-09 2019-05-28 武汉工程大学 一种基于贝叶斯分词算法的中文地址语义标注方法
CN108304411B (zh) * 2017-01-13 2020-08-18 中国移动通信集团辽宁有限公司 地理位置语句的语义识别方法和装置
US11151992B2 (en) * 2017-04-06 2021-10-19 AIBrain Corporation Context aware interactive robot
CN110928302A (zh) * 2019-11-29 2020-03-27 华中科技大学 一种人机协同自然语言空间导航方法及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016524736A (ja) * 2013-04-17 2016-08-18 トムトム ナビゲーション ベスローテン フエンノートシャップTomTom Navigation B.V. デジタル地図に関連する場所の探索及び表示を容易にする方法、装置及びコンピュータソフトウェア
CN111859060A (zh) * 2020-01-10 2020-10-30 北京嘀嘀无限科技发展有限公司 一种信息查询方法、装置、电子设备和可读存储介质

Also Published As

Publication number Publication date
JP7198312B2 (ja) 2022-12-28
US20220207235A1 (en) 2022-06-30
KR20210089604A (ko) 2021-07-16
EP3872677A3 (en) 2022-01-05
CN113535869A (zh) 2021-10-22
EP3872677A2 (en) 2021-09-01

Similar Documents

Publication Publication Date Title
JP7166322B2 (ja) モデルを訓練するための方法、装置、電子機器、記憶媒体およびコンピュータプログラム
JP7317791B2 (ja) エンティティ・リンキング方法、装置、機器、及び記憶媒体
KR101886373B1 (ko) 딥러닝 인공신경망 기반의 타스크 제공 플랫폼
KR20210040319A (ko) 엔티티 링킹 방법, 장치, 기기, 저장 매체 및 컴퓨터 프로그램
JP7108675B2 (ja) 意味マッチング方法、装置、電子機器、記憶媒体及びコンピュータプログラム
JP2022547704A (ja) 訓練を減らした意図認識技術
US11769018B2 (en) System and method for temporal attention behavioral analysis of multi-modal conversations in a question and answer system
JP2021182430A (ja) 意味解析モデルのトレーニング方法及び装置、電子機器並びに記憶媒体
CN110599557A (zh) 图像描述生成方法、模型训练方法、设备和存储介质
US20220138432A1 (en) Relying on discourse analysis to answer complex questions by neural machine reading comprehension
JP7200277B2 (ja) ワードスロットを識別するための方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム
CN111898636B (zh) 一种数据处理方法及装置
JP2021111334A (ja) 検索データに基づくヒューマンコンピュータ対話型インタラクションの方法、装置及び電子機器
JP2022505015A (ja) 知識グラフのベクトル表現生成方法、装置及び電子機器
EP4113357A1 (en) Method and apparatus for recognizing entity, electronic device and storage medium
JP2022006166A (ja) 地図上の目的地の決定方法、機器、及び記憶媒体
WO2023040742A1 (zh) 文本数据的处理方法、神经网络的训练方法以及相关设备
CN113392197A (zh) 问答推理方法、装置、存储介质及电子设备
CN112559715B (zh) 态度的识别方法、装置、设备及存储介质
CN112507705B (zh) 一种位置编码的生成方法、装置及电子设备
CN112069813B (zh) 文本处理方法、装置、设备及计算机可读存储介质
KR102440635B1 (ko) 음성 패킷 녹취 기능의 안내 방법, 장치, 기기 및 컴퓨터 저장 매체
JP2022106980A (ja) クエリ文の生成方法、装置、電子機器及び記憶媒体
CN114791950A (zh) 基于词性位置与图卷积网络的方面级情感分类方法及装置
KR20210087903A (ko) 자연어에 기반하는 실내 자율 내비게이팅

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210628

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220906

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221129

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221213

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221216

R150 Certificate of patent or registration of utility model

Ref document number: 7198312

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150