JP7198312B2 - 地図上の目的地の決定方法、機器、及び記憶媒体 - Google Patents
地図上の目的地の決定方法、機器、及び記憶媒体 Download PDFInfo
- Publication number
- JP7198312B2 JP7198312B2 JP2021106993A JP2021106993A JP7198312B2 JP 7198312 B2 JP7198312 B2 JP 7198312B2 JP 2021106993 A JP2021106993 A JP 2021106993A JP 2021106993 A JP2021106993 A JP 2021106993A JP 7198312 B2 JP7198312 B2 JP 7198312B2
- Authority
- JP
- Japan
- Prior art keywords
- segment
- model
- map
- region
- type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 38
- 238000003860 storage Methods 0.000 title claims description 9
- 230000015654 memory Effects 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims 1
- 230000006870 function Effects 0.000 description 18
- 239000003607 modifier Substances 0.000 description 10
- 238000012549 training Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 6
- 238000009826 distribution Methods 0.000 description 6
- 238000010606 normalization Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/387—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/907—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/909—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1815—Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/02—Control of position or course in two dimensions
- G05D1/021—Control of position or course in two dimensions specially adapted to land vehicles
- G05D1/0268—Control of position or course in two dimensions specially adapted to land vehicles using internal positioning means
- G05D1/0274—Control of position or course in two dimensions specially adapted to land vehicles using internal positioning means using mapping information stored in a memory device
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Mathematical Physics (AREA)
- Library & Information Science (AREA)
- Remote Sensing (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Instructional Devices (AREA)
Description
ステップ102:テキストのN個のセグメントの間の文法的な関係に基づいて、N個のセグメントの再帰的順序を決定する。
ここで、fθ*はθをパラメータとする基盤関数を示し、b0はダミー信頼度又は地図m全体にまたがる初期分布を示す。いくつかの実施形態では、等式(1)と等式(3)は同一関数を共用する。
表I
更新タイプ
ここで、kはupobjとuprepの総数を示す。いくつかの実施形態では、テキストは文法に関連するセグメント(uk)のシーケンスに分解され、且つシーケンスのそれぞれは再帰的に適用されて、信頼度bの概念を更新する。
と分類器
が構築される。等式(4)の更新関数は次のように表現できる。
ここで、II(α)はインジケータ関数である。分類器cはニューラルネットワークを示し、次のように定義される。
ここで、Φcはゲート付き回帰ユニット(GRU)層により抽出された隠れ状態を示し、且つWcはGRUの隠れ状態を生の分類重みにマッチングさせる線形層の重みを指す。図6は本開示のいくつかの実施形態に係る複数のモデルの更新関数のセマンティクス図示を示す。正確なモデル、方向モデル、近接度モデル及びダミーモデルの更新関数は次のように記述される。
いくつかの実施形態では、地図m∈Mは1グループの関心のある領域
に分けられ、各領域は地図境界B0内に境界Biを有する。各領域aiは一般的に言及される文字列のタプル(例えば、一意の領域id、領域カテゴリ及び領域名称(適用の場合))に関連付けられ、且つ各関心のあるの領域には多くともN個の単語が割り当てられる。
で示される地図情報の行列表現である。Sは関心のある領域の数である。Nは領域記述子内のトークンの数を指す。Hは単語の埋め込みの次元である。いくつかの実施形態では、修飾語ukは埋め込み行列
として符号化される。いくつかの実施形態では、正確なモデルはSレベルの分類問題として形成され、地図中内の全ての領域で定義された離散分布wkを生成する。各領域aiの計算は次のとおりである。
ここで、γk、
及びwk-1は次のように解釈する方向スケーリング係数、修飾語-地図注意、及び先験重みを示し、ηは正規化係数を指す。次に、wk(i)を境界Biにより示される地図上の領域に割り当て、次に地図全体にわたり正規化を行うことで完全信頼度bkを回復することができる。
ここで、σはシグモイド関数であり、xiは領域aiの重心であり、B0は地図の境界であり、eαkは予測される方向αk∈[-π,π]の単位方向ベクトルであり、κk∈[0,1]はukに方向が使用されているか否かを示す訓練可能な変数であり、βkはγkのスケーリングファクターを調整する整形係数であり、εは正の定数である。方向形容詞が使用されている場合、κkは1としてラベル付けられ、γkは指数形式で表示され、該指数形式のγkは、各領域aiの重心の予測方向に沿った投影に従って各領域aiを加重する。柔軟性を高めるために、βkはオフセットして追加される。方向形容詞が含まれていない場合、κkは0としてラベル付けられ、且つ全てのaiについてγk(i)はεにプッシュされ、それにより、この判別項をキャンセルする。等式中、(9)のxi及びbi以外の全ての項は全ての領域重みにより共有され、学習可能な関数により次のように計算され得る。
ここで、ф*はGRU層により抽出された隠れ状態を示し、且つW*はスカラー出力を生成する線形層の重みである。
等式(8)中の注意項
は次のように示される。
ここで、
は正規化係数であり、
は領域aiに割り当てられた第j単語の埋め込みを指し、
は修飾語
における第l単語の埋め込みを示す、該項は、予め定義された領域情報と修飾語ukの間のマッチング単語ペアをカウントすることにより、各領域aiを加重する。正規化された埋め込みドット積を閾値λでフィルタリングすることで単語のマッチングをチェックする。
近接関係に関する前置詞が存在する場合、後験は先験を中心とするガウス分布として表され、先験の領域サイズに比例する分散が割り当てられる。次に更新関数は次のように表現される。
ここで、xk-1と|Bk-1|は先験bk-1により示される領域の重心座標とサイズであり、且つρはスケーリング定数である。
形容詞として使用されることに加えて、方向詞(例えば、「北」)、例えば、「会議室202の北」は主語として直接使用可能である。いくつかの実施形態では、先験はガウス分布で表わされるが、該分布は信頼度のみをukと一致に維持する追加のマスクが設定されている。図6の図示の説明を参照する。更新関数は次のように表現され得る。
ここで、eαkは有効方向αkの単位方向ベクトルである。Nk-1は等式(13)と同じ形式を採用する。Cos(・,・)は余弦相似度である。いくつかの実施形態では、αkは、次のように、等式(10)と類似した学習可能な変数として示される。
いくつかの実施形態では、ダミーモデル関数は同一のマッチングである。
いくつかの実施形態では、バックプロパゲーションによる特定タイプの損失を最小化させることによって、学習可能な関数を訓練することができる。いくつかの実施形態では、訓練用の地図は一般的な作業領域、会議室や、例えば娯楽領域などの指定領域からなる事務室の間取り図である。いくつかの実施形態では、部屋や指定領域などの既存の空間構造を再利用することに加えて、廊下などの一般的な公共空間も分割される。いくつかの実施形態では、地図全体は指定属性を有する80個の領域に分割される。まとめられた領域属性は表IIに示す。
表II
領域属性及び修飾語辞書
いくつかの実施形態では、3200個の更新サンプルは訓練に用いられる。各更新関数に基本訓練サンプルを生成するプロセスは前記のとおりである。
表III
修飾語生成規則
方向αkについて、限界l2損失は次のように使用される。
インジケータκkについて、クロスエントロピー損失κkは次のように使用される。
Claims (21)
- コンピュータが実行する地図上の目的地の決定方法であって、
テキストのN個のセグメントを取得するステップであって、Nは1よりも大きい整数であるステップと、
前記テキストのN個のセグメントの間の文法的な関係に基づいて、前記N個のセグメントの再帰的順序を決定するステップと、
前記N個のセグメントのうちのそれぞれのセグメントについて、前記各セグメントの意味に基づいて複数のモデルの中からマッチングモデルを選択するステップであって、前記各セグメントのマッチングモデルは全て入力テキストと前記地図の入力領域を入力として、前記入力テキストの意味と前記入力領域に基づいて前記地図の更新領域を出力するように構成されるステップと、
前記再帰的順序に従って、前記各セグメントを、前記地図の初期領域又は前記マッチングモデルによって前記再帰的順序における前記各セグメントの前のセグメントについて出力される更新領域とともに前記各セグメントのマッチングモデルに入力するステップと、
前記マッチングモデルによって前記再帰的順序における最後のセグメントについて出力される前記更新領域を前記地図中の目的地として使用するステップとを含む方法。 - 前記文法的な関係に基づいて前記N個のセグメントの再帰的順序を決定するステップは、
前記N個のセグメントの中から前置詞セグメントの前の名詞主語セグメント、前記前置詞セグメント及び前記前置詞セグメントの目的語セグメントを決定するステップと、
前記名詞主語セグメントを前記再帰的順序における第1のセグメントとして決定し、前記前置詞セグメントを前記再帰的順序における第2のセグメントとして決定し、前記目的語セグメントを前記再帰的順序における第3のセグメントとして決定するステップとを含む、請求項1に記載の方法。 - 前記N個のセグメントは位置を示すセグメントと位置関係を示すセグメントを含み、
前記複数のモデルは第1のタイプモデルと第2のタイプモデルを含み、
前記第1のタイプモデルは、第1の地図領域と前記位置を示す第1のタイプテキストを入力として、前記第1の地図領域内の第1の更新領域を出力するように構成され、
前記第2のタイプモデルは、第2の地図領域と前記位置関係を示す第2のタイプテキストを入力として、前記第2の地図領域と前記位置関係に基づいて第2の更新領域を出力するように構成され、
前記再帰的順序に従って、前記各セグメントを、前記地図の初期領域又は前記マッチングモデルによって前記再帰的順序における前記各セグメントの前のセグメントについて出力される更新領域とともに前記各セグメントのマッチングモデルに入力するステップは、
前記再帰的順序における第1のセグメントと前記地図の初期領域を前記第1のセグメントのマッチングモデルに入力することにより、前記第1の更新領域を取得するステップと、
前記再帰的順序における第2のセグメント~第Nのセグメントのうちの前記各セグメントについて、前記各セグメントと前記マッチングモデルによって前記再帰的順序における前記各セグメントの前のセグメントについて出力される前記更新領域とを前記各セグメントのマッチングモデルに入力することにより、前記各セグメントの更新領域を取得するステップとを含む、請求項1に記載の方法。 - 前記位置関係は近接関係を含み、且つ前記第2のタイプモデルは近接度モデルを含み、前記近接度モデルは、前記第2の地図領域と前記近接関係を示す前記第2のタイプテキストとを入力として、前記第2の地図領域に近接する前記第2の更新領域を出力するように構成される、請求項3に記載の方法。
- 前記位置関係は方向関係を含み、且つ前記第2のタイプモデルは方向モデルを含み、前記方向モデルは、前記第2の地図領域と前記方向関係を示す前記第2のタイプテキストとを入力として、前記第2の地図領域の方向での前記第2の更新領域を出力するように構成される、請求項4に記載の方法。
- 前記複数のモデルは第3のタイプモデルを含み、前記第3のタイプモデルは第3の地図領域と第3のタイプテキストを入力として、前記第3の地図領域を出力するように構成され、前記第3のタイプテキストはいずれの位置又はいずれの位置関係も示さない、請求項5に記載の方法。
- 前記テキストのN個のセグメントを取得するステップは、前記位置を示す前記セグメント、方向を示すセグメント、近接度を示すセグメント、及びいずれの位置又はいずれの位置関係も示さないセグメントを取得することを含み、
前記N個のセグメントのうちのそれぞれのセグメントについて、前記各セグメントの意味に基づいて前記第1のタイプモデルと前記第2のタイプモデルを含む複数のモデルの中からマッチングモデルを選択するステップは、
前記位置を示す前記セグメントのマッチングモデルとして前記第1のタイプモデルを選択し、前記方向を示す前記セグメントのマッチングモデルとして前記方向モデルを選択し、前記位置を示す前記セグメントのマッチングモデルとして前記第1のタイプモデルを選択し、いずれの位置又はいずれの位置関係も示さない前記セグメントのマッチングモデルとして前記第3のタイプモデルを選択するステップを含む、請求項6に記載の方法。 - 前記位置関係は方向関係を含み、且つ前記第2のタイプモデルは方向モデルを含み、前記方向モデルは前記第2の地図領域と前記方向関係を示す前記第2のタイプテキストとを入力として、前記第2の地図領域の方向での前記第2の更新領域を出力するように構成される、請求項3に記載の方法。
- 前記N個のセグメントのうちのそれぞれのセグメントについて、前記各セグメントの意味に基づいて前記第1のタイプモデルと前記第2のタイプモデルを含む複数のモデルの中から前記マッチングモデルを選択するステップは、
前記各セグメントの前記意味に基づいて、分類器によって前記N個のセグメントのうちのそれぞれのセグメントのタイプを決定するステップと、
前記各セグメントのタイプと前記モデルのタイプに基づいて、前記各セグメントのマッチングモデルを決定するステップとを含む、請求項3に記載の方法。 - 前記地図中の目的地に基づいてロボットを移動制御するステップをさらに含む、請求項1に記載の方法。
- ユーザ入力に基づいて前記テキストを取得し、前記ユーザ入力は音声、キーボードによる入力、センサによる入力又はタッチスクリーンによる入力のうちの少なくとも1つを含む、請求項1に記載の方法。
- 地図上の目的地の決定機器であって、
1つの又は複数のプロセッサと、
前記1つの又は複数のプロセッサによって実行可能な命令を記憶することで前記決定機器に以下の操作を実行させるメモリとを含み、前記操作は、
テキストのN個のセグメントを取得することであって、Nは1よりも大きい整数であることと、
前記テキストの前記N個のセグメントの間の文法的な関係に基づいて、前記N個のセグメントの再帰的順序を決定することと、
前記N個のセグメントのうちのそれぞれのセグメントについて、前記各セグメントの意味に基づいて複数のモデルの中からマッチングモデルを選択することであって、前記各セグメントのマッチングモデルは全て入力テキストと前記地図の入力領域を入力として、前記入力テキストの意味と前記入力領域に基づいて前記地図の更新領域を出力するように構成されることと、
前記再帰的順序に従って、前記各セグメントを、前記地図の初期領域又は前記マッチングモデルによって前記再帰的順序における前記各セグメントの前のセグメントについて出力される更新領域とともに前記各セグメントのマッチングモデルに入力することと、
前記マッチングモデルによって前記再帰的順序における最後のセグメントについて出力される前記更新領域を前記地図中の目的地として使用することとを含む、機器。 - 前記文法的な関係に基づいて前記N個のセグメントの再帰的順序を決定するステップは、
前記N個のセグメントの中から前置詞セグメントの前の名詞主語セグメント、前記前置詞セグメント及び前記前置詞セグメントの目的語セグメントを決定するステップと、
前記名詞主語セグメントを前記再帰的順序における第1のセグメントとして決定し、前記前置詞セグメントを前記再帰的順序における第2のセグメントとして決定し、前記目的語セグメントを前記再帰的順序における第3のセグメントとして決定するステップとを含む、請求項12に記載の機器。 - 前記N個のセグメントは位置を示すセグメントと位置関係を示すセグメントを含み、
前記複数のモデルは第1のタイプモデルと第2のタイプモデルを含み、前記第1のタイプモデルは、第1の地図領域と前記位置を示す第1のタイプテキストを入力として、前記第1の地図領域内の第1の更新領域を出力するように構成され、前記第2のタイプモデルは、第2の地図領域と前記位置関係を示す第2のタイプテキストを入力として、前記第2の地図領域と前記位置関係に基づいて第2の更新領域を出力するように構成され、
前記再帰的順序に従って、前記各セグメントを、前記地図の初期領域又は前記マッチングモデルによって前記再帰的順序における前記各セグメントの前のセグメントについて出力される更新領域とともに前記各セグメントのマッチングモデルに入力するステップは、
前記再帰的順序における第1のセグメントと前記地図の初期領域を前記第1のセグメントのマッチングモデルに入力することにより、第1の更新領域を取得するステップと、
前記再帰的順序における第2のセグメント~第Nのセグメントのうちの前記各セグメントについて、前記各セグメントと前記マッチングモデルによって前記再帰的順序における前記各セグメントの前のセグメントについて出力される前記更新領域とを前記各セグメントのマッチングモデルに入力することにより、前記各セグメントの更新領域を取得するステップとを含む、請求項12に記載の機器。 - 前記位置関係は近接関係を含み、且つ前記第2のタイプモデルは近接度モデルを含み、前記近接度モデルは、前記第2の地図領域と前記近接関係を示す前記第2のタイプテキストとを入力として、前記第2の地図領域に近接する前記第2の更新領域を出力するように構成される、請求項14に記載の機器。
- 前記位置関係は方向関係を含み、且つ前記第2のタイプモデルは方向モデルを含み、前記方向モデルは、前記第2の地図領域と前記方向関係を示す前記第2のタイプテキストとを入力として、前記第2の地図領域の方向での前記第2の更新領域を出力するように構成される、請求項14に記載の機器。
- 前記複数のモデルは第3のタイプモデルを含み、前記第3のタイプモデルは、第3の地図領域と第3のタイプテキストを入力として、前記第3の地図領域を出力するように構成され、前記第3のタイプテキストはいずれの位置又はいずれの位置関係も示さない、請求項16に記載の機器。
- 前記テキストのN個のセグメントを取得するステップは、前記位置を示す前記セグメント、方向を示すセグメント、近接度を示すセグメント、及びいずれの位置又はいずれの位置関係も示さないセグメントを取得することを含み、
前記N個のセグメントのうちのそれぞれのセグメントについて、前記各セグメントの意味に基づいて前記第1のタイプモデルと前記第2のタイプモデルを含む複数のモデルの中からマッチングモデルを選択するステップは、
前記位置を示す前記セグメントのマッチングモデルとして前記第1のタイプモデルを選択し、前記方向を示す前記セグメントのマッチングモデルとして前記方向モデルを選択し、前記位置を示す前記セグメントのマッチングモデルとして前記第1のタイプモデルを選択し、いずれの位置又はいずれの位置関係も示さない前記セグメントのマッチングモデルとして前記第3のタイプモデルを選択するステップを含む、請求項17に記載の機器。 - 前記操作は、前記地図中の目的地に基づいてロボットを移動制御することをさらに含む、請求項12に記載の機器。
- 命令を記憶する一時的なコンピュータ読み取り可能な記憶媒体であって、前記命令は地図上の目的地を決定するプロセッサによって実行されることで前記プロセッサに操作を実行させ、前記操作は、
テキストのN個のセグメントを取得することであって、Nは1よりも大きい整数であることと、
前記テキストの前記N個のセグメントの間の文法的な関係に基づいて、前記N個のセグメントの再帰的順序を決定することと、
前記N個のセグメントのうちのそれぞれのセグメントについて、前記各セグメントの意味に基づいて複数のモデルの中からマッチングモデルを選択することであって、前記各セグメントのマッチングモデルは全て入力テキストと前記地図の入力領域を入力として、前記入力テキストの意味と前記入力領域に基づいて前記地図の更新領域を出力するように構成されることと、
前記再帰的順序に従って、前記各セグメントを、前記地図の初期領域又は前記マッチングモデルによって前記再帰的順序における前記各セグメントの前のセグメントについて出力される更新領域とともに前記各セグメントのマッチングモデルに入力することと、
前記マッチングモデルによって前記再帰的順序における最後のセグメントについて出力される前記更新領域を前記地図中の目的地として使用することとを含む、一時的なコンピュータ読み取り可能な記憶媒体。 - コンピュータプログラムであって、プロセッサにより実行されると、請求項1~11の何れか一項に記載の方法を実行するコンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US17/138,380 US20220207235A1 (en) | 2020-12-30 | 2020-12-30 | Method, apparatus and storage medium for determining destination on map |
US17/138,380 | 2020-12-30 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022006166A JP2022006166A (ja) | 2022-01-12 |
JP7198312B2 true JP7198312B2 (ja) | 2022-12-28 |
Family
ID=76522771
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021106993A Active JP7198312B2 (ja) | 2020-12-30 | 2021-06-28 | 地図上の目的地の決定方法、機器、及び記憶媒体 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20220207235A1 (ja) |
EP (1) | EP3872677A3 (ja) |
JP (1) | JP7198312B2 (ja) |
CN (1) | CN113535869A (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016524736A (ja) | 2013-04-17 | 2016-08-18 | トムトム ナビゲーション ベスローテン フエンノートシャップTomTom Navigation B.V. | デジタル地図に関連する場所の探索及び表示を容易にする方法、装置及びコンピュータソフトウェア |
CN111859060A (zh) | 2020-01-10 | 2020-10-30 | 北京嘀嘀无限科技发展有限公司 | 一种信息查询方法、装置、电子设备和可读存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10073834B2 (en) * | 2016-02-09 | 2018-09-11 | International Business Machines Corporation | Systems and methods for language feature generation over multi-layered word representation |
CN106528526B (zh) * | 2016-10-09 | 2019-05-28 | 武汉工程大学 | 一种基于贝叶斯分词算法的中文地址语义标注方法 |
CN108304411B (zh) * | 2017-01-13 | 2020-08-18 | 中国移动通信集团辽宁有限公司 | 地理位置语句的语义识别方法和装置 |
US11151992B2 (en) * | 2017-04-06 | 2021-10-19 | AIBrain Corporation | Context aware interactive robot |
CN110928302A (zh) * | 2019-11-29 | 2020-03-27 | 华中科技大学 | 一种人机协同自然语言空间导航方法及系统 |
-
2020
- 2020-12-30 US US17/138,380 patent/US20220207235A1/en not_active Abandoned
-
2021
- 2021-06-15 EP EP21179402.9A patent/EP3872677A3/en active Pending
- 2021-06-22 CN CN202110691321.0A patent/CN113535869A/zh active Pending
- 2021-06-28 JP JP2021106993A patent/JP7198312B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016524736A (ja) | 2013-04-17 | 2016-08-18 | トムトム ナビゲーション ベスローテン フエンノートシャップTomTom Navigation B.V. | デジタル地図に関連する場所の探索及び表示を容易にする方法、装置及びコンピュータソフトウェア |
CN111859060A (zh) | 2020-01-10 | 2020-10-30 | 北京嘀嘀无限科技发展有限公司 | 一种信息查询方法、装置、电子设备和可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
KR20210089604A (ko) | 2021-07-16 |
EP3872677A2 (en) | 2021-09-01 |
US20220207235A1 (en) | 2022-06-30 |
EP3872677A3 (en) | 2022-01-05 |
CN113535869A (zh) | 2021-10-22 |
JP2022006166A (ja) | 2022-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7317791B2 (ja) | エンティティ・リンキング方法、装置、機器、及び記憶媒体 | |
JP7166322B2 (ja) | モデルを訓練するための方法、装置、電子機器、記憶媒体およびコンピュータプログラム | |
JP7400007B2 (ja) | 複数の言語タスク階層を通じてデータを処理するための深層ニューラルネットワークモデル | |
JP7398402B2 (ja) | 実体リンキング方法、装置、電子機器、記憶媒体およびコンピュータプログラム | |
CN108334487B (zh) | 缺失语意信息补全方法、装置、计算机设备和存储介质 | |
EP4028932B1 (en) | Reduced training intent recognition techniques | |
JP7108675B2 (ja) | 意味マッチング方法、装置、電子機器、記憶媒体及びコンピュータプログラム | |
US11769018B2 (en) | System and method for temporal attention behavioral analysis of multi-modal conversations in a question and answer system | |
CN111951805A (zh) | 一种文本数据处理方法及装置 | |
JP7301922B2 (ja) | 意味検索方法、装置、電子機器、記憶媒体およびコンピュータプログラム | |
EP3852000A1 (en) | Method and apparatus for processing semantic description of text entity, device and storage medium | |
JP2022003539A (ja) | テキスト誤り訂正方法、装置、電子機器及び記憶媒体 | |
US20220138432A1 (en) | Relying on discourse analysis to answer complex questions by neural machine reading comprehension | |
JP7133002B2 (ja) | 句読点予測方法および装置 | |
WO2022001724A1 (zh) | 一种数据处理方法及装置 | |
JP2021111334A (ja) | 検索データに基づくヒューマンコンピュータ対話型インタラクションの方法、装置及び電子機器 | |
Wodziński et al. | Sequential classification of palm gestures based on A* algorithm and MLP neural network for quadrocopter control | |
CN117296058A (zh) | 作为简单有效的对抗攻击方法的变体不一致攻击(via) | |
JP2022106980A (ja) | クエリ文の生成方法、装置、電子機器及び記憶媒体 | |
US20210312173A1 (en) | Method, apparatus and device for recognizing bill and storage medium | |
JP7169770B2 (ja) | 人工知能プログラミングサーバおよびそのプログラム | |
JP7198312B2 (ja) | 地図上の目的地の決定方法、機器、及び記憶媒体 | |
WO2023116572A1 (zh) | 一种词句生成方法及相关设备 | |
JP7352640B2 (ja) | 検索項目書き換え方法、装置、機器および記憶媒体 | |
KR102683574B1 (ko) | 맵 상의 종착지를 결정하는 방법, 기기 및 저장매체 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210628 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220906 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221129 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221213 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221216 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7198312 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |