JP2015524096A - 音声制御ナビゲーション・システム用のランドマークに基づく場所思考追跡 - Google Patents

音声制御ナビゲーション・システム用のランドマークに基づく場所思考追跡 Download PDF

Info

Publication number
JP2015524096A
JP2015524096A JP2015510440A JP2015510440A JP2015524096A JP 2015524096 A JP2015524096 A JP 2015524096A JP 2015510440 A JP2015510440 A JP 2015510440A JP 2015510440 A JP2015510440 A JP 2015510440A JP 2015524096 A JP2015524096 A JP 2015524096A
Authority
JP
Japan
Prior art keywords
landmark
location
kernel model
candidate
amplitude
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015510440A
Other languages
English (en)
Other versions
JP2015524096A5 (ja
JP6017678B2 (ja
Inventor
ロー、アントワン
グプタ、ラケシュ
ラマチャンドラン、ディーパク
マー、イ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honda Motor Co Ltd
Original Assignee
Honda Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honda Motor Co Ltd filed Critical Honda Motor Co Ltd
Publication of JP2015524096A publication Critical patent/JP2015524096A/ja
Publication of JP2015524096A5 publication Critical patent/JP2015524096A5/ja
Application granted granted Critical
Publication of JP6017678B2 publication Critical patent/JP6017678B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/36Input/output arrangements for on-board computers
    • G01C21/3605Destination input or retrieval
    • G01C21/3608Destination input or retrieval using speech input, e.g. using speech recognition
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/36Input/output arrangements for on-board computers
    • G01C21/3626Details of the output of route guidance instructions
    • G01C21/3644Landmark guidance, e.g. using POIs or conspicuous other objects

Abstract

音声制御ナビゲーション・システム用のランドマークに基づく場所思考追跡技術を提供する。場所属性とランドマークを指定するユーザからの発話が受信され、候補地の組が指定された場所属性に基づいて特定され、信頼度スコアが各候補地について決定される。ランドマークの組が指定されたランドマークに基づいて特定され、かつ、信頼度スコアが該ランドマークに対して決定される。対応するカーネル・モデルが各ランドマークに対して生成される。各カーネル・モデルは、地図上の対応するランドマークの位置を中心とし、該カーネル・モデルの振幅がランドマークの属性、ランドマークの信頼度スコア、ユーザの特性等に基づいて決められる。候補地は、該候補地が重なるカーネル・モデルの振幅、及び、候補地に対応する信頼度スコアに基づいてランク付けされる。候補地は、候補地のランク付けに基づいて選択され、ユーザに提示される。【選択図】図1b

Description

例示用の実施形態は、ヒューマン・マシン対話システムの分野に関し、より詳細には音声制御ナビゲーション・システムにおけるランドマークに基づく、場所思考追跡の実装に関する。
スマート・フォンや車載コンピュータ・システムなどのモバイル機器は、改善された位置ベース・サービスに対する需要を生み出している。そのような需要には、位置ベースの検索、進路変更時ナビゲーション、企業評価へのアクセス、社会的イベントの推薦、などがある。安全規則では、例えば、ユーザが車両を操作している間に、そのような位置ベース・サービスを提供するデバイスのハンズ・フリー操作が必要になる。位置ベース・サービスに発話と対話のみを通じて適時にアクセスすることは、このようなサービスを提供する機器を用いて円滑なユーザ体験を提供するために重要である。
対話システムの位置ベース・サービスと交信するとき、ユーザは、多くの場合、レストラン、店舗、又はその他の公共の場所等の、特定の目的地を指定する必要がある。例えば、車両ナビゲーション・システムは、目的地へ向かう指示を提供する前に目的地を特定するようユーザに要求する。郵便アドレスを、多くの場所を正確に特定するために使用することができるが、郵便アドレスは、不明、又は、例えば車両を操作している最中、ユーザアクセスが困難のいずれかであることが多い。
ユーザが音声で目的地を指定するための自然な手段には、特に、目的地の正確な名前や住所がわかってない、又はすぐに入手できない場合、ランドマークの使用による手段がある。例えば、ユーザは、「メインストリートの近くのイタリア料理のレストラン」、又は「その球場近くのガソリンスタンド」等と指定することができる。ユーザが、ランドマークの使用により場所を特定することが可能な対話システムにより得られるものは、対話システムとユーザとのより簡潔な対話、より良好なシステムの精度と性能、より円滑な機器操作、このような対話システムの機能のユーザ体験の改善、該機能の拡張等である。
ある場所のユーザへの推薦は、受信されたユーザの発話に基づいて行われる。ユーザは発話を行い、かつ、ランドマーク・ナビゲーション・システムは発話を捕えてテキストに変換する。発話では、場所属性とランドマークを指定する。例えば、ユーザは、「テニスコートの近くのガソリンスタンド」と言うことがあろう。この例では、場所属性は、「ガソリンスタンド」であり、ランドマークは「テニスコート」である。ランドマーク・ナビゲーション・システムは、車両、携帯電話、コンピュータ等に実装することができる。なお、用語「場所属性」を本明細書において用いるが、発話で、1つのカテゴリー、サブカテゴリー、ジャンル、チェーン事業者(例えば、「サブウェイ・レストラン」等)、特別な事業者(例えば「メルのサンドイッチ店」など)、記述情報(例えば、「安いレストラン」、又は「小さな食料品店」)、又は、任意の他の場所属性を指定することができる。
候補地の組が、指定された場所属性に基づいて特定される。信頼度スコアを、各々の特定された候補地に対して決定することができる。この信頼度スコアは、候補地が指定された場所属性を表している確度を表している。ランドマークの組が指定されたランドマークに基づいて特定される。同様に、信頼度スコアが、各々のランドマークに対して決定され、該ランドマークが指定されたランドマークを表している確度を表わす。候補地の組とランドマークの組は、少なくとも部分的には、1つ又は複数の対話の繰り返しにわたる意味論的思考追跡を通して特定することができる。
カーネルが前記ランドマークの組の中の各ランドマークに対して生成される。カーネル・モデルは、地図との共平面である基底部を有する3次元モデルであり、かつ、地図上のランドマークの位置に中心が置かれる。カーネル・モデル基底部の形状は、ランドマークのタイプ、地図上のランドマークの形状、又は、ランドマークの他の任意の特性に基づくことができる。カーネル・モデルの振幅は、地図上のランドマークの位置で最大とすることができ、ランドマークからの距離が大きくなるにつれてガウス曲線に従って小さくなる。カーネル・モデルの振幅は、該関係付けられたランドマークの属性、該関係付けられたランドマークのタイプ、該関係付けられたランドマークのタイプの認知度、該関係付けられたランドマークの信頼度スコア、ユーザの位置、発話に含まれる相対的な言葉(例えば、「北の」、「2ブロック離れた」等)、又は、該関係付けられたランドマーク又はユーザの他の任意の特徴に基づくことができる。
候補地が、カーネル・モデルに基づいてランク付けされる。地図上の各候補地の位置における各カーネル・モデルの振幅を決定し、各候補地について合計して、該候補地に対するカーネル・モデルの振幅の合計を生成する。該候補地は、次に、該カーネル・モデル振幅の合計に基づいてランク付けされる。カーネル・モデル振幅の合計は、各候補地に関係付けられた信頼度スコアに基づいて補正することができる。1つの候補地を、候補地のランキングに基づいて選択して、ユーザに、例えば、音声又は表示により提示することができる。
本明細書に記載される特徴及び利点は、すべてを包括している訳ではなく、特に、多くの付加的な特徴及び利点が、図面及び明細書を見れば当業者には明らかになるであろう。さらに留意すべきことは、本明細書で使用される用語が、主として読解のし易さ及び説明目的から選択されており、本発明の主題事項を詳述又は限定するために選択されものではないことである。
1実施形態による、ランドマークに基づく場所思考追跡対話システムを実現するための車両ベース音声起動ナビゲーション・システムを示す図である。
1実施形態による、ランドマーク・ナビゲーションのための処理の概要を示す図である。
1実施形態による、ランドマークに基づく場所思考追跡対話システムを実現するためのランドマーク・ナビゲーション・システムを示す図である。
1実施形態による、地図上に生成されたカーネル・モデルの例を示す図である。
1実施形態による、候補地の例に対するカーネル・モデルの振幅の合計を示す図である。
1実施形態による、ユーザに推薦するための場所を選択する処理を示す図である。
図では、説明のためのみに種々の実施形態を表わしている。当業者は、以下の説明から、本明細書に示す構造及び方法の代替の実施形態を、本明細書に記載の原理から逸脱することなく用いることができることを認識できよう。
<システムの概要>
図1aは、1実施形態による、ランドマークに基づく場所思考追跡対話システムを実現するための車両ベース音声起動ナビゲーション・システムを示している。図1aの実施形態では、ユーザ100は、ランドマークに基づく場所思考追跡対話システム(以降、「ランドマーク・ナビゲーション・システム」)を実装した車両110を操作する。車両110は、音声認識モジュール115とランドマーク・ナビゲーション・システム125を含む。なお、他の実施形態では、ランドマーク・ナビゲーション・システムは、車両以外の環境、例えば、携帯電話、コンピュータ等に実装することができる。しかし、本明細書の説明の残りの部分では、簡単のため、車両での実装に焦点を当てる。車両110は、ユーザ100が他の方法で会話することによって車両との交信をできるように構成することができるが、本明細書の説明の残りの部分は、ユーザが該車両のランドマーク・ベースの位置サービスと交信する実施形態に限定される。
ユーザ100が発話105を発すると、該発話105は音声認識モジュール115によって受信される。該発話は、文、句、コマンド、少数の単語、要求、質問、説明、又は他の任意の適切な会話とすることができる。該発話には、通常、場所属性及びランドマークの特定情報が含まれるが、これは後で説明される。該発話は、例えば、車両110からの入力要求に応答して、ユーザによって数回繰り返して受信され、発話内容が明確にされる。音声認識モジュール115には、マイクロフォン又は他の音声取り込み機器が含まれ、自動的(例えば、発話を検出したとき)、又はユーザによる手動入力への応答、のいずれかによって発話を取り込むことができる。
音声認識モジュール115は、取り込んだ発話105を発話テキスト120に変換する。これは、例えば、取り込んだ発話内の単語を特定し、特定した単語群を表すテキストを決定することにより行われる。1つの実施形態では、前記音声認識モジュールが、取り込んだ発話に対する1つ又は複数の仮説テキストを出力し、かつ、各仮説テキストに関係付けられた信頼度スコアを出力する。該信頼度スコアは、各仮説テキストが正確に発話を表す、音声認識モジュールからの信頼度を表す。該音声認識モジュールは任意の適切な音声認識技術を実装することができ、該技術は、本明細書に記載の音声−テキスト変換操作を実行するように構成されている。例えば、自動音声認識(ASR)を用いて、信頼度に従ってランク付けされた仮説テキストの組を生成することができる。自然言語理解(NLU)を用いて、上位の閾値の数値又はパーセントのそれぞれの部分を「場所属性テキスト」及び「ランドマーク・テキスト」として分類することができる。これは、以下において説明する。
音声認識モジュール115は、発話テキストの内容に基づいて、場所属性テキスト又はランドマーク・テキスト、又はその両方として、発話テキストの複数の部分を分類することができる。発話テキストの第1の例「最初のレストラン」では、「最初のレストラン」が場所属性テキストとして分類され、「最初の」がランドマーク・テキストとして分類される。第2の例「近くの最初のレストラン」では、「レストラン」が場所属性テキストとして分類され、「近くの最初の」は「ランドマーク・テキスト」として分類される。1つの実施形態では、発話105には、複数の場所属性及びランドマークが含まれる。本明細書記載の原理はこのような実施形態に等しく適用されるが、本明細書の残りの部分では、単純化のため、発話が1つの場所属性及び1つのランドマークを指定する例に限定する。
ランドマーク・ナビゲーション・システム125は、発話テキスト120を受信し、かつ、該発話テキストに基づく推薦場所130をユーザ100に出力する。発話105には、道順を求める要求、検索クエリ、電話番号又は電話帳の要求、評価の要求、等が挙げられる。したがって、推薦場所には、方向、ナビゲーション命令、検索クエリの結果、電話番号、住所、評価等があり得る。
図1bは、1つの実施形態による、ランドマーク・ナビゲーションのための処理の概要を示す図である。1つの実施形態では、図1bのランドマーク・ナビゲーション処理は、図1aのランドマーク・ナビゲーション・システム125によって実行される。発話テキスト120には、場所属性テキスト135とランドマーク・テキスト140が含まれる。該場所属性は、1つのジャンル(例えば、「公園」、「レストラン」、「ジム」等)、1つのサブジャンル(「犬の公園」「イタリアン・レストラン」、「バスケットボールのジム」等)とすることができる、又は、特定の実在物(例えば、「ベンのイタリアン・レストラン」等)を指定することができる。該ランドマークは、特定の名前のついた場所(記念碑、公園、企業、レストラン、建物、等)、非特定の名前のついた場所(近所、地区、都市及び町、等)、名前のない場所(例えば、道路、河川、等)又は他の任意の適切な場所とすることができる。該ランドマーク・テキストには相対テキストを含み、ランドマークに対して相対的な位置を指定することができる。例えば、ユーザが「アクメ・ガス・ステーションの周り」、「ハイド・パークから2ブロック」、「7番目ストリートの北」等、と指定することができる。場所属性テキストとランドマーク・テキストには、複数の仮説場所属性と仮説ランドマークとをそれぞれ含むことができ、各々の仮説は、特定の仮説場所属性や仮説ランドマークが正確にユーザの意図した場所属性やランドマークを反映している確度を表す信頼度スコアに対応している。
場所検索部145は、場所属性135受信して、以下に説明するように、場所属性に対応した候補地150の組を生成する。カーネル・モデラー155は、ランドマーク140及び候補地150を受信し、かつ、以下に説明するように、該候補地を受信したランドマーク・テキストに基づいてランク付けして、候補地のランク付けリスト160を生成する。ランドマーク・ナビゲーション・システム125は、該ランク付けされた候補地の中から1つの場所(例えば、最高ランクの候補地)を選択して、推薦場所130をユーザ100へ、選択された候補地に基づいて出力する。または、該ランドマーク・ナビゲーション・システムは、上位閾値の数だけのランク付けされた候補地を選択して、該選択された候補地をユーザに提示し、ユーザが提示された候補地を選択できるようにする。該ランドマーク・ナビゲーション・システムは、図2に詳細に示されている。
図2は、1つの実施形態によるランドマークに基づく場所思考追跡対話システムを実現するためのランドマーク・ナビゲーション・システムを示す図である。ランドマーク・ナビゲーション・システム125は、プロセッサ200及びメモリ210を含む。但し、他の実施形態では、該ランドマーク・ナビゲーション・システムは、図2に示すコンポーネント以外を含むことができる。
プロセッサ200は、データ信号を処理し、様々なコンピューティング・アーキテクチャを含むことができる。このコンピューティング・アーキテクチャには、複合命令セット・コンピュータ(CISC)アーキテクチャ、縮小命令セット・コンピュータ(RISC)アーキテクチャ、又は複数の命令セットの組み合わせを実装するアーキテクチャがある。単一プロセッサのみが図2に示されているが。複数のプロセッサが含まれてもよい。該プロセッサには、算術論理演算ユニット、マイクロプロセッサ、汎用コンピュータ、又は、電子データ信号の送信、受信、及び処理をするために具備された、いくつかの他の情報機器を含むことができる。該データは、メモリ210及び、車両110内外の他の任意のコンポーネント又はシステムから、及び該コンポーネントの間で送受される。
メモリ210には、プロセッサ200によって実行することができる命令及び/又はデータが記憶される。命令及び/又はデータには、本明細書に記載の技術のいずれか及び/又は全てを実行するためのコード(すなわち、モジュール)を含むことができる。該メモリは、任意の非一時的なコンピュータ可読記憶媒体でよい。例えば、ダイナミック・ランダム・アクセス・メモリ(DRAM)デバイス、スタティック・ランダム・アクセス・メモリ(SRAM)デバイス、フラッシュRAM(不揮発性記憶)、前記の組み合わせ、又は、当該技術分野で公知の他のメモリデバイスでよい。
図2の実施形態では、メモリ210には、意味論的思考追跡モジュール220、候補地モジュール230、カーネル・モジュール240、及び、ランク付けモジュール250が含まれる。該メモリには、また、場所データベース260、及びランドマーク・データベース270が含まれる。しかし、留意するべきことは、候補地データベースとランドマーク・データベースは他のメモリ内に配置することができ、又は、車両110の外部(例えば、該車両がアクセス可能なオンラインデータベース内)に配置してもよいということである。他の実施形態では、該メモリには、本明細書に記載の機能を実行するために、追加の、又はより少ない、又は異なるモジュールを含むことができる。該メモリに格納されたモジュールは、互いにかつ、プロセッサ200に通信可能に接続されている。
意味論的思考追跡モジュール220は、場所属性テキスト135を音声認識モジュール115から受信して、結合推論されたユーザ目標(JIUG:Joint-Inferred User Goals)の組を発話テキストに基づいて生成する。各JIUGは、仮説場所属性であり、該仮説場所属性に関係付けられた信頼度スコアを含むことができる。該信頼度スコアは、意味論的思考追跡モジュールの信頼度であり、仮説場所属性がユーザ発話105又は発話テキスト120をどれだけ言い当てているかという信頼度を表している。例えば、ユーザが、「球場の近くの最初にあるイタリアの」と言う場合、該意味論的思考追跡モジュールは「最初にあるイタリアの」と言う場所属性テキストを受信し、かつ、関係付けられた信頼度スコアが以下になるJIUGを生成する。
・ 第1通りにあるイタリアン・レストラン、信頼度スコア:0.7
・1番街にあるイタリアン・レストラン、信頼度スコア:0.5
・ 第1通りにあるイタリア市場、信頼度スコア:0.3
・ 第1通りにあるインド・レストラン、信頼度スコア:0.1
場所属性テキストからJIUGを生成するために、意味論的思考追跡モジュール220は、動的確率オントロジー・ツリー(DPOT:Dynamic Probabilistic Ontology Tree)を使用した認識追跡を用いる。DPOTは、固定したユーザ目標(ユーザが所望する場所属性)を表すツリー状サブネットワークから構成されるベイジアン・ネットワークであり、連続する対話の繰り返しから収集された証拠を表す一連のサブネットワークに接続される。一般的な意味論的思考追跡、特にDPOTは2011年8月30日出願の、「対話システムにおける思考追跡及び行動選択」と題する米国特許出願第13/221155号においてより詳細に説明されている。該発明の内容は参照によりその全体が本明細書に組み込まれる。他の実施形態では、前記意味論的思考追跡モジュールは他の方法で仮説場所属性を生成することができるが、本明細書の残りでは、簡単のためDPOTを用いるJIUGの生成に限定する。
意味論的思考追跡モジュール220は、所定のフォーマットに従ってJIUGを生成することができる。JIUGフォーマットには、「ジャンル」、「サブジャンル」、「名前」、「場所」、「下位の場所」、「価格帯」、「評価点」等のような1つ又は複数の属性を含むことができる。該意味論的思考追跡モジュールは、場所属性のテキストに基づき各JIUGに対して可能な限り多くの属性を取り込むことができる。たとえば、場所属性テキスト「ヒューストンの犬の公園」に対するJIUGとしては、ジャンル属性「公園」、サブジャンル属性「犬の公園」、及び場所属性「ヒューストン」が取り込まれる。名前属性とサブ場所属性は設定されない。そして、価格帯属性や評価点属性は適用できないと判断される。前記意味論的思考追跡モジュールは、可能な限り多くのJIUGフォーマット属性を場所属性テキストに基づいて取り込もうとして、必要に応じて、ユーザ100に追加情報の入力要求をして追加属性を取り込むことができる。1つの実施形態では、JIUGフォーマットは場所データベース260に格納された場所フォーマットに基づいている。
1つの実施形態では、意味論的思考追跡モジュール220によって受信された場所属性テキスト135には、複数の仮説場所属性が含まれ、それぞれの仮説場所属性が信頼度スコアに関係付けられている。該意味論的思考追跡モジュールは、各仮説場所属性に対して1つ又は複数のJIUGを生成することができる、又は受信した仮説場所属性の1つの組に基づいて1つ又は複数のJIUGを生成することができる。該意味論的思考追跡モジュールによって生成され、各JIUGに関係付けられた信頼度スコアは、受信した仮説場所属性に関係付けられた信頼度スコアに基づくことができる、又は、ユーザ100のユーザ履歴(例えば、ユーザが過去に訪問した場所、該ユーザに対するランドマーク・ナビゲーション・システムのユーザ履歴など)、他のユーザに対するグローバル・ユーザ履歴、場所属性テキストが基づいている多数の対話の繰り返し、場所属性テキストに関係付けられた場所属性の種類、等に基づくことができる。
候補地モジュール230は、意味論的思考追跡モジュール220からJIUGの組を受け取り、該JIUGの組に基づく候補地の組を生成する。該候補地モジュールは、場所データベース260に候補地を要求する。該場所データベースには場所の組が格納され、かつ、それぞれの位置に関係付けられた1つ又は複数の場所属性が格納される。上述したように、格納された各々の場所及び関係付けられた場所属性のフォーマットは、受信したJIUGのフォーマットと同一にすることができる。該場所データベースは、百科事典サイト、評価サイト、地図データベース、企業ディレクトリ等の外部の場所データ・ソースから取り込まれてもよい。
候補地モジュール230は場所データベース260に照会して、すべての受信JIUG、最も高い信頼度スコアに関係付けられたJIUGの閾値の数値又はパーセント、上記閾値の信頼度スコアを持つ任意のJIUG、又はJIUGの他の任意の選択枝を問い合わせすることができる。該場所データベースは、JIUGを用いてなされた照会に応答して、1つ又は複数の場所、及び該JIUGに対応付けられた信頼度スコアにアクセスし、出力することができる。たとえば、JIUG「サンノゼのスーパーマーケット」に対して、該場所データベースは、該JIUGに関係付けられた場所(たとえば、サンノゼ地域内のすべてのスーパーマーケット等)を特定することができ、特定された各場所がJIUGに関係付けられた信頼度スコアを決定することができ、かつ、すべての又は閾値の数だけの特定された場所を該候補地モジュールに提供することができる。特定された各場所に対する信頼度スコアが基づくものには、該場所データベースに照会するために使用した該JIUGの信頼度スコア、該JIUGと特定された場所との間で共通な属性の数、該JIUGと特定された場所との間で共通な単語又は他の字句又は意味的特徴の数、特定された場所の数などがある。
前記の発話例「球場の近くにある最初のイタリアン」について続けると、候補地モジュール230は、場所データベース260に照会して、例えば、最も高い信頼度スコアを有する3つのJIUG、又は「第1通りにあるイタリアン・レストラン」、「1番街にあるイタリアン・レストラン」、及び「第1通りにあるイタリアの市場」等と照会することができる。該候補地モジュールは、最高の信頼度スコアに対応する各JIUGに関係付けられた場所を2つ要求することができる。応答においては、該候補地モジュールは次のような場所を返すことができる。
・「第1通りにあるAのイタリアン・レストラン」、信頼度スコア:0.9
・「第1通りにあるBのイタリアのアイスクリーム」、信頼度スコア:0.3
・「1番街にあるCのイタリアン・レストラン」、信頼度スコア:0.8
・「9番街にあるDのイタリアン・レストラン」、信頼度スコア:0.1
・「第1通りにあるEのイタリア産食料品」、信頼度スコア:0.5
この例では、場所データベース260は、「第1通りにあるイタリアン・レストラン」という照会に応答して「Aの...」及び「Bの...」を返送し、「1番街にあるイタリアン・レストラン」という照会に応答して「Cの...」及び「Dの...」を返送し、かつ「第1通りにあるイタリアの市場」という照会に応答して「Eの...」を返送する。該場所データベースは、最初の2つの照会に対して2つ以上の場所を特定したかも知れないが、最高の信頼度スコアを持つ2つの照会結果のみを出力している。1つの実施形態では、場所データベースは、特定された場所が閾値を超える信頼度スコアに対応付けられている場合には、特定された場所を出力するのみでよい。他の実施形態では、該場所データベースは、特定された場所をすべて候補地モジュール230に出力してもよい。該場所データベースの方で、最も適した場所、最高の信頼度スコアに対応付けられた場所等を選択してもよい。
候補地モジュール230は、場所データベース260から受信した場所を編集して、候補地の組を形成する。該候補地の組には、該場所データベースから受信したすべての場所、又は上記閾値の信頼度スコアに対応付けられた場所のみ、又は最も高い信頼度スコアに対応付けられた場所のうち閾値の数又はパーセントだけ、等が含まれる。該候補地モジュールは、該候補地の組の事前ランク付けを、信頼度スコアに基づいて、又は任意の他の場所属性に基づいて行うことができる。
カーネル・モジュール240は、ランドマーク・テキスト140を受信して、ランドマーク・テキストに関係付けられた1つ又は複数のランドマークに対するカーネル・モデルを生成する。該カーネル・モジュールはランドマーク・データベース270をランドマーク・テキストで照会して、ランドマーク・テキストに対応したランドマークの組を特定する。該ランドマーク・データベースには、ランドマーク及び該ランドマークの属性が格納される。ランドマークの属性には、ランドマークの位置(例えば、該ランドマークの経度及び緯度、地図上のランドマークの位置等)、該ランドマークの特徴(該ランドマークのタイプ、ランドマーク名等)、又は該ランドマークの他の任意の特徴がある。該ランドマーク・データベースは、百科事典のウェブサイト、評価サイト、地図データベース、企業ディレクトリ、などのような外部のランドマーク・ソースによって取り込まれてもよい。1つの実施形態では、場所データベース260及びランドマーク・データベースは、同一のデータベースの一部である。
ランドマーク・データベース270は、ランドマーク・テキスト140を用いた照会に応答して、該ランドマーク・テキストに関連するランドマークの組を特定する。1つの実施形態では、該ランドマーク・データベースは、格納されたランドマークで、該ランドマーク・テキストに類似したテキストに関係付けられた属性を持つランドマークを特定することによって、ランドマークの組を特定する。該ランドマーク・データベースは、また、信頼度スコアを、特定された各ランドマークに割り当てることができる。この割り当ては、該ランドマーク・テキストと特定されたランドマークの間の一致強度、各ランドマークに対応した人気又は評価、ユーザ100と該ランドマークの近さ、又は、該ランドマーク又はユーザに関係付けられている任意の他の特徴に基づいて行われる。たとえば、該場所データベースが、ランドマーク・テキスト「フィルのサンドイッチ」を照会された場合、該場所データベースは、以下のようなランドマークを、関係付けられた信頼度スコアと共に特定する。
・フィルのサンドイッチ店#1、信頼度スコア:0.95
・フィルのサンドイッチ店#2、信頼度スコア:0.90
・フィルのコインランドリー、信頼度スコア:0.40
・ビルのサンドイッチ、信頼度スコア:0.65
ランドマーク・データベース270が照会に応答して提供する、特定されたランドマークの組には、特定されたすべてのランドマーク、一定の閾値の数又はパーセントの最高の信頼度スコアに関係付けられた特定されたランドマーク、一定の閾値以上の信頼度スコアを持つすべての特定されたランドマーク、又はその他の任意の特定されたランドマークの組を含むことができる。
カーネル・モジュール240は、ランドマーク・データベース270から受信した特定されたランドマークの組内の各ランドマークに対するカーネル・モデルを生成する。カーネル・モデルは、地図上にレンダリングされた3次元モデルであり、該カーネルと関係付けられたランドマークの位置を中心においている。1つの実施形態では、該カーネル・モデルの基底部は、前記地図と同一平面である。より詳細に後述するように、該カーネル・モデルの基底部の形状は、ランドマークの属性(たとえば、ランドマークのタイプ、位置等)によって決まり、かつ、カーネル・モデルの高さ(以下「振幅」)は、特定されたランドマークに関係付けられた信頼度スコアによって決まる。この形状の決定は、ランドマークの属性、ランドマークのサイズ又は突出度、該ランドマーク・テキストに関係付けられた関係テキスト、等に基づいている。
図3は、1つの実施形態による、地図上に生成された例示的なカーネル・モデルを示す図である。図3の実施形態では、場所データベース270は、数店の「セブン・イレブン」の店舗及び「サブウェイ」レストランなどの特定されたランドマークの組を返送する。カーネル・モジュール240は、該ランドマークの組の各々に対してカーネルを生成する。たとえば、第1のカーネル・モデル300は、第1のランドマーク(セブン・イレブン店)に対して生成され、第2のカーネル・モデル302は、第2のランドマーク(サブウェイ・レストラン)に対して生成される。図3の実施形態における各カーネル・モデルの基底部は円形であり、地図のx軸とy軸に沿って延びている。各カーネル・モデルの振幅は、該地図のz軸に沿って地図から突出しており、該ランドマークの位置を中心として最大で、ランドマークからの地図上の距離に基づき、ガウス曲線に従って減衰する。図3の実施形態では、カーネル・モデル302はカーネル・モデル300よりも大きな振幅を有する。この理由としては、例えば、カーネル・モデル302に関係付けられたランドマークがより大きな信頼度スコアを持つ、カーネル・モデル302に関係付けられたランドマークの人気が高い、又は、カーネル・モデル302に関係付けられたランドマークにユーザ100がより接近している等がある。
上述したように、カーネル・モジュール240によって生成されたカーネル・モデルの形状は、地図上の該関係付けられたランドマークの形状、該ランドマークのタイプ、該ランドマークの突出度などに基づくことができる。図3に示す円形の基底部のガウシアン・カーネル・モデルに加えて、カーネル・モデル基底部は、地図上のランドマークの形状を表すことができる。1つの実施形態では、長方形の市立公園が長方形の基底部のカーネル・モデルで表現されている。該実施形態では、地図上の該公園内のカーネル・モデルの振幅は、地図上の公園を表す長方形領域内のすべての点に対して一定であり、地図上の公園を表す長方形領域の最近接点までの距離の増加に伴って減少する。各カーネルの基底部の形状は、地図上のランドマークの形状を拡張して表しても、又は、予め決められた形状を表しても、又は地図上のランドマークの形状の最も重要な部分を表してもよい。ランドマークには道路を含めることができる。このような場合には、カーネル・モデルの形状は、地図上の道路の形状を囲むようにすることができ、かつ、道路からの距離が増すにつれて振幅が減少するようにできる。
関係付けられたランドマークのカーネル・モデル基底部の形状は、ランドマークのタイプに基づいてもよい。基底部の形状は、各ランドマークのタイプに対して予め決めていてもよい。例えば、レストランは円形の基底部のカーネル・モデルで表すことができ、公園は長方形の基底部のカーネル・モデルで表すことができ、道路は線状の基底部のカーネル・モデルで表すことができる。また、基底部形状は、特定のランドマークのためにカスタマイズすることができる。例えば、多角形の基底部のカーネル・モデルを、街の繁華街のような地理的領域のランドマークを表すために生成することができる。
カーネル・モデルの基底部と振幅は、ランドマークのタイプの目立ち方や重要度に基づくことができる。例えば、点状の基底部のカーネル・モデルの振幅と半径は、全国的なランドマークに対しては国内チェーン店のファースト・フード・レストランより大きくすることができる。同様に、一つのランドマークに対する正方形の基底部のカーネルの振幅は、学校のランドマークに対してはガソリンスタンドのランドマークに対してよりも、カーネル・モデルからの距離が増すに連れて減衰を緩やかにすることができる。
カーネル・モデルの振幅は、ランドマーク・データベース270によって提供される特定されたランドマークに関係付けられた信頼度スコアに基づくことができる。例えば、信頼度スコア0.9を持つランドマークに対して生成されるカーネル・モデルの振幅は、信頼度スコア0.4を持つランドマークに対して生成されるカーネル・モデルの振幅よりも大きくすることができる。1つの実施形態では、カーネル・モジュール240は、閾値以上の信頼度スコアに関係付けられたランドマークに対するカーネル・モデルを生成するだけである。
前記カーネル・モデルの振幅は、該カーネル・モデルによって表されるランドマークのタイプの認知度に基づくことができる。たとえば、ランドマークがフレンチ・レストランであると判断され、数軒のフレンチ・レストランがユーザ100の近くにあると判断された場合、各フレンチ・レストランに対応するカーネル・モデルの振幅を減少させることができる。カーネル・モデルの振幅は、ランドマークの特性又は属性、たとえば、該ランドマークに「チェックイン」している人の数や、該ランドマークに関係付けられた商品やサービスの価格、又は、該ランドマークの他の任意の特性に基づいてもよい。
カーネル・モデルの振幅は、ランドマーク・ナビゲーション・システムの複数のユーザに亘る該カーネル・モデルによって表されるランドマーク使用量に基づいてもよい。多くのユーザのローカルなランドマーク・ナビゲーション・システムは、複数のユーザに亘って特定のランドマークの使用状況を集約するように構成された中央のランドマーク・ナビゲーション・システムと通信することができる。ローカルなランドマーク・ナビゲーション・システムのユーザから1つのランドマークを受信すると、これに応答して、該ローカルなランドマーク・ナビゲーション・システムは、ランドマークが使用される頻度を決めるために中央のランドマーク・ナビゲーション・システムに照会することができる。一つのランドマークが共通して使用されている場合、ローカルなランドマーク・ナビゲーション・システムにおける該ランドマークを表すカーネル・モデルの振幅は、ランドマークが共通して使用されていない場合よりも大きくすることができる。
カーネル・モデルの振幅は、該カーネル・モデルが表現するランドマークを記述した、又は該ランドマークに関係付けられた外部データに基づくことができる。たとえば、ランドマークに関してサード・パーティのユーザ評価データベースを照会することができ、該ランドマークを表すカーネル・モデルの振幅は、該ランドマークに関係付けられた評価の数、該ランドマークに対応付けられたユーザの評価点(例えば、1−10のスケールでのユーザによる総合的な評価点など)、又はランドマークに関係付けられた他の任意の情報に基づいてもよい。
特徴のないランドマークがユーザから提供され、特徴のないランドマークを表すカーネル・モデルが生成される場合がある。例えば、ユーザ100が「ダウンタウン」と言うランドマークを提供し、該ユーザのローカル・システムが「ダウンタウン」領域の境界をすぐに決定することができない場合がある。このような実施形態では、カーネル・モジュール240は、該特徴のないランドマークの場所を推定して、該特徴のないランドマークの境界を決定するために外部のデータ・ソースに照会する、及び/又は追加の詳細をユーザに入力要求することができる。
前述のように、ランドマーク・テキスト140には、ランドマークからの相対位置を指定する相対的なテキストを含むことができる。カーネル・モデルはこの相対的なテキストに基づいて生成することができる。例えば、ユーザ100は「7番街北の市立公園」と発話するかもしれない。この場合、7番街の通りの北にあるランドマークに関係付けられたカーネル・モデルの振幅は7番街の南にあるランドマークに関係付けられたカーネル・モデルの振幅よりも平均的に大きくすることができる。該ユーザは、道路のユーザ側のランドマークを、例えば、「その道路の私の側のガソリンスタンド」と指し示すかも知れない。該道路のユーザ側のランドマークに関係付けられたカーネル・モデルの振幅は、該道路の反対側のランドマークに関係付けられたカーネル・モデルの振幅よりも平均的に大きくすることができる。同様に、ユーザは、ユーザに対して相対的な方角を指し示して、例えば「ここの南にある食料品店」のように言うかもしれない。その場合、ユーザの南側にあるランドマークに関係付けられたカーネル・モデルの振幅を、ユーザの南側にはないランドマークに関係付けられたカーネル・モデルの振幅よりも平均的に大きくすることができる。
ランドマークに対応付けられたカーネル・モデルの振幅は、ユーザ100が以前に該ランドマークをランドマーク・ナビゲーション・システム125に提供したかどうかに基づくことができる。例えば、以前ユーザによって提供されたランドマークに関係付けられたカーネル・モデルの振幅は、ユーザが以前には提供していないランドマークに関係付けられたカーネル・モデルの振幅よりも平均して大きくすることができる。さらに、ランドマークに関係付けられたカーネル・モデルの振幅は、ユーザが以前に該ランドマークを提供しているかどうか、及び、その後ランドマーク・ナビゲーション・システムを使用する際に該ランドマークが有用だったか否かに基づくことができる。
なお、負のカーネル・モデルが、負のランドマークのテキスト条件をモデル化するために生成されることがある。負のカーネルとは、負の振幅(地図から下方に突出する振幅で、地図から上方に突出する、図3のカーネル・モデルのような通常のカーネル・モデルとは対照的である)を持つカーネル・モデルである。たとえば、ユーザが「タコス・スタンド、しかし、駅の近くのタコス・スタンドではない」と言うとき、負のカーネル・モデルを、「駅」に関係付けられたランドマークに対して生成することができる。
前述のように、ランドマーク・ナビゲーション・システム125は、車両110に実装することができる。したがって、ランドマーク・ナビゲーション・システムが車両の移動中に、使用されることがある。このような実施形態では、カーネル・モデルの振幅は車両の移動に応じて動的に変化することができる。例えば、ユーザ100が「最寄りのレストラン」と要求すると、車両の近くにあるレストランを表すカーネル・モデルの振幅は、該車両からずっと離れたレストランのカーネル・モデルに対して大きくすることができる。車両が移動し続けて、以前は車両の近くにあったレストランが車両から遠くになるにつれて、そのようなレストランのカーネルモードの振幅は、その後、しょうさくする縮小することができ、近づいて来るレストランのカーネル・モデルの振幅を大きくすることができる。
車両110は、指差しなどのジェスチャーを捕えることができるモーション検出器を備えてもよい。そのような車両では、ランドマークを表す、生成されたカーネル・モデルの振幅は、ユーザ100のジェスチャーに基づくことができる。例えば、ユーザが特定の方向を指差して「この方向のレストラン」と言う場合、指差しされた方向にあるランドマークのカーネル・モデルの振幅は、指差しされた方向にないカーネル・モデルの振幅よりも平均して大きくすることができる。同様に、車両に視線追跡技術を使用することができる。該技術では、ユーザの視線方向のランドマークのカーネル・モデルをユーザの視線の方向にないカーネル・モデルの振幅よりも平均して大きな振幅で生成することができる。
ランク付けモジュール250は、候補地モジュール230から候補地の組を受信し、かつカーネル・モジュール240から生成されたカーネル・モデルを受信して、候補地のランク付けを各候補地の生成されたカーネル・モデルの振幅に基づいて行う。各候補地について、ランク付けモジュールは、地図上の候補地の位置を特定し、地図上の候補地が重なるすべてのカーネル・モデルを特定する。ランク付けモジュールは、次に、地図上の候補地で重なる各カーネル・モデルの振幅を合計して候補地に対するカーネル・モデルの振幅の合計を確定し、そして、候補地のランク付けを少なくとも部分的には、カーネル・モデルの振幅の合計に基づいて行う。
図4は、1つの実施形態による例示的な候補地のカーネル・モデルに対する振幅の合計を示す。図4の実施形態では、y軸は、カーネル・モデルの振幅400を表す。図4のグラフの振幅の単位は任意である。重なるカーネル・モデルが、3つの候補地(405a、405b、及び405c)の各々について特定される。候補地405aに対しては、2つのカーネル・モデル(1A及び2A)が候補地405aと重なる。候補地405aにおけるカーネル・モデル1A及び2Aの振幅は、それぞれ、6及び10である。従って、候補地405aに対するカーネル・モデルの振幅の合計Aは16である。
1つのカーネル・モデル(1B)が候補地405bと重なり、候補地405bで12の振幅を持っている。1つのカーネル・モデルのみが候補地405bと重なるので、候補地405bのカーネル・モデルの振幅の合計Bもまた12である。3つのカーネル・モデル(1C、2C、及び3C)が候補地405cと重なっている。候補地405cでは、カーネル・モデル1Cが2の振幅を持ち、カーネル・モデル2Cが10の振幅を持ち、カーネル・モデル3Cが6の振幅を持っている。よって、カーネル・モデルの振幅の合計Cは18になる。
ランク付けモジュール250は、候補地のランク付けを、各候補地に関係付けられたカーネル・モデルの振幅の総計に基づいて行う。図4の実施形態では、該ランク付けモジュールは、候補地405cを第1番目にランク付けし、候補地405aを2番目に、候補地405bを3番目にランク付けする。該ランク付けモジュールは、候補地のランク付けを、さらに各候補地に関係付けられた信頼度スコアに基づいて行うことができる。例えば、該ランク付けモジュールは、各候補地のカーネル・モデルの振幅の合計に各候補地に関係付けられた信頼度スコアを乗じて、各候補地の補正されたカーネル・モデルの振幅の合計を生成することができる。図4の実施例を引き続いてみると、候補地405a、405b、及び405cに関係付けられた信頼度スコアは、それぞれ、0.5、0.75、及び0.33である。該ランク付けモジュールは、補正されたカーネル・モデルの振幅の合計(各カーネル・モデルの振幅の合計に、関係付けられた候補地の信頼度スコアを乗じて計算される)を確定する。各候補地について以下のようになる。
・候補地405a:(16)*(0.5)=8
・候補地405b:(12)*(0.75)=9
・候補地405c:(18)*(0.33)=6
この例では、ランク付けモジュールは、候補地405bを最高に、候補地405cを最低にランク付けする。
いくつかの実施形態では、負の振幅を有する1つ又は複数のカーネル・モデルが一つの候補地と重なる。このような実施形態では、該候補地と重なるカーネル・モデルの振幅を合計することは、負の振幅を持つカーネル・モデルの振幅の絶対値を正の振幅を持つカーネル・モデルの振幅の合計から減算することになる。
ランク付けモジュール250は、候補地のランク付けリストを、ランドマーク・ナビゲーション・システム125がユーザ100に推奨する場所の選択する時に使用するために、出力する。ランク付けされた候補地リストには、各候補地に関係付けられたカーネル・モデルの振幅の合計、又は補正されたカーネル・モデル振幅の合計を含むことができる。該ランドマーク・ナビゲーション・システムは、トップにランク付けされた候補地を、一つ又は多数選択してユーザに提示する。例えば、選択された候補地を発話又は表示によって提示する。
なお、いくつかの実施形態では、音声認識モジュール115は、モバイル通信機器(MCD)又は車両110と通信するように構成された車両110の外部の実在物に実装することができる。MCDには、例えば、携帯電話、ナビゲーション・システム、又はタブレット・コンピュータがある。外部の実在物には、例えば、リモート・サーバ又はクラウドベース・コンピューティング・システムがある。MCD及び/又は外部実在物は、車両110と、例えば、無線通信インタフェースを介して通信するように構成することができる。無線通信インタフェースは、Bluetooth(登録商標)、WiFi、又は2G/3G/4Gのセルラー・ネットワークのような無線プロトコルを実装している。1つの実施形態では、音声認識モジュール115はMCD内に実装される。該MCDは、発話を表す信号を捕捉して、該信号を該車両外部の音声テキスト変換サーバに送信し、発話テキストを表す信号を受信してランドマーク・ナビゲーション・システム125への通信に用いるように構成される。他の実施形態では、ランドマーク・ナビゲーション・システム125の1つまたは複数の構成要素は、MCD又は外部実在物に実装されている。例えば、意味論的思考追跡モジュール220及び候補地モジュール230は、MCD内に実装することができ、場所データベース260及びランドマークデータ270は、外部データベースに実装することができる。このような実施形態では、該MCDは直接、場所やランドマークについて無線で外部データベースに照会するか、又はJIUGをランドマーク・ナビゲーション・システム125に提供し、該システム125の方で場所やランドマークについて外部データベースに照会することができる。
いくつかの実施形態では、ランドマーク・ナビゲーション・モジュール125の機能は、検索エンジン・インタフェース内に実装される。例えば、ユーザ100は、検索エンジン(車両110の内部又は外部どちらかに実装される)との相互交信を、場所属性及びランドマークを指定する発話をすることによって行うことができる。応答時には、該検索エンジンは、候補地の組とランドマークの組を発話に基づき特定して、各ランドマークのカーネル・モデルを生成し、カーネル・モデルの振幅に基づいて候補地をランク付けする。該検索エンジンは、次に、ランク付けされた候補地を検索結果として検索エンジン・インターフェース内で提供することができる。
図5は、1実施形態による、ユーザに推薦するために場所を選択する処理を示している。ステップ500で、場所属性とランドマークを指定する発話がユーザから受信される。例えば、車両のランドマーク・ナビゲーション・システムのユーザは、「ダウンタウン近くの公園」又は「ワシントン通りのステーキ・ハウス」と言って、道案内や店舗情報を該ランドマーク・ナビゲーション・システムから受けとろうとする。
ステップ510で、候補地の組が指定された場所属性に基づいて特定される。該候補地は、場所データベースに格納された場所の中から特定することができる。この特定は、たとえば、指定された場所属性に関係付けられたテキストを含む候補地について場所データベースに照会することにより行われる。信頼度スコアが各特定された候補地に対して生成され、該特定された候補地が該指定された場所属性を表す確度を表すことができる。ステップ520で、該指定されたランドマークに関係付けられたランドマークの組が特定される。この特定は、例えば、ランドマーク・データベースへ、該指定されたランドマークに関係付けられたテキストを含むランドマークについて照会することにより行なわれる。信頼度スコアが各特定されたランドマークに対して生成され、該特定されたランドマークが該指定されたランドマークを表す確度を表すことができる。
ステップ530で、カーネル・モデルが、ランドマークの組の中の各ランドマークに対して生成される。前述のように、カーネル・モデルは3次元モデルであり、地図と同一平面にある基底部形状を有し、地図上のランドマークの位置を中心とし、かつ、地図から突出し、該ランドマークの属性、該ランドマークに関係付けられた信頼度スコア、該ランドマークのユーザに対する位置、又は該ランドマークの他の任意の特徴に基づく振幅を有する。
ステップ540で、該候補地の組は、前記ランドマークの組に関係付けられて生成されたカーネル・モデルに基づいてランク付けされる。各候補地について、該候補地で重なるすべてのカーネル・モデルの該候補地における振幅が合計される。該カーネル・モデルの振幅の合計は補正することができ、例えば、各合計に各候補地に関係付けられた信頼度スコアを乗算することによって補正できる。該候補地は、次に、カーネル・モデルの振幅の合計によってランク付けされ、ステップ550で、候補地のランク付けリストに基づいてユーザに対して推薦するために1つ又は複数の候補地が選択される。例えば、ユーザが「エンパイア・ステート・ビルの横のメキシカン・レストラン」と要求すると、いくつかのメキシカン・レストランが候補地として特定され、カーネル・モデルがエンパイア・ステートビル及び他のランドマークに対して生成され、合計が最高のカーネル・モデルの振幅に関係付けられたメキシカン・レストランが、ユーザに推薦するために選択される。
<その他の考慮事項>
明細書中の「1つの実施形態」という呼び方は、該実施形態に関連して記載される特定の特徴、構造、又は特性が少なくとも1つの実施形態に含まれることを意味する。「1つの実施形態において」又は「1つの実施形態」という語句が本明細書の様々な箇所で出現するが、必ずしもすべて同一の実施形態を指しているとは限らない。
以下の詳細な説明のいくつかの部分は、コンピュータ・メモリ内のデータ・ビットに対する操作のアルゴリズム及び記号表現によって説明される。これらのアルゴリズムによる記述及び表現は、データ処理分野の当業者が最も効果的に該分野の他の当業者に業務の内容を伝えるために用いる手段である。アルゴリズムは、本明細書で及び一般的に、所望の結果を導く首尾一貫した一続きのステップ(命令)であると考えられている。該ステップは、物理量の物理的操作を必要とする。通常、必ずしも必要ではないけれども、これらの量は、電気的、磁気的、又は光学的信号の形をとり、記憶、転送、結合、比較及びその他の操作を行うことができる。これらの信号をビット、値、要素、シンボル、文字、用語、数字等として参照することは、時には、主に共通使用の理由から便利である。さらに、物理量又は物理量の表現の物理的な操作や変換を必要とするステップの特定の配列を、モジュール又は符号化装置として、一般性を失うことなく参照することが便利なことがある。
しかしながら、これらの用語及び類似の用語の全てが適切な物理量に関係付けられるべきもので、単にこれらの量に付けられる便利なラベルである。以下の説明から明らかなように別段の記載がない限り、本明細書全体を通じて、「処理」、「計算」、「演算」、「判断」、「表示」、又は「判定」等の用語を用いた説明は、コンピュータシステム、又は同様の電子計算機器(例えば、特定の計算機)の動作及び処理を指し、該動作及び処理では、物理(電子)量として表されるデータがコンピュータ・システムのメモリ又はレジスタ又は他の情報記憶装置、伝送機器、又は表示機器の中で操作及び変換される。
いくつかの態様では、本明細書で説明した処理ステップ及び命令をアルゴリズムの形で含むものがある。なお、該処理ステップ及び命令は、ソフトウェア、ファームウェア、又はハードウェアで実装され、ソフトウェアで実装するときには、ダウンロードして常駐させ、多様なオペレーティングシステムが用いる様々なプラットフォームから操作することができる。該実施形態は、また、計算システム上で実行可能なコンピュータ・プログラム製品内にあってもよい。
いくつかの例示的な実施形態は、また、本明細書における動作を実行するための機器に関する。この機器は、該目的のために、例えば、車両内の特定のコンピュータ用に特別に構成することができ、又は、汎用コンピュータを有し、車両内にある該コンピュータに格納されたコンピュータ・プログラムによって選択的に起動又は再構成することができる。このようなコンピュータ・プログラムは、以下のようなコンピュータ読み取り可能な記憶媒体に格納することができるが、これらに限定されない。該コンピュータ読み取り可能な記憶媒体には、フロッピー(登録商標)ディスク、光ディスク、CD−ROM、光磁気ディスク、リード・オンリー・メモリ(ROM)、ランダム・アクセス・メモリ(RAM)、EPROM、EEPROM、磁気又は光カード、特定用途向け集積回路(ASIC)、又は電子命令の格納に適した任意の種類の媒体、及び各々がコンピュータシステムバスに結合された媒体を含む任意のタイプのディスクがある。メモリには、上記、及び/又は、情報/データ/プログラムを格納可能な任意の他のデバイスがある。さらに、本明細書で言及するコンピュータは単一のプロセッサを含んでもよく、又は計算能力増強のためのマルチプロセッサ設計を用いるアーキテクチャであってもよい。
本明細書に提示されるアルゴリズム及び表示は、本質的にどのような特定のコンピュータ又は他の機器に関連するものでもない。また、様々な汎用システムを、本明細書の教示によるプログラムと共に使用することができる、又は、方法ステップを実行するためにより特化した機器を構成すると便利である。これらの様々なシステムのための構造は以下の説明から明らかになるであろう。また、例示的な実施形態は、どのような特定のプログラミング言語に関する言及も記載されてはいない。様々なプログラミング言語を本明細書に記載の教示を実装するために使用できることが理解されよう。かつ、特定の言語に対する以下の言及は、実施可能化及びベスト・モードの開示のために提供される。
また、明細書で使用される言語は、主に、読みやすさや教示目的のために選択されており、本発明の主題事項を記述又は限定するためには選択されていない。したがって、本開示は、実施形態の範囲を例示的に説明することを意図しているが、該範囲を限定するものではない。
特定の実施形態及び用途について本明細書において図示及び説明してきたが、該実施形態は、本明細書で開示した詳細な構成及び部品には限定されないことを理解されたい。かつ、様々な修正、変更、および変形を、配置、操作、及び、方法及び機器の詳細において、本発明の精神及び範囲から逸脱することなく行うことができる。
100 ユーザ
105 発話
110 車両
115 音声認識モジュール
120 発話テキスト
125 ランドマーク・ナビゲーション・システム
130 推薦場所
135 場所属性
140 ランドマーク
145 場所検索部
150 候補地
155 カーネル・モデラー
160 候補地のランク付けリスト
200 プロセッサ
210 メモリ
220 意味論的思考追跡モジュール
230 候補地モジュール
240 カーネル・モジュール
250 ランク付けモジュール
260 場所データベース
270 ランドマーク・データベース

Claims (30)

  1. 場所属性とランドマークを指定する発話を表す信号を、ユーザから受信するステップと、
    該指定された場所属性に基づいて候補地の組を特定するステップと、
    該指定されたランドマークに基づいてランドマークの組を特定するステップと、
    該ランドマークの組の中の各ランドマークに関係付けられたカーネル・モデルを生成するステップであって、各カーネル・モデルは、地図上の中心が該カーネル・モデルに関係付けられたランドマークの位置にある3次元モデルを含むステップと、
    各候補地におけるカーネル・モデルの振幅に基づいて該候補地をランク付けするステップと、
    該ランク付けされた候補地に基づいて、ユーザに提示する場所を選択するステップと、
    を含む
    ことを特徴とする、場所を決定するコンピュータ・ベースの方法。
  2. 前記発話を表す信号が、指定された場所属性を表す場所属性テキストと指定されたランドマークを表すランドマーク・テキストとを含むテキストに変換される
    ことを特徴とする請求項1に記載の方法。
  3. 前記候補地の組を特定するステップは、指定された場所属性を表わす候補地の組を特定するための意味論的思考追跡を実行するステップを含む
    ことを特徴とする請求項1に記載の方法。
  4. 前記意味論的思考追跡が複数の対話の繰り返しにわたって行われる
    ことを特徴とする請求項3に記載の方法。
  5. さらに、各候補地が指定された場所属性を表わす確度を示す、各候補地に関係付けられた信頼度スコアを決定するステップを含む
    ことを特徴とする請求項1に記載の方法。
  6. さらに、各ランドマークが指定されたランドマークを表す確度を示す、各ランドマークに関係付けられた信頼度スコアを決定するステップを含む
    ことを特徴とする請求項1に記載の方法。
  7. 少なくとも1つのカーネル・モデルは円形の基底部を有し、該カーネル・モデルの振幅は該関係付けられたランドマークの地図上の位置において最大であり、かつ、該関係付けられたランドマークの位置からの距離の増加に伴い該カーネル・モデルの振幅がガウス曲線に従って減衰する
    ことを特徴とする請求項1に記載の方法。
  8. 少なくとも1つのカーネル・モデルの基底部の形状が、該カーネル・モデルに関係付けられたランドマークのタイプに基づいている
    ことを特徴とする請求項1に記載の方法。
  9. 少なくとも1つのカーネル・モデルの基底部の形状が、地図上の該カーネル・モデルに関係付けられたランドマークの空間における境界の形状に基づいている
    ことを特徴とする請求項1に記載の方法。
  10. 少なくとも1つのカーネル・モデルの振幅が、該カーネル・モデルに関係付けられたランドマークの信頼度スコアに基づいている
    ことを特徴とする請求項1に記載の方法。
  11. 少なくとも1つのカーネル・モデルの振幅が、該カーネル・モデルに関係付けられたランドマークの1つ又は複数の属性に基づいている
    ことを特徴とする請求項1に記載の方法。
  12. 前記カーネル・モデルの振幅が、前記関係付けられたランドマークのタイプに基づいている
    ことを特徴とする請求項11に記載の方法。
  13. 前記カーネル・モデルの振幅が、前記ランドマークのタイプの認知度に基づいている
    ことを特徴とする請求項12に記載の方法。
  14. 前記カーネル・モデルの振幅が、前記関係付けられたランドマークに対応付けられた評価に基づいている
    ことを特徴とする請求項11に記載の方法。
  15. 前記発話を表す受信した信号がさらに方角を指定し、かつ、少なくともカーネル・モデルの前記振幅が該指定された方角に基づいている
    ことを特徴とする請求項1に記載の方法。
  16. 前記発話を表す前記信号が、検索エンジン・ユーザ・インターフェイスにおいて検索エンジンによって受信され、かつ、さらに前記ランク付けされた候補地を検索結果として前記ユーザに、該検索エンジンのユーザインターフェースを介して提供するステップを含む
    ことを特徴とする請求項1に記載の方法。
  17. 前記候補地をランク付けするステップは、1つ又は複数の候補地のそれぞれについて、
    該候補地の地図上の位置で重なる1つ又は複数のカーネル・モデルを特定するステップと、
    該候補地の地図上の位置で、各特定されたカーネル・モデルの振幅を合計して、該候補地に関係付けられたカーネル・モデルの振幅の合計を決定するステップと、
    該カーネル・モデルの振幅の合計に基づいて、1つ又は複数の候補地をランク付けするステップと、を含む
    ことを特徴とする請求項1に記載の方法。
  18. 前記候補地をランク付けするステップは、さらに、
    各カーネル・モデルの振幅の合計毎に、該カーネル・モデルの振幅の合計に、該カーネル・モデルの振幅の合計に関係付けられた候補地の信頼度スコアを乗算して、カーネル・モデルの振幅の補正された合計を生成するステップと、
    該カーネル・モデルの振幅の補正された合計に基づいて、1つ又は複数の候補地をランク付けするステップと、を含む
    ことを特徴とする請求項17に記載の方法。
  19. 前記候補地を選択するステップが最高ランクの候補地を選択するステップを含む
    ことを特徴とする請求項1に記載の方法。
  20. 場所属性とランドマークを指定する発話を表す信号を、ユーザから受信して、
    該指定された場所属性に基づいて候補地の組を特定し、
    該指定されたランドマークに基づいてランドマークの組を特定し、
    該ランドマークの組の中の各ランドマークに関係付けられたカーネル・モデルであって、各カーネル・モデルは、地図上の中心が該カーネル・モデルに関係付けられたランドマークの位置にある3次元モデルを含むカーネル・モデルを生成し、
    各候補地におけるカーネル・モデルの振幅に基づいて該候補地をランク付けし、かつ、
    該ランク付けされた候補地に基づいて、該ユーザに提示する場所を選択する、
    ように構成された、
    実行可能なコンピュータ・モジュールを含む非一時的なコンピュータ可読記憶媒体と、
    該コンピュータ・モジュールを実行するように構成されたプロセッサと、を含む
    ことを特徴とする、ユーザに推薦する場所を決定するためのシステム。
  21. 前記実行可能なコンピュータ・モジュールがさらに、
    前記発話を表す信号を、指定された場所属性を表す場所属性テキストと指定されたランドマークを表すランドマーク・テキストとを含むテキストに変換するように構成されている
    ことを特徴とする請求項20に記載のシステム。
  22. 前記候補地の組の特定が、指定された場所属性を表わす候補地を特定するための意味論的思考追跡の実行を含む
    ことを特徴とする請求項20に記載のシステム。
  23. 前記実行可能なコンピュータ・モジュールが、さらに、
    各候補地が指定された場所属性を表わす確度を示す、該候補地に関係付けられた信頼度スコア、及び、各ランドマークが指定されたランドマークを表す確度を示す該ランドマークに関係付けられた信頼度スコアのうち、少なくとも1つを決定するように構成されている
    ことを特徴とする請求項20に記載のシステム。
  24. 少なくとも1つのカーネル・モデルが円形の基底部を有し、該カーネル・モデルの振幅は関係付けられたランドマークの地図上の位置において最大であり、かつ、該関係付けられたランドマークの位置からの距離の増加に伴い該カーネル・モデルの振幅がガウス曲線に従って減衰する
    ことを特徴とする請求項20に記載のシステム。
  25. 少なくとも1つのカーネル・モデルの基底部の形状が、該カーネル・モデルに関係付けられたランドマークのタイプ、及び、地図上の該カーネル・モデルに関係付けられたランドマークの空間における境界の形状のうちの、少なくとも1つに基づいている
    ことを特徴とする請求項20に記載のシステム。
  26. 少なくとも1つのカーネル・モデルの前記振幅が、
    該カーネル・モデルに関係付けられたランドマークの前記信頼度スコア、
    該カーネル・モデルに関係付けられた該ランドマークの1つ又は複数の属性、
    該関係付けられたランドマークのタイプ、及び、
    該関係付けられたランドマークに関係付けられた評価のうちの、少なくとも1つに基づいている
    ことを特徴とする請求項20に記載のシステム。
  27. 前記発話を表す受信した信号がさらに方角を指定し、かつ、少なくともカーネル・モデルの前記振幅が該指定された方角に基づいている
    ことを特徴とする請求項20に記載のシステム。
  28. 前記候補地のランク付けは、
    1つ又は複数の候補地のそれぞれについて、
    該候補地の地図上の位置が重なる1つ又は複数のカーネル・モデルを特定するステップと、
    該候補地の地図上の位置で、各特定されたカーネル・モデルの振幅を合計して、該候補地に関係付けられたカーネル・モデルの振幅の合計を確定するステップと、
    該カーネル・モデルの振幅の合計に基づいて、1つ又は複数の候補地をランク付けするステップと、を含む
    ことを特徴とする請求項20に記載のシステム。
  29. 各カーネル・モデルの振幅の合計毎に、該カーネル・モデルの振幅の合計に、該カーネル・モデルの振幅の合計に関係付けられた候補地の信頼度スコアを乗算して、カーネル・モデルの振幅の補正された合計を生成するステップと、
    該カーネル・モデルの振幅の補正された合計に基づいて、1つ又は複数の候補地をランク付けするステップと、を含む
    ことを特徴とする請求項28に記載のシステム。
  30. 前記候補地の選択が最高ランクの候補地を選択するステップを含む
    ことを特徴とする請求項20に記載のシステム。
JP2015510440A 2012-05-03 2013-05-01 音声制御ナビゲーション・システム用のランドマークに基づく場所思考追跡 Active JP6017678B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201261642335P 2012-05-03 2012-05-03
US61/642,335 2012-05-03
US13/801,441 US9127950B2 (en) 2012-05-03 2013-03-13 Landmark-based location belief tracking for voice-controlled navigation system
US13/801,441 2013-03-13
PCT/US2013/039121 WO2013166190A2 (en) 2012-05-03 2013-05-01 Landmark-based location belief tracking for voice controlled navigation system

Publications (3)

Publication Number Publication Date
JP2015524096A true JP2015524096A (ja) 2015-08-20
JP2015524096A5 JP2015524096A5 (ja) 2016-06-23
JP6017678B2 JP6017678B2 (ja) 2016-11-02

Family

ID=49513286

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015510440A Active JP6017678B2 (ja) 2012-05-03 2013-05-01 音声制御ナビゲーション・システム用のランドマークに基づく場所思考追跡

Country Status (3)

Country Link
US (1) US9127950B2 (ja)
JP (1) JP6017678B2 (ja)
WO (1) WO2013166190A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019207918A1 (ja) * 2018-04-25 2019-10-31 ソニー株式会社 情報処理装置、情報処理方法及びプログラム

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130321400A1 (en) 2012-06-05 2013-12-05 Apple Inc. 3D Map Views for 3D Maps
US9230556B2 (en) * 2012-06-05 2016-01-05 Apple Inc. Voice instructions during navigation
US9482296B2 (en) 2012-06-05 2016-11-01 Apple Inc. Rendering road signs during navigation
US9418672B2 (en) 2012-06-05 2016-08-16 Apple Inc. Navigation application with adaptive instruction text
US9997069B2 (en) 2012-06-05 2018-06-12 Apple Inc. Context-aware voice guidance
US9886794B2 (en) 2012-06-05 2018-02-06 Apple Inc. Problem reporting in maps
US9052197B2 (en) 2012-06-05 2015-06-09 Apple Inc. Providing navigation instructions while device is in locked mode
US10319013B2 (en) 2013-10-28 2019-06-11 Square, Inc. Electronic ordering system
US10013639B1 (en) 2013-12-16 2018-07-03 Amazon Technologies, Inc. Analyzing digital images based on criteria
US10410272B1 (en) 2014-08-20 2019-09-10 Square, Inc. Predicting orders from buyer behavior
JP2016053880A (ja) * 2014-09-04 2016-04-14 株式会社ランディード 車載システム、情報処理方法、およびコンピュータプログラム
US10852151B2 (en) 2014-12-12 2020-12-01 Square, Inc. Dynamic reconfiguring of geo-fences
US10582105B2 (en) 2014-12-30 2020-03-03 Qualcomm Incorporated Changing camera parameters based on wireless signal information
US9824481B2 (en) * 2014-12-30 2017-11-21 Qualcomm Incorporated Maintaining heatmaps using tagged visual data
US10430849B1 (en) 2014-12-31 2019-10-01 Square, Inc. Propagation of customer preferences
US10127595B1 (en) * 2014-12-31 2018-11-13 Square, Inc. Categorization of items based on attributes
US10366436B1 (en) 2014-12-31 2019-07-30 Square, Inc. Categorization of items based on item delivery time
US9589290B1 (en) 2014-12-31 2017-03-07 Square, Inc. Client-side use of customer preferences
US10024683B2 (en) 2016-06-06 2018-07-17 Uber Technologies, Inc. User-specific landmarks for navigation systems
US10670415B2 (en) 2017-07-06 2020-06-02 Here Global B.V. Method and apparatus for providing mobility-based language model adaptation for navigational speech interfaces
EP3752891B1 (en) * 2018-07-30 2023-05-03 Google LLC Systems and methods for identifying and providing information about semantic entities in audio signals
BR112022000233A2 (pt) * 2019-07-08 2022-02-22 Huawei Tech Co Ltd Sistema e método para identificar pontos de interesse a partir de dentro de veículos autônomos
DE102019216877A1 (de) * 2019-10-31 2021-05-06 Robert Bosch Gmbh Vorrichtung und Verfahren zur Ansteuerung eines Aktuators
US11625605B2 (en) * 2019-12-20 2023-04-11 Nvidia Corporation Selecting computational kernel variants using neural networks
CN112652298A (zh) * 2020-12-11 2021-04-13 北京百度网讯科技有限公司 语音识别方法、装置、电子设备和存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5961571A (en) * 1994-12-27 1999-10-05 Siemens Corporated Research, Inc Method and apparatus for automatically tracking the location of vehicles
US20070257792A1 (en) * 2007-01-19 2007-11-08 Gold Steven K Brand Mapping
JP2010277200A (ja) * 2009-05-26 2010-12-09 Ntt Comware Corp 対象物検索装置及びその処理方法とプログラム

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6081782A (en) 1993-12-29 2000-06-27 Lucent Technologies Inc. Voice command control and verification system
US6321158B1 (en) 1994-06-24 2001-11-20 Delorme Publishing Company Integrated routing/mapping information
KR100256620B1 (ko) 1995-10-30 2000-05-15 모리 하루오 네비게이션장치
AU6225199A (en) 1998-10-05 2000-04-26 Scansoft, Inc. Speech controlled computer user interface
US6742021B1 (en) 1999-01-05 2004-05-25 Sri International, Inc. Navigating network-based electronic information using spoken input with multimodal error feedback
US6799201B1 (en) 2000-09-19 2004-09-28 Motorola, Inc. Remotely configurable multimedia entertainment and information system for vehicles
US6675159B1 (en) 2000-07-27 2004-01-06 Science Applic Int Corp Concept-based search and retrieval system
US7027974B1 (en) 2000-10-27 2006-04-11 Science Applications International Corporation Ontology-based parser for natural language processing
ATE297588T1 (de) 2000-11-14 2005-06-15 Ibm Anpassung des phonetischen kontextes zur verbesserung der spracherkennung
US6950793B2 (en) 2001-01-12 2005-09-27 International Business Machines Corporation System and method for deriving natural language representation of formal belief structures
US7225183B2 (en) 2002-01-28 2007-05-29 Ipxl, Inc. Ontology-based information management system and method
US6873905B2 (en) 2002-03-19 2005-03-29 Opnext Japan, Inc. Communications type navigation device
US7243085B2 (en) 2003-04-16 2007-07-10 Sony Corporation Hybrid personalization architecture
US20050043940A1 (en) 2003-08-20 2005-02-24 Marvin Elder Preparing a data source for a natural language query
US7574358B2 (en) 2005-02-28 2009-08-11 International Business Machines Corporation Natural language system and method based on unisolated performance metric
US7917492B2 (en) 2007-09-21 2011-03-29 Limelight Networks, Inc. Method and subsystem for information acquisition and aggregation to facilitate ontology and language-model generation within a content-search-service system
US8566028B2 (en) 2006-11-27 2013-10-22 International Business Machines Corporation Apparatus, system, and method for autonomously determining a set of destinations
US8930135B2 (en) 2007-04-17 2015-01-06 Esther Abramovich Ettinger Device, system and method of landmark-based routing and guidance
US8452725B2 (en) 2008-09-03 2013-05-28 Hamid Hatami-Hanza System and method of ontological subject mapping for knowledge processing applications
US20090030683A1 (en) 2007-07-26 2009-01-29 At&T Labs, Inc System and method for tracking dialogue states using particle filters
WO2009032287A1 (en) 2007-09-07 2009-03-12 Enhanced Medical Decisions, Inc. Management and processing of information
US8010364B2 (en) 2007-10-31 2011-08-30 At&T Intellectual Property I, L.P. System and method for applying probability distribution models to dialog systems in the troubleshooting domain
US8140335B2 (en) 2007-12-11 2012-03-20 Voicebox Technologies, Inc. System and method for providing a natural language voice user interface in an integrated voice navigation services environment
US8498870B2 (en) 2008-01-24 2013-07-30 Siemens Medical Solutions Usa, Inc. Medical ontology based data and voice command processing system
US8140328B2 (en) 2008-12-01 2012-03-20 At&T Intellectual Property I, L.P. User intention based on N-best list of recognition hypotheses for utterances in a dialog
US8385948B2 (en) * 2008-12-18 2013-02-26 Telefonaktiebolaget Lm Ericsson (Publ) Method and arrangement for improved positioning
US8676583B2 (en) 2010-08-30 2014-03-18 Honda Motor Co., Ltd. Belief tracking and action selection in spoken dialog systems

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5961571A (en) * 1994-12-27 1999-10-05 Siemens Corporated Research, Inc Method and apparatus for automatically tracking the location of vehicles
US20070257792A1 (en) * 2007-01-19 2007-11-08 Gold Steven K Brand Mapping
JP2010277200A (ja) * 2009-05-26 2010-12-09 Ntt Comware Corp 対象物検索装置及びその処理方法とプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019207918A1 (ja) * 2018-04-25 2019-10-31 ソニー株式会社 情報処理装置、情報処理方法及びプログラム
JPWO2019207918A1 (ja) * 2018-04-25 2021-05-27 ソニーグループ株式会社 情報処理装置、情報処理方法及びプログラム

Also Published As

Publication number Publication date
WO2013166190A3 (en) 2013-12-27
WO2013166190A2 (en) 2013-11-07
US20130297321A1 (en) 2013-11-07
JP6017678B2 (ja) 2016-11-02
US9127950B2 (en) 2015-09-08

Similar Documents

Publication Publication Date Title
JP6017678B2 (ja) 音声制御ナビゲーション・システム用のランドマークに基づく場所思考追跡
US11614336B2 (en) Mobile search based on predicted location
US11538459B2 (en) Voice recognition grammar selection based on context
US9188456B2 (en) System and method of fixing mistakes by going back in an electronic device
US10268756B2 (en) Method and apparatus for providing natural language input in a cartographic system
CN106416313B (zh) 识别与无线网络接入点相关联的实体的方法和系统
US10043520B2 (en) Multilevel speech recognition for candidate application group using first and second speech commands
US8239129B2 (en) Method and system for improving speech recognition accuracy by use of geographic information
US20150356088A1 (en) Tile-based geocoder
US20130238332A1 (en) Automatic input signal recognition using location based language modeling
US11200892B1 (en) Speech-enabled augmented reality user interface
CN110770819B (zh) 语音识别系统和方法
US20090082037A1 (en) Personal points of interest in location-based applications
US10504510B2 (en) Motion adaptive speech recognition for enhanced voice destination entry
JP7176011B2 (ja) デジタルアシスタントアプリケーションとナビゲーションアプリケーションとの間のインターフェーシング
Janarthanam et al. Evaluating a city exploration dialogue system combining question-answering and pedestrian navigation
JP7362996B2 (ja) 音声認識方法及び装置
US11175154B2 (en) Translation of verbal directions into a list of maneuvers
CN114764482A (zh) 一种位置推荐信息获得方法、装置、电子设备及存储介质
WO2024102123A1 (en) Voice input disambiguation
CN115730154A (zh) 一种poi数据搜索方法、系统及终端

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160502

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160502

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20160502

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20160627

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160830

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160928

R150 Certificate of patent or registration of utility model

Ref document number: 6017678

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250