JP2015531109A - 自然動作入力を使用する文脈的クエリ調整 - Google Patents

自然動作入力を使用する文脈的クエリ調整 Download PDF

Info

Publication number
JP2015531109A
JP2015531109A JP2015521826A JP2015521826A JP2015531109A JP 2015531109 A JP2015531109 A JP 2015531109A JP 2015521826 A JP2015521826 A JP 2015521826A JP 2015521826 A JP2015521826 A JP 2015521826A JP 2015531109 A JP2015531109 A JP 2015531109A
Authority
JP
Japan
Prior art keywords
query
user
natural motion
natural
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015521826A
Other languages
English (en)
Other versions
JP2015531109A5 (ja
JP6204982B2 (ja
Inventor
ポール ヘック,ラリー
ポール ヘック,ラリー
チンタクンタ,マドゥズーダン
アイヤー,ルクミニ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2015531109A publication Critical patent/JP2015531109A/ja
Publication of JP2015531109A5 publication Critical patent/JP2015531109A5/ja
Application granted granted Critical
Publication of JP6204982B2 publication Critical patent/JP6204982B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

コンピュータ処理に関する分野では、多くの場面で、ユーザによって照会が構築され、その結果、デバイスによって照会結果が提示される。ユーザは照会の調整を要求することができるが、多くのデバイスは、認識されているキーワードの組、声による特定のコマンド、または手による特定のジェスチャなどの十分に構造化された方法で指定された要求しか処理することができない。したがって、ユーザは、照会が自然言語において指定される場合であっても、デバイスの制約の中で調整要求をやり取りする。自然動作入力(たとえば、自然な言語音声、声の抑揚、および自然な手振り)でユーザが照会調整を指定できるようにする技法が本明細書において提示されている。デバイスは、自然動作入力を評価し、ユーザの意図した照会調整を識別し、調整された照会を生成し、調整された照会結果を提示するように構成されていてもよく、それによってユーザは、個人とコミュニケーションするのと同じようにデバイスと対話できるようになる。

Description

コンピュータ処理に関する分野では、多くの場面で、所望の組のファイルを求めるファイルシステム内の検索、照会(query、クエリ)条件を指定するデータベースのselect照会、オブジェクトセットにおけるオブジェクトのフィルタリングもしくは順序づけ、または一致するウェブページの組を識別するためにウェブ検索エンジンに提出される検索クエリなど、ユーザによって提出される照会が必要とされる。これらおよび他の場面において、照会は、キーワードもしくは他の論理的な基準のテキスト入力、解析されて照会になり得るテキストもしくは音声による自然言語入力、または現在の検出位置近くの関心位置を提示する全地球測位システム(GPS: global positioning system)受信機などの自動化された文脈的(contextual)提示といったさまざまな方法でユーザによって提出され得る。
これらおよび他の場面では、デバイスは照会を使用して照会結果を(たとえば、直接的に照会を実行し、マッチング結果を識別するか、または照会(クエリ)を検索エンジンに提出(submit)し、照会結果を受け取ることによって)生成することができる。デバイスは、ユーザの現在検出されている位置に対する各レストランの近接度に従ってレストランの検索を命令することなどによって、文脈的ヒントを照会に追加してもよい。ユーザが照会結果に満足しない場合、デバイスはユーザに新たな照会の入力を可能にしてもよく、異なる照会結果を提示してもよい。あるいはデバイスは、ユーザが、再提出のための照会のテキストを手動で編集するためにキーボードを使用するなどして、ユーザ入力の従来の形で照会を調整できるようにし、タッチセンシティブディスプレイ、マウス、もしくはトラックボールなどのポインティングデバイスを使用して検索結果の一部を選択できるようにし、または検索結果の次の部分集合を示すなどの種々の動作に対応するキーワードを入力できるようにしてもよい。内容および/または照会の順序を調整するために、動作をデバイスの従来のデータ入力技法に対応づけるためのこれらおよび他の技法。
この概要は、「発明を実施するための形態」においてさらに後述するコンセプトから選択したものを簡単な形で紹介するために提供される。この「発明の概要」は、特許請求される主題の主要素または本質的な特徴を指定することは意図されておらず、また、と特許請求される主題の範囲を限定するために使用されることも意図されていない。
従来の入力または文脈的ヒントを使用して照会を更新することは有用であるが、これらの技法は、ユーザが自然動作入力で指定することができる多くのタイプの照会調整を適切に適用しない可能性がある。たとえば、ユーザは、「次へ」や「再開」などのデバイスによって認識される照会変更キーワードに一致せず、「結果をさらに表示する」や「最初のページに戻る」などの他の個人に認知され得る自然言語の入力を表す言語入力を提示することができる。代替または追加で、ユーザは、声の抑揚、宙で行う手振り(たとえば、ディスプレイには触れず、ディスプレイ上に提示される検索結果に対する指差し)、および検索結果の部分に対する視覚的注視フォーカスなど、デバイスの任意の入力コンポーネントには物理的に触れないノンバーバルコミュニケーションに対応する自然な動作を使用することができる。認識、評価、および照会を調整するためのアプリケーションは、デバイス、検索結果のサーバ、および/または自然動作入力を、照会結果を調整する呼び出し可能な動作に翻訳する「動作仲介役」などの異なるサーバによって実施され得る。自然動作入力の検出、評価、およびアプリケーションを介した照会結果の調整におけるこれらおよび他の変形形態は、本明細書で提示される技法に従って実現され得る。
上記および関連する目的の達成のために、以下の説明および付属の図面に、ある種の例示の態様および実装形態を記載してある。これらは、1つまたは複数の態様が使用され得るさまざまな方法を示すが、示しているのはその一部にすぎない。本開示の他の態様、利点、および新規な特徴は、以下の「発明を実施するための形態」を添付の図面とともに検討することで明らかになろう。
照会の提出および調整と、キーワードに基づく照会結果とに注目した例示的な場面の図である。 本明細書に示す技法による、照会の提出および調整と、自然動作入力に基づく照会結果とに注目した例示的な場面の図である。 本明細書に示す技法に従った、サーバを使用して照会結果をデバイスに提示する例示的な方法を示す流れ図である。 本明細書に示す技法による、照会結果をデバイスに提示するように構成されたサーバに注目した例示的な場面の図である。 本明細書に示す技法に従った、デバイスによる照会結果の提示を補助する例示的な方法を示す、少なくとも1つのエンティティを含む流れ図である。 本明細書に示す技法による、デバイスによる照会結果の提示を補助するように構成されたサーバに注目した、少なくとも1つのエンティティを含む例示的な場面の図である。 本明細書に示す技法に従った、ユーザから受け取った照会に応答して照会結果を提示する例示的な方法を示す流れ図である。 本明細書に提示される技法に従った、デバイスのプロセッサで実行されたとき、デバイスに照会の照会結果を提示させる命令を含む例示的なコンピュータ可読ストレージデバイスの図である。 本明細書に示す技法に従った、エンティティ指示(reference)およびエンティティ動作に関連づけられたエンティティを含む、照会結果の提示に注目した例示的な場面の図である。 本明細書に示す技法に従った、エンティティへの照会結果のフォーカスと、エンティティに関連するエンティティ動作の提示とに注目した例示的な場面の図である。 本明細書に示す技法に従った、照会結果の提示のコンテキストにおける自然ユーザ動作の曖昧性除去に注目した例示的な場面の図である。 本明細書に記載する規定のうちの1つまたは複数が実装できる例示的なコンピュータ処理環境の図である。
次に、特許請求される主題を図面を参照しながら説明する。図面全体を通して、同様の参照符号は同様の要素を指すために使用される。以下の説明では、説明する目的で、特許請求される主題の十分な理解を実現するための数多くの具体的な詳細を記載している。しかしながら、特許請求される主題はこういった具体的な詳細なしで実践できることは明らかであると思われる。他の例では、特許請求される主題の説明を容易にするために、構造およびデバイスをブロック図の形で示してある。
A.はじめに
コンピュータ処理に関する分野では、多くの場面で、ユーザによる照会(クエリ)が、ユーザに提示する照会結果(クエリ結果)を生成するために実行されるデバイスの提出が必要とされる。第1の例として、ユーザは、関心ファイルの説明(たとえば、部分的なファイル名の一致、ファイルのタイプ、または生成日付の範囲)を含む照会を提出することができ、デバイスは、ローカルファイルシステムを調べ、当該説明に一致するファイルのリストを提示することができる。第2の例として、ユーザは、SQL(Structured Query Language)におけるSELECT照会などのフィルタリングデータベース照会を提示することができ、デバイスは、その照会によって識別される記録を求めてデータベースを検索することができる。第3の例として、ユーザは、eメールデータベースにおけるeメールメッセージなどのオブジェクトセットの基準を提供することができ、デバイスは、その基準に一致するメッセージを識別することができる。第4の例として、ユーザは、検索クエリをウェブの検索エンジンに提出することができ、検索エンジンは、その検索クエリに一致するウェブページの説明およびリンクを含む検索結果の組を識別および提示することができる。照会結果は静的に提示されてもよく、またはデバイスによって、ユーザが、たとえば、照会結果におけるエンティティ(たとえば、ウェブ検索結果に含まれるウェブページ)を選択し、ユーザに対して、選択されたウェブページのコンテンツを提示することによって照会結果と対話できるようになってもよい。
これらおよび他の場面では、ユーザは、多くの方法で照会を提示することができる。第1の例として、ユーザは、キーボードなどのテキスト入力デバイスまたはマウス、スタイラス、もしくはタッチセンシティブディスプレイなどのポインティングデバイスを使用して、ウェブ検索クエリ結果に提示されるウェブページのタイトルまたは本文に含まれるべきキーワードの組など、照会の詳細を指定することができる。一部のそのような場面では、ユーザは、デバイスに対して照会内容を発話または手書きで伝えることができ、デバイスは、音声または手書き解析器を使用して、発話内容を識別することができる。さらに、照会は、キーワード、日付範囲を表す数字、およびブール演算子などの論理的な基準に従って指定されるか、または「自然言語」の照会として提出されてもよく、ここではユーザは、別の個人に自然に話しかけるときのように、求めるデータを表す文を発する。これらの場面では、デバイスは、ユーザの音声によって指定される基準を識別するために、自然言語字句解析器を使用して照会を解析することができる。さらに、これらおよび他の場面において、照会結果に十分に満足しないユーザは、照会を構築する際にユーザの意図により近い照会結果を生成および提示するために、照会を調整しようと努めることができる。たとえば、「ワシントン」を求めてウェブを検索するユーザは、米国のワシントン州と、ジョージワシントンという名前の個人の両方に関する多くのページに行き当たり、関心があるのは後者のみであることがある。そこでユーザは、両方の「ジョージワシントン」を指定する新たな照会を入力して、所望のトピックに近づくように照会結果を調整することができる。
図1は、デバイス104のユーザ102が第1の照会108を提出するところに注目した例示的な場面の図を表す。第1の時点100において、デバイス104は、ユーザ102に、検索エンジンのホームページなどであり、第1の照会108をユーザ102から受け取るように構成された照会テキスト入力コントロール114を含む検索ページ112を提示することができる。したがってユーザ102は、ユーザ102にとって関心のあるページを識別する一組のキーワード110を提出することができる。デバイス104は、提出に作用することを決めると、第1の照会108を照会入力コントロール114に提示することができ、第2の時点116において、照会結果118を完了するか受け取ったとき、照会結果118をユーザ102に提示することができる(たとえば、照会108のキーワード110に一致する、レストラン名簿の中で特定されたレストランなどの一組のエンティティ120)。ユーザ102が照会結果118満足しない場合、ユーザ102は、第3の時点112において、より狭いキーワード110を含むように第1の照会108の内容を手動で編集するなどによって、異なるキーワード110で第2の照会108を構築し、第2の照会108を提出して、異なるエンティティ120を有する第2の照会結果118を閲覧することができる。第4の時点124において、ユーザ102は、タッチ選択126をデバイス104のディスプレイ106で実施して、エンティティ120を選択(たとえば第1のエンティティ120のエントリをタッチ)することができ、デバイス104は、エンティティ120のウェブページ128など、選択されたエントリについてより詳しく提示することによって応答することができる。さらに、ウェブページ128は、カフェの営業時間を閲覧したり、カフェのメニューを閲覧したりするなど、エンティティ120に関する一組の動作130を含み得る。このように、デバイス104によって、ユーザ102はキーワードに基づく照会108を入力および調整できるようになり、照会結果106と対話できるようになり得る。
図1の例示的な場面において提示される技法は、方法によって変わり得る。たとえば、ユーザ102は、一組のキーワード110として、基準および論理結合子の組を含むフィルタとして、構造化照会言語(SQL)などの言語でのデータ照会として、または自然な人間言語で提示される要求などの自然言語照会として、照会108を入力することができる。さらに、ユーザ102は、第1の照会によって提供される入力を手動で変更すること、または第1の照会108とは異なる第2の照会108を構築することによって、照会108を調整することができる。
しかしながら、図1の例示的な場面およびその変形で提示される技法において、いくつかの欠点が認められることがある。第1の例として、ユーザ102がデバイス104の入力コンポーネントに通じていない場合(たとえば、ユーザ102がキーボードまたはマウスに熟達していない場合)、そのような入力コンポーネントを使用して照会108を指定することは困難かつ非効率であり得る。第2の例として、デバイス104が処理するように構成されている照会108のフォーマットにユーザ102が慣れていない場合(たとえば、構造化照会言語、または基準および論理演算子を指定する方法)、ユーザ102は、デバイス104が満足に処理できる適切に構築された照会108を提示することができない場合がある。第3の例として、デバイス104が一組のキーワードを使用し、ユーザ102がそのようなキーワードを正しく使用しない場合、照会108は所望の照会結果118を返せないことがある。たとえば、「選択」および「次」などの特定の発声キーワードを処理する音声起動型アプリケーションを備えるデバイス104は、識別されるキーワードを知らないまたは適切に話せないユーザ102には適していないことがある。第4の例として、照会108を調整するために、ユーザ102は、照会108を特定の方法で調整するようにデバイス104に単に求めるのではなく、前述の照会108の内容を編集する(たとえば、キーワード110を手動で追加、削除、または変更することによる)か、あるいは新たな照会108を開始する。これらおよび他の欠点は、図1の例示的な場面で提示されたものなどの照会技法の使用から生じることがある。
B.提示する技法
直観的人間コミュニケーションをより効果的に使用してユーザ102が照会108を開始および調整できるようにする技法が、本明細書に提示されている。特に、図1の例示的な場面に提示される欠点の多くが、ユーザ102がデバイス104と自然にコミュニケーションできるようにせず、またデバイス104がそのような自然なユーザ入力を解釈できるようにせず、ユーザ102に、デバイス104の論理的な制約および処理に従って入力を強いる(たとえば、ユーザ102に、デバイス104によって使用される構造化照会言語または論理演算子の組を学習するように指令する)ことに起因することが理解されよう。デバイス104は声による照会などの自然言語入力を処理することが可能であるが、そのような自然言語の入力の使用には、自然言語入力を使用してデバイス104の機能とは対話せず、プレーンテキスト(口述入力される文書など)の受け取りしかできないという制約がよくある。たとえば、口述入力を受け取るように構成されたアプリケーションは、プレーンテキストの文書に対する自然言語の入力を受け取ることができ、テキストの内容を変更するために発話キーワードの組を指定することができるが、「この次の文はボールド体」などのテキストの内容を変更するコマンドを受け取るために自然言語の入力が利用できないことがある。同様に、描画アプリケーションによって、ユーザはタッチセンシティブデバイスでのタッチ入力によるフリーハンドでの描画が可能になり、また、ズームインまたはアウトおよび異なる描画ツールの選択などのさまざまな描画コマンドを指定する一組のタッチジェスチャを指定することができるが、自然ユーザ動作として提供される描画コマンドをやはり含むフリーハンドの図を解釈できないことがある。すなわち、ユーザ102は、各コマンドを呼び出す特定の口頭キーワードおよびタッチジェスチャ、ならびにキーボードやタッチパッドなどの入力デバイスの詳細を学習することによって、口述入力アプリケーションおよび描画アプリケーションと通信しており、ユーザ102がデバイス104と自然に対話できるようにはせず、また、そのような自然動作入力を内容およびコマンドの両方の指定として解釈するようにデバイス104を構成していない。
本明細書に提示される技法によって、ユーザ102は、さまざまな形の自然ユーザ入力(たとえば、音声またはテキスト入力の自然言語、声の抑揚、デバイス104のいかなるコンポーネントにもタッチせずに行う手振り、およびディスプレイ106の特定の要素上における視覚的フォーカス)を使用してデバイス104と対話できるようになり、ここでは、そのような自然ユーザ入力は、デバイス104にコンテンツおよびコマンドの両方を指定する。具体的には、本明細書に提示される技法によって、照会108を調整し、調整された照会結果118を提示するために、ユーザ102は、自然ユーザ動作をし、そのような自然ユーザ動作を解釈するようにデバイス104を構成することによって、照会108を調整できるようになる。重要なことに、ユーザ102は、デバイス104の入力コンポーネントまたはデバイス104が使用できるコマンドについて何も理解する必要がなく、話す、ジェスチャする、およびその他の方法で、別の個人の対してするのと同じようにデバイス104とコミュニケーションすることができ、デバイス104は、そのような自然動作入力からユーザ102の意図を解釈し、それを受けて照会108を調整するように構成されていてもよい。さらに、そのような自然動作入力は、入力における曖昧性を解消し、ユーザ102の自然なコミュニケーションの全範囲に応答するために、発声、声の抑揚、指差しなどの手振り、および視覚的フォーカスといったモダリティの組み合わせを利用することができる。
図2は、ユーザ102の自然ユーザ動作による照会108の調整に注目した例示的な場面の図を提示する。この例示的な場面では、第1の時点200において、ユーザ102は第1の照会108を(たとえば、「バージニア」および「レストラン」などの一組のキーワード110、またはキーボードでタイプされるかもしくはデバイス104に話しかけられた自然言語照会として)指定し、デバイス104は、ディスプレイ106に、特定のエリアにおけるレストランのリストおよび一致する組のレストラン120を要求する照会108などの一組のエンティティ120を含む照会結果118を提示することができる。しかしながら、第2の時点202において、ユーザ102は、カフェなど、レストランの特定のタイプに結果を限定することなどによって、デバイス106に照会を変更するように求める要求として、自然ユーザ入力204を提示することができる。図1の例示的な場面とは対照的に、ユーザ102の調整要求は、デバイス104によって認識される限定されたコマンドの組(たとえば、「挿入、キーワード、カフェ)にも、自然言語またはキーワードの新たな組(たとえば、「新たな照会:バージニアカフェ」)での再構築された照会108の提示にも制限されず、ユーザ102が別の個人に求めるような、照会108を変更するための自然言語の要求に制限される。第2の時点202において、デバイス104は、第1の照会108における「レストラン」というキーワードをレストラン206のタイプについてより具体的なキーワードに置き換える要求など、照会調整206を識別するための自然動作入力204を調べることができる。したがって、デバイス104は、調整された照会208を生成し、調整された照会208を実行し、自然ユーザ入力204で示されたそのより具体的な基準に一致するレストランを含むエンティティ120などの調整された照会結果210を提示することができる。
図2にさらに示すように、第3の時点212において、ユーザ102は、自然言語の語句「それ」と発声しながら、ディスプレイ106のエンティティ120を手で指差す214ことによって、2つの形態の自然動作入力を同時に提示してもよい。デバイス104は、これらの形態の自然ユーザ入力204を合わせて、第1のカフェの照会結果など、ユーザ102が214において手で指差しているディスプレイ106の上の位置に表示されているエンティティ120のフォーカスを示すものとして解釈できる。デバイス104は、照会108を調整して、示されたエンティティ120に再びフォーカスする(たとえば、照会を第1のカフェの名前に限定する)ことによって、またはユーザ102のエンティティ120へのフォーカスを単に反映することによって、たとえばエンティティ120をユーザの選択の表示としてハイライトすることによって、エンティティ120の検索結果のハイパーリンクを起動するなど、エンティティ120で実施されるべき動作として、この推論に応答することができる。第4の時点218において、ユーザ102は、照会108をさらに調整する追加の自然動作入力204を発することができる。たとえば、ユーザ102が「開いていますか?」などの質問をした場合、デバイス106はこの自然動作入力204を、キーワード「時間」を追加する照会調整206を指定するものとして評価することができ、カフェの営業時間を示す調整された照会結果210を生成し、提示するための調整された照会208を実行する。
図2の例示的な場面に提示されている技法は、特に図1の例示的な場面に提示されている技法に対していくつかの利点を示す。第1の例として、ユーザ102はデバイス106の入力コンポーネントの動作を理解する必要がない。第2の例として、ユーザ102は、デバイス106の特定のコマンド、または照会言語もしくは論理演算子の性質に対応する口頭キーワードまたはタッチジェスチャなど、デバイス106の機能を呼び出すための機構を学習し、それに適応する必要がない。さらに、デバイス106によって認識されるコマンドにユーザ102が通じている場合であっても、ユーザ102は、内容を指定するために提示される自然言語入力(たとえば、文書のテキストとして解釈されるべき音声または絵柄として解釈されるべきタッチ入力)と、デバイス106の機能を呼び出す制約のある入力(たとえば、文書のフォーマッティングオプションを呼び出すための発話キーワードまたは描画コマンドを呼び出すための特定の手振りを)とを切り替える必要がない。むしろ、ユーザ102は、内容を指定し、かつ、コマンドをデバイス106に発するために、別の個人とコミュニケーションするかのようにデバイス106と簡単にやり取りし、デバイス106は、ユーザ102の意図を解釈するように構成されている。このように、デバイス106は、本明細書に示す技法に従って、ユーザ102が、照会108の提出および調整においてより自然に対話できるようにする。
C.実施形態
本明細書に提示される技法は種々の実施形態に従って実装され得る。特に、また以下の検討において提示するように、そのような実施形態の要素のアーキテクチャは変わり得る。たとえば、自然動作入力は、自然ユーザ入力204を受け取るデバイス106によって、照会108の照会結果118を提供するサーバによって、かつ/またはユーザ102によって操作されるデバイスおよび照会結果118を提供するサーバの両方を容易にする異なるサーバによって、解釈され、照会108の照会調整206に翻訳され得る。
図3および図4はともにこれらの技法の第1の実施形態を提示する。図3は、照会結果106をデバイス104のユーザ102に提示するためのプロセッサを有するサーバを構成する例示的な方法300の図を提示する。例示的な方法300は、たとえば、サーバのメモリコンポーネント(たとえば、揮発性メモリ回路、ハードディスクドライブのプラッタ、ソリッドステートストレージデバイス、または磁気もしくは光学ディスク)に格納された、サーバのプロセッサで実行されるとサーバに本明細書に示す技法を使用させる命令一式として実装され得る。例示的な方法300は302から開始し、サーバのプロセッサ上で命令の実行304を含む。特に、命令は、ユーザ102が提供した第1の照会108をデバイス104から受け取ったとき、第1の照会108を実行306して照会結果108を生成するように構成されている。命令はまた、ユーザ102の自然動作入力204に含まれているとき、第1の照会108の照会調整206(たとえば、ユーザ102が照会108を調整するためのさまざまな自然言語の要求に使用し得る異なる語句、およびその結果として照会108に適用され得る照会調整206)を示す少なくとも1つの自然動作要求を識別308するように構成されている。命令はまた、デバイス106に、照会結果118ならびに自然動作入力204および対応する照会調整206に関連する自然動作要求を提示310するように構成されている。照会結果118およびユーザ102から受け取ったさまざまなタイプの自然動作入力204を満たすために適用され得る照会調整206のタイプを提供したことで、例示的な方法300は、本明細書に提示される技法に従って、サーバに照会結果118をデバイス104に提示させ、したがって312で終了する。
図4は、このアーキテクチャを使用する例示的な場面400の図を提示する。この例示的な場面400では、デバイス104は照会108をサーバ402(ウェブサーバなど)に提示し、サーバは、照会108によって識別される一組のエンティティ404を含む照会結果118を提供することによって応答することができる。さらに、サーバ402は、各照会調整206(たとえば、第1の照会108に対して追加、変更、または削除するキーワード)に対応し得る一組の自然動作入力204(たとえば、自然言語の語句)など、一組の自然動作入力メタデータ406を提供することができる。照会108および自然動作入力メタデータ406をデバイス104に送達することによって、サーバ402は、本明細書に示す技法に従って、デバイス104との対話およびユーザ102が自然動作入力204によって照会108を調整することを容易にする。
図5および図6はともにこれらの技法の第2の実施形態を提示する。図5は、デバイス104による照会結果のユーザ102への提示を容易にするためのプロセッサを有するサーバを構成する例示的な方法500の図を提示する。図3の例示的な方法300とは対照的に、図5の例示的な方法500は、異なるソースから提示される照会結果118に対する自然動作入力204の評価を容易にするために呼び出され得る。例示的な方法500は、たとえば、サーバのメモリコンポーネント(たとえば、揮発性メモリ回路、ハードディスクドライブのプラッタ、ソリッドステートストレージデバイス、または磁気ディスクもしくは光学ディスク)に格納された、サーバのプロセッサで実行されるとサーバに本明細書に提示される技法を使用させる命令一式として実装され得る。例示的な方法500は502から開始し、サーバのプロセッサ上で命令を実行504することを含む。特に、命令は、第1の照会108および照会結果118をデバイス104から受け取ったとき、照会結果118の各エンティティ120について、ユーザ102が実施できる少なくとも1つの自然動作入力204および第1の照会108の対応する照会調整206に関連する少なくとも1つのエンティティ動作を識別506するように構成されている。たとえば、検索結果ページ内の各検索結果について、サーバは、各検索結果に全般的に関連する動作(たとえば、検索結果で指定されたハイパーリンクを辿る、または検索結果をブックマークする)および/または検索結果に固有に関係する動作(たとえば、レストランのウェブページを表す検索結果に対して、用語「時間」、「位置」、または「メニュー」を追加してウェブ検索クエリをレストランに関する情報のタイプに限定する)を識別することができる。命令はまた、デバイス104に、エンティティ102に関連するエンティティ動作、自然動作入力204、および対応する照会調整206を提示508するように構成されている。ユーザ102から受け取る自然動作入力204のさまざまなタイプを満たすように適用され得る照会調整206のタイプを識別することによって照会結果118の提示を容易にしたことで、例示的な方法500は、サーバにデバイス104が照会結果118をユーザ102に提示することを容易にさせており、したがって510で終了する。
図6は、デバイス104によって別のソースから受け取った照会結果118について、照会結果118のエンティティ404に関連する動作を識別する動作仲介役602として構成されたサーバに注目した例示的な場面600の図を提示する。デバイス104が照会108および照会結果118を動作仲介役602に送ると、動作仲介役602は照会結果118を調べて、各エンティティ404に利用可能な動作を識別することができる。たとえば、動作仲介役602は、デバイス104に、各エンティティ404について、さまざまな動作604に関連する自然動作入力204、およびそのような動作を呼び出すために照会108に適用され得る照会調整206を識別する一組の自然動作入力メタデータ406を送ることができる。照会結果118のソースおよびデバイス104そのような照会調整206に対応する自然ユーザ入力204の識別に参加しなかったとしても、デバイス104は、照会結果118の提示に応答してユーザ102から受け取った自然動作入力204の処理を助けるためにこのメタデータを利用することができる。
図7は、ユーザ102によって提示された照会108を評価するようにデバイス104を構成する例示的な方法700を含む、これらの技法の第3の実施形態の図を提示する。例示的な方法700は、たとえば、サーバのメモリコンポーネント(たとえば、揮発性メモリ回路、ハードディスクドライブのプラッタ、ソリッドステートストレージデバイス、または磁気もしくは光学ディスク)に格納された、サーバのプロセッサで実行されるとサーバに本明細書に提示される技法を使用させる命令一式として実施され得る。例示的な方法700は702から開始し、サーバのプロセッサ上で命令の実行704を含む。特に、命令は、ユーザ104から第1の照会108を受け取る706と、第1の照会108を実行706して第1の照会結果118を生成し、第1の照会結果118をユーザ102に提示708するように構成されている。命令はまた、自然動作入力204をユーザ102から受け取る710と、自然動作入力204において、第1の照会結果118に関係する少なくとも1つの照会調整206を識別712し、少なくとも1つの照会調整206によって調整された第1の照会108を含む調整された照会208を生成714し、調整された照会208を実行716して調整された照会結果210を生成し、調整された照会結果210をユーザ102に提示718するように構成されている。特に、デバイスは、直接的に自然動作入力204を評価すること、図4の例示的な場面400などにおいて、照会結果118を備えた自然動作入力メタデータ406を利用すること、または図6の例示的な場面600などにおいて、動作仲介役602を呼び出して、照会結果118に適用可能な自然動作入力204を識別することによって、識別を行うことができる。これらの変形形態のいずれにおいても、例示的な方法700は、本明細書に示す技法に従って、照会108および照会結果118の処理、提示、および調整を実現しており、したがって720で終了する。
さらに別の実施形態は、本明細書に提示される技法を適用するように構成されたプロセッサが実行可能な命令を含むコンピュータ可読媒体を含む。そのようなコンピュータ可読媒体には、たとえば、メモリ半導体(たとえば、半導体スタティックランダムアクセスメモリ(SRAM: static random access memory)を利用した半導体、ダイナミックランダムアクセスメモリ(DRAM: dynamic random access memory)、および/またはシンクロナスダイナミックランダムアクセスメモリ(SDRAM: synchronous dynamic random access memory)技術)、ハードディスクドライブのプラッタ、フラッシュメモリデバイス、または磁気もしくは光学ディスク(CD-R、DVD-R、またはフロッピーディスクなど)といった有形のデバイスを含むコンピュータ可読記憶媒体が含まれてもよく、これは、デバイスのプロセッサで実行されるとデバイスに本明細書に提示される技法を実装させるコンピュータ可読命令の組を符号化する。そのようなコンピュータ可読媒体にはまた、さまざまな物理現象(たとえば、電磁信号、音波信号、または光信号)を介して、また、(たとえば、イーサネットまたは光ファイバケーブルを介した)さまざまな有線場面および/または無線場面(たとえば、WiFiなどの無線ローカルエリアネットワーク(WLAN: wireless local area network)、Bluetoothなどのパーソナルエリアネットワーク(PAN: Personal Area Network)、またはセルラーもしくは無線ネットワーク)において伝搬させることができる信号などのさまざまなタイプの通信媒体を(コンピュータ可読記憶媒体とは区別されるクラスの技法として)が含まれてもよく、これは、デバイスのプロセッサで実行されるとデバイスに本明細書に提示される技法を実装させるコンピュータ可読命令の組を符号化する。
これらの方法で案出される例示的なコンピュータ可読媒体は図8に示してあり、この図では、実装形態800は、コンピュータ可読データ804が符号化されているコンピュータ可読媒体802(たとえば、CD-R、DVD-R、またはハードディスクドライブのプラッタ)を含む。そしてこのコンピュータ可読データ804は、本明細書に記載された原理に従って動作するように構成されたコンピュータ命令806の組を含む。そのような一実施形態において、プロセッサが実行可能な命令806は、図3の例示的な方法300、図5の例示的な方法500、および/または図7の例示的な方法700など、グラフィックのコンピュータ処理環境におけるユーザインターフェースを提示する方法を実施するように構成されていてもよい。このコンピュータ可読媒体のいくつかの実施形態は、プロセッサが実行可能なこのように構成された命令を格納するように構成されたコンピュータ可読ストレージデバイス(たとえば、ハードディスクドライブ、光学ディスク、またはフラッシュメモリデバイス)を含んでいてもよい。本明細書に提示される技法に従って動作するように構成された多くのそのようなコンピュータ可読媒体は、当業者によって案出され得る。
D.変形形態
本明細書に提示される技法は多くの態様において変形形態で実装することができ、いくつかの変形形態は、さらに別の利点を提示することができ、かつ/またはこれらおよび他のアーキテクチャや実装形態の他の変形形態に対する欠点を低減することができる。さらに、いくつかの変形形態は組み合わせて実施することができ、いくつかの組み合わせは、相乗的な作用によって、さらに別の利点および/または低減した欠点を特徴とすることができる。
D1.場面
これらの技法の実施形態の間で変わり得る第1の態様は、そのような技法が使用され得る場面に関する。
この第1の態様の第1の変形形態として、これらの技法は、ワークステーション、サーバ、キオスク、ノートおよびタブレットコンピュータ、移動体電話、テレビ、メディアプレーヤ、ゲームコンソール、パーソナル情報管理装置、ならびにそれらの組み合わせを含むさまざまなタイプのデバイス104で利用することができる。これらのデバイスは、固定作業空間、リビングルーム、公共スペース、歩行中、または車両などの移動環境といったさまざまな状況で使用され得る。さらに、また図4、図6、および図7の対照的な例示的な方法に示されるように)、そのような解決策のアーキテクチャおよび分配は変わり得るため、利用可能な自然動作入力204および対応する照会調整206を識別する第1のデバイス、ならびに対応する自然動作入力204をユーザ102から受け取ったとき照会調整206を適用することによってそのような情報を利用する第2のデバイス。
この第1の態様の第2の変形形態として、これらの技法は、多くの形態の自然動作入力204を利用することができる。たとえば、デバイスは、自然動作入力タイプの組から選択される自然動作入力タイプのさまざまな形態の自然動作入力204を受け取ることが可能であってもよく、これには、マイクロホンが受け取る話された言葉または声の抑揚、タッチセンシティブデバイスへの手書きなどの書かれた言葉、タッチセンシティブディスプレイに触れるタッチジェスチャ、スチルカメラもしくはモーションカメラで検出されるがデバイス104のいずれのコンポーネントにも触れない手振り、またはデバイス104のディスプレイ106の上の位置もしくは物理世界におけるオブジェクトに向けられる光学的注視などの光学的な動きが含まれる。
この第1の態様の第3の変形形態として、これらの技法は、ファイルシステム内のファイルの検索、データベース内の記録の照会、eメール格納部内のeメールメッセージなどのオブジェクトセット内のオブジェクトのフィルタリング、およびコンテンツウェブ内のウェブページのウェブ検索などといった多くのタイプの照会108および照会結果118に適用され得る。さらに、照会108は、多くの方法(たとえば、キーワードの組、構造化照会言語などの言語での構造化された照会、ブール結合子との基準の組、または自然言語照会)で指定されてもよく、照会結果118は、多くの方法(たとえば、ソートされた、またはソートされていないリスト、画像のサムネイルバージョンなどの照会結果118におけるエンティティ120のプレビュー表現の組、または照会108に一致する単一のエンティティ120の選択)で提供されてもよい。当業者は、本明細書に提示される技法が利用され得る場面の多くの変形形態を特定することができる。
D2.照会調整の識別
技法の各実施形態の間で変わり得る第2の態様は、自然動作入力204を評価し、照会調整206を識別し、照会調整206を照会106に適用して、調整された照会208および調整された照会結果210を生成するやり方に関する
この第2の態様の第1の変形形態として、各自然動作入力204に関連する照会調整206は、(図5の例示的な場面500と同様に)照会結果118とともに受け取られてもよい。たとえば、第1の照会結果118は、自然動作要求に関連する少なくとも1つの照会調整206を指定することができ、照会結果118を提示するデバイス104は、自然動作入力204をユーザ102から受け取ったとき、自然動作入力204における、第1の照会結果108により指定される自然動作要求を識別し、自然動作要求に関連する照会調整206を選択することができる。この変形形態は、自然動作入力204および対応する照会調整206を部分的に事前評価することによって、デバイス102の演算負担を低減することができ、これは演算リソースが限られているポータブルデバイスに有利であり得る。あるいは、デバイス104は、第1の照会結果118を受け取ったとき、第1の照会結果118を評価して、第1の照会108の照会調整206を示す少なくとも1つの自然動作要求を識別することによって、照会調整206を識別することができ、自然動作入力204をユーザ102から受け取ったとき、自然動作入力204における、第1の照会結果118によって指定される自然動作要求を識別し、自然動作要求に関連する照会調整206を選択する。この変形形態では、デバイス104はまず、照会結果118を求めてユーザ102が指定することができる自然動作要求のタイプを予測し、次いでこの情報を格納し、ユーザ102から受け取る自然動作入力204を評価するために使用する。さらに別の代替形態として、デバイス104は、自然動作入力204を受け取ったとき、対応する照会調整206を識別するために自然動作入力204の評価全体を実施するように構成されていてもよい。
この第1の態様のこの第1の変形形態のさらなる例として、デバイス104における評価がさまざまな方法で実装され得る。たとえば、コンピュータ処理環境(オペレーティングシステム、仮想マシン、または管理実行時間など)におけるアプリケーションを実行するデバイス104について、照会108をユーザ102から受け取り、照会結果118をユーザ102に提示するアプリケーションによって評価が実施され得る。あるいは、調整された照会結果210をアプリケーションに提示できるコンピュータ処理環境によって評価が実施され得る。たとえば、コンピュータ処理環境は、アプリケーションが呼び出すことができるアプリケーションプログラミングインターフェース(API: application programming interface)に照会結果118およびユーザ102から受け取った自然動作入力204を提供することができ、APIは調整された照会208で応答することができる。あるいは、コンピュータ処理環境は、照会結果118のアプリケーションへの送達を監視することができ、たとえば、ウェブブラウザから検索エンジンへ出された元の照会108を遮断し、照会108を調整し、調整された照会結果210を第1の照会結果118の代わりにウェブブラウザに提示することによって、ユーザ102から受け取った自然動作入力204に対応する照会調整206を実施することができる。
この第2の態様の第2の変形形態として、照会結果118は、照会調整206になる自然動作入力の受け取りを容易にするように変形されてもよい。第1のそのような例として、第1の照会結果118は少なくとも1つのエンティティを含むことができ、第1の照会結果118はエンティティに関する自然言語のエンティティ指示を挿入することができる。あるそのような場面として、照会結果118は検索結果の組を含むことができるが、ユーザ102が音声などの自然動作入力を使用して特定の検索結果を識別するのは困難なことがある。その代わり、検索結果は、ユーザが自然動作入力で指示できるようになる数字とともに提示されてもよい(たとえば、「3番の結果を表示してください」)。これらの自然言語のエンティティ指示は、照会結果118を返すサーバによって含められてもよいし、デバイス104によって挿入されてもよい。
第2のそのような例として、デバイス104はさまざまな入力コンポーネントを提示することができ、その一部は照会結果118に関連していなくてもよい。たとえば、イベントに関する情報を探しているとき、ユーザ102はデバイス104のコンピュータ処理環境によって提供されるカレンダアプリケーションを参照することができる。カレンダアプリケーションが照会結果118との直接的な関連を有していない可能性があるが、ユーザによるカレンダへのアクセスとカレンダからの日付の選択は、照会調整206を要求する自然動作入力として解釈されてもよく、デバイス104はこの入力コンポーネントによってユーザから提供された入力コンポーネント値を使用して照会調整206を構築することができる。
この第2の態様の第3の変形形態として、デバイス104は、照会調整206をさまざまな方法で利用して調整された照会結果210を生成することができる。第1のそのような例として、デバイス104は、第1の照会108を再構築して調整された照会208を生成し、それをサーバに送ることができる。第2のそのような例として、デバイス102は、照会結果118への照会調整206の効果を認識することができ、調整された照会208をサーバに戻す必要なく、調整された照会結果210を生成することができる。たとえば、デバイス102は、ユーザ102が第1の照会結果118における一組のエンティティを特定のエンティティに対してフィルタリングするように要求したことを認識することができ、他のエンティティを第1の照会結果118から削除して、調整された照会結果210を生成することができる。
この第3の態様の第4の変形形態として、照会結果118は、照会結果118のコンテキストで実施されるべき動作などの、動作識別子を有する少なくとも1つの動作と関連づけられていてもよい。たとえば、照会結果118を提示するアプリケーションは、名前またはキーワード「クリック」、「保存」、および「選択」などの特定の動作識別子に関連づけられた動作の組を含み得る。しかしながら、ユーザ102はそのような動作識別子に通じていないことがあるが、より自然な語句またはジェスチャによって、これらの動作を要求する自然動作入力204を提示することができる。したがってデバイス102は、そのような動作に対応する自然動作入力204の代替形態を識別することができる。たとえば、デバイス102は、自然言語の語句「それを表示してください」を、照会結果118における特定のエンティティに対する「クリック」動作を実施する要求に相互関連させることができる。あるいは、動作は特定のエンティティ120に関連づけられてもよく、自然動作入力204は、ユーザ102が特定のエンティティ120を指示する(たとえば、特定のエンティティ120を指差す)自然動作入力204を行ったときに実施され得る動作のポップアップメニューなどの各エンティティ120について利用可能な動作を表示することができ、ユーザ102が続いてその動作のうちの1つを実施する自然動作要求を提示したとき、デバイス102は指示されたエンティティ120に対する動作を実施することで応じることができる。
図9は、本明細書に提示される変形形態のうちのいくつかに注目した第1の例示的な場面900の図を示す。この第1の例示的な場面900では、照会結果118は一組のエンティティ404を含み、デバイス104のディスプレイ106に提示されるとき、エンティティ404は大文字「A」や「B」などの自然言語のエンティティ指示902を付されてもよく、それによってユーザは照会結果118を調整するために、結果Aを見ることを単に求めることができる。第2の例として、デバイス104は、自然動作入力204のいくつかの形態を照会調整に関連づけることができる。自然動作入力204の他の形態は、指示されるエンティティに実施される動作に関連づけられた自然動作入力204の他の形態であってもよい(たとえば、自然言語のエンティティ指示902の前の語句「見せてください」は、照会結果118における指定されたエンティティ404の選択に関連してもよい)。自然動作入力204を受け取ったとき、デバイスは、自然動作入力204を要求される動作の動作識別子に翻訳することができ、指定された動作を実施して自然動作入力204を満たすことができる。
図10は、本明細書に提示される技法の他の変形形態に注目した第2の例示的な場面を提示する。この第2の例示的な場面では、第1の時点1000において、ユーザ102は、まず照会結果106のエンティティ120を、エンティティ120に対する手による指差し214と語句「それ」の発声による自然動作入力で指示する。デバイス104はエンティティ120を選択することによってこの自然動作入力204を満たし、さらに、エンティティ1002に関連する動作のポップアップメニュー1002を提示する。第2の時点1004において、ユーザ102が、これらの動作のうちの1つに関連づけられた自然動作要求を含むさらなる自然動作入力204を行ったとき、デバイス104は、自然動作要求によって示される照会調整206を実施する(たとえば、ポップアップメニュー1002にある選択肢のうちの1つに関連づけられた語句の発声によって、デバイス104は、エンティティ120に関連づけられた「時間」選択肢を適用する)。
この第2の態様の第5の変形形態として、デバイス104は、種々の照会108および照会調整206を利用して他の照会108および照会調整206の認識を容易にすることができる。第1のそのような例として、第1の照会108は、第2の照会108に接続して、一連の照会108におけるユーザ102の続きの意図を識別することができる。第2のそのような例として、デバイス104は、第1の照会108を使用して照会調整206を明確にし、またその逆を行うことができる。たとえば、自然動作入力204は、「ショーを見せてください」など、別個に検討されると曖昧であると解
釈され得る指示を含むことがある。しかしながら、第1の照会108に照らして自然動作入力204を解釈することで、自然動作入力204の認識が容易になり得る。たとえば、自然動作入力204に対する音声認識装置または字句解析器は、第1の照会108から照会結果118を調べて、自然動作入力204の認識のための言語領域を識別することができ、それによって言語認識の精度を高めることができる。デバイス104はまた、他の情報を利用してこの曖昧性除去を実施することができる。たとえば、自然動作入力204が2つ以上のエンティティ120を曖昧に指示した場合(たとえば、「そのレストラン」)、デバイス104は、デバイス104のディスプレイ106の上で、見えないものでなく現在見えるエンティティ120を選択的に選ぶなど、各エンティティ120がユーザ102に提示され、かつ/またはユーザ102によって指示された最近性などの情報を利用して指示を明らかにすることができる。この曖昧性除去は、たとえば、第1の照会結果に現在提示されている第1のエンティティ(第1の確率)および第1の照会結果に現在提示されていない第2のエンティティ(第2の確率)に対する曖昧な指示について実施されてもよく、デバイス104は、第2のエンティティの第2の確率に比較して第1のエンティティの第1の確率を高くすることができる。
図11は、ユーザ102から受け取った自然動作入力204の曖昧性を除去するために使用され得るさまざまな確率調整に注目した例示的な場面の図を提示する。この例示的な場面では、ユーザ102は、2つの異なるカフェを表す異なるエンティティを含む照会結果1102のコンテキストにおける「カフェ」を指示する。しかしながら、ディスプレイ106は照会結果1102のすべてを表示するには小さすぎることがあり、そのため、エンティティ120の部分集合のみを一度に提示するスクロール可能なダイアログに照会結果を提示することができる。第1の時点1100において、ユーザ102が「カフェ」を指定するとき、ダイアログのスクロール位置は第1のカフェを提示しているが、第2のカフェは提示しておらず、したがってデバイス102は、ユーザ102が第2のカフェ1104ではなく第1のカフェ1104を指示している確率1104を高くするように認識装置を構成することができる。逆に、第2の時点1106において、ユーザ102が「カフェ」を指定するとき、ダイアログのスクロール位置は第2のカフェを提示しているが、第1のカフェは提示しておらず、したがってデバイス102は、ユーザ102が第1のカフェ1104ではなく第2のカフェ1104を指示している確率1104を高くするように認識装置を構成することができる。これらおよび他の変形形態は、本明細書に提示される技法と互換性があり得る。
D3.照会調整
これらの技法の実施形態の間で変わり得る第3の態様は、第1の照会108および第1の照会結果118について実施され得る照会調整210の効果に関する。
この第3の態様の第1の例として、照会調整210は、ユーザ102がデバイス104にフォーカスしてほしい1つまたは複数のエンティティ120の選択など、照会結果118のフィルタリングを含み得る。そのような自然動作入力204は、たとえば、エンティティ120を指差す、照会結果118におけるエンティティ120の部分集合を円もしくは枠で囲む、または1つもしくは複数のエンティティ120に対する自然言語のエンティティ指示を入力することを含み得る。デバイス104は、そのような自然動作入力204を、第1の照会108をフィルタリングするための少なくとも1つのフィルタ基準として解釈することができ、フィルタ基準に従って第1の照会結果118をフィルタリングすることができる。
この第3の態様の第2の例として、自然動作入力204は、第1の照会108に先行した前の照会108を指示することができる(たとえば、「これらのレストランと前のレストランを見せてください」)。デバイス104は、第1の照会108と前の照会108を組み合わせることによって、この照会調整210を解釈することができる。
この第3の態様の第3の例として、自然動作入力は、さらなる照会120についてのエンティティ120へのフォーカスを指定することができる(たとえば、「それを表示してください」)。デバイス104は、第1の照会108を指示されたエンティティにフォーカスする(たとえば、さらなる入力を指示されたエンティティにあてる)ことによってこの自然動作入力204を満たすことができる。そのような一例として、自然動作入力は、照会結果118のエンティティ120に実施されるエンティティ動作(たとえば、検索結果の組における検索結果を見るまたはブックマークする要求)を指定することができる。デバイス104は、要求されたエンティティ動作を、指示されたエンティティ120に実施することによって、照会調整210を適用することができる。
E.コンピュータ処理環境
図12は、本明細書に提示される技法が実装され得るコンピュータ処理装置における例示的なコンピュータ処理環境の図を提示する。例示的なコンピュータ処理装置には、限定はされないが、パーソナルコンピュータ、サーバコンピュータ、ハンドヘルドまたはラップトップデバイス、移動デバイス(移動体電話、携帯情報端末(PDA: Personal Digital Assistant)、メディアプレーヤなど)、マルチプロセッサシステム、大衆消費電子製品、ミニコンピュータ、メインフレームコンピュータ、および上記のシステムまたはデバイスのうちの任意のものを含む分散コンピュータ処理環境が挙げられる。
図12は、本明細書で提供される1つまたは複数の実送形態を実装するように構成されたコンピュータ処理装置1202を含むシステム1200の例を示す。ある構成では、コンピュータ処理装置1202は、少なくとも1つのプロセッサ1206および少なくとも1つのメモリコンポーネント1208を備える。コンピュータ処理装置の正確な構成およびタイプに応じて、メモリコンポーネント1208は、揮発性(たとえばRAMなど)であっても、不揮発性(たとえばROM、フラッシュメモリなど)であっても、中間またはハイブリッド型のメモリコンポーネントであってもよい。この構成は図12に破線1204で示してある。
いくつかの実施形態では、デバイス1202は追加の特徴および/または機能を含み得る。たとえば、デバイス1202は1つまたは複数の追加のストレージコンポーネント1210を備えていてもよく、これには、限定はしないが、ハードディスクドライブ、ソリッドステートストレージデバイス、および/または他の取り外し可能もしくは取り外し不可能な磁気もしくは光学媒体が挙げられる。一実施形態において、本明細書で提供される1つまたは複数の実施形態を実装する、コンピュータが可読かつプロセッサが実行可能な命令がストレージコンポーネント1210に格納されている。ストレージコンポーネント1210はまた、他のデータオブジェクト、たとえば、オペレーティングシステムのコンポーネント、1つまたは複数のアプリケーションを含む実行可能なバイナリ、プログラミングライブラリ(たとえば、アプリケーションプログラミングインターフェース(API)、メディアオブジェクト、および文書などを格納することができる。コンピュータ可読命令は、プロセッサ1206による実行のためにメモリコンポーネント1208にロードされてもよい。
コンピュータ処理装置1202はまた、コンピュータ処理装置1202が他のデバイスと通信できるようにする1つまたは複数の通信コンポーネント1216を備えていてもよい。1つまたは複数の通信コンポーネント1216は、(たとえば)モデム、ネットワークインターフェースカード(NIC: Network Interface Card)、無線周波数送信機/受信機、赤外線ポート、およびユニバーサルシリアルバス(USB: Universal Serial Bus)USB接続部を含み得る。そのような通信コンポーネント1216は、有線接続部(物理的なコード、ケーブル、またはワイヤを介してネットワークに接続)または無線接続部(可視光線、赤外線、または1つもしくは複数の無線周波数などによってネットワーキングデバイスと無線で通信)を含み得る。
コンピュータ処理装置1202は、キーボード、マウス、ペン、音声入力デバイス、タッチ入力デバイス、赤外線カメラ、もしくはビデオ入力デバイスなどの1つ以上の入力コンポーネント1214、ならびに/または1つ以上のディスプレイ、スピーカ、およびプリンタなどの1つ以上の出力コンポーネント1212を備えていてもよい。入力コンポーネント1214および/または出力コンポーネント1212は、有線接続、無線接続、またはその任意の組み合わせを介してコンピュータ処理装置1202に接続されていてもよい。一実施形態において、別のコンピュータ処理装置からの入力コンポーネント1214または出力コンポーネント1212は、コンピュータ処理装置1202のための入力コンポーネント1214および/または出力コンポーネント1212として使用され得る。
コンピュータ処理装置1202のコンポーネントは、バスなどのさまざまな相互接続部によって接続され得る。そのような相互接続部には、周辺コンポーネントインターコネクト(PCI: Peripheral Component Interconnect)が含まれ、これにはPCI Express、ユニバーサルシリアルバス(USB)、ファイアワイヤ(IEEE794)、光学バス構造などがある。別の実施形態において、コンピュータ処理装置1202のコンポーネントは、ネットワークによって相互に接続されていてもよい。たとえば、メモリコンポーネント1208は、ネットワークによって相互に接続された異なる物理的位置に配置された複数の物理メモリユニットで構成されていてもよい。
コンピュータ可読命令を格納するために使用されるストレージデバイスはネットワーク全体に分散されていてもよいことが当業者には理解されよう。たとえば、ネットワーク1218を介してアクセス可能なコンピュータ処理装置1220は、本明細書で提供された1つまたは複数の実施形態を実装するためのコンピュータ可読命令を格納することができる。コンピュータ処理装置1202は、コンピュータ処理装置1220にアクセスし、実行のためにコンピュータ可読命令の一部またはすべてをダウンロードすることができる。あるいは、コンピュータ処理装置1202は、必要に応じてコンピュータ可読命令のいくつかをダウンロードしてもよいし、一部の命令をコンピュータ処理装置1202で実行し、一部をコンピュータ処理装置1220で実行してもよい。
F.用語の使用
本出願で使用される際、用語「コンポーネント」、「モジュール」、「システム」、「インターフェース」などは、概して、コンピュータ関連エンティティ、すなわち、ハードウェア、ハードウェアとソフトウェアの組み合わせ、ソフトウェア、または実行時のソフトウェアのいずれかを指すことが意図されている。たとえば、コンポーネントは、限定はしないが、プロセッサ、プロセッサ、オブジェクト、実行可能、実行スレッド、プログラム、および/またはコンピュータで実行される処理であってもよい。例示として、コントローラで動作するアプリケーションとコントローラは両方ともコンポーネントであり得る。1つまたは複数のコンポーネントは、処理および/または実行スレッドの中にあってもよく、コンポーネントは1つのコンピュータに局所配置されていてもよく、かつ/または2つ以上のコンピュータの間に分散されていてもよい。
さらに、特許請求される主題は、開示された主題を実装するようにコンピュータを制御するソフトウェア、ファームウェア、ハードウェア、またはその任意の組み合わせを作成するために、標準的なプログラミングおよび/または工学技法を使用して、方法、装置、または製造物品として実装され得る。本明細書で使用される際、用語「製造物品」は、任意のコンピュータ可読装置、担体、または媒体からアクセス可能なコンピュータプログラムを包含することが意図されている。当然ながら、特許請求される主題の範囲または趣旨から逸脱することなく、多くの変更がこの構成になされ得ることが当業者には認識されよう。
実施形態の種々の動作が本明細書に記載される。一実施形態において、記載された動作の1つまたは複数が、1つまたは複数のコンピュータ可読媒体に格納されたコンピュータ可読命令を構成していてもよく、これは、コンピュータ処理装置によって実行される場合に、記載された動作をコンピュータ処理装置に実施させる。動作の一部または全部が記載される順序は、これらの動作が必然的に順序に依存することを意味するものと解釈されるべきではない。代替の順序が、この説明の利益を受ける当業者には理解されよい。さらに、本明細書に記載された各実施形態にすべての動作が必ずしも存在するわけではないことが理解されよう。
さらに、「例示的」という語は、本明細書において一例、例示、または例証として機能することを意味するように使用される。本明細書において「例示的」と記載される任意の態様または設計は、必ずしも他の態様または設計よりも有利であると解釈されるべきではない。むしろ、例示的という語の使用は、コンセプトを具体的な形で示すことが意図されている。本出願で使用される際、用語「または」は、排他的な「または」ではなく包含的な「または」を意味することが意図されている。すなわち、別段の指定がないか、または文脈から明らかであれば、「XはAまたはBを使用する」は、自然な包含的置換のいずれかを意味することが意図されている。すなわち、XがAを使用する場合、XがBを使用する場合、またはXがAおよびBを両方使用する場合、「XはAまたはBを使用する」は、上記の例のいずれかの下で満たされる。さらに、本明細書や添付の特許請求の範囲で使用されるときの冠詞「ある(a)」および「一(an)」は、別段の指定がないか、または文脈から明らかであれば、単数形を対象とする「1つまたは複数の」を意味すると一般に解釈され得る。
また、本開示を1つまたは複数の実施形態について図示および説明してきたが、本明細書および付属の図面を読み、理解することに基づいて、等価な変更形態および変形形態が当業者には想起されよう。本開示は、すべてのかかる変更形態および変形形態を含み、添付の特許請求の範囲によってのみ限定される。特に、上記のコンポーネントによって実施されるさまざまな機能に関して(たとえば、要素、リソースなど)、そのようなコンポーネントを説明するために使用される用語は、本明細書で説明された、本開示の例示的な実施形態における機能を実施する開示された構造と構造的には等価でない場合であっても、別段の記載がない限り、記載のコンポーネントの指定された機能を実施する(たとえば、機能的に等価な)任意のコンポーネントに対応することが意図されている。さらに、本開示の特定の特徴はいくつかの実装形態のうちの1つのみに対して開示されていることがあるが、そのような特徴は、任意の所与または特定の用途に所望され、かつ有利であり得るように、他の実装形態の1つまたは複数の他の特徴と組み合わせることができる。さらに、用語「包含する(includes)」、「有する(having)」、「もつ(has)」、「備える(with)」、またはその変形が「詳細な説明」または「特許請求の範囲」において使用される範囲では、そのような用語は、用語「含む(comprising)」と同様に包含的であることが意図されている。

Claims (10)

  1. プロセッサを有するデバイスでユーザのクエリを評価する方法であって、
    前記ユーザから第1のクエリを受け取ったとき、
    前記第1のクエリを実行して第1のクエリ結果を生成し、
    前記第1のクエリ結果を前記ユーザに提示し、
    自然動作入力を前記ユーザから受け取ったとき、
    前記自然動作入力における、前記第1のクエリ結果に関係する少なくとも1つのクエリ調整を識別し、
    前記少なくとも1つのクエリ調整によって調整された前記第1のクエリを含む調整されたクエリを生成し、
    前記調整されたクエリを実行して調整されたクエリ結果を生成し、
    前記調整されたクエリ結果を前記ユーザに提示する
    ように構成された命令を、前記プロセッサで実行する工程を含む、方法。
  2. 前記第1のクエリ結果が、自然動作要求に関連する少なくとも1つのクエリ調整を指定し、
    前記クエリ調整を識別する工程が、
    前記自然動作入力における、前記第1のクエリ結果によって指定される自然動作要求を識別する工程と、
    前記自然動作要求に関連する前記クエリ調整を選択する工程と
    を含む、請求項1に記載の方法。
  3. 前記クエリ調整を識別する工程が、
    前記第1のクエリ結果を受け取ったとき、前記第1のクエリ結果を評価して、前記第1のクエリについてのクエリ調整を示す少なくとも1つの自然動作要求を識別する工程を含み、
    前記自然動作入力を受け取ったとき、
    前記自然動作入力における、前記第1のクエリ結果によって指定される自然動作要求を識別する工程と、
    前記自然動作要求に関連する前記クエリ調整を選択する工程と
    を含む、請求項1に記載の方法。
  4. 前記クエリ調整を識別する工程が、前記クエリ結果のコンテキスト内で前記自然動作入力を解釈して前記クエリ調整を識別する工程を含む、請求項1に記載の方法。
  5. 少なくとも1つの動作に関連する前記クエリ結果が動作識別子を有し、
    前記クエリ調整が、
    前記動作識別子以外の前記動作を指定する少なくとも1つの自然動作要求を識別する工程と、
    前記動作に従って前記第1のクエリを調整する工程と
    を含む、請求項1に記載の方法。
  6. 前記自然動作入力が、前記第1のクエリをフィルタリングするための少なくとも1つのフィルタ基準を含み、
    前記クエリ調整が、前記少なくとも1つのフィルタ基準に従って前記第1のクエリをフィルタリングする工程を含む、請求項1に記載の方法。
  7. 前記自然動作入力が前のクエリに対する指示を含み、
    前記クエリ調整が、前記第1のクエリと前記前のクエリを組み合わせる工程を含む、請求項1に記載の方法。
  8. 前記自然動作入力が、前記クエリ結果とは別個の入力コンポーネントに向けられ、入力コンポーネント値になり、
    前記クエリ調整が、前記入力コンポーネント値を前記クエリ結果と関連づける工程を含む、請求項1に記載の方法。
  9. 前記自然動作入力が、前記第1のクエリ結果のエンティティに対して実施されるエンティティ動作を指定し、
    前記クエリ調整が、前記エンティティに対して実施される前記エンティティ動作を指定する工程を含む、請求項1に記載の方法。
  10. 前記自然動作入力が前記第1のクエリ結果のエンティティを指示し、
    前記クエリ調整が、
    前記自然動作入力によって指示された前記第1のクエリ結果の前記エンティティを識別する工程と、
    前記自然動作入力によって指示された前記エンティティに前記第1のクエリをフォーカスする工程と
    を含む、請求項5に記載の方法。
JP2015521826A 2012-07-15 2013-07-12 自然動作入力を使用する文脈的クエリ調整 Expired - Fee Related JP6204982B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/549,503 2012-07-15
US13/549,503 US20140019462A1 (en) 2012-07-15 2012-07-15 Contextual query adjustments using natural action input
PCT/US2013/050172 WO2014014745A2 (en) 2012-07-15 2013-07-12 Contextual query adjustments using natural action input

Publications (3)

Publication Number Publication Date
JP2015531109A true JP2015531109A (ja) 2015-10-29
JP2015531109A5 JP2015531109A5 (ja) 2016-08-04
JP6204982B2 JP6204982B2 (ja) 2017-09-27

Family

ID=49817242

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015521826A Expired - Fee Related JP6204982B2 (ja) 2012-07-15 2013-07-12 自然動作入力を使用する文脈的クエリ調整

Country Status (6)

Country Link
US (1) US20140019462A1 (ja)
EP (1) EP2873006A2 (ja)
JP (1) JP6204982B2 (ja)
KR (1) KR20150036643A (ja)
CN (1) CN104428770A (ja)
WO (1) WO2014014745A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2017195388A1 (ja) * 2016-05-12 2019-03-07 ソニー株式会社 情報処理装置、情報処理方法およびプログラム

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10630751B2 (en) 2016-12-30 2020-04-21 Google Llc Sequence dependent data message consolidation in a voice activated computer network environment
US10956485B2 (en) 2011-08-31 2021-03-23 Google Llc Retargeting in a search environment
US9424840B1 (en) * 2012-08-31 2016-08-23 Amazon Technologies, Inc. Speech recognition platforms
US9411803B2 (en) * 2012-09-28 2016-08-09 Hewlett Packard Enterprise Development Lp Responding to natural language queries
US20150088923A1 (en) * 2013-09-23 2015-03-26 Google Inc. Using sensor inputs from a computing device to determine search query
US9703757B2 (en) 2013-09-30 2017-07-11 Google Inc. Automatically determining a size for a content item for a web page
US10614153B2 (en) 2013-09-30 2020-04-07 Google Llc Resource size-based content item selection
US10431209B2 (en) 2016-12-30 2019-10-01 Google Llc Feedback controller for data transmissions
JP6418820B2 (ja) * 2014-07-07 2018-11-07 キヤノン株式会社 情報処理装置、表示制御方法、及びコンピュータプログラム
US9798801B2 (en) * 2014-07-16 2017-10-24 Microsoft Technology Licensing, Llc Observation-based query interpretation model modification
WO2016018039A1 (en) 2014-07-31 2016-02-04 Samsung Electronics Co., Ltd. Apparatus and method for providing information
US9785304B2 (en) 2014-10-31 2017-10-10 Bank Of America Corporation Linking customer profiles with household profiles
US9940409B2 (en) 2014-10-31 2018-04-10 Bank Of America Corporation Contextual search tool
US9922117B2 (en) * 2014-10-31 2018-03-20 Bank Of America Corporation Contextual search input from advisors
KR20170014353A (ko) * 2015-07-29 2017-02-08 삼성전자주식회사 음성 기반의 화면 내비게이션 장치 및 방법
US10180965B2 (en) * 2016-07-07 2019-01-15 Google Llc User attribute resolution of unresolved terms of action queries
WO2018195185A1 (en) * 2017-04-20 2018-10-25 Google Llc Multi-user authentication on a device
CN108595423A (zh) * 2018-04-16 2018-09-28 苏州英特雷真智能科技有限公司 一种基于属性区间变化的动态本体结构的语义分析方法
CN108920507A (zh) * 2018-05-29 2018-11-30 宇龙计算机通信科技(深圳)有限公司 自动搜索方法、装置、终端及计算机可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002342361A (ja) * 2001-05-15 2002-11-29 Mitsubishi Electric Corp 情報検索装置
JP2012511208A (ja) * 2008-12-04 2012-05-17 マイクロソフト コーポレーション 提案した絞込みタームおよび垂直検索に対する検索結果のプレビュー
JP2012133243A (ja) * 2010-12-22 2012-07-12 Toshiba Corp 音声認識装置、音声認識方法および音声認識装置を搭載したテレビ受像機

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070094224A1 (en) * 1998-05-28 2007-04-26 Lawrence Au Method and system for determining contextual meaning for network search applications
US7461059B2 (en) * 2005-02-23 2008-12-02 Microsoft Corporation Dynamically updated search results based upon continuously-evolving search query that is based at least in part upon phrase suggestion, search engine uses previous result sets performing additional search tasks
US7599918B2 (en) * 2005-12-29 2009-10-06 Microsoft Corporation Dynamic search with implicit user intention mining
US8117197B1 (en) * 2008-06-10 2012-02-14 Surf Canyon, Inc. Adaptive user interface for real-time search relevance feedback
US9318108B2 (en) * 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8190627B2 (en) * 2007-06-28 2012-05-29 Microsoft Corporation Machine assisted query formulation
US20090287626A1 (en) * 2008-05-14 2009-11-19 Microsoft Corporation Multi-modal query generation
WO2009153392A1 (en) * 2008-06-20 2009-12-23 Nokia Corporation Method and apparatus for searching information
US20100153112A1 (en) * 2008-12-16 2010-06-17 Motorola, Inc. Progressively refining a speech-based search
US20130246392A1 (en) * 2012-03-14 2013-09-19 Inago Inc. Conversational System and Method of Searching for Information

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002342361A (ja) * 2001-05-15 2002-11-29 Mitsubishi Electric Corp 情報検索装置
JP2012511208A (ja) * 2008-12-04 2012-05-17 マイクロソフト コーポレーション 提案した絞込みタームおよび垂直検索に対する検索結果のプレビュー
JP2012133243A (ja) * 2010-12-22 2012-07-12 Toshiba Corp 音声認識装置、音声認識方法および音声認識装置を搭載したテレビ受像機

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2017195388A1 (ja) * 2016-05-12 2019-03-07 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
US11195517B2 (en) 2016-05-12 2021-12-07 Sony Corporation Information processing apparatus and information processing method

Also Published As

Publication number Publication date
CN104428770A (zh) 2015-03-18
EP2873006A2 (en) 2015-05-20
WO2014014745A3 (en) 2014-03-13
WO2014014745A2 (en) 2014-01-23
US20140019462A1 (en) 2014-01-16
KR20150036643A (ko) 2015-04-07
JP6204982B2 (ja) 2017-09-27

Similar Documents

Publication Publication Date Title
JP6204982B2 (ja) 自然動作入力を使用する文脈的クエリ調整
US11710482B2 (en) Natural assistant interaction
US10445429B2 (en) Natural language understanding using vocabularies with compressed serialized tries
EP3701520B1 (en) Multi-turn canned dialog
US10909331B2 (en) Implicit identification of translation payload with neural machine translation
US11231903B2 (en) Multi-modal interfaces
EP3443556B1 (en) Detecting a trigger of a digital assistant
US10755051B2 (en) Rule-based natural language processing
JP6638000B2 (ja) デバイスの音声制御
US20180349447A1 (en) Methods and systems for customizing suggestions using user-specific information
US20180349472A1 (en) Methods and systems for providing query suggestions
CA2873240C (en) System, device and method for processing interlaced multimodal user input
DK179558B1 (en) DETECTING A TRIGGER OF A DIGITAL ASSISTANT
US20240265914A1 (en) Application vocabulary integration with a digital assistant
US11756548B1 (en) Ambiguity resolution for application integration
US11995457B2 (en) Digital assistant integration with system interface

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160613

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160613

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170428

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170508

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170802

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170814

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170901

R150 Certificate of patent or registration of utility model

Ref document number: 6204982

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees