JP6429630B2 - コンテキスト・ベースの検索クエリー形成 - Google Patents

コンテキスト・ベースの検索クエリー形成 Download PDF

Info

Publication number
JP6429630B2
JP6429630B2 JP2014559900A JP2014559900A JP6429630B2 JP 6429630 B2 JP6429630 B2 JP 6429630B2 JP 2014559900 A JP2014559900 A JP 2014559900A JP 2014559900 A JP2014559900 A JP 2014559900A JP 6429630 B2 JP6429630 B2 JP 6429630B2
Authority
JP
Japan
Prior art keywords
query
text
document
queries
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014559900A
Other languages
English (en)
Other versions
JP2015508930A (ja
JP2015508930A5 (ja
Inventor
バイ,プオン
チェン,ジュヨン
デイヴィッド ホワーン,シュエドーン
デイヴィッド ホワーン,シュエドーン
ニー,シヤオチュワン
スゥン,ジエン−タオ
ジャーン,ジーミン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2015508930A publication Critical patent/JP2015508930A/ja
Publication of JP2015508930A5 publication Critical patent/JP2015508930A5/ja
Application granted granted Critical
Publication of JP6429630B2 publication Critical patent/JP6429630B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本願はコンテキスト・ベースの検索クエリー形成に関する。
多くのインターネット検索は、ユーザーがブラウズしているウェブ・ページがきっかけとなる。すなわち、ユーザーはウェブ・ページ上のコンテンツを消費した後に検索を開始することを決める。検索を実施するために、ユーザーはウェブ・ページを去って検索エンジンにアクセスしなければならない。ユーザーはウェブ・ページから単語を検索ボックス中にコピー・アンド・ペーストしてもよいし、あるいは検索ボックス中または検索エンジン・ウェブ・ページ中への入力のために検索クエリーを手動で作成してもよい。検索クエリーを生成するいずれの技法も、特異性の欠如、複数の意味をもつ検索タームおよび検索ターム間の曖昧な関係といった不足があることがある。
検索結果が返されたのち、ユーザーは検索インターフェースを去ってウェブ・ブラウズに戻ることができる。ウェブ・ページと検索インターフェースとの間のこの行ったり来たりは不十分である。さらに、さまざまなユーザー・インターフェースとの対話(たとえば、テキスト選択、コピー、ペーストなど)は特に、携帯電話、タブレット・コンピュータ、ゲーム・コンソール、テレビジョンなどのような、小さな形状因子の装置上またはテキストを入力するための能力が限られている装置上では煩わしくなることがある。ますます多くのユーザーがウェブ・ページおよび他の電子文書に、伝統的なコンピュータ以外の装置を通じてアクセスするようになるにつれ、文書の消費と検索とをスムーズに統合する必要性が高まってくる。それを実行でき、さらに、改善された検索クエリーを提供できるシステムがユーザーを利するであろう。
この概要は、下記の詳細な説明においてさらに説明される概念のセレクションを単純化した形で紹介するために与えられている。この概要は、特許請求される主題のキーとなる特徴または本質的な特徴を同定するために意図されたものではなく、特許請求される主題の範囲を制限するために使われることも意図されていない。
本開示は、ウェブ・ページまたは他の文書上でのユーザーの注目の領域および周囲のコンテキストの両方を使って複数の検索クエリーを生成し、ランク付けする技法を説明する。ウェブ・ページをブラウズしながら、ユーザーはウェブ・ページからのテキストを選択する。テキストの選択は、そのテキストを候補クエリー――選択されたテキストに関連する結果を与えうる検索クエリー――を生成するための出発点として使うコマンドをも生成する。選択されたテキストから複数の候補クエリーを生成するために、複数の型の検索クエリー拡張または検索クエリー再定式化技法が適用されてもよい。次いで、ユーザーはこれらの検索クエリーの一つを、検索エンジンに提出するために選択してもよい。このように、ブラウズする行為が検索する行為と組み合わされ、単にウェブ・ページからテキストを選択して次いで候補クエリーの一つを選択することによる「ブラウズ中検索(Browsing to Search)」を可能にするインターフェースを作り出す。
候補クエリーの組から検索クエリーにユーザーを案内するために、文書のコンテキストが考慮される。ブラウズされるウェブ・ページによって与えられるコンテキストに照らしての候補クエリーの評価が、それぞれの候補クエリーをランク付けするために使われる。周囲のコンテキストを考慮することは、候補クエリーをランク付けすることにおいて補助する。ブラウズされるウェブ・ページは、候補クエリー中のタームの曖昧さを解決し、候補クエリーを同じウェブ・ページに関係した以前の検索クエリーと比較するために(可能性としては修正されて)使用されることができる単語を含むことがあるからである。
候補クエリーのランク付けは、言語モデル、分類方法または両者の組み合わせによって実行されうる。言語モデルは、選択されたテキストおよび周囲のコンテキストが与えられたときの候補クエリーの確率を決定するモデルとして実装されてもよい。分類方法は、ウェブ・ページ上の選択されたテキストと関連付けられた問い合わせとを含むトレーニング・データを使う。人間の検査者が、ウェブ・ページのその選択されたテキストが、ユーザーがその関連付けられた検索クエリーを行なう結果につながったことがありそうかどうかを判定する。もしそうであれば、選択されたテキストとクエリーの対が、機械学習システムによって、その選択されたテキストおよびそのコンテキストを与えられたときの候補クエリーについての信頼レベルを予測する関数を学習するために使われる。
詳細な説明は、付属の図面を参照して記述される。図面では、参照符号の左端の数字(単数または複数)がその参照符号が最初に現われる図面を同定する。異なる図面における同じ参照符号の使用は、同様のまたは同一の項目を指示する。
クエリー作成器を含む情報処理システムを示す例示的なアーキテクチャである。 図1のアーキテクチャからの例示的なデータおよびコンポーネントの概略的な表現を示す図である。 例示的な文書を選択されたテキストとともに示す図である。 テキストを選択するための二つの例示的なユーザー・インターフェースを示している。 テキストのユーザー選択に応答して候補クエリーのランク付けされたリストを提供する例示的な方法を示す例示的なフローチャートである。
図1は、ユーザー102がローカル・コンピューティング装置104と対話して検索クエリーを取得できるアーキテクチャ100を示している。ローカル・コンピューティング装置104は、デスクトップ・コンピュータ、ノートブック・コンピュータ、タブレット・コンピュータ、スマートフォン、ゲーム・コンソール、テレビジョンなどといったいかなる型のコンピューティング装置であってもよい。ローカル・コンピューティング装置104はネットワーク106を介して一つまたは複数のネットワーク・アクセス可能なコンピューティング装置108と通信してもよい。ネットワーク106は、ローカル・エリア・ネットワーク、広域ネットワーク、インターネット、電話網、ケーブル・ネットワーク、ピアツーピア・ネットワーク、メッシュ・ネットワークなどといった任意の一つまたは複数の型のデータ通信ネットワークであってもよい。ネットワーク・アクセス可能なコンピューティング装置108は、ネットワーク・サーバー、ウェブ・サーバー、ファイル・サーバー、スーパーコンピュータ、デスクトップ・コンピュータなどといったコンピューティング装置の任意の型または複数の型の組み合わせとして実装されてもよい。ネットワーク・アクセス可能なコンピューティング装置108は、一つまたは複数の検索エンジン110を含んでいるまたはそれに通信上接続されているのでもよい。検索エンジン110は、検索サービスを提供するエンティティによって維持される一つまたは複数の専用のコンピューティング装置上に実装されてもよい。
情報処理システム112は一つまたは複数の位置を通じて分散された一つまたは複数の処理要素114およびメモリ116を含む。処理要素114は、中央処理ユニット(CPU)、グラフィック処理ユニット(GPU)、単一コア・プロセッサ、マルチコア・プロセッサ、特定用途向け集積回路(ASIC)などのいかなる組み合わせを含んでいてもよい。一つまたは複数の処理要素114は、ハードウェア実装に加えてソフトウェアおよび/またはファームウェアで実装されてもよい。処理要素114のソフトウェアまたはファームウェア実装は、記載されるさまざまな機能を実行するための任意の好適なプログラミング言語で書かれたコンピュータまたは機械実行可能な命令を含んでいてもよい。処理要素114のソフトウェア実装はメモリ116に全体的または部分的に記憶されていてもよい。
メモリ116は、処理要素114上でロード可能かつ実行可能な命令のプログラムならびにこれらのプログラムの実行中に生成されるデータを記憶してもよい。メモリ116上に記憶されるプログラムおよびデータの例は、ローカル・コンピューティング装置104、ネットワーク・アクセス可能なコンピューティング装置108に利用可能なハードウェアおよびソフトウェア資源の動作を制御するためのオペレーティング・システム、ハードウェア装置と対話するためのドライバ、ネットワーク106および他のコンピューティング装置との間でデータを送受信するための通信プロトコルならびに追加的なソフトウェア・アプリケーションを含んでいてもよい。ローカル・コンピューティング装置104および/またはネットワーク・アクセス可能なコンピューティング装置108の構成および型に依存して、メモリ116は揮発性(RAMのように)および/または不揮発性(ROM、フラッシュメモリなどのように)でありうる。
情報処理システム112は、リムーバブル記憶、非リムーバブル記憶、ローカル記憶および/またはリモート記憶といった追加的なコンピュータ可読媒体をも含んでいてもよい。メモリ116および任意の関連するコンピュータ可読媒体が、コンピュータ可読命令、データ構造、プログラム・モジュールおよび他のデータの記憶を提供してもよい。コンピュータ可読媒体は、少なくとも、二つの型のコンピュータ可読媒体、すなわちコンピュータ記憶媒体および通信媒体を含む。
コンピュータ記憶媒体は、コンピュータ可読命令、データ構造、プログラム・モジュールまたは他のデータといった情報の記憶のための任意の方法または技術で実装された、揮発性および不揮発性、リムーバブルおよび非リムーバブルの媒体を含む。コンピュータ記憶媒体は、RAM、ROM、EEPROM、フラッシュメモリまたは他のメモリ技術、CD-ROM、デジタル多用途ディスク(DVD)または他の光学式記憶、磁気カセット、磁気テープ、磁気ディスク記憶または他の磁気記憶デバイスまたはコンピューティング装置によるアクセスのために情報を記憶するために使用できる他の非伝送媒体を含むが、これに限られない。
対照的に、通信媒体は、コンピュータ可読命令、データ構造、プログラム・モジュールまたは他のデータを、搬送波または他の伝送機構のような変調されたデータ信号において具現してもよい。本稿で定義されるところでは、コンピュータ記憶媒体は通信媒体を含まない。
情報処理システム112は、ローカル・コンピューティング装置104およびネットワーク・アクセス可能なコンピューティング装置108のいずれか一方または両方に全体的または部分的に存在してもよい。このように、情報処理システム112は、さまざまな物理的コンポーネントおよびデータ・コンポーネントが一つまたは複数の位置に存在して、一緒になって情報処理システム112の役割を実行する、分散式のシステムであってもよい。いくつかの実装では、情報処理システム112のすべての特徴がローカル・コンピューティング装置104上に存在していてもよい。他の実装では、ローカル・コンピューティング装置104は、単に表示データを受信して、情報処理システム112を含んでいる、ネットワーク・アクセス可能なコンピューティング装置108のような別の装置にユーザー入力信号を送信する、シン・クライアントであってもよい。
情報処理システム112は、ユーザー102のために検索クエリーを定式化するクエリー作成器118を含んでいてもよい。いくつかの実装では、クエリー作成器118は、全体的または部分的に、メモリ116内の記憶であってもよい。他の実装では、クエリー作成器118は、ASICの一部のような、処理要素114の一部として実装されてもよい。情報処理システム112自身と同様に、クエリー作成器118は全体的または部分的にローカル・コンピューティング装置104およびネットワーク・アクセス可能なコンピューティング装置108のいずれか一方または両方に存在してもよい。クエリー作成器118の全部または一部が複数のコンピューティング装置に冗長に位置している実装では、クエリー作成器118を実装するためにどのコンピューティング装置を使うかの選択は、相対的な処理速度、ネットワーク106を通じた情報伝送の速度および/または他の因子に基づいていてもよい。
図2は、クエリー作成器118および図1に示されるアーキテクチャ100の他の部分を通じた情報およびデータの流れを示している。ユーザー102が文書からテキストを選択すると、これがクエリーを定式化するためのクエリー作成器118にとっての入力を与える。選択されたテキスト202およびコンテキスト204は検索開始モジュール206によって受領される。選択されたテキスト202は、ユーザー102がローカル・コンピューティング装置104と対話して文書からテキストを選択するための任意の通常の機構によってテキストの一つまたは複数のパッセージを選択または指示することによって選択されてもよい。コンテキスト204は、選択されたテキスト202を囲むまたは選択されたテキスト202の近くに位置する当該文書中の他のテキストを含んでいてもよい。コンテキスト204は、文書の意図されたまたはありそうな使用に基づく文書の分類をも含んでいてもよい。たとえば、文書がウェブ・ページであり、該ウェブ・ページが商品およびサービスを売るための販売人のウェブ・ページとして識別される場合、コンテキスト204はユーザーが、購入すべき商品またはサービスを検索する可能性が高いことを認識してもよい。テキスト202を選択する前のユーザー102の先行する行動も、コンテキスト204を提供してもよい。たとえば、ユーザー102によって最近提出された検索クエリーが、ユーザー102が現在検索しているトピックまたは領域に関するコンテキスト204を与えてもよい。
検索開始モジュール206は、選択されたテキスト202を選択するユーザーからの単一の入力を、テキストの選択として、かつ選択されたテキスト202に基づいて検索クエリーを生成するコマンドとして解釈してもよい。たとえば、ユーザー102がカーソルを動かして文書から連続するテキストの系列を選択する場合、ユーザー102は、検索クエリー提案を受け取るために、このテキストを別のインターフェースにペーストしたり動かしたりする必要はない。テキストの選択自身が、検索開始モジュール206によって、一つまたは複数の検索クエリーを生成するコマンドとして解釈されうる。検索開始モジュール206のこの二重の役割は、ローカル・コンピューティング装置104との単一の入力または対話により、ユーザーがテキストを選択することと、検索クエリーを要求することとの両方をできるようにする。
検索開始モジュール206は選択されたテキスト202、コンテキスト204および検索クエリーを生成するコマンドをクエリー作成器118に渡す。クエリー作成器118は、選択されたテキスト202から候補クエリーを生成する候補クエリー生成器208を含んでいてもよい。候補クエリー生成器208は、選択されたテキスト202に、クエリー拡張またはクエリー再定式化技法を適用してもよい。候補クエリー生成器208は、選択されたテキスト202から候補クエリーを生成することを、同義語を含めること、単語の代替的な形態論上の形を加えること、間違って綴られた単語の綴りを訂正することおよび/または単語の代替的な綴りを提供することによって行なってもよい。たとえばテキストがそのまわりに(指を使って)楕円を描くことによって選択される場合、ユーザーが関心テキストを精密に選択し損なうときは、単語または句が偶発的に二つの部分に分割されることがある。後処理作業は、選択されたテキストから有意でないキャラクタを除去するまたは有意なキャラクタを前置/後置することを含んでいてもよい。いくつかの実装では、その文書に関連付けられた諸クエリーのクエリー・ログが、候補クエリーを生成するために使われる。クエリー・ログを使うクエリー拡張技法は、クエリー・ログに対してK平均アルゴリズムを適用すること、クエリー・ログをパースする(parse)ことによって生成されるクエリー‐文書二部グラフ上でランダム・ウォークを実施すること、クエリー・ログから生成されたクエリー‐フロー・グラフ上でページランク(PageRank)アルゴリズムを走らせることまたはクエリー・ログからターム関連付けパターンをマイニングすることを含んでいてもよい。
候補クエリー生成器208は候補クエリーを直接生成してもよく、あるいは候補クエリー生成器208はクエリー作成器118の外部の別のモジュールまたはシステム(たとえば、検索エンジンに付随するクエリー再定式化モジュール)に選択されたテキスト202を渡してもよい。候補クエリー生成器208は、選択されたテキスト202を別のシステムまたはモジュールに渡し、次いでその外部のモジュールまたはシステムから候補クエリーを受け取ることによって、事実上、候補クエリーを生成してもよい。候補クエリー生成器208は、選択されたテキスト202からいくつクエリーを生成してもよい。いくつかの実装では、候補クエリー生成器208によって生成される候補クエリーの数は、3個のクエリー、10個のクエリーなどといった所定の数に制限されてもよい。
ひとたびある数の候補クエリーが得られたら、クエリー・ランキング・モジュール210は、それらのクエリーが選択されたテキスト202およびコンテキスト204に対応する確からしさまたは確率に基づいて、候補クエリーにランク付けしてもよい。クエリー作成器118は、候補クエリーの生成と、それらの候補クエリーのランク付けの両方を、検索エンジン110に問い合わせを提出することなく実行してもよく、それにより検索エンジン110の負担を軽減する。
クエリー・ランク付けモジュール210は、一つまたは複数のランク付け技法に基づいて一つまたは複数の候補クエリーにランク付けしてもよい。使用されうるランク付け技法は、言語モデル212および人工知能(AI)システム214を含んでいてもよい。それぞれは、独立してまたは組み合わせて使用されてもよい。
言語モデル212は、コンテキスト204および選択されたテキスト202の二項〔バイグラム〕表現を生成してもよい。コンテキスト204は、選択されたテキスト202を含む文書からのテキストの一部を含んでいてもよい。このように、コンテキスト204は、選択されたテキスト202に当該文書からの追加的なテキストを加えたものであってもよい。言語モデル212は、候補クエリーのそれぞれにおけるいくつかの単語、選択されたテキスト202中のいくつかの単語およびコンテキスト204をなすテキストの当該部分におけるいくつかの単語に基づいて、候補クエリー生成器208からの候補クエリーの相対的なランク付けを決定してもよい。言語モデル212の一つの実装の詳細は下記で論じる。
人工知能システム214は、サポート・ベクター・マシン、ニューラル・ネットワーク、エキスパート・システム、ベイジアン信頼ネットワーク、ファジー論理エンジン、データ融合エンジンなどといったいかなる型の人工知能または機械システムとして実装されてもよい。人工知能システム214は、人間がラベル付けしたトレーニング・データから生成されてもよい。一または複数のユーザーの過去の文書消費および検索挙動から得られた、文書およびそれらの文書に関連付けられたクエリーを表わす<文書,クエリー>タプルのコーパスが、トレーニング・データの全部または一部のはたらきをしてもよい。いくつかの実装では、タプルは、検索エンジン110に自分のブラウズおよび検索挙動を提供することを選んだユーザーからの検索エンジン110からの検索ログから得られてもよい。ブラウズおよび検索データは、自分のデータを貢献することを選ぶユーザーのプライバシーを保護するために匿名化されてもよい。人間のラベル付け者がタプルを検査して、文書とクエリーとの間に因果関係があるかどうかを判定する。換言すれば、人間のラベル付け者が、タプル内の文書の内容がユーザーにそのタプル内のクエリーを提出させた確率の主観的な評価に基づいて、各タプルにラベルを割り当てる。人工知能システム214の一つの実装の詳細が下記で論じられる。
ひとたびクエリー作成器118がクエリーを定式化し、それらのクエリーにランク付けしたら、ユーザーはクエリーのランク付けされたリストを呈示されてもよい。より高いランク付けをもつクエリーは、より低いランク付けをもつクエリーよりも、リスト中で先に、またはより目立つ位置にリストされてもよい。ユーザー102は、クエリーに基づいて一つまたは複数の検索エンジン110上で検索を開始するよう、候補クエリーの一つを選択してもよい。
検索エンジン110は、クエリーをネットワーク106または他のデータ・ストアに提出し、検索アルゴリズム、選択されたクエリーおよびネットワーク106中で利用可能なデータに基づいて、検索結果216を受領してもよい。検索エンジン110は、選択された検索クエリーを処理するためのいかなる通常の検索技法を使ってもよい。
〈例示的な言語モデル〉
言語モデル212は、コンテキスト204に基づいて候補クエリーをランク付けする。候補クエリーは、sと表わされる選択されたテキスト202およびcと表わされるコンテキスト204が与えられたときに、それらの候補クエリーからのクエリーの一つであるクエリーqが生成される可能性を表わす条件付き確率p(q|s,c)によってランク付けされる。言語モデル212は、q=qw1,qw2,qwNq、s=sw1,sw2,swNsおよびc=cw1,cw2,cwNcを想定する。ここで、qwi、swiおよびcwiは、それぞれクエリーq、選択されたテキストsおよびコンテキストcにおけるi番目の単語を表わす。言語モデル212では、Nqはクエリーqの単語長さを表わし、Nsは選択されたテキストsの単語長さを表わし、Ncはコンテキストcの単語長さを表わす。
言語モデル212は、選択されたテキストsおよびコンテキストcを条件として、各クエリー語qwiはその直前の単語qwi-1のみに依存するというさらなる想定を含む。この想定は、二項言語モデルについてなされる想定と同様である。いくつかの実装について二項表現が望ましいのは、一項〔ユニグラム〕モデルではクエリー内部のターム・レベルの関係を捕捉できないことがあるためである。逆に、n項〔nグラム〕(n≧3)アプローチは、計算量が高くなることがあり、オンライン・クエリー提案のために時間がかかりすぎる可能性がある。しかしながら、処理機能が向上し続けるにつれて、3項(またはそれ以上)のアプローチの計算量にそれほど時間がかからなくなる可能性が高く、言語モデル212はn項(n≧3)のアプローチにも対応するよう適応されることができることが考えられている。
上記の定義および想定から、選択されたテキスト202およびコンテキスト204が与えられたときの候補クエリーからのクエリーの一つが生成される可能性は、次のように表わせる。
Figure 0006429630
上記の定式化では、より長いクエリーはより小さな確率をもつ傾向がある。この効果を軽減するために、確率は追加的な重みをかけられ、より長いクエリーはより大きな重みが割り当てられる。修正された確率は次式によって計算できる。
Figure 0006429630
ここで、Λは1より大きい定数である。
p(qi|s,c)を計算する定式化は次のようになる。
Figure 0006429630
ここではp(s,c)は無視できる。ランク付けされる候補クエリーのそれぞれは同じ選択されたテキストsおよびコンテキストcに基づいているからである。
p(qwi)の値を推定するためには、グローバル・クエリー・コーパスが使用されることができる。クエリー・コーパスQが与えられると、p(qwi)の値は
Figure 0006429630
によって計算されることができる。ここで、|Q(qwi)|はクエリー・コーパス中の、単語qwiを含むクエリーの数を表わし、|Q|はグローバル・クエリー・コーパス中のクエリーの総数を表わす。
式(4)を平滑化したバージョンが使用されてもよい。
Figure 0006429630
ここで、aは0から1までの間の定数である。
式(3)におけるもう一つの確率は、次のように導出できる。選択されたテキストsおよびコンテキストcが任意のクエリー語qwiを条件として独立であるとすると、
Figure 0006429630
この関数を単純化するために、言語モデル212はさらに、任意のクエリー語qwiを条件として、選択されたテキストsまたはコンテキストcの諸単語は独立して生成されることができると想定する。よって、
Figure 0006429630
ここで、p(swj|qwi)は、qwiが存在するときにswjがqwiと一緒に現われる確率である。この確率は、グローバル・クエリー・コーパスを使って推定されることができる。
Figure 0006429630
ここで、|Q(swj)∩Q(qwi)|はグローバル・クエリー・コーパスにおいてswjおよびqwiを同時に含むクエリーの数であり、|Q(qwi)|はクエリー・コーパス中の、単語qwiを含むクエリーの数を表わし、a∈(0,1)は平滑化のために使われている。
p(cwj|qwi)の値は同様に計算できる。Nsは常にNcよりはるかに小さいので、式(7)および(8)によれば、p(s|qwi)およびp(c|qwi)の値は不均衡である。この不均衡を解決するために、p(s|qwi)およびp(c|qwi)の規格化された値が使われてもよい。
p(s|qwi)の規格化された定式化は次のようになる。
Figure 0006429630
同様に、p(c|qwi)の規格化された値は次式によって計算できる。
Figure 0006429630
p(qwi-1|s,c,qwi-1)を計算するための定式化は
Figure 0006429630
となる。ここで、p(qwi-1|s,c)は式(3)によって計算できる。p(s,c)は、同じ選択されたテキスト202および同じコンテキスト204に基づく候補クエリーすべてについて同じ値を取るので、
Figure 0006429630
となる。ここで、p(qwi-1)は式(5)によって計算できる。p(qwi|qwi-1)は、qwi-1が存在するときに、qwi-1の直後にqwiが現われる確率である。しかしながら、グローバル・クエリー・コーパスを使ってこの確率を計算するとき、グローバル・クエリー・コーパスが疎であるために単語qwi-1およびqwiがめったに連続して現われないことがある。その可能性を取り入れるため、p(qwi|qwi-1)は、qwi-1が存在するときにqwiがqwi-1と一緒に現われる確率として(qwiとqwi-1が連続して現われることは要求せずに)推定されてもよい。これは式(9)に従って計算できる。
最後に、確率p(s,c|qwi,qwi-1)を計算するための定式化を下記に与えておく。簡単にするため、言語モデル212は、選択されたテキストsとコンテキストcが二つのクエリー語qwiおよびqwi-1を条件として独立であることを前提とする。
Figure 0006429630
式(7)と同様に、言語モデル212は二つのクエリー語qwiおよびqwi-1を条件として、選択されたテキストsまたはコンテキストc内の諸単語が独立に生成できることを想定する。よって、
Figure 0006429630
ここで、p(swj|qwi,qwi-1)はグローバル・クエリー・コーパスによって推定されることができる:
Figure 0006429630
ここで、|Q(swj)∩Q(qwi)∩Q(qwi-1)|はグローバル・クエリー・コーパスにおいてswj、qwi、qwi-1を同時に含むクエリーの数である。|Q(qwi)∩Q(qwi-1)|およびaは式(9)と同様の意味をもつ。
式(10)と同様に、p(s|qwj,qwi-1)の確率は規格化されてもよい:
Figure 0006429630
p(c|qwi,qwi-1)の値は同様に計算および規格化されることができる。
〈例示的な人工知能システム〉
人工知能システム214は、候補クエリーをランク付けするための分類技法を実装してもよい。分類技法では、人間の検査者が、文書とそれらの文書に関連付けられたクエリーqとの間の関連付けを評価する。人間の検査者によるラベル付けの前には、その文書のそのコンテンツがそのクエリーを引き起こしたのかどうか、あるいはその文書とそのクエリーとの間の関連付けが単に偶然またはその文書に無関係であるかどうかはわかっていなくてもよい。
人間のラベル付け者は、文書‐クエリー対の一つからのクエリーを、その文書の内容に関連している、その文書の内容に関連していないまたはその文書の内容との関連が曖昧として分類する。このように、人間のラベル付け者は<文書,クエリー>タプルのコーパスを吟味する。タプルは、ユーザーの実際のブラウズおよび検索挙動によって生成され、グローバル・クエリー・コーパスに記憶されてもよい。これは、言語モデル212によって使用されるのと同じグローバル・クエリー・コーパスであってもよい。<文書,クエリー>タプルにおける各文書は、その文書からの選択されたテキストsおよびその選択されたテキストsを含むコンテキストcとして表現されてもよい。したがって、人間のラベル付け者の作業は、<s,c>とqの対にラベル付けすることと表現されてもよい。ラベル付けされた対は、次いで人工知能システム214のためのトレーニング・データとして使用される。いくつかの実装では、<s,c>とqの対のうちクエリーが文書の内容に関連しているとラベル付けされているもののみがトレーニング・データとして使用されてもよい。
人工知能システム214は、トレーニング・データを使って関数f(<s,c>q)→{−1,+1}を学習する。関数fは、図2からの選択されたテキスト202、コンテキスト204およびクエリー候補といった新たなデータに適用され、それぞれの候補クエリーがその文書の内容に関連していることの信頼レベルを予測することができる。さまざまなクエリー候補についての信頼レベルは、クエリー・ランク付けモジュール210によってクエリー候補にランク付けするために使用されてもよい。
文書‐クエリー関係の手動のラベル付けは煩わしいことがある。手動のラベル付け努力を軽減し、関数fの精度を改善するためにより大量のトレーニング・データを取得するために擬似トレーニング・データが使用されてもよい。擬似トレーニング・データは、グローバル・クエリー・コーパスにおいて、ユーザーがクエリーと対になった文書を閲覧した後まもなくユーザーによって提出された検索クエリーを識別することによって生成されてもよい。この近接した時間関係は、文書の内容がユーザーにクエリーqを生成させたことを示唆しうる。検索クエリーqと文書の内容cの間の類似性の自動的なテキストに基づく比較によって検索クエリーqと同様である文書中の句pを同定してもしなくてもよい。自動解析によってそのような句pが同定される場合には、周囲のコンテキストcを与えられたとき、句pが検索クエリーqを引き起こしたまたは誘起したことがありうると想定される。これは、手動のラベル付けなしに(<p,c>,q)対を生成し、それらの対が人工知能システム214のためのトレーニング・データに追加されることができる。
〈例示的なユーザー・インターフェース〉
図3は、ローカル・コンピューティング装置104上に表示されうる例示的な文書300を示している。文書300はウェブ・ページ、テキスト文書、ワードプロセシング文書、スプレッドシート文書またはテキストを含む他の任意の型の文書であってもよく、ハイパーテキストマーケット言語(HTML)または拡張可能マークアップ言語(XML)のようなマークアップ言語で書かれた文書を含むがこれに限られない任意のフォーマットであってもよい。文書300は、ユーザー102によって選択されるテキストについてのコンテキストの複数の例を示している。
ユーザーが選択したテキスト302が、ユーザー102によって選択された単数または複数の単語を囲む太線の長方形によって示されている。ユーザー102は部分的な単語または単独文字を選択してもよい。選択されたテキスト302は、ユーザーの注目を受けている文書300の部分を示す。選択されたテキスト302は文書300のコンテキスト内に存在する。言語モデル212または人工知能システム214によって、コンテキストと考えられる文書300の量は変わりうる。
いくつかの実装では、文書300全体が、選択されたテキスト302についてのコンテキストを与えてもよい。文書300全体は、表示されていないものも含め複数のページを含んでいてもよく、その一部のページはユーザーによって閲覧されていなくてもよい。コンテキストのより狭いビューは、選択されたテキスト302を含むセンテンス304のみを含んでいてもよい。他の実装では、コンテキストは、選択されたテキスト302を含む段落306、選択されたテキスト302を含む欄308(またはウェブ・ページ・レイアウト中のフレーム)または選択されたテキスト302を含む文書300のページ310として定義されてもよい。センテンス、段落および/またはページのない文書を含む任意の型の文書について、コンテキストは文書300全体の相対的により大きなまたは相対的により小さな部分として定義されてもよい。
コンテキストは、所定の数の単語または文字をもち、選択されたテキスト302を含むテキストの部分312であってもよい。たとえば、選択されたテキスト302を含む文書300の60語のセグメントがコンテキストとして使われてもよい。テキスト312のこの部分は、複数のセンテンス、段落、欄などにまたがってもよく、センテンス、段落、欄などの途中で始まったり終わったりしてもよい。60語の長さは単に例示的であり、コンテキストは100語、20語といった任意の長さであってもよく、あるいはキャラクタに基づいていて、20文字、100文字、500文字または他の何らかの数の単語またはキャラクタを含んでいてもよい。
いくつかの実装では、選択されたテキスト302は、テキストの部分312の実質的に中央に位置している。たとえば、選択されたテキスト302が3語をもち、テキストの部分312が60語を含む場合、選択されたテキスト302はコンテキストをなすテキストの部分312の先頭から約23または24語に位置していてもよい(すなわち、60−3=57;57÷2=23.5)。いくつかの実装では、選択されたテキスト302はテキストの部分312の中央50%に(すなわち、最初の1/4および最後の1/4にはない)、あるいはテキスト308の前記部分の中央20%に(すなわち、最初の40%および最後の40%にはない)位置していてもよい。
テキスト308の前記部分における単語または文字の数の計算は、コンテキストを検索クエリーをランク付けするために最も有用でありうる単語に基づくものとするために、ストップワードを除外してもよい。たとえば、選択されたテキスト302を中心とする20語のコンテキストは、「a」、「the」、「and」、「it」および他の型のストップワードといった単語がコンテキストの20語に含まれているとしたら、検索クエリーをランク付けすることにおいてそれほどの助けとならないことがありうる。よって、コンテキストをなすテキスト302の前記部分における単語の所定の数は、ストップワードを除外した単語の所定の数であってもよい。
図3は、文書300内の事前に定式化された検索クエリー314の位置をも示している。事前に定式化された検索クエリー314は、ユーザーによるテキストの選択より前に文書の一部に関連付けられていてもよい。たとえば、事前に定式化された検索クエリー314は、文書300中の特定の単語、センテンス、段落、欄、ページなどに関連付けられていてもよい。この例は、選択されたテキスト302の直前のセンテンスに関連付けられているとして、事前に定式化された検索クエリー314を示している。選択されたテキスト302についてのコンテキストと考えられる文書300の広がりに依存して、事前に定式化された検索クエリー314は、文書300の、選択されたテキスト302と同じ部分に含まれていてもいなくてもよい。たとえば、選択されたテキスト302を含むセンテンス304がコンテキストである場合、事前に定式化された検索クエリー314は、文書300の、選択されたテキスト302と同じ部分に関連付けられない。しかしながら、コンテキストが段落306である場合には、事前に定式化された検索クエリー314は、文書300の、選択されたテキスト302と同じ部分に関連付けられる。
文書300は、0個、1個または複数個の事前に定式化された検索クエリー314を含みうる。事前に定式化された検索クエリー314は、文書300の関連する部分を消費しているときにユーザーが実施する可能性が高いであろうクエリーでありうる。事前に定式化された検索クエリー314は、文書300の特定の部分に埋め込むために人間の作者によって手動で制作されてもよい。代替的または追加的に、事前に定式化された検索クエリー314の一つまたは複数が、文書300を閲覧しその後クエリーを生成した他のユーザーからの検索ログの解析に基づいて決定されてもよい。
図2に示した検索クエリー生成器208は、事前に定式化された検索クエリー314を、選択されたテキスト302から生成される他の検索クエリーと一緒に取得してもよい。いくつかの実装では、候補クエリー生成器208は、文書300に関連付けられたすべての事前に定式化された検索クエリー314を、ユーザーに呈示される検索クエリーのリストに含めてもよい。他の実装では、候補クエリー生成器208は、コンテキストの定義に基づいて、文書300の、選択されたテキスト302と同じ部分に関連付けられている事前に決定された検索クエリー314のみを含めてもよい。さらなる実装では、文書300内の、選択されたテキスト302の位置に最も近い位置に関連付けられている閾値数(たとえば1個、2個、3個)の事前に決定された検索クエリー314のみが、ユーザーに呈示される検索クエリーのリストに含められる。
ひとたびユーザーが候補クエリーのリストからクエリーを選択したら、その選択されたクエリーが、文書300のその後の呈示について、事前に決定された検索クエリー314として使われてもよい。その事前に決定された検索クエリー314は、その検索クエリーをもともと生成した選択されたテキスト302の位置に関連付けられていてもよい。このように、文書300に関連付けられる事前に決定された検索クエリー314の数は、システムの使用が増すにつれて増大しうる。
図4は、タッチスクリーン・デバイス上でテキストを選択するための二つの例示的なユーザー・インターフェース400および402を示している。図1からのローカルなコンピューティング装置104は、タッチスクリーン・ディスプレイをもつ装置として実装されてもよい。第一のユーザー・インターフェース400では、ユーザーは自分の指(またはスタイラスのような他のポインティング器具)を、タッチスクリーンの表面上を横切って、選択すべきテキストの先頭にある点404から、点406かつ選択したいテキストの終わりまでドラッグする。ユーザーは、テキストの中央を通じて、あたかもテキストに下線を引いているかのようにテキストの底部に沿って、あるいはテキストの流れに概括的に一致する別の動きにおいて(たとえば英語では左から右へ、ただし動きの方向は異なる言語については異なりうる)、指を動かしうる。システムにとって、選択されたテキストから検索クエリーを定式化するための合図は、指が終点406で静止したときの指の動きの停止、タッチスクリーンの表面からの指の持ち上げ、終点406でのタッチスクリーンのタップなどであってもよい。
ユーザーは、第二のユーザー・インターフェース402において示されているように、ユーザーが選択することを意図しているテキストのまわりに概括的に円形(circular)の形状でスタイラス(または指のような他のポインティング器具)を動かすことによって、テキストを選択してもよい。概括的に円形の形状は、円形というよりは卵形(ovoid)の形であってもよく、始点408と終点410が接する閉じた円であっても、始点408が終点410とは異なる位置にある開いた弧であってもよい。
この例において、円は、選択されるテキストの右下の点408で始まってぐるっと時計回りに選択されるテキストの右上の点410まで描かれる。いくつかの実装では、時計回りまたは反時計回りいずれの方向に描かれた円もいずれも同じ結果を引き起こしうる。しかしながら、他の実装では、検索結果の生成の開始は、円が時計回り(あるいはまた反時計回り)方向に描かれるときにのみ行なわれてもよい。システムにとっての、選択されたテキストから検索クエリーを定式化するための合図は、スタイラスが終点410で静止したときのスタイラスの動きの停止、タッチスクリーンの表面からのスタイラスの持ち上げ、スタイラスが始点408に戻るときに円が閉じること、終点410でのタッチスクリーンのタップまたはテキスト選択の終了を表わし検索クエリー生成の開始を要求する他の何らかのジェスチャーであってもよい。
図4に示されるユーザー・インターフェース402および404のいずれも、ユーザーが、複数のコマンドやキーボードの使用あるいは消費していた文書以外のインターフェースへの切り換えなしに検索プロセスを開始するための便利な方法を提供する。
〈例示的なプロセス〉
理解の簡単のため、本開示で議論した諸プロセスは、独立したブロックとして表現される別個の動作として描かれるが、これらの別個に描かれた動作は、その機能において必ずしも順序依存として解釈されるべきではない。これらのプロセスが記載される順序は、限定として解釈されることは意図されておらず、記載されるプロセス・ブロックの任意の数が任意の順序で組み合わされて当該プロセスまたは代替的なプロセスを実装してもよい。さらに、提供される動作の一つまたは複数が修正または省略されてもよいことも可能である。
これらのプロセスは、ハードウェア、ソフトウェアまたはハードウェアとソフトウェアの組み合わせとして実装できる動作のシーケンスを表わす論理的なフローチャートにおいてブロックの集合として示される。議論のために、これらのプロセスは、図1〜図4に示したアーキテクチャ、システムおよびユーザー・インターフェースを参照して記述されるが、これらのプロセスは異なるアーキテクチャ、システムおよび/またはユーザー・インターフェースを使って実行されてもよい。
図5は、ユーザーに対する候補クエリーを同定し、呈示するプロセス500のフローチャートを示している。502では、文書中のテキストのユーザーによる選択が受領される。ユーザーは、図1に示したユーザー102であってもよく、選択は情報処理システム112によって受領されてもよい。選択されたテキストは、連続した1個、2個、3個、4個などの単語のようなテキストの連続的な系列または文書中の複数の位置からの複数の単語または組み合わせ単語の諸選択でありうる。文書は、ウェブ・ページ、テキスト文書、ワードプロセシング文書、電子書籍または他の任意の型の文書でありうる。
504では、複数の候補クエリーが取得される。候補クエリーは、候補クエリー生成器208から直接または間接的に取得されてもよい。候補クエリーは、502において選択されたテキストに一つまたは複数のクエリー拡張技法を適用することによって生成される。クエリー拡張技法は、選択されたテキストを以前のクエリー・ログと比較して、選択されたテキストに基づいて以前のクエリー・ログからの一つまたは複数のクエリーを同定するいかなる技法を含んでいてもよい。例示的な技法は、クエリー・ログに対してK平均アルゴリズムを適用すること、クエリー・ログをパースすることによって生成されるクエリー‐文書二部グラフ上でランダム・ウォークを実施すること、クエリー・ログから生成されたクエリー‐フロー・グラフ上でページランク(PageRank)アルゴリズムを走らせることまたはクエリー・ログからターム関連付けパターンをマイニングすることを含む。
506では、当該文書に関連付けられた事前に定式化されたクエリーがあるかどうかが判定される。事前に定式化されたクエリーは、過去の検索挙動のクエリー・ログに基づいて同定されても、人間の編集者によって作成されても、あるいは検索クエリーを生成するための他のいかなる技法によって生成されてもよい。事前に定式化されたクエリーは、特定の単語、センテンス、段落、ページなど、文書の特定の部分に関連付けられていてもよい。たとえば、図3に示される事前に定義されたクエリー314といったものである。ユーザーによって選択されたテキストが文書の、事前に定式化されたクエリーと同じ部分からである場合には、プロセス500は「yes」経路に沿って508に進む。しかしながら、文書が事前に定式化されたクエリーに関連付けられていない場合または文書に関連付けられた事前に定式化されたクエリーが、文書の、選択されたテキストを含む部分に関連付けられていない場合には、プロセス500は「no」経路に沿って510に進む。
508では、事前に定式化されたクエリーが、504で得られた候補クエリーの集合に含められる。事前に定式化されたクエリーは、事前に定式化されていて、生成するために処理や解析を必要としないことがあるので、504において得られる他のクエリーより速く得られることがある。
510では、508で同定された事前に定式化されたクエリーがあればそれも含めて504で得られた候補クエリーがランク付けされる。候補クエリーのランク付けは、502で選択されたテキストに基づいてユーザーが所望する結果を返す可能性がより高いクエリーにより高いランクを与える。ランク付けは、文書によって与えられるコンテキストを考える言語モデル512に基づいていてもよい。コンテキストは、502でユーザーによって選択されたテキストおよび追加的なテキストを含む、文書中のテキストによって表わされてもよい(すなわち、コンテキストは、ユーザーによって選択されたテキストより、少なくとも一つの追加的な単語または文字だけ多くを含む)。ランク付けは、追加的または代替的に、人工知能システム514に基づいていてもよい。人工知能システム514は、人間の吟味によって検証される文書とクエリーの対の集合(すなわち、トレーニング・データ)を用いてトレーニングされる。人間の検査者は、文書とクエリーの対を評価して、クエリーであって、該クエリーと対にされた文書の内容に関係しているクエリーをもつ対を同定する。
516では、候補クエリーが、ランク付けに従って順序付けられたランク付けされたリストにおいて、ユーザーに呈示される。ランク付けされたリストは、ユーザーがテキストを選択したもとの文書をも表示するインターフェースにおいてユーザーに対して示されてもよく、それによりユーザーは、検索クエリーを選びながら、当該文書および選択されたテキストを見ることができる。あるいはまた、文書はもはや示されず、文書はリストによって置換されてもよい(たとえば、両方を示すには小さすぎる表示領域をもつ装置上で)。リストをポップアップ・ボックス、ドロップダウン・メニューなどで呈示するといった、リストを表示するための追加的な技法も考えられている。このように、502におけるテキストの選択は、選択されたテキストおよび周囲のコンテキストに基づいて関連性の順序でランク付けされた推奨されるクエリーのリストの表示を引き起こしうる。
518では、リストからの候補クエリーの一つのユーザーによる選択が受領される。ユーザーは、リストから項目を選択するためのいかなる通常の技法によって選択を行なってもよい。このように、ユーザーは、検索すべき単語を502において選択するときの自分の意図を最もよく表わす検索クエリーを前記リストから取ることができる。
520では、ユーザーによって選択されたクエリーは、検索エンジン110のような一つまたは複数の検索エンジンに提出される。次いでユーザーは、検索エンジンから検索結果を受け取ることができる。このように、この方法500では、ユーザーは、文書から選択された単語を単純に検索するよりも、効果的な結果を生成するようよりよく設計されている検索クエリーに基づいて、検索結果を得ることができ、ユーザーはそれらの結果を、文書および/または検索エンジン・インターフェースとの最小限の対話のみで受け取ることができる。
〈結語〉
上記の主題はハードウェア、ソフトウェアまたはハードウェアとソフトウェアの両方において実装できる。実装は、構造的な特徴および/または方法論的な工程に固有の言辞において記載されてきたが、付属の請求項において定義される発明は必ずしも上記の特定の特徴または工程に限定されるものではないことは理解されるものとする。むしろ、そうした特定の特徴および工程は、検索クエリーを生成する例示的な実装の例示的な形として開示されているのである。
いくつかの態様を記載しておく。
〔態様1〕
文書中のテキストのユーザーによってなされた選択を受領する段階と;
少なくとも部分的には選択されたテキストに一つまたは複数のクエリー拡張技法を適用することによって生成されたクエリーを含む複数の候補クエリーを取得する段階と;
少なくとも部分的には(i)選択されたテキストの一部または全部および追加的なテキストを含む前記文書中のテキストを含むコンテキストから導出される言語モデルまたは(ii)クエリーであって該クエリーと対にされた文書の内容に関係しているクエリーを有するものとして人間の検査者によって識別された文書とクエリーの対の集合をもってトレーニングされる人工知能システムに基づいて、前記複数の候補クエリーを、一つまたは複数の処理要素によってランク付けする段階とを含む、
方法。
〔態様2〕
前記クエリー拡張技法は、クエリー・ログに対してK平均アルゴリズムを適用すること、クエリー・ログをパースすることによって生成されるクエリー‐文書二部グラフ上でランダム・ウォークを実施すること、クエリー・ログから生成されたクエリー‐フロー・グラフ上でページランク・アルゴリズムを実行することまたはクエリー・ログからターム関連付けパターンをマイニングすることのうち少なくとも一つを含む、態様1記載の方法。
〔態様3〕
前記コンテキストが、所定数の単語またはキャラクタを有する前記文書のテキストの一部を有しており、テキストの前記一部は、前記選択されたテキストがテキストの前記一部の実質的に中央になるよう前記文書中で位置される、態様1記載の方法。
〔態様4〕
前記ランク付けが少なくとも部分的には前記言語モデルに基づき、前記言語モデルは、少なくとも部分的には、前記複数の候補クエリーのうちのクエリー内のいくつかの単語、前記選択されたテキスト内のいくつかの単語および前記コンテキスト内のいくつかの単語に基づく、態様1記載の方法。
〔態様5〕
前記ランク付けが少なくとも部分的には前記言語モデルに基づき、前記言語モデルは、前記複数の候補クエリーからのクエリー内の単語が該クエリー内の直前の単語に依存する二項言語モデルを含む、態様1記載の方法。
〔態様6〕
前記複数の候補クエリーを、少なくとも部分的には前記ランク付けに従って順序付けされたリストにおいて、ユーザーに対して呈示する段階と;
前記複数の候補クエリーのうちの一つのクエリーのユーザーによる選択を受領する段階と;
前記候補クエリーのうちの選択されたクエリーを検索エンジンに提出する段階とをさらに含む、
態様1記載の方法。
〔態様7〕
コンピュータ実行可能命令を有する一つまたは複数のコンピュータ可読媒体であって、前記命令は、プロセッサによって実行されたときに、コンピューティング・システムに:
ユーザーによる文書中のテキストの選択を、少なくとも部分的には選択されたテキストに基づく一つまたは複数の検索クエリーをユーザーに提供するコマンドとして解釈する段階と;
少なくとも選択されたテキストに基づいて複数の候補クエリーを取得する段階と;
前記文書によって与えられるコンテキストに少なくとも部分的に基づいて前記候補クエリーをランク付けする段階とを実行させるものである、
一つまたは複数のコンピュータ可読媒体。
〔態様8〕
前記テキストの選択が:
ユーザーがタッチスクリーン・ディスプレイ上に表示されたテキストに沿ってポインティング器具をドラッグすること、または
ユーザーがタッチスクリーン・ディスプレイ上に表示されたテキストのまわりで概括的に円形または卵型にポインティング器具を動かすことを含む、
態様7記載の一つまたは複数のコンピュータ可読媒体。
〔態様9〕
前記コンテキストが、前記選択されたテキストの少なくとも一部を含む前記文書からのテキストのセクションを含み、前記ランク付けが、少なくとも部分的には前記候補クエリーのうちのクエリー内およびクエリー・コーパス内の単語の数に基づいて候補クエリーをランク付けする二項言語モデルを使うことを含む、態様7記載の一つまたは複数のコンピュータ可読媒体。
〔態様10〕
前記コンテキストが、前記選択されたテキストを含む前記文書からのテキストのセクションを含み、前記ランク付けが、文書/クエリー・タプルのデータ・セットを使う人工知能システムを使うことを含み、前記文書/クエリー・タプルのそれぞれのタプルにおける文書とクエリーとの間の対応は人間の検査者によって検証されている、態様7記載の一つまたは複数のコンピュータ可読媒体。

Claims (10)

  1. コンピュータ・システムが実行する方法であって、
    文書中のテキストのユーザーによってなされた選択を受領手段によって受領する段階と;
    少なくとも部分的には選択されたテキストに一つまたは複数のクエリー拡張技法を適用することによって生成されたクエリーを含む複数の候補クエリーを取得手段によって取得する段階と;
    少なくとも部分的には(i)選択されたテキストの一部または全部および追加的なテキストを含む前記文書中のテキストを含むコンテキストから導出される言語モデルまたは(ii)クエリーであって該クエリーと対にされた文書の内容に関係しているクエリーを有するものとして人間の検査者によって識別された文書とクエリーの対の集合をもってトレーニングされる人工知能システムに基づいて、前記複数の候補クエリーを、ランク付け手段によってランク付けする段階とを含む、
    方法。
  2. 前記クエリー拡張技法は、クエリー・ログに対してK平均アルゴリズムを適用すること、クエリー・ログをパースすることによって生成されるクエリー‐文書二部グラフ上でランダム・ウォークを実施すること、クエリー・ログから生成されたクエリー‐フロー・グラフ上でページランク・アルゴリズムを実行することまたはクエリー・ログからターム関連付けパターンをマイニングすることのうち少なくとも一つを含む、請求項1記載の方法。
  3. 前記コンテキストが、所定数の単語またはキャラクタを有する前記文書のテキストの一部を有しており、テキストの前記一部は、前記選択されたテキストがテキストの前記一部の実質的に中央になるよう前記文書中で位置される、請求項1記載の方法。
  4. 前記ランク付けが少なくとも部分的には前記言語モデルに基づき、各候補クエリーについて、前記選択されたテキストおよび前記コンテキストが与えられたときにその候補クエリーが生成される条件付き確率を決定することを含み、前記言語モデルは前記条件付き確率を、少なくとも部分的には、(i)クエリー・コーパスにおいて前記候補クエリー内の各単語を含むクエリーのそれぞれの集合、(ii)前記クエリー・コーパスにおいて前記選択されたテキスト内の各単語を含むクエリーのそれぞれの集合、(iii)前記クエリー・コーパスにおいて前記コンテキスト内の各単語を含むクエリーのそれぞれの集合の一つまたは複数を組み合わせた集合の要素数に基づいて与える、請求項1記載の方法。
  5. 前記ランク付けが少なくとも部分的には前記言語モデルに基づき、前記言語モデルは、前記複数の候補クエリーからのクエリー内の単語が該クエリー内の直前の単語に依存する二項言語モデルを含む、請求項1記載の方法。
  6. 呈示手段によって、前記複数の候補クエリーを、少なくとも部分的には前記ランク付けに従って順序付けされたリストにおいて、ユーザーに対して呈示する段階と;
    受領手段によって、前記複数の候補クエリーのうちの一つのクエリーのユーザーによる選択を受領する段階と;
    提出手段によって、前記候補クエリーのうちの選択されたクエリーを検索エンジンに提出する段階とをさらに含む、
    請求項1記載の方法。
  7. コンピューティング・システムに:
    ユーザーによる文書中のテキストの選択を、少なくとも部分的には選択されたテキストに基づく一つまたは複数の検索クエリーをユーザーに提供するコマンドとして解釈する段階と;
    少なくとも選択されたテキストに基づいて複数の候補クエリーを取得する段階と;
    前記文書によって与えられるコンテキストに少なくとも部分的に基づいて前記複数の候補クエリーをランク付けする段階とを実行させるためのコンピュータ・プログラム。
  8. 前記テキストの選択が:
    ユーザーがタッチスクリーン・ディスプレイ上に表示されたテキストに沿ってポインティング器具をドラッグすること、または
    ユーザーがタッチスクリーン・ディスプレイ上に表示されたテキストのまわりで概括的に円形または卵型にポインティング器具を動かすことを含む、
    請求項7記載のコンピュータ・プログラム。
  9. 前記コンテキストが、前記選択されたテキストの少なくとも一部を含む前記文書からのテキストのセクションを含み、前記複数の候補クエリーをランク付けすることが、各候補クエリーについて、クエリー・コーパスが与えられたときにその候補クエリーが前記選択されたテキストおよび前記コンテキストに対応する確からしさを表わす値を決定し、決定された値に基づいて前記複数の候補クエリーをランク付けすることを含む、請求項7記載のコンピュータ・プログラム。
  10. 前記コンテキストが、前記選択されたテキストを含む前記文書からのテキストのセクションを含み、前記ランク付けが、文書/クエリー・タプルのデータ・セットを使う人工知能システムを使うことを含み、前記文書/クエリー・タプルのそれぞれのタプルにおける文書とクエリーとの間の対応は人間の検査者によって検証されている、請求項7記載のコンピュータ・プログラム。
JP2014559900A 2012-02-29 2013-02-01 コンテキスト・ベースの検索クエリー形成 Active JP6429630B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/408,853 US10984337B2 (en) 2012-02-29 2012-02-29 Context-based search query formation
US13/408,853 2012-02-29
PCT/US2013/024247 WO2013130215A1 (en) 2012-02-29 2013-02-01 Context-based search query formation

Publications (3)

Publication Number Publication Date
JP2015508930A JP2015508930A (ja) 2015-03-23
JP2015508930A5 JP2015508930A5 (ja) 2016-02-25
JP6429630B2 true JP6429630B2 (ja) 2018-11-28

Family

ID=49004430

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014559900A Active JP6429630B2 (ja) 2012-02-29 2013-02-01 コンテキスト・ベースの検索クエリー形成

Country Status (11)

Country Link
US (1) US10984337B2 (ja)
EP (1) EP2820578B1 (ja)
JP (1) JP6429630B2 (ja)
KR (1) KR102036394B1 (ja)
CN (1) CN104145269B (ja)
AU (1) AU2013226549B2 (ja)
BR (1) BR112014019703A8 (ja)
CA (1) CA2861121C (ja)
MX (1) MX353571B (ja)
RU (1) RU2633115C2 (ja)
WO (1) WO2013130215A1 (ja)

Families Citing this family (141)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US10706373B2 (en) 2011-06-03 2020-07-07 Apple Inc. Performing actions associated with task items that represent tasks to perform
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US11157570B2 (en) * 2012-05-24 2021-10-26 Evernote Corporation Related notes and multi-layer search in personal and shared content
US9483518B2 (en) 2012-12-18 2016-11-01 Microsoft Technology Licensing, Llc Queryless search based on context
DE212014000045U1 (de) 2013-02-07 2015-09-24 Apple Inc. Sprach-Trigger für einen digitalen Assistenten
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
JP2014211701A (ja) * 2013-04-17 2014-11-13 ソニー株式会社 情報処理装置、情報処理方法、及びプログラム
JP6259911B2 (ja) 2013-06-09 2018-01-10 アップル インコーポレイテッド デジタルアシスタントの2つ以上のインスタンスにわたる会話持続を可能にするための機器、方法、及びグラフィカルユーザインタフェース
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
US9646062B2 (en) 2013-06-10 2017-05-09 Microsoft Technology Licensing, Llc News results through query expansion
US20150095319A1 (en) * 2013-06-10 2015-04-02 Microsoft Corporation Query Expansion, Filtering and Ranking for Improved Semantic Search Results Utilizing Knowledge Graphs
US9600228B2 (en) * 2013-09-16 2017-03-21 Here Global B.V. Enhanced system and method for static query generation and entry
US9411905B1 (en) * 2013-09-26 2016-08-09 Groupon, Inc. Multi-term query subsumption for document classification
US9754034B2 (en) * 2013-11-27 2017-09-05 Microsoft Technology Licensing, Llc Contextual information lookup and navigation
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
CN105095231A (zh) * 2014-04-29 2015-11-25 阿里巴巴集团控股有限公司 一种呈现搜索结果的方法和装置
US9600600B2 (en) * 2014-04-30 2017-03-21 Excalibur Ip, Llc Method and system for evaluating query suggestions quality
US9881010B1 (en) 2014-05-12 2018-01-30 Google Inc. Suggestions based on document topics
US9607032B2 (en) 2014-05-12 2017-03-28 Google Inc. Updating text within a document
US9959296B1 (en) 2014-05-12 2018-05-01 Google Llc Providing suggestions within a document
US9251141B1 (en) 2014-05-12 2016-02-02 Google Inc. Entity identification model training
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
WO2015184186A1 (en) 2014-05-30 2015-12-03 Apple Inc. Multi-command single utterance input method
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
WO2015192212A1 (en) * 2014-06-17 2015-12-23 Maluuba Inc. Server and method for classifying entities of a query
US9613145B2 (en) * 2014-06-18 2017-04-04 Google Inc. Generating contextual search presentations
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US9824079B1 (en) 2014-07-11 2017-11-21 Google Llc Providing actions for mobile onscreen content
US10242088B2 (en) 2014-09-18 2019-03-26 Microsoft Technology Licensing, Llc Multi-source search
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
WO2016061102A1 (en) 2014-10-14 2016-04-21 Google Inc. Assistive browsing using context
US11924018B2 (en) 2015-01-27 2024-03-05 Dell Products L.P. System for decomposing events and unstructured data
US11817993B2 (en) * 2015-01-27 2023-11-14 Dell Products L.P. System for decomposing events and unstructured data
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10169467B2 (en) 2015-03-18 2019-01-01 Microsoft Technology Licensing, Llc Query formulation via task continuum
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10200824B2 (en) 2015-05-27 2019-02-05 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
CN105095351B (zh) * 2015-06-18 2019-03-26 百度在线网络技术(北京)有限公司 一种用于提供本地搜索建议的方法和装置
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10331312B2 (en) 2015-09-08 2019-06-25 Apple Inc. Intelligent automated assistant in a media environment
US10740384B2 (en) 2015-09-08 2020-08-11 Apple Inc. Intelligent automated assistant for media search and playback
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10970646B2 (en) 2015-10-01 2021-04-06 Google Llc Action suggestions for user-selected content
US10691709B2 (en) 2015-10-28 2020-06-23 Open Text Sa Ulc System and method for subset searching and associated search operators
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10956666B2 (en) 2015-11-09 2021-03-23 Apple Inc. Unconventional virtual assistant interactions
US10055390B2 (en) 2015-11-18 2018-08-21 Google Llc Simulated hyperlinks on a mobile device based on user intent and a centered selection of text
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10289729B2 (en) * 2016-03-17 2019-05-14 Google Llc Question and answer interface based on contextual information
US10628505B2 (en) 2016-03-30 2020-04-21 Microsoft Technology Licensing, Llc Using gesture selection to obtain contextually relevant information
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10754886B2 (en) * 2016-10-05 2020-08-25 International Business Machines Corporation Using multiple natural language classifier to associate a generic query with a structured question type
US10437841B2 (en) 2016-10-10 2019-10-08 Microsoft Technology Licensing, Llc Digital assistant extension automatic ranking and selection
KR101916798B1 (ko) * 2016-10-21 2018-11-09 네이버 주식회사 검색 컨텍스트를 이용한 질의 추천 방법 및 시스템
CN106845530B (zh) * 2016-12-30 2018-09-11 百度在线网络技术(北京)有限公司 字符检测方法和装置
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
WO2018200979A1 (en) * 2017-04-29 2018-11-01 Google Llc Generating query variants using a trained generative model
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
US10747815B2 (en) 2017-05-11 2020-08-18 Open Text Sa Ulc System and method for searching chains of regions and associated search operators
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
DK180048B1 (en) 2017-05-11 2020-02-04 Apple Inc. MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770427A1 (en) 2017-05-12 2018-12-20 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
US10303715B2 (en) 2017-05-16 2019-05-28 Apple Inc. Intelligent automated assistant for media exploration
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US20180336892A1 (en) 2017-05-16 2018-11-22 Apple Inc. Detecting a trigger of a digital assistant
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US20180349472A1 (en) * 2017-06-02 2018-12-06 Apple Inc. Methods and systems for providing query suggestions
EP3649566A4 (en) 2017-07-06 2021-04-14 Open Text SA ULC SYSTEM AND PROCEDURE FOR VALUE-BASED AREA SEARCH AND RELATED SEARCH OPERATORS
US20190025939A1 (en) * 2017-07-24 2019-01-24 International Business Machines Corporation Cognition Enabled Predictive Keyword Dictionary for Smart Devices
KR102483328B1 (ko) 2017-11-13 2022-12-30 삼성전자주식회사 복수개의 전자 장치들 간의 거리 측정 방법 및 그에 따른 전자 장치
US20190171727A1 (en) * 2017-12-01 2019-06-06 Microsoft Technology Licensing, Llc Personalized contextual predictive type-ahead query suggestions
RU2711103C2 (ru) 2017-12-27 2020-01-15 Общество С Ограниченной Ответственностью "Яндекс" Способ и сервер для прогнозирования предлагаемого варианта расширения частично введенного пользователем запроса
US10824686B2 (en) * 2018-03-05 2020-11-03 Open Text Sa Ulc System and method for searching based on text blocks and associated search operators
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10504518B1 (en) 2018-06-03 2019-12-10 Apple Inc. Accelerated task performance
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
JP7115207B2 (ja) * 2018-10-11 2022-08-09 富士通株式会社 学習プログラム、学習方法および学習装置
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
RU2730449C2 (ru) * 2019-01-29 2020-08-21 Публичное Акционерное Общество "Сбербанк России" (Пао Сбербанк) Способ создания модели анализа диалогов на базе искусственного интеллекта для обработки запросов пользователей и система, использующая такую модель
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US10949664B2 (en) * 2019-04-08 2021-03-16 Kyocera Document Solutions Inc. Optical character recognition training data generation for neural networks by parsing page description language jobs
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
DK201970510A1 (en) 2019-05-31 2021-02-11 Apple Inc Voice identification in digital assistant systems
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
US11227599B2 (en) 2019-06-01 2022-01-18 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
US11488406B2 (en) 2019-09-25 2022-11-01 Apple Inc. Text detection using global geometry estimators
KR102244887B1 (ko) * 2019-10-01 2021-04-28 (주) 더존비즈온 Sql 쿼리 추천 방법 및 시스템
US11061543B1 (en) 2020-05-11 2021-07-13 Apple Inc. Providing relevant data items based on context
US11183193B1 (en) 2020-05-11 2021-11-23 Apple Inc. Digital assistant hardware abstraction
US11755276B2 (en) 2020-05-12 2023-09-12 Apple Inc. Reducing description length based on confidence
CN111831806B (zh) * 2020-07-02 2024-04-09 北京小米松果电子有限公司 语义完整性确定方法、装置、电子设备和存储介质
US11490204B2 (en) 2020-07-20 2022-11-01 Apple Inc. Multi-device audio adjustment coordination
US11438683B2 (en) 2020-07-21 2022-09-06 Apple Inc. User identification using headphones
US11829720B2 (en) 2020-09-01 2023-11-28 Apple Inc. Analysis and validation of language models
CN112926577B (zh) * 2021-02-20 2021-11-26 杭州海量信息技术有限公司 一种医疗票据图像结构化方法和装置、计算机可读介质
KR20230050807A (ko) 2021-10-08 2023-04-17 삼성전자주식회사 전자 장치 및 이의 제어 방법

Family Cites Families (78)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5252951A (en) 1989-04-28 1993-10-12 International Business Machines Corporation Graphical user interface with gesture recognition in a multiapplication environment
US6968333B2 (en) * 2000-04-02 2005-11-22 Tangis Corporation Soliciting information based on a computer user's context
US7760969B2 (en) 1999-05-25 2010-07-20 Silverbrook Research Pty Ltd Method of providing information via context searching from a printed substrate
US6598072B1 (en) 1999-12-02 2003-07-22 International Business Machines Corporation System for precluding repetitive accessing of web pages in a sequence of linked web pages accessed from the world wide web through a web browser at a web receiving display station
KR20010103532A (ko) 2000-05-10 2001-11-23 제임스 김 다니엘 전자상거래 원클릭 상품 검색방법 및 그 장치
US6591266B1 (en) * 2000-07-14 2003-07-08 Nec Corporation System and method for intelligent caching and refresh of dynamically generated and static web content
KR20000063555A (ko) 2000-07-21 2000-11-06 박형준 웹브라우져 상의 텍스트 정보를 이용한 웹사이트 검색방법
JP2003296015A (ja) 2002-01-30 2003-10-17 Casio Comput Co Ltd 電子機器
JP2004104594A (ja) 2002-09-11 2004-04-02 Toshiba Corp デジタルスチルカメラ及びユーザ指示入力方法
US7548858B2 (en) 2003-03-05 2009-06-16 Microsoft Corporation System and method for selective audible rendering of data to a user based on user input
US7895595B2 (en) * 2003-07-30 2011-02-22 Northwestern University Automatic method and system for formulating and transforming representations of context used by information services
US7836010B2 (en) * 2003-07-30 2010-11-16 Northwestern University Method and system for assessing relevant properties of work contexts for use by information services
US20050160107A1 (en) * 2003-12-29 2005-07-21 Ping Liang Advanced search, file system, and intelligent assistant agent
US6975767B1 (en) * 2004-02-02 2005-12-13 Adams Platform Pty Ltd. System and method for encoding and decoding video
US7499003B2 (en) 2004-03-31 2009-03-03 Electrolux Home Products, Inc. Disappearing interface system
US7836044B2 (en) * 2004-06-22 2010-11-16 Google Inc. Anticipated query generation and processing in a search engine
US7958115B2 (en) 2004-07-29 2011-06-07 Yahoo! Inc. Search systems and methods using in-line contextual queries
KR20060021722A (ko) 2004-09-03 2006-03-08 전홍석 문서보기, 단어추출, 사전검색 결과 보기를 한 프로그램안에서 동시에 실행하는 방법
JP4538284B2 (ja) 2004-09-09 2010-09-08 株式会社リコー 情報検索システム、情報検索端末、並びに、プログラムおよび記録媒体
US8169410B2 (en) 2004-10-20 2012-05-01 Nintendo Co., Ltd. Gesture inputs for a portable display device
US20060136406A1 (en) 2004-12-17 2006-06-22 Erika Reponen Spatial search and selection feature
US7487461B2 (en) 2005-05-04 2009-02-03 International Business Machines Corporation System and method for issuing commands based on pen motions on a graphical keyboard
US7676767B2 (en) 2005-06-15 2010-03-09 Microsoft Corporation Peel back user interface to show hidden functions
CN101243449A (zh) 2005-06-16 2008-08-13 文字点击有限公司 用于从计算机显示的内容中自动启动搜索查询的方法和系统
US7657518B2 (en) 2006-01-31 2010-02-02 Northwestern University Chaining context-sensitive search results
US7664739B2 (en) 2006-02-14 2010-02-16 Microsoft Corporation Object search ui and dragging object results
US8077153B2 (en) 2006-04-19 2011-12-13 Microsoft Corporation Precise selection techniques for multi-touch screens
US7739221B2 (en) * 2006-06-28 2010-06-15 Microsoft Corporation Visual and multi-dimensional search
US20080005074A1 (en) 2006-06-28 2008-01-03 Microsoft Corporation Search over designated content
US7716201B2 (en) 2006-08-10 2010-05-11 Yahoo! Inc. Method and apparatus for reconstructing a search query
US7877707B2 (en) 2007-01-06 2011-01-25 Apple Inc. Detecting and interpreting real-world and security gestures on touch and hover sensitive devices
JP4398992B2 (ja) * 2007-03-29 2010-01-13 株式会社東芝 情報検索装置、情報検索方法及び情報検索プログラム
US7693842B2 (en) 2007-04-09 2010-04-06 Microsoft Corporation In situ search for active note taking
US20080263142A1 (en) 2007-04-20 2008-10-23 Computer Associates Think, Inc. Meta Data Driven User Interface System and Method
US8094939B2 (en) 2007-06-26 2012-01-10 Microsoft Corporation Digital ink-based search
US8190627B2 (en) 2007-06-28 2012-05-29 Microsoft Corporation Machine assisted query formulation
JP2009053757A (ja) 2007-08-23 2009-03-12 Toshiba Corp 情報処理装置、入力方法およびプログラム
US7778118B2 (en) 2007-08-28 2010-08-17 Garmin Ltd. Watch device having touch-bezel user interface
US20090106221A1 (en) 2007-10-18 2009-04-23 Microsoft Corporation Ranking and Providing Search Results Based In Part On A Number Of Click-Through Features
JP4724701B2 (ja) * 2007-10-30 2011-07-13 日本電信電話株式会社 文章検索サーバコンピュータ,文章検索方法,文章検索プログラム,そのプログラムを記録した記録媒体
TWI389015B (zh) 2007-12-31 2013-03-11 Htc Corp 軟體鍵盤之操作方法
US20090198671A1 (en) * 2008-02-05 2009-08-06 Yahoo! Inc. System and method for generating subphrase queries
US20100241663A1 (en) 2008-02-07 2010-09-23 Microsoft Corporation Providing content items selected based on context
US8205157B2 (en) 2008-03-04 2012-06-19 Apple Inc. Methods and graphical user interfaces for conducting searches on a portable multifunction device
US8201109B2 (en) 2008-03-04 2012-06-12 Apple Inc. Methods and graphical user interfaces for editing on a portable multifunction device
JP4848388B2 (ja) * 2008-04-09 2011-12-28 ヤフー株式会社 検索クエリに関するスコアを算出する方法
US8010547B2 (en) 2008-04-15 2011-08-30 Yahoo! Inc. Normalizing query words in web search
US8229911B2 (en) 2008-05-13 2012-07-24 Enpulz, Llc Network search engine utilizing client browser activity information
US20090287680A1 (en) 2008-05-14 2009-11-19 Microsoft Corporation Multi-modal query refinement
US8296670B2 (en) 2008-05-19 2012-10-23 Microsoft Corporation Accessing a menu utilizing a drag-operation
US8055673B2 (en) 2008-06-05 2011-11-08 Yahoo! Inc. Friendly search and socially augmented search query assistance layer
WO2009155281A1 (en) 2008-06-17 2009-12-23 The Trustees Of Columbia University In The City Of New York System and method for dynamically and interactively searching media data
US20100042613A1 (en) 2008-08-14 2010-02-18 Yield Software, Inc. Method and system for automated search engine optimization
US8250066B2 (en) 2008-09-04 2012-08-21 International Business Machines Corporation Search results ranking method and system
US8060582B2 (en) 2008-10-22 2011-11-15 Google Inc. Geocoding personal information
US8086275B2 (en) 2008-10-23 2011-12-27 Microsoft Corporation Alternative inputs of a mobile communications device
US20100107067A1 (en) 2008-10-27 2010-04-29 Nokia Corporation Input on touch based user interfaces
US20100146012A1 (en) 2008-12-04 2010-06-10 Microsoft Corporation Previewing search results for suggested refinement terms and vertical searches
US8055675B2 (en) * 2008-12-05 2011-11-08 Yahoo! Inc. System and method for context based query augmentation
US8407606B1 (en) 2009-01-02 2013-03-26 Perceptive Pixel Inc. Allocating control among inputs concurrently engaging an object displayed on a multi-touch device
US9330165B2 (en) * 2009-02-13 2016-05-03 Microsoft Technology Licensing, Llc Context-aware query suggestion by mining log data
US8275759B2 (en) * 2009-02-24 2012-09-25 Microsoft Corporation Contextual query suggestion in result pages
KR20100101389A (ko) 2009-03-09 2010-09-17 삼성전자주식회사 사용자 메뉴를 제공하는 디스플레이 장치 및 이에 적용되는ui제공 방법
US8134539B2 (en) 2009-03-30 2012-03-13 Eastman Kodak Company Digital picture frame having near-touch and true-touch
US8836648B2 (en) 2009-05-27 2014-09-16 Microsoft Corporation Touch pull-in gesture
US8498993B2 (en) 2009-08-25 2013-07-30 Rakuten, Inc. Information acquiring apparatus, information acquiring program, recording medium, information acquiring method and information acquiring system
US20110055753A1 (en) 2009-08-31 2011-03-03 Horodezky Samuel J User interface methods providing searching functionality
US9015148B2 (en) 2009-09-21 2015-04-21 Microsoft Corporation Suggesting related search queries during web browsing
US8631004B2 (en) * 2009-12-28 2014-01-14 Yahoo! Inc. Search suggestion clustering and presentation
US8479107B2 (en) 2009-12-31 2013-07-02 Nokia Corporation Method and apparatus for fluid graphical user interface
US8938466B2 (en) 2010-01-15 2015-01-20 Lexisnexis, A Division Of Reed Elsevier Inc. Systems and methods for ranking documents
US8185526B2 (en) 2010-01-21 2012-05-22 Microsoft Corporation Dynamic keyword suggestion and image-search re-ranking
US20110208730A1 (en) * 2010-02-23 2011-08-25 Microsoft Corporation Context-aware searching
WO2011145272A1 (ja) * 2010-05-20 2011-11-24 日本電気株式会社 パープレキシティ算出装置
US8954422B2 (en) * 2010-07-30 2015-02-10 Ebay Inc. Query suggestion for E-commerce sites
DE112011102383T5 (de) 2010-08-17 2013-04-25 Google Inc. Berührungsbasierte Gestenerfassung für eine berührungsempfindliche Vorrichtung
US8438473B2 (en) 2011-01-05 2013-05-07 Research In Motion Limited Handling of touch events in a browser environment
CN103999028B (zh) 2011-05-23 2018-05-15 微软技术许可有限责任公司 不可见控件

Also Published As

Publication number Publication date
JP2015508930A (ja) 2015-03-23
CN104145269A (zh) 2014-11-12
EP2820578A1 (en) 2015-01-07
RU2014135211A (ru) 2016-03-20
RU2633115C2 (ru) 2017-10-11
KR20140128381A (ko) 2014-11-05
EP2820578A4 (en) 2015-02-11
AU2013226549A1 (en) 2014-08-28
US10984337B2 (en) 2021-04-20
MX2014010184A (es) 2014-11-10
AU2013226549B2 (en) 2017-09-28
CN104145269B (zh) 2018-10-16
US20130226935A1 (en) 2013-08-29
KR102036394B1 (ko) 2019-11-26
CA2861121A1 (en) 2013-09-06
BR112014019703A2 (ja) 2017-06-20
WO2013130215A1 (en) 2013-09-06
CA2861121C (en) 2020-07-07
BR112014019703A8 (pt) 2017-07-11
EP2820578B1 (en) 2019-03-27
MX353571B (es) 2018-01-18

Similar Documents

Publication Publication Date Title
JP6429630B2 (ja) コンテキスト・ベースの検索クエリー形成
US20200342177A1 (en) Capturing rich response relationships with small-data neural networks
EP2546766B1 (en) Dynamic search box for web browser
US8150829B2 (en) Facilitating display of an interactive and dynamic cloud of terms related to one or more input terms
US11157488B2 (en) Reinforcement learning techniques to improve searching and/or to conserve computational and network resources
US20210192134A1 (en) Natural query completion for a real-time morphing interface
US8898583B2 (en) Systems and methods for providing information regarding semantic entities included in a page of content
US9613132B2 (en) Method of and system for displaying a plurality of user-selectable refinements to a search query
US20180203921A1 (en) Semantic search in document review on a tangible user interface
EP3074888B1 (en) Contextual information lookup and navigation
US20120265779A1 (en) Interactive semantic query suggestion for content search
US9632999B2 (en) Techniques for understanding the aboutness of text based on semantic analysis
RU2696305C2 (ru) Браузинг изображений через интеллектуально проанализированные связанные гиперссылкой фрагменты текста
JP2015511746A5 (ja)
CA3103796A1 (en) Systems and methods to automatically categorize social media posts and recommend social media posts
TW201222294A (en) Registration for system level search user interface
WO2013134871A1 (en) System and method for conversation-based information search
US20150370833A1 (en) Visual refinements in image search
RU2677379C2 (ru) Способ формирования пользовательского запроса
Vo et al. Disco: A system leveraging semantic search in document review
US20240054552A1 (en) Intelligent Computer Search Engine Removal Of Search Results

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160105

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160105

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160914

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161004

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161226

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20170523

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20171102

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181030

R150 Certificate of patent or registration of utility model

Ref document number: 6429630

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250