JP5998194B2 - 対話型検索方法および装置 - Google Patents

対話型検索方法および装置 Download PDF

Info

Publication number
JP5998194B2
JP5998194B2 JP2014253625A JP2014253625A JP5998194B2 JP 5998194 B2 JP5998194 B2 JP 5998194B2 JP 2014253625 A JP2014253625 A JP 2014253625A JP 2014253625 A JP2014253625 A JP 2014253625A JP 5998194 B2 JP5998194 B2 JP 5998194B2
Authority
JP
Japan
Prior art keywords
query
words
keyword
word
feedback
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014253625A
Other languages
English (en)
Other versions
JP2015225657A5 (ja
JP2015225657A (ja
Inventor
ティンティン リー、
ティンティン リー、
ウェイ ワン、
ウェイ ワン、
シキ ザオ、
シキ ザオ、
Original Assignee
バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド
バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド, バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド filed Critical バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド
Publication of JP2015225657A publication Critical patent/JP2015225657A/ja
Publication of JP2015225657A5 publication Critical patent/JP2015225657A5/ja
Application granted granted Critical
Publication of JP5998194B2 publication Critical patent/JP5998194B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2423Interactive query statement specification based on a database schema
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04842Selection of displayed objects or displayed text elements

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本開示の実施形態は、一般に検索技術分野に関し、より具体的には、対話型検索方法および装置に関する。
コンピュータ技術の発展に伴い、インターネットアプリケーションがますます身近になり、検索エンジンを通じてユーザが必要とするインターネットソースを取得できるようになった。明らかに、関連する検索方法において、ユーザがまずクエリ(query)を入力し、検索エンジンが当該クエリに対応づけられた検索結果を取得し、当該検索結果をクライアントに返すことによって、最終的に、ユーザが必要とするソースを、返された検索結果から取得することになる。
しかしながら、上記の検索方法によると、ユーザによって入力されたクエリの表現が不明瞭または不完全なため、検索エンジンが正確な回答を提供できないことがある。ソースが同一の場合でも、クエリが属する分野にユーザが詳しくないために、検索を行うためにユーザが何度もクエリを変更しなくてはならなくなる。このため、ユーザの検索コストが大幅に高くなる。しかし、その場合でも、取得された検索結果は、依然としてユーザの要求を満たすものではないことがある。
本開示の実施形態は、上記関連技術に存在する問題のうち少なくとも1つを少なくともある程度解決しようとするものである。
したがって、本開示の第1の目的は、クエリ履歴およびフィードバックに従って、自動的にクエリ更新することによって、ユーザの入力作業を低減させ、ユーザの記憶負担を軽減することが可能な対話型検索方法を提供することである。
本開示の第2の目的は、対話型検索装置を提供することである。
上記目的を実現するために、本開示の第1の態様の実施形態は、入力されたクエリに従って検索エンジンが検索を行い、検索結果をユーザに提供する対話型検索方法であって、前記検索エンジンは、
第1のクエリを受信することと、
前記第1のクエリに従って、意図明確化誘導文を取得することと、
前記意図明確化誘導文に対応するフィードバックを受信することと、
前記意図明確化誘導文の種類を取得することと、
前記意図明確化誘導文が一般的な質問または特別な質問である場合、前記第1のクエリ、前記意図明確化誘導文、および前記フィードバックに従って、1つ以上のキーワードセットを取得することと、
前記意図明確化誘導文が選択的な質問である場合、前記第1のクエリおよび前記フィードバックに従って、1つ以上のキーワードセットを取得することと、
前記1つ以上のキーワードセットに従って、第2のクエリを生成することと、
前記第2のクエリに従って、検索結果を提供することと、を実行する対話型検索方法を提供する。
本開示の第2の態様の実施形態は、
第1のクエリを受信する第1の受信モジュールと、
前記第1のクエリに従って、意図明確化誘導文を取得する第1の取得モジュールと、
前記意図明確化誘導文に対応するフィードバックを受信する第2の受信モジュールと、
前記第1のクエリ、前記意図明確化誘導文、および前記フィードバックに従って、第2のクエリを生成する生成モジュールと、
前記第2のクエリに従って、検索結果を提供する提供モジュールと、を備え、
前記生成モジュールは、更に、
前記意図明確化誘導文の種類を取得する第1の取得サブモジュールと、
前記意図明確化誘導文が一般的な質問または特別な質問である場合、前記第1のクエリ、前記意図明確化誘導文、および前記フィードバックに従って、1つ以上のキーワードセットを取得する第2の取得サブモジュールと、
前記意図明確化誘導文が選択的な質問である場合、前記第1のクエリおよび前記フィードバックに従って、1つ以上のキーワードセットを取得する第3の取得サブモジュールと、
前記1つ以上のキーワードセットに従って、第2のクエリを生成する生成サブモジュールと、を備えた対話型検索装置を提供する。
本開示の第3の態様の実施形態は、1つ以上のプロセッサと、メモリと、メモリに記録され、1つ以上のプロセッサによって実行されることによって、本開示の上記実施形態に係る対話型検索方法を実行する1つ以上のプログラムと、を備えた装置を提供する。
本開示の第4態様の実施形態は、本開示の上記実施形態に係る対話型検索方法を実行するための1つ以上のプログラムを格納した、非一時的コンピュータ可読記録媒体を提供する。
本開示の実施形態の他の態様や利点は、部分的には以下に記載され、部分的には以下の記載によって明らかにされ、本開示の実施形態の実施によって理解されることになろう。
本開示の実施形態の上記および他の態様や利点を明らかでより理解しやすいようにするために、下記の図面を参照して以下に説明する。
図1は、本開示の一実施形態に係る対話型検索方法のフローチャートである。 図2aは、本開示の一実施形態に係る、意図明確化誘導文に従ってフィードバックを入力した効果を示す模式図である。 図2bは、本開示の一実施形態に係る、第2のクエリに従って検索結果を提供した効果を示す模式図である。 図2cは、本開示の一実施形態に係る、第1のクエリに従って結果候補を提供した効果を示す模式図である。 図2dは、本開示の一実施形態に係る、第2のクエリに従って検索結果を提供した効果を示す模式図である。 図3は、本開示の一実施形態に係る、第1のクエリ、意図明確化誘導文、およびフィードバックに従って第2のクエリを生成する方法のフローチャートである。 図4は、本開示の一実施形態に係る、第1のクエリ、意図明確化誘導文、およびフィードバックに従って1つ以上のキーワードセットを取得する方法のフローチャートである。 図5は、本開示の一実施形態に係る、第1のクエリおよびフィードバックに従って1つ以上のキーワードセットを取得する方法のフローチャートである。 図6は、本開示の一実施形態に係る、1つ以上のキーワードセットに従って第2のクエリを生成する方法のフローチャートである。 図7は、本開示の一実施形態に係る対話型検索装置のブロック図である。 図8は、本開示の一実施形態に係る対話型検索装置のブロック図である。 図9は、本開示の別の実施形態に係る対話型検索装置のブロック図である。 図10は、本開示の一実施形態に係る対話型検索装置の生成モジュールにおける、第2の取得サブモジュールのブロック図である。 図11は、本開示の一実施形態に係る対話型検索装置の生成モジュールにおける、第3の取得サブモジュールのブロック図である。 図12は、本開示の一実施形態に係る対話型検索装置の生成モジュールにおける、生成サブモジュールのブロック図である。
本開示の実施形態を詳細に参照する。本開示の実施形態を図面に示す。同一または同様の要素、および同一または同様の機能を有する要素には説明全体にわたって同様の参照番号を付してある。ここで図面に従って説明する実施形態は、説明および例示のためのものであり、本開示を限定するものとして解釈するべきではない。
なお、本開示の記載において、「複数」は、2つまたは2つよりも多い数を指し、「第1の」および「第2の」等の語は、説明のために用いられるものであって、相対的な重要性または重大性を意味または示唆するものではない。
本開示の実施形態に係る対話型検索方法および装置を、図面を参照して以下に説明する。
本開示の実施形態において、対話型検索は、対話型情報を提供することによって、ユーザに対する検索誘導を行うことができる検索である。具体的には、ユーザのクエリに従って、対話型情報(例えば、意図明確化誘導文)がユーザに提供され、対話型情報に対応するフィードバックに従って、クエリが更新されることによって、更新されたクエリに従ってさらなる検索が行われ、さらなる検索結果が返される。
ユーザによって入力されたクエリの表現が不明瞭または不完全なため、検索エンジンが正確な回答を提供できないという問題を解決するために、本開示の実施形態は、第1のクエリを受信することと、第1のクエリに従って、意図明確化誘導文を取得することと、意図明確化誘導文に対応するフィードバックを受信し、第1のクエリ、意図明確化誘導文、およびフィードバックに従って、第2のクエリを生成することと、第2のクエリに従って、検索結果を提供することと、を備えた対話型検索方法を提供する。
図1は、本開示の一実施形態に係る対話型検索方法のフローチャートである。図1に示すように、対話型検索方法は、以下のステップを備える。
ステップS101において、第1のクエリを受信する。
本開示の一実施形態において、第1のクエリは、語であっても文であってもよい。ユーザは、要求に従って、第1のクエリを検索ページ内の検索ボックスまたは他の検索欄に入力できる。
ステップS102において、第1のクエリに従って、意図明確化誘導文を取得する。
本開示の実施形態において、第1のクエリに従って意図明確化誘導文を取得する以前に、文ライブラリが確立されている。これにより、検索エンジンが文ライブラリに対してクエリを行うことによって意図明確化誘導文を取得できる。明らかに、文ライブラリがすでに確立されていると、文ライブラリを確立するステップが省略可能となる。
なお、検索エンジンは、第1のクエリに従って、1つ以上の意図明確化誘導文を取得することによって、ユーザが自分の検索意図を明確化するように誘導してもよい。例えば、第1のクエリ(例えば、「スコアが610ポイントの生徒が入学できる大学はどこか?」)に対して、2つの意図明確化誘導文(例えば、「あなたの出身地はどこ?」および「あなたは文系の生徒?それとも理系の生徒?」)が取得できる。
ステップS103において、意図明確化誘導文に対応するフィードバックを受信し、第1のクエリ、意図明確化誘導文、およびフィードバックに従って、第2のクエリを生成する。
本開示の実施形態において、フィードバックは、意図明確化誘導文に対応する回答の語または文である。具体的には、意図明確化誘導文を取得した後、検索エンジンは、ユーザがフィードバックを入力するクライアントを介して、意図明確化誘導文に対応するフィードバックを受信することができる。
本開示の一実施形態において、検索エンジンは、意図明確化誘導文をクライアントを介してユーザに表示することができ、また意図明確化誘導文に対応する少なくとも1つの結果候補または入力ボックスを提供することができる。これによって、ユーザが、少なくとも1つの結果候補から自分の検索意図を満たす結果候補を選択したり、意図明確化誘導文に対応する回答を入力ボックスに直接入力したりできる。
また、検索エンジンは、第1のクエリ、意図明確化誘導文、およびフィードバックに従って、第2のクエリを取得する。具体的には、検索エンジンは、ユーザの検索意図を意味する語を、第1のクエリ、意図明確化誘導文、およびフィードバックから、構文解析または語義解析を通じて取得し、当該語に従って、第2のクエリを取得する。
本開示の一実施形態において、図2aに示すように、第1のクエリ「スコアが610ポイントの生徒が入学できる大学はどこか?」に対して、検索エンジンは、2つの意図明確化誘導文(例えば、「あなたの出身地はどこ?」および「あなたは文系の生徒?それとも理系の生徒?」)を、クライアントを介してユーザに提供する。また、入力ボックスが各意図明確化誘導文の後に設けられ、これによって、ユーザは、「山東省」および「理系」を2つの入力ボックスにそれぞれ入力できる。
ユーザが「送信」ボタンをクリックすると、検索エンジンは、2つの意図明確化誘導文に対応するフィードバックを受信し、第2のクエリ「スコアが610ポイントで山東省の理系生徒が入学できる大学はどこか?」を生成する。
ステップS104において、第2のクエリに従って、検索結果を提供する。
本開示の実施形態において、第2のクエリに従って検索結果を取得した後、検索エンジンは、検索結果をクライアントに返すことによって、検索結果をクライアントを介してユーザに提供する。
また、検索エンジンは、生成された第2のクエリに従って、ユーザのさらなる誘導を行うか否かを判定してもよい。さらなる誘導を行う場合、第2のクエリに従って、対応する意図明確化誘導文を取得し、ユーザの誘導を継続してもよい。さらなる誘導を行わない場合、検索結果を直接提供してもよい。
例えば、本開示の一実施形態において、図2aに示すように、検索エンジンは、第2のクエリ「スコアが610ポイントで山東省の理系生徒が入学できる大学はどこか?」に従って、図2bに示すような検索結果を提供し、意図明確化誘導文「専攻は何か?」をさらに提供する。
本開示の一実施形態において、第1のクエリに従って意図明確化誘導文を取得した後、検索エンジンは、意図明確化誘導文に対応する少なくとも1つの結果候補を提供し、少なくとも1つの結果候補に対するトリガ動作を受信し、トリガ動作がなされた結果候補を意図明確化誘導文に対応するフィードバックとすることによって、ユーザの入力作業を低減させる。
具体的には、本開示の一実施形態において、図2cに示すように、第1のクエリ「ハルビン工業大学はどのようなかんじか?」に対して、検索エンジンは、4つの結果候補(例えば、「科学研究」、「教育」、「就職」、および「寮」)を提供して、ユーザに選択させる。
また、入力ボックスがさらに設けられ、結果候補の中に自分の要求を満たす結果がない場合、ユーザは当該入力ボックス内にフィードバックを入力できる。また、ユーザが「就職」をクリックすると、検索エンジンは、第2のクエリ「ハルビン工業大学の就職はどのようなかんじか?」を生成し、図2dに示すような検索結果を提供する。
本開示の一実施形態において、第2のクエリは、意図明確化誘導文の種類に応じて、第1のクエリ、意図明確化誘導文、およびフィードバックの全体または一部を選択することによって生成されてもよい。
本開示の実施形態において、第1のクエリは、c_queryと表され、意図明確化誘導文は、qbと表され、フィードバックは、ansと表され、第2のクエリは、n_queryと表される。
意図明確化誘導文の種類は、一般的な質問、特別な質問、および選択的な質問を一般に含む。例えば、これら3種類の意図明確化誘導文に従って生成された第2のクエリを、表1に示す。
Figure 0005998194
具体的には、図3は、第1のクエリ、意図明確化誘導文、およびフィードバックに従って、第2のクエリを生成する方法のフローチャートである。図3に示すように、当該方法は、以下のステップを備える。
ステップS301において、意図明確化誘導文の種類を取得する。
具体的には、意図明確化誘導文の種類は、構文解析を行うことによって取得してもよい。
ステップS302において、意図明確化誘導文が一般的な質問または特別な質問である場合、第1のクエリ、意図明確化誘導文、およびフィードバックに従って、1つ以上のキーワードセットを取得する。
本開示の一実施形態において、図4に示すように、第1のクエリ、意図明確化誘導文、およびフィードバックに従って、1つ以上のキーワードセットを取得する方法は、以下のステップを備える。
ステップS401において、第1のクエリ、意図明確化誘導文、およびフィードバックをワードにセグメント化することによって、第1のクエリに対応するワードの第1のセット、意図明確化誘導文に対応するワードの第2のセット、およびフィードバックに対応するワードの第3のセットを取得する。
本開示の実施形態において、第1のクエリ、意図明確化誘導文、およびフィードバックをワードにセグメント化する際、同時に、構文解析、エンティティ識別(entity identification)、およびストップワード削除処理(stop word omitting processing)を、第1のクエリ、意図明確化誘導文、およびフィードバックに行い、品詞タグ付け(part-of-speech tagging)を各ワードに行うことによって、ワードの第1のセット、ワードの第2のセット、およびワードの第3のセットが取得できる。
ステップS402において、ワードの第1のセット、ワードの第2のセット、およびワードの第3のセットのそれぞれにおける各ワードの複数の特徴を取得し、各ワードの複数の特徴の特徴値を取得する。
本開示の実施形態において、各ワードの複数の特徴は、品詞、統語的構成素(syntactic constituent)、多数の文のコーパス(corpus)におけるワード出現頻度、出現回数、エンティティであるか否か、文中の位置、ならびに各ワードの上位語および下位語の特徴を含み得る。
ステップS403において、各ワードの複数の特徴の特徴値に従って、各ワードのスコアを取得する。
本開示の実施形態において、各ワードのスコアは、各ワードの複数の特徴の特徴値に従って、次のような式を用いて取得されてもよい。
Figure 0005998194
式中、scorewは、w番目のワードのスコアであり、
Figure 0005998194
は、w番目のワードのi番目の特徴の重みであり、fi(w)は、w番目のワードのi番目の特徴の特徴値であり、Nは、w番目のワードの複数の特徴の合計数である。
ステップS404において、各ワードのスコアに従って、ワードの第1のセットから第1のキーワードセットを選択し、ワードの第2のセットから第2のキーワードセットを選択し、ワードの第3のセットから第3のキーワードセットを選択する。
本開示の実施形態において、キーワードセットは、これに限定されないが、所定の選択ルールに従ってワードの各セットから選択されてもよい。例えば、高いスコアを有する所定の数のキーワードが、ワードの各セットから選択されてもよいし、所定の閾値よりも高いスコアを有するキーワードが選択されてもよい。
ステップS303において、意図明確化誘導文が選択的な質問である場合、第1のクエリおよびフィードバックに従って、1つ以上のキーワードセットを取得する。
本開示の一実施形態において、図5に示すように、第1のクエリおよびフィードバックに従って、1つ以上のキーワードセットを取得する方法は、以下のステップを備える。
ステップS501において、第1のクエリおよびフィードバックをワードにセグメント化することによって、第1のクエリに対応するワードの第4のセットおよびフィードバックに対応するワードの第5のセットを取得する。
本開示の実施形態において、第1のクエリおよびフィードバックをワードにセグメント化する際、同時に、構文解析、エンティティ識別、およびストップワード削除処理を、第1のクエリおよびフィードバックに行い、品詞タグ付けを各ワードに行うことによって、ワードの第4のセットおよびワードの第5のセットが取得できる。
ステップS502において、ワードの第4のセットおよびワードの第5のセットのそれぞれにおける各ワードの複数の特徴を取得し、各ワードの複数の特徴の特徴値を取得する。
本開示の実施形態において、各ワードの複数の特徴は、品詞、統語的構成素(syntactic constituent)、多数の文のコーパスにおけるワード出現頻度、出現回数、エンティティであるか否か、文中の位置、ならびに各ワードの上位語および下位語の特徴を含み得る。
ステップS503において、各ワードの複数の特徴の特徴値に従って、各ワードのスコアを取得する。
本開示の実施形態において、各ワードのスコアは、各ワードの複数の特徴の特徴値に従って、次のような式を用いて取得されてもよい。
Figure 0005998194
式中、scorewは、w番目のワードのスコアであり、
Figure 0005998194
は、w番目のワードのi番目の特徴の重みであり、fi(w)は、w番目のワードのi番目の特徴の特徴値であり、Nは、w番目のワードの複数の特徴の合計数である。
ステップS504において、各ワードのスコアに従って、ワードの第4のセットから第4のキーワードセットを選択し、ワードの第5のセットから第5のキーワードセットを選択する。
本開示の実施形態において、キーワードセットは、これに限定されないが、所定の選択ルールに従ってワードの各セットから選択されてもよい。例えば、高いスコアを有する所定の数のキーワードが、ワードの各セットから選択されてもよいし、所定の閾値よりも高いスコアを有するキーワードが選択されてもよい。
ステップS304において、1つ以上のキーワードセットに従って、第2のクエリを生成する。
本開示の一実施形態において、図6に示すように、1つ以上のキーワードセットに従って、第2のクエリを生成する方法は、以下のステップを備える。
ステップS601において、1つ以上のキーワードセットに同義語処理を行って、1つ以上のキーワードシーケンスを取得する。
本開示の実施形態において、第2のクエリの主たる部分は、第1のクエリであり、意図明確化誘導文およびフィードバックのキーワードは、第2のクエリの補足部分として構成される。
当該補足部分が有意かつ非冗長であることを確実にするために、本開示の一実施形態において、同義語処理を1つ以上のキーワードセットに行って、1つ以上のキーワードシーケンスを取得してもよい。
具体的には、ansのキーワードセットおよびqbのキーワードセットの両方に同一または同義のワードが存在する場合、qbのキーワードセット中の当該同一または同義のワードを取り除き、ansまたはqbのキーワードセットにc_queryのキーワードセットのキーワードと同一または同義のワードが存在する場合、ansまたはqbのキーワードセット中の当該同一または同義のワードを取り除くことによって、最終的に、c_query、ans、およびqbのキーワードシーケンスを取得する。
例えば、表2に示すc_query、ans、およびqbに対して、表3に示す2つのキーワードシーケンスが取得できる。
Figure 0005998194
Figure 0005998194
ステップS602において、1つ以上のキーワードシーケンスのそれぞれにおけるキーワードをシーケンス化して、複数のシーケンス候補を取得する。
本開示の実施形態において、x個のキーワード、y個のキーワード、およびz個のキーワードをそれぞれ有する3つのキーワードシーケンスの複雑度は、x*y*zである。したがって、キーワードシーケンス中に多数のキーワードが存在する場合、可能性があるシーケンス候補全てを取得することは非常に複雑であり、膨大な計算量が必要とされる。
したがって、複数のシーケンス候補の取得プロセスを最適化するために、複数のシーケンス候補は、これに限定されないが、枝刈りアルゴリズム(pruning algorithm)によって探索および列挙されてもよい。例えば、枝刈りアルゴリズムは、Beam-searchおよびA*であってもよい。
ステップS603において、各シーケンス候補におけるキーワードのシーケンスおよび特徴に従って、各シーケンス候補のスコアを取得する。
本開示の一実施形態において、複数のシーケンス候補のそれぞれのスコアは、次のような式を用いて取得されてもよい。
Figure 0005998194
式中、scoresenは、シーケンス候補senのスコアであり、
Figure 0005998194
は、シーケンス候補senにおけるキーワードwiの3値化言語モデル(ternary language model)であり、c(wiwi-1wi-2)は、キーワードwi, wi-1, wi-2 のコーパス中同時出現回数であり、c(wi-1 wi-2) は、キーワードwi-1, wi-2 のコーパス中同時出現回数であり、
Figure 0005998194
は、シーケンス化ペナルティ項(sequencing penalty term)であり、
Figure 0005998194
は、0より大きく1より小さい定数であり、
d = posori_str(wi) − posc_str(wi)であり、posori_str(wi)は、キーワードwiを含むキーワードシーケンスにおける相対位置であって、当該キーワードwiと、当該キーワードwiを含むキーワードシーケンス中の他のキーワードとの相対位置であり、posc_str(wi)は、シーケンス候補senにおける相対位置であって、キーワードwiと、当該キーワードwiを含むキーワードシーケンス中の他のキーワードとの相対位置である。
例えば、シーケンス候補「身長175cm200kg体重をすぐに減らす」に対して、wiが「体重」である場合、wiを含むキーワードシーケンスは、ansに対応するキーワードシーケンス「身長175cm体重110kg」となるため、posori_str(wi)=3である。また、シーケンス候補「身長175cm体重110kg」中の4つのキーワードのシーケンス「身長175cm200kg体重」によると、posc_str(wi)=4が取得できるため
d =posori_str(wi) - posc_str(wi)=4-3=1であり、
Figure 0005998194
となる。
ステップS604において、複数のシーケンス候補のそれぞれのスコアに従って、複数のシーケンス候補から第2のクエリを選択する。
本開示の一実施形態において、最も高いスコアを有するシーケンス候補が、複数のシーケンス候補から第2のクエリとして選択されてもよい。
本開示の実施形態に係る対話型検索方法によると、検索エンジンによって提供された意図明確化誘導文が取得され、意図明確化誘導文および当該意図明確化誘導文に対応するフィードバックに従ってクエリが更新され、更新されたクエリに従って検索結果が提供されることによって、ユーザの検索意図が明確化され、また、クエリ履歴およびフィードバックに従って、クエリが自動更新できるようになり、ユーザは意図明確化誘導文に対応するフィードバックを入力するだけでよくなるため、ユーザの入力作業が低減され、ユーザの記憶負担も軽減される。また、検索エンジンがユーザの検索意図を識別する際の正確さが向上し、ユーザの要求が満たされ、これによって、ユーザの使い勝手が向上する。
上記実施形態を実現するため、本開示の実施形態は、対話型検索装置を提供する。
対話型検索装置は、第1のクエリを受信する第1の受信モジュールと、第1のクエリに従って、意図明確化誘導文を取得する第1の取得モジュールと、意図明確化誘導文に対応するフィードバックを受信する第2の受信モジュールと、第1のクエリ、意図明確化誘導文、およびフィードバックに従って、第2のクエリを生成する生成モジュールと、第2のクエリに従って、検索結果を提供する提供モジュールと、を備える。
図7は、本開示の一実施形態に係る対話型検索装置のブロック図である。
図7に示すように、対話型検索装置は、第1の受信モジュール100、第1の取得モジュール200、第2の受信モジュール300、生成モジュール400、および提供モジュール500を備える。
具体的には、第1の受信モジュール100は、第1のクエリを受信する。本開示の一実施形態において、第1のクエリは、語であっても文であってもよい。ユーザは、要求に従って、第1のクエリを検索ページ内の検索ボックスまたは他の検索欄に入力できる。
第1の取得モジュール200は、第1のクエリに従って、意図明確化誘導文を取得する。本開示の実施形態において、第1のクエリに従って意図明確化誘導文を取得する以前に、文ライブラリが確立されている。これにより、第1の取得モジュール200が文ライブラリに対してクエリを行うことによって意図明確化誘導文を取得できる。明らかに、文ライブラリがすでに確立されている場合、文ライブラリを確立するステップが省略可能となる。
なお、第1の取得モジュール200は、第1のクエリに従って、1つ以上の意図明確化誘導文を取得することによって、ユーザが自分の検索意図を明確化するように誘導してもよい。例えば、第1のクエリ(例えば、「スコアが610ポイントの生徒が入学できる大学はどこか?」)に対して、2つの意図明確化誘導文(例えば、「あなたの出身地はどこ?」および「あなたは文系の生徒?それとも理系の生徒?」)が、第1の取得モジュール200によって取得できる。
第2の受信モジュール300は、意図明確化誘導文に対応するフィードバックを受信する。本開示の実施形態において、フィードバックは、意図明確化誘導文に対応する回答の語または文である。具体的には、意図明確化誘導文が取得された後、第2の受信モジュール300は、ユーザがフィードバックを入力するクライアントを介して、意図明確化誘導文に対応するフィードバックを受信することができる。
本開示の一実施形態において、意図明確化誘導文をクライアントを介してユーザに表示し、意図明確化誘導文に対応する少なくとも1つの結果候補または入力ボックスを提供してもよい。これによって、ユーザが、少なくとも1つの結果候補から自分の検索意図を満たす結果候補を選択したり、意図明確化誘導文に対応する回答を入力ボックスに直接入力したりできる。
生成モジュール400は、第1のクエリ、意図明確化誘導文、およびフィードバックに従って、第2のクエリを生成する。具体的には、生成モジュール400は、ユーザの検索意図を意味する語を、第1のクエリ、意図明確化誘導文、およびフィードバックから、構文解析または語義解析を通じて取得し、当該語に従って、第2のクエリを取得する。
本開示の一実施形態において、生成モジュール400は、意図明確化誘導文の種類に応じて、第1のクエリ、意図明確化誘導文、およびフィードバックの全体または一部を選択することによって、第2のクエリを生成する。
本開示の実施形態において、第1のクエリは、c_queryと表され、意図明確化誘導文は、qbと表され、フィードバックは、ansと表され、第2のクエリは、n_queryと表される。意図明確化誘導文の種類は、一般的な質問、特別な質問、および選択的な質問を一般に含む。例えば、これら3種類の意図明確化誘導文に従って生成された第2のクエリは、表1に示した通りである。
本開示の一実施形態において、図2aに示すように、第1のクエリ「スコアが610ポイントの生徒が入学できる大学はどこか?」に対して、2つの意図明確化誘導文(例えば、「あなたの出身地はどこ?」および「あなたは文系の生徒?それとも理系の生徒?」)は、を、クライアントを介してユーザに提供してもよい。
また、入力ボックスが各意図明確化誘導文の後に設けられ、これによって、ユーザは、「山東省」および「理系」を2つの入力ボックスにそれぞれ入力できる。ユーザが「送信」ボタンをクリックすると、第2の受信モジュール300は、2つの意図明確化誘導文に対応するフィードバックを受信し、生成モジュール400は、第2のクエリ「スコアが610ポイントで山東省の理系生徒が入学できる大学はどこか?」を生成する。
提供モジュール500は、第2のクエリに従って、検索結果を提供する。本開示の実施形態において、第2のクエリに従って検索結果が取得された後、検索結果は、クライアントに返されることによって、クライアントを介してユーザに提供されてもよい。
また、第2のクエリに従って、ユーザのさらなる誘導を行うか否かを判定してもよい。さらなる誘導を行う場合、第1の取得モジュール200は、第2のクエリに従って、対応する意図明確化誘導文を取得し、ユーザの誘導を継続する。さらなる誘導を行わない場合、検索結果を直接提供してもよい。
例えば、本開示の一実施形態において、図2aに示すように、提供モジュール500は、第2のクエリ「スコアが610ポイントで山東省の理系生徒が入学できる大学はどこか?」に従って、図2bに示すような検索結果を提供し、意図明確化誘導文「専攻は何か?」をさらに提供する。
本開示の実施形態に係る対話型検索装置によると、検索エンジンによって提供された意図明確化誘導文が取得され、意図明確化誘導文および当該意図明確化誘導文に対応するフィードバックに従ってクエリが更新され、更新されたクエリに従って検索結果が提供されることによって、ユーザの検索意図が明確化され、また、クエリ履歴およびフィードバックに従って、クエリが自動更新できるようになり、ユーザは意図明確化誘導文に対応するフィードバックを入力するだけでよくなるため、ユーザの入力作業が低減され、ユーザの記憶負担も軽減される。また、検索エンジンがユーザの検索意図を識別する際の正確さが向上し、ユーザの要求が満たされ、これによって、ユーザの使い勝手が向上する。
本開示の一実施形態において、図8に示すように、生成モジュールは、第1の取得サブモジュール410、第2の取得サブモジュール420、第3の取得サブモジュール430、および生成サブモジュール440を備える。
第1の取得サブモジュール410は、意図明確化誘導文の種類を取得する。具体的には、第1の取得サブモジュール410は、構文解析を行うことによって、意図明確化誘導文の種類を取得する。
第2の取得サブモジュール420は、意図明確化誘導文が一般的な質問または特別な質問である場合、第1のクエリ、意図明確化誘導文、およびフィードバックに従って、1つ以上のキーワードセットを取得する。
本開示の一実施形態において、図10に示すように、第2の取得サブモジュール420は、第1のセグメント化ユニット421、第1の取得ユニット422、第2の取得ユニット423、および第1の選択ユニット424をさらに備える。
第1のセグメント化ユニット421は、第1のクエリ、意図明確化誘導文、およびフィードバックをワードにセグメント化することによって、第1のクエリに対応するワードの第1のセット、意図明確化誘導文に対応するワードの第2のセット、およびフィードバックに対応するワードの第3のセットを取得する。
本開示の実施形態において、第1のクエリ、意図明確化誘導文、およびフィードバックをワードにセグメント化する際、同時に、構文解析、エンティティ識別、およびストップワード削除処理を、第1のクエリ、意図明確化誘導文、およびフィードバックに行い、品詞タグ付けを各ワードに行うことによって、ワードの第1のセット、ワードの第2のセット、およびワードの第3のセットが取得できる。
第1の取得ユニット422は、ワードの第1のセット、ワードの第2のセット、およびワードの第3のセットのそれぞれにおける各ワードの複数の特徴を取得し、各ワードの複数の特徴の特徴値を取得する。
本開示の実施形態において、各ワードの複数の特徴は、品詞、統語的構成素、多数の文のコーパスにおけるワード出現頻度、出現回数、エンティティであるか否か、文中の位置、ならびに各ワードの上位語および下位語の特徴を含み得る。
第2の取得ユニット423は、各ワードの複数の特徴の特徴値に従って、各ワードのスコアを取得する。本開示の実施形態において、各ワードのスコアは、各ワードの複数の特徴の特徴値に従って、次のような式を用いて取得されてもよい。
Figure 0005998194
式中、scorewは、w番目のワードのスコアであり、
Figure 0005998194
は、w番目のワードのi番目の特徴の重みであり、fi(w)は、w番目のワードのi番目の特徴の特徴値であり、Nは、w番目のワードの複数の特徴の合計数である。
第1の選択ユニット424は、各ワードのスコアに従って、ワードの第1のセットから第1のキーワードセットを選択し、ワードの第2のセットから第2のキーワードセットを選択し、ワードの第3のセットから第3のキーワードセットを選択する。
本開示の実施形態において、キーワードセットは、これに限定されないが、所定の選択ルールに従ってワードの各セットから選択されてもよい。例えば、高いスコアを有する所定の数のキーワードが、ワードの各セットから選択されてもよいし、所定の閾値よりも高いスコアを有するキーワードが選択されてもよい。
第3の取得サブモジュール430は、意図明確化誘導文が選択的な質問である場合、第1のクエリおよびフィードバックに従って、1つ以上のキーワードセットを取得する。本開示の一実施形態において、図11に示すように、第3の取得サブモジュール430は、第2のセグメント化ユニット431、第3の取得ユニット432、第4の取得ユニット433、および第2の選択ユニット434を備える。
第2のセグメント化ユニット431は、第1のクエリおよびフィードバックをワードにセグメント化することによって、第1のクエリに対応するワードの第4のセットおよびフィードバックに対応するワードの第5のセットを取得する。
本開示の実施形態において、第1のクエリおよびフィードバックをワードにセグメント化する際、同時に、構文解析、エンティティ識別、およびストップワード削除処理を、第1のクエリおよびフィードバックに行い、品詞タグ付けを各ワードに行うことによって、ワードの第4のセットおよびワードの第5のセットが取得できる。
第3の取得ユニット432は、ワードの第4のセットおよびワードの第5のセットのそれぞれにおける各ワードの複数の特徴を取得し、各ワードの複数の特徴の特徴値を取得する。
本開示の実施形態において、各ワードの複数の特徴は、品詞、統語的構成素、多数の文のコーパスにおけるワード出現頻度、出現回数、エンティティであるか否か、文中の位置、ならびに各ワードの上位語および下位語の特徴を含み得る。
第4の取得ユニット433は、各ワードの複数の特徴の特徴値に従って、各ワードのスコアを取得する。本開示の実施形態において、各ワードのスコアは、各ワードの複数の特徴の特徴値に従って、次のような式を用いて取得されてもよい。
Figure 0005998194
式中、scorewは、w番目のワードのスコアであり、
Figure 0005998194
は、w番目のワードのi番目の特徴の重みであり、fi(w)は、w番目のワードのi番目の特徴の特徴値であり、Nは、w番目のワードの複数の特徴の合計数である。
第2の選択ユニット434は、各ワードのスコアに従って、ワードの第4のセットから第4のキーワードセットを選択し、ワードの第5のセットから第5のキーワードセットを選択する。
本開示の実施形態において、キーワードセットは、これに限定されないが、所定の選択ルールに従ってワードの各セットから選択されてもよい。例えば、高いスコアを有する所定の数のキーワードが、ワードの各セットから選択されてもよいし、所定の閾値よりも高いスコアを有するキーワードが選択されてもよい。
生成サブモジュール440は、1つ以上のキーワードセットに従って、第2のクエリを生成する。本開示の一実施形態において、図12に示すように、生成サブモジュール440は、同義語処理ユニット441、第5の取得ユニット442、第6の取得ユニット443、および第3の選択ユニット444を備える。
同義語処理ユニット441は、1つ以上のキーワードセットに同義語処理を行って、1つ以上のキーワードシーケンスを取得する。本開示の実施形態において、第2のクエリの主たる部分は、第1のクエリであり、意図明確化誘導文およびフィードバックのキーワードは、第2のクエリの補足部分として構成される。
当該補足部分が有意かつ非冗長であることを確実にするために、本開示の一実施形態において、同義語処理を1つ以上のキーワードセットに行って、1つ以上のキーワードシーケンスを取得してもよい。
具体的には、ansのキーワードセットおよびqbのキーワードセットの両方に同一または同義のワードが存在する場合、qbのキーワードセット中の当該同一または同義のワードを取り除き、ansまたはqbのキーワードセットにc_queryのキーワードセットのキーワードと同一または同義のワードが存在する場合、ansまたはqbのキーワードセット中の当該同一または同義のワードを取り除くことによって、最終的に、c_query、ans、およびqbのキーワードシーケンスを取得する。
例えば、表2に示すc_query、ans、およびqbに対して、表3に示す2つのキーワードシーケンスが取得できる。
第5の取得ユニット442は、1つ以上のキーワードシーケンスのそれぞれにおけるキーワードをシーケンス化して、複数のシーケンス候補を取得する。本開示の実施形態において、x個のキーワード、y個のキーワード、およびz個のキーワードをそれぞれ有する3つのキーワードシーケンスの複雑度は、x*y*zである。したがって、キーワードシーケンス中に多数のキーワードが存在する場合、可能性があるシーケンス候補全てを取得することは非常に複雑であり、膨大な計算量が必要とされる。
したがって、複数のシーケンス候補の取得プロセスを最適化するために、複数のシーケンス候補は、これに限定されないが、枝刈りアルゴリズムによって探索および列挙されてもよい。例えば、枝刈りアルゴリズムは、Beam-searchおよびA*であってもよい。
第6の取得ユニット443は、各シーケンス候補におけるキーワードのシーケンスおよび特徴に従って、各シーケンス候補のスコアを取得する。本開示の一実施形態において、複数のシーケンス候補のそれぞれのスコアは、次のような式を用いて取得されてもよい。
Figure 0005998194
式中、scoresenは、シーケンス候補senのスコアであり、
Figure 0005998194
は、シーケンス候補senにおけるキーワードwiの3値化言語モデルであり、c(wi wi-1 wi-2)は、キーワードwi, wi-1, wi-2 のコーパス中同時出現回数であり、c(wi-1 wi-2)は、キーワードwi-1, wi-2のコーパス中同時出現回数であり、
Figure 0005998194
は、シーケンス化ペナルティ項であり、
Figure 0005998194
は、0より大きく1より小さい定数であり、d = posori_str(wi) − posc_str(wi)であり、posori_str(wi)は、キーワードwiを含むキーワードシーケンスにおける相対位置であって、当該キーワードwiと、当該キーワードwiを含むキーワードシーケンス中の他のキーワードとの相対位置であり、posc_str(wi)は、シーケンス候補senにおける相対位置であって、キーワードwiと、当該キーワードwiを含むキーワードシーケンス中の他のキーワードとの相対位置である。
例えば、シーケンス候補「身長175cm200kg体重をすぐに減らす」に対して、wiが「体重」である場合、wiを含むキーワードシーケンスは、ansに対応するキーワードシーケンス「身長175cm体重110kg」となるため、posc_str(wi)= 3である。また、シーケンス候補「身長175cm体重110kg」中の4つのキーワードのシーケンス「身長175cm200kg体重」によると、posc_str(wi)=4が取得できるため、
d =posori_str(wi) − posc_str(wi)=4-3=1であり、
Figure 0005998194
となる。
第3の選択ユニット444は、複数のシーケンス候補のそれぞれのスコアに従って、複数のシーケンス候補から第2のクエリを選択する。本開示の一実施形態において、最も高いスコアを有するシーケンス候補が、複数のシーケンス候補から第2のクエリとして選択されてもよい。
図9は、本開示の一実施形態に係る対話型検索装置のブロック図である。
図9に示すように、本開示の実施形態に係る対話型検索装置は、第1の受信モジュール100、第1の取得モジュール200、第2の受信モジュール300、生成モジュール400、提供モジュール500、および第2の取得モジュール600を備える。
第2の取得モジュール600は、意図明確化誘導文に対応する少なくとも1つの結果候補を取得する。
例えば、本開示の一実施形態において、図2cに示すように、第1のクエリ「ハルビン工業大学はどのようなかんじか?」に対して、第2の取得モジュール600は、4つの結果候補(例えば、「科学研究」、「教育」、「就職」、および「寮」)を提供して、ユーザに選択させる。
また、入力ボックスがさらに設けられ、結果候補の中に自分の要求を満たす結果がない場合、ユーザは当該入力ボックス内にフィードバックを入力できる。また、ユーザが「就職」をクリックすると、生成モジュールは、第2のクエリ「ハルビン工業大学の就職はどのようなかんじか?」を生成してもよく、提供モジュール500は、図2dに示すような検索結果を提供する。
本開示の実施形態に係る対話型検索装置によると、意図明確化誘導文に対応する少なくとも1つの結果候補が、ユーザに提供され、少なくとも1つの結果候補に対するユーザのトリガ動作に従って、対応するフィードバックが取得されることによって、第2のクエリが取得され、第2のクエリに従って、検索結果が提供される。したがって、ユーザはフィードバックを入力する必要がなく、ユーザの入力作業がさらに低減される。
本開示の実施形態は、装置を提供する。装置は、1つ以上のプロセッサと、メモリと、メモリに記録され、1つ以上のプロセッサによって実行されることによって、本開示の上記実施形態に係る対話型検索方法を実行する1つ以上のプログラムと、を備える。
本開示の実施形態は、非一時的コンピュータ可読記録媒体を提供する。非一時的コンピュータ可読記録媒体は、本開示の上記実施形態に係る対話型検索方法を実行するための1つ以上のプログラムを備える。
上記フローチャートまたは他のあらゆる形式でここに記載されたいかなる手順または方法も、特定の論理機能または手順を実現する実行可能なコードを記録した1つ以上のモジュール、部、または部分を含むと理解されるだろう。
また、本開示の有利な実施形態は、叙述または検討されたものとは異なる実行順序(関連する機能に従って実質的に同時または逆の順序で機能を実行することを含む)の他の実施を含む。本開示の実施形態が属する技術分野の当業者であれば、これらのことが理解できるだろう。
他の形式でここに記載またはフローチャートに示された論理および/またはステップ、例えば、論理機能を実現する実行可能な命令の特定のシーケンス表は、具体的には、命令実行システム、デバイス、または装置(例えば、コンピュータに基づいたシステム、プロセッサを備えたシステム、または、命令実行システム、デバイス、および装置から命令を取得して当該命令を実行可能な他のシステム)によって用いられるか、当該命令実行システム、デバイス、および装置と併用されるいかなるコンピュータ可読媒体で実現されてもよい。
本明細書において、「コンピュータ可読媒体」は、命令実行システム、デバイスまたは装置によって用いられるか、これらと併用される、プログラムを格納、記録、通信、伝搬、または送信するのに適したいかなるデバイスであってもよい。
コンピュータ可読媒体のより具体的な例は、これらに限定されないが、1つ以上の配線を備えた電子接続(電子デバイス)、ポータブル・コンピュータ・エンクロージャ(磁気デバイス)、ランダム・アクセス・メモリ(RAM)、リード・オンリー・メモリ(ROM)、イレイザブル・プログラマブル・リード・オンリー・メモリ(EPROMまたはフラッシュメモリ)、光ファイバデバイス、およびポータブル・コンパクト・ディスク・リード・オンリー・メモリ(CDROM)を含む。
また、コンピュータ可読媒体は、紙であってもよく、プログラムが印刷可能な他の適切な媒体であってもよい。というのは、例えば、このような紙または他の適切な媒体は、プログラムを電子的に取得することが必要になったとき、光学スキャンして、編集、変換、または他の適切な方法で処理でき、当該プログラムは、コンピュータメモリに記録できるからである。
本開示の各部分は、ハードウェア、ソフトウェア、ファームウエア、またはこれらの組み合わせで実現されてもよいことが理解される。上記の実施形態において、複数のステップまたは方法は、メモリに記録され、適切な命令実行システムによって実行されるソフトウェアまたはファームウエアで実現されてもよい。
例えば、ハードウェアで実現される場合、他の実施形態と同様に、ステップまたは方法は、データ信号の論理機能を実現する論理ゲート回路を有する離散論理回路、適切な組み合わせ論理ゲート回路を有する特定用途向け集積回路、プログラマブル・ゲート・アレイ(PGA)、フィールド・プログラマブル・ゲート・アレイ(FPGA)、等を含む、当該技術分野において公知の技術のうちの1つまたはこれらの組み合わせで実現されてもよい。
当業者であれば、本開示の上記に例示した方法のステップの全体または一部は、プログラムを記録した関連するハードウェアにコマンドを与えることによって実現されてもよいことが理解できるだろう。
当該プログラムは、コンピュータ可読記録媒体に記録されていてもよく、プログラムは、コンピュータ上で作動する際、本開示の実施形態に係る方法のステップのうちの1つまたはこれらの組み合わせを含む。
また、本開示の実施形態の各機能セルは処理モジュールで統合されていてもよく、これらのセルは別々の物理的存在であってもよく、2つ以上のセルが処理モジュールで統合されていてもよい。統合モジュールは、ハードウェアの形態で実現されてもよく、ソフトウェア機能モジュールの形態で実現されてもよい。統合モジュールがソフトウェア機能モジュールの形態で実現され、スタンドアローンの製品として販売または使用される場合、統合モジュールは、コンピュータ可読記録媒体に記録されていてもよい。
上記の記録媒体は、リード・オンリー・メモリ、磁気ディスク、またはCD等であってもよい。
本明細書全体にわたって、「一実施形態」、「いくつかの実施形態」、「一例」、「具体例」、または「いくつかの例」への言及は、実施形態または例に関連して記載された特定の要素、構造、物質、または特徴が、本開示の少なくとも1つの実施形態または例に含まれることを意味する。
本明細書全体にわたって、語句の出現は、本開示の同一の実施形態または例に言及しているとは限らない。また、特定の要素、構造、物質、または特徴は、1つ以上の実施形態または例といかなる適切な方法で組み合わせられてもよい。
説明のための実施形態を記載し説明したが、上記の実施形態は本開示を限定するものとして解釈するべきではなく、本開示の精神、原理、および範囲から逸脱することなしに、変更、選択、および変形可能であることが当業者であれば理解できるだろう。

Claims (12)

  1. 入力されたクエリに従って検索エンジンが検索を行い、検索結果をユーザに提供する対話型検索方法であって、前記検索エンジンは、
    第1のクエリを受信することと、
    前記第1のクエリに従って、意図明確化誘導文を取得することと、
    前記意図明確化誘導文に対応するフィードバックを受信することと、
    前記意図明確化誘導文の種類を取得することと、
    前記意図明確化誘導文が一般的な質問または特別な質問である場合、前記第1のクエリ、前記意図明確化誘導文、および前記フィードバックに従って、1つ以上のキーワードセットを取得することと、
    前記意図明確化誘導文が選択的な質問である場合、前記第1のクエリおよび前記フィードバックに従って、1つ以上のキーワードセットを取得することと、
    前記1つ以上のキーワードセットに従って、第2のクエリを生成することと、
    前記第2のクエリに従って、検索結果を提供することと、を実行する対話型検索方法。
  2. 前記意図明確化誘導文の少なくとも1つの結果候補を取得することと、
    前記少なくとも1つの結果候補に対するトリガ動作を受信し、トリガ動作がなされた結果候補を前記意図明確化誘導文に対応する前記フィードバックとすることと、をさらに備えた、請求項1に記載の方法。
  3. 前記第1のクエリ、前記意図明確化誘導文、および前記フィードバックに従った、1つ以上のキーワードセットの前記取得は、
    前記第1のクエリ、前記意図明確化誘導文、および前記フィードバックをワードにセグメント化することによって、前記第1のクエリに対応するワードの第1のセット、前記意図明確化誘導文に対応するワードの第2のセット、および前記フィードバックに対応するワードの第3のセットを取得することと、
    前記ワードの第1のセット、前記ワードの第2のセット、および前記ワードの第3のセットのそれぞれにおける各ワードの複数の特徴を取得し、各ワードの前記複数の特徴の特徴値を取得することと、
    各ワードの前記複数の特徴の前記特徴値に従って、各ワードのスコアを取得することと、
    各ワードの前記スコアに従って、前記ワードの第1のセットから第1のキーワードセットを選択し、前記ワードの第2のセットから第2のキーワードセットを選択し、前記ワードの第3のセットから第3のキーワードセットを選択することと、を備えた、請求項1に記載の方法。
  4. 前記第1のクエリおよび前記フィードバックに従った、1つ以上のキーワードセットの前記取得は、
    前記第1のクエリおよび前記フィードバックをワードにセグメント化することによって、前記第1のクエリに対応するワードの第4のセットおよび前記フィードバックに対応するワードの第5のセットを取得することと、
    前記ワードの第4のセットおよび前記ワードの第5のセットのそれぞれにおける各ワードの複数の特徴を取得し、各ワードの前記複数の特徴の特徴値を取得することと、
    各ワードの前記複数の特徴の前記特徴値に従って、各ワードのスコアを取得することと、
    各ワードの前記スコアに従って、前記ワードの第4のセットから第4のキーワードセットを選択し、前記ワードの第5のセットから第5のキーワードセットを選択することと、
    を備えた、請求項に記載の方法。
  5. 前記複数のキーワードに従った、第2のクエリの前記生成は、
    前記1つ以上のキーワードセットに同義語処理を行って、1つ以上のキーワードシーケンスを取得することと、
    前記1つ以上のキーワードシーケンスのそれぞれにおける前記キーワードをシーケンス化して、複数のシーケンス候補を取得することと、
    各シーケンス候補における前記キーワードのシーケンスおよび特徴に従って、各シーケンス候補のスコアを取得することと、
    各シーケンス候補の前記スコアに従って、前記複数のシーケンス候補から前記第2のクエリを選択することと、を備えた、請求項ないしのいずれかに記載の方法。
  6. 第1のクエリを受信する第1の受信モジュールと、
    前記第1のクエリに従って、意図明確化誘導文を取得する第1の取得モジュールと、
    前記意図明確化誘導文に対応するフィードバックを受信する第2の受信モジュールと、
    前記第1のクエリ、前記意図明確化誘導文、および前記フィードバックに従って、第2のクエリを生成する生成モジュールと、
    前記第2のクエリに従って、検索結果を提供する提供モジュールと、を備え、
    前記生成モジュールは、更に、
    前記意図明確化誘導文の種類を取得する第1の取得サブモジュールと、
    前記意図明確化誘導文が一般的な質問または特別な質問である場合、前記第1のクエリ、前記意図明確化誘導文、および前記フィードバックに従って、1つ以上のキーワードセットを取得する第2の取得サブモジュールと、
    前記意図明確化誘導文が選択的な質問である場合、前記第1のクエリおよび前記フィードバックに従って、1つ以上のキーワードセットを取得する第3の取得サブモジュールと、
    前記1つ以上のキーワードセットに従って、第2のクエリを生成する生成サブモジュールと、を備えた対話型検索装置。
  7. 前記意図明確化誘導文の少なくとも1つの結果候補を取得する第2の取得モジュールをさらに含み、
    前記第2の受信モジュールは、前記少なくとも1つの結果候補に対するトリガ動作を受信し、トリガ動作がなされた結果候補を前記意図明確化誘導文に対応する前記フィードバックとする、請求項に記載の装置。
  8. 前記第2の取得サブモジュールは、
    前記第1のクエリ、前記意図明確化誘導文、および前記フィードバックをワードにセグメント化することによって、前記第1のクエリに対応するワードの第1のセット、前記意図明確化誘導文に対応するワードの第2のセット、および前記フィードバックに対応するワードの第3のセットを取得する第1のセグメント化ユニットと、
    前記ワードの第1のセット、前記ワードの第2のセット、および前記ワードの第3のセットのそれぞれにおける各ワードの複数の特徴を取得し、各ワードの前記複数の特徴の特徴値を取得する第1の取得ユニットと、
    各ワードの前記複数の特徴の前記特徴値に従って、各ワードのスコアを取得する第2の取得ユニットと、
    各ワードの前記スコアに従って、前記ワードの第1のセットから第1のキーワードセットを選択し、前記ワードの第2のセットから第2のキーワードセットを選択し、前記ワードの第3のセットから第3のキーワードセットを選択する第1の選択ユニットと、を備えた、請求項に記載の装置。
  9. 前記第3の取得サブモジュールは、
    前記第1のクエリおよび前記フィードバックをワードにセグメント化することによって、前記第1のクエリに対応するワードの第4のセットおよび前記フィードバックに対応するワードの第5のセットを取得する第2のセグメント化ユニットと、
    前記ワードの第4のセットおよび前記ワードの第5のセットのそれぞれにおける各ワードの複数の特徴を取得し、各ワードの前記複数の特徴の特徴値を取得する第3の取得ユニットと、
    各ワードの前記複数の特徴の前記特徴値に従って、各ワードのスコアを取得する第4の取得ユニットと、
    各ワードの前記スコアに従って、前記ワードの第4のセットから第4のキーワードセットを選択し、前記ワードの第5のセットから第5のキーワードセットを選択する第2の選択ユニットと、を備えた、請求項に記載の装置。
  10. 前記生成サブモジュールは、
    前記1つ以上のキーワードセットに同義語処理を行って、1つ以上のキーワードシーケンスを取得する同義語処理ユニットと、
    前記1つ以上のキーワードシーケンスのそれぞれにおける前記キーワードをシーケンス化して、複数のシーケンス候補を取得する第5の取得ユニットと、
    各シーケンス候補における前記キーワードのシーケンスおよび特徴に従って、各シーケンス候補のスコアを取得する第6の取得ユニットと、
    各シーケンス候補の前記スコアに従って、前記複数のシーケンス候補から前記第2のクエリを選択する第3の選択ユニットと、を備えた、請求項ないしのいずれかに記載の装置。
  11. 1つ以上のプロセッサと、
    メモリと、
    前記メモリに記録され、前記1つ以上のプロセッサによって実行されることによって、請求項1ないしのいずれかに記載の対話型検索方法を実行する1つ以上のプログラムと、を備えた装置。
  12. 請求項1ないしのいずれかに記載の対話型検索方法を実行するための1つ以上のプログラムを格納した、非一時的コンピュータ可読記録媒体。
JP2014253625A 2014-05-27 2014-12-16 対話型検索方法および装置 Active JP5998194B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201410228820.6A CN103995880B (zh) 2014-05-27 2014-05-27 交互式搜索方法和装置
CN201410228820.6 2014-05-27

Publications (3)

Publication Number Publication Date
JP2015225657A JP2015225657A (ja) 2015-12-14
JP2015225657A5 JP2015225657A5 (ja) 2016-07-07
JP5998194B2 true JP5998194B2 (ja) 2016-09-28

Family

ID=51310045

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014253625A Active JP5998194B2 (ja) 2014-05-27 2014-12-16 対話型検索方法および装置

Country Status (4)

Country Link
US (1) US20150347500A1 (ja)
EP (1) EP2953038A1 (ja)
JP (1) JP5998194B2 (ja)
CN (1) CN103995880B (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104156492A (zh) * 2014-09-02 2014-11-19 北京国双科技有限公司 搜索内容的提示方法和装置
CN104571813B (zh) * 2014-12-12 2019-03-29 百度在线网络技术(北京)有限公司 一种信息的显示方法及装置
CN106653006B (zh) * 2016-11-17 2019-11-08 百度在线网络技术(北京)有限公司 基于语音交互的搜索方法和装置
US10810238B2 (en) 2016-12-06 2020-10-20 Sap Se Decoupled architecture for query response generation
CN106681598B (zh) * 2017-01-13 2020-12-15 北京百度网讯科技有限公司 信息输入方法和装置
CN107168987A (zh) * 2017-03-24 2017-09-15 联想(北京)有限公司 一种数据处理方法及其装置
CN107133280A (zh) * 2017-04-14 2017-09-05 合信息技术(北京)有限公司 反馈的响应方法及装置
CN108304434B (zh) * 2017-09-04 2021-11-05 腾讯科技(深圳)有限公司 信息反馈方法和终端设备
CN110309274B (zh) * 2018-03-14 2021-09-07 北京三快在线科技有限公司 引导语推荐方法、装置及电子设备
CN109284405A (zh) * 2018-08-31 2019-01-29 北京优酷科技有限公司 信息应答方法及装置
CN109766414A (zh) * 2019-01-18 2019-05-17 广东小天才科技有限公司 一种意图识别方法及系统
CN109902149B (zh) 2019-02-21 2021-08-13 北京百度网讯科技有限公司 查询处理方法和装置、计算机可读介质
US11068665B2 (en) * 2019-09-18 2021-07-20 International Business Machines Corporation Hypernym detection using strict partial order networks
KR102144370B1 (ko) * 2019-11-18 2020-08-13 주식회사 오투오 대화형 정보 검색장치
CN111930904A (zh) * 2020-07-08 2020-11-13 联想(北京)有限公司 信息应答方法、装置、设备及存储介质

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001067225A2 (en) * 2000-03-06 2001-09-13 Kanisa Inc. A system and method for providing an intelligent multi-step dialog with a user
JP4003468B2 (ja) * 2002-02-05 2007-11-07 株式会社日立製作所 適合性フィードバックによる類似データ検索方法および装置
JP4650072B2 (ja) * 2005-04-12 2011-03-16 富士ゼロックス株式会社 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
CN100421113C (zh) * 2006-03-03 2008-09-24 中国移动通信集团公司 基于个性化信息的搜索系统及搜索方法
JP5246932B2 (ja) * 2008-08-29 2013-07-24 西日本電信電話株式会社 検索装置及び方法、ならびに、コンピュータプログラム
EP2237169A1 (en) * 2009-03-30 2010-10-06 BRITISH TELECOMMUNICATIONS public limited company Data searching system
JP4795452B2 (ja) * 2009-04-30 2011-10-19 沖電気工業株式会社 検索システム及び検索プログラム
CN101937437B (zh) * 2009-06-30 2011-11-16 华为技术有限公司 一种搜索方法、装置和系统
KR101734970B1 (ko) * 2010-02-10 2017-05-12 오의진 사용자 검색의도에 부합하는 검색 결과 제공 방법 및 시스템
US8280900B2 (en) * 2010-08-19 2012-10-02 Fuji Xerox Co., Ltd. Speculative query expansion for relevance feedback
CN102456018B (zh) * 2010-10-18 2016-03-02 腾讯科技(深圳)有限公司 一种交互搜索方法及装置
CA2741212C (en) * 2011-05-27 2020-12-08 Ibm Canada Limited - Ibm Canada Limitee Automated self-service user support based on ontology analysis
JP2012248161A (ja) * 2011-05-31 2012-12-13 Oki Electric Ind Co Ltd 対話型検索システム及びプログラム、並びに、対話シナリオ生成システム及びプログラム
US20130018895A1 (en) * 2011-07-12 2013-01-17 Harless William G Systems and methods for extracting meaning from speech-to-text data
US9767144B2 (en) * 2012-04-20 2017-09-19 Microsoft Technology Licensing, Llc Search system with query refinement
JP5880350B2 (ja) * 2012-08-24 2016-03-09 富士ゼロックス株式会社 情報検索プログラム及び情報検索装置

Also Published As

Publication number Publication date
EP2953038A1 (en) 2015-12-09
US20150347500A1 (en) 2015-12-03
CN103995880A (zh) 2014-08-20
JP2015225657A (ja) 2015-12-14
CN103995880B (zh) 2019-03-12

Similar Documents

Publication Publication Date Title
JP5998194B2 (ja) 対話型検索方法および装置
US11222167B2 (en) Generating structured text summaries of digital documents using interactive collaboration
KR101646547B1 (ko) 인터랙티브한 검색 방법 및 장치
JP6095621B2 (ja) 回答候補間の関係を識別および表示する機構、方法、コンピュータ・プログラム、ならびに装置
WO2020007028A1 (zh) 问诊数据推荐方法、装置、计算机设备和存储介质
CN111417940B (zh) 用于生成问题答案的方法、系统和介质
US9020805B2 (en) Context-based disambiguation of acronyms and abbreviations
US11531693B2 (en) Information processing apparatus, method and non-transitory computer readable medium
JP2015060243A (ja) 検索装置、検索方法、およびプログラム
CN109815390B (zh) 多语言信息的检索方法、装置、计算机设备及计算机存储介质
JP2019082931A (ja) 検索装置、類似度算出方法、およびプログラム
WO2020242570A1 (en) A proximity information retrieval boost method for medical knowledge question answering systems
JP2014219872A (ja) 発話選択装置、方法、及びプログラム、対話装置及び方法
KR20200074603A (ko) 신규 개체명 단어에 연관된 말뭉치 생성을 위한 문장 자동 생성 장치 및 그 동작 방법
CN117076636A (zh) 一种智能客服的信息查询方法、系统和设备
JP6305630B2 (ja) 文書検索装置、方法及びプログラム
CN112800314B (zh) 搜索引擎询问自动补全的方法、系统、存储介质及设备
JP2019074982A (ja) 情報検索装置、検索処理方法、およびプログラム
Kan et al. Grid structure attention for natural language interface to bash commands
JP2022546228A (ja) 構造化及び非構造化されたデータを使用する照会の解決
JPWO2018150453A1 (ja) データ分析装置およびデータ分析方法
KR101982490B1 (ko) 문자 데이터 변환에 기초한 키워드 검색 방법 및 그 장치
CN113761104A (zh) 知识图谱中实体关系的检测方法、装置和电子设备
Kyriakakis et al. Enabling ontology-based search: a case study in the bioinformatics domain
JP6425732B2 (ja) 文章検索システム、極性判定ルール修正システム、文章検索方法及び極性判定ルール修正方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160223

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160519

A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20160519

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160809

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160829

R150 Certificate of patent or registration of utility model

Ref document number: 5998194

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250