JP6902131B2 - クエリ処理方法、クエリ処理装置及びコンピュータ読み取り可能な媒体 - Google Patents

クエリ処理方法、クエリ処理装置及びコンピュータ読み取り可能な媒体 Download PDF

Info

Publication number
JP6902131B2
JP6902131B2 JP2020027637A JP2020027637A JP6902131B2 JP 6902131 B2 JP6902131 B2 JP 6902131B2 JP 2020027637 A JP2020027637 A JP 2020027637A JP 2020027637 A JP2020027637 A JP 2020027637A JP 6902131 B2 JP6902131 B2 JP 6902131B2
Authority
JP
Japan
Prior art keywords
candidate entity
target candidate
entity
evaluation result
category
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020027637A
Other languages
English (en)
Other versions
JP2020135900A (ja
Inventor
ジャジュン ルー,
ジャジュン ルー,
ゼナン リン,
ゼナン リン,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Publication of JP2020135900A publication Critical patent/JP2020135900A/ja
Application granted granted Critical
Publication of JP6902131B2 publication Critical patent/JP6902131B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/83Querying
    • G06F16/835Query processing
    • G06F16/8373Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90344Query processing by using string matching techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本開示の実施例は、人工知能技術の分野に関し、特に、クエリ処理方法、クエリ処理装置、及びコンピュータ読み取り可能な媒体に関する。
近年、人工知能技術の発展に伴い、コンピュータは、自然言語理解では多くの応用価値の成果を収めている。
意味及び文構造の多様性及び複雑さのため、テキストを直接抽出することは困難である。従来技術において、既存の方法は、テキスト中のキーワードを抽出することを主とすることが多く、主に統計分析による方法と意味分析による方法とに分けられている。
本開示の実施例は、クエリ処理方法、クエリ処理装置及びコンピュータ読み取り可能な媒体を提供する。
本開示の実施例の一態様によれば、本開示の実施例は、受信された、文字列を含むクエリ要求に基づいてクエリフィードバックを決定するステップと、前記クエリフィードバック、前記文字列、及び予め設定された知識ベースに基づいてターゲット候補エンティティ集合を決定するステップと、前記ターゲット候補エンティティ集合における各ターゲット候補エンティティを評価して、評価結果を取得するステップであって、1つの前記ターゲット候補エンティティは1つの評価結果に対応するステップと、各前記ターゲット候補エンティティの評価結果に基づいて、各前記ターゲット候補エンティティのカテゴリを決定するステップと、を含むクエリ処理方法を提供する。
いくつかの実施例において、前記クエリフィードバック、前記文字列、及び予め設定された知識ベースに基づいてターゲット候補エンティティ集合を決定するステップは、前記クエリフィードバックと前記文字列とに基づいて第1候補エンティティサブ集合を決定するステップと、前記文字列に基づいて、前記知識ベースから第2候補エンティティサブ集合を決定するステップと、前記第1候補エンティティサブ集合と前記第2候補エンティティサブ集合とに基づいて、前記ターゲット候補エンティティ集合を決定するステップと、を含む。
いくつかの実施例において、前記ターゲット候補エンティティ集合における各ターゲット候補エンティティを評価するステップは、前記ターゲット候補エンティティ集合及び前記クエリフィードバックをそれぞれデュアルチャンネルモデルに入力して、各ターゲット候補エンティティに対応する評価結果を取得するステップを含む。
いくつかの実施例において、各前記ターゲット候補エンティティの評価結果に基づいて、各前記ターゲット候補エンティティのカテゴリを決定するステップは、具体的には、各前記ターゲット候補エンティティの評価結果をそれぞれ予め設定された結果と比較するステップと、ターゲット候補エンティティの評価結果が前記予め設定された結果より優れる条件と、ターゲット候補エンティティの評価結果が前記予め設定された結果と同じである条件と、のうちの少なくとも1つを満たすターゲット候補エンティティを第1カテゴリのエンティティとして決定するステップと、を含む。
いくつかの実施例において、各前記ターゲット候補エンティティの評価結果をそれぞれ評価結果と比較するステップの後に、前記予め設定された結果より劣る評価結果に対応するターゲット候補エンティティを第2カテゴリのエンティティとして決定するステップをさらに含む。
いくつかの実施例において、ターゲット候補エンティティの評価結果が前記予め設定された結果より優れる条件と、ターゲット候補エンティティの評価結果が前記予め設定された結果と同じである条件と、のうちの少なくとも1つを満たすターゲット候補エンティティを第1カテゴリのエンティティとして決定するステップの後に、各前記ターゲット候補エンティティに対応する評価結果と前記ターゲット候補エンティティ集合とに基づいて、前記クエリ要求に対応する検索意図エンティティを決定するステップをさらに含む。
いくつかの実施例において、各前記ターゲット候補エンティティに対応する評価結果と前記ターゲット候補エンティティ集合とに基づいて、前記クエリ要求に対応する検索意図エンティティを決定するステップは、具体的には、各前記ターゲット候補エンティティに対応する評価結果から最適な評価結果を選出するステップと、前記最適な評価結果に対応するターゲット候補エンティティを前記検索意図エンティティとして決定するステップと、を含む。
いくつかの実施例において、前記クエリフィードバックは、ニュース、情報、関連検索、百科及び投稿掲示板のうちの1つ又は複数を含む。
本開示の実施例の別の態様によれば、本開示の実施例は、受信された、文字列を含むクエリ要求に基づいてクエリフィードバックを決定するように構成される検索モジュールと、
前記クエリフィードバック、前記文字列、及び予め設定された知識ベースに基づいてターゲット候補エンティティ集合を決定するように構成される集合決定モジュールと、前記ターゲット候補エンティティ集合における各ターゲット候補エンティティを評価して、評価結果を取得するように構成される評価モジュールであって、1つの前記ターゲット候補エンティティは一つの評価結果に対応する評価モジュールと、各前記ターゲット候補エンティティの評価結果に基づいて、各前記ターゲット候補エンティティのカテゴリを決定するように構成されるカテゴリ区別モジュールと、を含むクエリ処理装置を提供する。
いくつかの実施例において、前記集合決定モジュールは、具体的には、前記クエリフィードバックと前記文字列とに基づいて第1候補エンティティサブ集合を決定し、前記文字列に基づいて、前記知識ベースから第2候補エンティティサブ集合を決定し、前記第1候補エンティティサブ集合と前記第2候補エンティティサブ集合とに基づいて、前記ターゲット候補エンティティ集合を決定するように構成される。
いくつかの実施例において、前記評価モジュールは、前記ターゲット候補エンティティ集合及び前記クエリフィードバックをそれぞれデュアルチャンネルモデルに入力して、各ターゲット候補エンティティに対応する評価結果を取得するように構成される。
いくつかの実施例において、前記カテゴリ区別モジュールは、具体的には、各前記ターゲット候補エンティティの評価結果をそれぞれ予め設定された結果と比較し、ターゲット候補エンティティの評価結果が前記予め設定された結果より優れる条件と、ターゲット候補エンティティの評価結果が前記予め設定された結果と同じである条件と、のうちの少なくとも1つを満たすターゲット候補エンティティを第1カテゴリのエンティティとして決定するように構成される。
いくつかの実施例において、前記カテゴリ区別モジュールは、具体的には、前記予め設定された結果より劣る評価結果に対応するターゲット候補エンティティを第2カテゴリのエンティティとして決定するように構成される。
いくつかの実施例において、前記カテゴリ区別モジュールは、さらに、各前記ターゲット候補エンティティの評価結果と前記ターゲット候補エンティティ集合とに基づいて、前記クエリ要求に対応する検索意図エンティティを決定するように構成される。
いくつかの実施例において、前記カテゴリ区別モジュールは、具体的には、各前記ターゲット候補エンティティに対応する評価結果から最適な評価結果を選出し、前記最適な評価結果に対応するターゲット候補エンティティを前記検索意図エンティティとして決定するように構成される。
本開示の実施例に別の態様によれば、本開示の実施例は、コンピュータプログラムが記憶されているコンピュータ読み取り可能な媒体をさらに提供し、前記プログラムがプロセッサによって実行される場合、上記の方法が実現される。
本開示の実施例によって提供される技術案は、クエリ(query)のカテゴリを判断し、ユーザーによって入力されるクエリの意図を正確に決定し、クエリを行うに必要なコスト、例えば、計算リソース、ネットワークリソース、クエリ時間などを削減し、ユーザーの体験を向上させることができる。
具体的には、本開示の実施例で採用されるターゲット候補エンティティ集合を取得する案に基づいて、クエリフィードバック及び知識ベースなどの特徴を組み合わせたので、クエリに対応するターゲット候補エンティティを正確に選出することができる。また、本開示の実施例で採用される各ターゲット候補エンティティ集合の評価結果を取得する案に基づいて、各ターゲット候補エンティティを効率的かつ正確に評価し、クリエのカテゴリを正確に判断する技術的効果を奏することができる。クリエのカテゴリを正確に区別することができるので、検索の効率を向上させ、ユーザーの検索コストを削減することができる。しかも、クリエのカテゴリを正確に判断することができるので、ユーザーに提示する結果の正確性を向上させ、リコール率を向上させることができる。
図面は、本開示の実施例をさらに理解させるためのものであり、明細書の一部を構成し、本開示の実施例とともに本開示の解釈に用いられ、本開示の限定にはならない。図面を参照して例示的な実施例を詳細に説明することにより、上記及び他の特徴及び利点は、当業者にとってより明らかになる。
本開示の実施例に係るクエリ処理方法の概略図である。 本開示の実施例に係るターゲット候補エンティティ集合を決定する方法の概略図である。 本開示の実施例に係る各ターゲット候補エンティティのカテゴリカテゴリを決定する方法の概略図である。 本開示の実施例に係るクエリ処理装置の概略図である。 本開示の実施例に係るクエリ処理装置の概略ブロック図である。
当業者に本開示の技術方案をより良く理解させるために、本開示によって提供されるクエリ処理方法、クエリ処理装置、及びコンピュータ読み取り可能な媒体について、図面を参照して以下に詳細に説明する。
以下に図面を参照して例示的な実施例をさらに詳細に説明する。前記例示的な実施例は、異なる形態で表すことができ、本開示に記載の実施例に限定されるものであると解釈されるべきではない。逆に、これらの実施例を提供する目的は、本開示を明白且つ完全にし、当業者に本開示の範囲を充分に理解させることである。
本開示で使用される「及び/又は」という用語は、1つ又は複数の関連列挙項目のいずれか及び全ての組み合わせを含む。
本開示で使用される用語は、単に特定の実施例を説明するためのものであり、本開示を限定することを意図するものではない。本開示で使用される単数形「1つ」及び「当該」は、文脈からそうでないことが明確に示されていない限り、複数形を含むことも意図する。本開示で「含む」及び/又は「〜からなる」という用語を使用する場合、前記特徴、全体、ステップ、動作、要素及び/又はコンポーネントが存在することが指定されるが、1つ又は複数の他の特徴、全体、ステップ、動作、要素、コンポーネント及び/又はそのグループの存在又は追加を排除することはできない。
本開示の前記実施例は、本開示の理想的な概略図を用いて、平面図及び/又は断面図を参照して説明することができる。したがって、製造技術及び/又は許容範囲に基づいて例示的な図面を修正することができる。したがって、実施例は。図面で示される実施例に限定されるものではなく、製造工芸による構成の変更を含む。よって、図面で例示された領域は、概略的な属性を有し、図に示される領域の形状は、要素の領域の具体的な形状を例示しているが、限定することを意図していない。
他の限定がない限り、本開示で使用される全ての用語(技術及び科学用語を含む)の意味は、当業者によって一般に理解される意味と同じ意味を有する。さらに、一般的な辞書に限定されるような用語は、関連技術及び本開示の背景における意味と一致する意味を有すると解釈されるべきであって、本開示で明確にこう限定しない限り、理想化及び過度な形式上の意味を有すると解釈しないことを理解すべきである。また、本明細書で明確に限定されていない限り、一般的に使用される辞書で限定されている用語らは、関連技術及び本開示の背景における意味と一致する意味を持つと解釈されるべきであり、理想化された又は過度な意味を有すると解釈されないことも理解されるべきである。
本開示の実施例の一態様によれば、本開示の実施例は、クエリ処理方法を提供する。
図1は、本開示の実施例に係るクエリ処理方法の概略図である。当該方法はクエリ処理装置、例えば、サーバー装置に適用される。
図1に示すように、当該方法は、以下のステップS1〜ステップS4を含む。
ステップS1において、受信された、文字列を含むクエリ要求に基づいて、クエリフィードバックを決定する。
実施例において、ユーザーは、端末を介してサーバ装置にクエリ要求、すなわちqueryを送信する。具体的には、端末は、携帯電話、ノートパソコン、タブレット、携帯情報端末などのモバイルデバイスであってよいし、デスクトップコンピュータなどの固定デバイスであってもよい。クエリ要求は文字列によって構成される。本明細書で記載される「文字列」は、テキスト形態の文字、数字、アルファベット、記号などのうちの1つ又は複数のシーケンスを含んでもよいことを理解されたい。サーバ装置は、ユーザーのクエリに基づいて検索を開始し、ユーザーのクエリに対応するクエリフィードバックを取得する。検索は、インターネットを介して、ウェブページなどのネットワークリソースに基づいて実行することができるし、ローカルに保存された様々なデータベースに基づいてローカルで実行することもできることを理解されたい。
いくつかの実施例において、クエリフィードバックとは、ユーザーのクエリについて検索を行って取得された対応結果であり、例えば、ニュース、情報、関連検索クエリ、フォーラムなどの情報のうちのの一つ又は複数である。クエリフィードバックは、通常ユーザーがアクセス可能である。したがって、クエリフィードバックは、大量のユーザー行動に応じて変化することができ、例えば、ユーザーのクリック数が高い情報は、クエリフィードバックとして、すなわちクエリ要求の結果としてユーザーに提示されるが、ユーザーのクリック数が低い情報は無視される可能性がある。クエリフィードバックの提示は、ユーザーのクリック数のみを根拠とするのではなく、他の根拠も含むことができ、ここでは限定しないことを理解されたい。
クエリフィードバックが大量のユーザー行動に応じて変化するので、クエリフィードバックは、時効性を有する。異なる時間帯に同一のクエリ要求について取得されたクエリフィードバックは異なる可能性がある。それに、同一のクエリフィードバックが異なる時間帯で注目される程度も異なる。以下、クエリ要求「バンブルビー」を例として説明する。映画「バンブルビー」が上映される前に、「バンブルビー」は、トランスフォーマー中の仮想キャラクターとして知られている。つまり、トランスフォーマーが公開され、映画「バンブルビー」が上映される前に、「バンブルビー」は、トランスフォーマーの仮想キャラクターとして知られている。しかし、映画「バンブルビー」が上映された後、「バンブルビー」は、映画として人々に検索される可能性がより高い。つまり、時間の経過に伴い、大量のユーザー行動(例えば、クリック)は、変化し続け、クエリフィードバックもそれに応じて更新される。したがって、本開示の実施例の技術案を採用することで、同一のクエリ要求について異なる時間に異なるクエリフィードバックを得ることができる。すなわち、本開示の実施例によって提供される案によってクエリフィードバックの時効性を向上させることができる。
ステップS2において、クエリフィードバック、文字列、及び予め設定された知識ベースに基づいてターゲット候補エンティティ集合を決定する。
当該ステップにおいて、クエリフィードバック及び知識ベースに基づいて文字列に対応するターゲット候補エンティティ集合を決定することができる。用語「知識ベース」とは、ノードとエッジとによって構成される、グラフ状のデータ構造を指し、例えば、知識マップ又は他の適当なデータベースである。知識ベースにおいて、各ノードは、リアル世界で存在する「エンティティ」を表し、各エッジは、エンティティとエンティティとの「関係」を表す。知識ベースは、関係の有効的表現方式である。言い換えると、知識ベースは、異なる種類の情報を連結して1つの関係インターネットを取得することにより、「関係」の観点から問題を分析する能力を提供している。
図2を参照すると、いくつかの実施例において、ステップS2は、以下のステップS2−1〜ステップS2−3を含む。
ステップS2−1において、クエリフィードバック及び文字列に基づいて、第1候補エンティティサブ集合を決定する。第1候補エンティティサブ集合は、当該文字列に対応する候補エンティティを含む。候補エンティティは、特定の文字列に対応する全ての候補エンティティ又は一部の候補エンティティであってもいい。一部の候補エンティティは、異なる状況に応じて選択することができ、例えば、計算リソース又はインターネットリソースが限られている場合に、各候補エンティティ又は各エンティティ定義項目の重み又は他のパラメータに基づいて、優先順位の高いいくつかの候補エンティティ又はエンティティ定義項目を選択することができる。具体的な選択方式について、本開示はここで限定しない。
実施例において、第1候補エンティティサブ集合は、クエリフィードバック及び文字列を計算することによって取得することができる。具体的には、例えば、マルチモードマッチングアルゴリズムを採用して、文字列をクエリフィードバックにマッチングさせることにより、対応するクエリフィードバック内の全て又は一部の候補エンティティを抽出することができる。文字列をクエリフィードバックにマッチングさせて候補エンティティを得るアルゴリズムは、この機能を実現できる任意のアルゴリズムであってもよく、本開示は、ここで限定しない。
ステップS2−2において、文字列に基づいて、知識ベースから第2候補エンティティサブ集合を決定する。第2候補エンティティサブ集合は、当該文字列に対応する候補エンティティ、及び候補エンティティに対応するエンティティ定義項目を含む。定義項目は、例えば、見出し語、エントリであってよく、各異なる概念的意味の物を記述する内容を指す。候補エンティティのエンティティ定義項目は、当該候補エンティティに対応する全てのエンティティ定義項目又は一部のエンティティ定義項目であっていい。一部の候補エンティティ及びエンティティ定義項目は、状況に応じて選択することができる。具体的な選択方式について、本開示はここで限定しない。
好ましくは、知識ベースにおける既に相互関係を有する各エンティティの情報に基づいて、知識ベースから文字列と関連関係を有する複数のエンティティ定義項目を選択し、複数のエンティティ定義項目からなる集合が第2候補エンティティサブ集合である。
ステップS2−3において、第1候補エンティティサブ集合と第2候補エンティティサブ集合とに基づいて、ターゲット候補エンティティ集合を決定する。具体的には、2つのサブ集合である第1候補エンティティサブ集合と第2候補エンティティサブ集合との和集合をターゲット候補エンティ集合とする。
なお、ステップS2−1とステップS2−2とは、必ずしも先後の順序ではない。すなわち、第1候補エンティティサブ集合の取得ステップを優先的に実行してもよいし、第2候補エンティティサブ集合の取得ステップを優先的に実行してもよいし、さらに第1候補エンティティサブ集合の取得ステップと第2候補エンティティサブ集合の取得ステップを同期に実行してもいい。
ステップS3において、ターゲット候補エンティティ集合における各ターゲット候補エンティティを評価して評価結果を取得し、1つのターゲット候補エンティティは1つの評価結果に対応する。従来技術における評価方法を採用して、ターゲット候補エンティティ集合における各ターゲット候補エンティティを評価することができる。例えば、ターゲット候補エンティティ集合における各ターゲット候補エンティティの順序付けを行い、又はターゲット候補エンティティ集合における各ターゲット候補エンティティのスコアを計算する。具体的な評価方式についてここでは限定しない。
いくつかの実施例において、ステップS3は、ターゲット候補エンティティ集合及びクエリフィードバックをそれぞれデュアルチャンネルモデルに入力して、各ターゲット候補エンティティに対応する評価結果を取得するステップを含む。
具体的に、それぞれターゲット候補エンティティ集合とクエリフィードバックをデュアルチャンネルモデルに入力して、各ターゲット候補エンティティに対応する評価結果を出力する。デュアルチャンネルモデルはデュアルチャンネルLSTMモデルであるのが好ましい。ここで、デュアルチャンネルLSTMモデルは、すなわちデュアルチャンネルLSTM(Long−Short term Memory)モデルである。デュアルチャンネルLSTMモデルは、ターゲット候補エンティティにおける各ターゲット候補エンティティを正確に区別し、各ターゲット候補エンティティに対応する評価結果を出力することができる。
デュアルチャンネルLSTMモデルを採用して各ターゲット候補エンティティを評価する場合、取得された評価結果はスコアである。
具体的には、ターゲット候補エンティティ集合をデュアルチャンネルLSTMモデルの一端(すなわちデュアルチャンネルLSTMモデルの一方のチャンネル)に入力し、クエリフィードバックをデュアルチャンネルLSTMモデルの他端(すなわちデュアルチャンネルLSTMモデルの他方のチャンネル)に入力する。本開示の実施例において、デュアルチャンネルLSTMモデル、クエリフィードバック、及び知識ベースを利用して、クエリ処理領域内のエンティティ名称、エンティティエイリアス、エンティティ+情報(すなわち知識情報)及び誤り修正という問題を解決する。
ステップS4において、各ターゲット候補エンティティの評価結果に基づいて、各ターゲット候補エンティティのカテゴリを決定する。
いくつかの実施例において、カテゴリは、認知クラス需要と非認知クラス需要とを含む。認知クラス需要のエンティティは。エンティティ名称とエンティティ情報とを含み、すなわち認知クラス需要のエンティティは、明確な定義を持つエンティティである。非認知クラス需要のエンティティは、明確な定義を持たないエンティティである。
具体的には、ステップS2によって、ターゲット候補エンティティ集合が取得される。ターゲット候補エンティティ集合は、第1候補エンティティサブ集合と第2候補エンティティサブ集合とを含む。第1候補エンティティサブ集合に複数のターゲット候補エンティティが含まれる。第2候補エンティティサブ集合に複数のターゲット候補エンティティ、及び各ターゲット候補エンティティに対応するエンティティ定義項目が含まれる。1つのターゲット候補エンティティが少なくとも1つのエンティティ定義項目に対応するため、1つのエンティティ定義項目は1つのターゲット候補エンティティのみに対応する。したがって、ターゲット候補エンティティ集合に基づいて、ターゲット候補エンティティ集合における各ターゲット候補エンティティと各エンティティ定義項目との関連関係を決定することができる。評価の過程は、ターゲット候補エンティティ集合における各ターゲット候補エンティティ(あるターゲット候補エンティティが少なくとも1つのエンティティ定義項目を含む場合に、当該ターゲット候補エンティティとそれに対応する各エンティティ定義項目と)をそれぞれクエリフィードバックにマッチングさせる過程である。さらに、本開示の実施例において、エンティティ定義項目とターゲット候補エンティティとを組み合わせる方式でクエリフィードバックにマッチングさせることにより、マッチングの結果の包括性及び充分性を実現することができる。マッチングの結果は評価の結果である。具体的には、計算によってマッチングを行ってもよいし(例えば、類似度を計算)、モデルによってマッチングを行ってもよい(例えば、ニューラルネットワークモデル)、ここではマッチングの方法について限定しない。
ここで、計算によってマッチングを行う具体的な一実現形態は、次の通りである。ターゲット候補エンティティ集合におけるいずれかのターゲット候補エンティティとクエリフィードバックとの類似度を計算して(ターゲット候補エンティティが少なくとも1つのエンティティ定義項目を含む場合に、当該ターゲット候補エンティティとそれに対応する各エンティティ定義項目とを1つの全体としてクエリフィードバックにマッチングさせる)、当該ターゲット候補エンティティの類似度(すなわち評価結果)を取得する。類似度と予め設定された類似度閾値(すなわち予め設定された結果)とを比較し、類似度が類似度閾値以上である場合に、ターゲット候補エンティティを認知クラス需要のエンティティと決定し、類似度が類似度閾値より小さい場合に、当該ターゲット候補エンティティを非認知クラス需要のエンティティと決定することである。
ここで、モデルによってマッチングを行う具体的な一実現形態は、次の通りである。ターゲット候補エンティティ集合における各ターゲット候補エンティティをデュアルチャンネルLSTMモデルの一方のチャンネルを介してデュアルチャンネルLSTMモデルに入力し、クエリフィードバックをデュアルチャンネルLSTMモデルの他方のチャンネルを介してデュアルチャンネルLSTMモデルに入力する。デュアルチャンネルLSTMモデルはクエリフィードバックに基づいて、各ターゲット候補エンティティを評価する。評価の方法は、各ターゲット候補エンティティの採点処理を行うことを含むが、これに限られない。すなわち、デュアルチャンネルLSTMモデルは、クエリフィードバックに基づいて、各ターゲット候補エンティティに対応するスコア(すなわち評価結果)を出力する。具体的には、デュアルチャンネルLSTMモデルがあるターゲット候補エンティティのスコアC(すなわち当該ターゲット候補エンティティの評価結果)を出力し、予め設定されたスコア閾値(すなわち予め設定された結果)がDであり、かつC≧Dの場合、ターゲット候補エンティティを認知クラス需要のエンティティとして決定する。C<Dの場合に、ターゲット候補エンティティを非認知クラス需要のエンティティとして決定する。
図3を参照すると、いくつかの実施例において、ステップS4は、以下のステップS4−1〜ステップS4−3を含む。
ステップS4−1において、各ターゲット候補エンティティの評価結果をそれぞれ予め設定された結果と比較し、ターゲット候補エンティティの評価結果が予め設定された結果より優れる場合、又は予め設定された結果と同じである場合、ステップS4−2を実行し、そうでない場合、ステップS4−3を実行する。
ステップS4−2において、予め設定された結果より優れる、又は予め設定された結果と同じである評価結果に対応するターゲット候補エンティティを第1カテゴリのエンティティとして決定する。
ステップS4−3において、予め設定された結果より劣る評価結果に対応するターゲット候補エンティティを第2カテゴリのエンティティとして決定する。
ここで、第1カテゴリのエンティティは認知クラス需要のエンティティであり、第2カテゴリのエンティティは非認知クラス需要のエンティティである。
本開示の実施例において、ターゲット候補エンティティ集合にm個のターゲット候補エンティティがある場合、m個のターゲット候補エンティティの各ターゲット候補エンティティの評価結果のそれぞれを予め設定された結果と比較する。
なお、あるターゲット候補エンティティの評価結果を予め設定された結果と比較して得られた結果は、2つの可能性があり、1つ目は、当該ターゲット候補エンティティの評価結果が予め設定された結果より優れる、または予め設定された結果と同じであることであり、2つ目は、当該ターゲット候補エンティティの評価結果が予め設定された結果より劣ることである。1つ目の比較結果の場合に、当該ターゲット候補エンティティを第1カテゴリのエンティティとして決定し、2つ目の比較結果の場合に、当該ターゲット候補エンティティを第2カテゴリのエンティティとして決定する。
本開示の実施例によって提供される案によれば、本開示の実施例で採用されるターゲット候補エンティティ集合を取得する案に基づいて、クエリフィードバック及び知識ベースなどの特徴を組み合わせているので、クエリに対応するターゲット候補エンティティを正確に選択することができる。そして本開示の実施例で採用される各ターゲット候補エンティティの評価結果を取得する案に基づいて、各ターゲット候補エンティティを効率的かつ正確に評価し、クエリのカテゴリを正確に判断する技術的効果を奏することができる。クエリのカテゴリを正確に区別することができるので、検索の効率を向上させ、ユーザーの検索コストを削減することができる。しかも、クエリのカテゴリを正確に判断することができるので、ユーザーに提示する結果の正確性を向上させ、リコール率を向上させることができる。
図3参照すると、いくつかの実施例において、ステップS4−2の後に、当該方法は、ステップS4−4をさらに含む。
ステップS4−4において、各ターゲット候補エンティティに対応する評価結果とターゲット候補エンティティ集合とに基づいて、クエリ要求に対応する検索意図エンティティを決定する。検索意図エンティティとは、クエリ要求に対応するエンティティを最も現すことができるエンティティである。すなわち、検索意図エンティティは、ユーザーの所望のクエリ結果に対応するエンティティを最も現すことができるエンティティである。
図3を参照すると、いくつかの実施例において、ステップS4−4は、具体的には、各ターゲット候補エンティティに対応する評価結果から最適な評価結果を選出するステップS4−4−1と、最適な評価結果に対応するターゲット候補エンティティを検索意図エンティティとして決定するステップS4−4−2と、を含む。
本開示の実施例において、1つのターゲット候補エンティティは1つの評価結果(異なるターゲット候補エンティティに対応する評価結果が同じ結果である場合が存在する可能性がある)に対応し、すなわちm個のターゲット候補エンティティはm個の評価結果を有する。m個の評価結果を降順又は昇順に並べて、最適な評価結果を選出する。最適な評価結果に対応するターゲット候補エンティティを検索意図エンティティとして決定する。すなわち、最適な評価結果に対応するターゲット候補エンティティ(すなわち検索意図エンティティ)は、クエリ要求の本当の検索意図を最も表すことができるエンティティである。本開示の実施例によって提供される案により、ユーザーの本当の意図を効率的かつ正確に決定することができ、それに応じたカードをユーザーにフィードバックし、ユーザーの検索体験を向上させることができる。
本開示の実施例の別の態様によれば、本開示の実施例はクエリ処理装置をさらに開示する。
図4は、本開示の実施例に係るクエリ処理装置の概略図である。
図4に示すように、当該装置は、受信された、文字列を含むクエリ要求に基づいてクエリフィードバックを決定するように構成される検索モジュール1と、クエリフィードバック、文字列、及び予め設定された知識ベースに基づいてターゲット候補エンティティ集合を決定するように構成される集合決定モジュール2と、ターゲット候補エンティティ集合における各ターゲット候補エンティティを評価して、評価結果を取得するように構成され、1つのターゲット候補エンティティは一つの評価結果に対応する評価モジュール3と、各ターゲット候補エンティティの評価結果に基づいて、各ターゲット候補エンティティのカテゴリを決定するように構成されるカテゴリ区別モジュール4と、を含む。
いくつかの実施例において、集合決定モジュール2は、具体的には、クエリフィードバックと文字列とに基づいて第1候補エンティティサブ集合を決定し、文字列に基づいて、知識ベースから第2候補エンティティサブ集合を決定し、第1候補エンティティサブ集合と第2候補エンティティサブ集合とに基づいて、ターゲット候補エンティティ集合を決定するように構成される。
いくつかの実施例において、評価モジュールは、具体的には、ターゲット候補エンティティ集合及びクエリフィードバックをそれぞれデュアルチャンネルモデルに入力して、各ターゲット候補エンティティに対応する評価結果を取得するように構成される。
いくつかの実施例において、カテゴリ区別モジュール4は、具体的には、各ターゲット候補エンティティの評価結果をそれぞれ予め設定された結果と比較し、ターゲット候補エンティティの評価結果が予め設定された結果より優れる条件と、ターゲット候補エンティティの評価結果が予め設定された結果と同じである条件と、のうちの少なくとも1つを満たすターゲット候補エンティティを第1カテゴリのエンティティとして決定するように構成される。
いくつかの実施例において、カテゴリ区別モジュール4は、具体的には、さらに、予め設定された結果より劣る評価結果に対応するターゲット候補エンティティを第2カテゴリのエンティティとして決定するように構成される。
いくつかの実施例において、カテゴリ区別モジュール4は、さらに、各ターゲット候補エンティティの評価結果とターゲット候補エンティティ集合とに基づいて、クエリ要求に対応する検索意図エンティティを決定するように構成される。
いくつかの実施例において、カテゴリ区別モジュール4は、具体的には、各ターゲット候補エンティティに対応する評価結果から最適な評価結果を選出し、最適な評価結果に対応するターゲット候補エンティティを検索意図エンティティとして決定するように構成される。
いくつかの実施例において、クエリフィードバックは、ニュース、情報、関連検索、百科、及び投稿掲示板のうちの1つ又は複数を含む。
図5は、本開示の実施例に係るクエリ処理装置の概略ブロック図である。
図5に示されるクエリ処理装置は、単に一例であり、本開示の実施例の機能及び使用範囲について一切限定しない。
図5で示すように、クエリ処理装置は、汎用のコンピュータ機器の形態で表現される。クエリ処理装置のコンポーネントは、1つ又は複数のプロセッサ又は処理ユニット11、メモリ12、異なるコンポーネント(メモリ12と処理ユニット11とを含む)を接続するバス13を含むが、これらに限定されない。
バス13は、メモリバス又はメモリコントローラ、周辺バス、アクセラレーテッドグラフィックスポート、プロセッサ又は多様なバス構造のうちのいずれかのバス構造を使用するローカルバスを含む、複数種類のバス構造のうち一つ又は複数を表す。例を挙げると、これらのアーキテクチャは、インダストリスタンダードアーキテクチャ(ISA)バス、マイクロチャネルアーキテクチャ(MAC)バス、拡張ISAバス、ビデオエレクトロニクススタンダーズアソシエーション(VESA)ローカルバス、及びペリフェラルコンポーネントインターコネクト(PCI)バスを含むが、これらに限定されない。
クエリ処理装置は、典型的には、複数種類のコンピュータシステム読み取り可能な媒体を含む。これらの媒体は、クエリ処理装置がアクセスすることができる任意の使用可能な媒体であってもよく、揮発性媒体及び不揮発性媒体、リムーバブル媒体及びノンリムーバブル媒体を含む。
システムメモリ12は、ランダムアクセスメモリ(RAM)14及び/又はキャッシュメモリ15(すなわち緩衝記憶装置)などの揮発性メモリの形態のコンピュータシステム読み取り可能な媒体を含んでもよい。クエリ処理装置は、他のリムーバブル/ノンリムーバブル、揮発性/不揮発性コンピュータシステム記憶媒体をさらに含んでもよい。単なる一例として、ストレージシステム16は、ノンリムーバブル、不揮発性磁気媒体(図5に示されていないが、通常「ハードドライブ」という)に対して読み出し及び書き込みをするために用いることができる。図5に示されていないが、リムーバブル不揮発性磁気ディスク(例えば、「フロッピーディスク」)に対して読み出し及び書き込みをするための磁気ディスクドライブ、及びリムーバブル不揮発性光学ディスク(例えば、CD−ROM、DVD−ROM、又は他の光学媒体)に対して読み出し及び書き込みをするための光学ディスクドライブを提供することができる。これらの場合、各ドライブは、一つ又は複数のデータメディアインターフェイスを介してバス13に接続することができる。メモリ12は、本発明の各実施例に記載の機能を実行するように構成される1セット(例えば、少なくとも一つ)のプログラムモジュールを有する少なくとも一つのプログラム製品を含んでもよい。
1セットの(少なくとも1つ)プログラムモジュール17を有するプログラム/ユーティリティ18は、例えば、メモリ12に記憶されてもよく、このようなプログラムモジュール17は、オペレーティングシステム、1つ又は複数のアプリケーションプログラム、他のプログラムモジュール及びプログラムデータを含むが、これらに限定されない。これらの例のそれぞれ又はある組み合わせには、ネットワーキング環境の実現が含まれる可能性がある。プログラムモジュール17は、通常、本発明に記載の実施例における機能及び/又は方法を実行する。
クエリ処理装置は、1つ又は複数の外部デバイス10(例えば、キーボード、ポインティングデバイス、ディスプレイ20など)と通信することができ、また、ユーザが当該クエリ処理装置とインタラクションすることを可能にする1つ又は複数のデバイスと通信することができ、及び/又は、当該クエリ処理装置が1つ又は複数の他のコンピューティングデバイスと通信することを可能にする任意のデバイス(例えば、ネットワークカード、モデムなど)と通信することもできる。そのような通信は、入力/出力(I/O)インターフェイス21を介して行うことができる。また、クエリ処理装置は、ネットワークアダプタ22を介して、1つ又は複数のネットワーク(例えば、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、及び/又はパブリックネットワーク、例えば、インターネット)と通信することができる。図に示すように、ネットワークアダプタ22は、バス13を介してクエリ処理装置の他のコンポーネントと通信する。なお、図に示されていないが、マイクロコード、デバイスドライバ、冗長化処理ユニット、外部ディスク駆動アレイ、RAIDシステム、テープドライバ、及びデータバックアップストレージシステムなどを含むが、これらに限定されない他のハードウェア及び/又はソフトウェアモジュールをクエリ処理装置と組み合わせて使用することができる。
処理ユニット11は、メモリ12に記憶されている少なくとも1つのプログラムを実行することにより、様々な機能アプリケーション及びデータ処理を実行し、例えば、本発明の実施例に記載のクエリ処理方法を実現する。
本開示の実施例の別の態様によれば、本開示の実施例は、コンピュータプログラムが記憶されているコンピュータ読み取り可能な記憶媒体をさらに提供し、当該プログラムがプロセッサにより実行される場合に、上記の方法が実現される。
当業者であれば、上記の方法のすべて又はいくつかのステップ、システム、装置における機能モジュール/ユニットは、ソフトウェア、ファームウェア、ハードウェア、及び適切な組み合わせとして実施されてもよいことを理解されたい。ハードウェアの実施形態において、上記の説明で言及された機能モジュール/ユニットの分割は、必ずしも物理的コンポーネントの区分に対応するものではなく、例えば、1つの物理的コンポーネントは、複数の機能を有してもよく、または1つの機能又はステップは、複数の物理的コンポーネントによって連携して実行されてもよい。いくつかの物理的コンポーネント又はすべての物理的コンポーネントは、中央処理装置、デジタル信号プロセッサ、又はマイクロプロセッサなどのプロセッサによって実行されるソフトウェアとして実施されてもよく、又はハードウェアとして実施されてもよく、又は特定用途向け集積回路のような集積回路に実施されてもよい。このようなソフトウェアは、コンピュータ読み取り可能な媒体に配置されてもよく、コンピュータ読み取り可能な媒体は、コンピュータ記憶媒体(又は非一時的な媒体)と通信媒体(又は一時的な媒体)を含むことができる。当業者の周知のように、コンピュータ記憶媒体という用語は、情報(コンピュータ読み取り可能な命令、データ構成、プログラムモジュール、又は他のデータなど)を記憶するための任意の方法又は技術において実施される揮発性と非揮発性、リムーバブル媒体と非リムーバブル媒体を含む。コンピュータ記憶媒体は、RAM、ROM、EEPROM、フラッシュメモリ又は他のメモリ技術、CD−ROM、デジタル多用途ディスク(DVD)又は他の光ディスク記憶装置、マグネットボックス、デープ、ディスクストレージ又は他の磁気記憶装置、又は所望の情報を記憶し、コンピュータがアクセス可能な他の任意の媒体を含むことができるが、これらに限定されない。また、当業者の周知のように、通信媒体は、通常、コンピュータ読み取り可能な媒体、データ構造、プログラムモジュール、又は例えば搬送波や他の伝送方式などの変調データ信号における他のデータを含み、且つ任意の情報配信媒体を含むことができる。
本明細書では、既に例示的な実施例が開示されており、具体的な用語が使用されているが、これらの用語は一般的な説明としてのみ使用されることを意図しており、限定として解釈されるべきではない。いくつかの実施例において、特に明確に示されない限り、特定の実施例と合わせて説明される特徴、特性、及び/又は要素は、単独で使用されてもよいし、又は他の実施例と合わせて説明される特徴、特性、及び/又は要素と組み合わせて使用されてもよいことは、当業者には明らかであろう。したがって、当業者は、添付された特許請求の範囲によって定義された本開示の範囲を逸脱することなく、様々な形態および詳細を変更することができる。
1 検索モジュール
2 集合決定モジュール
3 評価モジュール
4 カテゴリ区別モジュール
11 処理ユニット(又はプロセッサ)
12 メモリ
13 バス
14 RAM
15 フラッシュメモリ
16 ストレージシステム
17 プログラムコンポーネント
18 ユーティリティ
19 外部デバイス
20 ディスプレイ
21 I/Oインターフェイス
22 ネットワークアダプタ

Claims (13)

  1. 検索モジュールが、受信された、文字列を含むクエリ要求に基づいてクエリフィードバックを決定するステップと、
    集合決定モジュールが、前記クエリフィードバック、前記文字列、及び予め設定された知識ベースに基づいてターゲット候補エンティティ集合を決定するステップと、
    評価モジュールが、前記ターゲット候補エンティティ集合における各ターゲット候補エンティティを評価して、評価結果を取得するステップであって、1つの前記ターゲット候補エンティティは1つの評価結果に対応するステップと、
    カテゴリ区別モジュールが、各前記ターゲット候補エンティティの評価結果に基づいて、各前記ターゲット候補エンティティのカテゴリを決定するステップと、
    を含み、
    前記集合決定モジュールが前記クエリフィードバック、前記文字列、及び予め設定された知識ベースに基づいてターゲット候補エンティティ集合を決定するステップが、
    前記集合決定モジュールが、前記クエリフィードバックと前記文字列とに基づいて第1候補エンティティサブ集合を決定するステップと、
    前記集合決定モジュールが、前記文字列に基づいて、前記知識ベースから第2候補エンティティサブ集合を決定するステップと、
    前記集合決定モジュールが、前記第1候補エンティティサブ集合と前記第2候補エンティティサブ集合とに基づいて、前記ターゲット候補エンティティ集合を決定するステップと、
    を含むクエリ処理方法。
  2. 前記評価モジュールが前記ターゲット候補エンティティ集合における各ターゲット候補エンティティを評価するステップが、
    前記評価モジュールが、前記ターゲット候補エンティティ集合及び前記クエリフィードバックをそれぞれデュアルチャンネルモデルに入力して、各ターゲット候補エンティティに対応する評価結果を取得するステップを含む請求項1に記載の方法。
  3. 前記カテゴリ区別モジュールが各前記ターゲット候補エンティティの評価結果に基づいて、各前記ターゲット候補エンティティのカテゴリを決定するステップが、
    前記カテゴリ区別モジュールが、各前記ターゲット候補エンティティの評価結果をそれぞれ予め設定された結果と比較するステップと、
    前記カテゴリ区別モジュールが、ターゲット候補エンティティの評価結果が前記予め設定された結果より優れる条件と、ターゲット候補エンティティの評価結果が前記予め設定された結果と同じである条件と、のうちの少なくとも1つを満たすターゲット候補エンティティを第1カテゴリのエンティティとして決定するステップと、
    を含む請求項1又は2に記載の方法。
  4. 各前記ターゲット候補エンティティの評価結果をそれぞれ評価結果と比較するステップの後に、
    前記カテゴリ区別モジュールが、前記予め設定された結果より劣る評価結果に対応するターゲット候補エンティティを第2カテゴリのエンティティとして決定するステップを含む請求項に記載の方法。
  5. ターゲット候補エンティティの評価結果が前記予め設定された結果より優れる条件と、ターゲット候補エンティティの評価結果が前記予め設定された結果と同じである条件と、のうちの少なくとも1つを満たすターゲット候補エンティティを第1カテゴリのエンティティとして決定するステップの後に、
    前記カテゴリ区別モジュールが、各前記ターゲット候補エンティティに対応する評価結果と前記ターゲット候補エンティティ集合とに基づいて、前記クエリ要求に対応する検索意図エンティティを決定するステップを含む請求項に記載の方法。
  6. 各前記ターゲット候補エンティティに対応する評価結果と前記ターゲット候補エンティティ集合とに基づいて、前記クエリ要求に対応する検索意図エンティティを決定するステップが
    前記カテゴリ区別モジュールが、各前記ターゲット候補エンティティに対応する評価結果から最適な評価結果を選出するステップと、
    前記カテゴリ区別モジュールが、前記最適な評価結果に対応するターゲット候補エンティティを前記検索意図エンティティとして決定するステップと、
    を含む請求項に記載の方法。
  7. 受信された、文字列を含むクエリ要求に基づいてクエリフィードバックを決定するように構成される検索モジュールと、
    前記クエリフィードバック、前記文字列、及び予め設定された知識ベースに基づいてターゲット候補エンティティ集合を決定するように構成される集合決定モジュールと、
    前記ターゲット候補エンティティ集合における各ターゲット候補エンティティを評価して、評価結果を取得するように構成される評価モジュールであって、1つの前記ターゲット候補エンティティは一つの評価結果に対応する評価モジュールと、
    各前記ターゲット候補エンティティの評価結果に基づいて、各前記ターゲット候補エンティティのカテゴリを決定するように構成されるカテゴリ区別モジュールと、
    を含み、
    前記集合決定モジュールが、
    前記クエリフィードバックと前記文字列とに基づいて第1候補エンティティサブ集合を決定し、
    前記文字列に基づいて、前記知識ベースから第2候補エンティティサブ集合を決定し、
    前記第1候補エンティティサブ集合と前記第2候補エンティティサブ集合とに基づいて、前記ターゲット候補エンティティ集合を決定するように構成されるクエリ処理装置。
  8. 前記評価モジュールが、
    前記ターゲット候補エンティティ集合及び前記クエリフィードバックをそれぞれデュアルチャンネルモデルに入力して、各ターゲット候補エンティティに対応する評価結果を取得するように構成される請求項に記載の装置。
  9. 前記カテゴリ区別モジュールが、
    各前記ターゲット候補エンティティの評価結果をそれぞれ予め設定された結果と比較し、
    ターゲット候補エンティティの評価結果が前記予め設定された結果より優れる条件と、ターゲット候補エンティティの評価結果が前記予め設定された結果と同じである条件と、のうちの少なくとも1つを満たすターゲット候補エンティティを第1カテゴリのエンティティとして決定するように構成される請求項又はに記載の装置。
  10. 前記カテゴリ区別モジュールが、
    前記予め設定された結果より劣る評価結果に対応するターゲット候補エンティティを第2カテゴリのエンティティとして決定するように構成される請求項に記載の装置。
  11. 前記カテゴリ区別モジュールが、
    各前記ターゲット候補エンティティの評価結果と前記ターゲット候補エンティティ集合とに基づいて、前記クエリ要求に対応する検索意図エンティティを決定するように構成される請求項に記載の装置。
  12. 前記カテゴリ区別モジュールが、
    各前記ターゲット候補エンティティに対応する評価結果から最適な評価結果を選出し、
    前記最適な評価結果に対応するターゲット候補エンティティを前記検索意図エンティティとして決定するように構成される請求項11に記載の装置。
  13. コンピュータプログラムが記憶されているコンピュータ読み取り可能な媒体であって、
    前記プログラムがプロセッサによって実行される場合、請求項1からのいずれか一項に記載の方法が実現されるコンピュータ読み取り可能な媒体。
JP2020027637A 2019-02-21 2020-02-21 クエリ処理方法、クエリ処理装置及びコンピュータ読み取り可能な媒体 Active JP6902131B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201910130355.5A CN109902149B (zh) 2019-02-21 2019-02-21 查询处理方法和装置、计算机可读介质
CN201910130355.5 2019-02-21

Publications (2)

Publication Number Publication Date
JP2020135900A JP2020135900A (ja) 2020-08-31
JP6902131B2 true JP6902131B2 (ja) 2021-07-14

Family

ID=66945255

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020027637A Active JP6902131B2 (ja) 2019-02-21 2020-02-21 クエリ処理方法、クエリ処理装置及びコンピュータ読み取り可能な媒体

Country Status (5)

Country Link
US (1) US11397788B2 (ja)
EP (1) EP3699781A1 (ja)
JP (1) JP6902131B2 (ja)
KR (1) KR102258484B1 (ja)
CN (1) CN109902149B (ja)

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6175829B1 (en) * 1998-04-22 2001-01-16 Nec Usa, Inc. Method and apparatus for facilitating query reformulation
US6363378B1 (en) * 1998-10-13 2002-03-26 Oracle Corporation Ranking of query feedback terms in an information retrieval system
US7747648B1 (en) * 2005-02-14 2010-06-29 Yahoo! Inc. World modeling using a relationship network with communication channels to entities
US20090299990A1 (en) * 2008-05-30 2009-12-03 Vidya Setlur Method, apparatus and computer program product for providing correlations between information from heterogenous sources
US20110307482A1 (en) * 2010-06-10 2011-12-15 Microsoft Corporation Search result driven query intent identification
US8600979B2 (en) 2010-06-28 2013-12-03 Yahoo! Inc. Infinite browse
US8972387B2 (en) * 2011-07-28 2015-03-03 International Business Machines Corporation Smarter search
EP2771806A4 (en) * 2011-10-28 2015-07-22 Blackberry Ltd MANAGEMENT OF ELECTRONIC EQUIPMENT WITH PROFILE-BASED INFERENCES BETWEEN DOMAINS
WO2013059904A1 (en) * 2011-10-28 2013-05-02 Research In Motion Limited Factor-graph based matching systems and methods
CN105956137B (zh) * 2011-11-15 2019-10-01 阿里巴巴集团控股有限公司 一种搜索方法、搜索装置及一种搜索引擎系统
US20130212081A1 (en) * 2012-02-13 2013-08-15 Microsoft Corporation Identifying additional documents related to an entity in an entity graph
US9183310B2 (en) * 2012-06-12 2015-11-10 Microsoft Technology Licensing, Llc Disambiguating intents within search engine result pages
US9594831B2 (en) * 2012-06-22 2017-03-14 Microsoft Technology Licensing, Llc Targeted disambiguation of named entities
KR20140075428A (ko) * 2012-12-11 2014-06-19 한국전자통신연구원 시맨틱 검색 키워드 추천 방법 및 시스템
CN104239340B (zh) * 2013-06-19 2018-03-16 北京搜狗信息服务有限公司 搜索结果筛选方法与装置
WO2015042290A1 (en) * 2013-09-19 2015-03-26 Quixey, Inc. Identifying gaps in search results
CN104866498A (zh) * 2014-02-24 2015-08-26 华为技术有限公司 一种信息处理方法及装置
US9754210B2 (en) * 2014-04-01 2017-09-05 Microsoft Technology Licensing, Llc User interests facilitated by a knowledge base
CN103995880B (zh) * 2014-05-27 2019-03-12 百度在线网络技术(北京)有限公司 交互式搜索方法和装置
US9418128B2 (en) * 2014-06-13 2016-08-16 Microsoft Technology Licensing, Llc Linking documents with entities, actions and applications
US20150370787A1 (en) 2014-06-18 2015-12-24 Microsoft Corporation Session Context Modeling For Conversational Understanding Systems
US20160041986A1 (en) * 2014-08-08 2016-02-11 Cuong Duc Nguyen Smart Search Engine
US20170193099A1 (en) * 2015-12-31 2017-07-06 Quixey, Inc. Machine Identification of Grammar Rules That Match a Search Query
WO2017134093A1 (en) * 2016-02-02 2017-08-10 Koninklijke Philips N.V. Cognitive patient care event reconstruction
US10769535B2 (en) * 2016-05-13 2020-09-08 Cognitive Scale, Inc. Ingestion pipeline for universal cognitive graph
US10380169B2 (en) * 2016-07-29 2019-08-13 Rovi Guides, Inc. Systems and methods for determining an execution path for a natural language query
CN108280081B (zh) * 2017-01-06 2023-02-24 百度在线网络技术(北京)有限公司 生成网页的方法和装置
US11157490B2 (en) * 2017-02-16 2021-10-26 Microsoft Technology Licensing, Llc Conversational virtual assistant
EP3642835A4 (en) * 2017-08-03 2021-01-06 Telepathy Labs, Inc. PROACTIVE, INTELLIGENT AND OMNICANAL VIRTUAL AGENT
US11893500B2 (en) * 2017-11-28 2024-02-06 International Business Machines Corporation Data classification for data lake catalog
US20190197176A1 (en) * 2017-12-21 2019-06-27 Microsoft Technology Licensing, Llc Identifying relationships between entities using machine learning
CN108345702A (zh) * 2018-04-10 2018-07-31 北京百度网讯科技有限公司 实体推荐方法和装置
US11010179B2 (en) * 2018-04-20 2021-05-18 Facebook, Inc. Aggregating semantic information for improved understanding of users
CN108733779B (zh) * 2018-05-04 2022-10-04 百度在线网络技术(北京)有限公司 文本配图的方法和装置
US20190347358A1 (en) * 2018-05-10 2019-11-14 Microsoft Technology Licensing, Llc Query Formulation Using Networked Device Candidates
CN109033140B (zh) * 2018-06-08 2020-05-29 北京百度网讯科技有限公司 一种确定搜索结果的方法、装置、设备和计算机存储介质
CN108959613B (zh) * 2018-07-17 2021-09-03 杭州电子科技大学 一种面向rdf知识图谱的语义近似查询方法
CN109344174A (zh) * 2018-09-13 2019-02-15 深圳易投云智能科技有限公司 金融分析方法和系统
CN109299289B (zh) * 2018-11-30 2021-04-06 国信优易数据股份有限公司 一种查询图构建方法、装置、电子设备及计算机存储介质

Also Published As

Publication number Publication date
EP3699781A1 (en) 2020-08-26
CN109902149B (zh) 2021-08-13
KR20200102334A (ko) 2020-08-31
CN109902149A (zh) 2019-06-18
US20200272675A1 (en) 2020-08-27
US11397788B2 (en) 2022-07-26
KR102258484B1 (ko) 2021-05-28
JP2020135900A (ja) 2020-08-31

Similar Documents

Publication Publication Date Title
US11361243B2 (en) Recommending machine learning techniques, features, and feature relevance scores
CN106575503B (zh) 用于对话理解系统的会话上下文建模的方法和系统
US9997157B2 (en) Knowledge source personalization to improve language models
WO2021093755A1 (zh) 问题的匹配方法及装置、问题的回复方法及装置
CN110110225B (zh) 基于用户行为数据分析的在线教育推荐模型及构建方法
US10108661B2 (en) Using synthetic events to identify complex relation lookups
JP7149976B2 (ja) 誤り訂正方法及び装置、コンピュータ読み取り可能な媒体
US11030402B2 (en) Dictionary expansion using neural language models
KR102046692B1 (ko) 다언어 특질 투영된 개체 공간 기반 개체 요약본 생성 방법 및 시스템
CN108304381B (zh) 基于人工智能的实体建边方法、装置、设备及存储介质
Medvet et al. Brand-related events detection, classification and summarization on twitter
CN114490923A (zh) 相似文本匹配模型的训练方法、装置、设备及存储介质
US10229156B2 (en) Using priority scores for iterative precision reduction in structured lookups for questions
US9547701B2 (en) Method of discovering and exploring feature knowledge
JP6902131B2 (ja) クエリ処理方法、クエリ処理装置及びコンピュータ読み取り可能な媒体
CN111222032A (zh) 舆情分析方法及相关设备
CN104750692B (zh) 一种信息处理方法、信息检索方法及其对应的装置
CN112989011B (zh) 数据查询方法、数据查询装置和电子设备
CN115098728A (zh) 视频检索方法及装置
US11379669B2 (en) Identifying ambiguity in semantic resources
CN112434174A (zh) 多媒体信息的发布账号的识别方法、装置、设备及介质
CN115795184B (zh) 一种基于rpa的场景化上车点推荐方法和装置
Oliveirinha et al. Semantics in Place and Time

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210202

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210426

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210615

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210618

R150 Certificate of patent or registration of utility model

Ref document number: 6902131

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250