JP2021099881A - テキストクエリ方法、装置、電子機器、記憶媒体及びコンピュータプログラム製品 - Google Patents

テキストクエリ方法、装置、電子機器、記憶媒体及びコンピュータプログラム製品 Download PDF

Info

Publication number
JP2021099881A
JP2021099881A JP2021044383A JP2021044383A JP2021099881A JP 2021099881 A JP2021099881 A JP 2021099881A JP 2021044383 A JP2021044383 A JP 2021044383A JP 2021044383 A JP2021044383 A JP 2021044383A JP 2021099881 A JP2021099881 A JP 2021099881A
Authority
JP
Japan
Prior art keywords
information
time
intention
query
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021044383A
Other languages
English (en)
Other versions
JP7163440B2 (ja
Inventor
暢 劉
Chang Liu
暢 劉
雙全 楊
Shuangquan Yang
雙全 楊
陽 張
Yang Zhang
陽 張
奕 謝
Yi Xie
奕 謝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Publication of JP2021099881A publication Critical patent/JP2021099881A/ja
Application granted granted Critical
Publication of JP7163440B2 publication Critical patent/JP7163440B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2477Temporal data queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90332Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition

Abstract

【課題】テキストクエリのクエリ効率を向上させることができるテキストクエリ方法、装置、機器及び記憶媒体を提供する。【解決手段】インテリジェント検索の技術分野において、テキストクエリ方法は、クエリテキストの意図を表す意図情報及び特徴情報を認識し、意図情報に基づいて、意図をクエリするためのクエリインタフェースを決定し、クエリインタフェースにより、意図に対応する情報において、特徴情報に合致するクエリ結果をクエリする。【選択図】図1

Description

本願は、コンピュータの技術分野におけるインテリジェント検索の技術分野に関し、特に、テキストクエリ方法、装置、機器及び記憶媒体に関する。
現在のテキストクエリ方法は、主にユーザによる手動クエリ方法であり、具体的には、ユーザは、ページや入力ボックスなどのコンポーネント内でクリック、ドラッグ、テキスト入力などの一連の操作を行わないと、対応するクエリ機能を見つけて、対応するクエリを行うことができない。そのため、現在、テキストクエリのクエリ効率が低い。
本願は、テキストクエリのクエリ効率が低いという問題を解決するために、テキストクエリ方法、装置、機器及び記憶媒体を提供する。
第1の態様に係るテキストクエリ方法は、
クエリテキストの、意図を表す意図情報及び特徴情報を認識することと、
意図情報に基づいて、前記意図をクエリするためのクエリインタフェースを決定することと、
前記クエリインタフェースにより、前記意図に対応する情報において、前記特徴情報に合致するクエリ結果をクエリすることとを含む。
第2の態様に係るテキストクエリ装置は、
クエリテキストの、意図を表す意図情報及び特徴情報を認識する認識モジュールと、
意図情報に基づいて、前記意図をクエリするためのクエリインタフェースを決定する決定モジュールと、
前記クエリインタフェースにより、前記意図に対応する情報において、前記特徴情報に合致するクエリ結果をクエリするクエリモジュールとを含む。
第3の態様に係る電子機器は、
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサと通信接続されたメモリとを含み、
前記メモリには、前記少なくとも1つのプロセッサによって実行可能で、前記少なくとも1つのプロセッサによって実行されると、前記少なくとも1つのプロセッサに本願に係るテキストクエリ方法を実行させることができる命令が記憶されていることを特徴とする。
第4の態様に係る非一時的なコンピュータ読み取り可能な記憶媒体には、本願に係るテキストクエリ方法をコンピュータに実行させるコンピュータ命令が記憶されていることを特徴とする。
本願に係る技術手段は、テキストクエリのクエリ効率を向上させる。
本部分で説明された内容は、本開示の実施例の主要又は重要な特徴を特定することを意図するものではなく、本開示の範囲を限定することを意図するものでもないことを理解されたい。本開示の他の特徴は、以下の明細書により容易に理解できる。
図面は、本解決手段をよりよく理解するためのものであり、本願を限定するものではない。
本願に係るテキストクエリ方法のフローチャートである。 本願に係る言語モデルの概略図である。 本願に係る時間情報解析の概略図である。 本願に係るテキストクエリ装置の構造図である。 本願の実施例に係るマルチメディアコンテンツの検索方法を実現するための電子機器のブロック図である。
以下、図面を参照しながら本願の例示的な実施例を説明し、理解を容易にするために、本願の実施例の様々な詳細を説明するが、これらが単なる例示的なものと見なされるべきである。したがって、当業者は、本願の範囲及び精神から逸脱することなく、ここで説明された実施例に対して様々な変更及び修正を行うことができることを理解すべきである。同様に、明確さと簡潔さのために、以下の説明では、公知の機能及び構造についての説明を省略する。
図1を参照すると、図1は、本願に係るテキストクエリ方法のフローチャートであり、図1に示すように、テキストクエリ方法は、以下のステップS101〜S103を含む。
ステップS101では、クエリテキストの、意図を表す意図情報及び特徴情報を認識する。
上記意図は、上記クエリテキストのクエリ意図を表すことができ、上記意図情報は、クエリテキストから抽出された意図情報であってよく、例えば、クエリテキストが「→先週の李四の旅行記録」である場合、意図情報は旅行、人、記録などの意図情報を含んでよく、或いは、例えば、クエリテキストが「先週の宿泊条件」である場合、意図情報は宿泊などの意図情報を含んでよい。さらに、上記意図情報は、クエリテキストから分析された意図情報を含んでもよく、例えば、クエリテキストが「先週の宿泊条件」である場合、該クエリテキストの意図情報がホテルを含んでよいと認識することができる。
上記特徴情報は、クエリテキストの時間、エンティティなどの情報を含んでよい。
また、上記クエリテキストは、フリーテキストクエリ語句、自然テキストクエリ語句、又はルールクエリ語句であってよい。
さらに、上記クエリテキストは、入力された音声を変換したテキストであってもよく、入力されたテキストであってもよい。
ステップS102では、意図情報に基づいて、上記意図をクエリするためのクエリインタフェースを決定する。
本願において、複数のクエリインタフェースを予め設定することができ、異なるクエリインタフェースは、異なる意図のクエリ結果をクエリするために用いられる。
本願におけるクエリインタフェースは、アプリケーションプログラミングインタフェース(Application Programming Interface,API)であってよい。
ステップS103では、上記クエリインタフェースにより、上記意図に対応する情報において、上記特徴情報に合致するクエリ結果をクエリする。
上記意図に対応する情報は、該意図に関連する情報であってよく、例えば、旅行意図を例として、該意図に対応する情報は、ルート、天気、フライト情報などの旅行関連の情報を含んでよい。
上記特徴情報に合致する上記クエリ結果は、上記意図に対応する情報と上記特徴情報から取得された情報、例えば、テキスト、ピクチャ、又はビデオなどの情報であってもよく、もちろん、これらの情報の組み合わせであってもよい。さらに、上記特徴情報は、上記インタフェースのクエリパラメータとしても理解することができる。
本願において、上記ステップにより、意図に対応するクエリ結果で特徴情報に合致するクエリ結果を直接クエリして、テキストクエリの効率を向上させることを実現することができる。
例えば、クエリテキストが、
「最近張三と同行した人」、
「先週の李四の旅行記録」、
「張のお父さんは誰ですか?」である場合、
クエリ結果は、具体的な記録情報、関係者の基本情報、関連記事の全文検索情報、関係マップ、行動軌跡などを含んでよい。
さらに、本願は、クエリテキストとの類似性スコアに応じてクエリ結果を順序付けることもできる。
なお、本願に係るテキストクエリ方法は、サーバ、コンピュータ、携帯電話などの電子機器に適用することができる。
好ましい実施形態として、上記特徴情報は、
エンティティ情報及び時間情報のうちの少なくとも一方を含む。
上記エンティティ情報は、上記クエリテキストのエンティティを表すことができ、これらのエンティティは、人物、イベント、場所、オブジェクト、ケースなどの種別のエンティティであってよい。
上記時間情報は、上記クエリテキストに対応する時間、例えば時点又は時間帯を表すことができる。
該実施形態では、上記意図に対応する情報において、エンティティ情報及び時間情報のうちの少なくとも一方に合致するクエリ結果をクエリすることで、クエリ結果の正確性を向上させることができる。
好ましくは、上記エンティティ情報は、言語モデルによって認識された上記クエリテキストのエンティティ情報である。
上記言語モデルは、深層学習ニューラルネットワークモデル、リカレントニューラルネットワークモデルであってよい。例えば、図2に示すネットワークモデルであってよいが、当然のことながら、図2は単なる例であり、本願では言語モデルは限定されない。
また、上記言語モデルは、深層学習又は条件付き確率場(crf)により構築された言語モデルであってよい。
深層学習により構築された言語モデルを例として、訓練プロセスにおいて、語句の各文字又は単語に対して対応ラベルを付けることができ、具体的には、シーケンスツーシーケンス(sequence to sequence)モデルを使用することができる。
長短期記憶ネットワーク(Long Short−Term Memory、LSTM)言語モデルを例として、教師ありコーパスを訓練する。
例えば、「先週の李四の旅行記録」について、先週−>「時間」、「李四」−>「名前」、「旅行」−>「行動タイプ」、記録−>「default」。
すると、この例は、教師ありラベル付きデータであり、LSTM言語モデルでは、単語分割後のコーパスに対して言語モデルを構築してもよく、単語分割を行わずにワードベクトルで言語モデルを構築してもよい。
条件付き確率場の方法の場合、単語分割後のコーパスを使用して言語モデルを構築することができる。
該実施形態では、言語モデルによりエンティティ情報を認識するため、エンティティ情報の正確性を向上させることができ、エンティティ情報を迅速に認識することもできる。
なお、本願において、言語モデルによりエンティティ情報を認識することに限定されず、他の方法でエンティティ情報を認識することもでき、例えば、意味認識技術により、クエリテキストのエンティティ情報を認識する。
好ましくは、上記時間情報は、時間記述情報から解析した時点情報、及び上記時点情報に基づいて上記時間記述情報から解析した時間帯情報のうちの少なくとも一方を含み、上記時間記述情報は、上記クエリテキストから抽出された時間記述情報である。
上記時点情報を解析することは、予め設定された時間粒度に基づいて解析することであってよく、時間粒度情報は、表1示すとおりである。
Figure 2021099881
上記時間帯情報は、上記時点情報に基づいて時点を決定し、そして時間記述情報のキーワード(例えば、から、までなど)に基づいて決定された具体的な時間帯情報であってよく、上記時間帯情報を解析することは、単一時点、同じタイプの2つの時点、又は異なるタイプの2つの時点などの方法で解析することであってよく、例えば、表2に示すとおりである。
Figure 2021099881
上記時間記述情報は、上記クエリテキストから抽出された時間関連情報であってよい。例えば、言語モデルによる抽出又は意味解析方法による抽出などであってよく、これは限定されない。
該実施形態では、時点情報及び時間帯情報のうちの少なくとも一方を解析して得ることができるため、時間情報の正確性を向上させることができ、さらに、クエリ結果の正確性を向上させることができる。
好ましくは、上記時点情報は、
上記時間記述情報を正規化して、時間正規化情報を取得し、
上記時間正規化情報に合致する時間解析ルールをクエリし、
上記時間正規化情報に合致する時間解析ルールが複数あれば、予め設定された衝突解決ポリシを用いてターゲット時間解析ルールを選択し、上記時間正規化情報を解析して、上記時点情報を取得し、上記時間正規化情報に合致する時間解析ルールが1つしかなければ、上記時間解析ルールを用いて上記正規化情報を解析して、上記時点情報を取得するという方法によって得られる。
上記時間記述情報を正規化して、時間正規化情報を取得することは、時間情報を同じタイプの時間情報に正規化することであってよく、例えば、大文字の時間情報を数字で表される時間情報に正規化する。
該実施形態では、複数の時間解析ルール、例えば、時間粒度の異なる時間解析ルールを予め設定することができ、当然のことながら、同一時間粒度に対して複数の時間解析ルールを設定することができるが、これは限定されない。また、異なる時間解析ルールから解析した時点情報のタイプは異なってよく、例えば、一部の時間解析ルールから年、月、日、時を解析することができるが、別の時間解析ルールから月、日、時などを解析することができる。
上記時間正規化情報に合致する時間解析ルールをクエリすることは、予め設定された複数の時間解析ルールにおいて、上記時間正規化情報を解析できる時間解析ルールをクエリすることであってよい。
上記時間正規化情報に合致する時間解析ルールが複数あれば、予め設定された衝突解決ポリシを用いてターゲット時間解析ルールを選択し、上記時間正規化情報を解析することは、複数の時間解析ルールにおいて、時間粒度の最も小さい時間解析ルールをターゲット時間解析ルールとして選択して解析することであってよく、当然のことながら、これは限定されず、例えば、時間粒度の2番目に小さい時間解析ルールをターゲット時間解析ルールとして選択して解析することもでき、具体的には、上記衝突解決ポリシを予め設定することができる。
該実施形態では、上記衝突解決ポリシによりターゲット時間解析ルールを選択して正規化情報を解析することで、時間情報が衝突して不正確になるという問題を解決することができる。
例えば、図3に示すように、時点情報及び時間帯情報について、時間記述抽出、正規化、ルール適合、衝突解決、時点解析、及び時間帯解析などのプロセスにより、正確な時間情報を取得することができる。
さらに、該実施形態では、時間記述情報を正規化するため、時間情報解析の正確性を向上させることができる。
好ましい実施形態として、上記意図情報は、マルチレベルの意図情報を含み、上記クエリインタフェースは、ターゲット意図情報が表すターゲット意図をクエリするためのクエリインタフェースであり、上記ターゲット意図情報は、上記マルチレベルの意図情報のうちのレベル1の意図情報であり、
上記クエリインタフェースにより、上記意図に対応する情報において、上記特徴情報に合致するクエリ結果をクエリすることは、
上記クエリインタフェースにより、上記ターゲット意図に対応するターゲット種別情報において、上記特徴情報に合致するクエリ結果をクエリすることを含み、上記ターゲット種別情報の情報種別は、他の意図情報が表す意図に合致し、かつ上記ターゲット種別情報は、上記ターゲット意図に対応する情報であり、上記他の意図情報は、上記マルチレベルの意図情報のうち、上記ターゲット意図情報以外の意図情報である。
上記マルチレベルの意図情報は、認識されるクエリテキストの意図、及び具体的な条件を表す。また、上記マルチレベルの意図情報は、3つのレベルの意図情報、例えば、
レベル1の意図種別:人、オブジェクト、記録など、
レベル2の意図種別:社会背景、関連関係など、
及び第3のレベル3の意図種別:旅行、宿泊などを含んでよい。
上記ターゲット意図情報は、旅行、宿泊、天気などのレベル3の意図であってよい。
さらに、同じ又は異なる方法で、異なるレベルの意図情報を認識することができ、例えば、svm/lstm言語モデルなどの言語モデルによりレベル1の意図情報を認識することができ、キーワド正規マッチング方法でレベル2/レベル3の意図を認識することができ、当然のことながら、これは限定されない。
上記ターゲット意図情報が旅行であり、他の意図情報が人及び社会背景を含む場合を例として、旅行に対応する情報において、情報種別が人、社会背景である関連情報をクエリすることができる。
該実施形態では、クエリインタフェースは内部インタフェースであってよく、これらの内部インタフェースは、drools又は他のルールファイルなどのルールファイル内で定義することができる。
上記ターゲット意図情報(例えば、レベル3の意図)の種別がある条件を満たすと、対応する内部インタフェースをトリガし、自動的に呼び出し、対応するクエリ結果をクエリする。
該実施形態では、対応する種別情報においてクエリするだけで、マルチレベルの意図情報を取得することができるため、テキストクエリの効率がさらに向上する。
次に、「旅行(chuxing)」種別のクエリルールを定義する。クエリテキスト(query)が、レベル1の意図が人であり、レベル3の意図が旅行であることを満たす場合に、指定された内部apiを実行する。クエリ要素(queryElement)は、エンティティ認識と時間解析結果を含む。このようにして、旅行という意図に対応するインタフェースを呼び出し、該インタフェースにより、旅行に対応する情報において、人という種別に合致し、かつ特徴情報に合致するクエリ結果をクエリする。
また、複数のクエリインタフェースが同時にトリガ及び実行される場合に、属性(例えば、salience属性)を設定することで優先度を指定することができる。
本願において、上記方法により、意図に対応するクエリ結果で特徴情報に合致するクエリ結果を直接クエリして、テキストクエリの効率を向上させることを実現することができる。
図4は、本願に係るテキストクエリ装置の構造図であり、図4に示すように、テキストクエリ装置400は、
クエリテキストの、意図を表す意図情報及び特徴情報を認識する認識モジュール401と、
意図情報に基づいて、上記意図をクエリするためのクエリインタフェースを決定する決定モジュール402と、
上記クエリインタフェースにより、上記意図に対応する情報において、上記特徴情報に合致するクエリ結果をクエリするクエリモジュール403とを含む。
好ましくは、上記特徴情報は、
エンティティ情報及び時間情報のうちの少なくとも一方を含む。
好ましくは、上記エンティティ情報は、言語モデルによって認識された上記クエリテキストのエンティティ情報であり、及び/又は
上記時間情報は、時間記述情報から解析した時点情報、及び上記時点情報に基づいて上記時間記述情報から解析した時間帯情報のうちの少なくとも一方を含み、上記時間記述情報は、上記クエリテキストから抽出された時間記述情報である。
好ましくは、上記時点情報は、
上記時間記述情報を正規化して、時間正規化情報を取得し、
上記時間正規化情報に合致する時間解析ルールをクエリし、
上記時間正規化情報に合致する時間解析ルールが複数あれば、予め設定された衝突解決ポリシを用いてターゲット時間解析ルールを選択し、上記時間正規化情報を解析して、上記時点情報を取得し、上記時間正規化情報に合致する時間解析ルールが1つしかなければ、上記時間解析ルールを用いて上記正規化情報を解析して、上記時点情報を取得するという方法によって得られる。
好ましくは、上記意図情報は、マルチレベルの意図情報を含み、上記クエリインタフェースは、ターゲット意図情報が表すターゲット意図をクエリするためのクエリインタフェースであり、上記ターゲット意図情報は、上記マルチレベルの意図情報のうちのレベル1の意図情報であり、
上記クエリモジュール403は、上記クエリインタフェースにより、上記ターゲット意図に対応するターゲット種別情報において、上記特徴情報に合致するクエリ結果をクエリし、上記ターゲット種別情報の情報種別は、他の意図情報が表す意図に合致し、かつ上記ターゲット種別情報は、上記ターゲット意図に対応する情報であり、上記他の意図情報は、上記マルチレベルの意図情報のうち、上記ターゲット意図情報以外の意図情報である。
本実施例に係る装置は、本願における方法の実施例において実現される各プロセスを実現することができ、かつ同様の有益な効果を達成することができ、重複を避けるために、ここでは説明を省略する。
本願の実施例によれば、本願は、電子機器と読み取り可能な記録媒体をさらに提供する。
図5に示すように、本願の実施例に係るテキストクエリ方法の電子機器のブロック図である。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、大型コンピュータ、その他の適切なコンピュータなどの、様々な形式のデジタルコンピュータを表すことを意図している。電子機器は、パーソナルデジタル処理、セルラー電話、スマートフォン、ウェアラブルデバイス、及びその他の類似するコンピューティングデバイスなどの、様々な形式のモバイルデバイスを表すこともできる。本明細書で示されるコンポーネントと、それらの接続及び関係と、それらの機能とは例示的なものに過ぎず、本明細書で説明及び/又は特許請求された本願の実施形態を制限することを意図しない。
図5に示すように、該電子機器は、1つ又は複数のプロセッサ501と、メモリ502と、高速インタフェース及び低速インタフェースを含む、各コンポーネントを接続するインタフェースとを含む。各コンポーネントは、異なるバスを介して相互に接続され、共通のマザーボードに取り付けられてもよく、必要に応じて他の方法で取り付けられてもよい。プロセッサは、メモリ内又はメモリに記憶されて、外部入力/出力装置(例えば、インタフェースに結合された表示装置)にGUIのグラフィック情報を表示する命令を含む、電子機器内で実行される命令を処理することができる。他の実施形態では、必要があれば、複数のプロセッサ及び/又は複数のバスを複数のメモリと共に使用することができる。同様に、複数の電子機器が接続されてよく、各機器は、(例えば、サーバアレイ、ブレードサーバのグループ、又はマルチプロセッサシステムとして)必要な操作の一部を提供する。図5では、1つのプロセッサ501を例とする。
メモリ502は、本願に係る非一時的なコンピュータ読み取り可能な記憶媒体である。上記メモリには、少なくとも1つのプロセッサによって実行されると、上記少なくとも1つのプロセッサに本願に係るテキストクエリ方法を実行させる命令が記憶されている。本願に係る非一時的なコンピュータ読み取り可能な記憶媒体には、コンピュータに本願に係るテキストクエリ方法を実行させるコンピュータ命令が記憶されている。
メモリ502は、非一時的なコンピュータ読み取り可能な記憶媒体として、非一時的ソフトウェアプログラム、非一時的なコンピュータ実行可能プログラム及びモジュール、例えば、本願の実施例におけるテキストクエリ方法に対応するプログラム命令/モジュール(例えば、図4に示す認識モジュール401、決定モジュール402及びクエリモジュール403)を記憶することができる。プロセッサ501は、メモリ502内に記憶された非一時的ソフトウェアプログラム、命令及びモジュールを実行することにより、サーバの各機能アプリケーション及びデータ処理を実行し、即ち、上記方法の実施例におけるテキストクエリ方法を実現する。
メモリ502は、オペレーティングシステム、少なくとも1つの機能に必要なアプリケーションを記憶できるプログラム記憶領域と、テキストクエリ方法を採用する電子機器の使用に基づいて作成されたデータなどを記憶できるデータ記憶領域とを含んでよい。さらに、メモリ502は、高速ランダムアクセスメモリを含んでもよく、少なくとも1つの磁気ディスク記憶装置、フラッシュメモリ装置、又は他の非一時的固体メモリ装置などの非一時的メモリを含んでもよい。いくつかの実施例では、メモリ502は、好ましくは、プロセッサ501に対して遠隔設置されたメモリを含んでよく、これらのリモートメモリは、ネットワークを介してテキストクエリ方法を採用する電子機器に接続することができる。上記ネットワークの例は、インターネット、企業イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク、及びそれらの組み合わせを含むが、これらに限定されない。
テキストクエリ方法を採用する電子機器は、入力装置503及び出力装置504をさらに含んでよい。プロセッサ501、メモリ502、入力装置503、及び出力装置504は、バス又は他の方法で接続することができ、図5では、バスによる接続を例とする。
入力装置503は、入力された数字又は文字情報を受信し、かつテキストクエリ方法を採用する電子機器のユーザ設定及び機能制御に関連するキー信号入力を生成することができ、入力装置は、例えば、タッチスクリーン、テンキー、マウス、トラックパッド、タッチパッド、ポインティングスティック、1つ又は複数のマウスボタン、トラックボール、ジョイスティックである。出力装置504は、表示装置、補助照明装置(例えば、LED)、触覚フィードバック装置(例えば、振動モータ)などを含んでよい。該表示装置は、液晶ディスプレイ(LDC)、発光ダイオード(LED)ディスプレイ、及びプラズマディスプレイを含んでよいが、これらに限定されない。いくつかの実施形態では、表示装置はタッチスクリーンであってよい。
本明細書で説明されたシステム及び技術の各実施形態は、デジタル電子回路システム、集積回路システム、専用ASIC(特定用途向け集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/又はそれらの組み合わせで実現することができる。これらの様々な実施形態は、1つ又は複数のコンピュータプログラムでの実施を含んでよく、該1つ又は複数のコンピュータプログラムは、少なくとも1つのプログラマブルプロセッサを含むプログラマブルシステム上で実行及び/又は解釈することでき、該プログラマブルプロセッサは、専用又は汎用のプログラマブルプロセッサであってよく、記憶システム、少なくとも1つの入力装置、及び少なくとも1つの出力装置からデータ及び命令を受信し、かつデータ及び命令を該記憶システム、該少なくとも1つの入力装置、及び該少なくとも1つの出力装置に送信することができる。
これらのコンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、又はコードとも呼ばれる)は、プログラマブルプロセッサの機械命令を含み、高水準手続き型プログラミング言語及び/又はオブジェクト指向のプログラミング言語、及び/又はアセンブリ言語/機械語によって実行することができる。本明細書で使用された用語「機械読み取り可能な媒体」及び「コンピュータ読み取り可能な媒体」は、機械命令及び/又はデータをプログラマブルプロセッサに提供する任意のコンピュータプログラム製品、機器、及び/又は装置(例えば、磁気ディスク、光ディスク、メモリ、プログラマブルロジックデバイス(PLD))を指し、機械読み取り可能な信号である機械命令を受信する機械読み取り可能な媒体を含む。用語「機械読み取り可能な信号」は、機械命令及び/又はデータをプログラマブルプロセッサに提供する任意の信号を指す。
ユーザとの対話を提供するために、本明細書で説明されたシステム及び技術をコンピュータ上で実行することができ、該コンピュータは、ユーザに情報を表示する表示装置(例えば、CRT(ブラウン管)又はLCD(液晶ディスプレイ)モニタ)と、キーボード及びポインティングデバイス(例えば、マウス又はトラックボール)とを有し、ユーザは、該キーボードと該ポインティングデバイスによりコンピュータに入力を提供することができる。他のタイプの装置も、ユーザとの対話を提供することができ、例えば、ユーザに提供されるフィードバックは、任意の形式の感覚フィードバック(例えば、視覚的フィードバック、聴覚的フィードバック、又は触覚的フィードバック)であってよく、また、任意の形式(音響入力、音声入力、又は触覚入力を含む)でユーザからの入力を受信することができる。
本明細書で説明されたシステム及び技術は、バックエンドコンポーネントを(例えば、データサーバとして)含むコンピューティングシステム、又はミドルウェアコンポーネント(例えば、アプリケーションサーバ)を含むコンピューティングシステム、又はフロントエンドコンポーネント(例えば、それを介して、ユーザが本明細書で説明されたシステム及び技術の実施形態と対話できるグラフィカルユーザインタフェース又はウェブブラウザを有するユーザコンピュータ)を含むコンピューティングシステム、又はこのようなバックエンドコンポーネント、ミドルウェアコンポーネント、若しくはフロントエンドコンポーネントの任意の組み合わせを含むコンピューティングシステムで実行することができる。任意の形式又は媒体のデジタルデータ通信(例えば、通信ネットワーク)を介してシステムのコンポーネントを相互に接続することができる。通信ネットワークの例は、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、及びインターネットを含む。
コンピュータシステムは、クライアントとサーバを含んでよい。クライアントとサーバは通常、互いに遠く離れ、かつ一般的には通信ネットワークを介して対話する。対応するコンピュータ上で実行し、相互にクライアント−サーバの関係を持つコンピュータプログラムによりクライアントとサーバの関係を生成する。
本願の実施例の技術手段によれば、意図に対応するクエリ結果で特徴情報に合致するクエリ結果を直接クエリして、テキストクエリの効率を向上させることを実現することができる。
上述した各形式のフローを使用して、ステップを並べ替え、追加、又は削除することができることを理解されたい。例えば、本願に開示されている技術手段の所望の結果を達成できる限り、本願に記載の各ステップは、並行して、順次、又は異なる順序で実行されてよいが、本明細書はこれを限定しない。
上記具体的な実施形態は、本願の保護範囲を限定するものではない。当業者は、設計要件及び他の要因に応じて、様々な修正、組み合わせ、部分組み合わせ及び置換を行うことができることを理解すべきである。本願の精神及び原則の範囲内で行われた修正、同等置換、及び改良などは、いずれも本願の保護範囲に含まれるべきである。

Claims (13)

  1. クエリテキストの、意図を表す意図情報及び特徴情報を認識することと、
    意図情報に基づいて、前記意図をクエリするためのクエリインタフェースを決定することと、
    前記クエリインタフェースにより、前記意図に対応する情報において、前記特徴情報に合致するクエリ結果をクエリすることとを含むことを特徴とする、テキストクエリ方法。
  2. 前記特徴情報は、
    エンティティ情報及び時間情報のうちの少なくとも一方を含むことを特徴とする、請求項1に記載の方法。
  3. 前記エンティティ情報は、言語モデルによって認識された前記クエリテキストのエンティティ情報であり、及び/又は
    前記時間情報は、時間記述情報から解析した時点情報、及び前記時点情報に基づいて前記時間記述情報から解析した時間帯情報のうちの少なくとも一方を含み、前記時間記述情報は、前記クエリテキストから抽出された時間記述情報であることを特徴とする、請求項2に記載の方法。
  4. 前記時点情報は、
    前記時間記述情報を正規化して、時間正規化情報を取得し、
    前記時間正規化情報に合致する時間解析ルールをクエリし、
    前記時間正規化情報に合致する時間解析ルールが複数あれば、予め設定された衝突解決ポリシを用いてターゲット時間解析ルールを選択し、前記時間正規化情報を解析して、前記時点情報を取得し、前記時間正規化情報に合致する時間解析ルールが1つしかなければ、前記時間解析ルールを用いて前記時間正規化情報を解析して、前記時点情報を取得するという方法によって得られることを特徴とする、請求項3に記載の方法。
  5. 前記意図情報は、マルチレベルの意図情報を含み、前記クエリインタフェースは、ターゲット意図情報が表すターゲット意図をクエリするためのクエリインタフェースであり、前記ターゲット意図情報は、前記マルチレベルの意図情報のうちのレベル1の意図情報であり、
    前記クエリインタフェースにより、前記意図に対応する情報において、前記特徴情報に合致するクエリ結果をクエリすることは、
    前記クエリインタフェースにより、前記ターゲット意図に対応するターゲット種別情報において、前記特徴情報に合致するクエリ結果をクエリすることを含み、前記ターゲット種別情報の情報種別は、他の意図情報が表す意図に合致し、かつ前記ターゲット種別情報は、前記ターゲット意図に対応する情報であり、前記他の意図情報は、前記マルチレベルの意図情報のうち、前記ターゲット意図情報以外の意図情報であることを特徴とする、請求項1に記載の方法。
  6. クエリテキストの、意図を表す意図情報及び特徴情報を認識する認識モジュールと、
    意図情報に基づいて、前記意図をクエリするためのクエリインタフェースを決定する決定モジュールと、
    前記クエリインタフェースにより、前記意図に対応する情報において、前記特徴情報に合致するクエリ結果をクエリするクエリモジュールとを含むことを特徴とする、テキストクエリ装置。
  7. 前記特徴情報は、
    エンティティ情報及び時間情報のうちの少なくとも一方を含むことを特徴とする、請求項6に記載の装置。
  8. 前記エンティティ情報は、言語モデルによって認識された前記クエリテキストのエンティティ情報であり、及び/又は
    前記時間情報は、時間記述情報から解析した時点情報、及び前記時点情報に基づいて前記時間記述情報から解析した時間帯情報のうちの少なくとも一方を含み、前記時間記述情報は、前記クエリテキストから抽出された時間記述情報であることを特徴とする、請求項7に記載の装置。
  9. 前記時点情報は、
    前記時間記述情報を正規化して、時間正規化情報を取得し、
    前記時間正規化情報に合致する時間解析ルールをクエリし、
    前記時間正規化情報に合致する時間解析ルールが複数あれば、予め設定された衝突解決ポリシを用いてターゲット時間解析ルールを選択し、前記時間正規化情報を解析して、前記時点情報を取得し、前記時間正規化情報に合致する時間解析ルールが1つしかなければ、前記時間解析ルールを用いて前記時間正規化情報を解析して、前記時点情報を取得するという方法によって得られることを特徴とする、請求項8に記載の装置。
  10. 前記意図情報は、マルチレベルの意図情報を含み、前記クエリインタフェースは、ターゲット意図情報が表すターゲット意図をクエリするためのクエリインタフェースであり、前記ターゲット意図情報は、前記マルチレベルの意図情報のうちのレベル1の意図情報であり、
    前記クエリモジュールは、前記クエリインタフェースにより、前記ターゲット意図に対応するターゲット種別情報において、前記特徴情報に合致するクエリ結果をクエリし、前記ターゲット種別情報の情報種別は、他の意図情報が表す意図に合致し、かつ前記ターゲット種別情報は、前記ターゲット意図に対応する情報であり、前記他の意図情報は、前記マルチレベルの意図情報のうち、前記ターゲット意図情報以外の意図情報であることを特徴とする、請求項6に記載の装置。
  11. 少なくとも1つのプロセッサと、
    前記少なくとも1つのプロセッサと通信接続されたメモリとを含み、
    前記メモリには、前記少なくとも1つのプロセッサによって実行可能で、前記少なくとも1つのプロセッサによって実行されると、前記少なくとも1つのプロセッサに請求項1〜5のいずれか1項に記載の方法を実行させることができる命令が記憶されていることを特徴とする、電子機器。
  12. コンピュータに請求項1〜5のいずれか1項に記載の方法を実行させるコンピュータ命令が記憶されていることを特徴とする、非一時的なコンピュータ読み取り可能な記憶媒体。
  13. コンピュータプログラムを含むコンピュータプログラム製品であって、
    前記コンピュータプログラムがプロセッサにより実行されると、請求項1〜5のいずれか1項に記載の方法が実現される、ことを特徴とするコンピュータプログラム製品。
JP2021044383A 2020-04-27 2021-03-18 テキストクエリ方法、装置、電子機器、記憶媒体及びコンピュータプログラム製品 Active JP7163440B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010343782.4A CN111538815B (zh) 2020-04-27 2020-04-27 一种文本查询方法、装置、设备及存储介质
CN202010343782.4 2020-04-27

Publications (2)

Publication Number Publication Date
JP2021099881A true JP2021099881A (ja) 2021-07-01
JP7163440B2 JP7163440B2 (ja) 2022-10-31

Family

ID=71977348

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021044383A Active JP7163440B2 (ja) 2020-04-27 2021-03-18 テキストクエリ方法、装置、電子機器、記憶媒体及びコンピュータプログラム製品

Country Status (5)

Country Link
US (1) US20210209112A1 (ja)
EP (1) EP3832486A3 (ja)
JP (1) JP7163440B2 (ja)
KR (1) KR20210038471A (ja)
CN (1) CN111538815B (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114610914A (zh) * 2022-03-11 2022-06-10 北京百度网讯科技有限公司 一种信息处理方法、装置及电子设备
CN116150409B (zh) * 2023-04-10 2023-06-23 中科雨辰科技有限公司 一种文本时间序列获取方法、电子设备及存储介质
CN117370493A (zh) * 2023-09-22 2024-01-09 中国司法大数据研究院有限公司 一种基于大语言模型的系统智能交互方法与装置
CN117093696B (zh) * 2023-10-16 2024-02-02 浙江同花顺智能科技有限公司 一种大语言模型的提问文本生成方法、装置、设备及介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009176302A (ja) * 2008-01-23 2009-08-06 Palo Alto Research Center Inc 推薦システム用の時間情報および場所情報の言語抽出
JP2010277312A (ja) * 2009-05-28 2010-12-09 Internatl Business Mach Corp <Ibm> 日程調整支援装置、方法、およびプログラム
US20150286747A1 (en) * 2014-04-02 2015-10-08 Microsoft Corporation Entity and attribute resolution in conversational applications
JP2018530026A (ja) * 2015-07-24 2018-10-11 フェイスブック,インク. メッセージングによるパーソナル・アシスタント・サービスの提供
JP2019109730A (ja) * 2017-12-19 2019-07-04 日本電気株式会社 情報処理装置、ハザードマップ生成方法およびプログラム
JP2019212266A (ja) * 2018-06-03 2019-12-12 アップル インコーポレイテッドApple Inc. 促進されたタスク実行

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103369520B (zh) * 2012-03-27 2016-12-14 百度在线网络技术(北京)有限公司 移动终端的应用程序可疑行为的意图预判系统及方法
CN105122240A (zh) * 2013-03-14 2015-12-02 微软技术许可有限责任公司 针对嵌入式应用上下文中的搜索的查询意图表达
CN103440242A (zh) * 2013-06-26 2013-12-11 北京亿赞普网络技术有限公司 一种基于用户搜索行为的个性化推荐方法和系统
US10579652B2 (en) * 2014-06-17 2020-03-03 Microsoft Technology Licensing, Llc Learning and using contextual content retrieval rules for query disambiguation
US10210201B2 (en) * 2016-05-13 2019-02-19 TCL Research America Inc. Method and system for App page recommendation via inference of implicit intent in a user query
US20190294731A1 (en) * 2018-03-26 2019-09-26 Microsoft Technology Licensing, Llc Search query dispatcher using machine learning
CN110008413B (zh) * 2019-03-14 2023-11-10 海信集团有限公司 一种交通出行问题查询方法和装置
CN110795528B (zh) * 2019-09-05 2023-10-13 腾讯科技(深圳)有限公司 一种数据查询方法、装置、电子设备及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009176302A (ja) * 2008-01-23 2009-08-06 Palo Alto Research Center Inc 推薦システム用の時間情報および場所情報の言語抽出
JP2010277312A (ja) * 2009-05-28 2010-12-09 Internatl Business Mach Corp <Ibm> 日程調整支援装置、方法、およびプログラム
US20150286747A1 (en) * 2014-04-02 2015-10-08 Microsoft Corporation Entity and attribute resolution in conversational applications
JP2018530026A (ja) * 2015-07-24 2018-10-11 フェイスブック,インク. メッセージングによるパーソナル・アシスタント・サービスの提供
JP2019109730A (ja) * 2017-12-19 2019-07-04 日本電気株式会社 情報処理装置、ハザードマップ生成方法およびプログラム
JP2019212266A (ja) * 2018-06-03 2019-12-12 アップル インコーポレイテッドApple Inc. 促進されたタスク実行

Also Published As

Publication number Publication date
US20210209112A1 (en) 2021-07-08
CN111538815B (zh) 2023-09-22
KR20210038471A (ko) 2021-04-07
EP3832486A3 (en) 2021-10-06
CN111538815A (zh) 2020-08-14
EP3832486A2 (en) 2021-06-09
JP7163440B2 (ja) 2022-10-31

Similar Documents

Publication Publication Date Title
CN112507715B (zh) 确定实体之间关联关系的方法、装置、设备和存储介质
US11663258B2 (en) Method and apparatus for processing dataset
CN105408890B (zh) 基于声音输入执行与列表数据有关的操作
JP2021099881A (ja) テキストクエリ方法、装置、電子機器、記憶媒体及びコンピュータプログラム製品
CN112507068B (zh) 文档查询方法、装置、电子设备和存储介质
US20210200813A1 (en) Human-machine interaction method, electronic device, and storage medium
JP2021166098A (ja) 検索語の推薦方法と装置、目的モデルの訓練方法と装置、電子デバイス、記憶媒体、及びプログラム
CN111611468B (zh) 页面交互方法、装置和电子设备
JP2021131528A (ja) ユーザ意図認識方法、装置、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラム
US20220129448A1 (en) Intelligent dialogue method and apparatus, and storage medium
AU2017216520A1 (en) Common data repository for improving transactional efficiencies of user interactions with a computing device
CN110569370B (zh) 一种知识图谱的构建方法、装置、电子设备及存储介质
WO2022095892A1 (zh) 推送信息的生成方法、装置
CN111324771A (zh) 视频标签的确定方法、装置、电子设备及存储介质
US11704326B2 (en) Generalization processing method, apparatus, device and computer storage medium
CN111984774B (zh) 搜索方法、装置、设备以及存储介质
CN111966781B (zh) 数据查询的交互方法及装置、电子设备和存储介质
US20210216713A1 (en) Method, apparatus, device and storage medium for intelligent response
CN114116997A (zh) 知识问答方法、装置、电子设备及存储介质
US11468236B2 (en) Method and apparatus for performing word segmentation on text, device, and medium
CN112989011B (zh) 数据查询方法、数据查询装置和电子设备
CN111339319A (zh) 一种企业名的消歧方法、装置、电子设备及存储介质
CN113971216B (zh) 数据处理方法、装置、电子设备和存储器
CN113535958B (zh) 生产线索聚合方法、装置及系统、电子设备和介质
CN112307134B (zh) 实体信息处理方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210318

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220125

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220422

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220607

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220902

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221004

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221019

R150 Certificate of patent or registration of utility model

Ref document number: 7163440

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150