JP7293544B2 - 質問回答システムの更新処理方法及び装置 - Google Patents

質問回答システムの更新処理方法及び装置 Download PDF

Info

Publication number
JP7293544B2
JP7293544B2 JP2021193609A JP2021193609A JP7293544B2 JP 7293544 B2 JP7293544 B2 JP 7293544B2 JP 2021193609 A JP2021193609 A JP 2021193609A JP 2021193609 A JP2021193609 A JP 2021193609A JP 7293544 B2 JP7293544 B2 JP 7293544B2
Authority
JP
Japan
Prior art keywords
question
answer
block
blocks
updated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021193609A
Other languages
English (en)
Other versions
JP2022097397A (ja
Inventor
グ、グイユアン
ジャオ、ゼンユ
スン、シューチ
チャン、ユエ
リ、ティンティン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Publication of JP2022097397A publication Critical patent/JP2022097397A/ja
Application granted granted Critical
Publication of JP7293544B2 publication Critical patent/JP7293544B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3338Query expansion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Description

本開示はコンピュータ応用技術分野に関し、特に人工知能技術分野におけるビッグデータ及び自然言語処理技術に関する。
迅速かつ正確に情報を入手するというユーザのニーズを満たすために、質問回答システム(QAS、Question Answering System)の研究が盛んになってくる。QASは情報検索システムの高度な形式であり、ユーザが自然言語で質問したことに正確かつ間接的な自然言語で回答することができる。そのうち、よくある質問回答(FAQ、Frequently Asked Questions)は、現在のネットワーク上でオンラインヘルプを提供する主要な手段であり、事前に整理された良くあるQ&Aペアによりユーザにサービスを提供する。
FAQ質問回答システムでは、ユーザが質問を入力すると、類似度マッチングによりあらかじめ配置された質問回答セットにおけるユーザが入力した質問に適合する質問に対応する回答が特定される。上記の類似度マッチングの過程では、ユーザが入力した質問の特徴と質問回答セットにおける各質問の特徴を取得する必要がある。上記の応答過程を高速化するために、FAQ質問回答システムは、質問回答セットにおける各問題に対してあらかじめ訓練を行って各問題の特徴を得ておき、訓練により得られた各問題の特徴を用いてjson文書の形式でインデックスファイルを作成する。
しかし、実際の応用において、FAQ質問回答システムの質問回答セットは、実際のビジネスニーズに合わせて更新されている。質問回答セットの規模が大きい場合は、更新のたびにインデックスファイル全体をロードし、上流から各問題の特徴を取得してインデックスファイル全体を更新する必要があるため、プロセス全体に時間がかかり、リソースの占有が大きい。
これに鑑みて、本開示は、更新プロセスの時間及びリソース占有を低減する質問回答システムの更新処理方法及び装置を提供する。
第1の態様では、本開示は、更新された質問回答セットを取得し、更新された質問回答セットと元の質問回答セットの各ブロックを質問回答ペアで比較し、変化なしのブロックと変化ありのブロックを特定し、変化ありのブロックに含まれる各問題の特徴データを取得し、当該ブロックに対応するインデックスファイルを作成し、前記特徴データを更新された訓練アウトプットセットに追加し、変化なしのブロックに対応するインデックスファイル及び特徴データを保持し、前記特徴データを更新された訓練アウトプットセットに追加することを含む質問回答システムの更新処理方法を提供する。
第2の態様では、本開示は、更新された質問回答セットを取得する更新取得モジュールと、更新された質問回答セットと元の質問回答セットの各ブロックを質問回答ペアで比較し、変化なしのブロックと変化ありのブロックを特定するブロック処理モジュールと、変化ありのブロックに含まれる各問題の特徴データを取得し、当該ブロックに対応するインデックスファイルを作成し、前記特徴データを更新された訓練アウトプットセットに追加する更新処理モジュールと、変化なしのブロックに対応するインデックスファイルと特徴データを保持し、前記特徴データを更新された訓練アウトプットセットに追加する多重化処理モジュールとを備える質問回答システムの更新処理装置を提供する。
第3の態様では、本開示は、少なくとも1つのプロセッサと、前記少なくとも1つのプロセッサと通信接続されたメモリとを備え、前記メモリに前記少なくとも1つのプロセッサにより実行可能なコマンドが記憶されており、前記コマンドが前記少なくとも1つのプロセッサにより実行されると、前記少なくとも1つのプロセッサに上述の方法を実行させる電子デバイスを提供する。
第4の態様では、本開示は、コンピュータに上記の方法を実行させるためのコンピュータコマンドを記憶した非一時的なコンピュータ可読記憶媒体を提供する。
第5の態様では、本開示は、プロセッサにより実行されるときに上述の方法を実現するコンピュータプログラムを含むコンピュータプログラム製品を提供する。
以上の技術案からわかるように、ブロック化の方式により、質問回答セットが更新されるたびに、変化ありのブロックに対応する質問回答ペアの特徴データを取得し、そのブロックに対応するインデックスファイルを更新すればよく、変化なしのブロックについてはインデックスファイルと特徴データを直接多重化することで、時間とリソースの占有を削減することができる。
上記のオプション方法が有する他の効果は、以下で特定の実施形態と合わせて説明する。
図面は、本技術案をより良く理解するためのものであり、本願に制限されない。
本開示の実施形態を適用可能な例示的なシステムアーキテクチャを示す。 本開示の実施形態により提供される主要な方法のフローチャートである。 本開示の実施形態により提供される別の方法のフローチャートである。 本開示の実施形態により提供されるステップ202の好ましい方法のフローチャートである。 本開示の実施形態により提供される装置構成図である。 本開示の実施形態により提供される方法を実施可能な電子デバイスのブロック図である。
以下、図面に基づいて、本開示の例示的な実施例を説明する。理解を容易にするために、本開示の実施例の様々な詳細が含まれており、それらは単なる例示と見なされるべきである。従って、当業者は、本開示の範囲及び精神から逸脱することなく、本明細書に記載の実施形態に対して様々な変更及び修正を行うことができることを認識するはずである。同様に、簡明のために、以下の説明では、よく知られた機能と構造の説明は省略される。
図1は、本開示の実施形態を適用可能な質問回答システムの更新処理方法又は質問回答システムの更新処理装置の例示的なシステムアーキテクチャを示した。
図1に示すように、当該システムアーキテクチャは、端末装置101、102、ネットワーク103及びサーバ104を含むことができる。ネットワーク103は、端末装置101、102とサーバ104との間に通信リンクの媒体を提供する。ネットワーク103は、例えば有線、無線通信リンク、又は光ファイバケーブルなどの様々な接続タイプを含むことができる。
ユーザは、端末装置101、102を用いて、ネットワーク103を介してサーバ104とインタラクションを行うことができる。端末装置101、102には、例えばウェブブラウザアプリケーション、通信系アプリケーション、音声インタラクションアプリケーション、マルチメディア再生系など、様々なアプリケーションがインストールされてよい。
端末装置101及び102は、様々な電子デバイスであってよく、スクリーン付きデバイスであってもよく、スクリーンなしデバイスであってもよい。そのうち、スマートフォン、タブレット、スマートスピーカー、スマートテレビ、PC(Personal Computer、パーソナルコンピュータ)などが含まれるが、これらに限定されない。本開示により提供される質問回答システムの更新処理装置は、上述したサーバ104に設定して動作可能である。これは、複数のソフトウェア又はソフトウェアモジュール(例えば、分散サービスを提供するために)として実現されてもよく、単一のソフトウェア又はソフトウェアモジュールとして実現されてもよいが、ここで特に限定されない。
例えば、質問回答システムの更新処理装置が上述したサーバ104に設定して動作される場合に、質問回答システムの更新処理装置は、本開示の実施形態で提供される方式を用いて質問回答システムの更新処理を行う。ユーザが端末装置101を介して質問を送信すると、サーバ104は、質問回答システムにおいてこの質問に対応する回答を特定し、回答を端末装置101に返送することができる。
サーバ104は、単一のサーバであってもよく、複数のサーバからなるサーバ群であってもよい。上述した質問回答システムは、サーバ104に設けられていてもよく、サーバ104とは別のサーバ側に設けられていてもよい。理解すべきなのは、図1における端末装置、ネットワーク、及びサーバの数は、単なる概略的なものである。実現の必要に応じて、任意の数の端末装置、ネットワーク、及びサーバを有することができる。
図2は、本開示の実施形態により提供される主な方法のフローチャートである。図2に示されるように、当該方法は以下のステップを含むことができる。
201では、更新された質問回答セットを取得する。
質問回答コレクションは実際の業務ニーズに応じて更新されるため、本ステップでは更新された質問回答セットを取得する。更新された質問回答セットの取得は、周期的な取得であってもよく、例えば管理者の要求イベントに基づいてトリガされるように、特定のイベントに基づいてトリガされる取得であってもよい。
202では、更新された質問回答セットと元の質問回答セットの各ブロックの質問回答ペアの比較を行い、変化なしのブロックと変化ありのブロックとを特定する。
本開示の実施形態では、質問回答セット全体がブロック化され、すなわち、質問回答ペアを含む複数のデータブロックに分割される。更新された質問回答セットを取得した後、更新された質問回答セットと元の質問回答セットの各ブロックに対して質問回答ペアを比較することにより、変化なしのブロックと変化ありのブロックとを特定する。ここで、変化なしのブロックとは、ブロック中のすべての質問回答ペアが更新されていないことを意味する。変化ありのブロックとは、ブロック中に更新された質問回答ペアが存在したり、新たにブロックが作成されたりすることである。様々なタイプのブロックを特定する方法については、後続の実施形態で詳細に説明する。
203では、変化ありのブロックに含まれる各質問の特徴データを取得し、当該ブロックに対応するインデックスファイルを作成し、当該特徴データを更新された訓練アウトプットセットに追加する。
204では、変化なしのブロックに対応するインデックスファイル及び特徴データを保持し、前記特徴データを更新された訓練アウトプットセットに追加する。
質問回答システムは、質問マッチングを行う過程で各質問の特徴データに基づいて質問間の類似度を計算することにより、質問の初期スクリーニングと判定を行う必要がある。質問マッチングのプロセスを迅速化するために、上流の機能モジュールは、通常に予め訓練して各質問の特性データを取得し、質問回答システムは、後続の質問マッチングプロセスで直接に使用するために、各質問の特性データを訓練アウトプットセットに追加する。
ここで、各質問の特徴データは、通常に各質問に対してトークン化処理を行って得られるトークンや各トークンの重みなどの情報から得られる。具体的な訓練方式は現在すでに成熟している技術を採用することができるが、ここでは言及しない。
変化なしのブロックについては、対応するインデックスファイルと特徴データを保持しておき、各質問回答ペアに対応する特徴データを上流から再度取得する必要がなく、直接に多重化すれば良く、即ち更新された訓練アウトプットセットに直接に加える。一方、変化ありのブロックについては、変化ありのブロックに含まれる質問回答ペアの特徴データを上流から取得し、そのブロックに対応するインデックスファイルを新たに作成し、その特徴データを更新された訓練アウトプットセットに加える必要がある。
このように、上述した実施形態では、ブロック化の方式により、質問回答セットが更新されるたびに、変化ありのブロックに対応する質問回答ペアの特徴データを取得し、そのブロックに対応するインデックスファイルを更新すればよく、変化なしのブロックについてはインデックスファイルと特徴データを直接に多重化することで、時間とリソースの占有を削減することができる。
さらに、上記のステップ202の比較を経て、削除する必要があるブロックを特定することも可能であり、すなわち、あるブロック内のすべての質問回答ペアが更新された質問回答セットに存在しない場合、そのブロックは削除する必要があるブロックである。この時点で、図3に示すように、ステップ105をさらに実行し、当該ブロック、当該ブロックに対応するバインディング関係、及びインデックスファイルを削除する必要がある。
以下では、上記202における「更新された質問回答セットと、元の質問回答セットの各ブロックについて質問回答ペアの比較を行って変化なしのブロックと変化ありのブロックとを特定する」ことの実現方式について、実施形態に合わせて詳細に説明する。
最初に特定された質問回答セットについては、当該一部の質問回答セットをブロック化し、予め設定された数の質問回答ペアを1つのブロックに割り当てる。ブロック化の根拠は、ランダムブロック化、一定の順序によるブロック化、又は共通の属性によるブロック化等であってもよいが、本開示ではこれを限定しない。
各ブロックにはブロックIDが関連付けられる。ブロックにおける各質問に対応する特徴データを上流から取得した後、ブロックに対してインデックスファイルを作成する。当該インデックスファイルに各質問回答ペアの標識が含まれている。この標識は、質問回答ペアを一意に識別することができ、通常に質問回答ペアの内容に基づいて生成される。例えば、情報ダイジェストアルゴリズムによって処理されて得られる情報ダイジェスト値、例えばMD5値を用いることができる。MD5値などを用いることにより、内容に基づいて質問回答ペアを一意に識別することができる。質問回答ペアの内容が変更されない限り、MD5値は変更されず、質問回答ペアの内容が変更された場合、MD5値も変更される。これにより、変化ありの質問回答ペアと変化なしの質問回答ペアを迅速に特定することができる。
さらに、各ブロックIDとブロックに含まれる質問回答ペアのMD5値とのバインディング関係を構築する。このバインディング関係により、質問回答ペアのMD5値から、その質問回答ペアが所在するブロックを迅速に特定することができる。当該バインディング関係はファイルとして保存できる。
好ましい実施形態として、更新された質問回答セットを取得した後、上記のステップ202の実施プロセスは、図4に示すように以下のステップを含んで良い。
401では、更新された質問回答セットから質問回答ペアを読み込む。
本ステップでは、更新後の質問回答セットから未読の質問回答ペアを1つずつ読み出して次のステップを実行することで、更新後の質問回答セットと元の質問回答セットの各ブロックの比較を実現する。
402では、読み取られた質問回答ペアのMD5値に基づいて、元の質問回答セットに読み取られた質問回答ペアのMD5値と一致する質問回答ペアが存在するか否かを検索し、肯定の場合に403を実行し、否定の場合に405を実行する。
元の質問回答セットはすべての質問回答ペアに対してMD5値及びMD5値とブロックとのバインディング関係を生成するため、MD5値の照合により、更新後の質問回答セットから読み取られた質問回答ペアが元の質問回答セットに存在しているか、具体的にどのブロックに存在しているかを迅速に特定することができる。
403では、当該MD5値にバインドされたブロックIDを特定し、当該質問回答ペアについてバインドされたブロックにおいて変化なしと標識する。
404では、更新された質問回答セットに未読の質問回答ペアが存在するか否かを判断し、存在する場合に401に進み、更新された質問回答セットからの質問回答ペアの読み込みを継続する。否定の場合に、ステップ406を実行する。
ステップ405では、当該質問回答ペアを新規のブロックに割り当て、ステップ404を実行する。
ブロックを新規に作成した場合でも、一つのブロックに予め設定された数の質問回答ペアが格納されることが保証される。一つのブロックに予め設定された数の質問回答ペアが含まれている場合には、新たにブロックを作成して質問回答ペアを格納し続ける。
406では、変化ありのブロック、変化なしのブロック、削除が必要なブロックが特定される。
標識なしの質問回答ペアがブロック内に存在している場合に、これらの質問回答ペアが更新された質問回答セットに存在しないことを意味し、ブロック内のこれらの質問回答ペアを削除する。
1つのブロック内のすべての質問回答ペアに変化がなければ、そのブロックを変化なしのブロックとして特定する。
一つのブロック内の一部の質問回答ペアが削除された場合には、そのブロックを変化ありのブロックとして特定する。また、新たに作成したブロックについても変化ありのブロックとして特定する。
一つのブロック内のすべての質問回答ペアが削除された場合は、そのブロックを削除すべきブロックとして特定する。
図4に示す手順を経て、変化ありのブロック、変化なしのブロック、削除が必要なブロックの3種類のブロックを特定することができる。
変化なしのブロックについては、そのブロックのインデックスファイルやバインディング関係などを直接に保持し、当該ブロックにおける各質問の特徴データを多重化し、これらの特徴データを更新された訓練アウトプットセットに直接に追加することができる。
変化ありのブロックについては、そのブロックに対して質問回答ペアのMD5値とブロックIDとのバインディング関係を新たに生成し、そのブロックに含まれる各質問回答ペアの特徴データを上流から取得し、取得された特徴データを更新後の訓練アウトプットセットに追加し、そのブロックに対してインデックスファイルを再作成する。
削除する必要があるブロックについては、当該ブロック、ブロックID、当該ブロックIDのバインディング関係、当該ブロックのインデックスファイルを削除する。
以上の処理を経て得られた訓練アウトプットセットは、更新された質問回答セットに対応する訓練アウトプットセットであり、更新された質問回答セットの各質問に対応する特徴データが主に含まれている。その後の実際の応用、すなわち質問回答システムの質問マッチング過程において、訓練アウトプットセットにおける質問の特徴データに基づいて実現される。
以上は、本開示で提供される方法の詳細な説明であり、以下に実施形態に合わせて本開示で提供される装置を詳細に説明する。
図5は本開示の実施形態により提供される装置構成図である。この装置は、サーバ側のアプリケーションに配置されていてもよく、サーバ側のアプリケーションに配置されたプラグインやソフトウェア開発キット(Software Development Kit、SDK)などの機能ユニットであってもよく、より高い計算能力を有するコンピュータ端末に配置されていてもよいが、本開示の実施形態ではこれを特に限定しない。図5に示すように、当該装置は、更新取得モジュール00と、ブロック処理モジュール10と、更新処理モジュール20と、多重化処理モジュール30とを備え、さらに削除処理モジュール40を備えてよい。これらの各構成ユニットの主な機能は次のとおりである。
更新取得モジュール00は、更新された質問回答セットを取得する。
更新された質問回答セットの取得は、周期的な取得であってもよく、管理者の要求イベントに基づいてトリガされるように特定のイベントに基づいてトリガされる取得であってもよい。
ブロック処理モジュール10は、更新された質問回答セットと元の質問回答セットの各ブロックについて質問回答ペアの比較を行って変化なしのブロックと変化ありのブロックとを特定する。
更新処理モジュール20は、変化ありのブロックに含まれる各質問の特徴データを取得し、そのブロックに対応するインデックスファイルを作成し、特徴データを更新された訓練アウトプットセットに追加する。
多重化処理モジュール30は、変化なしのブロックに対応するインデックスファイルと特徴データとを保持し、特徴データを更新された訓練アウトプットセットに追加する。
このうち、各ブロックの標識は、ブロックに含まれる質問回答ペアの標識とバインディング関係にある。好ましい実施形態として、質問回答ペアの標識は、質問回答ペアに対して情報ダイジェストアルゴリズム処理を行って得られる情報ダイジェスト値、例えばMD5値を含むことができる。
好適な実施形態として、ブロック処理モジュール10は、具体的に、比較サブモジュール11、標識サブモジュール12、ブロックサブモジュール13、及び特定サブモジュール14を含むことができる。
このうち、比較サブモジュール11は、更新された質問回答セットに含まれる各質問回答ペアの標識に基づいて、元の質問回答セットに当該標識と一致する質問回答ペアが存在するか否かを検索し、当該標識と一致する質問回答ペアとバインディングされたブロックの標識を特定する。
標識サブモジュール12は、比較サブモジュール11が元の質問回答セットで標識が一致する質問回答ペアを検索した場合、その質問回答ペアをバインディングされたブロック内で変化なしと標識する。
ブロックサブモジュール13は、比較サブモジュール11が元の質問回答セットで標識が一致する質問回答ペアを見つけられなかった場合、その質問回答ペアを新たに作成したブロックに割り当てる。
特定サブモジュール14は、比較サブモジュール11による更新された質問回答セットに含まれる各質問回答ペアについての検索が全て終了した後、ブロック内のすべての質問回答ペアが変化していない場合、当該ブロックを変化なしのブロックとして特定し、ブロック内の未標識の質問回答ペアを削除し、質問回答ペアの一部が削除されたブロックと新たに作成されたブロックを変化ありのブロックとして特定する。
削除処理モジュール40は、ブロック内の全ての質問回答ペアが削除された場合に、当該ブロック、当該ブロックに対応するバインディング関係、及びインデックスファイルを削除する。
本開示の実施形態によれば、本開示は更に、電子デバイス、可読記憶媒体、及びコンピュータプログラム製品を提供する。
図6は、本開示の実施形態に係る質問回答システムの更新処理方法の電子デバイスのブロック図である。電子デバイスは、様々な形式のデジタルコンピュータ、例えば、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、PDA、サーバ、ブレードサーバ、メインフレームコンピュータ、及び他の適切なコンピュータであることが意図される。電子デバイスは、様々な形式のモバイル装置、例えば、PDA、携帯電話、スマートフォン、ウェアラブルデバイス、及び他の類似するコンピューティング装置を示してもよい。本文で示された構成要素、それらの接続及び関係、ならびにそれらの機能は例示にすぎなく、本明細書において説明及び/又は請求される本開示の実現を限定することが意図されない。
図6に示すように、この電子デバイスは、一つ又は複数のプロセッサ601、メモリ602、及び各構成要素に接続するための高速インターフェース及び低速インターフェースを含むインターフェースを備える。各構成要素は、異なるバスで相互接続され、そして、共通マザーボードに、又は必要に応じて、他の態様で実装されてもよい。プロセッサは、電子デバイス内で実行されるコマンドを処理してもよく、メモリに記憶される又はメモリ上で外部入力/出力装置(例えば、インターフェースに結合される表示装置)にグラフィカルユーザインターフェースのグラフィカル情報を表示するコマンドを含む。他の実施形態において、必要な場合に、複数のプロセッサ及び/又は複数のバスが、複数のメモリとともに用いられてもよい。同様に、複数の電子デバイスが接続されてもよく、それぞれのデバイスが必要な操作の一部を提供する(例えば、サーババンク、ブレードサーバの集まり、又はマルチプロセッサシステムとする)。図6において、一つのプロセッサ601を例とする。
メモリ602は、本開示で提供される非一時的なコンピュータ可読記憶媒体である。なお、前記メモリには、少なくとも1つのプロセッサが本願に提供された質問回答システムの更新処理方法を実行するように、前記少なくとも1つのプロセッサに実行可能なコマンドが記憶されている。本開示の非一時的コンピュータ可読記憶媒体は、本願に提供された質問回答システムの更新処理方法をコンピュータに実行させるためのコンピュータコマンドを記憶している。
メモリ602は、非一時的コンピュータ可読記憶媒体として、非一時的ソフトウェアプログラム、非一時的コンピュータに実行可能なプログラム、モジュール、例えば、本開示の実施例における質問回答システムの更新処理方法に対応するプログラムコマンド/モジュールを記憶するために用いられる。プロセッサ601は、メモリ602に記憶されている非一時的ソフトウェアプログラム、コマンド及びモジュールを実行することで、サーバの様々な機能アプリケーション及びデータ処理を実行し、即ち、上記の方法実施例における質問回答システムの更新処理方法を実現する。
メモリ602は、プログラム記憶領域及びデータ記憶領域を含んでもよく、プログラム記憶領域はオペレーティングシステム、少なくとも一つの機能に必要なアプリケーションプログラムを記憶してもよく、データ記憶領域は当該電子デバイスの使用により作成されたデータなどを記憶してもよい。また、メモリ602は、高速ランダムアクセスメモリを含んでもよく、さらに非一時的メモリ、例えば、少なくとも一つの磁気ディスク記憶装置、フラッシュメモリ装置、又は他の非一時的固体記憶装置を含んでもよい。幾つかの実施例において、メモリ602は、プロセッサ601に対して遠隔設置されたメモリを選択的に含んでもよく、これらのリモートメモリは、ネットワークを介して当該電子デバイスに接続されてもよい。上記のネットワークの実例には、インターネット、イントラネット、ローカルエリアネットワーク、モバイル通信ネットワーク、及びそれらの組み合わせが含まれるが、これらに限定されない。
当該電子デバイスは、更に、入力装置603と出力装置604とを備えても良い。プロセッサ601、メモリ602、入力装置603及び出力装置604は、バス又は他の手段により接続されても良く、図6においてバスによる接続を例とする。
入力装置603は、入力された数字又はキャラクタ情報を受信し、当該電子デバイスのユーザ設定及び機能制御に関連するキー信号入力を生成でき、例えば、タッチスクリーン、キーパッド、マウス、トラックパッド、タッチパッド、ポインティングスティック、一つ又は複数のマウスボタン、トラックボール、ジョイスティックなどの入力装置である。出力装置604は、表示装置、補助照明装置(例えば、LED)、触覚フィードバック装置(例えば、振動モータ)などを含むことができる。当該表示装置は、液晶ディスプレイ(LCD)、発光ダイオードディスプレイ(LED)、及びプラズマディスプレイを含み得るが、これらに限定されない。いくつかの実施形態では、表示装置はタッチパネルであってもよい。
本明細書に説明されるシステム及び技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、専用ASIC(専用集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/又はそれらの組み合わせにおいて実現することができる。これらの様々な実施形態は、記憶システム、少なくとも一つの入力装置、及び少なくとも一つの出力装置からデータ及びコマンドを受信し、当該記憶システム、当該少なくとも一つの入力装置、及び当該少なくとも一つの出力装置にデータ及びコマンドを送信するようにつなげられた、特殊用途でもよく一般用途でもよい少なくとも一つのプログラマブルプロセッサを含む、プログラマブルシステム上で実行可能及び/又は解釈可能な一つ又は複数のコンピュータプログラムにおける実行を含んでもよい。
これらのコンピューティングプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、又は、コードとも称される)は、プログラマブルプロセッサの機械命令を含み、高水準のプロセス及び/又はオブジェクト向けプログラミング言語、及び/又はアセンブリ/機械言語で実行されることができる。本明細書で用いられる「機械可読媒体」及び「コンピュータ可読媒体」という用語は、機械可読信号としての機械命令を受け取る機械可読媒体を含むプログラマブルプロセッサに機械命令及び/又はデータを提供するのに用いられる任意のコンピュータプログラム製品、機器、及び/又は装置(例えば、磁気ディスク、光ディスク、メモリ、及びプログラマブル論理デバイス(PLD))を指す。「機械可読信号」という用語は、プログラマブルプロセッサに機械命令及び/又はデータを提供するために用いられる任意の信号を指す。
ユーザとのインタラクティブを提供するために、本明細書に説明されるシステムと技術は、ユーザに対して情報を表示するための表示装置(例えば、CRT(ブラウン管)又はLCD(液晶ディスプレイ)モニタ)、ユーザがコンピュータに入力を与えることができるキーボード及びポインティングデバイス(例えば、マウスや、トラックボール)を有するコンピュータ上に実施されることが可能である。その他の種類の装置は、さらに、ユーザとのインタラクションを提供するために使用されることが可能であり、例えば、ユーザに提供されるフィードバックは、任意の形態のセンシングフィードバック(例えば、視覚的なフィードバック、聴覚的なフィードバック、又は触覚的なフィードバック)であり得、ユーザからの入力は、任意の形態で(音響、音声又は触覚による入力を含む)受信され得る。
本明細書に説明されるシステムと技術は、バックエンド構成要素を含むコンピューティングシステム(例えば、データサーバとする)、又はミドルウェア構成要素を含むコンピューティングシステム(例えば、アプリケーションサーバ)、又はフロントエンド構成要素を含むコンピューティングシステム(例えば、グラフィカルユーザインターフェースもしくはウェブブラウザを有するクライアントコンピュータであり、ユーザは、当該グラフィカルユーザインターフェースもしくは当該ウェブブラウザを通じて本明細書で説明されるシステムと技術の実施形態とインタラクションすることができる)、そのようなバックエンド構成要素、ミドルウェア構成要素、もしくはフロントエンド構成要素の任意の組合せを含むコンピューティングシステムに実施されることが可能である。システムの構成要素は、任意の形態又は媒体のデジタルデータ通信(例えば、通信ネットワーク)によって相互に接続されることが可能である。通信ネットワークの例は、ローカルエリアネットワーク(「LAN」)、ワイド・エリア・ネットワーク(「WAN」)、インターネットワークを含む。
コンピュータシステムは、クライアントとサーバを含み得る。クライアントとサーバは、一般的に互いから遠く離れており、通常は、通信ネットワークを通じてインタラクトする。クライアントとサーバとの関係は、相応するコンピュータ上で実行され、互いにクライアント-サーバの関係を有するコンピュータプログラムによって生じる。
以上で示された様々な形式のフローを使用して、ステップを並べ替え、追加、又は削除できることを理解されたい。例えば、本開示に説明される各ステップは、並列の順序又は順次的な順序で実施されてもよいし、又は異なる順序で実行されてもよく、本開示で開示された技術案の望ましい結果が達成できる限り、ここで制限されない。
上記の具体的な実施形態は本開示の保護範囲に対する制限を構成しない。設計要件及び他の要因に従って、様々な修正、組み合わせ、部分的組み合わせ及び置換を行うことができることを当業者は理解するべきである。本開示の精神及び原則の範囲内で行われる修正、同等の置換、改善は、何れも本開示の保護範囲内に含まれるべきである。

Claims (11)

  1. 質問回答システムの更新処理方法であって、
    更新された質問回答セットを取得し、
    更新された質問回答セットと元の質問回答セットの各ブロックについて質問回答ペアの比較を行って変化なしのブロックと変化ありのブロックとを特定し、
    変化ありのブロックに含まれる各質問の特徴データを取得し、当該ブロックに対応するインデックスファイルを作成し、前記特徴データを更新された訓練アウトプットセットに追加し、
    変化なしのブロックに対応するインデックスファイルと特徴データを保持し、前記特徴データを更新された訓練アウトプットセットに追加することを含み、
    前記各ブロックの標識は、ブロックに含まれる質問回答ペアの標識とバインディング関係があり、
    前記更新された質問回答セットと元の質問回答セットの各ブロックについて質問回答ペアの比較を行うことは、
    更新された質問回答セットに含まれる各質問回答ペアの標識に基づいて、元の質問回答セットに当該標識と一致する質問回答ペアが存在するか否かを検索し、当該標識と一致する質問回答ペアとバインディングされたブロックの標識を特定することを含む、
    質問回答システムの更新処理方法。
  2. 前記変化なしのブロックと変化ありのブロックとを特定することは、
    元の質問回答セットで標識が一致する質問回答ペアが検索された場合、当該質問回答ペアをバインディングされたブロックにおいて変化なしと標識し、元の質問回答セットで標識が一致する質問回答ペアが検索されなかった場合、当該質問回答ペアを新たに作成したブロックに割り当て、
    前記比較が終了した後、ブロックにおけるすべての質問回答ペアが変化していない場合、当該ブロックを変化なしのブロックとして特定し、ブロックにおける標識されていない質問回答ペアを削除し、質問回答ペアの一部が削除されたブロックと新たに作成されたブロックを変化ありのブロックとして特定する、
    ことを含む請求項に記載の質問回答システムの更新処理方法。
  3. 前記質問回答ペアの標識は、前記質問回答ペアに対して情報ダイジェストアルゴリズム処理を行って得られる情報ダイジェスト値を含む、
    請求項1又は2に記載の質問回答システムの更新処理方法。
  4. ブロック内のすべての質問回答ペアが削除された場合に、当該ブロック、当該ブロックに対応するバインディング関係及びインデックスファイルを削除する、
    ことを更に含む請求項に記載の質問回答システムの更新処理方法。
  5. 質問回答システムの更新処理装置であって、
    更新された質問回答セットを取得する更新取得モジュールと、
    更新された質問回答セットと元の質問回答セットの各ブロックについて質問回答ペアの比較を行って変化なしのブロックと変化ありのブロックを特定するブロック処理モジュールと、
    変化ありのブロックに含まれる各質問の特徴データを取得し、当該ブロックに対応するインデックスファイルを作成し、前記特徴データを更新された訓練アウトプットセットに追加する更新処理モジュールと、
    変化なしのブロックに対応するインデックスファイルと特徴データを保持し、前記特徴データを更新された訓練アウトプットセットに追加する多重化処理モジュールとを備え、
    前記各ブロックの標識は、ブロックに含まれる質問回答ペアの標識とバインディング関係があり、
    前記ブロック処理モジュールは、
    更新された質問回答セットに含まれる各質問回答ペアの標識に基づいて、元の質問回答セットに当該標識と一致する質問回答ペアが存在するか否かを検索し、当該標識と一致する質問回答ペアがバインディングされたブロックの標識を特定する比較サブモジュールを備える、
    質問回答システムの更新処理装置。
  6. 前記ブロック処理モジュールは、
    前記比較サブモジュールが元の質問回答セットで標識が一致する質問回答ペアを検索した場合に、当該質問回答ペアをバインディングされたブロックにおいて変化なしと標識する標識サブモジュールと、
    前記比較サブモジュールが元の質問回答セットで標識が一致する質問回答ペアを検索しなかった場合に、当該質問回答ペアを新たに作成されたブロックに割り当てるブロックサブモジュールと、
    前記比較サブモジュールによる、更新された質問回答セットに含まれる各質問回答ペアについての検索が全て終了した後、ブロックにおけるすべての質問回答ペアが変化していない場合、当該ブロックを変化なしのブロックとして特定し、ブロックにおける未標識の質問回答ペアを削除し、質問回答ペアの一部が削除されたブロックと新たに作成されたブロックを変化ありのブロックとして特定する特定サブモジュールと、
    をさらに備える請求項に記載の質問回答システムの更新処理装置。
  7. 前記質問回答ペアの標識は、前記質問回答ペアに対して情報ダイジェストアルゴリズム処理を行って得られる情報ダイジェスト値を含む、
    請求項5又は6に記載の質問回答システムの更新処理装置。
  8. ブロック内のすべての質問回答ペアが削除された場合に、当該ブロック、当該ブロックに対応するバインディング関係及びインデックスファイルを削除する削除処理モジュールを更に備える
    請求項に記載の質問回答システムの更新処理装置。
  9. 少なくとも1つのプロセッサと、
    前記少なくとも1つのプロセッサと通信接続されたメモリとを備え、
    前記メモリに前記少なくとも1つのプロセッサにより実行可能なコマンドが記憶されており、前記コマンドが前記少なくとも1つのプロセッサにより実行されると、前記少なくとも1つのプロセッサに請求項1~のいずれか1項に記載の質問回答システムの更新処理方法を実行させる電子デバイス。
  10. コンピュータに請求項1~のいずれか1項に記載の質問回答システムの更新処理方法を実行させるためのコンピュータコマンドを記憶した非一時的なコンピュータ可読記憶媒体。
  11. プロセッサにより実行されると、請求項1~のいずれか1項に記載の質問回答システムの更新処理方法を実現するコンピュータプログラム。
JP2021193609A 2020-12-18 2021-11-29 質問回答システムの更新処理方法及び装置 Active JP7293544B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202011503415.2A CN112507100B (zh) 2020-12-18 2020-12-18 一种问答系统的更新处理方法和装置
CN202011503415.2 2020-12-18

Publications (2)

Publication Number Publication Date
JP2022097397A JP2022097397A (ja) 2022-06-30
JP7293544B2 true JP7293544B2 (ja) 2023-06-20

Family

ID=74921723

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021193609A Active JP7293544B2 (ja) 2020-12-18 2021-11-29 質問回答システムの更新処理方法及び装置

Country Status (3)

Country Link
US (1) US20220198301A1 (ja)
JP (1) JP7293544B2 (ja)
CN (1) CN112507100B (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005004657A (ja) 2003-06-13 2005-01-06 Nippon Telegr & Teleph Corp <Ntt> 情報分類方法及び装置
JP2006119991A (ja) 2004-10-22 2006-05-11 Qualica Inc Faqデータ作成装置及び方法、整理装置及び方法、faq回答システム
WO2013136442A1 (ja) 2012-03-13 2013-09-19 株式会社野村総合研究所 データ利用システム、時限データの履歴管理システム及びデータ処理システム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101770515B (zh) * 2010-01-18 2012-01-11 杭州顺网科技股份有限公司 一种基于数据块比较的数据更新方法
CN103729225B (zh) * 2014-01-22 2016-09-28 中国人民解放军国防科学技术大学 一种基于内容分块的远程文件实时更新方法
US20150278264A1 (en) * 2014-03-31 2015-10-01 International Business Machines Corporation Dynamic update of corpus indices for question answering system
CN104572998B (zh) * 2015-01-07 2017-09-01 北京云知声信息技术有限公司 用于自动问答系统的问答排序模型更新方法及装置
US10387430B2 (en) * 2015-02-26 2019-08-20 International Business Machines Corporation Geometry-directed active question selection for question answering systems
KR101662450B1 (ko) * 2015-05-29 2016-10-05 포항공과대학교 산학협력단 다중 소스 하이브리드 질의응답 방법 및 시스템
CN106326035A (zh) * 2016-08-13 2017-01-11 南京叱咤信息科技有限公司 一种基于文件元数据的增量备份方法
US11341422B2 (en) * 2017-12-15 2022-05-24 SHANGHAI XIAOl ROBOT TECHNOLOGY CO., LTD. Multi-round questioning and answering methods, methods for generating a multi-round questioning and answering system, and methods for modifying the system
CN110532369B (zh) * 2019-09-04 2022-02-01 腾讯科技(深圳)有限公司 一种问答对的生成方法、装置及服务器
CN111737399A (zh) * 2020-05-28 2020-10-02 北京百度网讯科技有限公司 扩展问答集的方法、装置、电子设备和可读存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005004657A (ja) 2003-06-13 2005-01-06 Nippon Telegr & Teleph Corp <Ntt> 情報分類方法及び装置
JP2006119991A (ja) 2004-10-22 2006-05-11 Qualica Inc Faqデータ作成装置及び方法、整理装置及び方法、faq回答システム
WO2013136442A1 (ja) 2012-03-13 2013-09-19 株式会社野村総合研究所 データ利用システム、時限データの履歴管理システム及びデータ処理システム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
難波 功 外,擬似事例頻度を利用した質問回答検索,電子情報通信学会技術研究報告,日本,社団法人電子情報通信学会,2002年03月14日,Vol. 101 No. 710,pp. 101-108

Also Published As

Publication number Publication date
CN112507100B (zh) 2023-12-22
CN112507100A (zh) 2021-03-16
US20220198301A1 (en) 2022-06-23
JP2022097397A (ja) 2022-06-30

Similar Documents

Publication Publication Date Title
CN109254733B (zh) 用于存储数据的方法、装置和系统
US8788471B2 (en) Matching transactions in multi-level records
JP6365195B2 (ja) 命令履歴分析プログラム、命令履歴分析装置、および、命令履歴分析方法
CN111639027B (zh) 一种测试方法、装置及电子设备
US11386067B2 (en) Data integrity checking in a distributed filesystem using object versioning
JP7200277B2 (ja) ワードスロットを識別するための方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム
US20120158742A1 (en) Managing documents using weighted prevalence data for statements
US10540352B2 (en) Remote query optimization in multi data sources
JP2022031625A (ja) 情報をプッシュするための方法および装置、電子機器、記憶媒体並びにコンピュータプログラム
CN113076104A (zh) 页面生成方法、装置、设备及存储介质
CN111913808A (zh) 任务分配的方法、装置、设备以及存储介质
CN110020272B (zh) 缓存方法、装置以及计算机存储介质
JP2022518645A (ja) 映像配信時効の決定方法及び装置
CN115358397A (zh) 一种基于数据采样的并行图规则挖掘方法及装置
CN110633281A (zh) 多类型数据源的处理方法及装置
CN112115113B (zh) 数据存储系统、方法、装置、设备以及存储介质
CN115705313A (zh) 一种数据处理方法、装置、设备及计算机可读存储介质
CN112069137A (zh) 生成信息的方法、装置、电子设备及计算机可读存储介质
JP7293544B2 (ja) 質問回答システムの更新処理方法及び装置
US10528575B2 (en) Collaborative search of databases
CN115454971A (zh) 数据迁移方法、装置、电子设备及存储介质
CN113111065A (zh) 数据库创建方法、装置、计算机设备及存储介质
US8712995B2 (en) Scoring records for sorting by user-specific weights based on relative importance
US8818955B2 (en) Reducing storage costs associated with backing up a database
US10789536B2 (en) Using Trie structures to efficiently identify similarities among topical subjects

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230131

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230418

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230509

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230515

R150 Certificate of patent or registration of utility model

Ref document number: 7293544

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150