JP2021518019A - 質問応答インタラクション方法、装置、コンピュータデバイス及びコンピュータ読取可能な記憶媒体 - Google Patents

質問応答インタラクション方法、装置、コンピュータデバイス及びコンピュータ読取可能な記憶媒体 Download PDF

Info

Publication number
JP2021518019A
JP2021518019A JP2020556316A JP2020556316A JP2021518019A JP 2021518019 A JP2021518019 A JP 2021518019A JP 2020556316 A JP2020556316 A JP 2020556316A JP 2020556316 A JP2020556316 A JP 2020556316A JP 2021518019 A JP2021518019 A JP 2021518019A
Authority
JP
Japan
Prior art keywords
intention
question
user
database
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020556316A
Other languages
English (en)
Other versions
JP7127150B2 (ja
Inventor
波 李
波 李
永梅 曽
永梅 曽
貢之 姚
貢之 姚
迪 陳
迪 陳
頻頻 朱
頻頻 朱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Xiaoi Robot Technology Co Ltd
Original Assignee
Shanghai Xiaoi Robot Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Xiaoi Robot Technology Co Ltd filed Critical Shanghai Xiaoi Robot Technology Co Ltd
Publication of JP2021518019A publication Critical patent/JP2021518019A/ja
Application granted granted Critical
Publication of JP7127150B2 publication Critical patent/JP7127150B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本発明は、質問応答インタラクション方法、装置、コンピュータデバイス及びコンピュータ読取可能な記憶媒体を開示する。当該質問応答インタラクション方法は、ユーザの質問を受信するステップ(110)と、質問に対応する回答を取得するとともに、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図の、質問との少なくとも1つの相関度を取得するステップ(120)と、少なくとも1つの相関度のうちから、予め設定された相関度閾値を超えた相関度を特定して、特定した相関度に対応する意図を推薦意図として確定するステップ(130)と、回答をユーザに送信するとともに推薦意図をユーザに送るステップ(140)と、を含む。本発明は、計算効率を向上させ、質問応答インタラクションのプロセスを簡略化させることができる。

Description

本願は、2018年4月16日に出願された中国特許出願「No.201810339766.0」の優先権を主張し、そのすべての内容を参照より本明細書に組み込む。
本願は、ヒューマンコンピュータインタラクション技術分野に関し、特に、質問応答インタラクション方法、装置、コンピュータデバイス及びコンピュータ読取可能な記憶媒体に関する。
ヒューマンコンピュータインタラクション(Human−Computer Interaction,HCI)は、システムとユーザの間のインタラクション関係を研究する科学である。システムは、様々な機器であってもよく、コンピュータ化されたシステムやソフトウェアであってもよい。例えば、インテリジェント顧客サービスシステム、音声制御システムなどの人工知能システムは、ヒューマンコンピュータインタラクションに基づいて実現されることができる。
インテリジェント質問応答インタラクションシステムは、ヒューマンコンピュータインタラクションにおける典型的な応用である。従来のインテリジェント質問応答インタラクションシステムは、あいまい検索や類似度計算などの方法を利用して、ユーザ質問に関連するか又は近似する知識を知識データベースから探し出し、当該知識に対応する回答をユーザに提供する。しかしながら、このような方法を用いると、すべてのユーザ質問に対してそれぞれあいまい検索と類似度計算を行わなければならない。こうすると、計算量が膨大になってしまって、計算効率が非常に低い。また、このような方法はユーザ質問に対して「1質問に1回答」の形で返事することしかできないため、複数の質問を聞きたい場合、ユーザは複数回の入力操作を繰り返しなければならない。その結果、インタラクションの過程が煩雑になってしまって、ユーザ体験が悪くなる。
以上に鑑みて、本発明の一つの目的は、質問応答インタラクション方法、装置、コンピュータデバイス及びコンピュータ読取可能な記憶媒体を提供することによって、計算効率を向上させ、質問応答インタラクションプロセスを簡略化させることである。
本発明の一態様によると、質問応答インタラクション方法を提供する。当該方法は、ユーザの質問を受信するステップと、質問に対応する回答を取得するとともに、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図の、質問との少なくとも1つの相関度を取得するステップと、少なくとも1つの相関度のうちから、予め設定された相関度閾値を超えた相関度を特定して、特定した相関度に対応する意図を推薦意図として確定するステップと、回答をユーザに送信するとともに推薦意図をユーザに送るステップと、を含む。
本発明の一実施例において、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図の、質問との少なくとも1つの相関度を取得するステップは、質問に対して単語分割処理を行って複数の単語を取得するステップと、複数の単語のうちの各単語と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素と、に対してマッチングを行うステップと、マッチング結果に基づいて、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図の、質問との少なくとも1つの相関度を確定するステップと、を含む。
本発明の一実施例において、複数の単語のうちの各単語と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素とに対してマッチングを行うステップは、複数の単語のうちの各単語と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応するトピックモデルにおける少なくとも1つの重要要素と、に対してマッチングを行うステップを含む。ここで、トピックモデルは少なくとも1つの重要要素の確率を含む。また、マッチング結果に基づいて、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図の、質問との少なくとも1つの相関度を確定するステップは、少なくとも1つの重要要素のうちから複数の単語にマッチする重要要素を特定して、特定した重要要素の確率に基づいて、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図の、質問との少なくとも1つの相関度を確定するステップ、を含む。
本発明の一実施例において、複数の単語のうちの各単語と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素と、に対してマッチングを行うステップは、複数の単語のうちの各単語と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応するシーケンスパターンにおける頻出アイテム集合の中の少なくとも1つの頻出アイテムと、に対してマッチングを行うステップを含む。ここで、頻出アイテム集合は少なくとも1つの頻出アイテムの確信度を含む。また、マッチング結果に基づいて、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図の、質問との少なくとも1つの相関度を確定するステップは、少なくとも1つの頻出アイテムのうちから複数の単語にマッチする頻出アイテムを特定して、特定した頻出アイテムの確信度に基づいて、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図の、質問との少なくとも1つの相関度を確定するステップを含む。
本発明の一実施例において、質問に対応する回答を取得するステップは、質問に対して単語分割処理を行って、複数の単語を取得するステップと、複数の単語のうちの各単語と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素と、に対してマッチングを行うステップと、マッチング結果に基づいて、予め設定された対応するサブルーチンを実行して、サブルーチンに対応する回答を取得するステップと、を含む。
本発明の一実施例において、予め設定された対応するサブルーチンを実行するステップは、複数の単語のうちの各単語と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素とがマッチするか否かを確定するステップと、複数の単語のうちの各単語と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素とがマッチする場合、対応する回答を出力するステップ、又は、複数の単語のうちの各単語と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素とがマッチしない場合、回答をトリガーするための少なくとも1つの重要要素を文脈意図推理の方法によって取得するステップと、を含む。
本発明の一実施例において、当該質問応答インタラクション方法は、インタラクション日誌に記載の少なくとも1つのユーザのうちの各ユーザからの複数の質問に基づいて、予め構築された意図データベースをビッグデータ分析の方法によって構築するステップ、を更に含む。ここで、予め構築された意図データベースは、少なくとも1つの意図のうちの各意図と少なくとも1つの重要要素との対応関係を含む。
本発明の一実施例において、推薦意図をユーザに送るステップは、推薦意図の質問文をユーザに送るステップを含む。また、当該質問応答インタラクション方法は、ユーザのフィードバックによって、推薦意図の質問文に対応する回答をユーザに送信するステップ、を更に含む。
本発明の一実施例において、推薦意図をユーザに送るステップは、推薦意図の商品の内容をユーザに送るステップを含む。
本発明の他の態様によると、質問応答インタラクション装置を提供する。当該装置は、ユーザの質問を受信する受信モジュールと、質問に対応する回答と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図の、質問との少なくとも1つの相関度と、を取得する取得モジュールと、少なくとも1つの相関度のうちから予め設定された相関度閾値を超えた相関度を特定して、特定した相関度に対応する意図を推薦意図として確定する確定モジュールと、回答をユーザに送信するとともに推薦意図をユーザに送る送信モジュールと、を備える。
本発明の一実施例において、取得モジュールは、質問に対して単語分割処理を行って、複数の単語を取得する処理ユニットと、複数の単語のうちの各単語と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素と、に対してマッチングを行うマッチングユニットと、マッチング結果に基づいて、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図の、質問との少なくとも1つの相関度を確定する確定ユニットと、を備える。
本発明の一実施例において、マッチングユニットは、複数の単語のうちの各単語と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応するトピックモデルにおける少なくとも1つの重要要素と、に対してマッチングを行う。ここで、トピックモデルは少なくとも1つの重要要素の確率を含む。また、確定ユニットは、少なくとも1つの重要要素のうちから複数の単語にマッチする重要要素を特定して、特定した重要要素の確率に基づいて、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図の、質問との少なくとも1つの相関度を確定する。
本発明の一実施例において、マッチングユニットは、複数の単語のうちの各単語と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応するシーケンスパターンにおける頻出アイテム集合の中の少なくとも1つの頻出アイテムと、に対してマッチングを行う。ここで、頻出アイテム集合は少なくとも1つの頻出アイテムの確信度を含む。また、確定ユニットは、少なくとも1つの頻出アイテムのうちから複数の単語にマッチする頻出アイテムを特定して、特定した頻出アイテムの確信度に基づいて、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図の、質問との少なくとも1つの相関度を確定する。
本発明の一実施例において、取得モジュールは、質問に対して単語分割処理を行って、複数の単語を取得する処理ユニットと、複数の単語のうちの各単語と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素と、に対してマッチングを行うマッチングユニットと、マッチング結果に基づいて、予め設定された対応するサブルーチンを実行して、サブルーチンに対応する回答を取得する実行ユニットと、を備える。
本発明の一実施例において、実行ユニットは、複数の単語のうちの各単語と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素とがマッチするか否かを確定し、複数の単語のうちの各単語と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素とがマッチする場合、対応する回答を出力するか、又は、複数の単語のうちの各単語と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素とがマッチしない場合、回答をトリガーするための少なくとも1つの重要要素を文脈意図推理の方法によって取得する。
本発明の一実施例において、当該質問応答インタラクション装置は、インタラクション日誌に記載の少なくとも1つのユーザのうちの各ユーザからの複数の質問に基づいて、予め構築された意図データベースをビッグデータ分析の方法によって構築するベース構築モジュールを更に備える。ここで、予め構築された意図データベースは、少なくとも1つの意図のうちの各意図と少なくとも1つの重要要素との対応関係を含む。
本発明の一実施例において、送信モジュールは、推薦意図の質問文をユーザに送り、ユーザのフィードバックによって、推薦意図の質問文に対応する回答をユーザに送信する。
本発明の一実施例において、送信モジュールは、推薦意図の商品の内容をユーザに送る。
本発明のもう1つの態様によると、コンピュータデバイスを提供する。当該コンピュータデバイスは、メモリ、プロセッサ及びメモリに記憶されてプロセッサにおいて実行されることができる実行可能な命令を備え、プロセッサが実行可能な命令を実行すると、以上に記載の任意の質問応答インタラクション方法が実現される。
本発明のもう1つの態様によると、コンピュータ読取可能な記憶媒体を提供する。当該記憶媒体にはコンピュータ実行可能な命令が記憶されており、実行可能な命令がプロセッサにより実行されると、以上に記載の任意の質問応答インタラクション方法を実現する。
本発明の実施例に係る技術案は、ユーザの質問を受信し、質問に対応する回答と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図の質問との少なくとも1つの相関度と、を取得し、少なくとも1つの相関度のうちから予め設定された相関度閾値を超えた相関度を特定して、特定した相関度に対応する意図を推薦意図として確定し、ユーザに回答を送信するとともに推薦意図をユーザに送ることによって、計算効率を向上させ、質問応答インタラクションのプロセスを簡略化させることができる。
なお、以上の一般的な記述及びこれからの詳しい説明は、例示的であって、解釈するための内容であり、本発明を制限するものではない。
ここで説明される図面は、本明細書の一部として明細書に組み込まれ、本発明にふさわしい実施例を示しており、明細書と一緒に本発明の原理を解釈する。
本発明の例示的な一実施例による質問応答インタラクション方法のフローチャートである。 本発明の他の例示的な一実施例による質問応答インタラクション方法のフローチャートである。 本発明の他の例示的な一実施例による質問応答インタラクション方法のフローチャートである。 本発明の他の例示的な一実施例による質問応答インタラクション方法のフローチャートである。 本発明の例示的な一実施例による質問応答インタラクション装置のブロック図である。 本発明の他の例示的な一実施例による質問応答インタラクション装置のブロック図である。 本発明の他の例示的な一実施例による質問応答インタラクション装置のブロック図である。 本発明の他の例示的な一実施例による質問応答インタラクション装置のブロック図である。 本発明の例示的な一実施例により提供される、質問応答インタラクションを行うための装置900のブロック図である。
以下、本発明の実施例の図面に基づいて、本発明の実施例に係る技術案を明確で完全に説明する。明らかに、説明される実施例は本発明の一部の実施例に過ぎず、すべての実施例ではない。当業者が本発明の実施例に基づいて創造的な労働をせずに得られる他の実施例は、すべて本発明の保護範囲に属するべきである。
図1は、本発明の例示的な一実施例による質問応答インタラクション方法のフローチャートである。図1に示す質問応答インタラクション方法は、ヒューマンコンピュータインタラクション装置(例えば、インテリジェント質問応答システムなど)により実行されることができる。図1に示すよう、当該質問応答インタラクション方法は、以下の内容を含む。
110:ユーザの質問を受信する。
本発明の実施例において、ユーザの質問は自然言語の文章、フレーズ又は語彙などの形であってもよい。ユーザの質問には1つの意図のみが含まれていてもよく、複数の意図が含まれていてもよく、本発明はそれについて制限しない。例えば、ユーザの質問が「私の残りデータ量を調べてください」である場合、当該質問には「残りデータ量の確認」という1つの意図しか含まれていない。もう1つの例として、ユーザの質問が「携帯料金ポイントを調べる」である場合、当該質問には「携帯料金を調べる」及び「ポイントを調べる」という2つの意図が含まれている。
さらに、ユーザの質問は、ユーザがキーボード、タッチスクリーン又は手書きパネルなどによって入力したテキスト情報であってもよく、ユーザがマイクロフォンなどによって入力した音声情報であってもよく、ユーザがインタラクション端末によって入力したテキストメッセージ、データリンク、音声メッセージ、イメージメッセージ、画像メッセージ又は動画メッセージなどであってもよく、本発明はそれについて制限しない。ここで、インタラクション端末は、インテリジェント質問応答システムと情報インタラクションを行うことができるデバイスである。例えば、スマートフォン、タブレット、パソコン又は他のスマート端末などであってもよい。例えば、ユーザは、音声又は動画でインテリジェント質問応答システムに質問を出しながら、インタラクション端末を介して対応するデータリングをインテリジェント質問応答システムへ送信することができる。
なお、質問としての音声メッセージ、イメージメッセージ、画像メッセージ又は動画メッセージが届いた場合、インテリジェント質問応答システムは、音声認識モジュール、イメージ認識モジュール又は動画認識モジュールなどによって、音声メッセージ、イメージメッセージ、画像メッセージ又は動画メッセージをテキストメッセージに変換することができる。
120:質問に対応する回答と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図の、質問との少なくとも1つの相関度と、を取得する。
本発明の実施例において、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図の質問との少なくとも1つの相関度を取得する前、まずはインタラクション日誌に記載の少なくとも1つのユーザのうちの各ユーザからの複数の質問に基づいて、ビッグデータ分析の方法を採用して、意図データベース(知識データベースとも称する)を予め構築しなければならない。ここで、予め構築された意図データベースは、少なくとも1つの意図のうちの各意図と少なくとも1つの重要要素との対応関係を含むことができる。
具体的に、意図は、自然言語処理の方法によって、データベースにおいて予め設定された意図知識にマッチングされることによって得られたものであってもよい。ここで、データベースはすなわち意図知識が記憶されている意図データベースである。当該意図データベースは複数の意図知識を含むことができ、複数の意図知識のうちの各意図知識は、対応する少なくとも1つの質問の回答及び/又は相関度を含むことができる。
さらに、単語分割処理又はセンテンス分割処理の結果に基づいて、語義解析や意図マッチングなどの手段によって、ユーザの質問に対して意図分析を行うことができる。又は、単語分割処理の結果に基づいて、単語分割された複数の単語を並べ替えて組み合わせ、単語を組み合わせた結果に基づいてユーザの質問に対して意図分析を行ってもよい。又は、コーパストレーニングによって得られた他の自然言語解析モデルなどを用いて質問に対して文章処理を行って質問の語義内容を取得し、質問の語義内容に基づいてユーザの質問に対して意図分析を行うこともできる。本発明はこれについて制限しない。
具体的には、単語分割処理の手段として、双方向最大マッチング法、ビタビ(Viterbi)アルゴリズム、隠れマルコフモデル(Hidden Markov Model,HMM)アルゴリズム及び条件付き確率場(Conditional Random Field,CRF)アルゴリズムのうちの1つ又は複数を採用することができる。センテンス分割処理においては、読点、セミコロン、句点、疑問符、感嘆符などを、センテンスを分割する分割符として用いて、ユーザの質問を複数の短い文に分割するか、又は、所定の文字や単語によってユーザの質問を分解することである。単語を組み合わせることは複数の単語を並べて組み合わせることであり、且つこれらの単語からなる組合せが表す意図は1つであってもよく、複数であってもよい。語義内容は、コーパストレーニングによって得られた他の自然言語解析モデルなどを用いてユーザの質問に対して全体的な語義解析を行うことによって得られるものであってもよい。
さらに、複数の単語のうちの各単語と、意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素と、に対してマッチングを行い、マッチング結果に基づいて、予め設定された対応するサブルーチンを実行して、サブルーチンに対応する回答を取得することができる。
具体的には、複数の単語のうちの各単語と、意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素とがマッチする場合、質問に対応する回答を意図データベースから直接取得する。一方、複数の単語のうちの各単語と、意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素とがマッチしない場合、回答をトリガーするための少なくとも1つの重要要素を文脈意図推理の方法によって意図データベースから取得する。
130:少なくとも1つの相関度のうちから、予め設定された相関度閾値を超えた相関度を特定して、特定した相関度に対応する意図を推薦意図として確定する。
本発明の実施例において、相関度は以下の方法によって算出されることができる。ユーザとインテリジェント質問応答システムとのインタラクション日誌から、ユーザが最初の質問を聞いたあとに追加で聞いた複数の質問を特定し、追加で聞かれた複数の質問のうちの各質問に対応する人数を統計し、統計結果に基づいて各質問に対応する人数がインタラクション日誌において占める割合を計算する。
具体的に、招商銀行のインテリジェントオンライン顧客サービスシステムを例とする。2000名のユーザの、インテリジェントオンライン顧客サービスシステムとのインタラクション日誌をサンプルデータとして抽出する。サンプルデータに対してビッグデータ分析を行うことによって、1000名のユーザが質問A「私のクレジットカードの今月の返済額はいくらですか」を聞いたことがあると判明することができる。続いて、この1000名のユーザが質問Aを聞いたあとに更に聞いた質問を統計すると、500名のユーザが質問Aの次に質問B「私の返済日は何日ですか」を聞いており、300名のユーザが質問Aの次に質問C「私の最低返済額がいくらですか」を聞いており、残りの200名のユーザが質問Aの次に質問D「私は分割払いを申し込むことができますか」を聞いていることを判明することができる。さらに、統計結果に基づいて、インタラクション日誌において各質問に対応する人数が占める割合を計算すると、質問Bと質問Aとの相関度は0.5であり、質問Cと質問Aとの相関度が0.3であり、質問Dと質問Aとの相関度は0.2である。なお、以上の相関度の計算方法以外にも、Aprioriアルゴリズム、FP−growthアルゴリズムなどのような相関分析方法を用いて相関度を計算してもよく、本発明はこれについて制限しない。
次に、算出された相関度を相関度閾値に比較する。相関度が相関度閾値より大きい場合、当該相関度に対応する意図を推薦意図として確定し、相関度が相関度閾値より小さい場合、当該相関度に対応する意図を無視する。ここで、相関度閾値は予め設定されたものであってもよく、実際の必要に応じて調整されてもよく、本発明はこれについて制限しない。
さらに、予め設定された相関度閾値が0.1である場合、質問B、質問C及び質問Dの質問Aとの相関度はすべて相関度閾値より大きい。つまり、質問B、質問C及び質問Dに対応する意図はどれもユーザが更に知りたい内容である。そこで、質問B、質問C及び質問Dに対応する意図を推薦意図として確定する。また、予め設定された相関度閾値が0.25である場合、質問B及び質問Cの質問Aとの相関度が相関度閾値より大きい。つまり、質問B及び質問Cに対応する意図はユーザが更に知りたい内容であるかもしれないが、質問Dに対応する意図はユーザが更に知りたい内容ではないかもしれない。そこで、質問B及び質問Cに対応する意図を推薦意図として確定し、質問Dに対応する意図を無視する。
140:回答をユーザに送信するとともに、推薦意図をユーザに送る。
本発明の実施例においては、テキスト、音声、イメージ、画像、動画、リンクなどの形のうちの1つ又は複数によって回答及び/又は推薦意図をユーザに送信することができる。
具体的に、招商銀行のインテリジェントオンライン顧客サービスシステムを例とする。ユーザがテキストの形で「クレジットカードの返済方法はどうなりますか」を入力した場合、招商銀行のインテリジェントオンライン顧客サービスシステムはテキストの形で「招商銀行のカウンター又はATMで返済手続を行われるか、又はオンライン銀行、自動振替などの方式で返済を行うことができます」と返事することができる。それと同時に、インテリジェントオンライン顧客サービスシステムのユーザインターフェイスではユーザの所在位置の近くにある招商銀行の位置情報を表示し、ユーザは位置情報をクリックしてナビゲーションに従って付近の招商銀行へ行って返済手続を行うことができる。
本発明の実施例に係る技術案は、ユーザの質問を受信し、質問に対応する回答と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図の質問との少なくとも1つの相関度と、を取得し、少なくとも1つの相関度のうちから予め設定された相関度閾値を超えた相関度を特定して、特定した相関度に対応する意図を推薦意図として確定し、ユーザに回答を送信するとともに推薦意図をユーザに送ることによって、計算効率を向上させ、質問応答インタラクションのプロセスを簡略化させることができる。
本発明の他の一実施例において、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図の、質問との少なくとも1つの相関度を取得するステップは、質問に対して単語分割処理を行って複数の単語を取得するステップと、複数の単語のうちの各単語と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素と、に対してマッチングを行うステップと、マッチング結果に基づいて、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図の、質問との少なくとも1つの相関度を確定するステップと、を含む。
具体的には、予め設定された単語分割ルール及び予め設定された単語分割辞書に基づいて、ユーザの質問に対して単語分割処理を行って、複数の単語を取得する。ここで、単語分割ルールは、フォワード最大マッチング法、バックワード最大マッチング法、単語ごと確認法又は単語頻度統計法、最少切り分け法、双方向マッチング法などを含んでもよいが、それらに限られない。例えば、ユーザの質問が「私は今何ポイントがありますか」である場合、インテリジェント質問応答システムは、単語ごと確認法を用いて、ユーザの質問「私は今何ポイントがありますか」に対して単語分割処理を行って、複数の単語「私は」、「今」、「何」、「ポイント」、「があります」を取得することができる。なお、ユーザの質問には句読点が含まれてもよく、句読点が含まれていなくてもよく、本発明はこれについて制限しない。
次に、複数の単語に対してフィルタ処理を行って、少なくとも1つのキーワードを取得する。フィルタ処理の方法として、品詞などに基づいて複数の単語に対してフィルタ処理を行って接頭辞及び接尾辞を除去してもよく、頻度に基づいて複数の単語に対してフィルタ処理を行ってストップワードを除去してもよく、又は接頭辞及び接尾辞を除去してからストップワードなどを除去してもよく、本発明はこれについて制限しない。ここで、ストップワードを除去することは、質問において現れる頻度が高いが認識してもほとんど意味がない単語、例えば、「この」、「の」、「と」などを除去することである。類似度を計算するとき、これらの単語は大きい誤差を招いてしまうため、ノイズと見なされてもよい。なお、フィルタ処理によって意味を有しない一部の単語、例えば、「私」、「・・・・たい」、「か」などを除去することもできる。
さらに、少なくとも1つのキーワードに対して語義解析を行って、複数の単語の語義情報を取得する。通常、語義情報とは、意味を有する任意の言語、文字、データ、符号などにより提供される情報を指す。本発明の実施例において、語義情報はすなわちユーザ質問に含まれる意図であり、品詞交換、命名実体認識などの方法によって取得されることができる。ここで、語義情報は単語の類義語及び/又は類義語の組合せ、単語の類語及び/又は類語の組合せ、単語と同一又は類似する構造を有する実体を含んでもよいが、それらに限られない。
さらに、語義情報と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素と、の語義類似度を算出し、語義類似度が最も高い重要要素を特定して、マッチする少なくとも1つの重要要素として確定する。ここで、語義類似度とは、複数の単語の語義情報と意図データベースにおける複数の予め設定された意図知識とが文字及び単語レベルにおいてマッチする度合、及び、語義の高度類似度を指す。語義類似度を計算するためには、ベクトル空間モデル(Vector Space Model,VSM)に基づく計算方法、潜在意味解析(Latent Semantic Indexing,LSI)モデルに基づく計算方法、属性理論に基づく語義類似度の計算方法、及び、ハミング距離に基づく語義類似度の計算方法のうちの1つ又は複数の組合せを採用することができる。なお、語義類似度の計算方法は、他の語義類似度の計算方法であってもよい。
最後に、語義類似度の計算結果に基づいて、マッチする少なくとも1つの重要要素のうちの各重要要素に対応する意図の、質問との少なくとも1つの相関度を確定する。
本発明の他の一実施例において、複数の単語のうちの各単語と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素と、に対してマッチングを行うステップは、複数の単語のうちの各単語と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応するトピックモデルにおける少なくとも1つの重要要素と、に対してマッチングを行うステップを含む。ここで、トピックモデルは少なくとも1つの重要要素の確率を含む。また、マッチング結果に基づいて、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図の、質問との少なくとも1つの相関度を確定するステップは、少なくとも1つの重要要素のうちから複数の単語にマッチする重要要素を特定して、特定した重要要素の確率に基づいて、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図の、質問との少なくとも1つの相関度を確定するステップを含む。
具体的に、トピックモデル(Topic Model)は、テキストに含まれているトピックを対象としたモデル構築方法である。トピックモデルによると、ドキュメント−単語の間に存在している潜在的な語義関係(すなわちトピック)を見つけることができる。ドキュメントは1グループのトピックの混合分布と見なされてもよく、それに、トピックは単語の確率分布である。よって、高次元の「単語−ドキュメント」ベクトル空間を、低次元の「単語−トピック」及び「トピック−ドキュメント」空間へマッピングすることによって、テキスト情報処理の性能を効果的に向上させることができる。ここで、トピックは1つのコンセプト、1つの分野であってもよく、関連する一連の単語により表される。また、数学的な考え方で説明すると、トピックは語彙表における単語の確率分布であり、トピックとの相関性が高い単語は確率が高いが、逆の場合には確率が低い。
例えば、「テンセント」というトピックを言及した文章においては、「ウィーチャット」、「伝説対決」、「馬化騰」などの単語が現れる確率が高い。また、「価格」というトピックが言及された場合、「値段」、「コスパ」、「割引」などの単語が頻繁に現れるかもしれない。「ジョブスは完璧主義者だ」と「アップルの値段が下がるでしょうか」という2つの文を例とすると、2つの文には共通な単語が全く存在しないにもかかわらず、両者は強い相関性を持っている。何故なら、2番目の文に現れた「アップル」という単語は食べるアップルを指している可能性もあるが、1番目の文には「ジョブス」が出たため、2番目の文における「アップル」はアップル社の製品を指していると自然に理解することができる。つまり、ここで「アップル」という単語は、「アップル社」というトピック及び「果物」というトピックの両方とも含んでいる。
また、トピックモデルは生成モデルであってもよい。1つのドキュメントにおける単語はすべて、「所定の確率によって1つのトピックを選定し、当該トピックにおいて所定の確率によって1つの単語を選定する」というような流れで得られたものである。つまり、1つのドキュメントを生成するとき、当該ドキュメントにおける各単語の現れる確率が
Figure 2021518019
である。
ここで、p(単語|ドキュメント)は1つのドキュメントにおける各単語が現れる確率を表し、p(単語|トピック)は1つのトピックにおいて各単語が現れる確率を表し、p(トピック|ドキュメント)は1つのドキュメントにおいて各トピックが現れる確率を表す。
ここで、複数のドキュメント(例えば、大量のウェブページ)があると仮定する。まずは、これらのドキュメントに対して単語分割を行って、語彙リストを取得する。次に、すべての単語1つずつを対象として、当該単語がドキュメントにおいて現れた回数と、ドキュメントにおけるすべての単語の総数との比を計算して、ドキュメントにおいて当該単語が現れる確率を取得することができる。つまり、任意のドキュメントにおいては、p(単語|ドキュメント)は既知であり、p(単語|トピック)及びp(トピック|ドキュメント)は未知である。トピックモデルはこのような原理に基づいて、大量の既知の「単語−ドキュメント」マトリックスp(単語|ドキュメント)を利用して、一連のトレーニングを行って、「単語−トピック」マトリックスp(単語|トピック)及び「トピック−ドキュメント」マトリックスp(トピック|ドキュメント)を推理して取得する。
さらに、トピックモデルは、確率的潜在意味解析(Probabilistic Latent Semantic Analysis,PLSA)、潜在的ディリクレ分布(Latent Dirichlet Allocation,LDA)、及びラベルを用いた潜在的ディリクレ分布(Label Latent Dirichlet Allocation,L−LDA)を含んでもよいが、これらに限られない。また、様々な応用シーンにおける必要に応じて、トピックモデルを拡大することもできる。例えば、PLSAモデルに単語の文脈情報、地理的位置の文脈情報などを引き込んでもよく、テキストコーパスの時間情報を引き込んでトピックの時間に伴う変化を研究してもよく、又は製品やブログ文章についてのユーザの採点情報を基本LDAモデルに引き込んでもよい。
選択的に、他の実施例として、複数の単語のうちの各単語と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素と、に対してマッチングを行うステップは、複数の単語のうちの各単語と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応するシーケンスパターンにおける頻出アイテム集合の中の少なくとも1つの頻出アイテムと、に対してマッチングを行うステップを含む。ここで、頻出アイテム集合は少なくとも1つの頻出アイテムの確信度を含む。また、マッチング結果に基づいて、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図の、質問との少なくとも1つの相関度を確定するステップは、少なくとも1つの頻出アイテムのうちから、複数の単語にマッチする頻出アイテムを特定して、特定した頻出アイテムの確信度に基づいて、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図の、質問との少なくとも1つの相関度を確定するステップを含む。
具体的に、シーケンスパターン(Sequence Pattern)とは、異なるシーケンスから構成された集合であり、その中の各シーケンスは順番に従って並んでいる異なる要素から構成されており、各要素(トランザクション)は異なる項目から構成されている。それに、ユーザにより決められた最小支持度閾値を提供する。シーケンスパターンマイニング(Sequence Pattern Mining)とは、すべての頻出サブシーケンスを見つけることである。すなわち、シーケンス集合において当該サブシーケンスが現れる頻度が、ユーザにより決められた最小支持度閾値以上でなければならない。言い換えると、まずはすべての頻出アイテム集合を見つける必要がある。これらのアイテム集合が現れる頻度は最低、予め設定された最小支持度に等しい。その次、頻出アイテム集合に基づいて相関ルールを生成する。これらのルールは、必ず最小支持度及び最小確信度に満たさなければならない。
ここで、相関ルールはデータに含まれている相関性を表す。例えば、商品Xを購入するユーザは商品Yを購入する頻度が高い。支持度(Support)は、商品Xと商品Yが同時に現れる確率を表す。商品Xと商品Yが同時に現れる確率が低ければ、商品Xと商品Yとの相関性が弱く、商品Xと商品Yが同時に現れる確率が高ければ、商品Xと商品Yとの相関性が強い。支持度の公式は
支持度({X,Y})={X,Y}を一緒に購入する人数/総人数
である。確信度(Confidence)は、商品Xを購入するユーザが商品Yを一緒に購入する確率を表す。確信度が高ければ(例えば、90%より高い)、商品Xを購入するユーザが商品Yを一緒に購入する可能性が高く、確信度が低ければ(例えば、10%より小さい)、商品Xを購入するユーザが商品Yを購入しない可能性が高い。確信度の公式は、
確信度(X−>Y)={X,Y}を同時に購入する人数/Xを購入する人数
である。なお、支持度には前後の順番が存在せず、すなわち{X,Y}の支持度と{Y,X}の支持度は同一である。
例えば、10000名のユーザのスーパーマーケットでの買い物記録をサンプルデータとする。その中、1000名のユーザが飲料水を購入しており、2000名のユーザがビールを購入しており、500名のユーザがパンを購入しており、800名のユーザが飲料水とビールを同時に購入しており、100名のユーザが飲料水とパンを同時に購入している。よって、{飲料水,ビール}の支持度(すなわち{飲料水,ビール}が同時に現れる確率)は800/10000=0.08となり、{飲料水,パン}の支持度は100/10000=0.01となり、(飲料水−>ビール)の確信度(すなわち飲料水を購入したユーザがビールを一緒に購入する確率)は800/1000=0.8となり、(ビール−>飲料水)の確信度は800/2000=0.4となる。
さらに、シーケンスマイニングアルゴリズムは、Aprioriアルゴリズム、一般的シーケンシャルパターン(Generalized Sequential Pattern,GSP)アルゴリズム、FreeSpanアルゴリズム及びPrefixSpanアルゴリズムを含んでもよいが、これらに限られない。Aprioriアルゴリズムは、相関ルールをマイニングする頻出アイテム集合アルゴリズムであり、その基本思想は、2つの段階(候補集合の生成及びストーリーの下向き封閉検出)によって頻出アイテム集合をマイニングすることである。GSPアルゴリズムはAprioriアルゴリズムに類似し、その基本思想は、データベースをスキャンするたびに、前回のスキャンによって生成された大シーケンスを用いて候補シーケンスを生成して、スキャンしながらそれらの支持度を計算し、支持度を満たす候補シーケンスを次回のスキャンで用いる大シーケンスと確定する。FreeSpanアルゴリズムは、パターン射影に基づくシーケンスマイニングアルゴリズムであり、その基本思想は、マイニング済みの頻出シーケンス集合を利用して、シーケンスデータベースの射影を再帰的に求めてより小さい射影データベースを取得し、各射影データベースでサブシーケンスを増長させる。PrefixSpanアルゴリズムはFreeSpanを改善したアルゴリズムであり、その基本思想は射影を行うときに、現れる可能性のあるすべての頻出サブシーケンスではなく、接頭辞シーケンスのみをチェックし、そして対応する接尾辞を射影して射影データベースを取得する。
本発明の他の一実施例において、質問に対応する回答を取得するステップは、質問に対して単語分割処理を行って、複数の単語を取得するステップと、複数の単語のうちの各単語と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素と、に対してマッチングを行うステップと、マッチング結果に基づいて、予め設定された対応するサブルーチンを実行して、サブルーチンに対応する回答を取得するステップと、を含む。
具体的には、単語分割処理で得られた複数の単語のうちの各単語と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素とがマッチするか否かを確認する。複数の単語のうちの各単語と、意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素とがマッチする場合、質問に対応する回答を直接取得して出力する。複数の単語のうちの各単語と、意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素とがマッチしない場合、回答をトリガーする少なくとも1つの重要要素を文脈意図推理の方法によって取得する。
さらに、類似度の高い順に沿って、意図データベースにおいて質問との類似度が高い複数の拡張質問のうちから1つの拡張質問を特定する。少なくとも1つの重要要素が消去されたあと、当該拡張質問に含まれている残りの少なくとも1つの単語が1つ前の質問の中に存在するか否かを確認する。少なくとも1つの重要要素が消去されたあと、当該拡張質問に含まれている残りの少なくとも1つの単語のうちのいずれの単語も1つ前の質問の中に存在しない場合、当該拡張質問を直接削除し、次の拡張質問が文脈意図の要件に満たすか否かを確認する。一方、少なくとも1つの重要要素が消去されたあと、当該拡張質問に含まれている残りの少なくとも1つの単語のうち、少なくとも1つの単語が1つ前の質問の中に存在する場合、当該拡張質問に対応する回答を取得して出力する。
本発明の他の一実施例において、推薦意図をユーザに送るステップは、推薦意図の質問文をユーザに送るステップを含む。また、当該質問応答インタラクション方法は、ユーザのフィードバックによって、推薦意図の質問文に対応する回答をユーザに送信するステップ、を更に含む。
具体的に、インテリジェント質問応答システムは、ユーザの質問に答えるとともに、推薦意図の質問文をユーザに送ることができる。さらに、ユーザのフィードバックによって、推薦意図の質問文に対応する回答をユーザに送信することができる。
ここでは、再び招商銀行のインテリジェントオンライン顧客サービスシステムを例とする。ユーザの質問が「私のクレジットカードに何ポイントがありますか」である場合、インテリジェントオンライン顧客サービスシステムの回答は、「現在使用可能なポイント:7600ポイント。ポイントで宝くじを引くイベントについてご興味がありますか?」となる。さらに、ユーザが「はい」と返事すると、インテリジェントオンライン顧客サービスシステムは「ポイントで宝くじを引くイベント」に対応する回答をユーザに送信する。
本発明の他の一実施例において、推薦意図をユーザに送るステップは、推薦意図の商品の内容をユーザに送るステップを含む。
具体的に、インテリジェント質問応答システムは推薦意図に対応する商品の内容をユーザに送ることができる。ここで、商品はバナナ、牛乳、ジャムなどの食品であってもよく、携帯電話、書籍、おもちゃなどの物品であってもよく、本発明はこれについて制限しない。また、商品の内容はイメージ、動画、リンクなどの形を有する広告内容を含んでもよいが、これらに限られない。
以上のすべての選択可能な技術案は、任意の組合せで本発明の選択可能な実施例を構成することができ、ここでは重複になる説明を省略する。
図2は、本発明の他の例示的な一実施例による質問応答インタラクション方法のフローチャートである。図2に示すよう、当該質問応答インタラクション方法は以下の内容を含む。
210:ユーザの質問を受信する。
本発明の実施例において、ユーザの質問は、1つの意図のみを含んでもよく、複数の意図を含んでもよく、本発明はこれについて制限しない。例えば、ユーザの質問が「クレジットカードの返済をしたい」である場合、当該質問には「クレジットカードの返済」という1つの意図しか含まれていない。もう1つの例として、ユーザの質問が「本日の北京と上海の天気を教えてください」である場合、当該質問には「北京の天気」及び「上海の天気」という2つの意図が含まれている。
なお、ユーザの質問はテキストメッセージ、音声メッセージ、イメージメッセージ、画像メッセージ及び動画メッセージのうちの1つ又は複数を含むことができる。さらに、ユーザの質問には句読点が含まれてもよく、句読点が含まれなくてもよい。
220:質問に対して単語分割処理を行って、複数の単語を取得する。
本発明の実施例において、予め設定された単語分割ルール及び予め構築された単語分割辞書に基づいて、ユーザの質問に対して単語分割処理を行って、複数の単語を取得する。ここで、単語分割ルールは、フォワード最大マッチング法、バックワード最大マッチング法、単語ごと確認法又は単語頻度統計法、最少切り分け法、双方向マッチング法などを含んでもよいが、それらに限られない。単語分割処理は、双方向最大マッチング法、ビタビアルゴリズム、隠れマルコフモデルアルゴリズム及び条件付き確率場アルゴリズムのうちの1つ又は複数を採用することができる。
なお、本発明において質問に対して処理を行う手段は単語分割処理に限られず、他の適切な手段(例えば、センテンス分割処理、単語組合せなど)であってもよい。
230:複数の単語のうちの各単語と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応するトピックモデルにおける少なくとも1つの重要要素と、に対してマッチングを行い、ここで、トピックモデルは少なくとも1つの重要要素の確率を含む。
本発明の実施例においては、複数の単語のうちの各単語に対して語義解析を行うことによって、複数の単語の語義情報を取得し、語義情報と予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応するトピックモデルにおける少なくとも1つの重要要素とに対して語義類似度の計算を行い、最も語義類似度の高い重要要素を特定して、マッチする少なくとも1つの重要要素として確定する。
トピックモデルは少なくとも1つの重要要素の確率を含んでもよい。ここで、トピックモデルは非構造化データを処理するためのよく使われている方法であり、その主要な機能がテキストデータから潜在的なトピック情報を抽出することである。トピックモデルにおいて、1つのトピックモデルのトピックは、実は語彙表における単語の確率分布である。また、ルール又は辞書に基づく他の検索方法とは違い、トピックモデルは教師なし学習方法である。
240:少なくとも1つの重要要素のうちの、複数の単語にマッチする重要要素の確率に基づいて、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図の、質問との少なくとも1つの相関度を確定する。
本発明の実施例においては、語義類似度の計算結果に基づいて、マッチする少なくとも1つの重要要素のうちの各重要要素に対応する意図の、質問との少なくとも1つの相関度を確定する。ここで、語義類似度とは、複数の単語の語義情報と、意図データベースにおける複数の予め設定された意図知識との間の、文字及び単語レベルにおけるマッチ度合い、及び語義の高度近似性を指す。
さらに、語義類似度は、ベクトル空間モデルに基づく計算方法、隠れ語義インデクシングモデルに基づく計算方法、属性理論に基づく語義類似度計算方法及びハミング距離に基づく語義類似度計算方法のうちの1つ又は複数方法の組合せによって計算されることができる。なお、語義類似度の計算方法は他の語義類似度を計算する方法であってもよい。
250:少なくとも1つの相関度のうちから、予め設定された相関度閾値を超えた相関度を特定して、特定した相関度に対応する意図を推薦意図として確定する。
本発明の実施例において、相関度は以下の方法によって算出されることができる。ユーザとインテリジェント質問応答システムとのインタラクション日誌から、ユーザが最初の質問を聞いたあとに追加で聞いた複数の質問を特定し、追加で聞かれた複数の質問のうちの各質問に対応する人数を統計し、統計結果に基づいて各質問に対応する人数がインタラクション日誌において占める割合を計算する。
さらに、算出された相関度を相関度閾値に比較する。相関度が相関度閾値より大きい場合、当該相関度に対応する意図を推薦意図として確定し、相関度が相関度閾値より小さい場合、当該相関度に対応する意図を無視する。
なお、相関度閾値は予め設定されたものであってもよく、実際の必要に応じて調整されてもよく、本発明はこれについて制限しない。
260:回答をユーザに送信するとともに、推薦意図をユーザに送る。
本発明の実施例において、インテリジェント質問応答システムは、ユーザに回答を送信するとともに、推薦意図の質問文をユーザに送り、さらにユーザの返事によって、推薦意図の質問文に対応する回答をユーザに送信することができる。又は、ユーザに回答を送信するとともに、推薦意図の商品の内容を送ることもできる。本発明はそれについて制限しない。また、テキスト、音声、イメージ、リンクなどの形で回答をユーザに提供することができる。
本発明の実施例により提供される技術案によると、トピックモデルを利用することによって、ドキュメントに対応するトピックを膨大なデータから見つけることができ、さらに、トピックに基づいて、当該トピックに属する単語が決められる確率を確認することができる。したがって、テキスト情報の処理能力を向上させ、自発的なマーケティングを実現し、ユーザ体験をより一層向上させることができる。
以下、京東社(JD.com)のインテリジェント質問応答システムを例として、前述の質問応答インタラクション方法について詳しく説明する。
具体的に、インテリジェント質問応答システムには予め設定されたトピックモデルが記憶されている。当該トピックモデルは4つのトピック、すなわちトピック1、トピック2、トピック3及びトピック4を含んでいる。ここで、トピック1、トピック2、トピック3及びトピック4の語彙表における単語の確率分布は、表1に示す通りである。なお、本発明の実施例で使用している第1、第2などの限定的な単語は、本発明の実施例による技術案をより明確に説明するために使用されるものに過ぎず、本発明の保護範囲を制限するためのものではない。
Figure 2021518019
ユーザAの質問が「アップルと梨のどっちがおいしい?」であり、ユーザBの質問が「アップルとアンドロイド(登録商標)のどっちが使いやすい?」であると仮定すると、インテリジェント質問応答システムは予め設定された単語分割ルール及び予め構築された単語分割辞書に基づいて、接頭辞、接尾辞及びストップワードなどを除去する手法などによって、以上の質問のそれぞれに対して単語分割処理を行う。その結果、ユーザAの質問に対応する単語が「アップル」、「梨」及び「おいしい」となり、ユーザBの質問に対応する単語が「アップル」、「アンドロイド」及び「使いやすい」となる。
さらに、ユーザAの質問に対応する単語「アップル」、「梨」及び「おいしい」と、予め設定されたトピックモデルにおける各トピックの語彙表にある単語と、に対して比較する。比較結果からわかるよう、トピック3に属する確率が最も高い。よって、トピック3に対応する商品の広告内容をユーザAに送る。同じく、ユーザBの質問に対応する単語「アップル」、「アンドロイド」及び「使いやすい」と、予め設定されたトピックモデルにおける各トピックの語彙表にある単語と、に対して比較する。比較結果からわかるよう、トピック1に属する確率が最も高い。よって、トピック1に対応する商品の広告内容をユーザBに送る。
図3は、本発明の他の例示的な一実施例による質問応答インタラクション方法のフローチャートである。図3に示すように、当該質問応答インタラクション方法は以下の内容を含む。
310:ユーザの質問を受信する。
320:質問に対して単語分割処理を行って、複数の単語を取得する。
330:複数の単語のうちの各単語と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応するシーケンスパターンにおける頻出アイテム集合の中の少なくとも1つの頻出アイテムと、に対してマッチングを行う。ここで、頻出アイテム集合は少なくとも1つの頻出アイテムの確信度を含む。
340:少なくとも1つの頻出アイテムのうちから、複数の単語にマッチする頻出アイテムを特定して、特定した頻出アイテムの確信度に基づいて、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図の、質問との少なくとも1つの相関度を確定する。
350:少なくとも1つの相関度のうちから、予め設定された相関度閾値を超えた相関度を特定して、特定した相関度に対応する意図を推薦意図として確定する。
360:回答をユーザに送信するとともに、推薦意図をユーザに送る。
本発明の実施例により提供される技術案は、シーケンスパターンを利用することによって、ユーザ行為に対してモデル構築を行うことができ、したがって、ユーザの過去の行為に基づいてユーザの将来の行為を予測することができる。このように、自発的な商品マーケティングを実現するとともに、ユーザ体験をより一層向上させることができる。
以下、中国移動社(チャイナモバイル,China Mobile)のインテリジェント質問応答システムを例として、前述の質問応答インタラクション方法について詳しく説明する。
具体的に、インテリジェント質問応答システムには予め設定されたシーケンスパターンが記憶されている。当該シーケンスパターンは、ユーザの行為データに基づくビッグデータ分析によって得られたものである。ここで、プランのシーケンスパターンを例とする。ほとんどのユーザは、「プラン」を選択してから「GSM(Global System for Mobile communications)プラン」を選択しており、「GSMプラン」を選択してから「GSMデータ通信プラン」を選択しており、「GSMデータ通信プラン」を選択してから「GSMデータ通信プラン58元コース」を選択しており、「GSMデータ通信プラン58元コース」を選択してから「GSMデータ通信プラン58元コースを契約する」を選択している。表2においては、プランのシーケンスパターンにおける各項目の確信度を示す。
Figure 2021518019
以下、中国移動社(チャイナモバイル,China Mobile)のインテリジェント質問応答システムを例として、前述の質問応答インタラクション方法について詳しく説明する。
ユーザが中国移動のクライアントを登録して「プラン」をクリックする場合、表2の左側にあるデータからわかるよう、「GSMデータ通信プラン」の確信度が最も高い。つまり、ユーザは「プラン」を選択したあとに「GSMデータ通信プラン」を選択する可能性が高い。よって、ユーザが「プラン」をクリックしたと検出したら、インテリジェント質問応答システムは自発的に「GSMデータ通信プラン」をユーザに送る。さらに、表2の右側のデータからわかるよう、「GSMデータ通信プラン58元コース」の確信度が最も高い。つまり、ユーザは「GSMデータ通信プラン」を選択したあとに「GSMデータ通信プラン58元コース」を選択する可能性が高い。よって、ユーザが「GSMデータ通信プラン」をクリックしたと検出したら、インテリジェント質問応答システムは自発的に「GSMデータ通信プラン58元コース」をユーザに送る。
図4は、本発明の他の例示的な一実施例による質問応答インタラクション方法のフローチャートである。図4に示すように、当該質問応答インタラクション方法は以下の内容を含む。
410:ユーザの質問を受信する。
420:質問に対して単語分割処理を行って、複数の単語を取得する。
430:複数の単語のうちの各単語と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素と、に対してマッチングを行う。
440:複数の単語のうちの各単語と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素とがマッチするか否かを確認する。
450:複数の単語のうちの各単語と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素とがマッチする場合、対応する回答を出力する。
460:複数の単語のうちの各単語と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素とがマッチしない場合、回答をトリガーする少なくとも1つの重要要素を文脈意図推理の方法によって取得する。
本発明の実施例により提供される技術案は、文脈意図推理のプロセスを実行することによって、意図データベース構築の困難さを低減させ、計算効率を向上させ、質問応答インタラクションのプロセスを簡略化させ、複数のセンテンスから新しい意図を構成することを実現することができる。
以下、家購入のインテリジェント質問応答システムを例として、前述の質問応答インタラクション方法について詳しく説明する。
具体的に、インテリジェント質問応答システムの意図データベースには、予め設定された意図知識が記憶されている。当該意図知識は、第1の意図知識「私は家を買う」、第2の意図知識「家を買うためには如何にローンを借りるか」、第3の意図知識「ローンを借りるためにどのような条件を満足すればよいか」及び第4の意図知識「家を買うためのローンを借りるための条件がどうなっているか」などを含むことができる。これらの意図知識に対応する表現式はそれぞれ、[家を買う]、[家を買う][如何に][ローンを借りる]、[ローンを借りる][どのような][条件]、及び、[家を買う][ローンを借りる][条件][どうなっている]となる。
次に、ユーザの1つ目の質問が「私は家を買う」であると仮定すると、1つ目の質問に対して単語分割処理を行って、複数の単語「私」、「は」及び「家を買う」を取得することができる。「家を買う」という単語が第1の意図知識に対応する表現式[家を買う]に直接マッチするため、続いて2つ目の質問に進入する。ユーザの2つ目の質問が「どうやってローンを借りるか」であると仮定すると、2つ目の質問に対して単語分割処理を行って、単語の「どうやって」及び「ローンを借りる」を取得することができる。意図データベースにおいては単語「どうやって」及び「ローンを借りる」にマッチする意図知識を直接見つけることができないため、文脈意図推理のサブルーチンを実行する。
ここで、1つ目の質問に対しては文脈意図推理によって回答を取得するではないため、意図データベースから2つ目の質問「どうやってローンを借りるか」に近似する拡張質問を見つける必要がある。さらに、類似度の高い順で拡張質問に対して順位付けして、拡張質問の候補集合を取得する。当該拡張質問の候補集合は、第1の拡張質問[ローンを借りる][どのような][条件]、第2の拡張質問[家を買う][如何に][ローンを借りる]及び第3の拡張質問[家を買う][ローンを借りる][条件][どうなっている]を含むことができる。
さらに、第1の拡張質問[ローンを借りる][どのような][条件]から、2つ目の質問における単語「ローンを借りる」を消去すると、残りの単語が「条件」(必須項目)と「どのような」(選択項目)となる。この2つの単語はいずれも1つ目の質問「私は家を買う」で見つけることができないため、拡張質問の候補集合から第1の拡張質問を削除し、引き続き第2の拡張質問に対して同様な処理プロセスを実行する。第2の拡張質問[家を買う][如何に][ローンを借りる]から、2つ目の質問における単語「ローンを借りる」を消去すると、残りの単語が「家を買う」と「如何に」となる。単語「家を買う」は、1つ目の質問「私は家を買う」で見つけることができるため、第2の拡張質問は文脈意図の要件を満足する。よって、「家を買うためには如何にローンを借りるか」に対応する回答を出力する。
以下は、本発明に係る装置の実施例であり、本発明に係る方法の実施例を実行するために用いられることができる。本発明に係る装置の実施例において詳しく説明されていない細部については、本発明に係る方法の実施例を参照すればよい。
図5は、本発明の例示的な一実施例による質問応答インタラクション装置500のブロック図である。図5に示すように、当該質問応答インタラクション装置500は、受信モジュール510と、取得モジュール520と、確定モジュール530と、送信モジュール540と、を備える。
受信モジュール510は、ユーザの質問を受信する。
取得モジュール520は、質問に対応する回答を取得するとともに、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図の質問との少なくとも1つの相関度を取得する。
確定モジュール530は、少なくとも1つの相関度のうちから、予め設定された相関度閾値を超えた相関度を特定して、特定した相関度に対応する意図を推薦意図として確定する。
送信モジュール540は、回答をユーザに送信するとともに、推薦意図をユーザに送る。
本発明の実施例により提供される技術案は、ユーザの質問を受信し、質問に対応する回答と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図の質問との少なくとも1つの相関度と、を取得し、少なくとも1つの相関度のうちから予め設定された相関度閾値を超えた相関度を特定して、特定した相関度に対応する意図を推薦意図として確定し、ユーザに回答を送信するとともに推薦意図をユーザに送ることによって、計算効率を向上させ、質問応答インタラクションのプロセスを簡略化させることができる。
本発明の他の一実施例において、取得モジュール520は、質問に対して単語分割処理を行って複数の単語を取得する処理ユニット5201と、複数の単語のうちの各単語と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素と、に対してマッチングを行うマッチングユニット5202と、マッチング結果に基づいて、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図の質問との少なくとも1つの相関度を確定する確定ユニット5203と、を備える。
本発明の他の一実施例において、マッチングユニット5202は、複数の単語のうちの各単語と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応するトピックモデルにおける少なくとも1つの重要要素と、に対してマッチングを行う。ここで、トピックモデルは少なくとも1つの重要要素の確率を含む。また、確定ユニット5203は、少なくとも1つの重要要素のうちから、複数の単語にマッチする重要要素を特定して、特定した重要要素の確率に基づいて、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図の質問との少なくとも1つの相関度を確定する。
本発明の他の一実施例において、マッチングユニット5202は、複数の単語のうちの各単語と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応するシーケンスパターンにおける頻出アイテム集合の中の少なくとも1つの頻出アイテムと、に対してマッチングを行う。ここで、頻出アイテム集合は少なくとも1つの頻出アイテムの確信度を含む。また、確定ユニット5203は、少なくとも1つの頻出アイテムのうちから、複数の単語にマッチする頻出アイテムを特定して、特定した頻出アイテムの確信度に基づいて、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図の質問との少なくとも1つの相関度を確定する。
本発明の他の一実施例において、取得モジュール520は、質問に対して単語分割処理を行って複数の単語を取得する処理ユニット5201と、複数の単語のうちの各単語と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素と、に対してマッチングを行うマッチングユニット5202と、マッチング結果に基づいて、予め設定された対応するサブルーチンを実行して、サブルーチンに対応する回答を取得する実行ユニット5204と、を備える。
本発明の他の一実施例において、実行ユニット5204は、複数の単語のうちの各単語と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素とがマッチするか否かを確認する。複数の単語のうちの各単語と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素とがマッチする場合、対応する回答を出力する。又は、複数の単語のうちの各単語と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素とがマッチしない場合、回答をトリガーする少なくとも1つの重要要素を文脈意図推理の方法によって取得する。
本発明の他の一実施例において、図5による質問応答インタラクション装置500は、インタラクション日誌に記載の少なくとも1つのユーザのうちの各ユーザからの複数の質問に基づいて、ビッグデータ分析の方法を採用して、予め構築された意図データベースを構築するベース構築モジュール550を更に備える。ここで、予め構築された意図データベースは、少なくとも1つの意図のうちの各意図と少なくとも1つの重要要素との対応関係を含む。
本発明の他の一実施例において、送信モジュール540は、推薦意図の質問文をユーザに送り、ユーザのフィードバックによって推薦意図の質問文に対応する回答をユーザに送信する。
本発明の他の一実施例において、送信モジュール540は、推薦意図の商品の内容をユーザに送る。
以上の装置における各モジュールの機能及び作用を実現するための詳しいプロセスについては、前述の方法における対応するステップを参照すればよく、ここでは再び説明しない。
図6は、本発明の他の例示的な一実施例による質問応答インタラクション装置600のブロック図である。図6に示すように、当該質問応答インタラクション装置600は、受信モジュール610と、処理モジュール620と、マッチングモジュール630と、確定モジュール640と、送信モジュール650と、を備える。
受信モジュール610は、ユーザの質問を受信する。
処理モジュール620は、質問に対して単語分割処理を行って、複数の単語を取得する。
マッチングモジュール630は、複数の単語のうちの各単語と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応するトピックモデルにおける少なくとも1つの重要要素と、に対してマッチングを行う。ここで、トピックモデルは少なくとも1つの重要要素の確率を含む。
確定モジュール640は、少なくとも1つの重要要素のうちから、複数の単語にマッチする重要要素を特定して、特定した重要要素の確率に基づいて、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図の質問との少なくとも1つの相関度を確定するとともに、少なくとも1つの相関度のうちから、予め設定された相関度閾値を超えた相関度を特定して、特定した相関度に対応する意図を推薦意図として確定する。
送信モジュール650は、回答をユーザに送信するとともに、推薦意図をユーザに送る。
本発明の実施例により提供される技術案によると、トピックモデルを利用することによって、ドキュメントに対応するトピックを膨大なデータから見つけることができ、さらに、トピックに基づいて、当該トピックに属する単語が決められる確率を確認することができる。したがって、テキスト情報の処理能力を向上させ、自発的なマーケティングを実現し、ユーザ体験をより一層向上させることができる。
図7は、本発明の他の例示的な一実施例による質問応答インタラクション装置700のブロック図である。図7に示すように、当該質問応答インタラクション装置700は、受信モジュール710と、処理モジュール720と、マッチングモジュール730と、確定モジュール740と、送信モジュール750と、を備える。
受信モジュール710は、ユーザの質問を受信する。
処理モジュール720は、質問に対して単語分割処理を行って、複数の単語を取得する。
マッチングモジュール730は、複数の単語のうちの各単語と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応するシーケンスパターンにおける頻出アイテム集合の中の少なくとも1つの頻出アイテムと、に対してマッチングを行う。ここで、頻出アイテム集合は少なくとも1つの頻出アイテムの確信度を含む。
確定モジュール740は、少なくとも1つの頻出アイテムのうちから、複数の単語にマッチする頻出アイテムを特定して、特定した頻出アイテムの確信度に基づいて、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図の質問との少なくとも1つの相関度を確定するとともに、少なくとも1つの相関度のうちから、予め設定された相関度閾値を超えた相関度を特定して、特定した相関度に対応する意図を推薦意図として確定する。
送信モジュール750は、回答をユーザに送信するとともに、推薦意図をユーザに送る。
本発明の実施例により提供される技術案は、シーケンスパターンを利用することによって、ユーザ行為に対してモデル構築を行うことができ、したがって、ユーザの過去の行為に基づいてユーザの将来の行為を予測することができる。このように、自発的な商品マーケティングを実現するとともに、ユーザ体験をより一層向上させることができる。
図8は、本発明の他の例示的な一実施例による質問応答インタラクション装置800のブロック図である。図8に示すように、当該質問応答インタラクション装置800は、受信モジュール810と、処理モジュール820と、マッチングモジュール830と、確定モジュール840と、を備える。
受信モジュール810は、ユーザの質問を受信する。
処理モジュール820は、質問に対して単語分割処理を行って、複数の単語を取得する。
マッチングモジュール830は、複数の単語のうちの各単語と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素と、に対してマッチングを行う。
確定モジュール840は、複数の単語のうちの各単語と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素とがマッチするか否かを確認する。複数の単語のうちの各単語と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素とがマッチする場合、対応する回答を出力する。一方、複数の単語のうちの各単語と、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素とがマッチしない場合、回答をトリガーする少なくとも1つの重要要素を文脈意図推理の方法によって取得する。
本発明の実施例により提供される技術案は、文脈意図推理のプロセスを実行することによって、意図データベース構築の困難さを低減させ、計算効率を向上させ、質問応答インタラクションのプロセスを簡略化させ、複数のセンテンスから新しい意図を構成することを実現することができる。
図9は、本発明の例示的な一実施例により提供される、質問応答インタラクションを行うための装置900のブロック図である。
図9に示すように、装置900は、1つ又は複数のプロセッサを含むプロセッサコンポネント910と、メモリ920により代表されてプロセッサコンポネント910により実行可能な命令(例えば、アプリケーション)を記憶するメモリリソースと、を備える。メモリ920の中に記憶されるアプリケーションは、それぞれ1セットの命令に対応する1つ又は複数のモジュールを含んでもよい。また、プロセッサコンポネント910は命令を実行するように配置されて、前述の質問応答インタラクション方法を実行する。
装置900は、装置900の電源管理を実行するように配置される電源コンポネント930と、装置900をネットワークに接続させるように配置される有線又は無線のネットワークコネクタ940と、入出力(I/O)コネクタ950と、を更に備えてもよい。装置900は、メモリ920に記憶された操作システム、例えば、Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM、又は類似のシステムを操作することができる。
非一時的なコンピュータ読取可能な記憶媒体であって、当該記憶媒体に記憶されている命令が上述の装置900のプロセッサにより実行されると、上述の装置900は質問応答インタラクション方法を実行することができる。ユーザの質問を受信するステップと、質問に対応する回答を取得するとともに、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図の、質問との少なくとも1つの相関度を取得するステップと、少なくとも1つの相関度のうちから、予め設定された相関度閾値を超えた相関度を特定して、特定した相関度に対応する意図を推薦意図として確定するステップと、回答をユーザに送信するとともに推薦意図をユーザに送るステップと、を含む。
当業者であれば理解できる通り、本願により開示された実施例による例示的なユニット及びアルゴリズムのステップは、電子ハードウェア又はコンピュータソフトウェアと電子ハードウェアとの組み合わせにより実現されることができる。これらの機能がハードウェアとソフトウェアのいずれにより実行されるかは、技術案が応用されるシーンと設計上の拘束条件によって決められる。専門的な技術者は、応用シーンによって適切な方法を選んで前述の機能を実現することができる。ただし、このような実現は本発明の範囲に属するべきである。
なお、上述のシステム、装置及びユニットの詳しい作業プロセスについては、前述の方法の実施例における相応のプロセスを参照すればよいため、便利で簡潔に記述するためにここでは説明を省略する。
また、本発明により提供される実施例において開示されたシステム、装置及び方法は、他の形態によって実現されることも可能である。例えば、上述の装置の実施例は単なる概略的なものである。例えば、上述のユニットの分け方は単なるロジック機能の分け方に過ぎず、実際に実現するときには別の分け方を使用してもよい。例えば、複数のユニットやコンポネントは、組み合わせられてもよく、別のシステムに集積されたてもよく、一部の特徴が省略されてもよく、実行されなくてもよい。また、開示又は議論された、互いに結合すること又は直接に結合すること或いは通信接続することは、一部のコネクタを介してもよく、装置やユニットの間接的な結合又は通信接続は、電気的でもよく、機械的又は他の形式であってもよい。
分離した部品として説明された上述のユニットは、物理的に分離したものであっても、そうでなくてもよい。ユニットの形で示された部品は、物理的なユニットであってもよく、そうでなくてもよい。つまり、1つの場所に位置してもよく、複数のネットワークユニットに分布してもよい。実際の必要によって、そのうちの一部又は全部のユニットを選択して、本実施例の技術案の目的を達成するために用いることができる。
また、本発明の各実施例における各機能ユニットは、1つのプロセッサーユニットに集積されてもよく、各ユニットが単独で物理的に存在してもよく、2つ以上のユニットが1つのユニットに集積されてもよい。
上述の機能がソフトウェアの機能ユニットの形で実現され且つ独立した製品として販売又は使用される場合、コンピュータ読取可能な記憶媒体に記憶されてもよい。このような理解に基づき、本発明の技術案の本質は、言い換えると従来技術に貢献した部分は、更に言い換えると当該技術案の部分は、ソフトウェア製品の形で表現されることが可能である。当該コンピュータソフトウェア製品は、記憶媒体に記憶されており、コンピュータ設備(パソコン、サーバー、又はネットワーク設備などであってもよい)が本発明の各実施例において説明された方法のすべて又は一部のステップを実行させる幾つかの命令を含む。なお、上述の記憶媒体は、USBメモリ、リムーバブルメディア、リードオンリーメモリ(ROM,Read−Only Memory)、ランダムアクセスメモリ(RAM,Random Access Memory)、磁気ディスク又はコンパクトディスクなどの、プログラム識別コードを記憶できる様々な媒体を含む。
以上の内容は、本発明の具体的な実施形態に過ぎない。本発明の保護範囲は以上の内容に限られない。当業者であれば、本発明により開示されている技術範囲に基づいて、変化や置換を容易になし得ることができ、このような変化や置換はすべて本発明の保護範囲に属するべきである。つまり、本発明の保護範囲は、特許請求の範囲である。

Claims (20)

  1. ユーザの質問を受信するステップと、
    前記質問に対応する回答を取得するとともに、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図の、前記質問との少なくとも1つの相関度を取得するステップと、
    前記少なくとも1つの相関度のうちから、予め設定された相関度閾値を超えた相関度を特定して、特定した相関度に対応する意図を推薦意図として確定するステップと、
    前記回答を前記ユーザに送信するとともに、前記推薦意図を前記ユーザに送るステップと、を含む
    ことを特徴とする質問応答インタラクション方法。
  2. 予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図の、前記質問との少なくとも1つの相関度を取得する前記ステップは、
    前記質問に対して単語分割処理を行って、複数の単語を取得するステップと、
    前記複数の単語のうちの各単語と、前記予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素と、に対してマッチングを行うステップと、
    マッチング結果に基づいて、前記予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図の、前記質問との少なくとも1つの相関度を確定するステップと、を含む
    ことを特徴とする請求項1に記載の質問応答インタラクション方法。
  3. 前記複数の単語のうちの各単語と、前記予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素と、に対してマッチングを行う前記ステップは、
    前記複数の単語のうちの各単語と、前記予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応するトピックモデルにおける少なくとも1つの重要要素と、に対してマッチングを行うステップを含み、
    前記トピックモデルは前記少なくとも1つの重要要素の確率を含み、
    マッチング結果に基づいて、前記予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図の、前記質問との少なくとも1つの相関度を確定する前記ステップは、
    前記少なくとも1つの重要要素のうちから、前記複数の単語にマッチする重要要素を特定して、特定した重要要素の確率に基づいて、前記予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図の、前記質問との少なくとも1つの相関度を確定するステップを含む
    ことを特徴とする請求項2に記載の質問応答インタラクション方法。
  4. 前記複数の単語のうちの各単語と、前記予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素と、に対してマッチングを行う前記ステップは、
    前記複数の単語のうちの各単語と、前記予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応するシーケンスパターンにおける頻出アイテム集合の中の少なくとも1つの頻出アイテムと、に対してマッチングを行うステップを含み、
    前記頻出アイテム集合は、前記少なくとも1つの頻出アイテムの確信度を含み、
    マッチング結果に基づいて、前記予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図の、前記質問との少なくとも1つの相関度を確定する前記ステップは、
    前記少なくとも1つの頻出アイテムのうちから、前記複数の単語にマッチする頻出アイテムを特定して、特定した頻出アイテムの確信度に基づいて、前記予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図の、前記質問との少なくとも1つの相関度を確定するステップを含む
    ことを特徴とする請求項2に記載の質問応答インタラクション方法。
  5. 前記質問に対応する回答を取得する前記ステップは、
    前記質問に対して単語分割処理を行って、複数の単語を取得するステップと、
    前記複数の単語のうちの各単語と、前記予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素と、に対してマッチングを行うステップと、
    マッチング結果に基づいて、予め設定された対応するサブルーチンを実行して、前記サブルーチンに対応する回答を取得するステップと、を含む
    ことを特徴とする請求項1に記載の質問応答インタラクション方法。
  6. 予め設定された対応するサブルーチンを実行する前記ステップは、
    前記複数の単語のうちの各単語と、前記予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素とがマッチするか否かを確認するステップと、
    前記複数の単語のうちの各単語と、前記予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素とがマッチする場合、対応する回答を出力するか、又は、前記複数の単語のうちの各単語と、前記予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素とがマッチしない場合、回答をトリガーする少なくとも1つの重要要素を文脈意図推理の方法によって取得するステップと、を含む
    ことを特徴とする請求項5に記載の質問応答インタラクション方法。
  7. インタラクション日誌に記載の少なくとも1つのユーザのうちの各ユーザからの複数の質問に基づいて、ビッグデータ分析の方法を採用して、前記予め構築された意図データベースを構築するステップ、を更に含み、
    前記予め構築された意図データベースは前記少なくとも1つの意図のうちの各意図と少なくとも1つの重要要素との対応関係を含む
    ことを特徴とする請求項1ないし6のいずれか一項に記載の質問応答インタラクション方法。
  8. 前記推薦意図を前記ユーザに送る前記ステップは、前記推薦意図の質問文を前記ユーザに送るステップを含み、
    前記質問応答インタラクション方法は、
    前記ユーザのフィードバックによって、前記推薦意図の質問文に対応する回答を前記ユーザに送信するステップ、を更に含む
    ことを特徴とする請求項1又は2に記載の質問応答インタラクション方法。
  9. 前記推薦意図を前記ユーザに送る前記ステップは、
    前記推薦意図の商品の内容を前記ユーザに送るステップ、を含む
    ことを特徴とする請求項1又は2に記載の質問応答インタラクション方法。
  10. ユーザの質問を受信する受信モジュールと、
    前記質問に対応する回答を取得するとともに、予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図の、前記質問との少なくとも1つの相関度を取得する取得モジュールと、
    前記少なくとも1つの相関度のうちから、予め設定された相関度閾値を超えた相関度を特定して、特定した相関度に対応する意図を推薦意図として確定する確定モジュールと、
    前記回答を前記ユーザに送信するとともに、前記推薦意図を前記ユーザに送る送信モジュールと、を備える
    ことを特徴とする質問応答インタラクション装置。
  11. 前記取得モジュールは、
    前記質問に対して単語分割処理を行って複数の単語を取得する処理ユニットと、
    前記複数の単語のうちの各単語と、前記予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素と、に対してマッチングを行うステップマッチングユニットと、
    マッチング結果に基づいて、前記予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図の、前記質問との少なくとも1つの相関度を確認する確定ユニットと、を備える
    ことを特徴とする請求項10に記載の質問応答インタラクション装置。
  12. 前記マッチングユニットは、前記複数の単語のうちの各単語と、前記予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応するトピックモデルにおける少なくとも1つの重要要素と、に対してマッチングを行い、
    前記トピックモデルは前記少なくとも1つの重要要素の確率を含み、
    前記確定ユニットは、前記少なくとも1つの重要要素のうちから、前記複数の単語にマッチする重要要素を特定して、特定した重要要素の確率に基づいて、前記予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図の、前記質問との少なくとも1つの相関度を確認する
    ことを特徴とする請求項11に記載の質問応答インタラクション装置。
  13. 前記マッチングユニットは、前記複数の単語のうちの各単語と、前記予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応するシーケンスパターンにおける頻出アイテム集合の中の少なくとも1つの頻出アイテムと、に対してマッチングを行い、
    前記頻出アイテム集合は前記少なくとも1つの頻出アイテムの確信度を含み、
    前記確定ユニットは、前記少なくとも1つの頻出アイテムのうちから、前記複数の単語にマッチする頻出アイテムを特定して、特定した頻出アイテムの確信度に基づいて、前記予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図の、前記質問との少なくとも1つの相関度を確認する
    ことを特徴とする請求項11に記載の質問応答インタラクション装置。
  14. 前記取得モジュールは、
    前記質問に対して単語分割処理を行って複数の単語を取得する処理ユニットと、
    前記複数の単語のうちの各単語と、前記予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素と、に対してマッチングを行うマッチングユニットと、
    マッチング結果に基づいて、予め設定された対応するサブルーチンを実行して、前記サブルーチンに対応する回答を取得する実行ユニットと、を備える
    ことを特徴とする請求項10に記載の質問応答インタラクション装置。
  15. 前記実行ユニットは、
    前記複数の単語のうちの各単語と、前記予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素とがマッチするか否かを確認し、
    前記複数の単語のうちの各単語と、前記予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素とがマッチする場合、対応する回答を出力し、
    前記複数の単語のうちの各単語と、前記予め構築された意図データベースにおける少なくとも1つの意図のうちの各意図に対応する少なくとも1つの重要要素とがマッチしない場合、回答をトリガーする少なくとも1つの重要要素を、文脈意図推理の方法によって取得する
    ことを特徴とする請求項14に記載の質問応答インタラクション装置。
  16. インタラクション日誌に記載の少なくとも1つのユーザのうちの各ユーザからの複数の質問に基づいて、ビッグデータ分析の方法を採用して、前記予め構築された意図データベースを構築するベース構築モジュール、を更に備え、
    前記予め構築された意図データベースは、前記少なくとも1つの意図のうちの各意図の、少なくとも1つの重要要素との対応関係を含む
    ことを特徴とする請求項10ないし15のいずれか一項に記載の質問応答インタラクション装置。
  17. 前記送信モジュールは、前記推薦意図の質問文を前記ユーザに送り、前記ユーザのフィードバックによって、前記推薦意図の質問文に対応する回答を前記ユーザに送信する
    ことを特徴とする請求項10又は11に記載の質問応答インタラクション装置。
  18. 前記送信モジュールは、前記推薦意図の商品の内容を前記ユーザに送る
    ことを特徴とする請求項10又は11に記載の質問応答インタラクション装置。
  19. メモリと、プロセッサと、前記メモリに記憶されて前記プロセッサにより実行可能な命令と、を備え、
    前記実行可能な命令が前記プロセッサにより実行されると、請求項1ないし9のいずれか一項に記載の質問応答インタラクション方法が実現される
    ことを特徴とするコンピュータデバイス。
  20. コンピュータ読取可能な記憶媒体であって、
    コンピュータにより実行可能な命令が記憶されており、
    前記実行可能な命令がプロセッサにより実行されると、請求項1ないし9のいずれか一項に記載の質問応答インタラクション方法が実現される
    ことを特徴とするコンピュータ読取可能な記憶媒体。
JP2020556316A 2018-04-16 2019-04-04 質問応答インタラクション方法、装置、コンピュータデバイス及びコンピュータ読取可能な記憶媒体 Active JP7127150B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201810339766.0 2018-04-16
CN201810339766.0A CN108536852B (zh) 2018-04-16 2018-04-16 问答交互方法和装置、计算机设备及计算机可读存储介质
PCT/CN2019/081434 WO2019201098A1 (zh) 2018-04-16 2019-04-04 问答交互方法和装置、计算机设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
JP2021518019A true JP2021518019A (ja) 2021-07-29
JP7127150B2 JP7127150B2 (ja) 2022-08-29

Family

ID=63480340

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020556316A Active JP7127150B2 (ja) 2018-04-16 2019-04-04 質問応答インタラクション方法、装置、コンピュータデバイス及びコンピュータ読取可能な記憶媒体

Country Status (5)

Country Link
JP (1) JP7127150B2 (ja)
CN (1) CN108536852B (ja)
PH (1) PH12020551699A1 (ja)
SG (1) SG11202010179QA (ja)
WO (1) WO2019201098A1 (ja)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108536852B (zh) * 2018-04-16 2021-07-23 上海智臻智能网络科技股份有限公司 问答交互方法和装置、计算机设备及计算机可读存储介质
CN111046148A (zh) * 2018-10-11 2020-04-21 上海智臻智能网络科技股份有限公司 智能交互系统及智能客服机器人
CN109711948A (zh) * 2019-01-09 2019-05-03 广州视源电子科技股份有限公司 物品推荐方法、装置、设备及存储介质
CN109902156B (zh) * 2019-01-09 2021-12-24 千城数智(北京)网络科技有限公司 实体检索方法、存储介质和电子设备
CN109753561B (zh) * 2019-01-16 2021-04-27 长安汽车金融有限公司 一种自动回复的生成方法及装置
CN109871439B (zh) * 2019-02-18 2020-12-22 华南理工大学 一种基于深度学习的问答社区问题路由方法
CN109977216A (zh) * 2019-04-01 2019-07-05 苏州思必驰信息科技有限公司 基于场景的对话推荐方法及系统
CN110516051A (zh) * 2019-07-26 2019-11-29 北京搜狗科技发展有限公司 一种数据处理方法、装置和电子设备
CN110737762A (zh) * 2019-10-09 2020-01-31 尹曦 一种基于语音交互的老年人个人信息助理系统
CN112784146A (zh) * 2019-11-04 2021-05-11 北京搜狗科技发展有限公司 一种数据处理方法、装置和用于数据处理的装置
CN111309888B (zh) * 2020-02-25 2023-10-24 百度在线网络技术(北京)有限公司 人机对话方法、装置、电子设备及存储介质
CN111488431B (zh) * 2020-04-08 2023-03-21 中国银行股份有限公司 命中确定方法、装置及系统
CN111581487B (zh) * 2020-05-11 2023-05-05 北京字节跳动网络技术有限公司 一种信息处理方法及装置
CN111625640B (zh) * 2020-06-11 2023-11-14 腾讯科技(深圳)有限公司 问答处理方法、装置及存储介质
CN111782965B (zh) * 2020-06-29 2023-08-11 北京百度网讯科技有限公司 意图推荐方法、装置、设备及存储介质
CN111984763B (zh) * 2020-08-28 2023-09-19 海信电子科技(武汉)有限公司 一种答问处理方法及智能设备
CN112131364B (zh) * 2020-09-22 2024-03-26 沈阳东软智能医疗科技研究院有限公司 问答方法、装置、电子设备和存储介质
CN112199489A (zh) * 2020-11-10 2021-01-08 平安普惠企业管理有限公司 客服系统中消息的处理方法、装置、设备及存储介质
CN112712800A (zh) * 2020-12-14 2021-04-27 杭州未名信科科技有限公司 应用于充电桩的数据处理方法、装置、存储介质及终端
CN113766253A (zh) * 2021-01-04 2021-12-07 北京沃东天骏信息技术有限公司 基于虚拟主播的直播方法、装置、设备及存储介质
CN114430490B (zh) * 2022-01-20 2024-06-04 阿里巴巴(中国)有限公司 直播问答及界面展示方法及计算机存储介质
CN117573985B (zh) * 2024-01-16 2024-04-05 四川航天职业技术学院(四川航天高级技工学校) 一种应用于智能化在线教育系统的信息推送方法及系统
CN117725185B (zh) * 2024-02-06 2024-05-07 河北神玥软件科技股份有限公司 智能对话生成方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012150524A (ja) * 2011-01-14 2012-08-09 Toshiba Corp 質問予測装置および質問予測方法
JP2015133047A (ja) * 2014-01-15 2015-07-23 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
JP2015204103A (ja) * 2014-04-11 2015-11-16 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 対話型の検索及び推奨方法並びにその装置
JP2017010517A (ja) * 2015-06-25 2017-01-12 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 人工知能によるヒューマン・マシン間の知能チャットの方法および装置

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7533081B2 (en) * 2004-02-06 2009-05-12 General Electric Company Systems, methods and apparatus to determine relevance of search results in whole/part search
CN101339551B (zh) * 2007-07-05 2013-01-30 日电(中国)有限公司 自然语言查询需求扩展设备及其方法
CN102722558B (zh) * 2012-05-29 2016-08-03 百度在线网络技术(北京)有限公司 一种为用户推荐提问的方法和装置
CN103810218B (zh) * 2012-11-14 2018-06-08 北京百度网讯科技有限公司 一种基于问题簇的自动问答方法和装置
JP2014119824A (ja) * 2012-12-13 2014-06-30 Toshiba Corp 推奨情報提供装置および推奨情報提供方法
CN104361506A (zh) * 2014-11-15 2015-02-18 任坤 一种基于用户问答方式的智能推荐商品方法及系统
CN104462553B (zh) * 2014-12-25 2019-02-26 北京奇虎科技有限公司 问答页面相关问题推荐方法及装置
CN104899188A (zh) * 2015-03-11 2015-09-09 浙江大学 一种基于问题主题和焦点的问题相似度计算方法
CN106919589A (zh) * 2015-12-24 2017-07-04 北京奇虎科技有限公司 用户问题分析方法和装置
CN105740476A (zh) * 2016-03-18 2016-07-06 科润智能科技股份有限公司 一种相关联问题推荐方法、装置及系统
CN106383875B (zh) * 2016-09-09 2019-10-15 北京百度网讯科技有限公司 基于人工智能的人机交互方法和装置
CN106528759B (zh) * 2016-11-04 2019-04-02 上海智臻智能网络科技股份有限公司 智能问答系统的信息处理方法及装置
CN107066568A (zh) * 2017-04-06 2017-08-18 竹间智能科技(上海)有限公司 基于用户意图预测的人机对话方法及装置
CN107146610B (zh) * 2017-04-10 2021-06-15 易视星空科技无锡有限公司 一种用户意图的确定方法及装置
CN108536852B (zh) * 2018-04-16 2021-07-23 上海智臻智能网络科技股份有限公司 问答交互方法和装置、计算机设备及计算机可读存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012150524A (ja) * 2011-01-14 2012-08-09 Toshiba Corp 質問予測装置および質問予測方法
JP2015133047A (ja) * 2014-01-15 2015-07-23 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
JP2015204103A (ja) * 2014-04-11 2015-11-16 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 対話型の検索及び推奨方法並びにその装置
JP2017010517A (ja) * 2015-06-25 2017-01-12 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 人工知能によるヒューマン・マシン間の知能チャットの方法および装置

Also Published As

Publication number Publication date
CN108536852B (zh) 2021-07-23
WO2019201098A1 (zh) 2019-10-24
CN108536852A (zh) 2018-09-14
PH12020551699A1 (en) 2021-07-12
JP7127150B2 (ja) 2022-08-29
SG11202010179QA (en) 2020-11-27

Similar Documents

Publication Publication Date Title
JP7127150B2 (ja) 質問応答インタラクション方法、装置、コンピュータデバイス及びコンピュータ読取可能な記憶媒体
US11334635B2 (en) Domain specific natural language understanding of customer intent in self-help
Li et al. Mining opinion summarizations using convolutional neural networks in Chinese microblogging systems
EP3717984B1 (en) Method and apparatus for providing personalized self-help experience
US20160306800A1 (en) Reply recommendation apparatus and system and method for text construction
CN116775847B (zh) 一种基于知识图谱和大语言模型的问答方法和系统
CN106095845B (zh) 文本分类方法和装置
Qaffas Improvement of Chatbots semantics using wit. ai and word sequence kernel: Education Chatbot as a case study
CN112307164A (zh) 信息推荐方法、装置、计算机设备和存储介质
CN116541493A (zh) 基于意图识别的交互应答方法、装置、设备、存储介质
CN114077661A (zh) 信息处理装置、信息处理方法和计算机可读介质
CN113342944B (zh) 一种语料泛化方法、装置、设备及存储介质
CN115455152A (zh) 写作素材的推荐方法、装置、电子设备及存储介质
CN114255067A (zh) 数据定价方法和装置、电子设备、存储介质
Pandiaraj et al. A Comparative Study on Emotion AI using Machine Learning and Deep Learning Models
CN114595377A (zh) 词汇推荐方法、装置、终端及可读存储介质
Zosa Analysis of News Media with Topic Models
ATTAPORN A Study on Detecting Domain-Specific Senses and its Application to Text Categorization
Lee et al. A Free Lunch in Generating Datasets: Building a VQG and VQA System with Attention and Humans in the Loop
Gliwa et al. Building sentiment lexicons based on recommending services for the Polish language
Chen et al. Automatic Personality Recognition via XLNet with Refined Highway and Switching Module for Chatbot
Aguado Sarrió MAS-based affective state analysis for user guiding in on-line social environments
CN115344679A (zh) 问题数据的处理方法、装置、计算机设备及存储介质
CN115292488A (zh) 意图跳转方法和装置、电子设备及存储介质
KR20230081295A (ko) 브랜드 평판 분석 서비스를 제공하기 위한 방법, 컴퓨터 장치, 및 컴퓨터 프로그램

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201013

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201013

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211119

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211214

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220222

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220719

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220817

R150 Certificate of patent or registration of utility model

Ref document number: 7127150

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150