JP7204801B2 - ニューラルネットワークに基づくマンマシンインタラクション方法、装置、及び媒体 - Google Patents
ニューラルネットワークに基づくマンマシンインタラクション方法、装置、及び媒体 Download PDFInfo
- Publication number
- JP7204801B2 JP7204801B2 JP2021045641A JP2021045641A JP7204801B2 JP 7204801 B2 JP7204801 B2 JP 7204801B2 JP 2021045641 A JP2021045641 A JP 2021045641A JP 2021045641 A JP2021045641 A JP 2021045641A JP 7204801 B2 JP7204801 B2 JP 7204801B2
- Authority
- JP
- Japan
- Prior art keywords
- user input
- information
- node
- nodes
- machine interaction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/008—Artificial life, i.e. computing arrangements simulating life based on physical entities controlled by simulated intelligence so as to replicate intelligent life forms, e.g. based on robots replicating pets or humans in their appearance or behaviour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
- G06F16/328—Management therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
- G06F18/2113—Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/29—Graphical models, e.g. Bayesian networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/247—Thesauruses; Synonyms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/041—Abduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/02—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail using automatic reactions or user delegation, e.g. automatic replies or chatbot-generated messages
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/042—Knowledge-based neural networks; Logical representations of neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Databases & Information Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Human Computer Interaction (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Robotics (AREA)
- Neurology (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- User Interface Of Digital Computer (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Feedback Control In General (AREA)
Description
特に明記されていない限り、この部分で説明されるいずれかの方法は、この部分に含まれるという理由だけで従来技術として見なされると仮定すべきではない。同様に、特に明記されていない限り、この部分で言及されている問題は、いかなる従来技術で知られていると見なされるべきではない。
本開示の別の態様によるコンピュータ読み取り可能な記憶媒体に格納されるコンピュータプログラムであって、前記コンピュータプログラムは、少なくとも一つのプロセッサによって実行されると上記の方法を実現させる命令を含む。
関連技術では、オープンドメイン対話システムは、ユーザの意図を取得し、意図に従ってユーザ入力を複数のインタラクションサブシステムに配布し、複数のインタラクションサブシステムの返信結果を受信し、次に予め設定されたソートポリシーに従ってスコアが最も高い結果を選択してユーザに返信する。このオープンドメイン対話システムには、モジュール同士がカスケードされているので、誤伝達が発生しやすい問題、各サブシステムが互いに独立しており、サブシステム間で情報を効果的に伝達又は自然に切り替えることができない問題、知識を深層学習に基づくシステムに効果的に融合することができない問題があり、その結果、オープンドメイン対話システムには、対話コンテンツが空であること、論理が明らかでないこと、答えが質問に合わないことなどの問題がある。
図1は本開示によるニューラルネットワークに基づくマンマシンインタラクション方法を示すフローチャートである。
前記有向エッジは、コアノード間、コアノードとラベルノード間の関連属性、及び各ノードと対応する論理制御情報の間の関連属性を表すことができる。コアノードとラベルノードは、構造化データであってもよく、それによってセマンティックコンテンツの理解及び制御を実現することができる。コアノードは、完全なセマンティックを備えた基本ユニットであってもよく、エンティティ、概念、イベント、命令を含むことができ、たとえば、人物、物品、構造、製品、建物、場所、組織、イベント、芸術作品、科学技術、科学定理などであってもよい。コアノードの論理制御情報は、人気、適時性、ラベルノードのリコールのための全てのラベル、タスクAPIなどを含むことができる。各コアノードは、関連している複数のラベルノードを含むことができる。ラベルノードのセマンティックコンテンツは、ラベルノードに関連するコアノードのセマンティックコンテンツの一部であってもよく、コアノードとの関係が部分と全体の関係である。
異なるノードは、有向エッジを介して接続されてもよく、接続されたノード間の関連属性を示している。有向エッジは、たとえば、コアノードからコアノードまでの関連エッジ、コアノードからラベルノードまでの関連エッジ、ラベルノードからコアノードまでの関連エッジ、ラベルノードからコンテンツノードまでの関連エッジを含むことができる。有向エッジの属性は、セマンティック関係(たとえばディレクター、作品、妻など)、論理関係(時系列、因果など)、相関性の強さ、セマンティックの上位及び下位関係などの様々なタイプを含むことができる。
いくつかの実施例によれば、ステップS103における、前記ユーザ入力のセマンティックコンテンツを分析することは、前記ユーザ入力が前記動作記憶情報内のあるノードに対応できるか否かを判断することと、前記ユーザ入力が前記動作記憶情報内のあるノードに対応できることに応答して、前記動作記憶情報に基づいて前記ユーザ入力を処理することとを含むことができ、これにより、動作記憶情報に基づいてユーザ入力のセマンティックコンテンツを理解し、現在のマンマシンインタラクションシーンでのユーザ入力の理解を実現し、対話の理解の精度と効率を向上させることができる。前記あるノードは、たとえば、第3の有向グラフ内のノードであってもよく、上記のように、前記第3の有向グラフは、前記第1の有向グラフ(意図知識グラフ)と同じ構造であってもよく、且つ前記第1の有向グラフの一部である。
いくつかの実施例によれば、前記ユーザ入力が前記動作記憶情報内のノードに対応できないことに応答して、前記長期記憶情報から前記ユーザ入力に関連するノードの情報を抽出し、動作記憶情報に格納することができる。これにより、ユーザ入力が動作記憶情報内の知識情報に覆われていない場合、知識範囲を拡大することができ(たとえば、意図グラフ全体に基づく)、知識情報に基づいてユーザ入力を理解することを試みることができる。
いくつかの実施例によれば、前記ユーザ入力に対して曖昧性除去処理を行うことは、前記ユーザ入力と、前記動作記憶情報内の現在のマンマシンインタラクションに関連するノードの情報とに基づき、前記ユーザ入力内の曖昧性がある少なくとも一部のコンテンツを識別し、前記少なくとも一部のコンテンツの現在のマンマシンインタラクションにおける意味を確定することを含むことができ、これにより、現在のマンマシンインタラクションシーンに基づいてユーザ入力に対して曖昧性除去処理を行うことができる。たとえば、ユーザ入力が「私は水滸伝を読むことが好きです」である場合、「水滸伝」が小説だけでなく、テレビドラマを指すことができるため、曖昧性があり、この場合、システムは、現在のコンテキストでの「水滸伝」の真の意味がテレビドラマではなく、小説を指すことをユーザ入力内の「読む」によって確定する。1つの例示的な実施例として、ユーザ入力と、動作記憶情報内の現在のマンマシンインタラクションに対応する前のコアノード(動作記憶情報内の最新の更新されたコアノードであってもよく、セマンティックコンテンツと論理制御情報を含む)に基づき、前記ユーザ入力に対して曖昧性除去処理を行うことができる。たとえば、ユーザ入力と、動作記憶情報内の現在のマンマシンインタラクションに対応する前のコアノードとを曖昧性除去ニューラルネットワークモデルに入力して、曖昧性除去ニューラルネットワークモデルによって出力されたユーザ入力の曖昧性がある少なくとも部分的なコンテンツのタイプを取得することができる。タイプコーパスを使用して曖昧性除去ニューラルネットワークモデルに対して測定トレーニングを実行して、ユーザ入力と前記動作記憶情報内の現在のマンマシンインタラクションに関連するノードの情報との組み合わせを実現することができ、それにより、タイプコーパスの対応するタイプにより近くなり、ユーザ入力内の曖昧性がある少なくとも一部のコンテンツ及び曖昧性がある前記少なくとも一部のコンテンツのタイプを出力することができる。ここでどのようにユーザ入力内の曖昧性がある少なくとも一部のコンテンツ及び曖昧性がある少なくとも一部のコンテンツのタイプとを確定するかは、例として説明され、これに制限されない。
いくつかの実施例によれば、前記ユーザ入力に関連する関連度に応じて、前記関連ノードに異なるスコアを付与する場合、現在のマンマシンインタラクションシーンで前記ユーザ入力に対して返信の計画を行うことは、前記ソート結果に応じて、対話目標を計画し、前記ユーザ入力との関連度が最も高いノードの情報を計画された対話コンテンツとして選択することと、前記計画された対話コンテンツと前記対話目標とを統合し、前記第2の入力として前記ニューラルネットワークシステムに提供することとを含むことができ、これにより、対話システムは、知識情報を融合し、ユーザ入力に基づいて返信の計画を行うことができ、対話論理が明確になる。
設定されたラウンド数(たとえば2ラウンド又は3ラウンド)の閑談を経た後、対話目標を推奨として計画し、動作記憶情報内の現在のマンマシンインタラクションコンテンツに対応する前のコアコアノードに基づいて関連度が高い他のノードを推奨することができ、それにより、複数回の閑談を経た後に知識ポイントを能動的に切り替えて、厄介なチャットを回避することができる。
いくつかの実施例によれば、図6に示すように、前記対話理解モジュール1021は、前記ユーザ入力が前記動作記憶情報内のあるノードに対応できるか否かを判断するように構成される判定サブモジュール10211と、前記ユーザ入力が前記動作記憶情報内のあるノードに対応できることに応答して、前記動作記憶情報に基づいて前記ユーザ入力を処理するように構成される処理サブモジュール10212とを含むことができ、これにより、動作記憶情報に基づいてユーザ入力のセマンティックコンテンツを理解し、現在のマンマシンインタラクションシーンでのユーザ入力の理解を実現し、対話の理解の精度と効率を向上させることができる。前記あるノードは、たとえば、第3の有向グラフ内のノードであってもよく、上記のように、前記第3の有向グラフは、前記第1の有向グラフ(意図知識グラフ)と同じ構造であってもよく、且つ前記第1の有向グラフの一部である。
いくつかの実施例によれば、前記対話理解モジュールは、さらに前記ユーザ入力が前記動作記憶情報内のノードに対応できないことに応答して、前記長期記憶モジュールから前記ユーザ入力に関連するノードの情報を抽出し、前記動作記憶モジュールに格納するように構成されてもよい。これにより、ユーザ入力が動作記憶情報内の知識情報に覆われていない場合、知識範囲を拡大することができ(たとえば、意図グラフ全体に基づく)、知識情報に基づいてユーザ入力を理解することを試みることができる。
いくつかの実施例によれば、前記曖昧性除去サブモジュール10213は、さらにユーザ入力と、前記動作記憶情報内の現在のマンマシンインタラクションに関連するノードの情報とに基づき、前記ユーザ入力内の曖昧性がある少なくとも一部のコンテンツを識別し、前記少なくとも一部のコンテンツの現在のマンマシンインタラクションにおける意味を確定するように構成されてもよい。これにより、現在のマンマシンインタラクションシーンに基づいてユーザ入力に対して曖昧性除去処理を行うことができる。たとえば、ユーザ入力が「私は水滸伝を読むことが好きす」である場合、「水滸伝」が小説だけでなく、テレビドラマを指すことができるため、曖昧性があり、この場合、システムは、現在のコンテキストでの「水滸伝」の真の意味がテレビドラマではなく、小説を指すことをユーザ入力内の「読む」によって確定する。1つの例示的な実施例として、ユーザ入力と、動作記憶情報内の現在のマンマシンインタラクションに対応する前のコアノード(動作記憶情報内の最新の更新されたコアノードであってもよく、セマンティックコンテンツと論理制御情報を含む)に基づき、前記ユーザ入力に対して曖昧性除去処理を行うことができる。たとえば、ユーザ入力と、動作記憶情報内の現在のマンマシンインタラクションに対応する前のコアノードとを曖昧性除去ニューラルネットワークモデルに入力して、曖昧性除去ニューラルネットワークモデルによって出力されたユーザ入力の曖昧性がある少なくとも部分的なコンテンツを取得することができる。タイプコーパスを使用して曖昧性除去ニューラルネットワークモデルに対して測定トレーニングを実行して、ユーザ入力と前記動作記憶情報内の現在のマンマシンインタラクションに関連するノードの情報との組み合わせを実現することができ、タイプコーパスの対応するタイプにより近くなり、ユーザ入力内の曖昧性がある少なくとも一部のコンテンツ及び曖昧性がある前記少なくとも一部のコンテンツのタイプを出力することができる。ここでどのようにユーザ入力内の曖昧性がある少なくとも一部のコンテンツ及び曖昧性がある少なくとも一部のコンテンツのタイプとを確定するかは、例として説明され、これに制限されない。
いくつかの実施例によれば、前記ユーザ入力に関連する関連度に応じて、前記関連ノードに異なるスコアを付与する場合、前記対話制御モジュールは、前記ソート結果に応じて、対話目標を計画し、前記ユーザ入力との関連度が最も高いノードの情報を計画された対話コンテンツとして選択する操作と、前記計画された対話コンテンツと前記対話目標とを統合し、前記第2の入力として前記ニューラルネットワークシステムに提供する操作を実行して、現在のマンマシンインタラクションシーンで前記ユーザ入力に対して返信の計画を行うように構成され、これにより、対話システムは、知識情報を融合し、ユーザ入力に基づいて返信の計画を行うことができ、対話論理が明確になる。
設定されたラウンド数(たとえば2ラウンド又は3ラウンド)の閑談を経た後、対話目標を推奨として計画し、動作記憶情報内の現在のマンマシンインタラクションコンテンツに対応する前のコアコアノードに基づいて関連度が高い他のノードを推奨することができ、それにより、複数回の閑談を経た後に知識ポイントを能動的に切り替えて、厄介なチャットを回避することができる。
Claims (51)
- ニューラルネットワークに基づくマンマシンインタラクション方法であって、
ユーザ入力を第1の入力としてニューラルネットワークシステムに提供することと、
前記ユーザ入力を前記ニューラルネットワークシステムとは異なる対話制御システムに提供することと、
前記ユーザ入力に関連する情報に基づき、前記対話制御システムによって前記ユーザ入力を処理することであって、前記ユーザ入力に関連する前記情報は、長期記憶情報と、現在のマンマシンインタラクション期間のみに有効な動作記憶情報とを含み、前記長期記憶情報は、ノードと有向エッジとを含む形態の第1の有向グラフの知識情報を含み、かつ前記第1の有向グラフ内のノードは、セマンティックコンテンツと論理制御情報とを含む構造化データであり、前記第1の有向グラフ内の有向エッジは、関連ノード間の関連属性を表す、処理することと、
前記対話制御システムの処理結果を第2の入力として前記ニューラルネットワークシステムに提供することと、
前記ニューラルネットワークシステムによって前記第1の入力と前記第2の入力に基づき、前記ユーザ入力に対する返信を生成することとを含むニューラルネットワークに基づくマンマシンインタラクション方法。 - 前記論理制御情報は、現在のマンマシンインタラクションに関連するノードをスクリーニングするために使用できる情報を含む請求項1に記載の方法。
- 前記論理制御情報は、現在のマンマシンインタラクションにおける各ノード間の関連度を確定するために使用できる情報を含む請求項1に記載の方法。
- 前記第1の有向グラフ内の各ノードは、第1のタイプのノードと第2のタイプのノードとを含み、前記第2のタイプのノードのセマンティックコンテンツは、前記第2のタイプのノードに関連する第1のタイプのノードのセマンティックコンテンツの一部であり、かつ前記第2のタイプのノードの論理制御情報は、前記第2のタイプのノードに関連する第1のタイプのノードの下での第2のタイプのノードの人気、前記第2のタイプのノードと少なくとも1つの他の第2のタイプのノードとの関連ジャンプ関係、前記第2のタイプのノードのサブタイプのうちの少なくとも1つを含む請求項1~3のいずれか一項に記載の方法。
- 前記第1の有向グラフ内の各ノードは、第3のタイプのノードを含み、前記第3のタイプのノードのセマンティックコンテンツは、マルチモーダルコンテンツをサポートし、かつ前記第3のタイプのノードの論理制御情報は、前記第3のタイプのノードに関連する第2のタイプのノードの情報、前記第3のタイプのノードのセマンティックコンテンツを特徴付けるための情報のうちの少なくとも1つを含む請求項4に記載の方法。
- 前記長期記憶情報は、ノードと有向エッジとを含む形態の第2の有向グラフの対話ライブラリ情報を含み、前記第2の有向グラフと前記第1の有向グラフは同じ構造である請求項1~3のいずれか一項に記載の方法。
- 前記動作記憶情報は、ノードと有向エッジとを含む形態の第3の有向グラフの情報を含み、前記第3の有向グラフと前記第1の有向グラフは同じ構造であり、かつ前記第3の有向グラフは、前記第1の有向グラフの一部である請求項1に記載の方法。
- 前記動作記憶情報は、前記第1の有向グラフから取得された、前記現在のマンマシンインタラクションに関連する全てのノードのセマンティックコンテンツと論理制御情報を含む請求項7に記載の方法。
- 前記動作記憶情報は、前記現在のマンマシンインタラクションに関与しているセマンティックコンテンツをマークするための第1の情報を含む請求項7又は8に記載の方法。
- 前記動作記憶情報は、前記関与したセマンティックコンテンツを最初に言及する対話者を示すための第2の情報を含む請求項9に記載の方法。
- 前記動作記憶情報は、前記現在のマンマシンインタラクション期間のインタラクションレコードの履歴データを含む請求項7又は8に記載の方法。
- 前記処理結果は、現在のマンマシンインタラクションシーンでの前記ユーザ入力に対する返信の計画を含む請求項1~3のいずれか一項に記載の方法。
- 前記対話制御システムによって前記ユーザ入力を処理することは、
前記ユーザ入力のセマンティックコンテンツを分析することと、
現在のマンマシンインタラクションにおける前記ユーザ入力に対応する前記ユーザーのコミュニケーション意図を分析することとを含む請求項12に記載の方法。 - 前記ユーザ入力のセマンティックコンテンツを分析することは、
前記ユーザ入力が前記動作記憶情報内のあるノードに対応できるか否かを判断することと、
前記ユーザ入力が前記動作記憶情報内のあるノードに対応できることに応答して、前記動作記憶情報に基づいて前記ユーザ入力を処理することとを含む請求項13に記載の方法。 - 前記ユーザ入力を処理することは、
前記動作記憶情報内の前記あるノードの情報に基づき、関連するコンテンツを前記ユーザ入力に補うことを含む請求項14に記載の方法。 - 前記ユーザ入力が前記動作記憶情報内のノードに対応できないことに応答して、前記ユーザ入力に関連するノードの情報を前記長期記憶情報から抽出し、前記動作記憶情報に格納する、請求項14又は15に記載の方法。
- 前記ユーザ入力のセマンティックコンテンツを分析することは、
前記ユーザ入力に対して曖昧性除去処理を行うことを含む請求項13に記載の方法。 - 前記ユーザ入力に対して曖昧性除去処理を行うことは、
前記ユーザ入力と、前記動作記憶情報内の現在のマンマシンインタラクションに関連するノードの情報とに基づき、前記ユーザ入力内の曖昧性がある少なくとも一部のコンテンツを識別し、前記少なくとも一部のコンテンツの現在のマンマシンインタラクションにおける意味を確定することを含む請求項17に記載の方法。 - 前記対話制御システムによって前記ユーザ入力を処理することは、さらに、
前記ユーザ入力のセマンティックコンテンツと、現在のマンマシンインタラクションにおける前記ユーザ入力に対応するコミュニケーション意図とに基づき、前記ユーザ入力に関連するノードの情報を前記動作記憶情報からクエリすることと、
前記ユーザ入力との関連度に応じて、クエリされた前記ユーザ入力の関連ノードを前記関連ノードの論理制御情報に基づいてソートすることとを含む請求項16に記載の方法。 - 前記ユーザ入力との関連度に応じて、前記関連ノードに異なるスコアを付与する、請求項19に記載の方法。
- 現在のマンマシンインタラクションシーンで前記ユーザ入力に対して返信を行う計画は、
前記ソート結果に応じて、対話目標を計画し、前記ユーザ入力との関連度が最も高いノードの情報を計画された対話コンテンツとして選択することと、
前記計画された対話コンテンツと前記対話目標とを統合し、前記第2の入力として前記ニューラルネットワークシステムに提供することとを含む請求項19に記載の方法。 - 前記ユーザ入力に対して前記動作記憶情報を更新しない場合、前記関連度の最も高いノードが所定の基準を満たせないことに応答して、前記長期記憶情報を再度クエリして前記動作記憶情報を更新する、請求項21に記載の方法。
- 前記ニューラルネットワークシステムは、エンドツーエンド型ニューラルネットワークシステムである請求項1~3のいずれか一項に記載の方法。
- エンドツーエンド型ニューラルネットワークシステムは、エンコーダとデコーダとを備え、前記エンコーダは、前記ユーザ入力及び格納された現在のマンマシンインタラクションの履歴インタラクション情報を受信するように構成され、前記デコーダは、前記第2の入力を受信して前記ユーザ入力に対する返信を生成するように構成される請求項23に記載の方法。
- ニューラルネットワークに基づくマンマシンインタラクション装置であって、
ユーザ入力を第1の入力として受信するように構成されるニューラルネットワークシステムと、
前記ユーザ入力を受信し、前記ユーザ入力に関連する情報に基づいて前記ユーザ入力を処理し、処理結果を第2の入力として前記ニューラルネットワークシステムに提供するように構成される、前記ニューラルネットワークシステムとは異なる対話制御システムと、
動作記憶モジュールと長期記憶モジュールとを含むストレージコンピューティングシステムであって、前記ユーザ入力に関連する前記情報は、前記長期記憶モジュールから取得された長期記憶情報と、前記動作記憶モジュールから取得された、現在のマンマシンインタラクション期間のみに有効な動作記憶情報とを含む、ストレージコンピューティングシステムと、
を備え、
前記ニューラルネットワークシステムは、さらに前記第1の入力と前記第2の入力に基づき、前記ユーザ入力に対する返信を生成するように構成され、
前記長期記憶モジュールにはノードと有向エッジとを含む形態の第1の有向グラフの知識情報を含む意図知識グラフが格納され、かつ前記第1の有向グラフ内のノードは、セマンティックコンテンツと論理制御情報とを含む構造化データであり、前記第1の有向グラフ内の有向エッジは、関連するノード間の関連属性を表す、
ニューラルネットワークに基づくマンマシンインタラクション装置。 - 前記論理制御情報は、現在のマンマシンインタラクションに関連するノードをスクリーニングするために使用できる情報を含む請求項25に記載の装置。
- 前記論理制御情報は、現在のマンマシンインタラクションにおける各ノード間の関連度を確定するために使用できる情報を含む請求項25に記載の装置。
- 前記第1の有向グラフ内の各ノードは、第1のタイプのノードと第2のタイプのノードとを含み、前記第2のタイプのノードのセマンティックコンテンツは、前記第2のタイプのノードに関連する第1のタイプのノードのセマンティックコンテンツの一部であり、かつ前記第2のタイプのノードの論理制御情報は、前記第2のタイプのノードに関連する第1のタイプのノードの下での第2のタイプのノードの人気、前記第2のタイプのノードと少なくとも1つの他の第2のタイプのノードとの関連ジャンプ関係、前記第2のタイプのノードのサブタイプのうちの少なくとも1つを含む請求項25~27のいずれか一項に記載の装置。
- 前記第1の有向グラフ内の各ノードは、第3のタイプのノードを含み、前記第3のタイプのノードのセマンティックコンテンツは、マルチモーダルコンテンツをサポートし、かつ前記第3のタイプのノードの論理制御情報は、前記第3のタイプのノードに関連する第2のタイプのノードの情報、前記第3のタイプのノードのセマンティックコンテンツを特徴付けるための情報のうちの少なくとも1つを含む請求項28に記載の装置。
- 前記長期記憶モジュールにはノードと有向エッジとを含む形態の第2の有向グラフの対話ライブラリ情報を含む対話ライブラリが格納され、前記第2の有向グラフと前記第1の有向グラフは同じ構造である請求項25~27のいずれか一項に記載の装置。
- 前記動作記憶モジュールにはノードと有向エッジとを含む形態の第3の有向グラフの情報を含む動作記憶情報が格納され、前記第3の有向グラフと前記第1の有向グラフは同じ構造であり、かつ前記第3の有向グラフは、前記第1の有向グラフの一部である請求項25に記載の装置。
- 前記動作記憶情報は、前記第1の有向グラフから取得された、前記現在のマンマシンインタラクションに関連する全てのノードのセマンティックコンテンツと論理制御情報を含む請求項31に記載の装置。
- 前記動作記憶情報は、前記現在のマンマシンインタラクションに関与しているセマンティックコンテンツをマークするための第1の情報を含む請求項31又は32に記載の装置。
- 前記動作記憶情報は、前記関与したセマンティックコンテンツを最初に言及する対話者を示すための第2の情報を含む請求項33に記載の装置。
- 前記動作記憶情報は、前記現在のマンマシンインタラクション期間のインタラクションレコードの履歴データを含む請求項31又は32に記載の装置。
- 前記処理結果は、現在のマンマシンインタラクションシーンでの前記ユーザ入力に対する返信の計画を含む請求項25~27のいずれか一項に記載の装置。
- 前記対話制御システムは、対話理解モジュールと対話制御モジュールとを含み、かつ前記対話理解モジュールは、
前記ユーザ入力のセマンティックコンテンツを分析し、
現在のマンマシンインタラクションにおける前記ユーザ入力に対応する前記ユーザーのコミュニケーション意図を分析するために構成される請求項36に記載の装置。 - 前記対話理解モジュールは、
前記ユーザ入力が前記動作記憶情報内のあるノードに対応できるか否かを判断するように構成される判定サブモジュールと、
前記ユーザ入力が前記動作記憶情報内のあるノードに対応できることに応答して、前記動作記憶情報に基づいて前記ユーザ入力を処理するように構成される処理サブモジュールとを含む請求項37に記載の装置。 - 前記処理サブモジュールは、さらに前記動作記憶情報内の前記あるノードの情報に基づき、関連するコンテンツを前記ユーザ入力に補うように構成される請求項38に記載の装置。
- 前記対話理解モジュールは、さらに前記ユーザ入力が前記動作記憶情報内のノードに対応できないことに応答して、前記ユーザ入力に関連するノードの情報を前記長期記憶モジュールから抽出し、前記動作記憶モジュールに格納するように構成される請求項38又は39に記載の装置。
- 前記対話理解モジュールは、
前記ユーザ入力に対して曖昧性除去処理を行うように構成される曖昧性除去サブモジュールを含む請求項37に記載の装置。 - 前記曖昧性除去サブモジュールは、さらに前記ユーザ入力と、前記動作記憶情報内の現在のマンマシンインタラクションに関連するノードの情報とに基づき、前記ユーザ入力内の曖昧性がある少なくとも一部のコンテンツを識別し、前記少なくとも一部のコンテンツの現在のマンマシンインタラクションにおける意味を確定するように構成される請求項41に記載の装置。
- 前記対話理解モジュールは、
前記ユーザ入力のセマンティックコンテンツと、現在のマンマシンインタラクションにおける前記ユーザ入力に対応するコミュニケーション意図とに基づき、前記動作記憶情報から前記ユーザ入力に関連するノードの情報をクエリするように構成されるクエリサブモジュールと、
前記ユーザ入力との関連度に応じて、クエリされた前記ユーザ入力の関連ノードを前記関連ノードの論理制御情報に基づいてソートするように構成されるソートサブモジュールとを含む請求項40に記載の装置。 - 前記対話理解モジュールは、さらに前記ユーザ入力との関連度に応じて、前記関連ノードに異なるスコアを付与するように構成される請求項43に記載の装置。
- 前記対話制御モジュールは、
前記ソート結果に応じて、対話目標を計画し、前記ユーザ入力との関連度が最も高いノードの情報を計画された対話コンテンツとして選択する操作と、
前記計画された対話コンテンツと前記対話目標とを統合し、前記第2の入力として前記ニューラルネットワークシステムに提供する操作とを実行して、現在のマンマシンインタラクションシーンで前記ユーザ入力に対して返信の計画を行うように構成される請求項43に記載の装置。 - 前記対話理解モジュールは、さらに前記ユーザ入力に対して前記動作記憶情報を更新しない場合、前記関連度の最も高いノードが所定の基準を満たせないことに応答して、前記長期記憶情報を再度クエリして前記動作記憶情報を更新するように構成される請求項45に記載の装置。
- 前記ニューラルネットワークシステムは、エンドツーエンド型ニューラルネットワークシステムである請求項25~27のいずれか一項に記載の装置。
- 前記エンドツーエンド型ニューラルネットワークシステムは、エンコーダとデコーダとを備え、前記エンコーダは、前記ユーザ入力及び格納された現在のマンマシンインタラクションの履歴インタラクション情報を受信するように構成され、前記デコーダは、前記第2の入力を受信して前記ユーザ入力に対する返信を生成するように構成される請求項47に記載の装置。
- 電子機器であって、
プロセッサと、
前記プロセッサによって実行されると前記プロセッサに請求項1~24のいずれか一項に記載の方法を実行させるための命令を含むプログラムを格納するメモリとを備える電子機器。 - プログラムを格納するコンピュータ読み取り可能な記憶媒体であって、前記プログラムは、電子機器のプロセッサによって実行されると前記電子機器に請求項1~24のいずれか一項に記載の方法を実行させる命令を含むコンピュータ読み取り可能な記憶媒体。
- コンピュータ読み取り可能な記憶媒体に格納されるコンピュータプログラムであって、前記コンピュータプログラムは、少なくとも一つのプロセッサによって実行されると請求項1~24のいずれか一項に記載の方法を実現させる命令を含むコンピュータ読み取り可能な記憶媒体に格納されるコンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010786352.XA CN111737441B (zh) | 2020-08-07 | 2020-08-07 | 基于神经网络的人机交互方法、装置和介质 |
CN202010786352.X | 2020-08-07 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022031109A JP2022031109A (ja) | 2022-02-18 |
JP7204801B2 true JP7204801B2 (ja) | 2023-01-16 |
Family
ID=72658073
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021045641A Active JP7204801B2 (ja) | 2020-08-07 | 2021-03-19 | ニューラルネットワークに基づくマンマシンインタラクション方法、装置、及び媒体 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20210234814A1 (ja) |
EP (1) | EP3822814A3 (ja) |
JP (1) | JP7204801B2 (ja) |
KR (1) | KR20220018886A (ja) |
CN (1) | CN111737441B (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113506638A (zh) * | 2021-03-23 | 2021-10-15 | 崔剑虹 | 基于在线咨询主题和机器学习的网络训练方法及系统 |
CN113254617B (zh) * | 2021-06-11 | 2021-10-22 | 成都晓多科技有限公司 | 基于预训练语言模型和编码器的消息意图识别方法及系统 |
CN113688220B (zh) * | 2021-09-02 | 2022-05-24 | 国家电网有限公司客户服务中心 | 一种基于语义理解的文本机器人对话方法及系统 |
CN114780830A (zh) * | 2022-03-24 | 2022-07-22 | 阿里云计算有限公司 | 内容推荐方法、装置、电子设备及存储介质 |
CN115563262B (zh) * | 2022-11-10 | 2023-03-24 | 深圳市人马互动科技有限公司 | 机器语音外呼场景中对话数据的处理方法及相关装置 |
CN117332823B (zh) * | 2023-11-28 | 2024-03-05 | 浪潮电子信息产业股份有限公司 | 目标内容自动生成方法、装置、电子设备及可读存储介质 |
CN118051603A (zh) * | 2024-04-15 | 2024-05-17 | 湖南大学 | 智能澄清提问语句生成方法、装置、设备及介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110399460A (zh) | 2019-07-19 | 2019-11-01 | 腾讯科技(深圳)有限公司 | 对话处理方法、装置、设备及存储介质 |
CN111191016A (zh) | 2019-12-27 | 2020-05-22 | 车智互联(北京)科技有限公司 | 一种多轮对话处理方法、装置及计算设备 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090204391A1 (en) * | 2008-02-12 | 2009-08-13 | Aruze Gaming America, Inc. | Gaming machine with conversation engine for interactive gaming through dialog with player and playing method thereof |
US10210453B2 (en) * | 2015-08-17 | 2019-02-19 | Adobe Inc. | Behavioral prediction for targeted end users |
JP6929539B2 (ja) * | 2016-10-07 | 2021-09-01 | 国立研究開発法人情報通信研究機構 | ノン・ファクトイド型質問応答システム及び方法並びにそのためのコンピュータプログラム |
US10713289B1 (en) * | 2017-03-31 | 2020-07-14 | Amazon Technologies, Inc. | Question answering system |
KR102339819B1 (ko) * | 2017-04-05 | 2021-12-15 | 삼성전자주식회사 | 프레임워크를 이용한 자연어 표현 생성 방법 및 장치 |
CN108763495B (zh) * | 2018-05-30 | 2019-09-20 | 苏州思必驰信息科技有限公司 | 人机对话方法、系统、电子设备及存储介质 |
CN109033223B (zh) * | 2018-06-29 | 2021-09-07 | 北京百度网讯科技有限公司 | 用于跨类型对话的方法、装置、设备以及计算机可读存储介质 |
US10909970B2 (en) * | 2018-09-19 | 2021-02-02 | Adobe Inc. | Utilizing a dynamic memory network to track digital dialog states and generate responses |
US11568234B2 (en) * | 2018-11-15 | 2023-01-31 | International Business Machines Corporation | Training a neural network based on temporal changes in answers to factoid questions |
WO2020117028A1 (ko) * | 2018-12-07 | 2020-06-11 | 서울대학교 산학협력단 | 질의 응답 장치 및 방법 |
CN110674281B (zh) * | 2019-12-05 | 2020-05-29 | 北京百度网讯科技有限公司 | 人机对话及人机对话模型获取方法、装置及存储介质 |
-
2020
- 2020-08-07 CN CN202010786352.XA patent/CN111737441B/zh active Active
-
2021
- 2021-03-11 KR KR1020210032086A patent/KR20220018886A/ko not_active Application Discontinuation
- 2021-03-19 JP JP2021045641A patent/JP7204801B2/ja active Active
- 2021-03-22 EP EP21164032.1A patent/EP3822814A3/en not_active Ceased
- 2021-03-22 US US17/208,865 patent/US20210234814A1/en not_active Abandoned
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110399460A (zh) | 2019-07-19 | 2019-11-01 | 腾讯科技(深圳)有限公司 | 对话处理方法、装置、设备及存储介质 |
CN111191016A (zh) | 2019-12-27 | 2020-05-22 | 车智互联(北京)科技有限公司 | 一种多轮对话处理方法、装置及计算设备 |
Also Published As
Publication number | Publication date |
---|---|
JP2022031109A (ja) | 2022-02-18 |
CN111737441A (zh) | 2020-10-02 |
EP3822814A2 (en) | 2021-05-19 |
CN111737441B (zh) | 2020-11-24 |
KR20220018886A (ko) | 2022-02-15 |
US20210234814A1 (en) | 2021-07-29 |
EP3822814A3 (en) | 2021-08-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7204801B2 (ja) | ニューラルネットワークに基づくマンマシンインタラクション方法、装置、及び媒体 | |
US11379529B2 (en) | Composing rich content messages | |
CN107943998B (zh) | 一种基于知识图谱的人机对话控制系统及方法 | |
JP6813615B2 (ja) | 会話型相互作用システムの検索入力におけるユーザ意図を推定する方法およびそのためのシステム | |
CN109690526B (zh) | 用于智能自动聊天的方法、装置和系统 | |
CN107832433B (zh) | 基于对话交互的信息推荐方法、装置、服务器和存储介质 | |
JP6942821B2 (ja) | 複数のコーパスからの応答情報取得 | |
CN111737411A (zh) | 人机对话中的响应方法、对话系统及存储介质 | |
CN115082602B (zh) | 生成数字人的方法、模型的训练方法、装置、设备和介质 | |
US10503767B2 (en) | Computerized natural language query intent dispatching | |
KR101751113B1 (ko) | 기억 능력을 이용하는 다중 사용자 기반의 대화 관리 방법 및 이를 수행하는 장치 | |
US20230350929A1 (en) | Method and system for generating intent responses through virtual agents | |
US11126682B1 (en) | Hyperlink based multimedia processing | |
JP7488871B2 (ja) | 対話推薦方法、装置、電子機器、記憶媒体ならびにコンピュータプログラム | |
AU2022201193A1 (en) | System and method for designing artificial intelligence (ai) based hierarchical multi-conversation system | |
CN108306813B (zh) | 会话消息的处理方法、服务器及客户端 | |
CN111385188A (zh) | 对话元素的推荐方法、装置、电子设备和介质 | |
US20230298568A1 (en) | Authoring content for a conversational bot | |
JP2021039727A (ja) | テキスト処理方法、装置、電子機器及びコンピュータ読み取り可能な記憶媒体 | |
KR20220071487A (ko) | 대화방 내에서 검색 기능을 제공하는 방법, 시스템, 및 컴퓨터 프로그램 | |
US11809843B2 (en) | Adaptive user interfacing | |
CN114036373B (zh) | 搜索方法及装置、电子设备和存储介质 | |
KR101836420B1 (ko) | 히스토리 탐색을 위한 인덱싱 | |
Agarwala et al. | TUM Data Innovation Lab | |
CN117369653A (zh) | 输入文本推荐方法、装置、存储介质及计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210319 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220308 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220603 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220907 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221129 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221220 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221228 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7204801 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |