JP6894534B2 - 情報処理方法及び端末、コンピュータ記憶媒体 - Google Patents
情報処理方法及び端末、コンピュータ記憶媒体 Download PDFInfo
- Publication number
- JP6894534B2 JP6894534B2 JP2019561185A JP2019561185A JP6894534B2 JP 6894534 B2 JP6894534 B2 JP 6894534B2 JP 2019561185 A JP2019561185 A JP 2019561185A JP 2019561185 A JP2019561185 A JP 2019561185A JP 6894534 B2 JP6894534 B2 JP 6894534B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- slot
- identification
- feature
- intention
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 18
- 238000003672 processing method Methods 0.000 title claims description 14
- 238000012545 processing Methods 0.000 claims description 170
- 239000002131 composite material Substances 0.000 claims description 112
- 238000000034 method Methods 0.000 claims description 83
- 238000002372 labelling Methods 0.000 claims description 79
- 238000004590 computer program Methods 0.000 claims description 45
- 238000012549 training Methods 0.000 claims description 35
- 238000000605 extraction Methods 0.000 claims description 32
- 238000001514 detection method Methods 0.000 claims description 27
- 230000003993 interaction Effects 0.000 claims description 25
- 239000013598 vector Substances 0.000 claims description 25
- 230000008569 process Effects 0.000 claims description 21
- 238000005070 sampling Methods 0.000 claims description 15
- 230000008878 coupling Effects 0.000 claims description 13
- 238000010168 coupling process Methods 0.000 claims description 13
- 238000005859 coupling reaction Methods 0.000 claims description 13
- 238000004458 analytical method Methods 0.000 claims description 12
- 238000013528 artificial neural network Methods 0.000 claims description 12
- 230000015654 memory Effects 0.000 claims description 12
- 230000000306 recurrent effect Effects 0.000 claims description 9
- 230000004044 response Effects 0.000 claims description 9
- 238000013507 mapping Methods 0.000 claims description 2
- 230000006870 function Effects 0.000 description 14
- 230000000694 effects Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 10
- 230000007246 mechanism Effects 0.000 description 10
- 238000013135 deep learning Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 238000013473 artificial intelligence Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 239000000284 extract Substances 0.000 description 5
- 150000001875 compounds Chemical class 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000011049 filling Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 239000010902 straw Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Fuzzy Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Description
第1情報を収集することと、
前記第1情報に対し意図識別タスクを実行して、意図識別処理結果を取得することと、
前記意図識別処理結果に基づいてスロット識別タスクを実行して、スロット識別処理結果を取得することと、
前記スロット識別処理結果に基づいて目標結果を出力することと、を含む。
第1情報を収集することと、
前記第1情報に対し意図識別タスクを実行して、意図識別処理結果を取得することと、
前記第1情報に対し意図識別タスクを実行して、スロット識別処理結果を取得することと、
前記意図識別処理結果から意図識別パラメータを解析することと、
前記スロット識別処理結果からスロット識別パラメータを解析することと、
前記意図識別パラメータ及び前記スロット識別パラメータに基づいてモデリングして、意図識別及びスロット識別の特徴結合性を特徴づける第1複合モデルを取得することと、
前記第1情報から第1特徴を抽出することと、
前記第1情報から第2特徴を抽出することと、
前記第1特徴及び前記第2特徴に基づき、前記第1複合モデルを訓練し、前記第1複合モデルが指定された目標に達する場合に訓練を停止し、意図識別を特徴づける第1目標パラメータ及びスロット識別を特徴づける第2目標パラメータを取得することと、
前記第1目標パラメータ及び前記第2目標パラメータに基づいて第2複合モデルを構築することと、を含む。
第1情報を収集するように構成される収集ユニットと、
前記第1情報に対し意図識別タスクを実行して、意図識別処理結果を取得するように構成される第1タスク実行ユニットと、
前記意図識別処理結果に基づいてスロット識別タスクを実行して、スロット識別処理結果を取得するように構成される第2タスク実行ユニットと、
前記スロット識別処理結果に基づいて目標結果を出力するように構成される出力ユニットと、を備える。
第1情報を収集するように構成される収集ユニットと、
前記第1情報に対し意図識別タスクを実行して、意図識別処理結果を取得するように構成される第1タスク実行ユニットと、
前記第1情報に対し意図識別タスクを実行して、スロット識別処理結果を取得するように構成される第2タスク実行ユニットと、
前記意図識別処理結果から意図識別パラメータを解析するように構成される第1解析ユニットと、
前記スロット識別処理結果からスロット識別パラメータを解析するように構成される第2解析ユニットと、
前記意図識別パラメータ及び前記スロット識別パラメータに基づいてモデリングして、意図識別及びスロット識別の特徴結合性を特徴づける第1複合モデルを取得するように構成される第1モデル確立ユニットと、
前記第1情報から第1特徴を抽出するように構成される第1抽出ユニットと、
前記第1情報から第2特徴を抽出するように構成される第2抽出ユニットと、
前記第1特徴及び前記第2特徴に基づき、前記第1複合モデルを訓練し、前記第1複合モデルが指定された目標に達する場合に訓練を停止し、意図識別を特徴づける第1目標パラメータ及びスロット識別を特徴づける第2目標パラメータを取得するように構成される第3抽出ユニットと、
前記第1目標パラメータ及び前記第2目標パラメータに基づいて第2複合モデルを構築するように構成される第2モデル確立ユニットと、を備える。
プロセッサにおいて実行できるコンピュータプログラムを記憶するように構成されるメモリと、
前記コンピュータプログラムを実行するとき、上記実施例に記載の方法のステップを実行するように構成されるプロセッサと、を備える。
音響logからqueryを抽出するステップ301と、
公式アカウントlogからqueryを抽出するステップ302と、
Queryをフィルタリングするステップ303と、
データを合併するステップ304と、
意図をラベリングするステップ305と、
スロットをラベリングするステップ306と、を含み、
ステップ302、ステップ303及びステップ301の順序が変化してもよい。
スロット特徴語テーブルを構築するステップ401と、
辞書にマッチングするステップ402と、
スロット特徴を示すステップ403と、を含む。
RNNモデルを利用し、補助特徴と組み合わせて、複合モデルの訓練を行う。複合モデルの目標関数は、
Lが可能性の最も高い運算を説明するための目標関数を示し、xが入力されたqueryを示し、yがqueryの意図を示し、lがqueryのスロットシーケンスを示し、αが意図識別の重要係数を示す。αは大きければ大きいほど意図識別がシステムで重要になることを示し、逆に、スロット識別がシステムで重要になることを示す。queryの深層特徴抽出部にLSTMを応用してもよい。深層特徴を抽出するとともに、補助特徴をベクトルにマッピングしてモデルにも組み込む。具体的なモデルフレームは図7に示される。図7に示すように、まず、queryにおける各単語を単語ベクトル(Embeding)にマッピングする。次に、双方向変種のリカレントニューラルネットワーク(Bi−LSTM)を利用してセンテンスの深層特徴(Hidden Vector)を抽出する。その後、補助特徴(Auxiliary Feature)及び深層特徴を結合する。次に、複合特徴を利用して分類できる。その1として、スロット識別に対し、シーケンスでラベリングする方式を利用し、つまり、各単語に1つのカテゴリラベルを付けてもよい。その2として、意図識別に対し、分類方式を用い、つまり、センテンス全体に1つの分類ラベルを付けてもよく、ここで、センテンス全体にラベルを付けるとき、単語の複合特徴ベクトルを加重調和平均方式でセンテンスの複合特徴ベクトルに構成し、次に該複合特徴ベクトルを利用して分類する。その後、ラベリングされたデータを利用して該モデルを訓練でき、訓練過程は主に勾配降下方式でモデルパラメータを更新し、上記目標関数を最大化させることであり、それにより意図及びスロット識別の精度を向上させ、処理効率を向上させる。
Lが可能性の最も高い運算を説明するための目標関数を示し、xが入力されたqueryを示し、yがqueryの意図を示し、lがqueryのスロットシーケンスを示す。
第1情報を収集し、
前記第1情報に対し意図識別タスクを実行して、意図識別処理結果を取得し、
前記意図識別処理結果に基づいてスロット識別タスクを実行して、スロット識別処理結果を取得し、
前記スロット識別処理結果に基づいて目標結果を出力するように構成されるプロセッサと、を備える。
前記意図識別処理結果から意図識別パラメータを解析し、
前記スロット識別処理結果からスロット識別パラメータを解析し、
前記意図識別パラメータ及び前記スロット識別パラメータに基づいてモデリングして、意図識別及びスロット識別の特徴結合性を特徴づける第1複合モデルを取得し、
前記第1情報から第1特徴を抽出し、
前記第1情報から第2特徴を抽出し、
前記第1特徴及び前記第2特徴に基づき、前記第1複合モデルを訓練し、前記第1複合モデルが指定された目標に達する場合に訓練を停止し、意図識別を特徴づける第1目標パラメータ及びスロット識別を特徴づける第2目標パラメータを取得し、
前記第1目標パラメータ及び前記第2目標パラメータに基づいて第2複合モデルを構築することに用いられる。
第2情報を取得し、
前記第2複合モデルに基づいて前記第2情報に対してフィードバック応答を行って、フィードバック情報を取得することに用いられる。
ローカルから、実ヒューマンコンピュータインタラクション環境において取得された対話内容からの前記第1情報を収集し、
及び/又は、ネットワーク側から前記第1情報を収集し、前記第1情報に対して選別処理を行って、実ヒューマンコンピュータインタラクション環境において取得された対話内容に近いものを特徴づけるための目標情報を取得することに用いられる。
第1情報を収集した後、前記第1情報及び/又は前記目標情報からなる第1情報源を作成することに用いられる。
前記第1情報源から処理対象オブジェクトを抽出し、
前記処理対象オブジェクトに対し意図を識別するための第1データラベリングを実行し、
第1データラベリング結果に対してサンプリング検出を行い、検出結果の精度が第1閾値より大きい場合、前記第1ラベリング結果が目標要件を満たすと決定し、
前記第1ラベリング結果に基づいて前記処理対象オブジェクトを分類して、異なる意図を特徴づける少なくとも1つの分類結果を取得して、前記意図識別処理結果として決定することに用いられる。
前記少なくとも1つの分類結果に基づいて対応するスロットを識別するための第2データラベリングを実行し、
第2データラベリング結果に対してサンプリング検出を行い、検出結果の精度が第2閾値より大きい場合、前記第2ラベリング結果が目標要件を満たすと決定し、
前記第2ラベリング結果を前記スロット識別処理結果として決定することに用いられる。
前記第1情報源から処理対象オブジェクトを抽出し、前記処理対象オブジェクトにスロット特徴語データベースを構築し、
前記処理対象オブジェクトのうちの指定されたオブジェクトに対し、辞書マッチング方式で前記スロット特徴語データベースと照合して、前記第1特徴を特徴づけるための、前記指定オブジェクトに含まれるすべての可能なスロット情報を検索することに用いられる。
検索された前記スロット情報をスロットベクトルの形式で示し、
将スロットベクトルをLSTMにマッピングし、前記LSTMと融合した後、前記処理対象オブジェクトに対して深層特徴抽出を行って、前記第2特徴を取得することに用いられる。
第1情報を収集し、
前記第1情報に対し意図識別タスクを実行して、意図識別処理結果を取得し、
前記第1情報に対し意図識別タスクを実行して、スロット識別処理結果を取得し、
前記意図識別処理結果から意図識別パラメータを解析し、
前記スロット識別処理結果からスロット識別パラメータを解析し、
前記意図識別パラメータ及び前記スロット識別パラメータに基づいてモデリングして、意図識別及びスロット識別の特徴結合性を特徴づける第1複合モデルを取得し、
前記第1情報から第1特徴を抽出し、
前記第1情報から第2特徴を抽出し、
前記第1特徴及び前記第2特徴に基づき、前記第1複合モデルを訓練し、前記第1複合モデルが指定された目標に達する場合に訓練を停止し、意図識別を特徴づける第1目標パラメータ及びスロット識別を特徴づける第2目標パラメータを取得し、
前記第1目標パラメータ及び前記第2目標パラメータに基づいて第2複合モデルを構築するように構成されるプロセッサと、を備える。
第1情報を収集し、
前記第1情報に対し意図識別タスクを実行して、意図識別処理結果を取得し、
前記意図識別処理結果に基づいてスロット識別タスクを実行して、スロット識別処理結果を取得し、
前記スロット識別処理結果に基づいて目標結果を出力するように構成される。
前記意図識別処理結果から意図識別パラメータを解析し、
前記スロット識別処理結果からスロット識別パラメータを解析し、
前記意図識別パラメータ及び前記スロット識別パラメータに基づいてモデリングして、意図識別及びスロット識別の特徴結合性を特徴づける第1複合モデルを取得し、
前記第1情報から第1特徴を抽出し、
前記第1情報から第2特徴を抽出し、
前記第1特徴及び前記第2特徴に基づき、前記第1複合モデルを訓練し、前記第1複合モデルが指定された目標に達する場合に訓練を停止し、意図識別を特徴づける第1目標パラメータ及びスロット識別を特徴づける第2目標パラメータを取得し、
前記第1目標パラメータ及び前記第2目標パラメータに基づいて第2複合モデルを構築するように構成される。
第2情報を取得し、
前記第2複合モデルに基づいて前記第2情報に対してフィードバック応答を行って、フィードバック情報を取得するように構成される。
ローカルから、実ヒューマンコンピュータインタラクション環境において取得された対話内容からの前記第1情報を収集し、
及び/又は、ネットワーク側から前記第1情報を収集し、前記第1情報に対して選別処理を行って、実ヒューマンコンピュータインタラクション環境において取得された対話内容に近いものを特徴づけるための目標情報を取得するように構成される。
第1情報を収集した後、前記第1情報及び/又は前記目標情報からなる第1情報源を作成するように構成される。
前記第1情報源から処理対象オブジェクトを抽出し、
前記処理対象オブジェクトに対し意図を識別するための第1データラベリングを実行し、
第1データラベリング結果に対してサンプリング検出を行い、検出結果の精度が第1閾値より大きい場合、前記第1ラベリング結果が目標要件を満たすと決定し、
前記第1ラベリング結果に基づいて前記処理対象オブジェクトを分類して、異なる意図を特徴づける少なくとも1つの分類結果を取得して、前記意図識別処理結果として決定するように構成される。
前記少なくとも1つの分類結果に基づいて対応するスロットを識別するための第2データラベリングを実行し、
第2データラベリング結果に対してサンプリング検出を行い、検出結果の精度が第2閾値より大きい場合、前記第2ラベリング結果が目標要件を満たすと決定し、
前記第2ラベリング結果を前記スロット識別処理結果として決定するように構成される。
前記第1情報源から処理対象オブジェクトを抽出し、前記処理対象オブジェクトにスロット特徴語データベースを構築し、
前記処理対象オブジェクトのうちの指定されたオブジェクトに対し、辞書マッチング方式で前記スロット特徴語データベースと照合して、前記第1特徴を特徴づけるための、前記指定オブジェクトに含まれるすべての可能なスロット情報を検索するように構成される。
検索された前記スロット情報をスロットベクトルの形式で示し、
スロットベクトルをLSTMにマッピングし、前記LSTMと融合した後、前記処理対象オブジェクトに対して深層特徴抽出を行って、前記第2特徴を取得するように構成される。
第1情報を収集し、
前記第1情報に対し意図識別タスクを実行して、意図識別処理結果を取得し、
前記第1情報に対し意図識別タスクを実行して、スロット識別処理結果を取得し、
前記意図識別処理結果から意図識別パラメータを解析し、
前記スロット識別処理結果からスロット識別パラメータを解析し、
前記意図識別パラメータ及び前記スロット識別パラメータに基づいてモデリングして、意図識別及びスロット識別の特徴結合性を特徴づける第1複合モデルを取得し、
前記第1情報から第1特徴を抽出し、
前記第1情報から第2特徴を抽出し、
前記第1特徴及び前記第2特徴に基づき、前記第1複合モデルを訓練し、前記第1複合モデルが指定された目標に達する場合に訓練を停止し、意図識別を特徴づける第1目標パラメータ及びスロット識別を特徴づける第2目標パラメータを取得し、
前記第1目標パラメータ及び前記第2目標パラメータに基づいて第2複合モデルを構築するように構成される。
32 端末
33 端末
34 端末
61 メモリ
62 プロセッサ
63 外部通信インターフェース
64 内部通信インターフェース
511 収集ユニット
512 第1タスク実行ユニット
513 第2タスク実行ユニット
514 出力ユニット
Claims (20)
- 情報処理方法であって、
前記方法は端末により実行され、前記端末は1つ又は複数のプロセッサ、メモリ及び1つ又は1つ以上のコンピュータプログラムを備え、前記1つ又は複数のプロセッサは前記コンピュータプログラムを実行するように構成され、前記方法は、
第1情報を収集することと、
前記第1情報に対し意図識別タスクを実行して、意図識別処理結果を取得することと、
前記意図識別処理結果に基づいてスロット識別タスクを実行して、スロット識別処理結果を取得することと、
前記スロット識別処理結果に基づいて目標結果を出力することと、を含み、
前記方法は、更に、
前記意図識別処理結果から意図識別パラメータを解析することと、
前記スロット識別処理結果からスロット識別パラメータを解析することと、
前記意図識別パラメータ及び前記スロット識別パラメータに基づいてモデリングして、意図識別及びスロット識別の特徴結合性を特徴づける第1複合モデルを取得することと、
前記第1情報から第1特徴を抽出することと、
前記第1情報から第2特徴を抽出することと、
前記第1特徴及び前記第2特徴に基づき、前記第1複合モデルを訓練し、前記第1複合モデルが指定された目標に達する場合に訓練を停止し、意図識別を特徴づける第1目標パラメータ及びスロット識別を特徴づける第2目標パラメータを取得することと、
前記第1目標パラメータ及び前記第2目標パラメータに基づいて第2複合モデルを構築することと、を含む、方法。 - 前記方法は、更に、
第2情報を取得することと、
前記第2複合モデルに基づいて前記第2情報に対してフィードバック応答を行って、フィードバック情報を取得することと、を含む
請求項1に記載の方法。 - 前記第1情報を収集することは、
ローカルから、実ヒューマンコンピュータインタラクション環境において取得された対話内容からの前記第1情報を収集し、
及び/又は、ネットワーク側から前記第1情報を収集し、前記第1情報に対して選別処理を行って、実ヒューマンコンピュータインタラクション環境において取得された対話内容に近いものを特徴づけるための目標情報を取得することを含む
請求項1又は2に記載の方法。 - 前記方法は、更に、
第1情報を収集した後、前記第1情報及び/又は前記目標情報からなる第1情報源を作成することを含む
請求項3に記載の方法。 - 前記第1情報に対し意図識別タスクを実行して、意図識別処理結果を取得することは、
前記第1情報源から処理対象オブジェクトを抽出することと、
前記処理対象オブジェクトに対し意図を識別するための第1データラベリングを実行することと、
第1データラベリング結果に対してサンプリング検出を行い、検出結果の精度が第1閾値より大きい場合、前記第1データラベリング結果が目標要件を満たすと決定することと、
前記第1データラベリング結果に基づいて前記処理対象オブジェクトを分類して、異なる意図を特徴づける少なくとも1つの分類結果を取得して、前記意図識別処理結果として決定することと、を含む
請求項4に記載の方法。 - 前記意図識別処理結果に基づいてスロット識別タスクを実行して、スロット識別処理結果を取得することは、
前記少なくとも1つの分類結果に基づいて対応するスロットを識別するための第2データラベリングを実行することと、
第2データラベリング結果に対してサンプリング検出を行い、検出結果の精度が第2閾値より大きい場合、前記第2データラベリング結果が目標要件を満たすと決定することと、
前記第2データラベリング結果を前記スロット識別処理結果として決定することと、を含む
請求項5に記載の方法。 - 前記第1情報から第1特徴を抽出することは、
前記第1情報源から処理対象オブジェクトを抽出し、前記処理対象オブジェクトにスロット特徴語データベースを構築することと、
前記処理対象オブジェクトのうちの指定されたオブジェクトに対し、辞書マッチング方式で前記スロット特徴語データベースと照合して、前記第1特徴を特徴づけるための、前記指定オブジェクトに含まれるすべての可能なスロット情報を検索することと、を含む
請求項4に記載の方法。 - 前記第1情報から第2特徴を抽出することは、
検索された前記スロット情報をスロットベクトルの形式で示すことと、
スロットベクトルを変種のリカレントニューラルネットワークにマッピングし、前記変種のリカレントニューラルネットワークと融合した後、前記処理対象オブジェクトに対して深層特徴抽出を行って、前記第2特徴を取得することと、を含む
請求項7に記載の方法。 - 情報処理方法であって、
前記方法は端末により実行され、前記端末は1つ又は複数のプロセッサ、メモリ及び1つ又は1つ以上のコンピュータプログラムを備え、前記1つ又は複数のプロセッサは前記コンピュータプログラムを実行するように構成され、前記方法は、
第1情報を収集することと、
前記第1情報に対し意図識別タスクを実行して、意図識別処理結果を取得することと、
前記第1情報に対し意図識別タスクを実行して、スロット識別処理結果を取得することと、
前記意図識別処理結果から意図識別パラメータを解析することと、
前記スロット識別処理結果からスロット識別パラメータを解析することと、
前記意図識別パラメータ及び前記スロット識別パラメータに基づいてモデリングして、意図識別及びスロット識別の特徴結合性を特徴づける第1複合モデルを取得することと、
前記第1情報から第1特徴を抽出することと、
前記第1情報から第2特徴を抽出することと、
前記第1特徴及び前記第2特徴に基づき、前記第1複合モデルを訓練し、前記第1複合モデルが指定された目標に達する場合に訓練を停止し、意図識別を特徴づける第1目標パラメータ及びスロット識別を特徴づける第2目標パラメータを取得することと、
前記第1目標パラメータ及び前記第2目標パラメータに基づいて第2複合モデルを構築することと、を含む、前記情報処理方法。 - 端末であって、
第1情報を収集するように構成される収集ユニットと、
前記第1情報に対し意図識別タスクを実行して、意図識別処理結果を取得するように構成される第1タスク実行ユニットと、
前記意図識別処理結果に基づいてスロット識別タスクを実行して、スロット識別処理結果を取得するように構成される第2タスク実行ユニットと、
前記スロット識別処理結果に基づいて目標結果を出力するように構成される出力ユニットと、を備え、
前記端末は、更に、
前記意図識別処理結果から意図識別パラメータを解析するように構成される第1解析ユニットと、
前記スロット識別処理結果からスロット識別パラメータを解析するように構成される第2解析ユニットと、
前記意図識別パラメータ及び前記スロット識別パラメータに基づいてモデリングして、意図識別及びスロット識別の特徴結合性を特徴づける第1複合モデルを取得するように構成される第1モデル確立ユニットと、
前記第1情報から第1特徴を抽出するように構成される第1抽出ユニットと、
前記第1情報から第2特徴を抽出するように構成される第2抽出ユニットと、
前記第1特徴及び前記第2特徴に基づき、前記第1複合モデルを訓練し、前記第1複合モデルが指定された目標に達する場合に訓練を停止し、意図識別を特徴づける第1目標パラメータ及びスロット識別を特徴づける第2目標パラメータを取得するように構成される第3抽出ユニットと、
前記第1目標パラメータ及び前記第2目標パラメータに基づいて第2複合モデルを構築するように構成される第2モデル確立ユニットと、を備える、
記載の端末。 - 前記端末は、更に、
取得ユニットが第2情報を取得するように構成され、
フィードバックユニットが前記第2複合モデルに基づいて前記第2情報に対してフィードバック応答を行って、フィードバック情報を取得するように構成されることを含む
請求項10に記載の端末。 - 前記収集ユニットは、更に、
ローカルから、実ヒューマンコンピュータインタラクション環境において取得された対話内容からの前記第1情報を収集し、
及び/又は、ネットワーク側から前記第1情報を収集し、前記第1情報に対して選別処理を行って、実ヒューマンコンピュータインタラクション環境において取得された対話内容に近いものを特徴づけるための目標情報を取得するように構成される
請求項10又は11に記載の端末。 - 前記端末は、更に、
第1情報を収集した後、前記第1情報及び/又は前記目標情報からなる第1情報源を作成するように構成される作成ユニットを備える
請求項12に記載の端末。 - 前記第1タスク実行ユニットは、更に、
前記第1情報源から処理対象オブジェクトを抽出し、
前記処理対象オブジェクトに対し意図を識別するための第1データラベリングを実行し
、
第1データラベリング結果に対してサンプリング検出を行い、検出結果の精度が第1閾値より大きい場合、前記第1データラベリング結果が目標要件を満たすと決定し、
前記第1データラベリング結果に基づいて前記処理対象オブジェクトを分類して、異なる意図を特徴づける少なくとも1つの分類結果を取得して、前記意図識別処理結果として決定するように構成される
請求項13に記載の端末。 - 前記第2タスク実行ユニットは、更に、
前記少なくとも1つの分類結果に基づいて対応するスロットを識別するための第2データラベリングを実行し、
第2データラベリング結果に対してサンプリング検出を行い、検出結果の精度が第2閾値より大きい場合、前記第2データラベリング結果が目標要件を満たすと決定し、
前記第2データラベリング結果を前記スロット識別処理結果として決定するように構成される
請求項14に記載の端末。 - 前記第1抽出ユニットは、更に、
前記第1情報源から処理対象オブジェクトを抽出し、前記処理対象オブジェクトにスロット特徴語データベースを構築し、
前記処理対象オブジェクトのうちの指定されたオブジェクトに対し、辞書マッチング方式で前記スロット特徴語データベースと照合して、前記第1特徴を特徴づけるための、前記指定オブジェクトに含まれるすべての可能なスロット情報を検索するように構成される
請求項13に記載の端末。 - 前記第2抽出ユニットは、更に、
検索された前記スロット情報をスロットベクトルの形式で示し、
スロットベクトルを変種のリカレントニューラルネットワークにマッピングし、前記変種のリカレントニューラルネットワークと融合した後、前記処理対象オブジェクトに対して深層特徴抽出を行って、前記第2特徴を取得するように構成される
請求項16に記載の端末。 - 端末であって、
第1情報を収集するように構成される収集ユニットと、
前記第1情報に対し意図識別タスクを実行して、意図識別処理結果を取得するように構成される第1タスク実行ユニットと、
前記第1情報に対し意図識別タスクを実行して、スロット識別処理結果を取得するように構成される第2タスク実行ユニットと、
前記意図識別処理結果から意図識別パラメータを解析するように構成される第1解析ユニットと、
前記スロット識別処理結果からスロット識別パラメータを解析するように構成される第2解析ユニットと、
前記意図識別パラメータ及び前記スロット識別パラメータに基づいてモデリングして、意図識別及びスロット識別の特徴結合性を特徴づける第1複合モデルを取得するように構成される第1モデル確立ユニットと、
前記第1情報から第1特徴を抽出するように構成される第1抽出ユニットと、
前記第1情報から第2特徴を抽出するように構成される第2抽出ユニットと、
前記第1特徴及び前記第2特徴に基づき、前記第1複合モデルを訓練し、前記第1複合モデルが指定された目標に達する場合に訓練を停止し、意図識別を特徴づける第1目標パラメータ及びスロット識別を特徴づける第2目標パラメータを取得するように構成される第3抽出ユニットと、
前記第1目標パラメータ及び前記第2目標パラメータに基づいて第2複合モデルを構築するように構成される第2モデル確立ユニットと、を備える、前記端末。 - 端末であって、
プロセッサにおいて実行できるコンピュータプログラムを記憶するように構成されるメモリと、
前記コンピュータプログラムを実行するとき、請求項1〜8のいずれか1項又は請求項9に記載の方法のステップを実行するように構成されるプロセッサと、を備える、前記端末。 - コンピュータ可読記憶媒体であって、
プロセッサにより実行されるとき、請求項1〜8のいずれか1項又は請求項9に記載の方法のステップを実現するコンピュータプログラムが記憶される、前記コンピュータ可読記憶媒体。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2017/108720 WO2019084810A1 (zh) | 2017-10-31 | 2017-10-31 | 一种信息处理方法及终端、计算机存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020521210A JP2020521210A (ja) | 2020-07-16 |
JP6894534B2 true JP6894534B2 (ja) | 2021-06-30 |
Family
ID=66331206
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019561185A Active JP6894534B2 (ja) | 2017-10-31 | 2017-10-31 | 情報処理方法及び端末、コンピュータ記憶媒体 |
Country Status (5)
Country | Link |
---|---|
US (2) | US11645517B2 (ja) |
JP (1) | JP6894534B2 (ja) |
KR (1) | KR102288249B1 (ja) |
CN (1) | CN110168535B (ja) |
WO (1) | WO2019084810A1 (ja) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102608469B1 (ko) * | 2017-12-22 | 2023-12-01 | 삼성전자주식회사 | 자연어 생성 방법 및 장치 |
CN110347789A (zh) * | 2019-06-14 | 2019-10-18 | 平安科技(深圳)有限公司 | 文本意图智能分类方法、装置及计算机可读存储介质 |
CN110413756B (zh) * | 2019-07-29 | 2022-02-15 | 北京小米智能科技有限公司 | 自然语言处理的方法、装置及设备 |
CN110532355B (zh) * | 2019-08-27 | 2022-07-01 | 华侨大学 | 一种基于多任务学习的意图与槽位联合识别方法 |
CN110928995B (zh) * | 2019-11-28 | 2022-12-09 | 中国建设银行股份有限公司 | 一种交互信息处理方法、装置、设备及存储介质 |
CN110929014B (zh) * | 2019-12-09 | 2023-05-23 | 联想(北京)有限公司 | 信息处理方法、装置、电子设备及存储介质 |
US10841251B1 (en) * | 2020-02-11 | 2020-11-17 | Moveworks, Inc. | Multi-domain chatbot |
CN111651988B (zh) * | 2020-06-03 | 2023-05-19 | 北京百度网讯科技有限公司 | 用于训练模型的方法、装置、设备以及存储介质 |
CN113779975B (zh) * | 2020-06-10 | 2024-03-01 | 北京猎户星空科技有限公司 | 一种语义识别方法、装置、设备及介质 |
US11302327B2 (en) * | 2020-06-22 | 2022-04-12 | Bank Of America Corporation | Priori knowledge, canonical data forms, and preliminary entrentropy reduction for IVR |
KR20220046103A (ko) * | 2020-10-07 | 2022-04-14 | 삼성전자주식회사 | 전자 장치 및 자연어 이해를 위한 파라미터의 획득 방법 |
CN112560505A (zh) * | 2020-12-09 | 2021-03-26 | 北京百度网讯科技有限公司 | 一种对话意图的识别方法、装置、电子设备及存储介质 |
CN112632987B (zh) * | 2020-12-25 | 2023-08-11 | 北京百度网讯科技有限公司 | 词槽的识别方法、装置及电子设备 |
CN113407698B (zh) * | 2021-06-30 | 2022-08-23 | 北京百度网讯科技有限公司 | 意图识别模型的训练与意图识别的方法、装置 |
KR102507650B1 (ko) * | 2021-07-20 | 2023-03-07 | 현대모비스 주식회사 | 머신 러닝 기반 품질데이터 자동 분석 시스템 |
Family Cites Families (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4176228B2 (ja) * | 1999-03-15 | 2008-11-05 | 株式会社東芝 | 自然言語対話装置及び自然言語対話方法 |
IS5369A (is) * | 2000-02-08 | 2001-08-09 | Net-Album.Net | Net-albúm-Verklag og vinnuferlar við meðhöndlun og geymslu stafrænna skráa í upplýsingakerfum |
JP4543294B2 (ja) * | 2000-03-14 | 2010-09-15 | ソニー株式会社 | 音声認識装置および音声認識方法、並びに記録媒体 |
US7890526B1 (en) * | 2003-12-30 | 2011-02-15 | Microsoft Corporation | Incremental query refinement |
US7461059B2 (en) * | 2005-02-23 | 2008-12-02 | Microsoft Corporation | Dynamically updated search results based upon continuously-evolving search query that is based at least in part upon phrase suggestion, search engine uses previous result sets performing additional search tasks |
US20110125764A1 (en) * | 2009-11-26 | 2011-05-26 | International Business Machines Corporation | Method and system for improved query expansion in faceted search |
WO2013108073A2 (en) * | 2011-12-06 | 2013-07-25 | Perception Partners, Inc. | Text mining analysis and output system |
US9201859B2 (en) * | 2011-12-15 | 2015-12-01 | Microsoft Technology Licensing, Llc | Suggesting intent frame(s) for user request(s) |
US9547647B2 (en) * | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
CN104424298B (zh) * | 2013-09-02 | 2018-07-06 | 联想(北京)有限公司 | 一种信息推送方法和电子设备 |
US9886950B2 (en) * | 2013-09-08 | 2018-02-06 | Intel Corporation | Automatic generation of domain models for virtual personal assistants |
JP6235360B2 (ja) * | 2014-02-05 | 2017-11-22 | 株式会社東芝 | 発話文収集装置、方法、及びプログラム |
WO2015151157A1 (ja) | 2014-03-31 | 2015-10-08 | 三菱電機株式会社 | 意図理解装置および方法 |
US9372851B2 (en) * | 2014-04-01 | 2016-06-21 | Microsoft Technology Licensing, Llc | Creating a calendar event using context |
US20150081277A1 (en) * | 2014-08-28 | 2015-03-19 | Kambiz Behi | System and Method for Automatically Classifying Text using Discourse Analysis |
JP2016061954A (ja) | 2014-09-18 | 2016-04-25 | 株式会社東芝 | 対話装置、方法およびプログラム |
CN105893345A (zh) * | 2016-03-28 | 2016-08-24 | 联想(北京)有限公司 | 一种信息处理方法和电子设备 |
CN106239506B (zh) * | 2016-08-11 | 2018-08-21 | 北京光年无限科技有限公司 | 智能机器人的多模态输入数据处理方法及机器人操作系统 |
CN106407178B (zh) * | 2016-08-25 | 2019-08-13 | 中国科学院计算技术研究所 | 一种会话摘要生成方法、装置、服务器设备以及终端设备 |
CN106383872A (zh) * | 2016-09-06 | 2017-02-08 | 北京百度网讯科技有限公司 | 基于人工智能的信息处理方法及装置 |
CN106383875B (zh) * | 2016-09-09 | 2019-10-15 | 北京百度网讯科技有限公司 | 基于人工智能的人机交互方法和装置 |
CN106557461B (zh) * | 2016-10-31 | 2019-03-12 | 百度在线网络技术(北京)有限公司 | 基于人工智能的语义解析处理方法和装置 |
KR20180077689A (ko) * | 2016-12-29 | 2018-07-09 | 주식회사 엔씨소프트 | 자연어 생성 장치 및 방법 |
GB2559618B (en) * | 2017-02-13 | 2020-07-08 | Toshiba Kk | A dialogue system, a dialogue method and a method of adapting a dialogue system |
US20180330718A1 (en) * | 2017-05-11 | 2018-11-15 | Mitsubishi Electric Research Laboratories, Inc. | System and Method for End-to-End speech recognition |
US20180329884A1 (en) * | 2017-05-12 | 2018-11-15 | Rsvp Technologies Inc. | Neural contextual conversation learning |
CN107203265B (zh) * | 2017-05-17 | 2021-01-22 | 广东美的制冷设备有限公司 | 信息交互方法和装置 |
US10817650B2 (en) * | 2017-05-19 | 2020-10-27 | Salesforce.Com, Inc. | Natural language processing using context specific word vectors |
CN107133345B (zh) * | 2017-05-22 | 2020-11-06 | 北京百度网讯科技有限公司 | 基于人工智能的交互方法和装置 |
CN107220235B (zh) * | 2017-05-23 | 2021-01-22 | 北京百度网讯科技有限公司 | 基于人工智能的语音识别纠错方法、装置及存储介质 |
CN107291828B (zh) * | 2017-05-27 | 2021-06-11 | 北京百度网讯科技有限公司 | 基于人工智能的口语查询解析方法、装置及存储介质 |
CN107301227A (zh) * | 2017-06-21 | 2017-10-27 | 北京百度网讯科技有限公司 | 基于人工智能的搜索信息解析方法及装置 |
US20190034542A1 (en) * | 2017-07-26 | 2019-01-31 | Scripps Networks Interactive, Inc. | Intelligent agent system and method of accessing and delivering digital files |
KR102608469B1 (ko) * | 2017-12-22 | 2023-12-01 | 삼성전자주식회사 | 자연어 생성 방법 및 장치 |
-
2017
- 2017-10-31 KR KR1020197037609A patent/KR102288249B1/ko active IP Right Grant
- 2017-10-31 WO PCT/CN2017/108720 patent/WO2019084810A1/zh active Application Filing
- 2017-10-31 CN CN201780054254.3A patent/CN110168535B/zh active Active
- 2017-10-31 JP JP2019561185A patent/JP6894534B2/ja active Active
-
2019
- 2019-10-22 US US16/660,305 patent/US11645517B2/en active Active
-
2023
- 2023-03-30 US US18/128,888 patent/US20230237328A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US20200050940A1 (en) | 2020-02-13 |
US11645517B2 (en) | 2023-05-09 |
WO2019084810A1 (zh) | 2019-05-09 |
CN110168535A (zh) | 2019-08-23 |
CN110168535B (zh) | 2021-07-09 |
US20230237328A1 (en) | 2023-07-27 |
KR102288249B1 (ko) | 2021-08-09 |
JP2020521210A (ja) | 2020-07-16 |
KR20200007969A (ko) | 2020-01-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6894534B2 (ja) | 情報処理方法及び端末、コンピュータ記憶媒体 | |
CN111177569B (zh) | 基于人工智能的推荐处理方法、装置及设备 | |
US11899681B2 (en) | Knowledge graph building method, electronic apparatus and non-transitory computer readable storage medium | |
JP6440732B2 (ja) | 機械学習に基づく自動タスク分類 | |
CN108664599B (zh) | 智能问答方法、装置、智能问答服务器及存储介质 | |
CN110543592B (zh) | 信息搜索方法、装置以及计算机设备 | |
CN110968684A (zh) | 一种信息处理方法、装置、设备及存储介质 | |
US20180046721A1 (en) | Systems and Methods for Automatic Customization of Content Filtering | |
US20190138616A1 (en) | Understanding User Product Queries in Real Time Without Using Any Rules | |
CN110765301B (zh) | 图片处理方法、装置、设备及存储介质 | |
CN111666766A (zh) | 数据处理方法、装置和设备 | |
US20190147104A1 (en) | Method and apparatus for constructing artificial intelligence application | |
CN112507139B (zh) | 基于知识图谱的问答方法、系统、设备及存储介质 | |
CN114357117A (zh) | 事务信息查询方法、装置、计算机设备及存储介质 | |
KR101545050B1 (ko) | 정답 유형 자동 분류 방법 및 장치, 이를 이용한 질의 응답 시스템 | |
CN109271624A (zh) | 一种目标词确定方法、装置及存储介质 | |
US11501071B2 (en) | Word and image relationships in combined vector space | |
CN108733702B (zh) | 用户查询上下位关系提取的方法、装置、电子设备和介质 | |
CN113591881B (zh) | 基于模型融合的意图识别方法、装置、电子设备及介质 | |
CN114996400A (zh) | 裁判文书处理方法、装置、电子设备及存储介质 | |
CN115774797A (zh) | 视频内容检索方法、装置、设备和计算机可读存储介质 | |
CN113704623A (zh) | 一种数据推荐方法、装置、设备及存储介质 | |
CN110019547B (zh) | 获取客户间的关联关系的方法、装置、设备及介质 | |
JPWO2018100700A1 (ja) | データ変換装置とデータ変換方法 | |
KR20220061388A (ko) | 키워드-종목 맵핑 정보 서비스 제공 프로그램이 기록된 기록매체 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191106 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201113 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201124 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210210 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210510 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210603 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6894534 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |