JP7101706B2 - 自然言語処理方法、装置及び設備 - Google Patents

自然言語処理方法、装置及び設備 Download PDF

Info

Publication number
JP7101706B2
JP7101706B2 JP2019564011A JP2019564011A JP7101706B2 JP 7101706 B2 JP7101706 B2 JP 7101706B2 JP 2019564011 A JP2019564011 A JP 2019564011A JP 2019564011 A JP2019564011 A JP 2019564011A JP 7101706 B2 JP7101706 B2 JP 7101706B2
Authority
JP
Japan
Prior art keywords
slot tagging
feedback information
tagging result
bilstm
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019564011A
Other languages
English (en)
Other versions
JP2021535411A (ja
Inventor
庄 銭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xiaomi Intelligent Technology Co Ltd
Original Assignee
Beijing Xiaomi Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xiaomi Intelligent Technology Co Ltd filed Critical Beijing Xiaomi Intelligent Technology Co Ltd
Publication of JP2021535411A publication Critical patent/JP2021535411A/ja
Application granted granted Critical
Publication of JP7101706B2 publication Critical patent/JP7101706B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90332Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Machine Translation (AREA)

Description

(関連出願の相互参照)
本願は、2019年07月29日に提出した中国特許出願第201910687763.0号の優先権を主張し、ここで、該中国特許出願の全内容が本願の一部として援用される。
本開示の実施例はマンマシン対話技術分野に関し、特に自然言語処理方法、装置及び設備に関する。
自然言語処理は、言語学、コンピュータサイエンス、数学を組み合わせる科学であり、人間とコンピュータとの間で自然言語を利用して効果的に通信する理論及び方法を研究している。自然言語処理において、シーケンスラベリングモデルはよく使用されているモデルであり、テキスト処理等の関連分野に広く使用されている。
現在流行っている、シーケンスラベリング問題を解決する方法は、隠れマルコフモデル(HMM)、条件付確率場(CRFs)及びリカレントニューラルネットワーク(RNNs)を含む。しかしながら、上記モデルはいずれもモデル能力が限られているため、自己学習を行うことができないといった問題がある。
関連技術の問題を解決するために、本開示の実施例は自然言語処理方法、装置及び設備を提供する。
本開示の実施例に係る第1態様では、自然言語処理方法を提供し、前記方法はマンマシン対話システムにおける対話ロボットに適用され、前記方法は、
使用されている双方向長期短期記憶ネットワークアルゴリズム及び条件付確率場アルゴリズム(BiLSTM-CRF)モデルでユーザーの入力した対話データに対してスロットタギングを行った後に出力したスロットタギング結果を確定することと、
前記スロットタギング結果及びユーザーの前記スロットタギング結果に対するフィードバックに基づいてフィードバック情報を確定することと、
前記フィードバック情報に基づいて前記BiLSTM-CRFモデルに対して強化学習を行うことと、を含む。
好ましくは、前記マンマシン対話システムは更に中央制御モジュールを備え、
前記使用されているBiLSTM-CRFモデルでユーザーの入力した対話データに対してスロットタギングを行った後に出力したスロットタギング結果を確定した後、前記方法は、更に、
前記対話ロボットが前記BiLSTM-CRFモデルの出力したスロットタギング結果を前記中央制御モジュールに出力することと、
受信された前記対話データのスロットタギング結果集合から前記中央制御モジュールにより確定された目標スロットタギング結果を取得することと、を含み、
前記スロットタギング結果集合が前記BiLSTM-CRFモデルの出力したスロットタギング結果及び他の対話ロボットの出力したスロットタギング結果を含み、前記目標スロットタギング結果が前記マンマシン対話システムからのユーザーへの応答結果として出力されることに用いられる。
好ましくは、前記スロットタギング結果及びユーザーの前記スロットタギング結果に対するフィードバックに基づいてフィードバック情報を確定することは、
前記目標スロットタギング結果と前記BiLSTM-CRFモデルの出力したスロットタギング結果とが一致しないことに応じて、前記一致しないフィードバック情報を負フィードバック情報として確定することと、
前記目標スロットタギング結果と前記BiLSTM-CRFモデルの出力したスロットタギング結果とが一致することに応じて、ユーザーの前記応答結果に対するフィードバック操作によってフィードバック情報を確定することと、を含む。
好ましくは、ユーザーの前記応答結果に対するフィードバック操作によってフィードバック情報を確定することは、
ユーザーの正方向フィードバック率が所定閾値以上であることに応じて、該フィードバック情報を正フィードバック情報として確定することと、
前記正方向フィードバック率が所定閾値より小さいことに応じて、該フィードバック情報を負フィードバック情報として確定することと、を含み、
前記正方向フィードバック率が所定期間内のユーザーの前記応答結果に対するフィードバック操作によって確定されるものである。
好ましくは、前記フィードバック情報に基づいてモデル強化学習を行うことは、
前記CRF層が前記フィードバック情報に基づいてモデル強化訓練を行うことができるように、前記フィードバック情報を前記BiLSTM-CRFモデルにおけるCRF層にフィードバックすることを含む。
本開示の実施例に係る第2態様では、自然言語処理装置を提供し、前記装置はマンマシン対話システムにおける対話ロボットに適用され、前記装置は、
使用されている双方向長期短期記憶ネットワークアルゴリズム及び条件付確率場アルゴリズム(BiLSTM-CRF)モデルでユーザーの入力した対話データに対してスロットタギングを行った後に出力したスロットタギング結果を確定するように構成されるスロットタギング結果確定モジュールと、
前記スロットタギング結果及びユーザーの前記スロットタギング結果に対するフィードバックに基づいてフィードバック情報を確定するように構成されるフィードバック情報確定モジュールと、
前記フィードバック情報に基づいて前記BiLSTM-CRFモデルに対して強化学習を行うように構成されるモデル強化学習モジュールと、を備える。
好ましくは、前記マンマシン対話システムは更に中央制御モジュールを備え、
前記装置は、更に、
前記BiLSTM-CRFモデルの出力したスロットタギング結果を前記中央制御モジュールに出力するように構成されるスロットタギング結果出力モジュールと、
受信された前記対話データのスロットタギング結果集合から前記中央制御モジュールにより確定された目標スロットタギング結果を取得するように構成される目標スロットタギング結果確定モジュールと、を備え、
前記スロットタギング結果集合が前記BiLSTM-CRFモデルの出力したスロットタギング結果及び他の対話ロボットの出力したスロットタギング結果を含み、前記目標スロットタギング結果が前記マンマシン対話システムからのユーザーへの応答結果として出力されることに用いられる。
好ましくは、前記フィードバック情報確定モジュールは、
前記目標スロットタギング結果と前記BiLSTM-CRFモデルの出力したスロットタギング結果とが一致しないことに応じて、前記一致しないフィードバック情報を負フィードバック情報として確定するように構成される第1フィードバック情報確定サブモジュールと、
前記目標スロットタギング結果と前記BiLSTM-CRFモデルの出力したスロットタギング結果とが一致することに応じて、ユーザーの前記応答結果に対するフィードバック操作によってフィードバック情報を確定するように構成される第2フィードバック情報確定サブモジュールと、を含む。
好ましくは、前記第2フィードバック情報確定サブモジュールは、具体的に、
ユーザーの正方向フィードバック率が所定閾値以上であることに応じて、該フィードバック情報を正フィードバック情報として確定し、
前記正方向フィードバック率が所定閾値より小さいことに応じて、該フィードバック情報を負フィードバック情報として確定するように構成され、
前記正方向フィードバック率が所定期間内のユーザーの前記応答結果に対するフィードバック操作によって確定されるものである。
好ましくは、前記モデル強化学習モジュールは、具体的に、
前記CRF層が前記フィードバック情報に基づいてモデル強化訓練を行うことができるように、前記フィードバック情報を前記BiLSTM-CRFモデルにおけるCRF層にフィードバックするように構成される。
本開示の実施例に係る第3態様では、対話ロボットを備えるマンマシン対話装置を提供し、前記マンマシン対話装置は、
プロセッサと、
プロセッサ実行可能命令を記憶するように構成されるメモリと、を備え、
前記プロセッサは、
使用されている双方向長期短期記憶ネットワークアルゴリズム及び条件付確率場アルゴリズム(BiLSTM-CRF)モデルでユーザーの入力した対話データに対してスロットタギングを行った後に出力したスロットタギング結果を確定し、
前記スロットタギング結果及びユーザーの前記スロットタギング結果に対するフィードバックに基づいてフィードバック情報を確定し、
前記フィードバック情報に基づいて前記BiLSTM-CRFモデルに対して強化学習を行うように構成される。
本開示の実施例に係る第4態様では、コンピュータ可読記憶媒体を提供し、コンピュータプログラムが記憶され、前記プログラムがプロセッサにより実行されるとき、上記方法のステップを実現する。
本開示の実施例に係る技術案は以下の有益な効果を有してもよい。
本開示の実施例において、BiLSTM-CRFモデルを基本的なフレームとし、BiLSTM-CRFモデルがスロットタギング結果を外部に出力した後、対話ロボットは該スロットタギング結果に基づいて対応するフィードバック情報を取得して、該フィードバック情報に基づいてBiLSTM-CRFモデルに対して強化学習を行うことができ、これにより、モデルの動的な自己学習を実現し、それにより手動ラベリング過程を省略し、スロットタギング効率及び精度を向上させる。
以上の一般的な説明及び以下の詳細な説明は例示的及び解釈的なものであって、本開示の実施例を制限するためのものではないと理解すべきである。
図1は本開示の例示的な実施例に係る自然言語処理方法の実施例のフローチャートである。 図2は本開示の例示的な実施例に係る他の自然言語処理方法の実施例のフローチャートである。 図3は本開示の例示的な実施例に係るBiLSTM-CRFモデルの模式図である。 図4は本開示の例示的な実施例に係る自然言語処理装置の実施例のブロック図である。 図5は本開示の例示的な実施例に係るマンマシン対話装置のブロック図である。
ここで、図面は明細書に援用されて本明細書の一部となり、本開示に適用される実施例を示し、且つ明細書とともに本開示の実施例の原理を解釈することに用いられる。
ここで、例示的な実施例を詳しく説明し、その例を図面に示す。以下の説明は図面に関わるとき、特に断りがない限り、異なる図面における同じ数字は同様又は類似の要素を示す。以下の例示的な実施例に説明される実施形態は本開示の実施例に一致するすべての実施形態を代表しない。逆に、それらは単に添付の特許請求の範囲に詳しく説明された、本開示の実施例のいくつかの態様に一致する装置及び方法の例である。
本開示の実施例に使用される用語は特定の実施例を説明するためのものであって、本開示の実施例を制限するためのものではない。コンテクストに他の意味を明確に示さない限り、本開示の実施例及び添付の特許請求の範囲に使用される単数形式の「1種」「前記」及び「該」は複数形式を含むように意図される。本明細書に使用される用語「及び/又は」は1つ又は複数の関連する列挙した項目を含む任意又はすべての可能な組み合わせを指すと更に理解すべきである。
本開示の実施例において用語「第1」「第2」「第3」等を用いて異なる情報を説明する可能性があるが、このような情報がこれらの用語に限らないと理解すべきである。このような用語は同じタイプの情報を区別するためのものに過ぎない。例えば、本開示の実施例の範囲を逸脱せずに、第1情報が第2情報と称されてもよく、同様に、第2情報が第1情報と称されてもよい。コンテクストによって、ここで使用される用語「〇〇場合」は「○○時」又は「○○であれば」又は「確定することに応じて」と解釈されてもよい。
図1は本開示の例示的な実施例に係る自然言語処理方法の実施例のフローチャートであり、本開示の実施例の方法はマンマシン対話システムにおける対話ロボットに適用されてもよく、具体的に、以下のステップを含んでもよい。
ステップ101において、使用されているBiLSTM-CRFモデルでユーザーの入力した対話データに対してスロットタギングを行った後に出力したスロットタギング結果を確定する。
該ステップでは、本対話ロボットがユーザーの入力した対話データを受信した場合、BiLSTM(Bi-directional Long Short-Term Memory、双方向長期短期記憶ネットワークアルゴリズム)-CRF(Conditional Random Field algorithm、条件付確率場アルゴリズム)モデルで該対話データに対してスロットタギングを行って、BiLSTM-CRFモデルの出力したスロットタギング結果を取得してもよい。スロットタギングがシーケンスラベリング問題を解決するシーケンスラベリングタスクであると理解されてもよい。
ステップ102において、前記スロットタギング結果及びユーザーの前記スロットタギング結果に対するフィードバックに基づいてフィードバック情報を確定する。
該ステップでは、対話ロボットがスロットタギング結果を取得した後、更に該スロットタギング結果のフィードバック情報を確定してもよく、例示的に、該フィードバック情報がユーザーの該スロットタギング結果に対するフィードバックを含んでもよい。
ステップ103において、前記フィードバック情報に基づいて前記BiLSTM-CRFモデルに対して強化学習を行う。
該ステップでは、対話ロボットは取得された該スロットタギング結果のフィードバック情報に基づき、BiLSTM-CRFモデルに対して強化学習を行うことができ、これにより、モデルの動的な自己学習を実現し、それにより手動ラベリング過程を省略し、スロットタギング効率及び精度を向上させる。
図2は本開示の例示的な実施例に係る他の自然言語処理方法の実施例のフローチャートであり、本開示の実施例の方法はマンマシン対話システムにおける対話ロボットに適用されてもよく、具体的に、以下のステップを含んでもよい。
ステップ201において、使用されているBiLSTM-CRFモデルでユーザーの入力した対話データに対してスロットタギングを行った後に出力したスロットタギング結果を確定する。
スロットタギング(Slot tagging)はNLU(Natural Language Understanding、自然言語理解)モジュールの重要な構成部分であるが、NLUモジュールはマンマシン対話システムにおける最も重要な部分であり、NLUモジュール全体の機能は主にユーザー意図(Intent)に対する理解及びユーザーの表明したセンテンスにおけるコアスロット(Slot、すなわちスロット)に対する解析の2つを含む。意図(Intent)は1つの分類器であって、ユーザーの表明したセンテンスのタイプを確定し、更に確定されたタイプに対応するプログラム(すなわち、Bot(音声ロボット))により専門の解析を行う。例えば、ユーザーは
Figure 0007101706000001
と言ったとき、ユーザーの意図の種類が音楽であると判断でき、従って、音楽ロボット(Bot)を呼び出してユーザーに一曲の歌を推薦して再生し、ユーザーが聞きたくない場合、「曲を変えてください」と言ったと、この音楽ロボットがユーザーにサービスを提供し続け、ユーザーが別の問題を出すまで、他のロボットに切り換えてユーザーにサービスを提供する。
マンマシン対話システムは更にNLUモジュールと通信する1つの中央制御モジュールを備え、NLUモジュールが1つの対話センテンスに対して1種類を超える意図を解析した場合、中央制御モジュールによりユーザーの対話センテンスを、ユーザー意図を処理できるBot(すなわち、ChatBot、対話ロボット)に送信して、これらのBotによりその処理が完了した結果を返送する。
そして、Botが対話センテンスの内容を理解すべきであり、簡単にするために、最も重要な部分を選択して理解して、他の重要でない内容を無視してもよいが、それらの最も重要な部分がスロットサイト(Slot)、すなわちスロットと称される。
本開示の実施例の対話ロボットBotがBiLSTM-CRFモデルでユーザーの入力した対話データに対してスロットタギングを行ってもよい。スロットタギングがシーケンスラベリング問題を解決するシーケンスラベリングタスクであると理解されてもよい。
以下、中国語のセンテンスを例として、BiLSTM-CRFモデルでスロットタギングを行う過程は以下のとおりである。
n個のワードを含む1つのセンテンス(ワードのシーケンス)は、
x=(x,x,・・・,x
と記され、
がセンテンスにおけるi番目のワードの辞書でのidを示し、更に各ワードのワンホット(one-hot)ベクトルを取得でき、次元が辞書サイズである。
図3のBiLSTM-CRFモデルの模式図に示すように、
モデルの第1層がルックアップ層(look-up layer)であり、予め訓練又はランダムに初期化された埋め込み(embedding)マトリクスを利用してセンテンスにおける各ワードをone-hotベクトルから低次元高密度のワードベクトルにマッピングし、次の層に入力する前に、dropout(ドロップアウトは深層構造を有するニューラルネットワークを最適化する方法であって、学習過程において隠れ層の一部の重み又は出力をランダムにゼロにし、ノード間の依存性を低下させることにより、ニューラルネットワークの正規化を実現し、ニューラルネットワークの過学習を防止する)を設定することにより過学習を緩和する。
モデルの第2層は双方向LSTM(Long Short-Term Memory、長期短期記憶ネットワーク)層であって、正方向長期短期記憶ネットワーク(forward LSTM)及び逆方向長期短期記憶ネットワーク(backward LSTM)を含む。1つのセンテンスの各ワードのchar embedding(文字埋め込み)シーケンス(x,x,・・・,x)を双方向LSTMの各タイムステップの入力とし、次に正方向LSTMから出力された
Figure 0007101706000002
隠れ状態シーケンスと逆方向LSTMから各位置で出力された
Figure 0007101706000003
隠れ状態シーケンスとを位置によって組み合わせて、完全な隠れ状態シーケンスを取得する。
dropoutを設定した後、1つの線形層にアクセスし、隠れ状態ベクトルをm次元からk次元にマッピングし、kがラベリングセットのタグ数であり、これにより、出力層(LSTM’s output)が自動的に抽出された、マトリクスP=(p,p,・・・,p)と記されるセンテンス特徴を出力する。
モデルの第3層はCRF層であって、センテンスレベルのシーケンスラベリングを行い、CRF層のパラメータが1つの(k+2)*(k+2)のマトリクスAであり、Aijがi番目のタグからj番目のタグまでの転送スコアを示し、更に一箇所をラベリングするとき、この前にラベリングされたタグを利用してもよく、2を加える理由はセンテンスの冒頭に1つの開始状態を追加して、センテンスの末尾に1つの終了状態を追加するためである。
図3によれば、「中国特大」(中国がとても大きい)のセンテンスに対して、BiLSTM-CRFモデルの最終的に出力したスロットタギング結果は、
「中 国 特 大
B-LOC I-LOC O O」であり、
BIOラベリングセットにおいて、B-PER、I-PERがそれぞれ人名の頭文字、人名の非頭文字を示し、B-LOC、I-LOCがそれぞれ地名の頭文字、地名の非頭文字を示し、B-ORG、I-ORGがそれぞれ組織機構名の頭文字、組織機構名の非頭文字を示し、Oは該ワードが命名実体の一部に属しないことを示す。当然ながら、特定の分野では、ユーザーが更にそれに応じて分野内の様々な実体タイプ、例えば映画タイプ(video)、天気タイプ(weather)等のタイプを定義する。
ステップ202において、前記対話ロボットが前記BiLSTM-CRFモデルの出力したスロットタギング結果を前記中央制御モジュールに出力する。
ステップ203において、受信された前記対話データのスロットタギング結果集合から前記中央制御モジュールにより確定された目標スロットタギング結果を取得する。
該実施例において、対話ロボットがBiLSTM-CRFモデルの出力したスロットタギング結果を取得した後、該スロットタギング結果を中央制御モジュールに出力してもよい。中央制御モジュールについては、異なる対話ロボットBotから送信された、同じ対話データに対するスロットタギング結果を受信して、スロットタギング結果集合を構成することができ、その場合、スロットタギング結果集合にはBiLSTM-CRFモデルの出力したスロットタギング結果及び他の対話ロボットの出力したスロットタギング結果が含まれてもよい。
実際には、NLUモジュールが1つの対話センテンスに対して1種類を超える意図を解析した場合、中央制御モジュールにより確定され、つまり、複数種類の意図から1種類の意図をユーザー意図として確定して、ユーザー意図に対応する少なくとも1つのBotを確定してそれぞれ解析処理を行って、処理後のスロットタギング結果集合を取得してもよい。その後、中央制御モジュールがスロットタギング結果集合からユーザー意図に最もマッチングする目標スロットタギング結果を確定してもよく、該目標スロットタギング結果がマンマシン対話システムからのユーザーへの応答結果として出力されてもよい。
ステップ204において、前記目標スロットタギング結果と前記BiLSTM-CRFモデルの出力したスロットタギング結果とが一致しないことに応じて、前記一致しないフィードバック情報を負フィードバック情報として確定する。
本実施例は目標スロット結果とBiLSTM-CRFモデルの出力したスロットタギング結果との比較結果と組み合わせて、BiLSTM-CRFモデルの出力したスロットタギング結果のフィードバック情報を確定することができる。
一例として、該フィードバック情報は正フィードバック情報及び負フィードバック情報を含んでもよい。例えば、正フィードバック情報は数値1で示されてもよく、負フィードバック情報は数値-1で示されてもよい。
該ステップでは、BiLSTM-CRFモデルの出力したスロットタギング結果と目標スロットタギング結果とが一致しない場合、フィードバック情報を負フィードバック情報として確定してもよい。
一実現方式では、本対話ロボットはフィードバック計算機(Reward Calculator)を設定して現在のスロットタギング結果のフィードバック情報を記録することができる。例えば、上記フィードバック情報を負フィードバック情報として確定する場合、Reward Calculatorの記録がreward=-1である。
ステップ205において、前記目標スロットタギング結果と前記BiLSTM-CRFモデルの出力したスロットタギング結果とが一致することに応じて、ユーザーの前記応答結果に対するフィードバック操作によってフィードバック情報を確定する。
該ステップでは、BiLSTM-CRFモデルの出力したスロットタギング結果と目標スロットタギング結果とが一致する場合、ユーザーの応答結果に対するフィードバック操作によってフィードバック情報を確定してもよい。
つまり、BiLSTM-CRFモデルの出力したスロットタギング結果と目標スロットタギング結果とが一致しても、ユーザーの応答結果に対するフィードバック操作によってフィードバック情報を確定することもでき、その理由はユーザーが応答結果の合理性を判断する真の判断側であるためである。
本開示の実施例の可能な実施形態において、ステップ205は、
ユーザーの正方向フィードバック率が所定閾値以上であることに応じて、該フィードバック情報を正フィードバック情報として確定するサブステップS11と、
前記正方向フィードバック率が所定閾値より小さいことに応じて、該フィードバック情報を負フィードバック情報として確定するサブステップS12と、を含んでもよい。
正方向フィードバック率が所定期間内のユーザーの応答結果に対するフィードバック操作によって確定される。
実際には、1つの時間帯内に複数のユーザーがマンマシン対話システムに同様又は類似の対話データを出す可能性がある場合、該対話データに対して、BiLSTM-CRFモデルの出力したスロットタギング結果を応答結果とすれば、該時間帯内の複数のユーザーの該応答結果に対するフィードバック操作(例えば、クリック又はサムズアップ等の操作)を統計することができ、正方向フィードバック率が所定閾値以上である場合、ユーザーのフィードバックが正のフィードバックであることを示し、この時、該スロットタギング結果のフィードバック情報を正フィードバック情報、すなわちreward=1として確定してもよく、そうでない場合、つまり、正方向フィードバック率が所定閾値より小さい場合、ユーザーのフィードバックが負のフィードバックであることを示し、この時、該スロットタギング結果のフィードバック情報を負フィードバック情報、すなわちreward=-1として確定してもよい。
フィードバック情報を確定した後、更に該フィードバック情報をキャッシュ領域に記憶して、以下の使用に備えてもよい。
ステップ206において、前記CRF層が前記フィードバック情報に基づいてモデル強化訓練を行うことができるように、前記フィードバック情報を前記BiLSTM-CRFモデルにおけるCRF層にフィードバックする。
該ステップでは、Reward CalculatorはBiLSTM-CRFモデルの出力したスロットタギング結果のフィードバック情報を確定した後、記録されたフィードバック情報をBiLSTM-CRFモデルのCRF層にフィードバックすることができ、CRF層が各スロットタギング結果及び対応するフィードバック情報を訓練データとしてモデルの強化学習訓練を行い、強化学習によって学習全体の閉ループを完了し、それにより訓練後のBiLSTM-CRFモデルがより正確なスロットタギング結果を取得できる。
一例では、BiLSTM-CRFモデルに対して強化学習を行うための4つの要素は、
スロットタギング結果YであるActionと、
識別対象シーケンスXであるStateと、
p(y|x)、すなわちシーケンスXの条件下で結果Yを生成する確率であるPolicyと、
フィードバック情報であるRewardと、を含んでもよい。
本実施例において、BiLSTM-CRFモデルの出力したスロットタギング結果を取得した後、中央制御モジュール及びユーザーの該スロットタギング結果に対するフィードバックと組み合わせて、フィードバック情報を確定してもよく、ユーザーによるラベリングを省略し、該フィードバック情報をBiLSTM-CRFモデルのCRF層に返送して強化学習を行うことにより、BiLSTM-CRFモデルの精度を向上させることができる。
当業者が本開示の実施例をよく理解するために、以下に具体例を挙げて本開示の実施例を例示的に説明する。
例えば、ユーザーの入力した対話データが「明日の天気」であり、「明日の天気」が1つの映画名であるため、BiLSTM-CRFモデルが「明日の天気」に対してスロットタギングを行った後、出力したスロットタギング結果が「明日の天気/video」である。中央制御モジュールは複数のBotから送信されたスロットタギング結果を受信した後、最終的に該対話データのユーザー意図が天気であると確定したため、最終的に取得した目標スロットタギング結果が「明日/date 天気/weather」である。Reward Calculatorは中央制御モジュールの確定した目標スロットタギング結果を取得した後、それをBiLSTM-CRFモデルの出力したスロットタギング結果にマッチングし、それらが一致しない(一方がvideoの結果であるが、他方がweatherの結果である)と判定するため、該BiLSTM-CRFモデルの出力したスロットタギング結果のフィードバック情報をreward=-1として設定する。
逆に、中央制御モジュールの最終的に確定した該対話データの意図がvideoであるため、最終的に取得した目標スロットタギング結果が「明日の天気/video」である。Reward Calculatorは中央制御モジュールの確定した目標スロットタギング結果を取得した後、それをBiLSTM-CRFモデルの出力したスロットタギング結果にマッチングし、それらが一致する(いずれもvideoの結果である)と判定し、この時、Reward Calculatorは所定期間内のユーザーの該目標スロットタギング結果に対する応答結果(例えば、中央制御モジュールがユーザーに「明日の天気の映画資源」を返信する)のクリック率を統計し、クリック率がより低い(所定閾値より低い)場合、該応答結果がユーザーを満たさないと見なされ、該スロットタギング結果のフィードバック情報をreward=-1として設定してもよく、逆に、クリック率がより高い(所定閾値より高い)場合、該応答結果がユーザーを満たすと見なされ、該スロットタギング結果のフィードバック情報をreward=1として設定してもよい。
Reward Calculatorがフィードバック情報をBiLSTM-CRFモデルにフィードバックし、モデルが動的な自己学習を行うため、reward=-1と仮定する場合、モデルが再び「明日の天気」の対話データを受信した場合、それがvideoのラベリング結果に属さず、weatherのラベリング結果に属すると判定し、出力した識別結果が「明日/date 天気/weather」であり、それにより学習の目的を実現する。
以上の実施形態の様々な技術的特徴は任意に組み合わせられてもよく、紙幅の都合上、ここで詳しく説明しないが、特徴同士の組み合わせが衝突又は矛盾しない限り、上記実施形態の様々な技術的特徴の任意の組み合わせも本明細書に開示される範囲に属する。
上記自然言語処理方法の実施例に対応して、本開示の実施例は更に自然言語処理装置の実施例を提供する。
図4に示すように、図4は本開示の例示的な実施例に係る自然言語処理装置の実施例のブロック図であり、本開示の実施例の装置はマンマシン対話システムにおける対話ロボットに適用され、該装置は、具体的に、
使用されているBiLSTM-CRFモデルでユーザーの入力した対話データに対してスロットタギングを行った後に出力したスロットタギング結果を確定するように構成されるスロットタギング結果確定モジュール401と、
前記スロットタギング結果及びユーザーの前記スロットタギング結果に対するフィードバックに基づいてフィードバック情報を確定するように構成されるフィードバック情報確定モジュール402と、
前記フィードバック情報に基づいて前記BiLSTM-CRFモデルに対して強化学習を行うように構成されるモデル強化学習モジュール403と、を備えてもよい。
上記実施例によれば、本開示の実施例において、スロットタギング結果確定モジュール401がBiLSTM-CRFモデルの出力したスロットタギング結果を取得して、フィードバック情報確定モジュール402によって該スロットタギング結果及びユーザーの該スロットタギング結果に対するフィードバックに基づいてフィードバック情報を確定することにより、手動ラベリング量を減少させる。次に、モデル強化学習モジュール403が該フィードバック情報に基づいてBiLSTM-CRFモデルに対して強化学習を行うことにより、モデルの動的な自己学習を実現し、それによりモデルのスロットタギング精度を向上させることができる。
本開示の実施例の好適な実施例において、マンマシン対話システムは更に中央制御モジュールを備え、前記装置は、更に、
前記BiLSTM-CRFモデルの出力したスロットタギング結果を前記中央制御モジュールに出力するように構成されるスロットタギング結果出力モジュールと、
受信された前記対話データのスロットタギング結果集合から前記中央制御モジュールにより確定された目標スロットタギング結果を取得するように構成される目標スロットタギング結果確定モジュールと、を備え、
前記スロットタギング結果集合が前記BiLSTM-CRFモデルの出力したスロットタギング結果及び他の対話ロボットの出力したスロットタギング結果を含み、前記目標スロットタギング結果が前記マンマシン対話システムからのユーザーへの応答結果として出力されることに用いられる。
本開示の実施例の他の好適な実施例において、前記フィードバック情報確定モジュール402は、
前記目標スロットタギング結果と前記BiLSTM-CRFモデルの出力したスロットタギング結果とが一致しないように応答して、前記一致しないフィードバック情報を負フィードバック情報として確定するように構成される第1フィードバック情報確定サブモジュールと、
前記目標スロットタギング結果と前記BiLSTM-CRFモデルの出力したスロットタギング結果とが一致するように応答して、ユーザーの前記応答結果に対するフィードバック操作によってフィードバック情報を確定するように構成される第2フィードバック情報確定サブモジュールと、を含んでもよい。
上記実施例によれば、ラベリング精度を向上させるよう、フィードバック情報は中央処理モジュールのフィードバック情報及びユーザーのフィードバック情報を含んでもよく、フィードバック情報の確定次元を増加させる。
本開示の実施例の好適な実施例において、前記第2フィードバック情報確定サブモジュールは、具体的に、
ユーザーの正方向フィードバック率が所定閾値以上であることに応じて、該フィードバック情報を正フィードバック情報として確定し、
前記正方向フィードバック率が所定閾値より小さいことに応じて、該フィードバック情報を負フィードバック情報として確定するように構成され、
前記正方向フィードバック率が所定期間内のユーザーの前記応答結果に対するフィードバック操作によって確定されるものである。
上記実施例によれば、フィードバック情報のラベリングを行うとき、中央制御モジュール及びユーザーのフィードバック情報と組み合わせて分析してもよく、それによりラベリング精度を向上させることができる。
本開示の実施例の好適な実施例において、前記モデル強化学習モジュール403は、具体的に、
前記CRF層が前記フィードバック情報に基づいてモデル強化訓練を行うことができるように、前記フィードバック情報を前記BiLSTM-CRFモデルにおけるCRF層にフィードバックするように構成される。
上記実施例によれば、モデル強化学習モジュール403がフィードバック情報に基づいてモデル強化学習を行うことにより、モデルの動的な自己学習を実現し、モデルのスロットタギング精度を向上させることができる。
上記装置における各モジュールの機能及び作用の実現過程の具体的な詳細は上記システム実施例の具体的な説明を参照してもよく、ここで詳細な説明は省略する。
装置実施例については、それは基本的にシステム実施例に対応するため、関連箇所はシステム実施例の説明の一部を参照してもよい。以上に説明される装置実施例は模式的なものに過ぎず、分離部材として説明される前記ユニットは物理的に分離してもよいし、物理的に分離しなくてもよく、ユニットとして表示される部材は物理ユニットであってもよいし、物理ユニットでなくてもよく、つまり、一箇所に位置してもよいし、複数のネットワークユニットに配置されてもよい。実際の必要に応じて、その一部又は全部のモジュールを選択して本開示の実施例の解決手段の目的を実現してもよい。当業者であれば、創造的な労力を要することなく、理解し実施できる。
図5に示すように、図5は本開示の例示的な実施例に係るマンマシン対話装置500のブロック図である。
図5に示すように、装置500は処理コンポーネント502、メモリ504、電源コンポーネント506、マルチメディアコンポーネント508、オーディオコンポーネント510、入力/出力(I/O)インターフェース512、センサコンポーネント514及び通信コンポーネント516のうちの1つ又は複数を備えてもよい。
処理コンポーネント502は一般的に装置500の全体操作を制御し、上記方法の全部又は一部のステップを完了するよう、処理コンポーネント502は命令を実行するために1つ又は複数のプロセッサ520を備えてもよい。なお、処理コンポーネント502は処理コンポーネント502と他のコンポーネントとの相互作用に役立つ1つ又は複数のモジュールを備えてもよい。例えば、処理コンポーネント502はマルチメディアコンポーネント508と処理コンポーネント502との相互作用に役立つマルチメディアモジュールを備えてもよい。
メモリ504は装置500における操作をサポートするために様々なタイプのデータを記憶するように構成される。これらのデータの例は装置500において操作するためのいかなるアプリケーションプログラム又は方法の命令を含む。メモリ504はいかなるタイプの揮発性記憶装置又は不揮発性記憶装置、例えばスタティックランダムアクセスメモリ(SRAM)、電気的消去可能プログラム可能読み出し専用メモリ(EEPROM)、消去可能プログラム可能読み出し専用メモリ(EPROM)、プログラム可能読み出し専用メモリ(PROM)、読み出し専用メモリ(ROM)、磁気メモリ、フラッシュメモリ、磁気ディスク又は光ディスク、又はそれらの組み合わせで実現されてもよい。
電源コンポーネント506は装置500の様々なコンポーネントに電力を提供する。電源コンポーネント506は電源管理システム、1つ又は複数の電源及び装置500への電力の生成、管理及び分配に関連する他のコンポーネントを備えてもよい。
マルチメディアコンポーネント508は前記装置500とユーザーとの間に1つの出力インターフェースを提供するスクリーンを備える。いくつかの実施例において、スクリーンは液晶ディスプレイ(LCD)及びタッチパネル(TP)を含んでもよい。スクリーンはタッチパネルを含む場合、ユーザーからの入力信号を受信するよう、スクリーンはタッチスクリーンとして実現されてもよい。タッチ、スワイプ及びタッチパネルにおけるジェスチャーを検知するよう、タッチパネルは1つ又は複数のタッチセンサを備える。前記タッチセンサはタッチ又はスワイプ動作の境界を検知するだけでなく、更に前記タッチ又はスワイプ操作に関連する持続時間及び圧力を検出することができる。オーディオコンポーネント510はオーディオ信号を出力及び/又は入力するように構成される。例えば、オーディオコンポーネント510は1つのマイクロフォン(MIC)を備え、装置500が操作モード、例えばコールモード、記録モード及び音声識別モードにある場合、マイクロフォンは外部オーディオ信号を受信するように構成される。受信されたオーディオ信号は更にメモリ504に記憶され又は通信コンポーネント516により送信されてもよい。いくつかの実施例において、オーディオコンポーネント510は更にオーディオ信号を出力するための1つの拡声器を備える。
I/Oインターフェース512は処理コンポーネント502と周辺インターフェースモジュールとの間にインターフェースを提供し、上記周辺インターフェースモジュールはキーボード、クリックホイール、ボタン等であってもよい。これらのボタンはホームページボタン、音量ボタン、スタートボタン及びロックボタンを含んでもよいが、それらに限らない。
センサコンポーネント514は装置500に各態様の状態評価を提供するための1つ又は複数のセンサを備える。例えば、センサコンポーネント514は装置500のオン/オフ状態、コンポーネントの相対位置決めを検出することができ、例えば前記コンポーネントは装置500のディスプレイ及びキーパッドであり、センサコンポーネント514は更に装置500又は装置500の1つのコンポーネントの位置変化、ユーザーが装置500に接触しているかどうか、装置500の方位又は加速/減速及び装置500の温度変化を検出することができる。センサコンポーネント514は物理的に接触しない際に近傍に物体があるかどうかを検出するように構成される接近センサを備えてもよい。センサコンポーネント514は更にイメージングアプリケーションに使用されるための光センサ、例えばCMOS又はCCD画像センサを備えてもよい。いくつかの実施例において、該センサコンポーネント514は更に加速度センサ、ジャイロスコープセンサ、磁気センサ、圧力センサ又は温度センサを含んでもよい。
通信コンポーネント516は装置500と他の装置との有線又は無線方式の通信に役立つように構成される。装置500は通信規格に基づく無線ネットワーク、例えばWiFi(登録商標)、2G又は5G、又はそれらの組み合わせにアクセスすることができる。1つの例示的な実施例において、通信コンポーネント516は放送チャネルを介して外部放送管理システムからのブロードキャスト信号又はブロードキャスト関連情報を受信する。1つの例示的な実施例において、近距離通信を促進するよう、前記通信コンポーネント516は更に近距離無線通信(NFC)モジュールを備える。例えば、NFCモジュールは無線周波数識別(RFID)技術、赤外線データ協会(IrDA)技術、超広帯域(UWB)技術、ブルートゥース(登録商標)(BT)技術又は他の技術により実現されてもよい。
例示的な実施例において、上記方法を実行するために、装置500は1つ又は複数の特定用途向け集積回路(ASIC)、デジタル信号プロセッサ(DSP)、デジタル信号処理デバイス(DSPD)、プログラマブルロジックデバイス(PLD)、フィールドプログラマブルゲートアレイ(FPGA)、コントローラ、マイクロコントローラ、マイクロプロセッサ又は他の電子素子により実現されてもよい。
例示的な実施例において、更に命令を含む非一時的コンピュータ可読記憶媒体、例えば命令を含むメモリ504を提供し、上記方法を完了するために、上記命令が装置500のプロセッサ520により実行されてもよい。例えば、前記非一時的コンピュータ可読記憶媒体はROM、CD-ROM、磁気テープ、フロッピー(登録商標)ディスク及び光データ記憶装置等であってもよい。
前記記憶媒体における命令が前記プロセッサにより実行されるとき、装置500は自然言語処理方法を実行することができ、前記方法は、使用されているBiLSTM-CRFモデルでユーザーの入力した対話データに対してスロットタギングを行った後に出力したスロットタギング結果を確定することと、前記スロットタギング結果及びユーザーの前記スロットタギング結果に対するフィードバックに基づいてフィードバック情報を確定することと、前記フィードバック情報に基づいて前記BiLSTM-CRFモデルに対して強化学習を行うことと、を含む。
当業者が明細書を考慮し及びここで開示される発明を実践した後、本開示の実施例の他の実施形態に容易に想到し得る。本開示の実施例は本開示の実施例のいかなる変形、用途又は適応変化を含むように意図され、これらの変形、用途又は適応変化は本開示の実施例の一般原理に従い且つ本開示の実施例に開示されていない本技術分野における周知の知識又は慣用の技術的手段を含む。明細書及び実施例は例示的なものであると見なされ、本開示の実施例の真の範囲及び趣旨は以下の特許請求の範囲に準じる。
本開示の実施例は以上に説明されて図面に示される正確な構造に限らず、その範囲を逸脱せずに、種々の修正や変更を行うことができると理解すべきである。本開示の実施例の範囲は添付の特許請求の範囲により制限される。
以上の説明は本開示の実施例の好適な実施例であって、本開示の実施例を制限するためのものではなく、本開示の実施例の趣旨及び原則内に行ったいかなる修正、等価置換、改良等は、いずれも本開示の実施例の保護範囲内に含まれるべきである。
本開示の実施例において、BiLSTM-CRFモデルを基本的なフレームとし、BiLSTM-CRFモデルがスロットタギング結果を外部に出力した後、対話ロボットは該スロットタギング結果に基づいて対応するフィードバック情報を取得して、該フィードバック情報に基づいてBiLSTM-CRFモデルに対して強化学習を行うことができ、これにより、モデルの動的な自己学習を実現し、それにより手動ラベリング過程を省略し、スロットタギング効率及び精度を向上させる。

Claims (10)

  1. 自然言語処理方法であって、マンマシン対話システムにおける対話ロボットに適用され、
    使用されている双方向長期短期記憶ネットワークアルゴリズム及び条件付確率場アルゴリズム(BiLSTM-CRF)モデルでユーザーの入力した対話データに対してスロットタギングを行った後に出力したスロットタギング結果を確定することと、
    前記スロットタギング結果及びユーザーの前記スロットタギング結果に対するフィードバックに基づいてフィードバック情報を確定することと、
    前記フィードバック情報に基づいて前記BiLSTM-CRFモデルに対して強化学習を行うことと、を含
    前記マンマシン対話システムは更に中央制御モジュールを備え、
    使用されている前記BiLSTM-CRFモデルでユーザーの入力した対話データに対してスロットタギングを行った後に出力したスロットタギング結果を確定した後、前記方法は、更に、
    前記対話ロボットが前記BiLSTM-CRFモデルの出力したスロットタギング結果を前記中央制御モジュールに出力することと、
    受信された前記対話データのスロットタギング結果集合から前記中央制御モジュールにより確定された目標スロットタギング結果を取得することと、を含み、
    前記スロットタギング結果集合が前記BiLSTM-CRFモデルの出力したスロットタギング結果及び他の対話ロボットの出力したスロットタギング結果を含み、前記目標スロットタギング結果が前記マンマシン対話システムからのユーザーへの応答結果として出力されることに用いられる、
    自然言語処理方法。
  2. 前記スロットタギング結果及びユーザーの前記スロットタギング結果に対するフィードバックに基づいてフィードバック情報を確定することは、
    前記目標スロットタギング結果と前記BiLSTM-CRFモデルの出力したスロットタギング結果とが一致しないことに応じて、前記一致しないフィードバック情報を負フィードバック情報として確定することと、
    前記目標スロットタギング結果と前記BiLSTM-CRFモデルの出力したスロットタギング結果とが一致することに応じて、ユーザーの前記応答結果に対するフィードバック操作によってフィードバック情報を確定することと、を含む
    請求項に記載の方法。
  3. ユーザーの前記応答結果に対するフィードバック操作によってフィードバック情報を確定することは、
    ユーザーの正方向フィードバック率が所定閾値以上であることに応じて、該フィードバック情報を正フィードバック情報として確定することと、
    前記正方向フィードバック率が所定閾値より小さいことに応じて、該フィードバック情報を負フィードバック情報として確定することと、を含み、
    前記正方向フィードバック率が所定期間内のユーザーの前記応答結果に対するフィードバック操作によって確定されるものである、
    請求項に記載の方法。
  4. 前記フィードバック情報に基づいてモデル強化学習を行うことは、
    RF層が前記フィードバック情報に基づいてモデル強化訓練を行うことができるように、前記フィードバック情報を前記BiLSTM-CRFモデルにおける前記CRF層にフィードバックすることを含む
    請求項1~のいずれか1項に記載の方法。
  5. 自然言語処理装置であって、
    マンマシン対話システムにおける対話ロボットに適用され、
    使用されている双方向長期短期記憶ネットワークアルゴリズム及び条件付確率場アルゴリズム(BiLSTM-CRF)モデルでユーザーの入力した対話データに対してスロットタギングを行った後に出力したスロットタギング結果を確定するように構成されるスロットタギング結果確定モジュールと、
    前記スロットタギング結果及びユーザーの前記スロットタギング結果に対するフィードバックに基づいてフィードバック情報を確定するように構成されるフィードバック情報確定モジュールと、
    前記フィードバック情報に基づいて前記BiLSTM-CRFモデルに対して強化学習を行うように構成されるモデル強化学習モジュールと、を備え
    前記マンマシン対話システムは更に中央制御モジュールを備え、
    前記装置は、更に、
    前記BiLSTM-CRFモデルの出力したスロットタギング結果を前記中央制御モジュールに出力するように構成されるスロットタギング結果出力モジュールと、
    受信された前記対話データのスロットタギング結果集合から前記中央制御モジュールにより確定された目標スロットタギング結果を取得するように構成される目標スロットタギング結果確定モジュールと、を備え、
    前記スロットタギング結果集合が前記BiLSTM-CRFモデルの出力したスロットタギング結果及び他の対話ロボットの出力したスロットタギング結果を含み、前記目標スロットタギング結果が前記マンマシン対話システムからのユーザーへの応答結果として出力されることに用いられる、
    自然言語処理装置。
  6. 前記フィードバック情報確定モジュールは、
    前記目標スロットタギング結果と前記BiLSTM-CRFモデルの出力したスロットタギング結果とが一致しないことに応じて、前記一致しないフィードバック情報を負フィードバック情報として確定するように構成される第1フィードバック情報確定サブモジュールと、
    前記目標スロットタギング結果と前記BiLSTM-CRFモデルの出力したスロットタギング結果とが一致することに応じて、ユーザーの前記応答結果に対するフィードバック操作によってフィードバック情報を確定するように構成される第2フィードバック情報確定サブモジュールと、を含む
    請求項に記載の装置。
  7. 前記第2フィードバック情報確定サブモジュールは、具体的に、
    ユーザーの正方向フィードバック率が所定閾値以上であることに応じて、該フィードバック情報を正フィードバック情報として確定し、
    前記正方向フィードバック率が所定閾値より小さいことに応じて、該フィードバック情報を負フィードバック情報として確定するように構成され、
    前記正方向フィードバック率が所定期間内のユーザーの前記応答結果に対するフィードバック操作によって確定されるものである、
    請求項に記載の装置。
  8. 前記モデル強化学習モジュールは、具体的に、
    RF層が前記フィードバック情報に基づいてモデル強化訓練を行うことができるように、前記フィードバック情報を前記BiLSTM-CRFモデルにおける前記CRF層にフィードバックするように構成される
    請求項のいずれか1項に記載の装置。
  9. 対話ロボットを備えるマンマシン対話装置であって、
    プロセッサと、
    プロセッサ実行可能命令を記憶するように構成されるメモリと、を備え、
    前記プロセッサは、
    使用されている双方向長期短期記憶ネットワークアルゴリズム及び条件付確率場アルゴリズム(BiLSTM-CRF)モデルでユーザーの入力した対話データに対してスロットタギングを行った後に出力したスロットタギング結果を確定し、
    前記スロットタギング結果及びユーザーの前記スロットタギング結果に対するフィードバックに基づいてフィードバック情報を確定し、
    前記フィードバック情報に基づいて前記BiLSTM-CRFモデルに対して強化学習を行うように構成され
    前記マンマシン対話装置は更に中央制御モジュールを備え、
    使用されている前記BiLSTM-CRFモデルでユーザーの入力した対話データに対してスロットタギングを行った後に出力したスロットタギング結果を確定した後、前記プロセッサは、更に、
    前記対話ロボットが前記BiLSTM-CRFモデルの出力したスロットタギング結果を前記中央制御モジュールに出力することと、
    受信された前記対話データのスロットタギング結果集合から前記中央制御モジュールにより確定された目標スロットタギング結果を取得することと、を実行するように構成され、
    前記スロットタギング結果集合が前記BiLSTM-CRFモデルの出力したスロットタギング結果及び他の対話ロボットの出力したスロットタギング結果を含み、前記目標スロットタギング結果が前記マンマシン対話システムからのユーザーへの応答結果として出力されることに用いられる、
    マンマシン対話装置。
  10. コンピュータ可読記憶媒体であって、
    コンピュータプログラムが記憶され、前記プログラムがプロセッサにより実行されるとき、請求項1~のいずれか1項に記載の方法のステップを実現する、前記コンピュータ可読記憶媒体。
JP2019564011A 2019-07-29 2019-10-12 自然言語処理方法、装置及び設備 Active JP7101706B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201910687763.0 2019-07-29
CN201910687763.0A CN110413756B (zh) 2019-07-29 2019-07-29 自然语言处理的方法、装置及设备
PCT/CN2019/110894 WO2021017173A1 (zh) 2019-07-29 2019-10-12 自然语言处理的方法、装置及设备

Publications (2)

Publication Number Publication Date
JP2021535411A JP2021535411A (ja) 2021-12-16
JP7101706B2 true JP7101706B2 (ja) 2022-07-15

Family

ID=68363742

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019564011A Active JP7101706B2 (ja) 2019-07-29 2019-10-12 自然言語処理方法、装置及び設備

Country Status (7)

Country Link
US (1) US11501078B2 (ja)
EP (1) EP3772012A1 (ja)
JP (1) JP7101706B2 (ja)
KR (1) KR102330061B1 (ja)
CN (1) CN110413756B (ja)
RU (1) RU2726739C1 (ja)
WO (1) WO2021017173A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110909541A (zh) * 2019-11-08 2020-03-24 杭州依图医疗技术有限公司 指令生成方法、系统、设备和介质
CN111198937B (zh) * 2019-12-02 2023-06-30 泰康保险集团股份有限公司 对话生成及装置、计算机可读存储介质、电子设备
CN111597808B (zh) * 2020-04-24 2023-07-25 北京百度网讯科技有限公司 仪表盘绘制处理方法、装置、电子设备和存储介质
CN111681647B (zh) * 2020-06-10 2023-09-05 北京百度网讯科技有限公司 用于识别词槽的方法、装置、设备以及存储介质
CN112507126B (zh) * 2020-12-07 2022-11-15 厦门渊亭信息科技有限公司 一种基于循环神经网络的实体链接装置和方法
CN113515822B (zh) * 2021-01-28 2022-11-29 长春工业大学 一种基于归零神经网络的张拉整体结构找形方法
CN113268995B (zh) * 2021-07-19 2021-11-19 北京邮电大学 中文学术关键词抽取方法、装置和存储介质
US11520815B1 (en) * 2021-07-30 2022-12-06 Dsilo, Inc. Database query generation using natural language text
CN115099224A (zh) * 2022-07-08 2022-09-23 江苏理工学院 融合BiLSTM+CRF与规则匹配的中文PDF内容抽取方法和装置
CN117173491B (zh) * 2023-10-24 2024-02-23 广州思德医疗科技有限公司 医学图像的标注方法、装置、电子设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018132754A (ja) 2017-02-13 2018-08-23 株式会社東芝 対話システム、対話方法、および対話システムを適合させる方法
JP2018163641A (ja) 2017-03-27 2018-10-18 三角獣(北京)科技有限公司 情報処理装置及び情報処理方法

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070106496A1 (en) * 2005-11-09 2007-05-10 Microsoft Corporation Adaptive task framework
GB2440316A (en) 2006-07-25 2008-01-30 Optinose As Nasal inhaler with scrubber
US9978365B2 (en) * 2008-10-31 2018-05-22 Nokia Technologies Oy Method and system for providing a voice interface
EP2839391A4 (en) 2012-04-20 2016-01-27 Maluuba Inc CONVERSATION AGENT
RU2665239C2 (ru) * 2014-01-15 2018-08-28 Общество с ограниченной ответственностью "Аби Продакшн" Автоматическое извлечение именованных сущностей из текста
RU2595489C2 (ru) * 2014-06-18 2016-08-27 Самсунг Электроникс Ко., Лтд. Выделение временных выражений для текстов на естественном языке
MX2018002346A (es) 2015-08-28 2018-04-11 Agbiome Inc Composiciones y metodos para controlar enfermedades de plantas.
WO2017083504A1 (en) 2015-11-12 2017-05-18 Semantic Machines, Inc. Interaction assistant
CN107305575B (zh) * 2016-04-25 2021-01-26 北京京东尚科信息技术有限公司 人机智能问答系统的断句识别方法和装置
US11783173B2 (en) * 2016-06-23 2023-10-10 Microsoft Technology Licensing, Llc Multi-domain joint semantic frame parsing
CN106445147B (zh) * 2016-09-28 2019-05-10 北京百度网讯科技有限公司 基于人工智能的对话系统的行为管理方法及装置
CN106569998A (zh) * 2016-10-27 2017-04-19 浙江大学 一种基于Bi‑LSTM、CNN和CRF的文本命名实体识别方法
GB2559618B (en) * 2017-02-13 2020-07-08 Toshiba Kk A dialogue system, a dialogue method and a method of adapting a dialogue system
CN106919702B (zh) * 2017-02-14 2020-02-11 北京时间股份有限公司 基于文档的关键词推送方法及装置
JP6851894B2 (ja) * 2017-04-24 2021-03-31 株式会社東芝 対話システム、対話方法及び対話プログラム
US11933699B2 (en) 2017-07-06 2024-03-19 Waters Technologies Corporation Devices and methods for preparing filtered solutions for lateral flow testing
US10431219B2 (en) * 2017-10-03 2019-10-01 Google Llc User-programmable automated assistant
JP6894534B2 (ja) 2017-10-31 2021-06-30 ▲騰▼▲訊▼科技(深▲セン▼)有限公司 情報処理方法及び端末、コンピュータ記憶媒体
JP6805112B2 (ja) * 2017-11-08 2020-12-23 株式会社東芝 対話システム、対話方法および対話プログラム
US11562243B2 (en) * 2017-11-17 2023-01-24 Meta Platforms, Inc. Machine-learning models based on non-local neural networks
CN108108449A (zh) * 2017-12-27 2018-06-01 哈尔滨福满科技有限责任公司 一种面向医疗领域的基于多源异构数据问答系统及该系统的实现方法
CN108363690A (zh) * 2018-02-08 2018-08-03 北京十三科技有限公司 基于神经网络的对话语义意图预测方法及学习训练方法
CN109003605B (zh) * 2018-07-02 2020-04-21 北京百度网讯科技有限公司 智能语音交互处理方法、装置、设备及存储介质
CN109063035B (zh) * 2018-07-16 2021-11-09 哈尔滨工业大学 一种面向出行领域的人机多轮对话方法
CN109697679A (zh) * 2018-12-27 2019-04-30 厦门智融合科技有限公司 知识产权服务导引方法及系统
US20200293874A1 (en) * 2019-03-12 2020-09-17 Microsoft Technology Licensing, Llc Matching based intent understanding with transfer learning
CN109918680B (zh) * 2019-03-28 2023-04-07 腾讯科技(上海)有限公司 实体识别方法、装置及计算机设备

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018132754A (ja) 2017-02-13 2018-08-23 株式会社東芝 対話システム、対話方法、および対話システムを適合させる方法
JP2018163641A (ja) 2017-03-27 2018-10-18 三角獣(北京)科技有限公司 情報処理装置及び情報処理方法

Also Published As

Publication number Publication date
CN110413756A (zh) 2019-11-05
WO2021017173A1 (zh) 2021-02-04
EP3772012A1 (en) 2021-02-03
JP2021535411A (ja) 2021-12-16
RU2726739C1 (ru) 2020-07-15
CN110413756B (zh) 2022-02-15
US11501078B2 (en) 2022-11-15
KR20210016262A (ko) 2021-02-15
KR102330061B1 (ko) 2021-11-26
US20210034966A1 (en) 2021-02-04

Similar Documents

Publication Publication Date Title
JP7101706B2 (ja) 自然言語処理方法、装置及び設備
CN110364148B (zh) 自然助理交互
CN111656439B (zh) 基于延迟控制电子设备的方法、电子设备及存储介质
CN111480134B (zh) 注意力感知虚拟助理清除
WO2021135577A1 (zh) 音频信号处理方法、装置、电子设备及存储介质
WO2020147428A1 (zh) 交互内容生成方法、装置、计算机设备及存储介质
CN112313680A (zh) 助理系统中手势输入的自动完成
US11436451B2 (en) Multimodal fine-grained mixing method and system, device, and storage medium
US11886542B2 (en) Model compression using cycle generative adversarial network knowledge distillation
CN114041283A (zh) 利用事件前和事件后输入流来接洽自动化助理
WO2021211200A1 (en) Natural language processing models for conversational computing
CN115221295A (zh) 个人请求的数字助理处理
JP7488871B2 (ja) 対話推薦方法、装置、電子機器、記憶媒体ならびにコンピュータプログラム
CN111368525A (zh) 信息搜索方法、装置、设备及存储介质
WO2019212729A1 (en) Generating response based on user's profile and reasoning on contexts
WO2023071562A1 (zh) 语音识别文本处理方法、装置、设备、存储介质及程序产品
CN111144093A (zh) 一种智能文本处理方法、装置、电子设备及存储介质
WO2019212760A1 (en) Enhanced accessibility in mixed reality experience for collaboration tools
CN112036174B (zh) 一种标点标注方法及装置
CN117520498A (zh) 基于虚拟数字人交互处理方法、系统、终端、设备及介质
CN109154899B (zh) 用于利用在线服务执行用户指令的交互框架
Liang et al. Hierarchical hybrid code networks for task-oriented dialogue
Zhou et al. An image captioning model based on bidirectional depth residuals and its application
CN112015873A (zh) 通过设备内置目标定位和个性化实现语音助理可发现性
Li et al. Conditional joint model for spoken dialogue system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220126

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220621

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220705

R150 Certificate of patent or registration of utility model

Ref document number: 7101706

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150