JP2021119451A - 対話型インタラクションの方法、装置、機器及び記憶媒体 - Google Patents

対話型インタラクションの方法、装置、機器及び記憶媒体 Download PDF

Info

Publication number
JP2021119451A
JP2021119451A JP2020158812A JP2020158812A JP2021119451A JP 2021119451 A JP2021119451 A JP 2021119451A JP 2020158812 A JP2020158812 A JP 2020158812A JP 2020158812 A JP2020158812 A JP 2020158812A JP 2021119451 A JP2021119451 A JP 2021119451A
Authority
JP
Japan
Prior art keywords
tree
dialogue
node
sentence
statement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020158812A
Other languages
English (en)
Inventor
ホー・ウェンソン
Wensong He
ミャオ・ヤフェイ
Yafei Miao
タン・チーチャオ
Qichao Tang
シュ・ベン
Ben Xu
シエ・ジエン
Jian Zie
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Original Assignee
Baidu Online Network Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baidu Online Network Technology Beijing Co Ltd filed Critical Baidu Online Network Technology Beijing Co Ltd
Publication of JP2021119451A publication Critical patent/JP2021119451A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • G06F40/56Natural language generation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Human Computer Interaction (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】複数ランドのマンマシンイン対話の正確性を向上させることができる対話型インタラクションの方法、装置、機器及び記憶媒体を提供する。【解決手段】対話型インタラクションの方法は、文のツリーに基づいて、ユーザからの受信情報に対し、第1のセマンティックコードを決定するステップと、第1のセマンティックコードに基づき、対話のツリーから、ユーザからの受信情報に応答するための第2のセマンティックコードを決定するステップと、ユーザと対話するために、文のツリーから、第2のセマンティックコードの対応するターゲット応答文を決定するステップと、を含む。【選択図】図1

Description

本出願の実施例は、コンピュータ技術分野に関し、特に人工知能技術分野に関し、具体的には、対話型インタラクションの方法、装置、機器及び記憶媒体に関する。
スマートスピーカ装置等のスマート機器の普及に伴い、ユーザとスマート機器とが対話する需要が日増しに伸びている。リソースのリクエスト、家電の制御等の需要に加え、スマート機器との感情の交流、日常対話、話題のチャット等のマンマシンインタラクションを行うユーザも多くなる。しかしながら、従来の技術では、一般的に、1ランドだけの対話しかを実現できないため、対話文脈の論理性に欠け、複数ランドの対話時の正確率が低く、トレーニングコーパスのコストが高い問題がある。
本願の実施例は、複数ランドのランドマンマシンイン対話の正確性を向上させることができる対話型インタラクションの方法、装置、機器及び記憶媒体を提供する。
第1の態様において、本出願の実施例は、対話型インタラクションの方法であって、
ユーザからの受信情報に対し、文のツリーに基づいて、第1のセマンティックコードを決定するステップと、
前記第1のセマンティックコードに基づいて、対話のツリーから、前記受信情報に応答するための第2のセマンティックコードを決定するステップであって、前記文のツリーと前記対話のツリーは、ロジックマインドマップのサンプルにおける文ノード情報及び/又は単語ノード情報を利用してトレーニングして得られた、ステップと、
ユーザと対話するために、前記文のツリーから、前記第2のセマンティックコードの対応するターゲット応答文を決定するステップと、
を含む方法を提供する。
上記の実施例は、以下の利点又は有益な効果を有する。ロジックマインドマップにより、対話論理を文のツリー及び対話のツリーにするように迅速に学習することにより、文のツリーと対話のツリーとは交互にマッチングすることで、前文の対話内容を考慮するとともに、対話内容の複数種の表現を含み、対話内容の多様性を確保できる応答内容を提供し、マンマシン間の複数ランドの対話の正確性を向上させる。
選択的に、前記文のツリーは、単語と文との間の組み合わせ関係を表すように構成され、前記対話のツリーは、対話における文の間の応答関係を表すように構成される。
上記の実施例は、以下の利点又は有益な効果を有する。組み合わせ関係を有する文のツリーと、応答関係を有する対話のツリーとにより、上記対話内容を考慮するとともに、対話内容の複数種の表現を含み、対話内容の多様性を確保できる応答内容を提供することができる。
選択的に、前記文のツリーと前記対話のツリーは、前記ロジックマインドマップのサンプルに基づいて学習することにより、文のツリー及び対話のツリーにおけるノードを得るステップと、前記文のツリーと前記対話のツリーにおいて、ノード間の変換確率を決定するステップと、を含む操作により決定される。
上記の実施例は、以下の利点又は有益な効果を有する。ロジックマインドマップに基づいて決定されたノード情報及びノードの間の変換確率は、文のツリーと対話のツリーとを共に構成することで、ツリーにおける各ノードの間に対話論理を有し、対話内容の複数種の表現を含み、対話内容の多様性を確保できる。
選択的に、前記ロジックマインドマップのサンプルに基づいて学習することにより、文のツリー及び対話のツリーにおけるノードを得るステップは、
前記ロジックマインドマップのサンプルに対し、単語ノードの深さ優先探索を実行して、完全な対話パスを得るステップと、
前記完全な対話パスにおける単語ノードに基づいて、対話辞書を作成するステップと、
前記対話辞書の単語から構成された文に対してセマンティック圧縮を実行して、文のツリーを構成する文ノードを生成し、前記対話辞書に基づいて前記文ノードにおける単語ノードの組み合わせを得るステップと、
前記文ノードにおける単語ノードの組み合わせの語義に応じて、前記文ノードに、語義を識別するセマンティックコードを付加するステップと、を含む。
上記の実施例は、以下の利点又は有益な効果を有する。ロジックマインドマップのサンプルに基づいて作成された対話辞書における単語は、単語ノードの組み合わせにより表現された語義は文のツリーの単語ノードを構成しており、単語ノードの組み合わせによって、構成される文ノードにより表現された語義が異なり、それにより、文の語義毎に、セマンティックコードが与えられることにより、ユーザからの様々な表現となる受信情報の識別に有益であり、且つ、同一の語義の複数種の表現について、対話の多様性を確保することができる。
選択的に、前記ロジックマインドマップのサンプルに基づいて学習することにより、文のツリー及び対話のツリーにおけるノードを得るステップは、
前記ロジックマインドマップのサンプルにおける文ノードに対してセマンティック圧縮を実行して、対話のツリーを構成する文ノードを生成するステップと、ロジックマインドマップにおける文ノード間の接続関係の示す対話論理に基づいて、対話のツリーにおける文ノード間の応答関係を決定するステップと、
前記文ノードと、文ノード間の応答関係とに基づいて、対話のツリーを得て、前記文ノードの語義に応じて、前記文ノードに、語義を識別するセマンティックコードを付加するステップと、を含む。
上記の実施例は、以下の利点又は有益な効果を有する。ロジックマインドマップのサンプルにおいて圧縮された文の語義は、対話のツリーの文ノードを構成しており、各文ノードにセマンティックコードを付加し、ロジックマインドマップにおける対話論理に基づいて、対話のツリーにおける文ノード間の応答関係を決定することにより、語義の対応関係は、対話における発話間の対話論理を決定することに有利であり、且つ文における単語の表現に限定されない。
選択的に、前記ユーザからの受信情報に対し、文のツリーに基づいて、第1のセマンティックコードを決定するステップは、
前記受信情報における単語情報に基づいて、前記文のツリーの単語ノードから文ノードにトラバースして、前記受信情報を構成するターゲット単語ノードの組み合わせを決定するステップと、
前記ターゲット単語ノードの組み合わせに基づいて、前記ターゲット単語ノードの組み合わせの属する文ノードから、前記受信情報を示す第1のセマンティックコードを決定するステップと、を含む。
上記の実施例は、以下の利点又は有益な効果を有する。ユーザからの受信情報における単語情報を文のツリーにおける文ノードとマッチングすることにより、単語情報に一致するターゲット単語ノードの組み合わせを決定して、ターゲット単語ノードの組み合わせが属する文ノードの第1のセマンティックコードを決定することにょり、ユーザからの受信情報の語義識別を実現することができる。
選択的に、前記第1のセマンティックコードに基づいて、対話のツリーから、前記受信情報に応答するための第2のセマンティックコードを決定するステップは、
前記対話のツリーにおいて、前記第1のセマンティックコードと一致するターゲット受信文ノードを特定するステップと、
前記ターゲット受信文ノードと応答関係を持つ候補文ノードの変換確率によって、前記候補文ノードから応答文ノードを抽出するステップと、
前記応答文ノードの第2のセマンティックコードを決定するステップと、
を含む。
上記の実施例は、以下の利点又は有益な効果を有する。第1のセマンティックコードにより、対話のツリーにおいて文ノードを特定し、それにより文ノード間の応答関係に基づいて、ユーザからの受信情報に応答する第2のセマンティックコードを決定することにより、対話論理の上で応答の語義を決定することが実現でき、単語表示が対話に対する限界性及び対話の前文の無視を回避し、対話の多様性及び正確性を確保することができる。
選択的に、前記文のツリーから、前記第2のセマンティックコードの対応するターゲット応答文を決定するステップは、
前記文のツリーから、前記第2のセマンティックコードに一致するターゲット応答文ノードを照合するステップと、
前記ターゲット応答文ノードと組み合わせ関係を持つ候補単語ノードの変換確率によって、前記候補単語ノードからターゲット応答文ノードを抽出するステップと、
前記ターゲット応答単語ノードを組み合わせて、前記ターゲット応答文を得るステップと、を含む。
上記の実施例は、以下の利点又は有益な効果を有する。応答の語義としての第2のセマンティックコードに基づいて文のツリーからターゲット応答文ノードを決定し、第2のセマンティックコードに基づいて該第2の語義を表現する単語の組み合わせを決定し、最後に対話するためのターゲット応答文を生成する。語義を正確に表現するとともに、対話の多様性を確保することができる。
第2の態様において、本出願の実施例は、対話型インタラクション装置であって、
ユーザからの受信情報に対し、文のツリーに基づいて、第1のセマンティックコードを決定するように構成されたユーザ語義識別モジュールと、
前記第1のセマンティックコードに基づいて、対話のツリーから、前記受信情報に応答するための第2のセマンティックコードを決定するように構成された応答語義決定モジュールであって、前記文のツリーと前記対話のツリーは、ロジックマインドマップのサンプルにおける文ノード情報及び/又は単語ノード情報を利用してトレーニングして得られた、モジュールと、
ユーザと対話するために、前記文のツリーから、前記第2のセマンティックコードの対応するターゲット応答文を決定する応答文決定モジュールと、
を備えることを特徴とする対話型インタラクション装置を提供する。
第3の態様において、本願の実施例は、電子機器であって、
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサと通信可能に接続されたメモリと、を含み、
前記メモリは、前記少なくとも1つのプロセッサが実行可能な指令を記憶しており、前記指令は、前記少なくとも1つのプロセッサに実行されると、前記少なくとも1つのプロセッサに、請求項1乃至8のいずれか一項に記載の対話型インタラクションの方法を実行させる
ことを特徴とする電子機器を提供する。
第4の態様において、本願の実施例は、コンピュータコマンドが記憶された非瞬時コンピュータ読み取り可能な記憶媒体であって、
前記コンピュータコマンドは前記コンピュータに請求項1乃至8のいずれか一項に記載の対話型インタラクションの方法を実行させることを特徴とするコンピュータ読み取り可能な記憶媒体を提供する。
上記の実施例は、以下の利点又は有益な効果を有する。ロジックマインドマップのサンプルにおける文ノード情報及び/又は単語ノード情報により、予めトレーニングして学習することにより、文のツリー及び対話のツリーを得て、ユーザからの対話情報を受信すると、文のツリーに基づいて、ユーザからの受信情報に対し、第1のセマンティックコードを決定し、第1のセマンティックコードに基づいて、対話のツリーからユーザからの受信情報に応答する第2のセマンティックコードを決定し、最後に第2のセマンティックコードに基づいて、文のツリーからターゲット応答文を決定して、ユーザと対話する。本願の実施例によれば、ロジックマインドマップにより、対話論理を文のツリー及び対話のツリーにするように迅速に学習することにより、文のツリーと対話のツリーとは交互にマッチングすることで、前文の対話内容を考慮するとともに、対話内容の複数種の表現を含み、対話内容の多様性を確保できる応答内容を提供し、マンマシン間の複数ランドの対話の正確性を向上させる。
第5の態様において、コンピュータプログラムであって、プロセッサに実行されると、第1の態様に記載の対話型インタラクションの方法を実行させるコンピュータプログラムを提供する。
上記した各選択可能な実施態様の奏する効果は、以下本発明の実施の形態について、以下で実施例を参照して詳細に説明する。
図面は、本願を限定するものではなく、本願技術案をより理解するためのものである。
本願の第1の実施例に係る対話型インタラクションの方法のフローチャートである。 本願の第2の実施例に係る文のツリー及び対話のツリーのトレーニングフローチャートである。 本願の第2の実施例に係る文のツリーにおけるノードのトレーニングフローチャートである。 本願の第2の実施例に係るロジックマインドマップのサンプルの一例を示す図である。 本願の第2の実施例に係る対話のツリーにおけるノードのトレーニングフローチャートである。 本願の第3の実施例に係る対話型インタラクションの方法のフローチャートである。 本願の第四実施例に基づく対話型インタラクションの装置の概略構造図である。 本願の実施例の対話型インタラクションの方法を実施するための電子機器のブロック図である。
以下は、図面を参照して本願の例示的な実施例を説明し、ここでは本願の実施例の様々な詳細を含み理解に役立つため、これらは単なる例示的なものと考えなければならない。従って、本発明の要旨を逸脱しない範囲で当業者が実施例の修正や代用を成し得ることは自明である。なお、以下の説明では、明確化及び簡略化のため、公知の機能及び構成については説明を省略する。
<第1の実施の形態>
図1は本願の第1の実施例に係る対話型インタラクションの方法のフローチャートであり、本実施例は、ヒューマンマシン間の複数ランドの対話において応答文を決定する場面に適用することができる。該方法は、対話型インタラクション装置により実行することができ、該装置は、ソフトウェア及び/又はハードウェアの形態で実現されてもよく、好ましくは、例えば、スマートスピーカ等の電子機器に配置される。図1に示すように、該方法は、具体的に以下のステップを含む。
S110、文のツリーに基づいて、ユーザからの受信情報に対し、第1のセマンティックコードを決定する。
本願の具体的な実施例において、ユーザからの受信情報とは、ユーザから電子機器に入力された対話音声であり、ユーザが電子機器をウェイクアップした後、ユーザが主動的に電子機器に向かって発話する初期音声であってもよく、対話中にユーザから入力された任意の対話音声であってもよく、または、電子機器が主動的に発話する際にユーザから入力された対話音声であってもよい。ユーザからの受信情報は、同一の対話シナリオに限定されず、異なる対話シナリオの間で変換し、電子機器がユーザに合わせて、対話を実現するようにしてもよい。
本実施例において、第1のセマンティックコードとは、ユーザからの受信情報の語義を表すコードである。単語又は文は、いずれも、少なくとも1つの語義を有することに鑑み、本実施例は、セマンティックコードで、1つの語義を一意に識別することにより、文脈の語義によって対話論理を表現し、対話を外的な形式的としての単語の表現に限定することを回避する。
本実施例において、電子機器において対話型インタラクションに用いるデータ構造は、少なくとも文のツリーと対話のツリーを含むことができる。そのうち、文のツリーは、単語と文との間の組み合わせ関係を表すために用いられ、対話のツリーは、対話における文の間の応答関係を表すために用いられ、文のツリー及び対話のツリーは、いずれもロジックマインドマップのサンプルにおける文ノード情報及び/又は単語ノード情報を用いてトレーニングして得られる。
具体的には、ロジックマインドマップは、対話に関連する単語及び/又は文を、互いの所属関係、又は、関連するノードの階層関係によって表現するものを指す。ロジックマインドマップには、単語及び文の組み合わせ関係が含まれており、対話のツリーは、対話における文の間の応答関係を表すことができる。本実施例は、なるシーンにおける対話論理を表示するために、事前に異なるシーンに対してロジックマインドマップを構築することができる。大量の基礎サンプルとして、異なるシーンでのロジックマインドマップから、大量の文及び文の単語をマイニングする。ロジックマインドマップのサンプルにおける単語を保留するが、ロジックマインドマップのサンプルにおける文に対してセマンティック圧縮を行い、語義に基づいて文ノードと単語ノードにセマンティックコードを付加し、すなわち、各語義に一意に対応するセマンティックコードを付与する一方、複数の語義を有するノードに対し、複数のセマンティックコードを付与して、1つの語義を一意に識別するようにする。最後にノード間の変換確率を決定し、文のツリーと対話のツリーを生成して、電気機器とユーザとの対話際に使用するために、電子機器に保存する。ここで、文のツリーと対話のツリーのトレーニング過程は、後の実施例で説明する。
本実施例では、ユーザからの受信情報を受信した後、文のツリーにおける単語と文語義との間の組み合わせ関係に基づき、外的な表現としてのユーザからの受信情報を文脈の語義に変換する。したがって、まず、ユーザからの受信情報から、外的な表現形式に限定されないことを実現する。具体的には、文のツリーにおける単語と文との間の組み合わせ関係に基づき、ユーザからの受信情報の外の形式で表現された語義を決定し、ユーザからの受信情報に対して語義理解を実現し、ユーザからの受信情報の語義を表現する第1のセマンティックコードを得ることができる。
例えば、電子機器は、スマートスピーカ、サービスロボット等の対話機能を有するスマート機器であってもよい。電子機器は、センサ等の装置を介してユーザが入力した音声形式のユーザからの受信情報を受信した後、音声形式のユーザからの受信情報をテキスト形式に変換し、テキスト形式のユーザからの受信情報に対して単語分割を行うことができる。ユーザからの受信情報における単語の配列順序に基づき、文のツリーにおける単語ノード間の接続関係に基づき、文のツリーの単語ノードから文ノードにトラバースし、ユーザからの受信情報を構成するターゲット単語ノードの組み合わせを決定する。これにより、ターゲット単語ノードの組み合わせが属する文ノードの中から、ユーザからの受信情報を表す第1のセマンティックコードが決定される。
S120、第1のセマンティックコードに基づき、対話のツリーからユーザからの受信情報に応答するための第2のセマンティックコードを決定する。
本願の具体的な実施例において、第1のセマンティックコードは、ユーザからの受信情報の語義を表すコードであり、対応し、第2のセマンティックコードは、ユーザからの受信情報に応答するためのセマンティックコードを表す。ここで、「第1」及び「第2」の限定は、具体的な意味を有せず、ユーザからの受信情報と、その応答に対応する語義とを区分するためのものである。
本実施形態では、ユーザからの受信情報の語義を決定した後、対話のツリー内の対話文間の応答関係に基づいて、ユーザからの受信情報の語義から応答情報の語義を決定する。したがって、応答の面でも、外在の表現形式に限定されず、語義の正確を基にして応答する。具体的には、対話のツリーから、ユーザからの文において、第1のセマンティックコードに一致するターゲット受信文ノードを特定し、すなわち、現在のユーザからの受信情報の達した対話の段階を特定することができる。対話のツリーにおける文間の応答関係に基づき、ターゲット受信文ノードを受理又は応答するための応答文ノードを決定し、応答文ノードの語義を表す第2のセマンティックコードを得る。
そのうち、第2のセマンティックコードは、対話のツリー全体の対話論理の上で決定されたため、第2のセマンティックコードの決定は、単にユーザからの受信情報に返信するという1ランドの対話のみではなく、対話の前文を考慮したのであるので、対話全体を連係し、応答語義の正確な決定を実現することができる。
例示的に、対話のツリーには、1ランドまた1ランドの完全な対話内容及び論理的な関係が含まれ、そのうち、ある一回の対話において、7層の対話語義で構成され、この7層の対話語義の間に応答関係があると仮定する。第1のセマンティックコードに基づいて対話のツリーから現在のユーザからの受信情報までの対話の段階が第3層対話語義に達したとする。これにより、対話のツリーにおける文ノード間の応答関係に基づいて、対話中の第4層の対話語義のセマンティックコードが第2のセマンティックコードとして決定される。
そのうち、対話のツリーにおいて、ユーザからの受信情報に応答するための候補対話語義が複数あり、すなわち、ターゲット受信文ノードを親ノードとし、ターゲット受信文ノードは、子ノードを複数有することができる。そして、ロジックマインドマップのサンプルに基づいて統計して得られた、親ノードから各子ノードに変換する変換確率が異なる。これにより、変換確率が最も高い候補語義を第2のセマンティックコードとして選択することができる。対話の多様性を確保するために、対話を一種に限定しないように、本実施例は、候補対話語義の変換確率に基づいてランダム抽出を行い、第2のセマンティックコードを得ることができる。
S130、ユーザと対話するために、文のツリーから、第2のセマンティックコードの対応するターゲット応答文を決定する。
本願の具体的な実施例において、ターゲット応答文は、第2のセマンティックコードの語義を表すことができ、且つ、具体的な外的な表現形式を有する文である。ターゲット応答文は、テキスト形式で存在し、電子機器によってターゲット応答文をユーザに再生し、ユーザからの受信情報に応答し、ユーザとの対話を実現するようにしてもよい。
本実施例では、同一語義で外的な表現形式が多様であることに鑑み、第2のセマンティックコードを決定した後、文のツリーにおける単語及び文の語義の間の組み合わせ関係に基づいて、根本的な語義を外的な表現形式上のターゲット応答文に変換することができる。これにより、ターゲット応答文の出力は、同一種の外的な言葉表現形式に限定されないことが実現される。具体的には、文のツリーから第2のセマンティックコードと一致するターゲット応答文ノードを検索し、ターゲット応答文ノードと組み合わせ関係を持つ単語ノードに基づき、ターゲット応答文を構成するためのターゲット応答単語ノードを決定し、最後に、ターゲット応答単語ノードを組み合わせて、ターゲット応答文を得る。
ここで、文のツリーに同義語を複数含むことができ、すなわち、ターゲット応答文ノード又は一つのターゲット応答単語ノードを親ノードとし、親ノードは、子ノードを複数有することができる。且つロジックマインドマップのサンプルに基づいて統計して得られた、親ノードから各子ノードに変換する変換確率が異なる。これにより、変換確率が最も高い候補単語ノードを、文を連係するために必要なターゲット応答単語ノードとして選択することができる。対話の多様性を確保するために、対話を表現形式に限定しないように、本実施例は、候補単語ノードの変換確率に基づいてランダム抽出を行い、各段階のターゲット応答単語ノードを得ることができる。
本実施例の技術的解決手段は、ロジックマインドマップのサンプルにおける文ノード情報及び/又は単語ノード情報により、事前にトレーニングし学習することにより、文のツリーと対話のツリーを得て、ユーザからの受信情報を受信すると、文のツリーに基づいてユーザからの受信情報の第1のセマンティックコードを決定し、第1のセマンティックコードに基づき、対話のツリーから、ユーザからの受信情報に応答する第2のセマンティックコードを決定し、最後に、第2のセマンティックコードに基づき、文のツリーからターゲット応答文を決定して、ユーザと対話する。本願の実施例によれば、本願の実施例によれば、ロジックマインドマップにより、対話論理を文のツリー及び対話のツリーにするように迅速に学習することにより、文のツリーと対話のツリーとは交互にマッチングすることで、前文の対話内容を考慮するとともに、対話内容の複数種の表現を含み、対話内容の多様性を確保できる応答内容を提供し、マンマシン間の複数ランドの対話の正確性を向上させる。
<第2の実施例>
図2は、本願の第2の実施例に係る文のツリー及び対話のツリーのトレーニングフローチャートであり、本実施例は、上記第1の実施例の上、さらに、文のツリー及び対話のツリーのトレーニング方式を説明する。文のツリー及び対話のツリーは、ロジックマインドマップのサンプルにおける文ノード情報及び/又は単語ノード情報により、トレーニングして得ることができる。図2に示すように、該方法は、具体的に以下のステップを含む。
S210、ロジックマインドマップのサンプルに基づいて学習して文のツリー及び対話のツリーを構成するノードを得る。
本願の具体的な実施例において、ロジックマインドマップは、対話に関連する単語及び/又は文を、互いの所属関係及びノード間の階層関係によって表現することを指す。異なるシーンでの対話論理を表示するために、事前に異なるシーンに対してロジックマインドマップを構築し、異なるシーンでのロジックマインドマップを大量のサンプルとするようにしてもよい。
本実施例において、ロジックマインドマップのサンプルに存在する外的な単語表現形式及び語義に限定されず、ロジックマインドマップのサンプルにおけるノードに対して深度優先検索(Depth−First−Search、DFS)を行うことにより、完全な対話パスを得る。完全な対話パス中の局所も対話を構成することができることを鑑み、完全な対話パスを分割して、大量の単語表現及びその表現された語義をマイニングする。
本実施例では、ロジックマインドマップのサンプルにおける単語を保留する一方、ロジックマインドマップのサンプルにおける文に対してセマンティック圧縮を行い、語義に基づいて文ノード及び単語ノードにセマンティックコードを付加し、すなわち各語義に一意に対応するセマンティックコードを付与し、複数の語義に対応するノードに複数のセマンティックコードを付与することにより、各セマンティックコードは一種の語義を一意に識別するに用いられるように、文のツリー及び対話のツリーにおけるノードを形成する。
具体的には、図3は、文のツリーにおけるノードのトレーニングフローチャートである。図3に示すように、ロジックマインドマップのサンプルに基づき、学習して文のツリーにおけるノードを得ることは、以下のステップを含む。
S2111、ロジックマインドマップのサンプルに対して単語ノードの深さ優先探索を実行して、完全な対話パスを得る。
本実施例では、ロジックマインドマップのサンプルの親ノードからして、それぞれの可能な分岐パスに対し、それ以上深くならないように探索して、完全な対話パスを得る。ここで、トラバースされたパスにおける文ノードに対し、学習することにより、文ノード間の対話論理を得ることができる。トラバースされたパスにおける単語ノードに対し、文の完全な表現を得ることができる。
S2112、完全な対話パスにおける単語ノードに基づいて、対話辞書を作成する。
本実施例では、完全な文パス中の局所も対話を構成可能であり、完全な単語パス中の局所も文に連係可能であるため、完全な対話パスを分割して、大量の単語表現及びその表現された語義をマイニングする。ここで、文のツリートレーニングの過程において、ロジックマインドマップのサンプルを保留するとともに、それにおける全ての単語ノード、及び単語ノードとの間の接続関係をマイニングして、対話辞書を作成する。
S2113、対話辞書の単語で構成された文に対してセマンティック圧縮を行い、文のツリーにおける文ノードを生成し、対話辞書に基づいて文ノードにおける単語ノードの組み合わせを得る。
本実施例では、対話辞書における単語ノード及びその接続関係に基づき、対話辞書における単語を組み合わせ、それにより、単語で構成される文の語義を得る。電子機器におけるデータの記憶量の最小化、及び文のツリーの完全性と一意性のために、構成された文の語義をセマンティック圧縮を行う。すなわち、同じ語義の文を統合し、文のツリーにおける文ノードを生成する。ただし、各文における全ての単語を保留し、すなわち、文ノードにおける単語ノードの組み合わせを得る。理解できるように、文のツリーは、文の複数の単語表現形式を保留する。
例えば、表現しようとする文の語義が「張君が王君を批判」との場合、「張君が王君を批判した」、「張君が王君の批判を受けた」、「王君が王君に批判された」の3つの表現を含んでもよい。これらの3種類の表現形式を語義に基づいて同一の文ノードに圧縮することができ、該文ノードは、3種類の単語ノードの組み合わせを含む。
S2114、文ノードにおける単語ノードの組み合わせの語義に基づき、文ノードに、センテンスの語義を識別するセマンティックコードを付加する。
本実施例では、セマンティックコードを利用して一種類の語義を一意に識別するようにし、文脈な語義によって対話論理を表現し、対話を外的な形式における単語の表現に限定することを回避する。ここで、文ノードにおいて、同一のパス上の異なる単語ノードに基づいて組み合わせられた文は、他の語義を表現する可能性があり、それに伴い、文ノードに他の文語義を付与するようにする。したがって、文ノードにおける単語ノードの組み合わせの語義に応じて、語義ごとにセマンティックコードが付加される。それに応じて、文のツリーにおける同一の文ノードは複数のセマンティックコードを有することができる。
そのうち、文のツリーにおける単語ノードは、セマンティックコードを有してもよく、それに応じて、文ノードのセマンティックコードは、単語ノードの組み合わせに含まれる単語ノードのセマンティックコードに基づいて生成されたセマンティックコードである。すなわち、文ノードと単語ノードとの組み合わせは、セマンティックコードにおいて一定の関連関係を呈する。例えば、文ノードのセマンティックコードは、単語ノードの組み合わせにおける各単語ノードのセマンティックコードの接続であってもよく、また各単語ノードのセマンティックコードが一定のアルゴリズムによって生成されたコードであってもよい。
例示的に、図4は、ロジックマインドマップの一例を示す図である。図4に示すように、サンプルにC1からC9までの9層のノードを含み、C1層からC6層は文ノードであってもよく、C7層からC9層は単語ノードであってもよい。サンプルに対して深さ優先探索を行い、完全なパスの[C1,C2,……,C9]を得て、対話を構成することができる。完全なパスを分割して、最も左側の分岐を例とすると、[C1,C2,C3]も対話を構成することができ、文の大量の言葉表現及びその表現する語義をマイニングする。C7層〜C9層が対話の文を構成する。そのうち、サンプルに対して文のセマンティック圧縮を行い、C7層における複数のノードを同一語義の文ノードC6に統合し、文のツリーにおける文ノードを生成することができる。文ノードC6に対して、[C7,C8,C9]における複数の単語ノードの組み合わせを得ることができる。文ノードにおける局所的な単語ノードの組み合わせの語義に基づき、「時間まで戻る」と「時間まで到達」はC7からC9までの完全なパスと異なる語義を形成することができると仮定すると、文ノードC6に、少なくとも2つのセマンティックコードを付加することができる。
なお、ロジックマインドマップの複雑性を踏まえると、図4は、ロジックマインドマップの簡単な模式図であるので、完全に正確なものではない可能性があり、且つ、ロジックマインドマップは、例示の具体的な表現形式を限定するものではない。
具体的には、図5は、対話のツリーにおけるノードのトレーニングフローチャートである。図5に示すように、ロジックマインドマップのサンプルに基づき、学習して対話のツリーにおけるノードを得るステップは、以下のステップを含む。
S2121、ロジックマインドマップのサンプルにおける文ノードに対してセマンティック圧縮を行い、対話のツリーにおける文ノードを生成する。
本実施例では、対話のツリーの生成過程において、基本的にロジックマインドマップのサンプルにおける文ノードを保留し、ロジックマインドマップにおける文ノードに対してセマンティック圧縮を行い、すなわち同じ語義の文を統合し、対話のツリーにおける文ノードを生成する。例えば、ロジックマインドマップのサンプルにおける3つの文ノードに、それぞれ、「張君が王君を批判した」、「張君が王君の批判を受けた」、「王君が王君に批判された」という文が保存される。該3つの文ノードの文語義は同一であるため、該3つの文ノードの語義は、対話のツリーにおける同一の文ノードとして生成することができる。
S2122、ロジックマインドマップにおける文ノード間の接続関係が示す対話論理に基づき、対話のツリーにおける文ノード間の応答関係を決定する。
本実施例では、ロジックマインドマップにおける文ノード間の接続関係に従い、対話のツリーにおける文ノード間に応答関係を確立する。したがって、対話のツリーは、大量のロジックマインドマップのサンプルに基づいてトレーニングして得られたものであるため、対話のツリーにおいて、同一文ノードと応答関係を持つ候補文ノードは複数含まれることが可能である。
S2123、文ノード及び文ノードとの間の応答関係に基づき、対話のツリーを得て、文ノードの語義に基づき文ノードに語義を識別するセマンティックコードを付加する。
本実施例において、文ノード及びその間の応答関係は、共同で対話のツリーを構成する。対話のツリーにおける文ノードは一般的には1つのみの語義を有し、それに伴い、対話のツリーにおける各文ノードは、いずれも一意に対応するセマンティックコードを有する。そのうち、対話のツリーにおける文ノードのセマンティックコードは、文のツリーにおける文ノードのセマンティックコードに対応し、すなわち、対応関係を持ち、対話のツリーにおける文ノードと文のツリーにおける文ノードは、同じセマンティックコードを有する。文のツリーから対話のツリーに、ユーザからの受信情報の対話段階を特定し、対話のツリーから文のツリーまで、応答文を検索する。
S220、文のツリーと対話のツリーにおいて、ノード間の変換確率を決定する。
本願の具体的な実施例において、変換確率とは、接続関係を有するノード間において、前のノードから後のノードに接続する確率を変換することである。本実施例において、各ノードは、いずれも変換確率リストを配置することができ、異なるノードが本ノードに接続する変換確率を示すために用いられる。
文のツリーにおいて、ロジックマインドマップのサンプルに基づき、文ノード語義を表現する最初の単語の使用確率を統計し、且つ一つの単語ノードが他の単語ノードに接続する使用確率を統計することができる。例えば、文ノード語義の「私は時間まで帰宅」にういて、「私」の後に、「時間まで」と「時間の通り」を接続することができ、そのうち、「時間まで」の使用確率は、60%であり、「時間の通り」の使用確率は、40%である。この場合、語義私は時間まで帰宅」の上で、単語ノード「私」から単語ノード「時間まで」への変換確率は60%であり、単語ノード「私」から単語ノード「時間の通り」への変換確率は40%である。
対話のツリーにおいて、ロジックマインドマップブックに基づき、同一語義に応答する異なる文ノードの使用確率を統計することができる。例えば、文ノードの語義「会いたかった」に対して、文ノードの語義「私も」で応答する確率は70%であり、文ノードの語義「memeda」で応答する確率は30%である。
そのうち、対話における疑問型の受信情報に対し、電子機器は、ネットワークを介した検索によって回答を決定することができ、回答を直接応答として対話を実現することができ、また文のツリーにおける単語ノードのトラバースによって回答の語義を決定し、且つ文のツリーにおいて回答の単語ノードの組み合わせを再決定することができる。
本実施例の技術案によれば、ロジックマインドマップのサンプルにおける文ノード情報及び/又は単語ノード情報により、事前にトレーニングし学習して文のツリー及び対話のツリーにおけるノードを得て、ロジックマインドマップのサンプルにおけるノード間の変換確率に基づき、文のツリー及び対話のツリーを生成する。本願の実施例によれば、対話論理を文のツリー及び対話のツリーにするように迅速に学習することにより、対話内容の複数種の表現を含み、対話内容の多様性を確保できる応答内容を提供し、マンマシン間の複数ランドの対話の正確性を向上させる。
<第3の実施例>
図6は、本願の第3の実施例に係る対話型インタラクションの方法のフローチャートであり、本実施例は、上記第1の実施例の上、さらにターゲット応答文の決定方法を説明し、文のツリーにおける単語ノードをトラバースすることによってユーザからの受信情報の語義を識別することができ、かつ対話のツリーにおける文ノードとの間の応答関係によって応答語義を決定し、最後に文のツリーにおいて、応答語義の単語ノードを抽出することによってターゲット応答文を決定する。図6に示すように、該方法は、具体的に以下のステップを含む。
S610、ユーザからの受信情報の単語情報に基づき、文のツリーの単語ノードから文ノードにトラバースし、ユーザからの受信情報を構成するターゲット単語ノードの組み合わせを決定する。
本願の具体的な実施例において、ユーザからの受信情報は、ユーザが電子機器に入力した対話音声である。それに伴い、ユーザからの受信情報の単語情報は、音声形式のユーザからの受信情報をテキスト形式に変換し、テキスト形式のユーザからの受信情報を分割して得られた単語、及び各単語間の順序等の情報であってもよい。
本実施例において、ターゲット単語ノードの組み合わせとは、文のツリーにおいて、ユーザからの受信情報の単語情報の外的形式に一致し、且つノード間に接続関係を有してパスを構成できる単語ノードを指す。ユーザからの受信情報の文脈的な語義は、形式的なマッチングによって得ることができる。
具体的には、単語情報における各単語の逆順で、単語情報における各単語を採用し、直前の単語のマッチングが成功した単語ノードを基にして、文のツリーにおける単語ノードとの間の接続関係によって、子ノードからルートノードへの順に従ってエルゴディックを行うことができる。ここで、マッチングに成功しパスを構成する全ての単語ノードの組み合わせは、ユーザからの受信情報のターゲット単語ノードの組み合わせを構成する。
例え、図4のノードC6からノードC9までを文のツリーとし、且つユーザからの受信情報が「時間まで帰宅」とすると、得られたユーザからの受信情報単語情報は「時間まで」−>「帰」−>「宅」である。さらに、子ノードからルートノードへの順序に従ってトラバースし、まず、単語情報「宅」と単語ノードC9とマッチングし、単語ノード「宅」とのマッチングがに成功した場合、次に、単語情報「帰」と単語ノードC8における「帰」とマッチングし、マッチングが成功した場合、最後に、単語情報「時間まで」と単語ノードC7における「時間まで」とマッチングする。マッチングが成功した場合で且つパスを構成する場合、単語ノードC7における「時間まで」、単語ノードC8における「帰」及び単語ノードC9における「宅」をターゲット単語ノードの組み合わせとする。
S620、ターゲット単語ノードの組み合わせに基づき、ターゲット単語ノードの組み合わせの属する文ノードから、ユーザからの受信情報を示すための第1のセマンティックコードを決定する。
本願の具体的な実施例において、ターゲット単語ノードの組み合わせにおける各単語ノードはパスを構成するため、ターゲット単語ノードの組み合わせは同一の文ノードに属し、よって、該文ノードのセマンティックコードをユーザからの受信情報の第1のセマンティックコードとする。ここで、文ノードは、複数のセマンティックコードを含むと、ターゲット単語ノードの組み合わせに含まれる単語ノードに基づき、文ノードのセマンティックコードの生成根拠に基づき、複数のセマンティックコードから、ターゲット単語ノードの組み合わせが表現する語義のセマンティックコードを決定し、ユーザからの受信情報の第1のセマンティックコードとする。例えば、上記の例では、ユーザからの受信情報の第1のセマンティックコードとして、文ノードC6のセマンティックコードが用いられている。
S630、対話のツリーから第1のセマンティックコードと一致するターゲット受信文ノードを特定する。
本願の具体的な実施例において、ターゲットユーザの文ノードとは、対話のツリーにおいて、ユーザからの受信情報の語義と一致する文ノードを指す。文のツリーが対話における文間の応答関係を表していることに鑑み、ターゲット受信文ノードは、ユーザからの受信情報の現在の対話の段階を特定する。
具体的には、第1のセマンティックコードと対話のツリーにおける各文ノードのセマンティックコードをマッチングし、第1のセマンティックコードとマッチングする文ノードを得てターゲット受信文ノードとする。ここで、ユーザからの受信情報は、対話中における対話情報であれば、対話のツリーにおける文ノード間の接続関係に基づき、対話の前文とマッチングする文ノードに接続された子ノードにおいて、続けてターゲットユーザ文ノードのマッチングを行い、マッチングの範囲を縮小する。マッチングが失敗すれば、ユーザが他の話題の対話を開始したこととなり、そのため、この場合、全ての対話のツリーからマッチングを行うことができる。
S640、ターゲット受信文ノードと応答関係を持つ候補文ノードの変換確率に基づき、候補文ノードから応答文ノードを抽出する。
本願の具体的な実施例において、応答文ノードは、対話のツリーにおける応答ターゲットのユーザ文ノードに用いられる文ノードを指す。対話のツリーに、ターゲット受信文ノードに応答するために用いられる候補文ノードは複数ある可能性があり、すなわち、ターゲット受信文ノードを親ノードとすると、ターゲット受信文ノードは、複数の子ノードを含むことができる。応答文ノードは、ターゲット受信文ノードと応答関係を持つ候補文ノードの1つである。
ここで、ロジックマインドマップのサンプルに基づいて統計して得られた、親ノードから各子ノードに変換する変換確率が異なる。よって、変換確率が最も高い候補文ノードを応答文ノードとして選択することができる。対話の多様性を確保するために、対話を一つの様式に限定しないように、本実施例は、各候補文ノードの変換確率に基づき、候補文ノードからランダムに抽出することにより応答文ノードを得ることができる。
例示的に、ターゲット受信文ノードは、2つの候補文ノードを含むと仮定し、即ち、ユーザはターゲット受信文ノードの対話語義を表現した後、スマート機器の応答方式は2種類ある。ここで、第1の候補文ノードの変換確率が60%であり、第2の候補文ノードの変換確率が40%であると仮定すると、ランダム抽出過程において、60%の確率で第1の候補文ノードを抽出することができ、40%の確率で第2の候補文ノードを抽出することができる。
S650、応答文ノードの第2のセマンティックコードを決定する。
本出願の具体的な実施例では、対話のツリーにおける文ノードは、通常1つのセマンティックコードのみを有するため、応答文ノードのセマンティックコードを第2のセマンティックコードとする。
S660、文のツリーから、第2のセマンティックコードと一致するターゲット応答文ノードを検索する。
本願の具体的な実施例において、ユーザからの受信情報への応答を決定した後、応答の具体的な表示形式を決定することができる。具体的には、ターゲット応答文ノードは、文サブツリーにおける応答語義を表現できる文ノードを指し、第2のセマンティックコードと文のツリーにおける各文ノードのセマンティックコードとマッチングを行い、セマンティックコードとマッチングする文ノードをターゲット応答文ノードとする。
S670、ターゲット応答文ノードと組み合わせ関係を持つ候補単語ノードの変換確率に基づき、候補単語ノードからターゲット応答単語ノードを抽出する。
本出願の具体的な実施例において、ターゲット応答単語ノードは、文のツリーにおけるターゲット応答文ノードの語義を表すために用いられる単語ノードを指す。文のツリーにおけるターゲット応答文ノードを表すための候補単語ノードは、複数であってもよく、すなわち、ターゲット応答文ノードを親ノードとすると、ターゲット応答文ノードは、子ノードを複数有し、各子ノードは、さらに子ノードを複数有するようにしてもよい。ターゲット応答単語ノードは、ターゲット応答文ノードと組み合わせた関係を持つ候補単語ノードの少なくとも1つである。
そのうち、ロジックマインドマップのサンプルに基づいて統計して得られた、親ノードから各子ノードに変換する変換確率が異なる。したがって、変換確率が最も高い候補単語ノードを、ターゲット応答単語ノードとして選択することができる。対話の多様性を確保するために、対話を一つの様式に限定しないように、本実施例は、各候補単語ノードの変換確率に基づき、候補単語ノードから、ターゲット応答単語ノードをランダムに抽出することができる。第2のセマンティックコードを表現する単語ノードの範囲内で、単語ノード間の接続関係に基づき、層ごとにターゲット応答単語ノードを抽出する。
例示的に、ターゲット応答文ノードを親ノードとすると、合計5層の単語ノードがある。ターゲット応答文ノードは、2つのセマンティックコードを有し、そのうちの1つは第2のセマンティックコードと一致し、該セマンティックコードを表現できる単語ノード範囲は、親ノードが接続される3層の単語ノードであると仮定する。したがって、ターゲット応答文ノードを親ノードとすると、まず、親ノードに接続された第1層の単語ノードを抽出し、次に抽出された第1層の単語ノードを親ノードとし、第2回の単語ノードを抽出し、最後に抽出された第2回の単語ノードを親ノードとし、第3回の単語ノードを抽出し、この三つの単語ノードをターゲット応答単語ノードとする。
S680、ターゲット応答単語ノードを組み合わせて、ターゲット応答文を得る。
本願の具体的な実施例において、ターゲット応答文は、第2のセマンティックコードの語義を表現することができ、且つ具体的な外的な表現形式を有する文である。ターゲット応答文は、テキスト形式で存在し、電子機器によってターゲット応答文をユーザに再生して、ユーザからの受信情報に応答し、ユーザとの対話を実現する。
本実施例では、各ターゲット単語ノード間の接続関係に基づき、ターゲット単語ノードを組み合わせ、ターゲット応答文を形式することができる。例示的に、上記例では、文のツリーにおける親ノードから子ノードに向かう順に、第1層の単語ノード、第2回の単語ノード及び第3回の単語ノードを順に接続し、組み合わせてターゲット応答文を形成することができる。
本実施例の技術的解決手段は、文のツリーにおける単語ノードをエルゴディックすることによってユーザからの受信情報の語義を識別し、対話のツリーにおける文ノードの間の応答関係によって応答語義を決定し、最後に文のツリーにおける応答語義下の単語ノードの抽出によってターゲット応答文を決定し、ユーザと対話する。本願の実施例によれば、ロジックマインドマップに基づいて対話論理を文のツリー及び対話のツリーにするように迅速に学習することにより、文のツリーと対話のツリーとは交互にマッチングすることで、前文の対話内容を考慮するとともに、対話内容の複数種の表現を含み、対話内容の多様性を確保できる応答内容を提供し、マンマシン間の複数ランドの対話の正確性を向上させる。
<第4の実施例>
図7は、本願の第4の実施例に係る対話型インタラクション装置の概略構造図であり、本実施例は、ヒューマンマシン間の複数ランドの対話において応答文を決定する場合に適用することができ、該装置は、本願の任意の実施例に記載の対話型インタラクションの方法を実現することができる。該装置700は具体的に、
ユーザからの受信情報に対し、文のツリーに基づいて、第1のセマンティックコードを決定するように構成されたユーザ語義識別モジュール710と、
前記第1のセマンティックコードに基づいて、対話のツリーから、前記受信情報に応答するための第2のセマンティックコードを決定するように構成された応答語義決定モジュール720であって、前記文のツリーと前記対話のツリーは、ロジックマインドマップのサンプルにおける文ノード情報及び/又は単語ノード情報を利用してトレーニングして得られた、モジュールと、
ユーザと対話するために、前記文のツリーから、前記第2のセマンティックコードの対応するターゲット応答文を決定する応答文決定モジュール730と、を備える。
選択的に、前記文のツリーは、単語と文との間の組み合わせ関係を表すために用いられ、前記対話のツリーは対話における文との間の応答関係を表すために用いられる。
さらに、前記装置700は、さらにトレーニングモジュール740を含み、トレーニングモジュール740、具体的に、前記ロジックマインドマップのサンプルに基づいて学習することにより、文のツリー及び対話のツリーにおけるノードを得て、前記文のツリーと前記対話のツリーにおいて、ノード間の変換確率を決定するために用いられる。
選択的に、前記トレーニングモジュール740は、具体的に、前記ロジックマインドマップのサンプルに対し、単語ノードの深さ優先探索を実行して、完全な対話パスを得、前記完全な対話パスにおける単語ノードに基づいて、対話辞書を作成し、前記対話辞書の単語から構成された文に対してセマンティック圧縮を実行して、文のツリーを構成する文ノードを生成し、前記対話辞書に基づいて前記文ノードにおける単語ノードの組み合わせを得、前記文ノードにおける単語ノードの組み合わせの語義に応じて、前記文ノードに、語義を識別するセマンティックコードを付加するために用いられる。
選択的に、前記トレーニングモジュール740は具体的に、前記ロジックマインドマップのサンプルにおける文ノードに対してセマンティック圧縮を実行して、対話のツリーを構成する文ノードを生成し、ロジックマインドマップにおける文ノード間の接続関係の示す対話論理に基づいて、対話のツリーにおける文ノード間の応答関係を決定し、前記文ノードと、文ノード間の応答関係とに基づいて、対話のツリーを得て、前記文ノードの語義に応じて、前記文ノードに、語義を識別するセマンティックコードを付加するために用いられる。
選択的に、前記ユーザ語義識別モジュール710は、具体的に、前記受信情報における単語情報に基づいて、前記文のツリーの単語ノードから文ノードにトラバースして、前記受信情報を構成するターゲット単語ノードの組み合わせを決定し、前記ターゲット単語ノードの組み合わせに基づいて、前記ターゲット単語ノードの組み合わせの属する文ノードから、前記受信情報を示す第1のセマンティックコードを決定するために用いられる。
選択的に、前記応答語義決定モジュール720は、具体的に、前記対話のツリーにおいて、前記第1のセマンティックコードと一致するターゲット受信文ノードを特定し、前記ターゲット受信文ノードと応答関係を持つ候補文ノードの変換確率によって、前記候補文ノードから応答文ノードを抽出し、前記応答文ノードの第2のセマンティックコードを決定するために用いられる。
選択的に、前記応答文決定モジュール730は、具体的に、前記文のツリーから、前記第2のセマンティックコードに一致するターゲット応答文ノードを照合し、前記ターゲット応答文ノードと組み合わせ関係を持つ候補単語ノードの変換確率によって、前記候補単語ノードからターゲット応答文ノードを抽出し、前記ターゲット応答単語ノードを組み合わせて、前記ターゲット応答文を得るために用いられる。
本実施例の技術的解決手段は、各機能モジュール間の協同動作により、ロジックマインドマップの構築、文のツリーと対話のツリーのトレーニング、ユーザ語義の認識、応答語義の決定及び応答文の決定等の機能を実現する。本願の実施例によれば、ロジックマインドマップにより、対話論理を文のツリー及び対話のツリーにするように迅速に学習することにより、文のツリーと対話のツリーとは交互にマッチングすることで、前文の対話内容を考慮するとともに、対話内容の複数種の表現を含み、対話内容の多様性を確保できる応答内容を提供し、マンマシン間の複数ランドの対話の正確性を向上させる。
<第5の実施例>
本願の実施例によれば、本願は、さらに電子機器及び読み取り可能な記憶媒体を提供する。
図8に示すように、本出願の実施例に係る対話型インタラクションの方法の電子機器のブロック図である。電子機器は、ノート型コンピュータ、デスクトップ型コンピュータ、テーブル型コンピュータ、携帯情報端末、サーバ、ブレード型サーバ、大型コンピュータ等の様々な形態のデジタルコンピュータをターゲットとする。また、電子機器は、個人デジタル処理、携帯電話、スマートフォン、ウェアラブル機器等の各種のモバイル機器を表現することができる。なお、ここで示した構成要素、その接続関係、およびその機能はあくまで一例であり、ここで説明した本願の実現や要求される機能を限定することを意図したものではない。
図8に示すように、該電子機器は、1つ又は複数のプロセッサ801、メモリ802、及び各部品を接続するための、高速インタフェース及び低速インタフェース等のインタフェースを含む。各構成要素は、互いに異なるバスで接続されており、共通のマザーボード上に実装されていてもよいし、必要に応じて実装されていてもよい。前記プロセッサは、前記インターフェースに接続された表示装置等の外部入出力装置や、GUI(Graphical User Interface)のグラフィック情報を表示するための命令等、電子機器内で実行される命令を処理してもよい。他の実施形態では、必要に応じて、複数のプロセッサおよび/または複数のバスを、複数のメモリおよび複数のメモリとともに使用することができる。また、複数の電子機器が接続されていてもよく、各機器は、例えば、サーバアレイ、ブレードサーバ群、マルチプロセッサシステムなど、必要な動作を提供する。図8では、1つのプロセッサ801を例としている。
メモリ802は、本出願が提供する非瞬時コンピュータ読み取り可能な記憶媒体である。そのうち、前記メモリは少なくとも1つのプロセッサが実行可能な命令を記憶し、前記少なくとも1つのプロセッサに本出願が提供する対話型インタラクションの方法を実行させる。本願の非瞬時コンピュータ読み取り可能な記憶媒体はコンピュータコマンドを記憶し、該コンピュータコマンドはコンピュータに本願が提供する対話型インタラクションの方法を実行させるために用いられる。
メモリ802は、非瞬時コンピュータ読み取り可能な記憶媒体として、非瞬時ソフトウェアプログラム、非瞬時コンピュータ実行可能なプログラム及びモジュールを記憶することに用いることができ、例えば本願の実施例における対話型インタラクションの方法に対応するプログラム指令/モジュールであり、例えば、図7に示すユーザ語義認識モジュール710、応答語義決定モジュール720、応答文決定モジュール730及びトレーニングモジュール740である。プロセッサ801はメモリ802に記憶された非瞬時ソフトウェアプログラム、指令及びモジュールを実行することにより、サーバの各種機能アプリケーション及びデータ処理を実行し、すなわち上記方法の実施例に係る対話型インタラクションの方法を実現する。
メモリ802は、オペレーティングシステム、少なくとも1つの機能に必要なアプリケーションプログラムを格納する格納プログラム領域と、対話型の電子機器を用いて作成されたデータ等を格納する格納データ領域とを含んでもよい。また、メモリ802は高速ランダムアクセスメモリを含むことができ、また非瞬性メモリ、例えば少なくとも一つの磁気ディスク記憶装置、フラッシュメモリ装置又は他の非瞬性固体記憶装置を含むことができる。いくつかの実施例において、メモリ802はプロセッサ801と遠隔に設定されたメモリを選択することができ、これらの遠隔メモリはネットワークを介して対話型方法の電子機器に接続することができる。上記ネットワークとしては、例えば、インターネット、イントラネット、ローカルエリアネットワーク、移動体通信網、これらの組み合わせなどが挙げられるが、上記に限られない。
対話型の電子機器は、さらに、入力装置803と、出力装置804とを備えることができる。プロセッサ801、メモリ802、入力装置803及び出力装置804は、バス又はその他の方式で接続されていてもよく、図8ではバスで接続されている例を示している。
入力装置803は、入力された数字や文字情報や、タッチパネル、キーパッド、マウス、トラックパッド、タッチパネル、ポインティング機器、マウスボタン、トラックボール、ジョイスティック等の対話型電子機器のユーザ設定や機能制御に関するキー信号の入力を受け付けることができる。出力装置804は表示装置、補助照明装置及び触覚フィードバック装置等を含み、そのうち、補助照明装置は例えば発光ダイオード(Light Emitting Diode、LED)である。触覚フィードバック装置は例えば、振動モータである。該表示装置は以下を含むことができるがこれらに限定されず、液晶ディスプレイ(Liquid Crystal Display、LCD)、LEDディスプレイ及びプラズマディスプレイである。いくつかの実施形態において、表示装置はタッチパネルであってもよい。
ここで説明するシステム及び技術の様々な実施形態はデジタル電子回路システム、集積回路システム、専用集積回路(Application Specific Integrated Circuit、ASIC)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/又はそれらの組み合わせにおいて実現することができる。これらの様々な実施形態は以下を含むことができる。1つ又は複数のコンピュータプログラムに実装され、該1つ又は複数のコンピュータプログラムは、少なくとも1つのプログラマブルプロセッサを含むプログラマブルシステムにおいて実行及び/又は解釈することができ、該プログラマブルプロセッサは専用又は汎用プログラマブルプロセッサであってもよく、記憶システム、少なくとも1つの入力装置及び少なくとも1つの出力装置からデータ及びコマンドを受信することができ、且つデータ及びコマンドを該記憶システム、該少なくとも1つの入力装置及び該少なくとも1つの出力装置に伝送する。
これらのコンピュータプログラムは、プログラム、ソフトウェア、ソフトウェアアプリケーション又はコードとも呼ばれ、プログラマブルプロセッサの機械命令を含み、且つ高度プロセス及び/又はターゲット指向のプログラミング単語、及び/又はアセンブリ/機械単語を利用して実現することができる。ここで、「機械可読媒体」及び「コンピュータ可読媒体」とは、機械可読信号である機械指令を受ける機械可読媒体を含み、機械指令及び/又はデータをプログラマブルプロセッサに供給するための任意のコンピュータプログラム製品、装置、及び/又は装置を語義する。「機械可読信号」とは、機械指令やデータをプログラマブル・プロセッサに供給するための任意の信号を語義する。
ここで説明したシステム及び技術は、例えば、CRT(Cathode Ray Tube)、LCDモニタ等の情報をユーザに表示する表示装置と、マウス、トラックボール等のキーボード及びポインティング機器とを備え、ユーザがこれらのキーボード及びポインティング機器を介して入力をコンピュータに供給することにより、ユーザとの間でインタラクションを提供するコンピュータ上で実現することができる。他の種類の装置はさらにユーザとのインタラクションを提供することに用いることができる。例えば、ユーザに提供されるフィードバックはいかなる形態のセンシングフィードバックであってもよく、例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバックである。且ついかなる形態であってもよく、音声入力、音声入力又は、触覚入力を含み、ユーザからの入力を受信する。
ここで説明したシステム及び技術は、データサーバのようなバックグラウンド部品を含む計算システムに実施されてもよく、又はミドルウェア部品を含む計算システムに実施されてもよく、例えば、アプリケーションサーバのような、又はフロントエンド部品を含む計算システムに実施されてもよく、例えば、グラフィカルユーザインタフェース又はウェブブラウザを有するユーザコンピュータであってもよく、ユーザは該グラフィカルユーザインタフェース又はウェブブラウザを介してここで説明したシステム及び技術の実施形態とインタラクションしてもよく、又はこのようなバックグラウンド部品、ミドルウェア部品又はフロントエンド部品のいずれかの組み合わせを含む計算システムに実施されてもよい。また、システムの各構成要素間は、通信網等の任意の形態または媒体を介してデジタルデータ通信により接続されていてもよい。通信ネットワークとしては、例えば、LAN(Local Area Network)、 WAN(Wide Area Network)、インターネットなどが挙げられる。
コンピュータシステムは、クライアントとサーバとを含んでもよい。クライアントとサーバは、通常、互いに離れており、通信ネットワークを介してやり取りされる。クライアントとサーバとの関係は、それぞれのコンピュータ上で動作し、互いにクライアント−サーバの関係を有するコンピュータプログラムによって生成される。
本願の実施例の技術的解決手段によれば、ロジックマインドマップにより、対話論理を文のツリー及び対話のツリーにするように迅速に学習することにより、文のツリーと対話のツリーとは交互にマッチングすることで、前文の対話内容を考慮するとともに、対話内容の複数種の表現を含み、対話内容の多様性を確保できる応答内容を提供し、マンマシン間の複数ランドの対話の正確性を向上させる。
また、組み合わせ関係を持つ文のツリー、及び応答関係を持つ対話のツリーにより、応答内容は、上記対話内容を考慮し、且つ対話内容の複数の表現をパッケージし、対話内容の多様性を確保することができる。
また、ロジックマインドマップのサンプルによって決定されたノード情報とノードとの間の変換確率は、共に文のツリーと対話のツリーを構成し、ツリーにおけるノードの間に対話論理があり、対話内容の複数種の表現を含み、対話内容の多様性を確保できる。
また、ロジックマインドマップのサンプルに基づいて構築された対話辞書における単語は、文のツリーにおける単語ノードを構成し、単語ノードの組み合わせにより表現された語義は、文ノードを構成し、単語ノードの異なる組み合わせ方式に基づき、文ノードは異なる文語義を含む可能性があり、それにより各文語義に対応するセマンティックコードが付与され、異なる表現のユーザからの受信情報の識別に有利であり、同一の語義の複数の表現に対し、対話の多様性を確保することができる。
また、ロジックマインドマップのサンプルに基づいて圧縮された後の文の語義は、対話のツリーにおける文ノードを構成し、且つ各文ノードにセマンティックコードを付加し、ロジックマインドマップにおける対話論理に基づいて、対話のツリーにおける文ノード間の応答関係を決定し、語義の対応関係は、対話における発話間の対話論理を決定することに有利であり、且つ文における単語の表現に限定されない。
また、ユーザからの受信情報における単語情報を文のツリーにおける文ノードとマッチングすることにより、単語情報に適合するターゲット単語ノードの組み合わせを決定し、それにより、ターゲット単語ノードの組み合わせの属する文ノードの第1のセマンティックコードを決定し、ユーザからの受信情報に対する語義識別を実現する。
また、第1のセマンティックコードに基づいて、対話のツリーにおいて文ノードを特定し、それにより文ノードとの間の応答関係に基づき、ユーザからの受信情報に応答する第2のセマンティックコードを決定し、対話ロジックに基づいて応答語義を決定することを実現し、単語表示が対話への限界性及び対話以上の無視を回避し、対話の多様性及び正確性を確保することができる。
また、応答語義である第2のセマンティックコードにより文のツリーからターゲット応答文ノードを決定し、第2のセマンティックコードに従って第2の語義を表現する単語の組み合わせを決定し、最後にターゲット応答文を形成して対話する。語義を精確に表現するとともに、対話内容の多様性を確保することができる。
なお、上述した様々な形態のフローを用いて、並び替え、付加、削除を行うようにしてもよい。例えば、本願において開示される各ステップは、並列的あるいは個別に実行されるものであっても良いし、また、本願において開示される技術的思想の範囲内において、並列的あるいは個別に実行されるものであっても良い。
上記具体的な実施形態は、本出願の保護範囲を限定するものではない。以上、添付図面を参照しながら本発明の好適な実施形態について詳細に説明したが、本発明はかかる例に限定されない。本発明の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本本願の精神及び原則内で行われた修正、均等置換及び改良等は、いずれも本願の保護範囲内に含まれるべきである。

Claims (12)

  1. 対話型インタラクションの方法であって、
    ユーザからの受信情報に対し、文のツリーに基づいて、第1のセマンティックコードを決定するステップと、
    前記第1のセマンティックコードに基づいて、対話のツリーから、前記受信情報に応答するための第2のセマンティックコードを決定するステップであって、前記文のツリーと前記対話のツリーは、ロジックマインドマップのサンプルにおける文ノード情報及び/又は単語ノード情報を利用してトレーニングして得られた、ステップと、
    ユーザと対話するために、前記文のツリーから、前記第2のセマンティックコードの対応するターゲット応答文を決定するステップと、
    を含むことを特徴とする方法。
  2. 前記文のツリーは、単語と文との間の組み合わせ関係を表すように構成され、前記対話のツリーは、対話における文の間の応答関係を表すように構成される、ことを特徴とする請求項1に記載の方法。
  3. 前記文のツリーと前記対話のツリーは、
    前記ロジックマインドマップのサンプルに基づいて学習することにより、文のツリー及び対話のツリーにおけるノードを得るステップと、
    前記文のツリーと前記対話のツリーにおいて、ノード間の変換確率を決定するステップと、
    を含む操作により決定されることを特徴とする請求項1に記載の方法。
  4. 前記ロジックマインドマップのサンプルに基づいて学習することにより、文のツリー及び対話のツリーにおけるノードを得るステップは、
    前記ロジックマインドマップのサンプルに対し、単語ノードの深さ優先探索を実行して、完全な対話パスを得るステップと、
    前記完全な対話パスにおける単語ノードに基づいて、対話辞書を作成するステップと、
    前記対話辞書の単語から構成された文に対してセマンティック圧縮を実行して、文のツリーを構成する文ノードを生成し、前記対話辞書に基づいて前記文ノードにおける単語ノードの組み合わせを得るステップと、
    前記文ノードにおける単語ノードの組み合わせの語義に応じて、前記文ノードに、語義を識別するセマンティックコードを付加するステップと、
    を含む、ことを特徴とする請求項3に記載の方法。
  5. 前記ロジックマインドマップのサンプルに基づいて学習することにより、文のツリー及び対話のツリーにおけるノードを得るステップは、
    前記ロジックマインドマップのサンプルにおける文ノードに対してセマンティック圧縮を実行して、対話のツリーを構成する文ノードを生成するステップと、
    ロジックマインドマップにおける文ノード間の接続関係の示す対話論理に基づいて、対話のツリーにおける文ノード間の応答関係を決定するステップと、
    前記文ノードと、文ノード間の応答関係とに基づいて、対話のツリーを得て、前記文ノードの語義に応じて、前記文ノードに、語義を識別するセマンティックコードを付加するステップと、
    を含む、ことを特徴とする請求項3に記載の方法。
  6. 前記ユーザからの受信情報に対し、文のツリーに基づいて、第1のセマンティックコードを決定するステップは、
    前記受信情報における単語情報に基づいて、前記文のツリーの単語ノードから文ノードにトラバースして、前記受信情報を構成するターゲット単語ノードの組み合わせを決定するステップと、
    前記ターゲット単語ノードの組み合わせに基づいて、前記ターゲット単語ノードの組み合わせの属する文ノードから、前記受信情報を示す第1のセマンティックコードを決定するステップと、
    を含むことを特徴とする請求項1に記載の方法。
  7. 前記第1のセマンティックコードに基づいて、対話のツリーから、前記受信情報に応答するための第2のセマンティックコードを決定するステップは、
    前記対話のツリーにおいて、前記第1のセマンティックコードと一致するターゲット受信文ノードを特定するステップと、
    前記ターゲット受信文ノードと応答関係を持つ候補文ノードの変換確率によって、前記候補文ノードから応答文ノードを抽出するステップと、
    前記応答文ノードの第2のセマンティックコードを決定するステップと、
    を含むことを特徴とする請求項1に記載の方法。
  8. 前記文のツリーから、前記第2のセマンティックコードの対応するターゲット応答文を決定するステップは、
    前記文のツリーから、前記第2のセマンティックコードに一致するターゲット応答文ノードを照合するステップと、
    前記ターゲット応答文ノードと組み合わせ関係を持つ候補単語ノードの変換確率によって、前記候補単語ノードからターゲット応答文ノードを抽出するステップと、
    前記ターゲット応答単語ノードを組み合わせて、前記ターゲット応答文を得るステップと、
    を含むことを特徴とする請求項1に記載の方法。
  9. 対話型インタラクション装置であって、
    ユーザからの受信情報に対し、文のツリーに基づいて、第1のセマンティックコードを決定するように構成されたユーザ語義識別モジュールと、
    前記第1のセマンティックコードに基づいて、対話のツリーから、前記受信情報に応答するための第2のセマンティックコードを決定するように構成された応答語義決定モジュールであって、前記文のツリーと前記対話のツリーは、ロジックマインドマップのサンプルにおける文ノード情報及び/又は単語ノード情報を利用してトレーニングして得られた、モジュールと、
    ユーザと対話するために、前記文のツリーから、前記第2のセマンティックコードの対応するターゲット応答文を決定する応答文決定モジュールと、
    を備えることを特徴とする対話型インタラクション装置。
  10. 電子機器であって、
    少なくとも1つのプロセッサと、
    前記少なくとも1つのプロセッサと通信可能に接続されたメモリと、を含み、
    前記メモリは、前記少なくとも1つのプロセッサが実行可能な指令を記憶しており、前記指令は、前記少なくとも1つのプロセッサに実行されると、前記少なくとも1つのプロセッサに、請求項1乃至8のいずれか一項に記載の対話型インタラクションの方法を実行させる
    ことを特徴とする電子機器。
  11. コンピュータコマンドが記憶された非瞬時コンピュータ読み取り可能な記憶媒体であって、
    前記コンピュータコマンドは前記コンピュータに請求項1乃至8のいずれか一項に記載の対話型インタラクションの方法を実行させることを特徴とするコンピュータ読み取り可能な記憶媒体。
  12. コンピュータプログラムであって、
    プロセッサに実行されると、請求項1乃至8のいずれか一項に記載の対話型インタラクションの方法を実行させることを特徴とするコンピュータプログラム。
JP2020158812A 2020-01-08 2020-09-23 対話型インタラクションの方法、装置、機器及び記憶媒体 Pending JP2021119451A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010017420.6 2020-01-08
CN202010017420.6A CN111259162B (zh) 2020-01-08 2020-01-08 对话交互方法、装置、设备和存储介质

Publications (1)

Publication Number Publication Date
JP2021119451A true JP2021119451A (ja) 2021-08-12

Family

ID=70946812

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020158812A Pending JP2021119451A (ja) 2020-01-08 2020-09-23 対話型インタラクションの方法、装置、機器及び記憶媒体

Country Status (3)

Country Link
US (1) US11556719B2 (ja)
JP (1) JP2021119451A (ja)
CN (1) CN111259162B (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113807091B (zh) 2021-08-12 2022-07-22 北京百度网讯科技有限公司 词语挖掘方法、装置、电子设备和可读存储介质
CN113793197A (zh) * 2021-09-02 2021-12-14 中电积至(海南)信息技术有限公司 一种基于知识图谱语义融合的会话推荐系统
US11823666B2 (en) * 2021-10-04 2023-11-21 International Business Machines Corporation Automatic measurement of semantic similarity of conversations
CN114550705B (zh) * 2022-02-18 2024-04-12 北京百度网讯科技有限公司 对话推荐方法、模型的训练方法、装置、设备及介质
CN118132710A (zh) * 2024-03-11 2024-06-04 中国科学院信息工程研究所 基于多尺度滑动窗口与动态聚合的对话级情感分析方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003303187A (ja) * 2002-04-11 2003-10-24 P To Pa:Kk 会話制御システム、会話制御装置、会話制御方法、プログラム及びプログラムを記録した記録媒体
JP2003308320A (ja) * 2002-03-20 2003-10-31 Microsoft Corp 文実現システム
US20180329879A1 (en) * 2017-05-10 2018-11-15 Oracle International Corporation Enabling rhetorical analysis via the use of communicative discourse trees

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100577387B1 (ko) * 2003-08-06 2006-05-10 삼성전자주식회사 음성 대화 시스템에서의 음성 인식 오류 처리 방법 및 장치
CN102231134A (zh) * 2011-07-29 2011-11-02 哈尔滨工业大学 基于静态分析的冗余代码缺陷检测方法
CN110019793A (zh) * 2017-10-27 2019-07-16 阿里巴巴集团控股有限公司 一种文本语义编码方法及装置
CN109918673B (zh) * 2019-03-14 2021-08-03 湖北亿咖通科技有限公司 语义仲裁方法、装置、电子设备和计算机可读存储介质
CN110287282A (zh) * 2019-05-20 2019-09-27 湖南大学 基于树核计算的智能对话系统应答方法及智能对话系统
US11055649B1 (en) * 2019-12-30 2021-07-06 Genesys Telecommunications Laboratories, Inc. Systems and methods relating to customer experience automation

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003308320A (ja) * 2002-03-20 2003-10-31 Microsoft Corp 文実現システム
JP2003303187A (ja) * 2002-04-11 2003-10-24 P To Pa:Kk 会話制御システム、会話制御装置、会話制御方法、プログラム及びプログラムを記録した記録媒体
US20180329879A1 (en) * 2017-05-10 2018-11-15 Oracle International Corporation Enabling rhetorical analysis via the use of communicative discourse trees

Also Published As

Publication number Publication date
US11556719B2 (en) 2023-01-17
CN111259162B (zh) 2023-10-03
CN111259162A (zh) 2020-06-09
US20210209312A1 (en) 2021-07-08

Similar Documents

Publication Publication Date Title
JP7317791B2 (ja) エンティティ・リンキング方法、装置、機器、及び記憶媒体
CN108369580B (zh) 针对屏幕上项目选择的基于语言和域独立模型的方法
JP7247441B2 (ja) セマンティック表現モデルの処理方法、装置、電子機器、及び記憶媒体
JP2021119451A (ja) 対話型インタラクションの方法、装置、機器及び記憶媒体
CN111033492B (zh) 为自动化助手提供命令束建议
JP7283009B2 (ja) 対話理解モデルの訓練方法、装置、デバイス及び記憶媒体
KR20210040319A (ko) 엔티티 링킹 방법, 장치, 기기, 저장 매체 및 컴퓨터 프로그램
US9269354B2 (en) Semantic re-ranking of NLU results in conversational dialogue applications
US9171542B2 (en) Anaphora resolution using linguisitic cues, dialogue context, and general knowledge
US20150279366A1 (en) Voice driven operating system for interfacing with electronic devices: system, method, and architecture
US9361884B2 (en) Communicating context across different components of multi-modal dialog applications
CN111241245B (zh) 人机交互处理方法、装置及电子设备
WO2016028946A1 (en) Orphaned utterance detection system and method
JP2021111379A (ja) インタラクション情報推薦方法及び装置
KR20210056961A (ko) 의미 처리 방법, 장치, 전자 기기 및 매체
JP2021197133A (ja) 意味マッチング方法、装置、電子機器、記憶媒体及びコンピュータプログラム
JP2021192290A (ja) 機械翻訳モデルのトレーニング方法、装置及び電子機器
JP2021111334A (ja) 検索データに基づくヒューマンコンピュータ対話型インタラクションの方法、装置及び電子機器
JP7093825B2 (ja) マンマシン対話方法、装置、及び機器
JP7264957B2 (ja) 音声インタラクション方法、装置、電子機器、コンピュータ読取可能な記憶媒体及びコンピュータプログラム
EP3251114A1 (en) Transcription correction using multi-token structures
CN111984775A (zh) 问答质量确定方法、装置、设备和存储介质
US20200159824A1 (en) Dynamic Contextual Response Formulation
US11900918B2 (en) Method for training a linguistic model and electronic device
JP2022020063A (ja) 対話処理方法、装置、電子機器及び記憶媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210507

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20210531

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220531

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220607

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220906

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20220906

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20221206