JP2020537777A - 発言のユーザ意図を識別するための方法および装置 - Google Patents

発言のユーザ意図を識別するための方法および装置 Download PDF

Info

Publication number
JP2020537777A
JP2020537777A JP2020517103A JP2020517103A JP2020537777A JP 2020537777 A JP2020537777 A JP 2020537777A JP 2020517103 A JP2020517103 A JP 2020517103A JP 2020517103 A JP2020517103 A JP 2020517103A JP 2020537777 A JP2020537777 A JP 2020537777A
Authority
JP
Japan
Prior art keywords
statement
vector
analyzed
historical
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020517103A
Other languages
English (en)
Inventor
フー、ユシャン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Publication of JP2020537777A publication Critical patent/JP2020537777A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Machine Translation (AREA)
  • Stored Programmes (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本開示の実施形態において、発言のユーザ意図を識別するための方法が開示される。本方法は、分析対象の発言のユーザ意図を決定する必要があるときに、当該分析対象の発言が位置しているHCIセッションから、当該分析対象の発言の少なくとも1つの履歴発言を決定することができることを含む。HCIは一般に一定の連続性を有しており、それゆえ、HCIセッションにおける履歴発言の内容が分析対象の発言の内容と関連している場合がある。分析対象の発言の発言ベクトルおよび少なくとも1つの履歴発言の発言ベクトルを参照して決定された履歴ベクトルは、履歴発言において関連する内容を含む場合があり、その内容は、分析対象の発言の内容とある程度関連している場合がある。分析対象の発言のユーザ意図が履歴ベクトルを参照して決定される場合、履歴ベクトルに含まれる、分析対象の発言と関連する内容を追加の決定基準として使用してもよく、その結果、分析対象の発言のユーザ意図の決定精度を向上させることができる。本開示の実施形態において、発言のユーザ意図を識別するための装置も開示される。

Description

[関連出願の相互参照]
本出願は、2017年10月20日出願の中国特許出願第201710987004.7号の優先権を主張する、2018年10月16日出願の国際出願第PCT/CN2018/110395号の優先権を主張し、かつその国内移行段階である。これらはいずれも、それらの全体が参照により本明細書に組み込まれる。
本開示は、データ処理の分野に関し、具体的には、発言のユーザ意図を識別するための方法および装置に関する。
人工知能技術の発展に伴い、マシンは、人間の言語を分析することにより、発言の意味を識別することができ、そのようにしてユーザと言語の対話を実施する。
質問−回答シナリオが典型的な対話シナリオであり、マシンは、ユーザの質問に対して目的の返答を提供することができる。返答する前に、マシンは、質問のユーザ意図および質問の具体的な意味を識別できる必要があり、その結果、マシンは質問に対して正確に返答を提供することができる。
現在のシステムにおいて、マシンは主に、質問のユーザ意図を識別するための参考として、ユーザの質問に含まれるテキストを使用する。しかしながら、いくつかの場合では、識別されたユーザ意図が不正確であり、そのため、提供される回答がユーザ意図と一致しない場合があり、これはネガティブなユーザ体験をもたらす。
上述の技術的問題を解決するために、発言のユーザ意図を識別するための方法が本開示において提供され、本方法は、従来の識別方法の低精度の問題を解決し、ユーザ体験を向上させる。以下の技術的解決策は、実施形態の説明においてさらに詳細に論じられる。
一実施形態において、発言のユーザ意図を識別するための方法が本開示の実施形態において開示され、本方法はHCIセッションにおいて適用され、HCIセッションは複数の発言を含む。本方法は、複数の発言から、分析対象の発言および分析対象の発言に対応する少なくとも1つの履歴発言を取得する段階であって、少なくとも1つの履歴発言が、HCIセッションにおいて分析対象の発言の前に出現する発言である、段階と、分析対象の発言の発言ベクトルおよび少なくとも1つの履歴発言の発言ベクトルに従い、分析対象の発言の履歴ベクトルを決定する段階であって、履歴ベクトルが、少なくとも1つの履歴発言における分析対象の発言と関連する情報を含む、段階と、履歴ベクトルに従い、分析対象の発言のユーザ意図を決定する段階と、を含む。
一実施形態において、複数の分析対象の発言が存在し、複数の分析対象の発言は、複数の発言のうち、対話順序における最後の複数の発言である。
一実施形態において、少なくとも1つの履歴発言と分析対象の発言との間の発言間隔は、事前設定閾値より小さい。
一実施形態において、少なくとも1つの履歴発言が複数の履歴発言を含む場合、複数の履歴発言は、第1の履歴発言および第2の履歴発言を含み、分析対象の発言の発言ベクトルおよび少なくとも1つの履歴発言の発言ベクトルに従い、分析対象の発言の履歴ベクトルを決定する段階は、分析対象の発言の発言ベクトル、第1の履歴発言の発言ベクトル、および第2の履歴発言の発言ベクトルに従い、分析対象の発言に対する第1の履歴発言の意味的類似性および分析対象の発言に対する第2の履歴発言の意味的類似性を決定する段階と、HCIセッションにおける、第1の履歴発言と分析対象の発言との間の出現位置関係、ならびに第2の履歴発言と分析対象の発言との間の出現位置関係を決定する段階と、第1の履歴発言の意味的類似性、第2の履歴発言の意味的類似性、第1の履歴発言の出現位置関係、および第2の履歴発言の出現位置関係に従い、分析対象の発言の履歴ベクトルを決定する段階と、を含む。
一実施形態において、履歴ベクトルに従い、分析対象の発言のユーザ意図を決定する段階は、分析対象の発言の履歴ベクトルおよび発言ベクトルに従い、分析対象の発言の融合ベクトルを決定する段階と、融合ベクトルに従い、分析対象の発言のユーザ意図を決定する段階と、を含む。
一実施形態において、分析対象の発言の履歴ベクトルおよび発言ベクトルに従い、分析対象の発言の融合ベクトルを決定する段階は、分析対象の発言の履歴ベクトルおよび発言ベクトルを加重加算して、分析対象の発言の融合ベクトルを得る段階を含む。
一実施形態において、融合ベクトルに従い、分析対象の発言のユーザ意図を決定する段階が、融合ベクトルを複数の事前設定されたユーザ意図にマッピングする段階と、複数のユーザ意図へのマッピング結果に従い、複数のユーザ意図から分析対象の発言のユーザ意図を決定する段階とを含む。
一実施形態において、分析対象の発言が少なくとも1つの単語セグメントを含み、分析対象の発言の発言ベクトルおよび複数の履歴発言の発言ベクトルに従い、分析対象の発言の履歴ベクトルを決定した後に、本方法はさらに、第1の単語セグメントの単語ベクトルを決定する段階であって、第1の単語セグメントが少なくとも1つの単語セグメントのうちの1つである、段階と、第1の単語セグメントの履歴ベクトルおよび単語ベクトルに従い、第1の単語セグメントの融合単語ベクトルを決定する段階と、第1の単語セグメントの融合単語ベクトルに従い、第1の単語セグメントのエンティティタイプを決定する段階と、を含む。
一実施形態において、分析対象の発言が複数の単語セグメントを含む場合、第1の単語セグメントの融合単語ベクトルに従い、第1の単語セグメントのエンティティタイプを決定する段階は、第1の単語セグメントの融合単語ベクトル、第2の単語セグメントの融合単語ベクトル、および事前学習したエンティティタイプ依存関係に従い、第1の単語セグメントのエンティティタイプを決定する段階を含み、第2の単語セグメントは複数の単語セグメントのうちの1つである。
別の実施形態において、発言のユーザ意図を識別するための装置が本開示の実施形態において開示され、本装置はHCIセッションにおいて適用され、HCIセッションは複数の発言を含む。本装置は、取得ユニットと、第1の決定ユニットと、第2の決定ユニットとを含み、取得ユニットは、複数の発言から、分析対象の発言および分析対象の発言に対応する少なくとも1つの履歴発言を取得し、少なくとも1つの履歴発言は、HCIセッションにおいて分析対象の発言の前に出現する発言であり、第1の決定ユニットは、分析対象の発言の発言ベクトルおよび少なくとも1つの履歴発言の発言ベクトルに従い、分析対象の発言の履歴ベクトルを決定し、履歴ベクトルは、少なくとも1つの履歴発言における分析対象の発言と関連する情報を含み、第2の決定ユニットは、履歴ベクトルに従い、分析対象の発言のユーザ意図を決定する。
一実施形態において、複数の分析対象の発言が存在し、複数の分析対象の発言は、複数の発言のうち、対話順序における最後の複数の発言である。
一実施形態において、少なくとも1つの履歴発言と分析対象の発言との間の発言間隔は、事前設定閾値より小さい。
一実施形態において、第1の決定ユニットは、意味的類似性決定サブユニットと、位置関係決定サブユニットと、履歴ベクトル決定サブユニットとを含み、意味的類似性決定サブユニットは、少なくとも1つの履歴発言が複数の履歴発言を含み、かつ複数の履歴発言が第1の履歴発言および第2の履歴発言を含むとき、分析対象の発言の発言ベクトル、第1の履歴発言の発言ベクトル、および第2の履歴発言の発言ベクトルに従い、分析対象の発言に対する第1の履歴発言の意味的類似性および分析対象の発言に対する第2の履歴発言の意味的類似性を決定し、位置関係決定サブユニットは、HCIセッションにおける、第1の履歴発言と分析対象の発言との間の出現位置関係、ならびに第2の履歴発言と分析対象の発言との間の出現位置関係を決定し、履歴ベクトル決定サブユニットは、第1の履歴発言の意味的類似性、第2の履歴発言の意味的類似性、第1の履歴発言の出現位置関係、および第2の履歴発言の出現位置関係に従い、分析対象の発言の履歴ベクトルを決定する。
一実施形態において、第2の決定ユニットは、融合ベクトル決定サブユニットおよびユーザ意図決定サブユニットを含み、融合ベクトル決定サブユニットは、分析対象の発言の履歴ベクトルおよび発言ベクトルに従い、分析対象の発言の融合ベクトルを決定し、ユーザ意図決定サブユニットは、融合ベクトルに従い、分析対象の発言のユーザ意図を決定する。
一実施形態において、融合ベクトル決定サブユニットは、分析対象の発言の履歴ベクトルおよび発言ベクトルを加重加算して、分析対象の発言の融合ベクトルを得る。
一実施形態において、ユーザ意図決定サブユニットは、マッピングサブユニットおよび決定サブユニットを含み、マッピングサブユニットは、融合ベクトルを複数の事前設定されたユーザ意図にマッピングし、決定サブユニットは、複数のユーザ意図へのマッピング結果に従い、複数のユーザ意図から分析対象の発言のユーザ意図を決定する。
一実施形態において、本装置はさらに、第3の決定ユニット、第4の決定ユニット、および第5の決定ユニットを含み、第3の決定ユニットは、少なくとも1つ単語セグメントのうちの1つである第1の単語セグメントの単語ベクトルを決定し、第4の決定ユニットは、第1の単語セグメントの履歴ベクトルおよび単語ベクトルに従い、第1の単語セグメントの融合単語ベクトルを決定し、第5の決定ユニットは、第1の単語セグメントの融合単語ベクトルに従い、第1の単語セグメントのエンティティタイプを決定する。
一実施形態において、第5の決定ユニットは、分析対象の発言が複数の単語セグメントを含む場合、第1の単語セグメントの融合単語ベクトル、複数の単語セグメントのうちの1つである第2の単語セグメントの融合単語ベクトル、および事前学習したエンティティタイプ依存関係に従い、第1の単語セグメントのエンティティタイプを決定する。
別の実施形態において、発言のユーザ意図を識別するためのデバイスが本開示の実施形態において開示され、本デバイスはHCIセッションにおいて適用され、HCIセッションは複数の発言を含む。本デバイスは、プロセッサおよびメモリを含み、メモリは、プログラムコードを記憶し、かつプログラムコードをプロセッサに送信し、プロセッサは、プログラムコード中の命令に応じて、複数の発言から、分析対象の発言および分析対象の発言に対応する少なくとも1つの履歴発言を取得する段階であって、少なくとも1つの履歴発言が、HCIセッションにおいて分析対象の発言の前に出現する発言である、段階と、分析対象の発言の発言ベクトルおよび少なくとも1つの履歴発言の発言ベクトルに従い、分析対象の発言の履歴ベクトルを決定する段階であって、履歴ベクトルが、少なくとも1つの履歴発言における分析対象の発言と関連する情報を含む、段階と、履歴ベクトルに従い、分析対象の発言のユーザ意図を決定する段階と、を含む方法を実施する。
一実施形態において、複数の分析対象の発言が存在し、複数の分析対象の発言は、複数の発言のうち、対話順序における最後の複数の発言である。
一実施形態において、少なくとも1つの履歴発言と分析対象の発言との間の発言間隔は、事前設定閾値より小さい。
一実施形態において、プロセッサは、プログラムコード中の命令に応じて、分析対象の発言の発言ベクトル、第1の履歴発言の発言ベクトル、および第2の履歴発言の発言ベクトルに従い、分析対象の発言に対する第1の履歴発言の意味的類似性および分析対象の発言に対する第2の履歴発言の意味的類似性を決定する段階と、HCIセッションにおける、第1の履歴発言と分析対象の発言との間の出現位置関係、ならびに第2の履歴発言と分析対象の発言との間の出現位置関係を決定する段階と、第1の履歴発言の意味的類似性、第2の履歴発言の意味的類似性、第1の履歴発言の出現位置関係、および第2の履歴発言の出現位置関係に従い、分析対象の発言の履歴ベクトルを決定する段階と、を含む方法を実施する。
一実施形態において、プロセッサは、プログラムコード中の命令に応じて、分析対象の発言の履歴ベクトルおよび発言ベクトルに従い、分析対象の発言の融合ベクトルを決定する段階と、融合ベクトルに従い、分析対象の発言のユーザ意図を決定する段階と、を含む方法を実施する。
一実施形態において、プロセッサは、プログラムコード中の命令に応じて、分析対象の発言の履歴ベクトルおよび発言ベクトルを加重加算して、分析対象の発言の融合ベクトルを得る段階を含む方法を実施する。
一実施形態において、プロセッサは、プログラムコード中の命令に応じて、融合ベクトルを複数の事前設定されたユーザ意図にマッピングする段階と、複数のユーザ意図へのマッピング結果に従い、複数のユーザ意図から分析対象の発言のユーザ意図を決定する段階と、を含む方法を実施する。
一実施形態において、プロセッサはさらに、プログラムコード中の命令に応じて、少なくとも1つ単語セグメントのうちの1つである第1の単語セグメントの単語ベクトルを決定する段階と、第1の単語セグメントの履歴ベクトルおよび単語ベクトルに従い、第1の単語セグメントの融合単語ベクトルを決定する段階と、第1の単語セグメントの融合単語ベクトルに従い、第1の単語セグメントのエンティティタイプを決定する段階と、を含む方法を実施する。
一実施形態において、プロセッサはさらに、プログラムコード中の命令に応じて、第1の単語セグメントの融合単語ベクトル、複数の単語セグメントのうちの1つである第2の単語セグメントの融合単語ベクトル、および事前学習したエンティティタイプ依存関係に従い、第1の単語セグメントのエンティティタイプを決定する段階を含む方法を実施する。
別の実施形態において、記憶媒体が本開示の実施形態において開示され、当該記憶媒体はプログラムコードを記憶し、当該プログラムコードは、本開示の前述の実施形態において提供される、発言のユーザ意図を識別するための方法を実施するために使用される。
別の実施形態において、命令を含むコンピュータプログラム製品が本開示の実施形態において開示され、当該コンピュータプログラム製品がコンピュータで動作すると、コンピュータは、本開示の前述の実施形態において提供される、発言のユーザ意図を識別するための方法を実施させられる。
上に要約され、かつ本明細書にさらに詳細に説明されるように、分析対象の発言のユーザ意図を決定する必要がある場合、当該分析対象の発言が位置しているHCIセッションから、当該分析対象の発言の少なくとも1つの履歴発言を決定することができ、HCIは一般に一定の連続性を有しており、それゆえ、HCIセッションにおける履歴発言の内容が分析対象の発言の内容と関連している場合がある。分析対象の発言の発言ベクトルおよび少なくとも1つの履歴発言の発言ベクトルを参照して決定された履歴ベクトルは、履歴発言において関連する内容を含む場合があり、その内容は、分析対象の発言の内容とある程度関連している場合がある。分析対象の発言のユーザ意図が履歴ベクトルを参照して決定される場合、履歴ベクトルに含まれる分析対象の発言と関連する内容を追加の決定基準として使用することができ、決定基準がより多くなることにより、分析対象の発言のユーザ意図を決定する精度を向上させることができる。
本開示の実施形態における技術的解決策を説明するために、実施形態の説明に用いられる添付図面を以下に簡潔に紹介する。以下の説明の添付図面は、本開示の一部の実施形態にすぎない。当業者は、大きな努力を伴わずにこれらの添付図面に基づき他の添付図面をさらに得ることができる。
開示されるいくつかの実施形態に係る、発言のユーザ意図を識別するための方法を示すフロー図である。
開示される実施形態に係る、融合ベクトルに従い、ユーザ意図を決定することについての図である。
開示されるいくつかの実施形態に係る、発言のユーザ意図を識別するための方法を示すフロー図である。
開示されるいくつかの実施形態に係る、分析対象の発言の単語セグメントタイプをラベリングするための方法を示すフロー図である。
開示されるいくつかの実施形態に係る、発言のユーザ意図を識別するためのプログラムのブロック図である。
開示されるいくつかの実施形態に係る、発言のユーザ識別およびエンティティラベリングを実装するためのプログラムのブロック図である。
開示されるいくつかの実施形態に係る履歴メモリコンポーネントのブロック図である。
開示されるいくつかの実施形態に係る最新の発言の処理コンポーネントのブロック図である。
開示されるいくつかの実施形態に係るエンティティラベリングコンポーネントのブロック図である。
開示されるいくつかの実施形態に係る、発言のユーザ意図を識別するための装置のブロック図である。
本開示のいくつかの実施形態に係る、発言のユーザ意図を識別するためのデバイスのブロック図である。
開示される実施形態を、添付図面を参照して以下に説明する。
現在、人工知能技術は発展の只中にあり、そのような技術は日常生活にますます適用されている。例えば、ユーザは、Apple Inc.(カリフォルニア州クパチーノ)により提供されるiPhone(登録商標)デバイスに設けられたSiri(登録商標)デジタルアシスタント、およびMicrosoft Inc.(ワシントン州レドモンド)により提供されるチャットロボット(Xiaobing)と会話して、天気を検索したり、道順を尋ねたり、音楽を流したり、一般的な質問をしたりするなどができる。日常生活における適用に加え、職場における人工知能技術の適用もまた主要な開発傾向である。従来の労力の代わりにロボットを使用する(例えば、物流分野において荷物の仕分けのためにロボットを使用する)ことにより、効果的に労働コストを低減し、企業経営を容易にすることができる。産業時代における蒸気機関および情報時代におけるコンピュータと同様に、人工知能は、社会に大きな変化をもたらし、人間の生活に新たな変化をもたらすことになる。
人工知能の中心にあるのは、ヒューマンコンピュータインタラクション(HCI)技術である。人間をマシンと区別する最も重要な点は、人間は自主的に思考することができ、マシンは機械的である点である。したがって、人工知能の目的は、マシンが人間のように思考するのを可能にすることである。マシンが思考することができ、かつマシンが人間の意図を理解し、その人間の意図に応答することができるという前提に基づき、人間とマシンとの間の対話(すなわち、HCI)はそのように実施される。したがって、HCIの発展は、ユーザ意図の識別精度の向上に依存している。
従来のユーザ意図識別は、固定の発言パターンを参照して、ユーザの最新の発言を分析することにより実施される。人間の言語の柔軟性や変動性に起因して、この技術を使用して得られるユーザ意図はしばしば、ユーザの実際の意図と一致しない。例えば、以下のシナリオを考察する(ここで、「Q」はユーザの質問を表し、「A」はマシンの回答を表し、数字は質問および回答の順序を表し、「xxx」は質問に対する回答を表しており、これらの内容は、問答に関する検討において重要ではない)。
Q1:明日のウルムチの天気はどうですか?
A1:xxx
Q2:明後日はどうですか?
A2:xxx
Q3:上海はどうですか?
A3:xxx
この一連の問答において、マシンは、各質問(Q1、Q2、Q3等;Qとして総称される)の意図、すなわち、Qの内容を通してユーザが何を表現することを意図しているか、および目的が何であるかを識別する必要がある。Q2およびQ3の意図について、従来の方法に従って正確な結果を取得することが困難であることは明らかであり、これらの意図は、履歴情報(例えば、Q1等の以前の質問)を参照することによってのみ正確に判断され得る。Q3を例として説明を行う。従来の方法において、「上海はどうですか?」という分析対象の発言の意図を識別する場合、一般に、分析対象の発言の内容に従い分析を行うことができる。しかしながら、分析対象の発言は、分析対象の発言の意図を正確に決定するには不十分である。得られる意図は、他の多くの意図の中でも、上海の天気はどうか、または、上海にはどんな景勝地があるかになり得る。これは、分析対象の発言の実際の意図、すなわち、「明後日の上海の天気はどうですか?」とは明らかに異なる。従来の方法を使用して決定された意図に応じてマシンが返答すると、返答の内容は、ユーザが知りたいと意図する内容とは明らかに一致せず、ユーザ体験の低下および不正確な結果をもたらす。
したがって、発言のユーザ意図を識別するための方法および装置が本開示の実施形態において提供される。分析対象の発言のユーザ意図を決定する必要がある場合、当該分析対象の発言が位置しているHCIセッションから、当該分析対象の発言の少なくとも1つの履歴発言を決定することができ、HCIは一般に一定の連続性を有しており、それゆえ、HCIセッションにおける履歴発言の内容が分析対象の発言の内容と関連している場合がある。分析対象の発言の発言ベクトルおよび少なくとも1つの履歴発言の発言ベクトルを参照して決定された履歴ベクトルは、履歴発言において関連する内容を含む場合があり、その内容は、分析対象の発言の内容とある程度関連している場合がある。分析対象の発言のユーザ意図が履歴ベクトルを参照して決定される場合、履歴ベクトルに含まれる分析対象の発言と関連する内容を追加の決定基準として使用することができ、決定基準が多くなるほど、分析対象の発言のユーザ意図の決定精度を向上させることができる。
開示される実施形態は、主にリカレントニューラルネットワーク(RNN)に適用され、発言の発言ベクトルは、RNNによって決定することができる。本開示の実施形態において言及される発言は、1つまたは複数の文字を含んでもよく、異なる言語形態または言語に応じて、複数の異なる文字形態および文字の組み合わせが存在し得る。発言の発言ベクトルは、発言中のすべての単語の情報を保有し、ベクトル化形態で得られるベクトルである。例えば、単語セグメント化された発言が入力され、発言がn個の単語セグメントを有すると仮定すると、RNNを通過した後、n個の単語セグメントにそれぞれ対応するn個の出力ベクトルr...rn−1,rが存在し、これらの出力ベクトルを単語セグメントの単語ベクトルとして使用することができる。RNNのメモラビリティに起因して、i番目の単語セグメントの出力ベクトルrは、すべての単語セグメント、すなわち、その単語セグメントの前のr,...ri−1の情報を含み、そのため、最後の単語セグメントの出力ベクトルは、発言中のすべての単語セグメントの情報を含むはずである。したがって、最後の単語セグメントの出力ベクトルrを、発言の発言ベクトルとして使用することができる。
発言、すなわち、分析対象の発言のユーザ意図が決定されると、開示される実施形態において、分析対象の発言のユーザ意図は、少なくとも1つの履歴発言の発言ベクトルを参照して決定される。ここでの履歴発言は、ユーザ意図が分析される分析対象の発言に対して決定される。分析対象の発言は、マシンによってユーザ意図を決定する必要がある発言である。一般に、分析対象の発言は、HCIセッションにおいてユーザによって入力される最後の発言であり、マシンによる返答および応答が必要とされる発言である。マシンの返答が遅い場合、分析対象の発言は、ユーザが入力した発言のうち、マシンによって返答されていない発言でもあり得る。1つの分析対象の発言または複数の分析対象の発言が存在し得る。複数の分析対象の発言が存在する場合、複数の分析対象の発言は、複数の発言のうち、対話順序における最後の複数の発言であってもよい。本開示の実施形態に現れるマシンは従来の意味でのマシンに限定されず、対話機能を実装可能なソフトウェア、またはそのソフトウェアが利用される端末もしくはサーバ等であってもよいことに留意すべきである。
分析対象の発言および分析対象の発言に対応する履歴発言はいずれも、同一のHCIセッションに出現する。このHCIセッションでは、HCIは連続的なプロセスである。履歴発言は、HCIセッションにおいて分析対象の発言の前に出現する発言であり、履歴発言および分析対象の発言はいずれもユーザによって入力された発言である。例えば、Q1→A1、Q2→A2、およびQ3→A3の上述の例では、マシンがQ2のユーザ意図を分析する必要がある場合、Q1をQ2の履歴発言として使用することができる。マシンがQ3のユーザ意図を分析する必要がある場合、Q1およびQ2をQ3の履歴発言として使用することができる。
実施形態1
本開示のいくつかの実施形態に係る、発言のユーザ意図を識別するための方法を、添付図面を参照して以下に詳細に説明する。図1は、本開示の一実施形態に係る、発言のユーザ意図を識別するための方法を示すフロー図である。本方法は、以下の段階を含む。
S101:複数の発言から、分析対象の発言および分析対象の発言に対応する少なくとも1つの履歴発言を取得する。ここで、少なくとも1つの履歴発言は、HCIセッションにおいて分析対象の発言の前に出現する発言である。
例示された実施形態において、上記の発言は同一のHCIセッション内に位置しており、いずれもユーザによって入力される。入力方法は限定されない。例えば、発言は、キーボード等の入力デバイスを介してユーザによって手動で入力されてもよいし、ユーザによる音声入力からマシンによって認識されてもよい。例えば、デジタル音声アシスタントのSiri(登録商標)では、音声の意味をまず構文解析して音声をテキストに変換することにより、ユーザ意図を識別する必要がある。音声の構文解析は本開示により解決すべき技術的問題ではないため、本開示におけるユーザ意図の識別の技術的解決策は、本開示の実施形態において、テキスト形態の発言を例として示す。
上述の天気の質問の適用シナリオでは、従来の方式で分析対象の発言が決定される場合、分析対象の発言のユーザ意図は、一般に、分析対象の発言自体の統語構造または意味論上の意味などを参照して決定され得る。分析対象の発言がQ3(「上海はどうですか?」)である場合、マシンは、Q3自体の統語構造および意味論上の意味に従い、Q3のユーザ意図を分析することができる。Q3に含まれる内容では、マシンが、この質問のテキストのみに基づいてQ3のユーザ意図を正確に決定することは困難になる。したがって、例示された実施形態では、分析対象の発言のユーザ意図は、分析対象の発言および対応する履歴発言を参照して決定される。少なくとも1つの履歴発言を参照して分析対象の発言のユーザ意図を決定することにより、複数の一連の問答における、ユーザが入力した情報の不完全性および省略に起因する分析対象の発言のユーザ意図の不正確な識別の発生が低減され得る。
しかしながら、履歴発言の数の要件は、異なる適用シナリオにおいてしばしば異なる。例えば、TaobaoまたはJingdong Mallなどのショッピングサイトでは、カスタマーサービス担当者が忙しいときにカスタマーサービス担当者の代わりに一部のよくある質問(「返品方法は?」および「送料は含まれていますか?」等)に回答するためにカスタマーサービスロボットが設けられていることが多い。この種類の質問は非常に独立したものであることが多く、現在論じられているトピックは、概して2回または3回以内の一連の質問で完了され得る。したがって、このシナリオでは、分析対象の発言の前にユーザにより入力された2つの発言が分析対象の発言に対応する履歴発言であると設定することができる。当然ながら、別の適用シナリオにおいて、ユーザにより入力された多くの発言がHCIセッション中に存在するときに、分析対象の発言の履歴発言を決定する必要がある場合、後戻りする発言の個数を指定することができる(例えば、5つの発言)。したがって、分析対象の発言の前にユーザにより入力された5つの発言を分析対象の発言の履歴発言として使用することができ、それ以前の発言は無視してよい。後戻りする発言の個数を指定することにより、履歴発言の数を低減し、その後の履歴発言の関連度の計算の複雑さを効果的に低減し、計算効率を向上させることができる。それにより、ユーザ意図をより迅速かつより正確に識別し、ユーザ意図に迅速かつ正確に応答することができ、より良好なユーザ体験がもたらされる。
履歴発言の数は、特定の適用シナリオに応じてカスタマイズすることができる。当然ながら、履歴発言の数の設定も、識別結果に対して一定の影響を及ぼす。したがって、異なるシナリオでは、履歴発言の個数は、固定されていてもよいし、変動してもよい(例えば、文脈が変わると変動する)。履歴発言の個数は事前設定されていてもよいし、履歴発言の個数は絶え間ない学習を通して最適化されてもよいので、識別精度はこの適用シナリオにおいてさらに向上する。
異なる位置にある履歴発言も、分析対象の発言のユーザ意図の識別に対して一定の影響を有することになる。同一または同様の意味論上の意味の場合、距離がより短い履歴発言は分析対象の発言のユーザ意図の識別に対する影響がより大きく、距離が長い履歴発言は分析対象の発言のユーザ意図の識別に対する影響がより小さい。履歴発言の位置がある程度遠い場合、分析対象の発言のユーザ意図の識別に対する履歴発言の影響は無視してもよい。この位置での履歴発言と分析対象の発言との間の発言間隔が、事前設定閾値として設定されてもよい。本開示の実施形態の考えられる実装において、ユーザ意図の識別精度を向上させるために、少なくとも1つの履歴発言と分析対象の発言との間の発言間隔は、事前設定閾値より小さく設定されてもよい。事前設定閾値は、経験的に設定されてもよい。
S102:分析対象の発言の発言ベクトルおよび少なくとも1つの履歴発言の発言ベクトルに従い、分析対象の発言の履歴ベクトルを決定する。
履歴ベクトルは、分析対象の発言の発言ベクトルおよび少なくとも1つの履歴発言の発言ベクトルに従った計算によって得られるベクトルであり、分析対象の発言および履歴発言に対応する発言ベクトルと見なされ得る。履歴ベクトルに含まれる情報は、分析対象の発言と関連する少なくとも1つの履歴発言の情報を反映することができるだけでなく、分析対象の発言の情報もある程度反映することができる。
履歴ベクトルの計算プロセスは、本開示において限定されない。履歴ベクトルの計算は、分析対象の発言の発言ベクトルおよび履歴発言の発言ベクトルの加算であってもよいし、他の計算方法であってもよい。例えば、分析対象の発言の発言ベクトルがmであり、履歴発言の発言ベクトルがそれぞれm〜mn−1であり、履歴ベクトルは、2つを加算した結果、すなわち、m+...mn−1+mであってもよい。
S103:履歴ベクトルに従い、分析対象の発言のユーザ意図を決定する。
履歴ベクトルに含まれる情報は、分析対象の発言の情報を反映してよく、分析対象の発言と関連する少なくとも1つの履歴発言の情報も反映してよい。したがって、マシンが履歴ベクトルにより分析対象の発言のユーザ意図を決定する場合、分析対象の発言のユーザ意図の識別がより正確となるように、より多くの、かつ有効な参照可能な情報が存在し得る。複数の一連の問答において、より正確なユーザ意図に基づき、マシンは、ユーザにより入力された分析対象の発言に対してより正確に応答することができ、そのため、より良好な体験をユーザにもたらす。
一実施形態において、履歴ベクトルに従い、分析される発言のユーザ意図を決定する方法は限定されない。一般に、ユーザ意図の種類は限られており、事前に集約することができる。その結果、履歴ベクトルに従い、分析対象の発言のユーザ意図が決定されると、履歴ベクトルは、事前に取得された様々なユーザ意図に一定のルールでマッピングされ得る。特定の種類のユーザ意図のスコアまたはカテゴリがマッピング中で最も高い場合、この種類のユーザ意図を、分析対象の発言のユーザ意図として使用することができる。
ステップS103について、分析対象の発言の情報は、常に履歴ベクトルに十分に反映されるとは限らず、したがって、分析対象の発言のユーザ意図をより正確に決定するために、追加の実施形態がさらに提供される。この追加の実施形態において、分析対象の発言の融合ベクトルは、分析対象の発言の履歴ベクトルおよび発言ベクトルに従ってまず決定されてよく、その後、融合ベクトルに従い、分析対象の発言のユーザ意図が決定される。例えば、履歴ベクトルはhであり、最新の分析対象の発言の発言ベクトルはuである。履歴ベクトルhおよび分析対象の発言の発言ベクトルuを融合して、融合ベクトルоを得ることができる。融合方法は、単に2つのベクトルの加算であってもよいし、意図識別に対する影響に応じて2つのベクトルの各々に重みが割り当てられた後の加重加算の実施であってもよく、あるいは他の融合方法も使用してもよい。本開示の実施形態では、理解を容易にするために、2つのベクトルの加算、すなわち、о=h+uによって説明を行う。融合ベクトルを得た後、融合ベクトルは、事前に取得された様々なユーザ意図に一定のルールでマッピングされ得る。特定の種類のユーザ意図のスコアまたはカテゴリがマッピング中で最も高い場合、この種類のユーザ意図を、分析対象の発言のユーザ意図として使用することができる。
融合ベクトルをマッピングすることによるユーザ意図の取得を、図2を参照して以下に紹介する。
図2において、2つの融合ベクトル、すなわち、оおよびоが存在する。分析対象の発言1について計算された融合ベクトルがоであり、分析対象の発言2について計算された融合ベクトルがоである。n種類の考えられるユーザ意図が事前に取得され、これらのユーザ意図はそれぞれx,x…xによって表される。様々なユーザ意図のスコアを得るために、оおよびоは各々、マシンによりn種類のユーザ意図にマッピングされる。оおよびоに対応する様々なユーザ意図のスコアは、b11,b12...b1nおよびb21,b22...b2nである。最高スコア値の意図が、分析対象の発言のユーザ意図である。事前に取得された異なるユーザ意図への融合ベクトルのマッピングは異なる重みを有してよく、これらの重みはマシンに学習させることによって得ることができることに留意すべきである。
意図取得モジュールには複数の意図カテゴリが存在し、それぞれx,x…xによって表される。マッピングモジュールは、оおよびоの各々をx,x...xにマッピングし、x,x...xのスコアを得る。意図取得モジュールは、最新の発言の意図として機能する最大スコアを選択する。例えば、оのマッピングについて、xのスコアが最大である場合、xが分析対象の発言1のユーザ意図である。
上述の実施形態において、分析対象の発言の履歴ベクトルは、分析対象の発言の発言ベクトルおよび少なくとも1つの履歴発言の発言ベクトルを計算することにより求められ、ユーザ意図は、分析対象の発言の履歴ベクトルに従って決定される。既存のシステムと比較して、この方法は、分析対象の発言と関連し、かつ履歴発言に含まれる情報を十分に考慮するため、ユーザ意図識別がより正確である。
いくつかの実施形態では、S102において、分析対象の発言の発言ベクトルおよび少なくとも1つの履歴発言の発言ベクトルに従い、分析対象の発言の履歴ベクトルを決定する必要がある。計算の際には、異なる履歴発言と分析対象の発言との間の関連性の程度を考慮する必要がある。履歴発言と分析対象の発言との間の意味的類似性のみならず、HCIセッションにおける履歴発言と分析対象の発言との間の距離も考慮する必要がある。
一般に、HCIプロセスにおいて、対話内容は、トピックについての連続的なプロセスを含んでよい。同一のトピックが論じられるとき、ユーザにより入力される発言はいずれもそのトピックと関連している場合があり、続けて入力される発言もまたそれらの間に一定の関連性を有する場合がある。したがって、同一のトピックを論じる発言の間の意味的類似性は一般により高くなる。さらに、通常の対話は一般に連続性を有するが、その連続性はあまり長続せず、したがって、分析対象の発言により近い履歴発言は、分析対象の発言とより関連しており、同一の事柄または同一のトピックを論じている可能性が高く、分析対象の発言から遠く離れた履歴発言は、分析対象の発言との関連性が非常に低い場合があり、異なる事柄または異なるトピックを論じている可能性が高い。
したがって、HCIセッションにおいて分析対象の発言により近い履歴発言は、意図識別に対する影響がより大きくなる。当然ながら、履歴発言と分析対象の発言との間の位置関係のみを考慮することは不十分であり、分析対象の発言のユーザ意図を決定するときに、より正確な意図識別を達成するためには、履歴発言と分析対象の発言との間の意味的類似性も考慮する必要がある。したがって、分析対象の発言が決定されるとき、分析対象の発言から遠く離れているが、意味的類似性が高い履歴発言は、分析対象の発言のユーザ意図の決定のための主要な基準として使用されないようにすることができる。これは、分析対象の発言から遠く離れたこの種類の履歴発言は、分析対象の発言とは異なる事柄またはトピックを論じている場合があるためである。その履歴発言が分析対象の発言のユーザ意図を決定するための主要な基準として使用されると、決定されたユーザ意図が、分析対象の発言の実際のユーザ意図と一致しない場合がある。特定のシナリオに関連した例を通じて、以下に説明を行う。
Q1:明日のウルムチの天気はどうですか?
A1:xxx
Q2:明後日はどうですか?
A2:xxx
Q3:杭州にはどんな景勝地がありますか?
A3:xxx
Q4:上海はどうですか?
A4:xxx
分析対象の発言はQ4の「上海はどうですか?」であり、Q1からQ3はQ4の履歴発言であると仮定する。3つの履歴発言から2つユーザ意図が決定される可能性があるため、一方は、景勝地を尋ねることであり、他方は天気を尋ねることであり、これらはいずれもQ4と関連している場合がある。景勝地を尋ねる履歴質問が分析対象の発言により近くに出現するという位置関係が考慮されない場合、Q4の意図として天気の質問が誤って識別される可能性が高い。
ユーザ意図識別に対する履歴発言の位置関係の影響を考慮して、S102において、分析対象の発言の発言ベクトルおよび履歴発言の発言ベクトルに従い、分析対象の発言の履歴ベクトルを決定するための方法が、開示される実施形態に提供される。
本開示の実施形態における、分析対象の発言の発言ベクトルおよび履歴発言の発言ベクトルに従い、履歴ベクトルを決定するための方法を、図3を参照して以下に紹介する。1つの履歴発言または複数の履歴発言が存在し得る。分析対象の発言の発言ベクトルおよび1つの履歴発言の発言ベクトルに従い、履歴ベクトルを決定するための方法は、分析対象の発言の発言ベクトルおよび複数の履歴発言の発言ベクトルに従い、履歴ベクトルを決定するための方法と同様である。分析対象の発言の発言ベクトルおよび複数の履歴発言の発言ベクトルに従い、履歴ベクトルを決定するための方法を以下に紹介する。履歴発言の個数が1つである場合、複数の履歴発言についての方法を参照することができ、詳細はここで再度説明しない。
複数の履歴発言は、第1の履歴発言および第2の履歴発言を含む。この実施形態において、第1の履歴発言および第2の履歴発言を例として説明を行うが、本開示は、第1の履歴発言および第2の履歴発言に限定されない。本方法は、以下の段階を含む。
S301:分析対象の発言の発言ベクトル、第1の履歴発言の発言ベクトル、および第2の履歴発言の発言ベクトルに従い、分析対象の発言に対する第1の履歴発言の意味的類似性および分析対象の発言に対する第2の履歴発言の意味的類似性を決定する。
意味的類似性は、意味論の観点から2つの発言の間の関連度を表す概念である。例えば、分析対象の発言に対する第1の履歴発言の意味的類似性のレベルとは、意味論の観点からの第1の履歴発言と分析対象の発言との間の関連度を意味する。意味的類似性は、第1の履歴発言の発言ベクトルおよび分析対象の発言の発言ベクトルを通して決定することができる。
本開示の実施形態において、分析対象の発言に対する第1の履歴発言の意味的類似性および分析対象の発言に対する第2の履歴発言の意味的類似性を決定するための方法は限定されず、実現可能な実装は、分析対象の発言に対する複数の履歴発言の関連度の分布を見つけることである。
例えば、分析対象の発言の発言ベクトルはuであり、履歴発言の発言ベクトルはmである。具体的には、本開示の実施形態において、第1の履歴発言および第2の履歴発言の発言ベクトルはそれぞれmおよびmであってよい。分析対象の発言に対する履歴発言の意味的類似性はpであり、分析対象の発言に対する履歴発言の意味的類似性の分布は、p=softmax(m)によって取得することができ、ここで、mは、履歴発言の発言ベクトルおよび最新の分析対象の発言の発言ベクトルの内積を表す。ここで、Tは移項を意味し、発言ベクトルの移項から得られるベクトルを表し、すなわち、元の行ベクトル形態が列ベクトル形態に変換される。ソフトマックス関数の機能は正規化であり、その結果、
Figure 2020537777
となる。この正規化は、意味的類似性の結果をより直感的に示すように機能する。本開示の別の実施形態において、正規化が実施されなくてもよく、すなわち、意味的類似性の別の分布は、p=mである。正規化が実施されるどうかは本開示の実施形態の実装に影響しない。
意味的類似性を計算するための好ましい実装解決策は、mの行列計算のためにPythonプログラミング言語におけるNumPyパッケージまたはJava(登録商標)プログラミング言語におけるJamaパッケージを選択することであり、ここで、NumPyパッケージおよびJamaパッケージは各々、対応するプログラミング言語におけるベクトルまたは行列の計算を実施するための一組のクラスを含む。次に、正規化処理のためにソフトマックス関数を呼び出すことができる。p値が大きいほど、履歴発言iと分析対象の発言との間の関連度が高く、履歴発言iが分析対象の発言とよく類似していることを示す。対照的に、p値が小さいほど、履歴発言iと分析対象の発言との間の関連度が低く、履歴発言iが分析対象の発言と類似しないことを示す。
意味的類似性は、履歴発言の発言ベクトルおよび分析対象の発言の発言ベクトルの内積によって計算される。一方では、履歴情報が十分に考慮され、様々な履歴発言の発言ベクトルを同時に計算することができる。他方では、関数を直接呼び出すことによって内積の行列計算を実施することができ、実装プロセスは比較的単純であり、それにより、計算効率が向上し、類似の意味論上の意味の結果が素早く得られる。
S302:第1の履歴発言の類似度、第2の履歴発言の類似度、第1の履歴発言の出現位置関係、および第2の履歴発言の出現位置関係に従い、分析対象の発言の履歴ベクトルを決定する。
位置関係は、HCIセッションにおける履歴発言と分析対象の発言との間の距離を表すために使用することができる。位置関係の観点から、分析対象の発言により近い履歴発言は、ユーザ意図識別に対する影響がより大きい。位置関係を参照して履歴ベクトルを計算することにより、ユーザ意図識別のより正確な結果がもたらされ得る。履歴発言の位置関係が無視されると、類似する意味上の類似性を有する2つ以上の履歴発言が履歴発言に存在する場合、ユーザ意図識別の精度が低下する場合がある。
位置関係は、複数の様式で反映される場合があり、最新の履歴発言と分析対象の発言との間の行数の違いであってもよいし、他の表現形式であってもよい。位置関係の反映方法は、本開示の実施形態の実装に影響しない。
位置関係の反映の1つの実装は、HCIセッションにおける分析対象の発言に対して、i番目の履歴発言の位置を表すためにposを使用することであり、qは位置関係を表し、ここで、q=softmax(pos)である。当然ながら、正規化は実施されなくてもよく、正規化が実施されるかどうかは本開示の実施形態の実装に影響しない。例えば、ウルムチの天気を尋ねるシナリオにおいて、「明日の/ウルムチ/の/天気は/どう/ですか?」が第1の履歴質問であり、pos=0等である。第2および第3の履歴発言において、pos=1、pos=2であり、q=softmax(pos)に従って計算が実施され、その結果、q=0.09、q=0.24、およびq=0.67を得ることができる。この例から分かるように、分析対象の発言により近い履歴発言が、より高い位置関係の重みを有する。履歴発言と分析対象の発言との間の位置関係を反映することができる限り、pos値を設定する方法は本開示の実施形態において限定されない。
分析対象の発言の履歴ベクトルは、第1の履歴発言の類似度、第2の履歴発言の類似度、第1の履歴発言の出現位置関係、および第2の履歴発言の出現位置関係に従い決定される。履歴ベクトルの決定プロセスは本開示において限定されず、発言の意味的類似性を位置関係に加算すること、または発言の意味的類似性に位置関係を乗算することによって実施されてもよいし、他の計算方式によって実施されてもよい。
履歴ベクトルを計算する1つの実装は、分析対象の発言に対する履歴発言の類似度の平均と、履歴発言の発言ベクトルの係数として機能する履歴発言の対応する位置関係とを得ることである。表現および後の参照を容易にするために、係数はαによって表され、分析対象の発言uに対する履歴発言mの意味的類似性はpであり、位置関係はqであり、そして、履歴発言の発言ベクトルmの係数は、α=(p+q)/2である。そして、履歴ベクトルmとその係数αの積を加算して履歴ベクトルが得られ、履歴ベクトルは、hによって表される。履歴ベクトルの計算式は、
Figure 2020537777
として得ることができる。
履歴発言の発言ベクトルの係数は、意味的類似性および位置関係を参照して計算する必要がある。意味的類似性のみまたは位置関係のみを考慮することは、不正確なユーザ意図識別をもたらすことになる。位置関係が無視されると、セッションにおいて類似の意味上の類似性を有する少なくとも2つの履歴発言が存在するときに、分析対象の発言から遠く離れた履歴発言が主要な基準として使用された場合、決定されたユーザ意図は実際のユーザ意図と一致しない可能性が高い。意味的類似性が無視されて位置関係のみが考慮され、分析対象の発言により近い履歴発言が主要な基準として使用されると、より近い履歴発言が分析対象の発言に対してより低い意味的類似性を有する場合、決定されるユーザ意図は実際のユーザ意図と一致しない可能性が高い。したがって、履歴ベクトルを計算するときに、分析対象の発言に対する履歴発言の意味的類似性および位置関係が十分に考慮されるべきであり、すなわち、履歴発言の発言ベクトルの係数は、分析対象の発言に対する履歴発言の意味的類似性および位置関係に従って決定されるべきである。履歴ベクトルhには、実際には様々な履歴発言の発言ベクトルに含まれる有用な情報が凝縮されていることは明らかであろう。より大きい重み、すなわちより大きいαを有する履歴発言の発言ベクトルは、履歴ベクトル全体に対する影響がより大きくなる。履歴ベクトルはユーザ意図識別の結果に直接影響するため、係数αを正確に計算することは特に重要である。
本開示の他の実装において、平均化は実施されなくてもよく、意味的類似性および位置関係のそれぞれに重みが割り当てられてもよく、加算、乗算、または他の計算方法を実施してもよい。履歴発言の発言ベクトルの係数を計算するための方法は、本開示の実施形態の実装に影響しない。平均化は、計算の利便性のためのものである。具体的に、実際の適用シナリオでは、シナリオの特徴に応じた適応数学モデルが確立されてもよく、異なるパラメータが定義される。パラメータはまた事前設定されてもよいし、反復学習および最適化によって得られてもよい。学習および最適化によって得られたパラメータは、より正確な履歴ベクトル計算をもたらすことができ、それにより、ユーザ意図識別の精度が向上し、ユーザに対してより良好な体験がもたらされる。
上述の実施形態において、履歴ベクトルは、分析対象の発言に対する履歴発言の意味的類似性および位置関係を参照して計算され、履歴ベクトルに従ってユーザ意図が決定されるため、意味的類似性または位置関係のみを考慮することにより引き起こされる、ユーザの実際の意図と一致しないユーザ意図を得るリスクが低減される。したがって、ユーザ意図識別はより正確であり、マシンは、このより正確な意図に応じて正確に応答することができるため、ユーザに対してより良好な体験をもたらす。
実施形態2
この実施形態では、主に、発言中の単語セグメントに対してエンティティラベリングを実施する方法について説明を行う。この実施形態における解決策は、実施形態1に基づいて実装されてもよいし、分析対象の発言の履歴ベクトルが決定された後に実装されてもよい。
本開示の実施形態において、ユーザ意図の識別に加え、正確な応答をするために、ユーザの質問中のエンティティを識別し、ラベリングする必要がある。具体的には、上述の天気の質問のシナリオでは、エンティティラベリングは以下の表1に示される。表1は、ユーザ意図の識別のための概略的な表である。
Figure 2020537777
表の1行目は、発言の単語セグメント化を示し、2行目はラベリングを示す。「BIO」システムでは、Bはエンティティの開始を識別し、Iはエンティティの中間を識別し、Oは無意味である。上述のエンティティがラベリングされた後、以下と類似する応答を行うことができる。
Q1:明日のウルムチの天気はどうですか?
A1:明日のウルムチは曇りのち晴れで、気温は12〜20度になります。
Q2:明後日はどうですか?
A2:明後日のウルムチは曇りで、気温は12〜18度になります。
Q3:上海はどうですか?
A3:明後日の上海は雨で、気温は15〜17度になります。
上述のエンティティラベリングも、履歴発言の意味論上の意味を参照して実施される必要がある。そうでなければ、Q2およびQ3に正確に回答することはできない。
履歴発言の意味論上の意味を考慮することに加え、履歴発言の位置関係も考慮する必要がある。異なる位置にある履歴発言は、異なる結果を生み出す場合がある。以下のシナリオについて検討する。
Q:Zhao Weiが出演した映画は?
A:...
Q:Jay Chouは?
Q:Xu Songが歌った歌は?
A:...
Q:Jay Chouは?
「Jay Chouは?」は、2つの一連の問答の両方に存在する。履歴情報が考慮されないと、「Jay Chou」という単語をどのようにラベリングするか完全に手掛かりがないが、履歴情報が考慮され、かつ履歴情報の位置も参照されると、モデルは明確に、1回目のJay ChouをB−役者としてラベリングし、2回目のJay ChouをB−歌手としてラベリングすることができる。位置が考慮されないと、2つ目の一連の問答におけるJay Chouが誤ってB−役者としてラベリングされる場合がある。
ユーザ意図識別について与えられた理由と同じ理由に基づいて、履歴発言の意味論上の意味および履歴発言の位置情報が参照されない場合、従来の方法でのエンティティラベリングの精度は比較的低くなる。さらに、意図識別およびエンティティラベリングは別々に実施されるため、リソースを共有することができず、意図識別およびエンティティラベリングを同期して実施することができない。その結果、マシンは、意図識別およびエンティティラベリングを別々に実施するために2倍の時間を掛ける必要があり、これはリソースの浪費および効率の低下をもたらす。
複数の一連のセッションにおけるユーザ意図に応答する際のエンティティラベリングの機能を考慮すると、分析対象の発言の発言ベクトルおよび複数の履歴発言の発言ベクトルに従い、分析対象の発言の履歴ベクトルが決定された後に、分析対象の発言中の単語セグメントのエンティティタイプを決定するための方法が、本開示の別の実施形態において提供される。
本開示の実施形態における分析対象の発言の単語セグメントのエンティティタイプの決定を、図4を参照して以下に紹介する。分析対象の発言の単語セグメントのエンティティタイプの決定において、分析対象の発言は、少なくとも1つの単語セグメントを含む。第1の単語セグメントのエンティティタイプの決定は、その後の参照および解決策の紹介を容易にするために例示される。第1の単語セグメントは、少なくとも1つの単語セグメントのうちの1つであり、他の単語セグメントと連続関係を持たない。別の単語セグメントのエンティティタイプの決定プロセスは、第1の単語セグメントのエンティティタイプの決定プロセスと同じであり、詳細はここで再度説明しない。S102を通して分析対象の発言の履歴ベクトルを決定した後、本方法は、以下の段階を含む。
S401:第1の単語セグメントの単語ベクトルを決定する。
したがって、発言中に含まれる単語セグメントのエンティティタイプがラベリングされる前に、まず発言を分解して少なくとも1つの単語セグメントを取得する必要がある。単語セグメントは、意味のあるエンティティであってもよいし、無意味な補助的な単語であってもよい。単語セグメントは、比較的抽象的な概念であり、マシンが理解することは比較的困難である。したがって、単語セグメントを、マシンが理解できる具体的概念へと変換することが非常に必要とされる。マシンが理解できる概念は、単語ベクトルであってもよい。単語セグメントの単語ベクトルは、単語セグメントをベクトル形態へと変換することにより得られ、単語セグメントのすべての情報を含む。代替的には、単語セグメントが位置している発言において当該単語セグメントより前に他の単語セグメントが存在する場合、単語セグメントの単語ベクトルは、当該単語セグメントのすべての情報に加え、さらに他の単語セグメントのすべての情報を含んでもよい。
本開示の実施形態において、単語ベクトルは、単語セグメントに対してRNN符号化を実施することにより得られてもよい。RNNのメモラビリティに起因して、発言の最後の単語セグメントは、それ以前のすべての単語セグメントの情報を含み、最後の単語セグメントの単語ベクトルを発言の発言ベクトルとして使用することができる。具体的に、最新の分析対象の発言にn個の単語セグメントが存在し、nが1より大きいか1に等しい正の整数である場合、単語ベクトルc,c...cをRNN符号化により得ることができる。
単語セグメントに対してRNN符号化が実施される前に、まず単語セグメントを符号化してもよく、単語セグメントは一定寸法の空間にマッピングされる。この空間において、意味論上の意味をより良好に表現するために、意味が類似している単語セグメントは互いに近接している。本開示の実施形態において、Word2vec符号化方法が採用されており、また、one−hot符号化等の別の符号化方法が採用されてもよい。符号化方法は、本開示の実施形態の実装に影響しない。
S402:第1の単語セグメントの履歴ベクトルおよび単語ベクトルに従い、第1の単語セグメントの融合単語ベクトルを決定する。
履歴ベクトルは、S102および/またはS202のベクトルに記載される履歴ベクトルであり、履歴ベクトルを取得するための方法は、第1の実施形態および第2の実施形態における方法と同一であり、詳細はここで再度説明しない。第1の単語セグメントの単語ベクトルは、S401における単語ベクトルである。融合単語ベクトルは、最新の単語ベクトルに含まれる情報および履歴ベクトルに含まれる情報を統合することにより得られる新たなベクトルである。履歴ベクトルに含まれる情報および最新の単語ベクトルに含まれる情報の統合は、有効な参照可能な情報の集約および無関係な情報の除去として理解されてよい。
この融合は、履歴ベクトルの情報および最新の単語ベクトルの情報の統合プロセスである。複数の融合方法が存在し、これらは本開示において限定されない。融合は、ベクトルを加算することによって実施されてもよいし、融合は、ベクトルの内積または行列によって実施されてもよいし、あるいは情報を統合するための他の方法によって実施されてもよい。融合方法は、本開示の実施形態の実装に影響しない。
融合ベクトルの決定の機能は、履歴ベクトルに含まれる情報および最新の単語ベクトルに含まれる情報を統合して、最新の単語セグメント、すなわち第1の単語セグメントを分類すること、または履歴情報を参照してエンティティタイプを決定することである。このようにして、文脈を参照せずに最新の発言のみを考慮することにより引き起こされる、単語セグメントをラベリングする精度が比較的低いという先行技術の問題が回避される。一方で、融合単語ベクトルは、履歴ベクトルに従って計算される。この履歴ベクトルは、ユーザ意図の識別プロセスにおいて計算されており、エンティティタイプを決定するときにこれを直接使用することができることにより、リソースの共有が達成される。さらに、ユーザ意図識別プロセスおよびエンティティタイプラベリングプロセスは互いに干渉することはなく、同期的に実施することができ、それにより、計算効率が向上し、ユーザに対する応答に要する時間が短縮され、より良好なユーザ体験効果が達成される。
例えば、最新の分析対象の発言は3つの単語セグメントを有し、これらの単語セグメントの単語ベクトルはそれぞれ、c、c、およびcであり、履歴ベクトルはhである。3つの単語セグメントに対応する融合ベクトルは、c+h、c+h、およびc+hであってよい。単語ベクトルの融合プロセスは、ユーザ意図識別プロセスにおけるベクトルを融合するプロセスと同期して実施されてもよく、それにより、計算効率が向上する。当然ながら、この例における融合単語ベクトルは、説明の利便性のために単純な加算により得られた融合単語ベクトルである。具体的には、実際の適用において、異なる適用シナリオに応じて異なる融合モデルを確立して、より正確な融合単語ベクトルを得て、単語セグメントのエンティティタイプをより正確に決定してもよい。
S403:第1の単語セグメントの融合単語ベクトルに従い、第1の単語セグメントのエンティティタイプを決定する。
第1の単語セグメントの融合単語ベクトルに従った第1の単語セグメントのエンティティタイプの決定は、融合単語ベクトルに含まれる情報を参照して、複数のエンティティタイプの中で、第1の単語セグメントとの関連度が最も高いエンティティタイプを決定することと見なされてよい。関連度は、単語の意味および位置関係を参照して得た関連度であってよい。
融合単語ベクトルを通した第1の単語セグメントのエンティティタイプの決定の機能は、融合単語ベクトル中の履歴情報を参照して単語セグメントのエンティティタイプをより正確に決定して、文脈を参照せずにエンティティタイプが誤ってラベリングされるという先行技術における問題を解消することができることである。
具体的には、本開示の実施形態において、融合単語ベクトルは、マッピングモジュールを介して異なるエンティティタイプのモジュールにマッピングされてもよく、様々なエンティティタイプのモジュールのスコアが得られる。スコアが最も高いモジュールのエンティティタイプが、第1の単語セグメントのエンティティタイプである。第1の単語セグメントのエンティティタイプを決定するための方法はマッピングに限定されず、エンティティタイプを決定するために他の方法を使用してもよい。決定方法は、本開示の実施形態の実装に影響しない。
例えば、単語セグメントの融合単語ベクトルは、о=c+hである。事前にn種類の考えられるエンティティタイプが取得され、それぞれ、x,x,...xで表される。例えば、B−日、B−場所、およびB−歌手が含まれてよい。マシンは、融合単語ベクトルоをn種類のエンティティタイプにマッピングし、様々なエンティティタイプのスコアを得る。оに対応する様々なエンティティタイプのスコアは、b11,b12,...b1nであり、様々なエンティティタイプのスコアは別々に合計され、スコアが最も高いエンティティタイプが、その単語セグメントのエンティティタイプである。
S403では、複数のエンティティタイプから、あるエンティティタイプを決定する作業量は比較的重い。複数の単語セグメントを有する発言において、本明細書では第1の単語セグメントおよび第2の単語セグメントを含む発言を例にとり、第1の単語セグメントが第2の単語セグメントの後に位置し、かつ第2の単語セグメントのタイプが無意味を意味するOである場合、「Oの後には、IではなくOまたはBが続かなければならない」という依存関係に従い、第1の単語セグメントのタイプがIであることは除外される。依然としてステップS303に従って決定が実施される場合、不必要な時間が浪費され、間違った結果が得られる場合があるため、効率が低下する。
複数の単語セグメントを有する発言中の単語セグメント間のエンティティタイプ依存関係を知らないことにより引き起こされる、エンティティタイプ識別精度の低さおよび低効率という問題を解消するために、S403に以下の改善を施してもよい。
第1の単語セグメントのエンティティタイプは、第1の単語セグメントの融合単語ベクトル、第2の単語セグメントの融合単語ベクトル、および事前学習したエンティティタイプ依存関係に従って決定される。
融合単語ベクトルに従ったエンティティタイプの決定は、本質的には、融合単語ベクトルを参照して、複数のエンティティタイプから単語セグメントとの関連度が最も高いエンティティタイプを選択するプロセスである。次に、事前学習したエンティティタイプ依存関係に従い、まず選択範囲を縮小することができ、それにより、計算量を減らし、モデルの複雑さを低減し、効率を向上させることができる。したがって、応答時間をさらに短縮することができるため、より良好なユーザ体験がもたらされる。3秒の応答時間と10分の応答時間とでは、ユーザ体験に非常に大きい違いがあることは明らかである。したがって、エンティティタイプ依存関係を加えることにより、エンティティタイプの決定が大きく向上する。
当業者であれば、上述の方法の実施形態のステップのすべてまたはその一部は、関連するハードウェアに命令するプログラムによって実装され得ることを理解することができる。前述のプログラムは、方法のステップに対応する機能モジュールを含む。プログラムが実行されると、上述の方法の実施形態のステップが実施される。
プログラムは、図5に示されるように、単語符号化モジュール501、履歴メモリコンポーネント502、最新の発言の処理コンポーネント503、関連度計算コンポーネント504、および意図識別コンポーネント505を含んでよい。エンティティラベリングのためにエンティティラベリングコンポーネントをさらに加えてもよい。当然ながら、本開示の他の実装において、上述の方法の実施形態のステップを実施するために他の機能モジュールも使用してもよく、これは本開示において限定されない。
単語符号化モジュールは主に、発言の単語セグメントを符号化し、その結果、好都合なことに、履歴メモリコンポーネントおよび最新の発言の処理コンポーネントは、符号化された単語セグメントに対してRNN符号化を実施して、履歴発言の発言ベクトルおよび分析対象の発言の発言ベクトルをそれぞれ得る。履歴メモリコンポーネントはまた、後戻りする発言の個数を指定してもよい。分析対象の発言が位置するセッションにおいて、ユーザによって入力される発言の個数が多い場合、後戻りする発言の個数が指定される。例えば、後戻りする発言の個数が5に指定されると、分析対象の発言の前の5つの発言が分析対象の発言の履歴発言として使用され、その5つの発言の前の発言は無視されることになり、RNN符号化を受けない。履歴発言の数の低減により、履歴ベクトルの計算の複雑さを効果的に低減することができ、それにより、計算効率が向上する。主要な計算コンポーネントは、一方で、履歴メモリコンポーネント内の履歴発言の発言ベクトルおよび最新の発言の処理コンポーネント内の分析対象の発言の発言ベクトルに従い、履歴発言と分析対象の発言との間の意味的類似性を得るが、他方で、様々な履歴発言の位置を符号化して位置の重みを得て、意味的類似性および位置の重みを融合して履歴ベクトルを得る。履歴ベクトルをより直感的に表すために、履歴ベクトルをさらに正規化してもよい。関連度計算コンポーネントは、実際にはステップS102またはステップS201+S202を実施する。意図識別コンポーネントは、関連度計算コンポーネント内の履歴ベクトルおよび最新の発言の処理コンポーネント内の分析対象の発言の発言ベクトルに従い、複数の意図から最新の分析対象の発言のユーザ意図を識別する、すなわち、ステップS103を実施する。
エンティティラベリング機能を実装するために、上記に加え、エンティティラベリングコンポーネントもプログラムに加えてよい。図6に示されるように、エンティティラベリングコンポーネント606は、関連度計算コンポーネント504および最新の発言の処理コンポーネント503に別々に接続される。関連度計算コンポーネント504によって出力された履歴ベクトルおよび最新の発言の処理コンポーネント503によって出力された単語ベクトルを、エンティティラベリングコンポーネント606の入力として使用することができる。
図7を参照して履歴メモリコンポーネントについて以下に説明する。履歴メモリコンポーネントの構造は以下のとおりである。
履歴メモリコンポーネントは主に、履歴発言入力モジュール、エンコーダモジュール、および発言ベクトル出力モジュールを含む3つのモジュールに分割されている。分析対象の発言の履歴発言は履歴発言入力モジュールに入力され、エンコーダは履歴質問に対してRNN符号化を実施し、発言ベクトル出力モジュールは、符号化後にエンコーダにより得られた発言ベクトルを出力する。
天気の質問の適用シナリオを例として履歴メモリコンポーネントを以下に例示する。
まず、履歴発言が入力される。
s1:明日のウルムチの天気はどうですか?
s2:明後日はどうですか?
s3:杭州にはどんな景勝地がありますか?
次に、RNNメモリエンコーダは入力された履歴質問を符号化して、様々な履歴質問の出力ベクトルm、m、およびmを得る。
最後に、発言ベクトル出力モジュールは履歴発言の発言ベクトルm、m、およびmを出力する。
図8を参照して最新の発言の処理コンポーネントについて以下に説明する。最新の発言の処理コンポーネントの構造は以下のとおりである。
最新の発言の処理コンポーネントは主に、最新の発言の入力モジュール、エンコーダモジュール、および単語ベクトル出力モジュールを含む3つのモジュールに分割されている。単語セグメント化された分析対象の発言は最新の発言の入力モジュールに入力され、エンコーダモジュールは、最新の発言、すなわち分析対象の発言に対してリカレントニューラルネットワーク符号化を実施して、様々な単語セグメントに対応する単語ベクトルを取得する。ここで、最後の単語ベクトルが最新の発言の発言ベクトルである。
天気の質問における「上海はどうですか?」という発言を例として、最新の発言の処理モジュールを以下に例示する。
まず、単語セグメント化された最新の発言が入力される。上海/は/どうですか?
次に、エンコーダは入力モジュール内の単語セグメントに対してリカレントニューラルネットワーク符号化を実施して、様々な単語セグメントに対応する単語ベクトル、すなわち、c、c、およびcを得る。
最後に、出力モジュールは、最新の発言における様々な単語セグメントに対応する単語ベクトルを出力する。cは、発言の発言ベクトルでもあることに留意すべきである。
意図識別コンポーネントについて以下に説明する。
意図識別コンポーネントは主に、入力モジュール、マッピングモジュール、および意図取得モジュールを含む3つのモジュールに分割されている。最新の発言の履歴情報を有する融合ベクトルが入力モジュールに入力される。融合ベクトルは、マッピングモジュールにより意図取得モジュール内の様々なカテゴリにマッピングされ、意図取得モジュールは、様々なカテゴリのスコアに応じて判断を行い、ユーザ意図を決定する。マッピングモジュールは、意図識別コンポーネントのコアモジュールである。図2を参照して、マッピングモジュールについて以下に説明する。
例えば、図2では、2つの融合ベクトル、すなわちоおよびоが存在する。意図取得モジュール内には複数のカテゴリが存在し、それぞれ、x,x...xで表される。マッピングモジュールは、оおよびоをx,x...xにマッピングして、x,x...xのスコアを得る。意図取得モジュールは、スコアが最も高いカテゴリを最新の発言の意図として選択する。例えば、融合ベクトルоについて、xのスコアが最も高い場合、xが分析対象の発言のユーザ意図である。
エンティティラベリングコンポーネントは、実際にはステップS302およびS303を実施し、ステップS301は、最新の発言の処理コンポーネントによって実施される。エンティティラベリングコンポーネントは、最新の発言の処理コンポーネントにおける単語ベクトルおよび関連度計算コンポーネントにおける履歴ベクトルに従って融合単語ベクトルを得た後に、融合単語ベクトルに従って単語セグメントのエンティティタイプを決定する。
図9を参照して、エンティティラベリングコンポーネントについて以下に説明する。エンティティラベリングコンポーネントの構造は、以下のとおりである。
エンティティラベリングコンポーネントは主に、最新の発言の入力モジュール、エンコーダモジュール、単語ベクトル出力モジュール、単語ベクトル融合モジュール、フル接続モジュール、CRFモジュール、およびエンティティラベリングモジュールを含む。最新の発言の入力モジュールは、単語セグメント化された最新の発言を入力する。最新の発言の入力モジュール、エンコーダモジュール、単語ベクトル出力モジュール、および最新の発言の処理コンポーネントは、共有することができる。単語ベクトル融合モジュールは、単語ベクトルおよび履歴ベクトルを融合して、融合単語ベクトルを得る。フル接続モジュールは融合単語ベクトルの特徴を組み合わせ、組み合わされた特徴がCRFモジュールに入って全体的な特徴とラベリング結果との間のネットワーク影響、すなわち、「Oの後には、IではなくOまたはBが続かなければならない」といったエンティティ間の依存関係を学習する。各単語の最終的なラベルスコアが出力され、システムは、スコアが最も高いラベルを、最新の単語の最終的なラベルとして選択する。
上述の実施形態に提供される、発言のユーザ意図を識別するための方法に基づき、図10に示されるように、発言のユーザ意図を識別するための装置が本開示の実施形態においてさらに提供される。図10は、本開示の一実施形態に係る、発言のユーザ意図を識別するための装置のブロック図であり、本装置は、HCIセッションにおいて適用することができる。HCIセッションは、複数の発言を含む。本装置は、取得ユニット1001と、第1の決定ユニット1002と、第2の決定ユニット1003とを含み、取得ユニット1001は、複数の発言から、分析対象の発言および分析対象の発言に対応する少なくとも1つの履歴発言を取得し、少なくとも1つの履歴発言は、HCIセッションにおいて分析対象の発言の前に出現する発言であり、第1の決定ユニット1002は、分析対象の発言の発言ベクトルおよび少なくとも1つの履歴発言の発言ベクトルに従い、分析対象の発言の履歴ベクトルを決定し、履歴ベクトルは、少なくとも1つの履歴発言における分析対象の発言と関連する情報を含み、第2の決定ユニット1003は、履歴ベクトルに従い、分析対象の発言のユーザ意図を決定する。
一実施形態において、複数の分析対象の発言が存在し、複数の分析対象の発言は、複数の発言のうち、対話順序における最後の複数の発言である。
一実施形態において、少なくとも1つの履歴発言と分析対象の発言との間の発言間隔は、事前設定閾値より小さい。
一実施形態において、第1の決定ユニット1002は、意味的類似性決定サブユニットと、位置関係決定サブユニットと、履歴ベクトル決定サブユニットとを含む。意味的類似性決定サブユニットは、少なくとも1つの履歴発言が複数の履歴発言を含み、かつ複数の履歴発言が第1の履歴発言および第2の履歴発言を含むとき、分析対象の発言の発言ベクトル、第1の履歴発言の発言ベクトル、および第2の履歴発言の発言ベクトルに従い、分析対象の発言に対する第1の履歴発言の意味的類似性および分析対象の発言に対する第2の履歴発言の意味的類似性を決定する。位置関係決定サブユニットは、HCIセッションにおける、第1の履歴発言と分析対象の発言との間の出現位置関係、ならびに第2の履歴発言と分析対象の発言との間の出現位置関係を決定する。履歴ベクトル決定サブユニットは、第1の履歴発言の意味的類似性、第2の履歴発言の意味的類似性、第1の履歴発言の出現位置関係、および第2の履歴発言の出現位置関係に従い、分析対象の発言の履歴ベクトルを決定する。
一実施形態において、第2の決定ユニット1003は、融合ベクトル決定サブユニットおよびユーザ意図決定サブユニットを含み、融合ベクトル決定サブユニットは、分析対象の発言の履歴ベクトルおよび発言ベクトルに従い、分析対象の発言の融合ベクトルを決定し、ユーザ意図決定サブユニットは、融合ベクトルに従い、分析対象の発言のユーザ意図を決定する。
一実施形態において、融合ベクトル決定サブユニットは、分析対象の発言の履歴ベクトルおよび発言ベクトルを加重加算して、分析対象の発言の融合ベクトルを得る。
一実施形態において、ユーザ意図決定サブユニットは、マッピングサブユニットおよび決定サブユニットを含み、マッピングサブユニットは、融合ベクトルを複数の事前設定されたユーザ意図にマッピングし、決定サブユニットは、複数のユーザ意図へのマッピング結果に従い、複数のユーザ意図から分析対象の発言のユーザ意図を決定する。
一実施形態において、本装置はさらに、第3の決定ユニット、第4の決定ユニット、および第5の決定ユニットを含み、第3の決定ユニットは、少なくとも1つ単語セグメントのうちの1つである第1の単語セグメントの単語ベクトルを決定し、第4の決定ユニットは、第1の単語セグメントの履歴ベクトルおよび単語ベクトルに従い、第1の単語セグメントの融合単語ベクトルを決定し、第5の決定ユニットは、第1の単語セグメントの融合単語ベクトルに従い、第1の単語セグメントのエンティティタイプを決定する。
一実施形態において、第5の決定ユニットは、分析対象の発言が複数の単語セグメントを含む場合、第1の単語セグメントの融合単語ベクトル、複数の単語セグメントのうちの1つである第2の単語セグメントの融合単語ベクトル、および事前学習したエンティティタイプ依存関係に従い、第1の単語セグメントのエンティティタイプを決定する。
本開示の実施形態における、発言のユーザ意図を識別するための装置について、モジュラー機能エンティティの観点から上記に説明した。発言のユーザ意図を識別するためのデバイスが、本開示の実施形態にさらに提供される。本開示の一実施形態における、発言のユーザ意図を識別するためのデバイスについて、ハードウェアの観点から以下に説明する。
図11は、本開示の一実施形態に係る、発言のユーザ意図を識別するためのデバイスを示す。本デバイスは、HCIセッションにおいて適用され、HCIセッションは、複数の発言を含む。図11を参照すると、デバイス1100は、プロセッサ1102およびメモリ1101を含む。メモリ1101は、プログラムコードを記憶し、かつプログラムコードをプロセッサに送信する。プロセッサ1102は、プログラムコード中の命令に応じて、複数の発言から、分析対象の発言および分析対象の発言に対応する少なくとも1つの履歴発言を取得する段階であって、少なくとも1つの履歴発言が、HCIセッションにおいて分析対象の発言の前に出現する発言である、段階と、分析対象の発言の発言ベクトルおよび少なくとも1つの履歴発言の発言ベクトルに従い、分析対象の発言の履歴ベクトルを決定する段階であって、履歴ベクトルが、少なくとも1つの履歴発言における分析対象の発言と関連する情報を含む、段階と、履歴ベクトルに従い、分析対象の発言のユーザ意図を決定する段階とを含む方法を実施する。
一実施形態において、複数の分析対象の発言が存在し、複数の分析対象の発言は、複数の発言のうち、対話順序における最後の複数の発言である。
一実施形態において、少なくとも1つの履歴発言と分析対象の発言との間の発言間隔は、事前設定閾値より小さい。
一実施形態において、プロセッサ1102は、プログラムコード中の命令に応じて、分析対象の発言の発言ベクトル、第1の履歴発言の発言ベクトル、および第2の履歴発言の発言ベクトルに従い、分析対象の発言に対する第1の履歴発言の意味的類似性および分析対象の発言に対する第2の履歴発言の意味的類似性を決定する段階と、HCIセッションにおける、第1の履歴発言と分析対象の発言との間の出現位置関係、ならびに第2の履歴発言と分析対象の発言との間の出現位置関係を決定する段階と、第1の履歴発言の意味的類似性、第2の履歴発言の意味的類似性、第1の履歴発言の出現位置関係、および第2の履歴発言の出現位置関係に従い、分析対象の発言の履歴ベクトルを決定する段階とを含む方法を実施する。
一実施形態において、プロセッサ1102は、プログラムコード中の命令に応じて、分析対象の発言の履歴ベクトルおよび発言ベクトルに従い、分析対象の発言の融合ベクトルを決定する段階と、融合ベクトルに従い、分析対象の発言のユーザ意図を決定する段階とを含む方法を実施する。
一実施形態において、プロセッサ1102は、プログラムコード中の命令に応じて、分析対象の発言の履歴ベクトルおよび発言ベクトルを加重加算して、分析対象の発言の融合ベクトルを取得する段階を含む方法を実施する。
一実施形態において、プロセッサ1102は、プログラムコード中の命令に応じて、融合ベクトルを複数の事前設定されたユーザ意図にマッピングする段階と、複数のユーザ意図へのマッピング結果に従い、複数のユーザ意図から分析対象の発言のユーザ意図を決定する段階とを含む方法を実施する。
一実施形態において、プロセッサ1102はさらに、プログラムコード中の命令に応じて、少なくとも1つ単語セグメントのうちの1つである第1の単語セグメントの単語ベクトルを決定する段階と、第1の単語セグメントの履歴ベクトルおよび単語ベクトルに従い、第1の単語セグメントの融合単語ベクトルを決定する段階と、第1の単語セグメントの融合単語ベクトルに従い、第1の単語セグメントのエンティティタイプを決定する段階とを含む方法を実施する。
一実施形態において、プロセッサ1102はさらに、プログラムコード中の命令に応じて、第1の単語セグメントの融合単語ベクトル、複数の単語セグメントのうちの1つである第2の単語セグメントの融合単語ベクトル、および事前学習したエンティティタイプ依存関係に従い、第1の単語セグメントのエンティティタイプを決定する段階を含む方法を実施する。
上述の実施形態は、ソフトウェア、ハードウェア、ファームウェア、またはそれらの任意の組み合わせによって完全にまたは部分的に実装されてよい。ソフトウェアによって実装される場合、上述の実施形態は、コンピュータプログラム製品の形態で完全にまたは部分的に実装されてよい。
コンピュータプログラム製品は、1つまたは複数のコンピュータ命令を含む。コンピュータプログラム命令がコンピュータにロードされて実行されると、本発明の実施形態において説明されたプロセスまたは機能が完全にまたは部分的にもたらされる。コンピュータは、汎用コンピュータ、専用コンピュータ、コンピュータネットワーク、または任意の他のプログラマブルデバイスであってよい。コンピュータ命令は、コンピュータ可読記憶媒体に記憶されてもよいし、あるコンピュータ可読記憶媒体から別のコンピュータ可読記憶媒体に送信されてもよい。例えば、コンピュータ命令は、有線手段(例えば、同軸ケーブル、光ファイバ、もしくはデジタル加入者回線(DSL))、または無線手段(例えば、赤外線、電波、もしくはマイクロ波)によって、あるウェブサイト、コンピュータ、サーバ、またはデータセンターから、別のウェブサイト、コンピュータ、サーバ、またはデータセンターに送信されてよい。コンピュータ可読記憶媒体は、コンピュータがアクセス可能な任意の利用可能な媒体、またはサーバなどのデータ記憶デバイス、および統合された1つまたは複数の利用可能な媒体を含むデータセンターであってよい。利用可能媒体は、磁気媒体(例えば、フロッピーディスク、ハードディスク、もしくは磁気テープ)、光学式媒体(例えば、DVD)、または半導体媒体(例えば、ソリッドステートディスク(SSD))等であってよい。
本明細書の実施形態は漸進的に説明されており、異なる実施形態間での同一または類似する部分について、それらの実施形態の各々において他の実施形態との相違点に焦点を当てられるように、互いを参照している場合があることに留意すべきである。特に、デバイスおよびシステムの実施形態は方法の実施形態と実質的に類似しているため、比較的簡潔に説明されており、関連する部分については方法の実施形態の説明を参照することができる。上記のデバイスおよびシステムの実施形態は例示にすぎず、別個のコンポーネントとして説明されているユニットは物理的に離れていてもいなくてもよく、ユニットとして表示されているコンポーネントは物理的なユニットであってもなくてもよく、すなわち、それらのコンポーネントは同じ場所に位置してもよいし、複数のネットワークユニットに分散されていてもよい。この実施形態の解決策の目的は、実際の要件に応じてモジュールの一部またはすべてを選択することによって実装されてよい。当業者は、創造的な努力を伴わずに本開示を理解し、実施することができる。
上記の説明は本開示の具体的な実装例に過ぎず、本開示の保護範囲はこれに限定されない。当業者は、本開示により開示される技術範囲内の変更または置換を容易に想到することができ、これらの変更または置換はすべて本開示の保護範囲内に含まれるべきである。したがって、本開示の保護範囲は、特許請求の範囲の保護範囲に従うべきである。

Claims (13)

  1. HCIセッションにおいて適用される、発言のユーザ意図を識別するための方法であって、前記HCIセッションが複数の発言を含み、前記方法が、
    前記複数の発言から、分析対象の発言および前記分析対象の発言に対応する少なくとも1つの履歴発言を取得する段階であって、前記少なくとも1つの履歴発言が、前記HCIセッションにおいて前記分析対象の発言の前に出現する発言である、段階と、
    前記分析対象の発言の発言ベクトルおよび前記少なくとも1つの履歴発言の発言ベクトルに従い、前記分析対象の発言の履歴ベクトルを決定する段階であって、前記履歴ベクトルが、前記少なくとも1つの履歴発言における前記分析対象の発言と関連する情報を含む、段階と、
    前記履歴ベクトルに従い、前記分析対象の発言のユーザ意図を決定する段階と、
    を含む、方法。
  2. 複数の分析対象の発言が存在し、前記複数の分析対象の発言が、前記複数の発言のうち、対話順序における最後の複数の発言である、請求項1に記載の方法。
  3. 前記少なくとも1つの履歴発言と前記分析対象の発言との間の発言間隔が、事前設定閾値より小さい、請求項1に記載の方法。
  4. 前記少なくとも1つの履歴発言が複数の履歴発言を含む場合、前記複数の履歴発言は、第1の履歴発言および第2の履歴発言を含み、前記分析対象の発言の発言ベクトルおよび前記少なくとも1つの履歴発言の発言ベクトルに従い、前記分析対象の発言の履歴ベクトルを決定する前記段階は、
    前記分析対象の発言の前記発言ベクトル、前記第1の履歴発言の発言ベクトル、および前記第2の履歴発言の発言ベクトルに従い、前記分析対象の発言に対する前記第1の履歴発言の意味的類似性および前記分析対象の発言に対する前記第2の履歴発言の意味的類似性を決定する段階と、
    前記HCIセッションにおける、前記第1の履歴発言と前記分析対象の発言との間の出現位置関係、ならびに前記第2の履歴発言と前記分析対象の発言との間の出現位置関係を決定する段階と、
    前記第1の履歴発言の前記意味的類似性、前記第2の履歴発言の前記意味的類似性、前記第1の履歴発言の前記出現位置関係、および前記第2の履歴発言の前記出現位置関係に従い、前記分析対象の発言の前記履歴ベクトルを決定する段階と
    を含む、請求項1に記載の方法。
  5. 前記履歴ベクトルに従い、前記分析対象の発言のユーザ意図を決定する前記段階が、
    前記分析対象の発言の前記履歴ベクトルおよび前記発言ベクトルに従い、前記分析対象の発言の融合ベクトルを決定する段階と、
    前記融合ベクトルに従い、前記分析対象の発言の前記ユーザ意図を決定する段階と
    を含む、請求項1から4のいずれか1項に記載の方法。
  6. 前記分析対象の発言の前記履歴ベクトルおよび前記発言ベクトルに従い、前記分析対象の発言の融合ベクトルを決定する前記段階が、
    前記分析対象の発言の前記履歴ベクトルおよび前記発言ベクトルを加重加算して、前記分析対象の発言の前記融合ベクトルを得る段階を含む、請求項5に記載の方法。
  7. 前記融合ベクトルに従い、前記分析対象の発言の前記ユーザ意図を決定する前記段階が、
    前記融合ベクトルを複数の事前設定されたユーザ意図にマッピングする段階と、
    前記複数の事前設定されたユーザ意図へのマッピング結果に従い、前記複数の事前設定されたユーザ意図から前記分析対象の発言の前記ユーザ意図を決定する段階と
    を含む、請求項5に記載の方法。
  8. 前記分析対象の発言が少なくとも1つの単語セグメントを含み、前記分析対象の発言の前記発言ベクトルおよび前記少なくとも1つの履歴発言の前記発言ベクトルに従い、前記分析対象の発言の前記履歴ベクトルを決定した後に、前記方法がさらに、
    第1の単語セグメントの単語ベクトルを決定する段階であって、前記第1の単語セグメントが前記少なくとも1つの単語セグメントのうちの1つである、段階と、
    前記第1の単語セグメントの前記履歴ベクトルおよび前記単語ベクトルに従い、前記第1の単語セグメントの融合単語ベクトルを決定する段階と、
    前記第1の単語セグメントの前記融合単語ベクトルに従い、前記第1の単語セグメントのエンティティタイプを決定する段階と
    を含む、請求項1に記載の方法。
  9. 前記分析対象の発言が複数の単語セグメントを含む場合、前記第1の単語セグメントの前記融合単語ベクトルに従い、前記第1の単語セグメントのエンティティタイプを決定する前記段階が、
    前記第1の単語セグメントの前記融合単語ベクトル、第2の単語セグメントの融合単語ベクトル、および事前学習したエンティティタイプ依存関係に従い、前記第1の単語セグメントの前記エンティティタイプを決定する段階を含み、前記第2の単語セグメントが前記複数の単語セグメントのうちの1つである、請求項8に記載の方法。
  10. HCIセッションにおいて適用される、発言のユーザ意図を識別するための装置であって、前記HCIセッションが複数の発言を含み、前記装置が、取得ユニットと、第1の決定ユニットと、第2の決定ユニットとを備え、
    前記取得ユニットが、前記複数の発言から、分析対象の発言および前記分析対象の発言に対応する少なくとも1つの履歴発言を取得し、前記少なくとも1つの履歴発言は、前記HCIセッションにおいて前記分析対象の発言の前に出現する発言であり、
    前記第1の決定ユニットが、前記分析対象の発言の発言ベクトルおよび前記少なくとも1つの履歴発言の発言ベクトルに従い、前記分析対象の発言の履歴ベクトルを決定し、前記履歴ベクトルは、前記少なくとも1つの履歴発言における前記分析対象の発言と関連する情報を含み、
    前記第2の決定ユニットが、前記履歴ベクトルに従い、前記分析対象の発言のユーザ意図を決定する、装置。
  11. HCIセッションにおいて適用される、発言のユーザ意図を識別するためのデバイスであって、前記HCIセッションが複数の発言を含み、前記デバイスがプロセッサおよびメモリを含み、
    前記メモリが、プログラムコードを記憶し、かつ前記プログラムコードを前記プロセッサに送信し、
    前記プロセッサが、前記プログラムコード中の命令に従い、
    前記複数の発言から、分析対象の発言および前記分析対象の発言に対応する少なくとも1つの履歴発言を取得する段階であって、前記少なくとも1つの履歴発言が、前記HCIセッションにおいて前記分析対象の発言の前に出現する発言である、段階と、
    前記分析対象の発言の発言ベクトルおよび前記少なくとも1つの履歴発言の発言ベクトルに従い、前記分析対象の発言の履歴ベクトルを決定する段階であって、前記履歴ベクトルが、前記少なくとも1つの履歴発言における前記分析対象の発言と関連する情報を含む、段階と、
    前記履歴ベクトルに従い、前記分析対象の発言のユーザ意図を決定する段階と
    を含む方法を実施する、デバイス。
  12. 記憶媒体であって、前記記憶媒体がプログラムコードを記憶し、前記プログラムコードが、請求項1から9のいずれか1項に記載の、発言のユーザ意図を識別するための方法を実施するために使用される、記憶媒体。
  13. コンピュータに、請求項1から9のいずれか1項に記載の方法を実施させる、プログラム。
JP2020517103A 2017-10-20 2018-10-16 発言のユーザ意図を識別するための方法および装置 Pending JP2020537777A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201710987004.7 2017-10-20
CN201710987004.7A CN109697282B (zh) 2017-10-20 2017-10-20 一种语句的用户意图识别方法和装置
PCT/CN2018/110395 WO2019076286A1 (zh) 2017-10-20 2018-10-16 一种语句的用户意图识别方法和装置

Publications (1)

Publication Number Publication Date
JP2020537777A true JP2020537777A (ja) 2020-12-24

Family

ID=66174297

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020517103A Pending JP2020537777A (ja) 2017-10-20 2018-10-16 発言のユーザ意図を識別するための方法および装置

Country Status (5)

Country Link
US (1) US11551007B2 (ja)
JP (1) JP2020537777A (ja)
CN (1) CN109697282B (ja)
TW (1) TW201935273A (ja)
WO (1) WO2019076286A1 (ja)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110334340B (zh) * 2019-05-06 2021-08-03 北京泰迪熊移动科技有限公司 基于规则融合的语义分析方法、装置以及可读存储介质
WO2020242383A1 (en) * 2019-05-28 2020-12-03 Active Intelligence Pte Ltd Conversational diaglogue system and method
CN110489740B (zh) * 2019-07-12 2023-10-24 深圳追一科技有限公司 语义解析方法及相关产品
CN110390107B (zh) * 2019-07-26 2023-04-18 腾讯科技(深圳)有限公司 基于人工智能的下文关系检测方法、装置及计算机设备
CN110472029B (zh) * 2019-08-01 2024-03-19 腾讯科技(深圳)有限公司 一种数据处理方法、装置以及计算机可读存储介质
CN110543633B (zh) * 2019-08-29 2021-06-29 腾讯科技(深圳)有限公司 语句意图识别方法、装置
CN111325034A (zh) * 2020-02-12 2020-06-23 平安科技(深圳)有限公司 多轮对话中语义补齐的方法、装置、设备及存储介质
CN111339278B (zh) * 2020-02-28 2023-03-31 支付宝(杭州)信息技术有限公司 训练话术生成模型、生成应答话术的方法和装置
US20210284492A1 (en) * 2020-03-16 2021-09-16 Otis Elevator Company Robot concierge
CN111460118B (zh) * 2020-03-26 2023-10-20 聚好看科技股份有限公司 一种人工智能冲突语义识别方法及装置
CN111428483B (zh) * 2020-03-31 2022-05-24 华为技术有限公司 语音交互方法、装置和终端设备
CN111460302B (zh) * 2020-03-31 2023-08-08 拉扎斯网络科技(上海)有限公司 数据处理方法、装置、电子设备及计算机可读存储介质
CN111611369B (zh) * 2020-05-22 2023-06-20 腾讯科技(深圳)有限公司 基于人工智能的交互方法和相关装置
CN113761183A (zh) * 2020-07-30 2021-12-07 北京汇钧科技有限公司 意图识别方法和意图识别装置
CN111897939B (zh) * 2020-08-12 2024-02-02 腾讯科技(深圳)有限公司 视觉对话方法、视觉对话模型的训练方法、装置及设备
CN112214591B (zh) * 2020-10-29 2023-11-07 腾讯科技(深圳)有限公司 一种对话预测的方法及装置
CN112307304B (zh) * 2020-11-16 2024-04-12 深圳市欢太科技有限公司 热点搜索方法、装置、终端及存储介质
CN112580366B (zh) * 2020-11-30 2024-02-13 科大讯飞股份有限公司 情绪识别方法以及电子设备、存储装置
CN112487164A (zh) * 2020-12-01 2021-03-12 中译语通科技(青岛)有限公司 一种人工智能交互方法
CN112988963B (zh) * 2021-02-19 2024-05-10 平安科技(深圳)有限公司 基于多流程节点的用户意图预测方法、装置、设备及介质
CN113010661A (zh) * 2021-04-22 2021-06-22 中国平安人寿保险股份有限公司 解析语句的方法、装置、设备及存储介质
US11902231B2 (en) * 2022-02-14 2024-02-13 International Business Machines Corporation Dynamic display of images based on textual content

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017173873A (ja) * 2016-03-18 2017-09-28 ヤフー株式会社 情報提供装置および情報提供方法

Family Cites Families (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040236673A1 (en) 2000-10-17 2004-11-25 Eder Jeff Scott Collaborative risk transfer system
US7720835B2 (en) 2006-05-05 2010-05-18 Visible Technologies Llc Systems and methods for consumer-generated media reputation management
US9269068B2 (en) 2006-05-05 2016-02-23 Visible Technologies Llc Systems and methods for consumer-generated media reputation management
CN101506765B (zh) * 2006-11-10 2011-05-25 松下电器产业株式会社 目的推测装置以及目的推测方法
US7996210B2 (en) 2007-04-24 2011-08-09 The Research Foundation Of The State University Of New York Large-scale sentiment analysis
CN101779180B (zh) * 2007-08-08 2012-08-15 贝诺特公司 基于背景的内容推荐的方法和设备
JP2009187384A (ja) * 2008-02-07 2009-08-20 Ntt Resonant Inc 検索装置、検索方法、検索プログラム、および、記録媒体
US7974983B2 (en) 2008-11-13 2011-07-05 Buzzient, Inc. Website network and advertisement analysis using analytic measurement of online social media content
US8166032B2 (en) 2009-04-09 2012-04-24 MarketChorus, Inc. System and method for sentiment-based text classification and relevancy ranking
US9633399B2 (en) 2009-08-19 2017-04-25 Oracle International Corporation Method and system for implementing a cloud-based social media marketing method and system
US8423538B1 (en) 2009-11-02 2013-04-16 Google Inc. Clustering query refinements by inferred user intent
US20120137367A1 (en) 2009-11-06 2012-05-31 Cataphora, Inc. Continuous anomaly detection based on behavior modeling and heterogeneous information analysis
US8954440B1 (en) * 2010-04-09 2015-02-10 Wal-Mart Stores, Inc. Selectively delivering an article
US8495143B2 (en) 2010-10-29 2013-07-23 Facebook, Inc. Inferring user profile attributes from social information
US9536269B2 (en) 2011-01-19 2017-01-03 24/7 Customer, Inc. Method and apparatus for analyzing and applying data related to customer interactions with social media
US8909771B2 (en) 2011-09-15 2014-12-09 Stephan HEATH System and method for using global location information, 2D and 3D mapping, social media, and user behavior and information for a consumer feedback social media analytics platform for providing analytic measurements data of online consumer feedback for global brand products or services of past, present or future customers, users, and/or target markets
US9275342B2 (en) * 2012-04-09 2016-03-01 24/7 Customer, Inc. Method and apparatus for intent modeling and prediction
US9377933B2 (en) 2012-09-24 2016-06-28 Facebook, Inc. Displaying social networking system entity information via a timeline interface
US9652797B2 (en) * 2013-01-18 2017-05-16 24/7 Customer, Inc. Intent prediction based recommendation system using data combined from multiple channels
US9875494B2 (en) * 2013-04-16 2018-01-23 Sri International Using intents to analyze and personalize a user's dialog experience with a virtual personal assistant
EP2994846A4 (en) 2013-05-09 2017-01-25 Moodwire, Inc. Hybrid human machine learning system and method
US8966074B1 (en) 2013-09-13 2015-02-24 Network Kinetix, LLC System and method for real-time analysis of network traffic
US10079013B2 (en) * 2013-11-27 2018-09-18 Sri International Sharing intents to provide virtual assistance in a multi-person dialog
CN104951428B (zh) * 2014-03-26 2019-04-16 阿里巴巴集团控股有限公司 用户意图识别方法及装置
US9043196B1 (en) 2014-07-07 2015-05-26 Machine Zone, Inc. Systems and methods for identifying and suggesting emoticons
CN105824797B (zh) * 2015-01-04 2019-11-12 华为技术有限公司 一种评价语义相似度的方法、装置和系统
US11093971B2 (en) * 2015-02-27 2021-08-17 Keypoint Technologies India Pvt Ltd. Contextual discovery
US9541990B2 (en) * 2015-04-21 2017-01-10 Cypress Semiconductor Corporation Asynchronous transceiver for on-vehicle electronic device
CN105095187A (zh) * 2015-08-07 2015-11-25 广州神马移动信息科技有限公司 一种搜索意图识别方法及装置
US10032463B1 (en) * 2015-12-29 2018-07-24 Amazon Technologies, Inc. Speech processing with learned representation of user interaction history
CN106095950B (zh) * 2016-06-14 2019-06-07 极限元(杭州)智能科技股份有限公司 一种人机对话中教授意图答案生成方法
US10902341B1 (en) * 2016-06-22 2021-01-26 Amazon Technologies, Inc. Machine learning based list recommendations
US11449744B2 (en) * 2016-06-23 2022-09-20 Microsoft Technology Licensing, Llc End-to-end memory networks for contextual language understanding
US11783173B2 (en) * 2016-06-23 2023-10-10 Microsoft Technology Licensing, Llc Multi-domain joint semantic frame parsing
US10546066B2 (en) * 2016-08-31 2020-01-28 Microsoft Technology Licensing, Llc End-to-end learning of dialogue agents for information access
CN106407333B (zh) * 2016-09-05 2020-03-03 北京百度网讯科技有限公司 基于人工智能的口语查询识别方法及装置
JP6727610B2 (ja) * 2016-09-05 2020-07-22 国立研究開発法人情報通信研究機構 文脈解析装置及びそのためのコンピュータプログラム
CN106528530A (zh) * 2016-10-24 2017-03-22 北京光年无限科技有限公司 一种确定句子类型的方法及装置
US10268679B2 (en) * 2016-12-02 2019-04-23 Microsoft Technology Licensing, Llc Joint language understanding and dialogue management using binary classification based on forward and backward recurrent neural network
CN106897263A (zh) * 2016-12-29 2017-06-27 北京光年无限科技有限公司 基于深度学习的机器人对话交互方法及装置
US11880761B2 (en) * 2017-07-28 2024-01-23 Microsoft Technology Licensing, Llc Domain addition systems and methods for a language understanding system

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017173873A (ja) * 2016-03-18 2017-09-28 ヤフー株式会社 情報提供装置および情報提供方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
岩下薫: "対話履歴と事例に基づく発話意図の推定", FIT2006 第5回情報科学技術フォーラム 一般講演論文集 第2分冊, JPN6022037495, 21 August 2006 (2006-08-21), JP, pages 159 - 160, ISSN: 0004867857 *

Also Published As

Publication number Publication date
US11551007B2 (en) 2023-01-10
CN109697282B (zh) 2023-06-06
TW201935273A (zh) 2019-09-01
US20200250378A1 (en) 2020-08-06
CN109697282A (zh) 2019-04-30
WO2019076286A1 (zh) 2019-04-25

Similar Documents

Publication Publication Date Title
JP2020537777A (ja) 発言のユーザ意図を識別するための方法および装置
CN110111780B (zh) 数据处理方法和服务器
CN111737411A (zh) 人机对话中的响应方法、对话系统及存储介质
CN110415679B (zh) 语音纠错方法、装置、设备和存储介质
CN110187780B (zh) 长文本预测方法、装置、设备和存储介质
US20220358292A1 (en) Method and apparatus for recognizing entity, electronic device and storage medium
WO2022160969A1 (zh) 基于多轮对话改进的智能客服辅助系统系统和方法
CN116521841B (zh) 用于生成回复信息的方法、装置、设备及介质
WO2023155678A1 (zh) 用于确定信息的方法和装置
CN111639162A (zh) 信息交互方法和装置、电子设备和存储介质
CN111026840A (zh) 文本处理方法、装置、服务器和存储介质
EP4060517A1 (en) System and method for designing artificial intelligence (ai) based hierarchical multi-conversation system
CN114297361A (zh) 一种基于场景化对话理解的人机交互方法及相关组件
CN113850383A (zh) 文本匹配模型训练方法、装置、电子设备及存储介质
Al-Besher et al. BERT for Conversational Question Answering Systems Using Semantic Similarity Estimation.
CN117421398A (zh) 人机交互方法、装置、设备以及存储介质
CN117370512A (zh) 回复对话的方法、装置、设备及存储介质
CN115270818A (zh) 一种意图识别方法及装置、存储介质、计算机设备
CN114490974A (zh) 信息自动回复方法、装置、系统、电子设备及可读介质
CN114860910A (zh) 智能对话方法及系统
CN111241236B (zh) 任务导向性问答方法、系统、电子设备、可读存储介质
CN114546326A (zh) 一种虚拟人手语生成方法和系统
CN114297380A (zh) 一种数据处理方法、装置、设备及存储介质
CN113836932A (zh) 交互方法、装置和系统,以及智能设备
CN115905490B (zh) 人机交互对话方法、装置以及设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210922

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220829

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220906

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221202

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230307

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20231010