JP7093397B2 - 質問応答ロボットの生成方法および装置 - Google Patents

質問応答ロボットの生成方法および装置 Download PDF

Info

Publication number
JP7093397B2
JP7093397B2 JP2020211025A JP2020211025A JP7093397B2 JP 7093397 B2 JP7093397 B2 JP 7093397B2 JP 2020211025 A JP2020211025 A JP 2020211025A JP 2020211025 A JP2020211025 A JP 2020211025A JP 7093397 B2 JP7093397 B2 JP 7093397B2
Authority
JP
Japan
Prior art keywords
question
robot
answering
category
existing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020211025A
Other languages
English (en)
Other versions
JP2021131846A (ja
Inventor
ツェンユー ジャオ,
シュウキ スン,
ケ スン,
ティンティン リー,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Publication of JP2021131846A publication Critical patent/JP2021131846A/ja
Application granted granted Critical
Publication of JP7093397B2 publication Critical patent/JP7093397B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/374Thesaurus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/043Distributed expert systems; Blackboards

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Manipulator (AREA)

Description

本出願は人工知能技術分野のロボット技術分野に関し、特に質問応答ロボットの生成方法および装置に関する。
人工知能の潮流の推進に伴い、カスタマーサービス、マーケティング、ガイダンスなどの多方面のニーズを満たすためにカテゴリ質問応答ロボットを構築することは、数多くの会社が人工知能時代に向かって邁進する試みとなっている。このようなカテゴリ質問応答ロボットは、顧客と対話し、顧客からの質問に回答することができる。例えば、母子のシーンでは、対応する顧客は、「妊婦はどんな果物を食べられますか」、「妊婦が亜鉛を補充するにはどんな海産物を食べればいいですか」などと質問する可能性があり、これらの質問には、合理的に設定されたカテゴリ質問応答ロボットであれば回答することが可能である。
しかしながら、カテゴリ質問応答ロボットを実際に構築する場合、顧客のニーズを満たすためには多くの質問ペアを配置する必要がある。そのため、開発者は機能が揃い、かつ効果が良好なカテゴリ質問応答ロボットを構築するには多大な労力を要する。
本願は質問応答ロボットの生成方法を提供し、カテゴリ質問応答ロボットを構築する際に多大な人件費がかかるという関連技術における技術的課題を解決する。
本出願の第1態様の実施例は質問応答ロボットの生成方法を提供し、該方法は、ユーザが入力したカテゴリ情報を取得して、前記カテゴリ情報に基づいてロボットライブラリから対応するカテゴリロボットを取得するステップと、前記カテゴリロボットに対応するテンプレートリストを取得して前記ユーザに提供するステップであって、前記テンプレートリストに複数のテンプレートが含まれるステップと、前記ユーザにより入力された前記複数のテンプレートを受信するステップであって、前記入力済みのテンプレートに少なくとも1つの質問および前記少なくとも1つの質問に対応する回答が含まれるステップと、前記回答に対応する質問の組み合わせを生成するように、質問語義ライブラリに基づいて、前記入力された質問を拡張するステップであって、前記回答および対応する質問の組み合わせによって質問応答ペアが構成されるステップと、前記質問応答ペアに基づいて前記質問応答ロボットを生成するステップと、を含む。
本出願の実施例の第1の可能な実現形態として、前記カテゴリロボットは、複数の既存の質問応答ロボットを取得して、前記各既存の質問応答ロボットの既存の質問応答ペアを取得するステップと、前記既存の質問応答ロボットの既存の質問応答ペアに基づいて、前記既存の質問応答ロボットのカテゴリタグを生成するステップと、複数の前記既存の質問応答ロボットのカテゴリタグに基づいて、同じカテゴリに属する質問応答ロボットをクラスタリングして各カテゴリに対応するカテゴリロボットを生成するステップと、を通して生成される。
本出願の実施例の第2の可能な実現形態として、前記複数の前記既存の質問応答ロボットのカテゴリタグに基づいて、同じカテゴリに属する質問応答ロボットをクラスタリングして各カテゴリに対応するカテゴリロボットを生成するステップは、前記各既存の質問応答ロボットの既存の質問応答ペアの語義を決定するステップと、前記各既存の質問応答ロボットの語義が同じである既存の質問応答ペアを同じ質問語義ライブラリに記憶するステップと、前記質問語義ライブラリ内の語義が同じである既存の質問応答ペアを合併して、対応するカテゴリロボットを生成するステップと、を含む。
本出願の実施例の第3の可能な実現形態として、前記テンプレートリスト内の複数のテンプレートは、前記既存の質問応答ロボットの形式が近い既存の質問応答ペアを同じクラスターに記憶するステップと、前記同じクラスター内の語義が異なる任意の2つの既存の質問応答ペアのレーベンシュタイン距離を決定するステップと、前記同じクラスター内のレーベンシュタイン距離が最も小さくて語義が異なる任意の2つの既存の質問応答ペアに対してアラインメント処理を行って、前記既存の質問応答ペアのテンプレートを取得するステップと、を通して生成される。
本出願の実施例の第4の可能な実現形態として、質問語義ライブラリに基づいて、前記入力された質問を拡張するステップは、ユーザにより前記複数のテンプレートに入力されたキーワードを決定するステップと、前記キーワード、および前記質問語義ライブラリに記憶される質問応答ペアに基づいて、前記入力された質問を拡張するステップと、を含む。
本出願の実施例の第5の可能な実現形態として、前記カテゴリ情報に基づいて、ロボットライブラリから対応するカテゴリロボットを取得するステップは、質問分類器によって前記カテゴリ情報に対応するカテゴリを決定するステップと、前記カテゴリ情報に対応するカテゴリに基づいて前記ロボットライブラリから対応するカテゴリロボットを取得するステップと、を含む。
本出願の第2態様の実施例は質問応答ロボットの生成装置を提供し、該装置は、ユーザが入力したカテゴリ情報を取得して、前記カテゴリ情報に基づいてロボットライブラリから対応するカテゴリロボットを取得することに用いられる第1の取得モジュールと、前記カテゴリロボットに対応するテンプレートリストを取得して前記ユーザに提供することに用いられる第2の取得モジュールであって、前記テンプレートリストに複数のテンプレートが含まれる第2の取得モジュールと、前記ユーザにより入力された前記複数のテンプレートを受信することに用いられる受信モジュールであって、前記入力済みのテンプレートに少なくとも1つの質問および前記少なくとも1つの質問に対応する回答が含まれる受信モジュールと、前記回答に対応する質問の組み合わせを生成するように、質問語義ライブラリに基づいて、前記入力された質問を拡張することに用いられる拡張モジュールであって、前記回答および対応する質問の組み合わせによって質問応答ペアが構成される拡張モジュールと、前記質問応答ペアに基づいて前記質問応答ロボットを生成することに用いられる生成モジュールと、を含む。
本出願の第3態様の実施例はコンピュータ機器を提供し、該機器は、少なくとも1つのプロセッサと、前記少なくとも1つのプロセッサと通信可能に接続されるメモリとを含み、前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶され、前記命令は、前記少なくとも1つのプロセッサによって実行される場合、前記少なくとも1つのプロセッサが第1態様の実施例に記載の質問応答ロボットの生成方法を実行できる。
本出願の第4態様の実施例は、コンピュータ命令が記憶される非一時的コンピュータ読み取り可能な記憶媒体を提供し、前記コンピュータ命令は、前記コンピュータに第1態様の実施例に記載の質問応答ロボットの生成方法を実行させることに用いられる。
上記出願の1つの実施例は以下の利点または有益な効果を有する。ユーザが入力したカテゴリ情報を取得して、カテゴリ情報に基づいてロボットライブラリから対応するカテゴリロボットを取得し、カテゴリロボットに対応するテンプレートリストを取得してユーザに提供し、テンプレートリストに複数のテンプレートが含まれ、ユーザにより入力された複数のテンプレートを受信し、入力済みのテンプレートに少なくとも1つの質問および少なくとも1つの質問に対応する回答が含まれ、回答に対応する質問の組み合わせを生成するように、質問語義ライブラリに基づいて、入力された質問を拡張し、回答および対応する質問の組み合わせによって質問応答ペアが構成され、および質問応答ペアに基づいて質問応答ロボットを生成する。これにより、質問応答ロボットの開発者は品質の高いカテゴリ質問応答ロボットを素早く構築することができるため、人件費およびロボットの開発コストが削減される。
上記選択可能な形態が有する他の効果は、後文において具体的な実施例と併せて説明する。
図面は本解決手段をよりよく理解するためのものであり、本出願を限定するものではない。
本出願の実施例1が提供する質問応答ロボットの生成方法のフローチャートである。 本出願の実施例2が提供する質問応答ロボットの生成方法のフローチャートである。 本出願の実施例3が提供する質問応答ロボットの生成方法のフローチャートである。 本出願の実施例4が提供する質問応答ロボットの生成装置の構造概略図である。 本出願の実施例に係る質問応答ロボットの生成方法のコンピュータ機器のブロック図である。
以下、図面を参照しながら本出願の例示的な実施例を説明し、理解を促すために本出願の実施例の様々な詳細が含まれているが、それらは単なる例示的なものとして見なすべきである。そのため、当業者は、本出願の範囲および精神から逸脱することなく、本明細書に記載された実施例に対して様々な変更および修正を行うことができることを理解するべきである。同様に、以下の説明では、明確かつ簡明にするために、公知の機能および構造についての説明は省略される。
以下、参考図面を参照しながら、本出願の実施例の質問応答ロボットの生成方法、装置、コンピュータ機器および記憶媒体を説明する。
図1は本出願の実施例1が提供する質問応答ロボットの生成方法のフローチャートである。
本出願の実施例は、該質問応答ロボットの生成方法が質問応答ロボットの生成装置内において配置される場合を例として挙げて説明し、該質問応答ロボットの生成装置が任意のコンピュータ機器に適用可能である。これにより、該コンピュータ機器は質問応答ロボットの生成機能を実行することができる。
コンピュータ機器はパーソナルコンピュータ(Personal Computer、PCと略称される)、クラウドデバイス、モバイルデバイスなどであってもよく、モバイルデバイスは様々なオペレーティングシステムを有するハードウェアデバイス、例えば、例えば携帯電話、タブレット、パーソナルデジタルアシスタント、ウェアラブルデバイス、車載デバイスなどであってもよい。
図1に示すように、質問応答ロボットの生成方法は以下のステップを含んでも良い。
ステップ101において、ユーザが入力したカテゴリ情報を取得し、カテゴリ情報に基づいてロボットライブラリから対応するカテゴリロボットを取得する。
ロボットライブラリは、過去の開発者が配置した様々なスキルを持つロボットを指す。例えば、理解とインタラクション技術プラットフォーム(Understanding and Interaction Technology、UNITと略称される)は、バイドゥが中国語のサードパーティ開発者向けに重点的に構築した対話システム開発プラットフォームである。UNITプラットフォームは、業界をリードする需要理解および対話管理技術を搭載しており、バイドゥが長年にわたって累積した自然言語理解およびインタラクション技術、ディープラーニング、ビッグデータなどのコアコンピタンスを含むため、サードパーティの開発者の製品に対し、スマートな対話およびインタラクションを迅速に機能させ、未来の想像の余地をより豊かにする。UNITプラットフォームには、過去の開発者が配置した様々なスキルデータが記憶されており、各スキルのデータは、このスキルの下でユーザが配置したすべての質問応答ペアを含む。
本出願の実施例において、ユーザ、つまり新しい開発者がカテゴリロボットを作成する際に、まずユーザが入力したカテゴリ情報を取得して、ユーザが入力したカテゴリ情報に基づいてロボットライブラリから対応するカテゴリロボットを取得する。
1つの実現可能な実現形態として、質問分類器によってカテゴリ情報に対応するカテゴリを決定して、カテゴリ情報に対応するカテゴリに基づいてロボットライブラリから対応するカテゴリロボットを取得する。質問分類器は、大量の質問を用いて予めトレーニングされた、ディープニューラルネットワークに基づく分類器を指す。
例えば、ユーザが「南京にはどんな面白い所がありますか」、「南京の観光名所は?」、「中山陵のチケットの値段」という質問を入力すると、質問分類器はユーザが入力した質問に基づいて、対応するカテゴリが旅行カテゴリであると決定し、ロボットライブラリから旅行カテゴリに対応するロボットを取得する。
別の可能な実現形態として、ユーザがカテゴリ質問応答ロボットを作成する場合、カテゴリを選択することも可能である。従って、ユーザが選択したカテゴリに基づいて、対応するカテゴリロボットをロボットライブラリから取得する。
例えば、ユーザは、新しいカテゴリ質問応答ロボットを構築する際に、選択したカテゴリが「旅行」であると、ユーザの選択に基づいて、過去の開発者が構築したロボットライブラリから旅行カテゴリに対応するロボットを取得することができる。
ステップ102において、カテゴリロボットに対応するテンプレートリストを取得してユーザに提供し、テンプレートリストに複数のテンプレートが含まれる。
本出願の実施例において、ユーザが構築しようとする質問応答ロボットのカテゴリを決定すると、対応するカテゴリロボットをロボットライブラリから取得した後、さらに、カテゴリロボットに対応するテンプレートリストを取得してユーザに提供する。
例えば、ユーザが入力したカテゴリ情報に基づいてカテゴリを「旅行」に決定すると、「〔 〕はどこですか」、「〔 〕のチケットの値段は」のような旅行カテゴリロボットに対応するテンプレートリストを取得することができる。
ステップ103において、ユーザから入力された複数のテンプレートを受信し、入力済みのテンプレートに少なくとも1つの質問および少なくとも1つの質問に対応する回答が含まれる。
本出願の実施例では、カテゴリロボットに対応するテンプレートリストを取得してユーザに提供した後、ユーザは、それぞれテンプレートリストに含まれる複数のテンプレートに対応するキーワードを入力することで、対応する質問応答ペアを生成することができる。
なお、ユーザにより入力された複数のテンプレートには少なくとも1つの質問および少なくとも1つの質問に対応する回答が含まれ、その組み合わせによって質問応答ペアが生成される。ユーザが複数のテンプレートに入力する際に、入力したキーワードが異なると、異なる質問応答ペアが生成される。
例えば、テンプレートリスト内のテンプレートが「〔 〕はどこですか」である場合には、ユーザが該テンプレートに入力する際、入力できるテンプレートには「中山陵はどこですか」という質問や、該質問に対応する回答「南京市玄武区紫金山南麓鐘山景勝地内に位置します」が含まれている。
ステップ104において、回答に対応する質問の組み合わせを生成するように、質問語義ライブラリに基づいて、入力された質問を拡張し、回答および対応する質問の組み合わせによって質問応答ペアが構成される。
本出願の実施例では、ユーザが入力した複数のテンプレートを受信すると、質問語義ライブラリに基づいて、入力された質問を拡張し、さらに同義の質問を拡張して、回答に対応する質問の組み合わせを生成することができる。以上により、カテゴリにおいてよく見られた質問のテンプレートへの記入および記入された質問に対する拡張によって、数多くの拡張された質問を得ることができ、水準の高いカテゴリ質問応答ロボットを構成するとともに、人件費を削減することができる。
なお、質問語義ライブラリに基づいて、入力された質問を拡張し、生成されたおよび回答に対応する質問の組み合わせによって質問応答ペアが構成される。即ち、質問応答ペアは複数の同義の質問および対応する回答を含む。
1つの可能な実現形態として、ユーザから入力された複数のテンプレートを受信した後、ユーザが複数のテンプレートに入力したキーワードを決定し、さらに、ユーザが入力したキーワードに基づいて、質問語義ライブラリに記憶されるおよび該テンプレートと同義の質問応答ペアを用いてユーザが入力した質問を拡張する。
例えば、ユーザが旅行カテゴリを選択して、「〔 〕はどこですか」という推薦されたテンプレートに基づいて、〔 〕に「中山陵」を入力すると、質問語義ライブラリに基づいて、入力された質問を拡張して「〔 〕はどこですか?〔 〕の位置は?〔 〕はどの辺りにありますか?どこに行って〔 〕を見つけられますか?」の全てが「中山陵はどこですか?中山陵の位置は?中山陵はどの辺りにありますか?どこに行って中山陵を見つけられますか?」に書き換えられる。
ステップ105において、質問応答ペアに基づいて質問応答ロボットを生成する。
本出願の実施例では、質問語義ライブラリに基づいて、入力された質問を拡張し、質問応答ペアを生成した後、質問応答ペアに基づいてカテゴリに対応する質問応答ロボットを生成することができる。
本出願の実施例の質問応答ロボットの生成方法は、ユーザが入力したカテゴリ情報を取得して、カテゴリ情報に基づいてロボットライブラリから対応するカテゴリロボットを取得し、カテゴリロボットに対応するテンプレートリストを取得してユーザに提供する。テンプレートリストには複数のテンプレートが含まれており、ユーザにより入力された複数のテンプレートを受信し、入力済みのテンプレートに少なくとも1つの質問および少なくとも1つの質問に対応する回答が含まれ、回答に対応する質問の組み合わせを生成するように、質問語義ライブラリに基づいて、入力された質問を拡張する。回答および対応する質問の組み合わせによって質問応答ペアが構成され、および質問応答ペアに基づいて質問応答ロボットを生成する。以上より、該方法は、カテゴリロボットのテンプレートリストを取得することで、ユーザが該カテゴリでよく見られる質問テンプレートにおいて質問を拡張し、水準がより高い質問応答ロボットを構成することができるとともに、人件費を削減することができる。
上記実施例をもとに、ユーザが入力したカテゴリ情報に基づいて、ロボットライブラリから対応するカテゴリロボットを取得する上記ステップ101は、複数の既存の質問応答ロボット、および各既存の質問応答ロボットに対応する既存の質問応答ペアを取得することで、既存の質問応答ロボットの既存の質問応答ペアに基づいて、既存の質問応答ロボットのカテゴリタグを生成し、さらに、複数の既存の質問応答ロボットのカテゴリタグに基づいて、同じカテゴリに属する質問応答ロボットをクラスタリングして生成する。以下、図2を参照しながら上記プロセスを詳しく説明し、図2は本出願の実施例2が提供した質問応答ロボットの生成方法のフローチャートである。
図2に示すように、該質問応答ロボットの生成方法は、以下のステップをさらに含んでも良い。
ステップ201において、複数の既存の質問応答ロボットを取得して、各既存の質問応答ロボットの既存の質問応答ペアを取得する。
既存の質問応答ロボットは、医療カテゴリ、母子カテゴリ、教育カテゴリなど、各カテゴリに対応する既存の質問応答ロボットを含む。
本出願の実施例において、複数の既存の質問応答ロボット、および各既存の質問応答ロボットの既存の質問応答ペアを、既存のデータプラットフォームから取得することができる。例えば、過去の開発者が配置した既存の質問応答ロボット、および各既存の質問応答ロボットの既存の質問応答ペアを、UNITプラットフォームから取得することができる。既存の質問応答ペアは、質問および該質問に対応する回答を含む。
ステップ202において、既存の質問応答ロボットの既存の質問応答ペアに基づいて、既存の質問応答ロボットのカテゴリタグを生成する。
本出願の実施例では、複数の既存の質問応答ロボットおよび各既存の質問応答ロボットの既存の質問応答ペアが取得されると、既存の質問応答ペアに対応するカテゴリを決定し、既存の質問応答ロボットの既存の質問応答ペアに基づいて、既存の質問応答ロボットのカテゴリタグを生成するように、質問分類器によって既存の質問応答ペアを識別する。
例えば、既存の質問応答ロボットの既存の質問応答ペアが「妊婦が食べられない果物は何ですか」、「妊婦が亜鉛を補充するにはどんな海産物を食べればいいですか」などであるとすると、該既存の質問応答ロボットに対応するカテゴリが、母子カテゴリであると決定することができる。
ステップ203において、複数の既存の質問応答ロボットのカテゴリタグに基づいて、同じカテゴリに属する質問応答ロボットをクラスタリングして、各カテゴリに対応するカテゴリロボットを生成する。
本出願の実施例では、既存の質問応答ロボットのカテゴリタグが決定された後、各カテゴリに対応するカテゴリロボットを生成するように、複数の既存の質問応答ロボットのカテゴリタグに基づいて、同じカテゴリに属する質問応答ロボットをクラスタリングする。
1つの可能な実現形態では、各既存の質問応答ロボットの既存の質問応答ペアの語義を決定し、各既存の質問応答ロボットの語義が同じである既存の質問応答ペアを同じ質問語義ライブラリに記憶し、質問語義ライブラリ内の語義が同じである既存の質問応答ペアを合併して、対応するカテゴリロボットを生成することができる。
具体的には、複数の既存の質問応答ロボット、および各既存の質問応答ロボットの既存の質問応答ペアが取得されると、各既存の質問応答ロボットの既存の質問応答ペアに対して語義識別を行い、語義が同じである既存の質問応答ペアを決定することができる。例えば、「故宮はどこですか」と「故宮の位置」は同じ意味を表すため、同じ質問語義ライブラリ内に記憶される。このとき、同じ質問応答ペアの一組の同義の質問を基本単位として、密度に基づくクラスタリング方法を用いて既存の質問応答ペアをクラスタリングし、密度に基づくクラスタリング結果を取得した後、複数の既存の質問応答ペアは同じ質問語義ライブラリに記憶することができる。
なお、同じ質問語義ライブラリ内に記憶される複数の既存の質問応答ペアの中にも重複する質問応答ペアが存在する可能性があるので、この場合には、質問応答ペアを処理する必要がある。質問応答ペアに対して重複排除操作を行った後、異なる質問語義ライブラリには語義が同じ質問応答ペアが含まれる可能性がある。この場合、合併された質問語義ライブラリを生成するように、異なる質問語義ライブラリ内の語義が同じ既存の質問応答ペアを合併する必要がある。質問語義ライブラリ内の質問の数をさらに増やすため、ユーザログ内の質問応答ペアに当て嵌る類似度の高い質問を質問語義ライブラリに追加して、対応するカテゴリロボットを生成することができる。
例えば、質問語義ライブラリに記憶される同じ語義の既存の質問応答ペアには、2組だけの質問応答ペア、例えば「故宮はどこですか?故宮はどの辺りにありますか?」が含まれると決定される場合、ユーザログを介して同一の質問語義ライブラリを拡張し、この質問語義ライブラリの質問応答ペアを「故宮はどこですか、故宮はどの辺りにありますか?故宮の位置、故宮はどこですか、どこに行って故宮を見つけられますか、故宮の地理的位置」のような6組の質問応答ペアまで拡張する可能性がある。
本出願の実施例の質問応答ロボットの生成方法は、複数の既存の質問応答ロボットを取得して、各既存の質問応答ロボットの既存の質問応答ペアを取得し、既存の質問応答ロボットの既存の質問応答ペアに基づいて、既存の質問応答ロボットのカテゴリタグを生成し、複数の既存の質問応答ロボットのカテゴリタグに基づいて、同じカテゴリに属する質問応答ロボットをクラスタリングして各カテゴリに対応するカテゴリロボットを生成する。以上により、複数の既存の質問応答ロボット、および各既存の質問応答ロボットの既存の質問応答ペアによって、各カテゴリに対応するカテゴリロボットを生成し、質問応答ロボットの構築のためにユーザにデータを提供して、質問応答ロボットの構築速度の向上に役立つ。
上記実施例をもとに、ステップ102で取得されたカテゴリロボットに対応するテンプレートリストに含まれる複数のテンプレートは、既存の質問応答ロボットの既存の質問応答ペアをクラスタリングして、レーベンシュタイン距離が最も小さくて語義が異なる任意の2つの既存の質問応答ペアに対してアラインメント処理を行って得ることができる。以下、図3を参照しながら上記プロセスを詳しく説明し、図3は本出願の実施例3が提供する質問応答ロボットの生成方法のフローチャートである。
図3に示すように、該質問応答ロボットの生成方法は、以下のステップをさらに含んでも良い。
ステップ301において、既存の質問応答ロボットの形式が近い既存の質問応答ペアを、同じクラスターに記憶する。
形式が近い既存の質問応答ペアとは、既存の質問応答ペア内の質問の形式が近いことを指し、例えば、「故宮はどこですか」と「頤和園はどこですか」は形式が近い既存の質問応答ペアである。
本出願の実施例において、複数の既存の質問応答ロボットおよび各既存の質問応答ロボットの既存の質問応答ペアが取得されると、同様に密度に基づくクラスタリング方法を用いて、既存の質問応答ロボットの形式が近い既存の質問応答ペアを同じクラスターに記憶する。
ステップ302において、同じクラスター内の語義が異なる任意の2つの既存の質問応答ペアのレーベンシュタイン距離を決定する。
レーベンシュタイン距離は、2つのシーケンスの類似度の判定に用いられ、2つのシーケンスの間では、1つのシーケンスが他のシーケンスに変換されるのに必要な最小編集操作回数を指す。
本出願の実施例において、同じクラスター内の形式が近い既存の質問応答ペアに対して、語義が異なる任意の2つの既存の質問応答ペアのレーベンシュタイン距離を計算する。
ステップ303において、同じクラスター内のレーベンシュタイン距離が最も小さく語義が異なる任意の2つの既存の質問応答ペアに対してアラインメント処理を行い、既存の質問応答ペアのテンプレートを取得する。
本出願の実施例において、同じクラスター内のレーベンシュタイン距離が最も小さく語義が異なる任意の2つの既存の質問応答ペアに対してアラインメント処理を行い、アラインメントされた一組の質問応答ペアを取得する。アラインメントされた各ペアの質問応答ペアに対し、該組の質問応答ペアに対応するテンプレートを取得する。
1つの可能な実現形態として、同じ組の質問応答ペアの2つの質問を2つのループと見なすことができ、この2つのループにおける最長共通部分列を計算し、最長共通部分列の長さの比率が一定の閾値になった時に、該組の質問応答ペアのテンプレートが得られる。
例えば、同じクラスター内の既存の質問応答ペアが「故宮はどこですか、頤和園はどこですか、故宮はどの方向ですか、頤和園はどの方向ですか」を含む場合、同じクラスター内のレーベンシュタイン距離が最も小さく語義が異なる任意の2つの既存の質問応答ペアに対してアラインメント処理を行った後、アラインメントされた2組の質問応答ペアはそれぞれ「故宮はどこですか、頤和園はどこですか」および「故宮はどの方向ですか、頤和園はどの方向ですか」である。従って、該カテゴリのテンプレートリストの「〔 〕はどこですか、〔 〕はどこですか」を生成する。
本出願の実施例の質問応答ロボットの生成方法は、既存の質問応答ロボットの形式が近い既存の質問応答ペアを同じクラスターに記憶し、同じクラスター内の語義が異なる任意の2つの既存の質問応答ペアのレーベンシュタイン距離を決定し、同じクラスター内のレーベンシュタイン距離が最も小さくて語義が異なる任意の2つの既存の質問応答ペアに対してアラインメント処理を行い、既存の質問応答ペアのテンプレートを取得する。このように、既存の質問応答ロボットの既存の質問応答ペアに基づいて、該既存の質問応答ロボットに対応するカテゴリのテンプレートを取得するので、ユーザが質問応答ロボットを配置する速度の向上に役立つ。
上記実施例を実現するために、本出願は質問応答ロボットの生成装置を提供する。
図4は本出願の実施例4が提供する質問応答ロボットの生成装置の構造概略図である。
図4に示すように、該質問応答ロボットの生成装置400は、第1の取得モジュール410、第2の取得モジュール420、受信モジュール430、拡張モジュール440および生成モジュール450を含んでも良い。
第1の取得モジュール410は、ユーザが入力したカテゴリ情報を取得し、カテゴリ情報に基づいてロボットライブラリから対応するカテゴリロボットを取得する。
第2の取得モジュール420は、カテゴリロボットに対応するテンプレートリストを取得してユーザに提供する。テンプレートリストには、複数のテンプレートが含まれる。
受信モジュール430は、ユーザにより入力された複数のテンプレートを受信する。入力済みのテンプレートには、少なくとも1つの質問および少なくとも1つの質問に対応する回答が含まれる。
拡張モジュール440は、回答に対応する質問の組み合わせを生成するように、質問語義ライブラリに基づいて、入力された質問を拡張するし、回答および対応する質問の組み合わせによって質問応答ペアが構成される。
生成モジュール450は、質問応答ペアに基づいて質問応答ロボットを生成する。
考えられる1つの状況として、第1の取得モジュール410はさらに、複数の既存の質問応答ロボットを取得して、各既存の質問応答ロボットの既存の質問応答ペアを取得し、既存の質問応答ロボットの既存の質問応答ペアに基づいて、既存の質問応答ロボットのカテゴリタグを生成し、複数の既存の質問応答ロボットのカテゴリタグに基づいて、同じカテゴリに属する質問応答ロボットをクラスタリングして各カテゴリに対応するカテゴリロボットを生成する。
考えられるもう一つの状況として、第1の取得モジュール410はさらに、各既存の質問応答ロボットの既存の質問応答ペアの語義を決定し、各既存の質問応答ロボットの語義が同じである既存の質問応答ペアを同じ質問語義ライブラリに記憶し、質問語義ライブラリ内の語義が同じである既存の質問応答ペアを合併して、対応するカテゴリロボットを生成するする。
考えられるもう一つの状況として、テンプレートリスト内の複数のテンプレートは以下のステップによって生成される。
既存の質問応答ロボットの形式が近い既存の質問応答ペアを同じクラスターに記憶する。
同じクラスター内の語義が異なる任意の2つの既存の質問応答ペアのレーベンシュタイン距離を決定する。
同じクラスター内のレーベンシュタイン距離が最も小さく語義が異なる任意の2つの既存の質問応答ペアに対してアラインメント処理を行い、既存の質問応答ペアのテンプレートを取得する。
考えられるもう一つの状況として、拡張モジュール440はさらに、ユーザが複数のテンプレートに入力したキーワードを決定し、キーワード、および質問語義ライブラリに記憶される質問応答ペアに基づいて、入力された質問を拡張する。
考えられるもう一つの状況として、第1の取得モジュール410はさらに、質問分類器によってカテゴリ情報に対応するカテゴリを決定し、カテゴリ情報に対応するカテゴリに基づいてロボットライブラリから対応するカテゴリロボットを取得することとしてもよい。
本出願の実施例の質問応答ロボットの生成装置は、ユーザが入力したカテゴリ情報を取得して、カテゴリ情報に基づいてロボットライブラリから対応するカテゴリロボットを取得し、カテゴリロボットに対応するテンプレートリストを取得してユーザに提供する。テンプレートリストに複数のテンプレートが含まれ、ユーザにより入力された複数のテンプレートを受信し、入力済みのテンプレートに少なくとも1つの質問および少なくとも1つの質問に対応する回答が含まれ、回答に対応する質問の組み合わせを生成するように、質問語義ライブラリに基づいて、入力された質問を拡張する。回答および対応する質問の組み合わせによって質問応答ペアが構成され、および質問応答ペアに基づいて質問応答ロボットを生成する。以上により、該方法はカテゴリロボットのテンプレートリストを取得することで、ユーザが該カテゴリによく見られる質問テンプレートにおいて質問の拡張を行うので、水準がより高い質問応答ロボットを構成することができるとともに、人件費を削減することができる。
本出願の実施例に基づいて、本出願はコンピュータ機器および読み取り可能な記憶媒体をさらに提供する。
図5に示すように、図5は本出願の実施例に係る質問応答ロボットの生成方法のコンピュータ機器のブロック図である。電子機械は様々な形態のデジタルコンピュータ、例えば、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、携帯情報端末、サーバ、ブレードサーバ、大型コンピュータ、及び他の適切なコンピュータを表すこと意図している。電子機械はさらに、様々な形態のモバイル装置、例えば、携帯情報端末、セルラー電話、スマートフォン、ウェアラブルデバイス及び他の同様なコンピューティングデバイスを表すことができる。本明細書に示されている部品、それらの接続と関係、及びそれらの機能は例示的なものに過ぎず、本明細書で説明された及び/又は求められた本出願の実現を限定することを意図していない。
図5に示すように、該電子機器は、1つ又は複数のプロセッサ501、メモリ502、及び各部品を接続するためのインターフェースを含み、インターフェースは高速インターフェースと低速インターフェースを含む。各部品は、異なるバスを用いて互いに接続されており、かつ共用のマザーボードに実装される又は必要に応じて他の形態で実装することができる。プロセッサは、電子機器内で実行される命令を処理することができ、前記命令は、外部入力/出力装置(例えば、インターフェースに接続される表示装置)にGUIの図形情報を表示するようにメモリ内又はメモリ上に記憶される命令を含む。他の実施形態において、必要があれば、複数のプロセッサ及び/又は複数のバスを複数のメモリと組み合わせて使用してもよい。同様に、複数の電子機器を接続してもよく、各機械は、必要とされる操作の一部(例えば、サーバアレイ、1組のブレードサーバ、又はマルチプロセッサシステムとして)を提供する。図5では、1つのプロセッサ501は例として挙げられている。
メモリ502は即ち本出願によって提供される非一時的なコンピュータ読み取り可能な記憶媒体である。前記メモリには、本出願が提供する質問応答ロボットの生成方法を前記少なくとも1つのプロセッサに実行させる少なくとも1つの実行可能な命令が記憶されている。本出願の非一時的なコンピュータ読み取り可能な記憶媒体は、本出願が提供する質問応答ロボットの生成方法をコンピュータに実行させるためのコンピュータ命令が記憶されている。
メモリ502は非一時的なコンピュータ読み取り可能な記憶媒体として、本出願の実施例における質問応答ロボットの生成方法に対応するプログラム命令/モジュール(例えば、図4に示す第1の取得モジュール410、第2の取得モジュール420、受信モジュール430、拡張モジュール440および生成モジュール450)のような非一時的なソフトウェアプログラム、非一時的なコンピュータ実行可能なプログラム及びモジュールを記憶することに用いることができる。プロセッサ501は、メモリ502に記憶される非一時的なソフトウェアプログラム、命令及びモジュールを実行することによって、サーバの様々な機能適用及びデータ処理を実行し、即ち上記方法の実施例における質問応答ロボットの生成方法を実現する。
メモリ502は、プログラムを記憶する領域と、データを記憶する領域とを含んでも良い。プログラムを記憶する領域は、オペレーティングシステムと、少なくとも1つの機能に必要なアプリケーションプログラムを含んでも良い。データを記憶する領域は、音声翻訳のコンピュータ機器の使用によって生成されたデータなどを含んでも良い。また、メモリ502は、高速ランダムアクセスメモリだけではなく、少なくとも1つのディスクストレージデバイス、フラッシュメモリデバイス又は他の非一時的なソリッドステートストレージデバイスのような非一時的なメモリを含んでも良い。一部の実施例において、メモリ502は、プロセッサ501に対してリモートで配置されるメモリを選択的に含んでもよく、これらのメモリはネットワーク経由で質問応答ロボットの生成方法のコンピュータ機器に接続することができる。上記のネットワークの例は、インターネット、企業内部のネットワーク、ローカルエリアネットワーク、移動通信ネットワーク及びそれらの組み合わせを含むが、これらに限定されない。
質問応答ロボットの生成方法のコンピュータ機器は入力装置503および出力装置504をさらに含んでも良い。プロセッサ501、メモリ502、入力装置503および出力装置504はバスまたは他の方法で接続することができ、図5では、バスによる接続は例として挙げられている。
入力装置503は、入力されたデジタル又は文字情報を受信し、及び音声翻訳のコンピュータ機器のユーザ設定及び機能制御に関連するキー信号入力を生成することができ、例えば、タッチスクリーン、キーパッド、マウス、トラックパッド、タッチパッド、ポインティングスティック、1つ又は複数のマウスボタン、トラックボール、ジョイスティック等の入力装置がある。出力装置504は、表示装置、補助照明装置(例えば、LED)及び触覚フィードバック装置(例えば、振動モータ)などを含んでも良い。該表示装置は、液晶ディスプレイ(LCD)、発光ダイオード(LED)ディスプレイ及びプラズマディスプレイを含むが、これらに限定されない。一部の実施形態では、表示装置はタッチスクリーンであってもよい。
ここで説明されたシステムと技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、専用ASIC(専用集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/又はそれらの組み合わせにおいて実現することができる。これらの様々な実施形態は以下を含んでもよい。1つ又は複数のコンピュータプログラムにおいて実施され、該1つ又は複数のコンピュータプログラムは、少なくとも1つのプログラマブルプロセッサを含むプログラマブルシステムにおいて実行及び/又は解釈することができ、該プログラマブルプロセッサは、専用又は汎用のプログラマブルプロセッサであり、ストレージシステム、少なくとも1つの入力装置及び少なくとも1つの出力装置からデータと命令を受信し、データ及び命令を該ストレージシステム、該少なくとも1つの入力装置及び該少なくとも1つの出力装置に転送することができる。
これらの計算プログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、又はコードとも言う)は、プログラマブルプロセッサの機械命令を含み、かつ高度プロセス及び/又はオブジェクト指向プログラミング言語、及び/又はアセンブリ言語/機械語を用いてこれらの計算プログラム実行することができる。本明細書で使用される「機械読み取り可能な媒体」と「コンピュータ読み取り可能な媒体」という用語は、機械命令及び/又はデータをプログラマブルプロセッサに提供するための任意のコンピュータプログラム製品、装置、及び/又はデバイス(例えば、磁気ディスク、光ディスク、メモリ、プログラマブルロジックデバイス(PLD))を指し、機械読み取り可能な信号としての機械命令を受信する機械読み取り可能な媒体を含む。「機械読み取り可能な信号」という用語は、機械命令及び/又はデータをプログラマブルプロセッサに提供するための如何なる信号をも指す。
ユーザとのインタラクションを提供するため、ここで説明されたシステムと技術をコンピュータで実施することができる。該コンピュータは、ユーザに情報を表示するための表示装置(例えば、CRT(ブラウン管)又はLCD(液晶ディスプレイ)モニタ)と、キーボードとポインティングデバイス(例えば、マウス又はトラックボール)とを含み、ユーザは該キーボードと該ポインティングデバイスを介して入力をコンピュータに提供することができる。別の種類のデバイスはさらにユーザとのインタラクションを提供することができ、例えば、ユーザに提供されたフィードバックは、任意の形式のセンサフィードバック(例えば、視覚フィードバック、聴覚フィードバック、または触覚フィードバック)であっても良く、ユーザからの入力を任意の形式(音の入力、音声入力又は触覚入力を含む)で受信することもできる。
ここで説明されたシステムと技術を、バックグラウンドパーツを含む計算システム(例えば、データサーバとして)、又はミドルウェアパーツを含む計算システム(例えば、アプリケーションサーバ)、又はフロントエンドパーツを含む計算システム(例えば、グラフィカルユーザインタフェース又はウェブブラウザを有するユーザコンピュータ、ユーザは該グラフィカルユーザインタフェース又は該ウェブブラウザ介して、ここで説明されたシステムと技術の実施形態と対話することができる)、又はこれらのバックグラウンドパーツ、ミドルウェアパーツ又はフロントエンドパーツの任意の組み合わせを含む計算システムにおいて実行することができる。任意の形式又は媒体のデジタルデータ通信(例えば、通信ネットワーク)を介して、システムのパーツを互いに接続することができる。通信ネットワークの例としては、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)及びインターネットが含まれる。
コンピュータシステムは、クライアントとサーバを含んでも良い。クライアントとサーバは通常離れており、一般的に通信ネットワークを介してインタラクションを行う。対応するコンピュータで実行されかつ互いにクライアント-サーバ関係を有するコンピュータプログラムによって、クライアントとサーバとの関係は生成される。
本出願の実施例に係る技術案は、ユーザが入力したカテゴリ情報を取得して、カテゴリ情報に基づいてロボットライブラリから対応するカテゴリロボットを取得し、カテゴリロボットに対応するテンプレートリストを取得してユーザに提供し、テンプレートリストに複数のテンプレートが含まれ、ユーザにより入力された複数のテンプレートを受信し、入力済みのテンプレートに少なくとも1つの質問および少なくとも1つの質問に対応する回答が含まれ、回答に対応する質問の組み合わせを生成するように、質問語義ライブラリに基づいて、入力された質問を拡張し、回答および対応する質問の組み合わせによって質問応答ペアが構成され、および質問応答ペアに基づいて質問応答ロボットを生成する。以上により、質問応答ロボットの開発者は品質の高いカテゴリ質問応答ロボットを素早く構築することができるため、人件費およびロボットの開発コストが削減される。
なお、以上に示した様々な形式のプロセスを用いて、ステップを並べ替えたり、追加したり、削除したりすることができることを理解されたい。例えば、本出願書に記載の各ステップは、並列的に実行するか、順次的に実行するか、又は異なる順序で実行してもよい。本出願で開示された技術的解決手段が予期している結果を実現できる限り、本明細書では限定されない。
上記の具体的な実施形態は、本出願の保護範囲を制限するものではない。当業者であれば、設計要件とその他の要因に応じて、様々な修正、組み合わせ、一部の組み合わせ及び置き換えを行うことができることを理解されたい。本出願の精神と原則を逸脱しない限り、行われるすべての修正、置き換え及び改善等は、いずれも本出願の保護範囲に含まれるべきである。

Claims (15)

  1. コンピュータが、ユーザが入力したカテゴリ情報を取得して、前記カテゴリ情報に基づいてロボットライブラリから対応するカテゴリロボットを取得するステップと、
    コンピュータが、前記カテゴリロボットに対応するテンプレートリストを取得して前記ユーザに提供するステップであって、前記テンプレートリストに複数のテンプレートが含まれるステップと、
    コンピュータが、前記ユーザにより入力された前記複数のテンプレートを受信するステップであって、前記ユーザにより入力された前記複数のテンプレートに少なくとも1つの質問および前記少なくとも1つの質問に対応する回答が含まれるステップと、
    コンピュータが、前記回答に対応する質問の組み合わせを生成するように、質問語義ライブラリに基づいて、前記入力された質問を拡張するステップであって、前記回答および対応する質問の組み合わせによって質問応答ペアが構成されるステップと、
    コンピュータが、前記質問応答ペアに基づいて質問応答ロボットを生成するステップと、を含むことを特徴とする、質問応答ロボットの生成方法。
  2. 前記カテゴリロボットは、
    コンピュータが、複数の既存の質問応答ロボットを取得して、前記各既存の質問応答ロボットの既存の質問応答ペアを取得するステップと、
    コンピュータが、前記既存の質問応答ロボットの既存の質問応答ペアに基づいて、前記既存の質問応答ロボットのカテゴリタグを生成するステップと、
    コンピュータが、複数の前記既存の質問応答ロボットのカテゴリタグに基づいて、同じカテゴリに属する質問応答ロボットをクラスタリングして各カテゴリに対応するカテゴリロボットを生成するステップと、を通して生成されることを特徴とする、請求項1に記載の質問応答ロボットの生成方法。
  3. コンピュータが、前記複数の前記既存の質問応答ロボットのカテゴリタグに基づいて、同じカテゴリに属する質問応答ロボットをクラスタリングして各カテゴリに対応するカテゴリロボットを生成するステップは、
    コンピュータが、前記各既存の質問応答ロボットの既存の質問応答ペアの語義を決定するステップと、
    コンピュータが、前記各既存の質問応答ロボットの語義が同じである既存の質問応答ペアを同じ質問語義ライブラリに記憶するステップと、
    コンピュータが、異なる質問語義ライブラリ内の語義が同じである既存の質問応答ペアを合併して、対応するカテゴリロボットを生成するステップと、を含むことを特徴とする、請求項2に記載の質問応答ロボットの生成方法。
  4. 前記テンプレートリスト内の複数のテンプレートは、
    コンピュータが、前記既存の質問応答ロボットの形式が近い既存の質問応答ペアを同じクラスターに記憶するステップと、
    コンピュータが、前記同じクラスター内の語義が異なる任意の2つの既存の質問応答ペアのレーベンシュタイン距離を決定するステップと、
    コンピュータが、前記同じクラスター内のレーベンシュタイン距離が最も小さくて語義が異なる任意の2つの既存の質問応答ペアに対してアラインメント処理を行って、前記既存の質問応答ペアのテンプレートを取得するステップと、を通して生成されることを特徴とする、請求項2に記載の質問応答ロボットの生成方法。
  5. コンピュータが、質問語義ライブラリに基づいて、前記入力された質問を拡張するステップは、
    コンピュータが、ユーザが前記複数のテンプレートに入力したキーワードを決定するステップと、
    コンピュータが、前記キーワード、および前記質問語義ライブラリに記憶される質問応答ペアに基づいて、前記入力された質問を拡張するステップと、を含むことを特徴とする、請求項1に記載の質問応答ロボットの生成方法。
  6. コンピュータが、前記カテゴリ情報に基づいて、ロボットライブラリから対応するカテゴリロボットを取得するステップは、
    コンピュータが、質問分類器によって前記カテゴリ情報に対応するカテゴリを決定するステップと、
    コンピュータが、前記カテゴリ情報に対応するカテゴリに基づいて前記ロボットライブラリから対応するカテゴリロボットを取得するステップと、を含むことを特徴とする、請求項1から5のいずれか1項に記載の質問応答ロボットの生成方法。
  7. ユーザが入力したカテゴリ情報を取得して、前記カテゴリ情報に基づいてロボットライブラリから対応するカテゴリロボットを取得することに用いられる第1の取得モジュールと、
    前記カテゴリロボットに対応するテンプレートリストを取得して前記ユーザに提供することに用いられる第2の取得モジュールであって、前記テンプレートリストに複数のテンプレートが含まれる第2の取得モジュールと、
    前記ユーザにより入力された前記複数のテンプレートを受信することに用いられる受信モジュールであって、前記ユーザにより入力された前記複数のテンプレートに少なくとも1つの質問および前記少なくとも1つの質問に対応する回答が含まれる受信モジュールと、
    前記回答に対応する質問の組み合わせを生成するように、質問語義ライブラリに基づいて、前記入力された質問を拡張することに用いられる拡張モジュールであって、前記回答および対応する質問の組み合わせによって質問応答ペアが構成される拡張モジュールと、
    前記質問応答ペアに基づいて質問応答ロボットを生成することに用いられる生成モジュールと、を含むことを特徴とする、質問応答ロボットの生成装置。
  8. 前記第1の取得モジュールはさらに、
    複数の既存の質問応答ロボットを取得して、前記各既存の質問応答ロボットの既存の質問応答ペアを取得し、
    前記既存の質問応答ロボットの既存の質問応答ペアに基づいて、前記既存の質問応答ロボットのカテゴリタグを生成し、および
    複数の前記既存の質問応答ロボットのカテゴリタグに基づいて、同じカテゴリに属する質問応答ロボットをクラスタリングして各カテゴリに対応するカテゴリロボットを生成することに用いられることを特徴とする、請求項7に記載の質問応答ロボットの生成装置。
  9. 前記第1の取得モジュールはさらに、
    前記各既存の質問応答ロボットの既存の質問応答ペアの語義を決定し、
    前記各既存の質問応答ロボットの語義が同じである既存の質問応答ペアを同じ質問語義ライブラリに記憶し、
    前記質問語義ライブラリ内の語義が同じである既存の質問応答ペアを合併して、対応するカテゴリロボットを生成することに用いられることを特徴とする、請求項8に記載の質問応答ロボットの生成装置。
  10. 前記テンプレートリスト内の複数のテンプレートは、
    前記既存の質問応答ロボットの形式が近い既存の質問応答ペアを同じクラスターに記憶するステップと、
    前記同じクラスター内の語義が異なる任意の2つの既存の質問応答ペアのレーベンシュタイン距離を決定するステップと、
    前記同じクラスター内のレーベンシュタイン距離が最も小さくて語義が異なる任意の2つの既存の質問応答ペアに対してアラインメント処理を行って、前記既存の質問応答ペアのテンプレートを取得するステップと、を通して生成されることを特徴とする、請求項8に記載の質問応答ロボットの生成装置。
  11. 前記拡張モジュールはさらに、
    ユーザが前記複数のテンプレートに入力したキーワードを決定し、
    前記キーワード、および前記質問語義ライブラリに記憶される質問応答ペアに基づいて、前記入力された質問を拡張することに用いられることを特徴とする、請求項7に記載の質問応答ロボットの生成装置。
  12. 前記第1の取得モジュールはさらに、
    質問分類器によって前記カテゴリ情報に対応するカテゴリを決定し、
    前記カテゴリ情報に対応するカテゴリに基づいて前記ロボットライブラリから対応するカテゴリロボットを取得することに用いられることを特徴とする、請求項7から11のいずれか1項に記載の質問応答ロボットの生成装置。
  13. 少なくとも1つのプロセッサと、
    前記少なくとも1つのプロセッサと通信可能に接続されるメモリと、を含み、
    前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶され、前記命令は、前記少なくとも1つのプロセッサによって実行される場合、前記少なくとも1つのプロセッサが請求項1から6のいずれか1項に記載の質問応答ロボットの生成方法を実行できることを特徴とする、コンピュータ機器。
  14. ンピュータ命令は、請求項1から6のいずれか1項に記載の質問応答ロボットの生成方法をコンピュータに実行させることに用いられることを特徴とする、コンピュータ命令が記憶される非一時的コンピュータ読み取り可能な記憶媒体。
  15. コンピュータ上で動作しているときに、請求項1から6のいずれか1項に記載の質問応答ロボットの生成方法を前記コンピュータに実行させることを特徴とする、コンピュータプログラム。
JP2020211025A 2020-02-18 2020-12-21 質問応答ロボットの生成方法および装置 Active JP7093397B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010098793.0A CN111324715B (zh) 2020-02-18 2020-02-18 问答机器人的生成方法和装置
CN202010098793.0 2020-02-18

Publications (2)

Publication Number Publication Date
JP2021131846A JP2021131846A (ja) 2021-09-09
JP7093397B2 true JP7093397B2 (ja) 2022-06-29

Family

ID=71172152

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020211025A Active JP7093397B2 (ja) 2020-02-18 2020-12-21 質問応答ロボットの生成方法および装置

Country Status (5)

Country Link
US (1) US11321370B2 (ja)
EP (1) EP3869359A1 (ja)
JP (1) JP7093397B2 (ja)
KR (1) KR102490712B1 (ja)
CN (1) CN111324715B (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11487948B2 (en) * 2020-02-19 2022-11-01 Conduent Business Services, Llc Method and system for automated autonomous intent mining
CN113095056B (zh) * 2021-03-17 2024-04-12 阿里巴巴创新公司 生成方法、处理方法、装置、电子设备以及介质
TWI845290B (zh) * 2023-05-02 2024-06-11 玉山商業銀行股份有限公司 智能模型自助服務系統與運作方法
CN116450858B (zh) * 2023-06-14 2023-09-05 辰风策划(深圳)有限公司 一种电子产品用销售系统
CN117149985B (zh) * 2023-10-31 2024-03-19 海信集团控股股份有限公司 一种基于大模型的问答方法、装置、设备及介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014056376A (ja) 2012-09-12 2014-03-27 Nippon Telegr & Teleph Corp <Ntt> グループ生成クエリの作成方法、グループ生成クエリの作成プログラム、及びグループ生成クエリの作成装置
JP2017037588A (ja) 2015-08-14 2017-02-16 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7809664B2 (en) * 2007-12-21 2010-10-05 Yahoo! Inc. Automated learning from a question and answering network of humans
US9448992B2 (en) * 2013-06-04 2016-09-20 Google Inc. Natural language search results for intent queries
CN105912648A (zh) * 2016-04-08 2016-08-31 南京大学 一种基于侧面信息的代码片段编程语言识别方法
CN113505205B (zh) * 2017-01-17 2023-06-06 华为技术有限公司 一种人机对话的系统和方法
EP3528143A1 (en) * 2018-02-19 2019-08-21 Siemens Aktiengesellschaft Bot for a system
CN110209780B (zh) * 2018-08-07 2023-03-10 腾讯科技(深圳)有限公司 一种问题模板生成方法、装置、服务器及存储介质
CN109446387A (zh) * 2018-10-09 2019-03-08 众蚁(上海)信息技术有限公司 一种基于人工智能的业委会智能问答系统
CN109299476B (zh) * 2018-11-28 2023-04-18 出门问问创新科技有限公司 问答方法、装置、电子设备及存储介质
CN109920415A (zh) * 2019-01-17 2019-06-21 平安城市建设科技(深圳)有限公司 基于语音识别的人机问答方法、装置、设备和存储介质
CN110413755A (zh) * 2019-07-25 2019-11-05 腾讯科技(深圳)有限公司 一种问答库的扩充方法、装置及服务器、存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014056376A (ja) 2012-09-12 2014-03-27 Nippon Telegr & Teleph Corp <Ntt> グループ生成クエリの作成方法、グループ生成クエリの作成プログラム、及びグループ生成クエリの作成装置
JP2017037588A (ja) 2015-08-14 2017-02-16 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム

Also Published As

Publication number Publication date
CN111324715B (zh) 2023-07-14
KR20210105288A (ko) 2021-08-26
EP3869359A1 (en) 2021-08-25
US11321370B2 (en) 2022-05-03
US20210256045A1 (en) 2021-08-19
KR102490712B1 (ko) 2023-01-19
JP2021131846A (ja) 2021-09-09
CN111324715A (zh) 2020-06-23

Similar Documents

Publication Publication Date Title
JP7093397B2 (ja) 質問応答ロボットの生成方法および装置
KR102504699B1 (ko) 엔티티 링킹 방법, 장치, 기기, 저장 매체 및 컴퓨터 프로그램
JP7264866B2 (ja) イベント関係の生成方法、装置、電子機器及び記憶媒体
US20210209446A1 (en) Method for generating user interactive information processing model and method for processing user interactive information
JP2021197137A (ja) モデルを訓練するための方法、装置、電子機器、記憶媒体およびコンピュータプログラム
JP2022002079A (ja) 異種グラフノード表現用のモデル生成方法及び装置
JP7309798B2 (ja) 対話意図の認識方法及び装置、電子機器並びに記憶媒体
KR102694584B1 (ko) 이벤트 추출 방법, 이벤트 추출 장치 및 전자 기기
JP7386827B2 (ja) セマンティック処理方法、装置、電子機器及び媒体
JP2022018095A (ja) マルチモーダル事前訓練モデル取得方法、装置、電子デバイス及び記憶媒体
US11423907B2 (en) Virtual object image display method and apparatus, electronic device and storage medium
KR102521765B1 (ko) 인과 관계의 판별 방법, 장치, 전자 기기 및 저장 매체
KR20210040885A (ko) 정보 생성 방법 및 장치
US20240220812A1 (en) Method for training machine translation model, and electronic device
WO2019245966A1 (en) Constrained natural language processing
KR20210040329A (ko) 비디오 태그의 생성 방법, 장치, 전자 기기 및 저장 매체
KR20210038467A (ko) 이벤트 테마 생성 방법, 장치, 기기 및 저장 매체
JP2021111334A (ja) 検索データに基づくヒューマンコンピュータ対話型インタラクションの方法、装置及び電子機器
KR102561951B1 (ko) 모델링 매개 변수의 설정 방법, 장치, 전자 기기 및 기록 매체
JP7269972B2 (ja) 事前トレーニングのセマンティックモデルに基づくモデル改良方法及び装置
US20210390254A1 (en) Method, Apparatus and Device for Recognizing Word Slot, and Storage Medium
JP7295200B2 (ja) 汎化処理方法、装置、デバイス、コンピュータ記憶媒体及びプログラム
CN111858880B (zh) 获取查询结果的方法、装置、电子设备和可读存储介质
CN112329429B (zh) 文本相似度学习方法、装置、设备以及存储介质
JP7352640B2 (ja) 検索項目書き換え方法、装置、機器および記憶媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201221

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211207

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220317

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220614

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220617

R150 Certificate of patent or registration of utility model

Ref document number: 7093397

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150