JP2022148678A - 言い換え文候補を提示するシステム - Google Patents
言い換え文候補を提示するシステム Download PDFInfo
- Publication number
- JP2022148678A JP2022148678A JP2021050448A JP2021050448A JP2022148678A JP 2022148678 A JP2022148678 A JP 2022148678A JP 2021050448 A JP2021050448 A JP 2021050448A JP 2021050448 A JP2021050448 A JP 2021050448A JP 2022148678 A JP2022148678 A JP 2022148678A
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- paraphrase
- data
- abstract
- representative
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
【課題】適切な言い換え文候補を生成する。【解決手段】第1テンプレートデータは、単語が任意語を示す変数に変換されている抽象化発話文と、抽象化された発話文に紐づけられており、抽象化発話文と共通語が変数に変換されている抽象化言い換え文と、抽象化言い換え文が属する分野の情報と、を含む。システムは、入力発話文において所定品詞の単語を変数に変換して、抽象化入力発話文を生成する。システムは、第1テンプレートデータを参照して、抽象化入力発話文と同一の抽象化発話文に紐づけられており、入力発話文が属する分野と同一の分野の抽象化言い換え文から、抽象化言い換え文候補を選択する。システムは、抽象化言い換え文候補の変数を入力発話文の所定品詞の単語に置き換えて、言い換え文候補として提示する。【選択図】図5
Description
本発明は、言い換え文候補を提示するシステムに関する。
近年、グローバル化やライフスタイルの多様化等の影響で対人によるコミュニケーションの複雑化が進んでいる。中でも、自治体における窓口業務やコールセンター業務、駅や空港における施設案内等、口頭言語による各種相談に対応するサービスは多数存在しており、問い合わせ数の増加や、問い合わせ内容の複雑化・高度化に伴い、既存の職員のみでの対応が難しくなってきている。
そこで、複雑化する相談対応業務を支援する対話システムの開発や実用化が進んでいる。対話システムは、サービス利用者からの質問を受け取り、それに対応する回答を自動で応答するシステムである。
高精度な回答を実現するためには、ユーザからの様々な言い方に対応できる必要がある。そのため、質問文(Q)とその回答(A)をまとめたデータ(Q&Aデータ)を、日々メンテナンスしていくことが重要となる。
システムによる回答精度を向上させるためには、1つの質問文に対して、ユーザから入力される可能性のある言い方(言い換え文)を増やすことが有効である。しかし、網羅的かつ正確な言い換え文を、考え、登録するには、類義語や曖昧な表現などの表記ゆれに関する高い日本語の能力が必要である。そのため、Q&Aデータのメンテナンス作業は、専門性の高いノウハウが求められ、かつ業務負担が高いものとなっている。
本発明の一態様は、入力された発話文に対応する言い換え文候補を提示するシステムであって、1以上のプロセッサと、1以上の記憶装置と、を含む。前記1以上の記憶装置は、第1テンプレートデータを格納する。前記第1テンプレートデータは、単語が任意語を示す変数に変換されている抽象化発話文と、前記抽象化された発話文に紐づけられており、前記抽象化発話文と共通語が変数に変換されている抽象化言い換え文と、前記抽象化言い換え文が属する分野の情報と、を含む。前記1以上のプロセッサは、入力発話文及び前記入力発話文が属する分野の情報を取得し、前記入力発話文において所定品詞の単語を変数に変換して、抽象化入力発話文を生成し、前記第1テンプレートデータを参照して、前記抽象化入力発話文と同一の抽象化発話文に紐づけられており、前記入力発話文が属する分野と同一の分野の抽象化言い換え文から、抽象化言い換え文候補を選択し、前記抽象化言い換え文候補の変数を前記入力発話文の前記所定品詞の単語に置き換えて、言い換え文候補として提示する、システム。
本発明の一態様によれば、適切な言い換え文候補を生成できる。
以下においては、便宜上その必要があるときは、複数のセクションまたは実施例に分割して説明するが、特に明示した場合を除き、それらは互いに無関係なものではなく、一方は他方の一部または全部の変形例、詳細、補足説明等の関係にある。また、以下において、要素の数等(個数、数値、量、範囲等を含む)に言及する場合、特に明示した場合及び原理的に明らかに特定の数に限定される場合等を除き、その特定の数に限定されるものではなく、特定の数以上でも以下でもよい。
本システムは、物理的な計算機システム(一つ以上の物理的な計算機)でもよいし、クラウド基盤のような計算リソース群(複数の計算リソース)上に構築されたシステムでもよい。計算機システムあるいは計算リソース群は、1以上のインタフェース装置(例えば通信装置及び入出力装置を含む)、1以上の記憶装置(例えば、メモリ(主記憶)及び補助記憶装置を含む)、及び、1以上のプロセッサを含む。
プログラムがプロセッサによって実行されることで機能が実現される場合、定められた処理が、適宜に記憶装置及び/またはインタフェース装置等を用いながら行われるため、機能はプロセッサの少なくとも一部とされてもよい。機能を主語として説明された処理は、プロセッサあるいはそのプロセッサを有するシステムが行う処理としてもよい。プログラムは、プログラムソースからインストールされてもよい。プログラムソースは、例えば、プログラム配布計算機または計算機が読み取り可能な記憶媒体(例えば計算機読み取り可能な非一過性記憶媒体)であってもよい。各機能の説明は一例であり、複数の機能が一つの機能にまとめられたり、一つの機能が複数の機能に分割されたりしてもよい。
本明細書の一実施形態は、対話システムを効率的にメンテナンスするためのシステム及び方法に関する。本明細書の一実施形態は、同一発話の言い換え文としてデータベースに追加する候補をレコメンド表示する。これにより、高い日本語能力や専門性の高いノウハウを持たない人でも、簡単かつ網羅的に言い換え文を追加することが可能となる。
<対話システムの全体構成>
図1は対話システムの構成例を示すブロック図である。対話システムは、具体的な例としては、コンピュータ等の情報処理装置により構成される。情報処理装置1は、中央処理装置(CPU)11、キーボードや画像モニタなどの入出力装置13、磁気ディスク装置や半導体記憶素装置で構成されたメモリ107を含む。
図1は対話システムの構成例を示すブロック図である。対話システムは、具体的な例としては、コンピュータ等の情報処理装置により構成される。情報処理装置1は、中央処理装置(CPU)11、キーボードや画像モニタなどの入出力装置13、磁気ディスク装置や半導体記憶素装置で構成されたメモリ107を含む。
また、外部とデータをやり取りするためのインタフェースとして、データ通信部105を含んでいてもよい。データ通信部105は、例えば外部のネットワーク70と接続される。なお、入出力装置という場合、入出力両機能を含む装置のみを意味するのではなく、入力機能のみを含む装置、出力機能のみを含む装置、さらには入出力の両方を含む装置のいずれも意味するものとする。
本実施例では計算や制御等の機能は、メモリ107に格納されたプログラムがCPU104によって実行されることで、定められた処理を他のハードウェアと協働して実現される。CPU104が実行するプログラム、その機能、あるいはその機能を実現する手段を、「機能」、「手段」、「部」、「ユニット」、「モジュール」等と呼ぶ場合がある。
図1では、概念的にCPU104が、ソフトウェアに基づいて実行する機能を、制御部115、入力処理部119、出力処理部120として示している。これらの機能を実現するためのプログラムはメモリ107に格納される。また、メモリ107には各プログラムが利用するデータとして、Q&Aデータ108、対話ログ109、言い換え文登録履歴111、言い換え文テンプレート112、言い換え文登録履歴テンプレート113、レコメンドデータテンプレート114等が格納される。
なお、上記プログラムは、ROM等に予め組み込まれて提供されたり、インストール可能な形式又は実行可能な形式のファイルでCD-ROM、CD-R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録して提供されたり、配布されてもよい。さらには、上記プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供したり、配布してもよい。
メモリ107に格納するデータは、入出力装置106又はデータ通信部105を介して端末に、入出力することができる。また、入出力装置13は、キーボードやマウス、タッチパネルやマイクなどの入力装置と、ディスプレイやタッチパネルやスピーカなどの出力装置を含むことができる。
Q&Aデータ108は、質問文とその質問に対する回答を対で保持している。本明細書の一実施形態において、Q&Aデータ108は質問の代表となる言い回しである代表文と、代表文と同じ意味であるが異なる言い回しである言い換え文が親子関係となっている。対話システム利用者のユーザ端末101より入力された質問文は、インターネット等のネットワーク102を経由し、対話システムを構成する情報処理装置103へ到着する。ユーザは、音声又はテキストにより質問文を入力できる。
本実施例の対話システムは、情報処理装置103の制御部115、入力処理部119及び出力処理部120で対話が実行される。入力処理部119は、本システムで必要な入力処理を行う処理部である。出力処理部120は、本システムで必要な出力処理を行う処理部である。
ユーザ端末101より入力された質問文は、入力処理部119により所定のフォーマットに変換されて、制御部115に送られる。制御部115は、制御部115は、入力された質問文に類似する質問(Q)をQ&Aデータ108の中から検索をし、最も類似した質問文に対する回答(A)を返す。出力処理部120は、制御部115からの回答を、ユーザ端末101に送信するためのフォーマットに変換して、データ通信部105を介して、ユーザ端末101に返す。
制御部115は、対話システムのユーザからの質問と対話システムが回答をした結果とを、対話ログ109に記録する。Q&Aデータ108のメンテナンスにおいて。制御部115は、管理者(ユーザとも呼ぶ)から入力されたユーザ発話に対してQ&Aデータ108に追加登録した言い換え文を、言い換え文登録履歴111に記録する。
以上の構成は、図1に示したように単体のコンピュータで構成してもよく、又は、入力装置、出力装置、処理装置、記憶装置の各機能部が、ネットワークで接続された他のコンピュータで構成されてもよい。また、本実施例中、ソフトウェアで構成した機能と同等の機能は、FPGA(Field Programmable Gate Array)や、ASIC(Application Specific Integrated Circuit)などのハードウェアでも実現できる。
<言い換え文テンプレートの生成>
図2は、言い換え文テンプレート112を生成する処理を示すフローチャートである。この処理は、Q&Aデータ108から言い換え文テンプレート112を生成する。本処理は、Q&Aデータ108のメンテナンス後、次のメンテナンスまでに実行される。以下に説明する例は、新たな言い換え文テンプレート112を生成し、既存テンプレートを新たなテンプレートに置き換える。これにより、言い換え文テンプレート112のデータが更新される。なお、任意のデータ更新処理を採用できる。この点は、他のテンプレートの生成に対して同様である。
図2は、言い換え文テンプレート112を生成する処理を示すフローチャートである。この処理は、Q&Aデータ108から言い換え文テンプレート112を生成する。本処理は、Q&Aデータ108のメンテナンス後、次のメンテナンスまでに実行される。以下に説明する例は、新たな言い換え文テンプレート112を生成し、既存テンプレートを新たなテンプレートに置き換える。これにより、言い換え文テンプレート112のデータが更新される。なお、任意のデータ更新処理を採用できる。この点は、他のテンプレートの生成に対して同様である。
本処理を説明する前に、Q&Aデータ108及び言い換え文テンプレート112を説明する。図6は、Q&Aデータ108管理する情報の例を模式的に示す。Q&Aデータ108は、代表文欄601、言い換え文欄602、及び回答欄603を有する。代表文欄601は、質問文(Q)の代表文を格納する。言い換え文欄602は、代表文に紐づく言い換え文を格納する。回答(A)欄603は、言い換え文及び代表文に紐づく回答文(A)を格納する。図6のレコード604から606は、それぞれ、同一の代表文に対する三つの言い換え文及びその代表文に対する回答文を示す。
図7A及び7Bは、それぞれ、1又は複数のQ&Aデータ108から生成される、言い換え文テンプレート112管理する情報の例を示す。図7Aは、一つの分野(公共分野)における言い換え文のテンプレートを示す。図7Bは、分野によって言い換え文のパターンが異なる例を示す。
図7Aの例において、言い換え文テンプレート112は、代表文欄701、言い換え文欄702、言い換え件数欄703及び分野情報欄704を有する。代表文欄701は代表質問文を格納し、言い換え文欄702は、代表質問文に紐づけられている言い換え文を格納する。言い換え文欄702は、代表文と同一の文を格納してもよい。
後述するように、代表文とそれに紐づく一つの言い換え文に共通する、所定品詞の1又は複数の単語は変数に変換されている。単語は、一つの意味を表す。本明細書の一実施形態において、変数に変換され得る品詞は名詞であり、名詞は、普通名詞、固有名詞及び動名詞を含むことができる。また、本明細書の一実施形態において、一つの代表文と言い換え文のペアにおいて変数に変換される単語は、一つである。このように、言い換え文テンプレート112は、共通語が抽象化された代表文と言い換え文を格納する。単語が変数に変換された文を、抽象化された文又はテンプレート文と呼ぶことがある。
言い換え件数欄703は、共通語が変数の代表文及び言い換え文の同一のペアとなる、変換前の代表文と言い換え文のペアの件数を示す。同一の抽象化された代表文(単語が変数に変換された代表文)が、異なる代表文から生成され得る。分野情報欄704は、Q&Aデータ108の分野を示す。本明細書の一実施形態において、一つの対話システムに対して、一つの分野が割り当てられている。一つの対話システムが異なる分野のQ&Aデータ108を含んでもよい。図7Aは、三つレコード705から707を例として示す。これらの代表文は共通であり、言い換え文が異なる。
図7Bの例において、言い換え文テンプレート112は、代表文欄708、言い換え文欄709、言い換え件数欄710及び分野情報欄711を有する。図7Bの欄は、図7Aの欄と同様である。図7Bの例において、分野情報欄711は、Q&Aデータ108の複数の分野を示している。言い換え件数欄710は、同一の代表文と言い換え文の組み合わせに対して、分野毎の件数を示す。図7Bは、六つレコード712から717を例として示す。これらの代表文は共通であり、言い換え文又は分野が異なる。
図2を参照して、言い換え文テンプレート112を生成する実施例を説明する。図2の処理は、Q&Aデータ108における各レコードに対して実行される。まず、テンプレート生成処理部116は、1又は複数の対話システムに登録されているQ&Aデータ108において、代表文と言い換え文を取得する(202)。
次に、テンプレート生成処理部116は、代表文と言い換え文に共通する単語を変数に変換する(203)。例えば図6のレコード604を例にした場合、代表文である「申請書について、記入の仕方を教えて下さい」と、それに紐づく言い換え文「申請書の記入方法を教えて下さい」に共通する単語は、「申請書」である。テンプレート生成処理部116は、「申請書」を変数Xに変換する。代表文が「Xについて、記入の仕方を教えて下さい」となり、それに紐づく言い換え文は「Xの記入方法を教えて下さい」となる。本例において、言い換え文における「記入方法」が一つの単語として認識され、代表文における「記入」とは、異なる単語であると判定されている。
他の例として、言い換え文が「申請書の記入の方法を教えて下さい」であるとする。二つの文における「申請書」と「記入」が共通する。本明細書の一実施形態は、二つの抽象化された文のペアを生成する。具体的には、一つのペアは、抽象化された代表文「Xについて、記入の仕方を教えて下さい」と抽象化された言い換え文「Xの記入の方法を教えて下さい」で構成される。他の一つのペアは、抽象化された代表文「申請書について、Xの仕方を教えて下さい」と抽象化された言い換え文「申請書のXの方法を教えて下さい」で構成される。
次に、テンプレート生成処理部116は、上記処理203で変換処理を行ったレコードに対して分野情報を付与する(204)。Q&Aデータ108に対して、分野情報が予め紐づけられている、又は、テンプレート生成処理部116は、入出力装置106を介して、管理者から分野情報を取得してもよい。この分野情報は最終的なレコメンド精度を向上させる。この点の詳細は、次の<分野情報によるレコメンド精度の向上>にて説明する。
次に、テンプレート生成処理部116は、同じ分野のデータが言い換え文テンプレート112に登録済みか確認する(205)。同じ分野のデータが言い換え文テンプレート112に登録済みの場合(205:YES)、テンプレート生成処理部116は、今回の言い換え文が言い換え文テンプレート112に登録済みか確認する(206)。
同一分野における今回の言い換え文が、言い換え文テンプレート112に登録済みの場合(205:YES、206:YES)、テンプレート生成処理部116は、対象レコードの「言い換え件数」(703)の値を1加算する(207)。今回の代表文と言い換え文の組み合わせが、未登録又は異なる分野でのみ登録されている場合(205:NO又は206:NO)、テンプレート生成処理部116は、新規レコードを言い換え文テンプレート112に追加する。
<分野情報によるレコメンド精度の向上>
代表文に対する言い換え文の展開パターンは、その分野によって異なることがある。ここでいう分野は、対話システム又はQ&Aデータを利用する環境のことであり、金融や交通、医療、公共などがあげられる。
代表文に対する言い換え文の展開パターンは、その分野によって異なることがある。ここでいう分野は、対話システム又はQ&Aデータを利用する環境のことであり、金融や交通、医療、公共などがあげられる。
例えば「○○を使いたい」という代表文に対して、医療分野の場合は「○○を処方してください」という言い換え文が考えられるが、交通分野では「○○の場所はどこですか」、公共分野の場合は「○○制度の申請方法を教えて」などといった言い換え文が考えられる。
そのため、対話システムを利用する分野が異なる場合、言い換え文テンプレートには当てはまらないという状況が発生する可能性がある。そこで、言い換え文テンプレートに分野情報を付与することで、対象分野における言い換え文テンプレートを利用することを可能とすることで、レコメンド精度の向上を図ることができる。
<言い換え文登録履歴テンプレートの生成>
次に、言い換え文の登録履歴テンプレートを生成する処理を説明する。図3は、言い換え文の登録履歴テンプレートを生成する処理の例を示すフローチャートである。この処理は、言い換え文登録履歴111から、言い換え文登録履歴テンプレート113を生成する。本処理は、Q&Aデータ108のメンテナンス後、次のメンテナンスまでに実行される。
次に、言い換え文の登録履歴テンプレートを生成する処理を説明する。図3は、言い換え文の登録履歴テンプレートを生成する処理の例を示すフローチャートである。この処理は、言い換え文登録履歴111から、言い換え文登録履歴テンプレート113を生成する。本処理は、Q&Aデータ108のメンテナンス後、次のメンテナンスまでに実行される。
まず、言い換え文登録履歴111及び言い換え文登録履歴テンプレート113を説明する。図8は、言い換え文登録履歴111管理する情報の例を示す。言い換え文登録履歴111は、1又は複数の対話システムにてメンテナンスをした内容(ユーザ発話とそれに対応する言い換え文)を、言い換え文の登録履歴として格納する。最初のメンテナンス前の言い換え文登録履歴111の初期データは、例えば、空である。図8は、三つのレコード803から805を例として示す。
図8の構成例において、言い換え文登録履歴111は、ユーザ発話欄801及び言い換え登録文欄802を有する。ユーザ発話欄801は、Q&Aデータ108への新たな言い換え文の登録のためにユーザから入力されるユーザ発話の内容を格納する。言い換え登録文欄802は、ユーザ発話に対して紐づけられており、Q&Aデータ108に登録されている言い換え文を格納する。
図9は、言い換え文登録履歴テンプレート113が管理する情報の例を示す。図9の構成例において、言い換え文登録履歴テンプレート113は、ユーザ発話欄901、言い換え登録文欄902、採用件数欄903、非採用件数欄904、及び採用率欄905を有する。図9は、三つのレコード906から908を例として示す。
ユーザ発話欄901及び言い換え登録文欄902は、それぞれ、ユーザ発話と、ユーザ発話に紐づけられ、Q&Aデータ108に登録されている言い換え文を格納する。後述するように、ユーザ発話と言い換え文に共通する単語(名詞)は変数Xに変換されている。このように、共通語が抽象化されたユーザ発話と言い換え文が格納されている。
採用件数欄903は、過去に、言い換え文登録履歴テンプレート113から言い換え登録文が採用されて、Q&Aデータ108に登録された件数(回数)を示す。後述するように、対話システムは、管理者が入力したユーザ発話に対して、推奨する、抽象化されていない言い換え文を表示する。採用件数欄903は、レコメンドに対して、管理者によって採用され、Q&Aデータ108に追加された、抽象化された言い換え登録文に対応する言い換え文の件数を示す。
非採用件数欄904は、過去に、抽象化された言い換え登録文に対応する言い換え文のレコメンドに対して、管理者に採用されなかった件数(回数)を示す。採用率欄905は、レコメンドの総数(採用件数+非採用件数)に対する採用件数の割合を示す。
図3を参照して、言い換え文登録履歴テンプレート113を生成する例を説明する。図3処理は、各レコードに対して実行される。テンプレート生成処理部116は、言い換え文登録履歴111から、ユーザ発話と言い換え登録文を取得する(302)。次に、テンプレート生成処理部116は、ユーザ発話と言い換え登録文に共通する単語(名詞)を変数に変換する。(303)
変数によってユーザ発話と言い換え文を抽象化する方法は、代表文と言い換え文の抽象化と同様である。図8におけるレコード803から、抽象化されたユーザ発話及び言い換え登録文を生成する例を説明する。ユーザ発話「配偶者区分の記入方法」と言い換え登録文「配偶者区分の記入方法を教えてください」との間において、「配偶者区分」と「記入方法」とが共通である。
テンプレート生成処理部116は、抽象化されたユーザ発話と言い換え登録文の二つのペアを生成する。一つのペアは、抽象化されたユーザ発話「Xの記入方法」と抽象化された言い換え登録文「Xの記入方法を教えてください」で構成される。もう一つペアは、抽象化されたユーザ発話「配偶者区分のX」と抽象化された言い換え登録文「配偶者区分のXを教えてください」で構成される。
次に、テンプレート生成処理部116は、抽象化されたユーザ発話と言い換え登録文がすでに言い換え文登録履歴テンプレート113に登録されているかどうかを確認する(304)。登録されていない場合(304:NO)、言い換え文登録履歴テンプレート113は、新規レコードを言い換え文登録履歴テンプレート113に追加する(305)。
新規レコードを追加した(305)後、又はすでに同一のペアが登録されている場合(304:YES)、テンプレート生成処理部116は、各レコードの採用件数欄903の値と非採用件数欄904の値から、採用率欄905の値を算出する。各レコードの採用件数欄903の値と非採用件数欄904の値は、前回の言い換え文登録履歴テンプレート113における値が使用される。
<レコメンドデータテンプレートの生成>
次に、レコメンドデータテンプレートを生成する処理を説明する。図4はレコメンドデータテンプレート114を生成する処理例を示すフローチャートである。この処理は、言い換え文テンプレート(第2テンプレートデータ)112と言い換え文登録履歴テンプレート(第3テンプレートデータ)113を結合し、レコメンドデータテンプレート(第1テンプレートデータ)114を生成する。本処理は、Q&Aデータ108のメンテナンス後、次のメンテナンスまでに実行される。
次に、レコメンドデータテンプレートを生成する処理を説明する。図4はレコメンドデータテンプレート114を生成する処理例を示すフローチャートである。この処理は、言い換え文テンプレート(第2テンプレートデータ)112と言い換え文登録履歴テンプレート(第3テンプレートデータ)113を結合し、レコメンドデータテンプレート(第1テンプレートデータ)114を生成する。本処理は、Q&Aデータ108のメンテナンス後、次のメンテナンスまでに実行される。
まず、レコメンドデータテンプレート114を説明する。図10は、レコメンドデータテンプレート114管理する情報の例を示す。レコメンドデータテンプレート114は、ユーザ発話欄1001、言い換え登録文欄1002、代表文欄1003、言い換え件数欄1004、分野情報欄1005、採用件数欄1006、非採用件数欄1007、採用率欄1008、レコメンドスコア値欄1009を有する。図10は、三つのレコード1010から1012を例として示す。
ユーザ発話欄1001、言い換え登録文欄1002、採用件数欄1006、非採用件数欄1007及び採用率欄1008は、言い換え文登録履歴テンプレート113の同名の欄901から905に、それぞれ対応する。代表文欄1003、言い換え件数欄1004及び分野情報欄1005は、言い換え文テンプレート112において、言い換え登録文欄1002が示す言い換え文に対応する、同名の欄708、710及び711のデータを格納する。
図4を参照して、レコメンドデータテンプレート114を生成する例を説明する。テンプレート生成処理部116は、言い換え文テンプレート112の言い換え文欄702の文(値)と言い換え文登録履歴テンプレート113の言い換え登録文欄902の文(値)が一致するレコードを結合して、レコメンドデータテンプレート114のテーブルを作成する(402)。
テンプレート生成処理部116は、結合後のテーブルの言い換え件数欄1004と採用率欄1008の値を用いて、レコメンドスコア値を算出する(403)。レコメンドスコア値は、「言い換え文としての使われやすさ」に採用率をかけた値である。「言い換え文としての使われやすさ」は、言い換え件数欄1004の値を、同一代表文の中で言い換え件数が最大の値で割った値である。つまり、以下の式で表される。
レコメンドスコア値=「言い換え文としての使われやすさ」*採用率
「言い換え文としての使われやすさ」
=言い換え件数/同一代表文で言い換え件数が最大の値
「言い換え文としての使われやすさ」
=言い換え件数/同一代表文で言い換え件数が最大の値
レコメンドスコア値は、他の方法で計算してもよい。例えば、「言い換え文としての使われやすさ」のみを参照してもよく、採用率のみを参照してもよい。または、採用率に代えて採用数を使用してもよい。上述のように、Q&Aデータ108から得られる値と言い換え文登録履歴111から得れる値の双方を参照することで、より適切なスコアを計算することができる。
<言い換え文候補のレコメンド表示>
<言い換え文候補のレコメンド表示>
次に、言い換え文候補をレコメンド表示する処理を説明する。図5は言い換え文候補をレコメンド表示し、さらに、管理者入力に応じてQ&Aデータ108の言い換え文の更新を行う処理例を示すフローチャートである。この処理は、言い換え文のレコメンド表示及び管理者の登録言い換え文の選択を行うための、メンテナンス画面を生成及び表示する。
まず、管理者に対して言い換え文の候補をレコメンド表示し、管理者によるQ&Aデータ108の言い換え文の更新を受け付ける、メンテナンス画面を説明する。図11は、メンテナンス画面の例を示す。図11のメンテナンス画面の例は、対象の一つの対話システムをメンテナンスするために表示される。言い換え文候補表示処理部118は、メンテナンス画面を生成し、入出力装置106において表示する。メンテナンス画面の生成のため、後述するレコメンドデータテンプレート114を含む作成済みテンプレートが参照される。
言い換え文候補表示処理部118は、メンテナンス画面を通じて、ユーザ発話を管理者からの入力として受け取り、言い換え文の候補をレコメンド表示する。さらに、Q&Aデータ108に追加する又は削除する言い換え文の管理者による指定を受け付ける。このように、メンテナンス画面を通じて、管理者は適切にQ&Aデータ108を更新できる。
管理者は、セクション1101において、言い換え文の候補の提示を望むユーザ発話を、入力する。ユーザ発話の入力は、例えば、フリーテキスト又はプルダウンメニュを使用することができる。図11の構成例において、「備考の記入方法」が、フリーテキストによって、ユーザ発話として入力されている。
言い換え文候補表示処理部118は、入力されたユーザ発話に対応する、Q&Aデータ108に登録済み代表文を、セクション1102において表示する。図11の構成例において、「備考について、記入の仕方を教えて下さい」が表示されている。
言い換え文候補表示処理部118は、Q&Aデータ108に登録済みの、言い換え文を1103において表示する。図11の例は、三つの登録済み言い換え文を示す。言い換え文候補表示処理部118は、さらに、入力されたユーザ発話に対して、推奨される言い換え文の候補のリストを、セクション1104において表示する。図11の例は、三つの言い換え文候補を示す。
推奨される言い換え文の候補のリストは、言い換え文候補それぞれの推奨度を合わせて表示する。推奨度は、レコメンドデータテンプレート114のレコメンドスコア値欄1009の値から算出される。言い換え文候補表示処理部118は、推奨度が高い順に、所定すうの言い換え文候補を表示する又は推奨度が所定閾値を超える言い換え文候補を表示してもよい。図11の構成例において、セクション1104は、推奨度の高い順に、言い換え文候補を並べる。
メンテナンス画面は、Q&Aデータ108から登録済み言い換え文を削除するためのボタン1108、及びQ&Aデータ108に新たな言い換え文を追加するためのボタン1107を含む。セクション1103は、登録済み言い換え文から削除する言い換え文を選択するためのチェックボックスを示す。セクション1104は、言い換え文候補からQ&Aデータ108に追加する言い換え文を選択するためのチェックボックスを含む。なお、登録済み言い換え文の表示や削除ボタン、代表文等は省略されてもよい。
図5を参照して、言い換え文候補のレコメンド表示の処理を説明する。図5のフローチャートにおけるステップ502から505が、この処理に対応する。ステップ502から504は、各レコードに対して実行される。言い換え文候補表示処理部118は、メンテナンス画面を表示して、管理者からのユーザ発話の入力を受け付ける。
言い換え文候補表示処理部118は、ユーザ発話に含まれる任意の名詞を変数に変換する(502)。例えば、ユーザ発話として「備考の記入方法」が入力された場合、ユーザ発話に含まれる名詞は「備考」と「記入方法」である。「備考」を変数Xとしたとき、「備考の記入方法」は、「Xの記入方法」となる。「記入方法」を変数Xとしたとき、「備考の記入方法」は、「備考のX」と変換される。
言い換え文候補表示処理部118は、変換後のユーザ発話をレコメンドデータテンプレート114のユーザ発話欄1001において検索をする(503)。レコメンドデータテンプレート114を検索するとき、メンテナンス対象の対話システムの分野情報で絞り込みを行うことで、同一分野の言い換え文の展開パターンの中から検索を行うことができる。なお、対話システムが複数分野のQ&Aデータ108を含み、メンテナンス画面が分野を指定するためのオブジェクトを含んでもよい。この構成例は、レコメンドデータテンプレート114において指定された分野のレコードを検索する。
上記例の場合、「Xの記入方法」というユーザ発話が、レコメンドデータテンプレート114のユーザ発話欄1001に存在する。検索している抽象化されたユーザ発話がユーザ発話欄1001に存在しない場合(503:未登録)、推奨される言い換え文候補は提示されない(ステップ504及び505をスキップ)。
検索している抽象化されたユーザ発話がユーザ発話欄1001に存在する場合(503:登録済)、言い換え文候補表示処理部118は、言い換え登録文欄1002の対応する言い換え文それぞれにおいて、変数を変換した単語に置き換える(504)。この例では、変数Xは、「備考」に変換される。
言い換え文候補表示処理部118は、さらに、代表文欄1003の対応する代表文の変数を、上記単語に置き換える。言い換え文候補表示処理部118は、Q&Aデータ108を参照し、変換した代表文に対応する言い換え文を取得する。言い換え文候補表示処理部118は、Q&Aデータ108に登録されている言い換え文を、推奨する言い換え文候補から削除する。
言い換え文候補表示処理部118は、Q&Aデータ108に登録済みの言い換え文を除き、変換した言い換え文を推奨する言い換え文の候補として、メンテナンス画面で表示をする(505)。言い換え文候補表示処理部118は、レコメンドスコア値欄1009の値から、言い換え文候補それぞれの推奨度を計算して、合わせて表示する。本例において、レコメンドスコア値欄1009の値が高い程、推奨度が高い。
言い換え文候補を管理者に提示する際、言い換え文候補表示処理部118は、言い換え文候補の推奨度の関係が分かるように、レコメンドスコア値に基づき言い換え文候補を表示してもよい。例えば、レコメンドスコア値欄1009の値が大きい順に、言い換え文候補を表示してもよい。これにより、言い換え文として採用される可能性の高い文が上部に表示されるため、Q&Aデータのメンテナンス作業を効率化することができる。
図11に示すように、言い換え文候補表示処理部118は、言い換え文候補の推奨度を合わせて表示してもよい。言い換え文候補表示処理部118は、推奨度に基づき表示する候補を選択してもよい。例えば、言い換え文候補表示処理部118は、最も高い候補から所定数を選択して表示してもよく、推奨度が閾値を超える候補を選択して表示してもよい。
図11に示すように、言い換え文候補表示処理部118は、入力されたユーザ発話に対応する代表文及びQ&Aデータ108に登録済みの言い換え文を、合わせて表示してもよい。上述のように、言い換え文候補表示処理部118は、推奨度に基づいて言い換え文候補を提示してよい。
<言い換え文候補の拡充及び精度の向上>
以下において、言い換え文のレコメンド表示に対する管理者からの入力に応じて、Q&Aデータ108を更新する処理を説明する。図5のフローチャートにおけるステップ506から510が、この処理を示す。ステップ506から510は、各レコード(提示された各言い換え文候補)に対して実行される。
以下において、言い換え文のレコメンド表示に対する管理者からの入力に応じて、Q&Aデータ108を更新する処理を説明する。図5のフローチャートにおけるステップ506から510が、この処理を示す。ステップ506から510は、各レコード(提示された各言い換え文候補)に対して実行される。
レコメンド表示された言い換え文候補から、Q&Aデータ108に追加する言い換え文が管理者により選択された場合(506:YES)、言い換え文候補表示処理部118は、Q&Aデータ108を更新する(507)。なお、Q&Aデータ108の更新は、管理者により行われてもよい。
例えば、図11の例において、「備考の記入方法」というユーザ発話に対して、「備考の記入方法を教えて下さい」、「備考はどのように書くのですか」といった1又は複数の言い換え文が、レコメンド表示された言い換え文の中から採用され得る。また、登録済み言い換え文から削除する言い換え文が選択されている場合、言い換え文候補表示処理部118は、Q&Aデータ108を更新する。
次に、言い換え文候補表示処理部118は、言い換え文登録履歴111に、今回追加された言い換え文のレコードを追加する(508)。また、言い換え文候補表示処理部118は、言い換え文登録履歴テンプレート113において、該当するレコードの採用件数欄903の値に1を加算する(509)。いずれの言い換え文候補も採用されなかった場合(506:NO)、言い換え文候補表示処理部118は、該当するレコードの非採用件数欄904の値に1を加算する(510)。
上述のようにQ&Aデータ108が更新されたことに応じて、図2を参照して説明したように、言い換え文テンプレート112が更新される。同様に、言い換え文登録履歴111が更新されることに応じて、図3を参照して説明したように、言い換え文登録履歴テンプレート113が更新される。また、言い換え文テンプレート112と言い換え文登録履歴テンプレート113が更新されることで、図4を参照して説明したように、レコメンドデータテンプレート114が更新される。
従って、レコメンドされた言い換え文の候補を利用してQ&Aデータ108を更新した場合、各種テンプレートが更新される。そのため、管理者によるQ&Aデータ108のメンテナンス作業を重ねていくうちに、レコメンドされる言い換え文の精度が上がり、結果的に利用している対話システムの回答精度を高めることが可能となる。
また、対話システムを運用する異なるテナントが、言い換え文のレコメンドの基礎となる各種テンプレートのデータを共有することで、一つのテナントの対話システムと異なるテナントのシステムに入力されたユーザ発話や言い換え文を利用することができる。これにより、より多様な言い回しをカバーすることができる。
<他の適用例>
以下において、本実施形態の言い換え文のレコメンド機能の適用例を説明する。図12は実施形態言い換え文レコメンド機能の適用例として、チャットボットサービスの論理構成を模式的に示す。チャットボットサービス1201は、クラウドサービス1123によるSaaSの形態で提供される。言い換え文のレコメンド機能1204は、例えば、オプション機能として提供される。
以下において、本実施形態の言い換え文のレコメンド機能の適用例を説明する。図12は実施形態言い換え文レコメンド機能の適用例として、チャットボットサービスの論理構成を模式的に示す。チャットボットサービス1201は、クラウドサービス1123によるSaaSの形態で提供される。言い換え文のレコメンド機能1204は、例えば、オプション機能として提供される。
チャットボットサービス1201は、対話機能1202、管理者用機能1203及びレコメンド機能1204を含む。チャットボットサービス1201は、テナント毎に、Q&Aデータ(Q&A)、並びに、対話ログ及び言い換え文の登録履歴(ログ)を格納している。具体的には、テナントA1208のQ&Aデータ1211及びログ1212、テナントB1209のQ&Aデータ1213及びログ1214、並びにテナントC1210のQ&Aデータ1215及び言い換え文の登録履歴(ログ)1216が、格納されている。
対話機能1202は、テナントそれぞれのQ&Aデータ1211、1213、1215を使用して、エンドユーザ1217、1219、1221それぞれと対話する。テナントの管理者1218、1220、1222は、それぞれ、管理者用機能1203及びレコメンド機能1204を使用して、そのテナントのQ&Aデータ及び言い換え文の登録履歴(ログ)を更新する。各テナントに対して分野情報が紐づけられている。
レコメンド機能1204は、図2から図5を参照して説明した処理を実行する。Q&Aデータのメンテナンスは、テナント毎に実行される。レコメンド機能1204は、言い換え文テンプレート1205、言い換え文登録履歴テンプレート1206及びレコメンドデータテンプレート1207を含む。これらは、上記言い換え文テンプレート112、言い換え文登録履歴テンプレート113及びレコメンドデータテンプレート114に対応する。
レコメンド機能1204を実現するための各種テンプレート1205から1207は、チャットボットサービスを利用するテナント1208から1210に共有され、すべてのテナント1208から1210のデータから生成される。共通のテンプレートデータを利用及び更新することで、あるテナントの利用する環境以外で入力されたユーザ発話や言い換え文を、当該テナントが利用することができる。
図13は、実施形態に係る言い換え文レコメンド機能の他の適用例を示す。図12の適用例は、クラウド環境による利用を前提とする。図13の例は、オンプレミス環境によるリコメンド機能の利用例を示す。
対話システム1301は、クラウド1305上に存在する。対話システム1301は、対話機能1302及び管理者用機能1303に加えて、本実施形態のレコメンド機能1304を含む。
対話システム1307は、対話機能1308及び管理者用機能1309に加えて、本実施形態のレコメンド機能1310を含む。対話システム1307は、オンプレミス構成を有し、また、ネットワーク1306を通じて、クラウドサービス上のレコメンド機能1304に接続をして利用することで、常に最新のレコメンド機能1310を利用することが可能となる。
対話システム1312は、対話機能1313及び管理者用機能1314に加えて、本実施形態のレコメンド機能1315を含む。対話システム1312は、外部ネットワークに接続不可なオフライン環境にある。対話システム1312の管理者は、クラウドサービス上の各種テンプレート及びレコメンド機能を購入し、対話システム1312にインストールする。これにより、レコメンド機能1315が利用可能となる。
上記構成例は、言い換え文テンプレート112及び言い換え文登録履歴テンプレート113を生成し、それらからレコメンドデータテンプレート114を生成する。他の構成例は、言い換え文テンプレート112及び言い換え文登録履歴テンプレート113の一方のみから、レコメンドデータテンプレート114を生成してもよい。レコメンドスコア値は、採用件数又は採用率の一方のみから算出することができる。分野情報は、言い換え文登録履歴111及び言い換え文登録履歴テンプレート113にも含めることができる。
なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明したすべての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。
また、上記の各構成・機能・処理部等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリや、ハードディスク、SSD(Solid State Drive)等の記録装置、または、ICカード、SDカード等の記録媒体に置くことができる。
また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしもすべての制御線や情報線を示しているとは限らない。実際には殆どすべての構成が相互に接続されていると考えてもよい。
100 ユーザ端末
102 インターネット等のネットワーク
104 CPU
106 入出力装置
107 メモリ
108 Q&Aデータ
109 対話ログ
601 Q&Aデータに登録されている代表文
602 代表文に紐づく言い換え文
702 言い換え文テンプレートに登録されている言い換え文
703 言い換え文テンプレートにおける「言い換え件数」項目
902 言い換え文登録履歴テンプレートにおける「言い換え登録文」項目
903 言い換え文登録履歴テンプレートにおける「採用件数」項目
904 言い換え文登録履歴テンプレートにおける「非採用件数」項目
905 言い換え文登録履歴テンプレートにおける「採用率」項目
1004 レコメンドデータテンプレートにおける「言い換え件数」項目
1008 レコメンドデータテンプレートにおける「採用率」項目
1009 レコメンドデータテンプレートにおける「レコメンドスコア値」項目
102 インターネット等のネットワーク
104 CPU
106 入出力装置
107 メモリ
108 Q&Aデータ
109 対話ログ
601 Q&Aデータに登録されている代表文
602 代表文に紐づく言い換え文
702 言い換え文テンプレートに登録されている言い換え文
703 言い換え文テンプレートにおける「言い換え件数」項目
902 言い換え文登録履歴テンプレートにおける「言い換え登録文」項目
903 言い換え文登録履歴テンプレートにおける「採用件数」項目
904 言い換え文登録履歴テンプレートにおける「非採用件数」項目
905 言い換え文登録履歴テンプレートにおける「採用率」項目
1004 レコメンドデータテンプレートにおける「言い換え件数」項目
1008 レコメンドデータテンプレートにおける「採用率」項目
1009 レコメンドデータテンプレートにおける「レコメンドスコア値」項目
Claims (14)
- 入力された発話文に対応する言い換え文候補を提示するシステムであって、
1以上のプロセッサと、
1以上の記憶装置と、を含み
前記1以上の記憶装置は、第1テンプレートデータを格納し、
前記第1テンプレートデータは、
単語が任意語を示す変数に変換されている抽象化発話文と、
前記抽象化された発話文に紐づけられており、前記抽象化発話文と共通語が変数に変換されている抽象化言い換え文と、
前記抽象化言い換え文が属する分野の情報と、を含み、
前記1以上のプロセッサは、
入力発話文及び前記入力発話文が属する分野の情報を取得し、
前記入力発話文において所定品詞の単語を変数に変換して、抽象化入力発話文を生成し、
前記第1テンプレートデータを参照して、前記抽象化入力発話文と同一の抽象化発話文に紐づけられており、前記入力発話文が属する分野と同一の分野の抽象化言い換え文から、抽象化言い換え文候補を選択し、
前記抽象化言い換え文候補の変数を前記入力発話文の前記所定品詞の単語に置き換えて、言い換え文候補として提示する、システム。 - 請求項1に記載のシステムであって、
前記1以上のプロセッサは、
前記提示された言い換え文候補に対するユーザ選択を受け取り、
前記1以上の記憶装置において、前記第1テンプレートデータにおける前記抽象化言い換え文それぞれの過去のユーザ採用件数を管理し、
前記過去のユーザ採用件数に基づいて、前記言い換え文候補を提示する、システム。 - 請求項2に記載のシステムであって、
前記1以上のプロセッサは、前記1以上の記憶装置において、前記第1テンプレートデータにおける前記抽象化言い換え文それぞれの過去のユーザ非採用件数を管理し、
前記過去のユーザ採用件数及びユーザ非採用件数に基づいて、前記言い換え文候補を提示する、システム。 - 請求項1に記載のシステムであって、
前記1以上の記憶装置は、質問文と前記質問文に対する回答文とを格納するQ&Aデータを格納し、
前記質問文は、代表文と前記代表文の言い換え文とを含み、
前記第1テンプレートデータは、前記抽象化言い換え文と共通語が変数に変換された、抽象化代表文を含み、
前記1以上のプロセッサは、前記提示された言い換え文候補から選択された言い換え文と、前記抽象化代表文の変数を前記所定品詞の単語に置き換えた代表文と、を前記Q&Aデータに含める、システム。 - 請求項1又は2に記載のシステムであって、
前記1以上の記憶装置は、質問文と前記質問文に対する回答文とを格納し、かつ、分野と関連付けられているQ&Aデータを格納し、
前記質問文は、代表文と前記代表文の言い換え文とを含み、
前記第1テンプレートデータの抽象化言い換え文は、前記代表文の言い換え文の抽象化言い換え文を含み、
前記1以上のプロセッサは、
前記Q&Aデータにおいて、前記代表文と前記代表文の言い換え文の共通語を変数に変換して、抽象化代表文と抽象化言い換え文のペアを生成し、
前記Q&Aデータにおいて、前記抽象化代表文と前記抽象化言い換え文の同一ペアが生成された、代表文と言い換え文のペアの件数を言い換え件数と決定し、
前記言い換え件数に基づいて、前記言い換え文候補を提示する、システム。 - 請求項1に記載のシステムであって、
前記1以上の記憶装置は、
代表文と前記代表文の言い換え文とを含む質問文と前記質問文に対する回答文とを格納し、かつ、分野と関連付けられてるQ&Aデータと、
前記ユーザ採用された言い換え文及び当該言い換え文の入力発話文を格納する、言い換え文登録履歴と、を格納し、
前記1以上のプロセッサは、
前記Q&Aデータにおいて、前記代表文と前記代表文の言い換え文の前記所定品詞の共通語を変数に変換して、抽象化代表文と抽象化言い換え文のペアを生成し、当該ペアを第2テンプレートデータに含め、
前記言い換え文登録履歴において、前記入力発話文と前記入力発話文の言い換え文の前記所定品詞の共通語を変数に変換して、抽象化発話文と抽象化言い換え文のペアを生成し、当該ペアを第3テンプレートデータに含め、
前記第2テンプレートデータと前記第3テンプレートデータにおける共通の言い換え文によって、前記第2テンプレートデータと前記第3テンプレートデータを結合したデータを、前記第1テンプレートデータに含める、システム。 - 請求項6に記載のシステムであって、
前記1以上の記憶装置は、前記Q&Aデータと前記言い換え文登録履歴の複数のペアを含み、
前記1以上のプロセッサは、
前記複数のペアの各ペアから前記第2テンプレートデータ及び前記第3テンプレートデータを生成し、
各ペアの前記第2テンプレートデータ及び前記第3テンプレートデータを結合したデータを、前記第1テンプレートデータに含める、システム。 - システムが、入力された発話文に対応する言い換え文候補を提示する方法であって、
前記システムは、第1テンプレートデータを格納し、
前記第1テンプレートデータは、
単語が任意語を示す変数に変換されている抽象化発話文と、
前記抽象化された発話文に紐づけられており、前記抽象化発話文と共通語が変数に変換されている抽象化言い換え文と、
前記抽象化言い換え文が属する分野の情報と、を含み、
前記方法は、前記システムが、
入力発話文及び前記入力発話文が属する分野の情報を取得し、
前記入力発話文において所定品詞の単語を変数に変換して、抽象化入力発話文を生成し、
前記第1テンプレートデータを参照して、前記抽象化入力発話文と同一の抽象化発話文に紐づけられており、前記入力発話文が属する分野と同一の分野の抽象化言い換え文から、抽象化言い換え文候補を選択し、
前記抽象化言い換え文候補の変数を前記入力発話文の前記所定品詞の単語に置き換えて、言い換え文候補として提示する、ことを含む方法。 - 請求項8に記載の方法であって、
前記システムが、
前記提示された言い換え文候補に対するユーザ選択を受け取り、
前記第1テンプレートデータにおける前記抽象化言い換え文それぞれの過去のユーザ採用件数を管理し、
前記過去のユーザ採用件数に基づいて、前記言い換え文候補を提示する、方法。 - 請求項9に記載の方法であって、前記システムが、
前記1以上の記憶装置において、前記第1テンプレートデータにおける前記抽象化言い換え文それぞれの過去のユーザ非採用件数を管理し、
前記過去のユーザ採用件数及びユーザ非採用件数に基づいて、前記言い換え文候補を提示する、方法。 - 請求項8に記載の方法であって、
前記システムは、質問文と前記質問文に対する回答文とを格納するQ&Aデータを格納し、
前記質問文は、代表文と前記代表文の言い換え文とを含み、
前記第1テンプレートデータは、前記抽象化言い換え文と共通語が変数に変換された、抽象化代表文を含み、
前記方法は、前記システムが、前記提示された言い換え文候補から選択された言い換え文と、前記抽象化代表文の変数を前記所定品詞の単語に置き換えた代表文と、を前記Q&Aデータに含める、方法。 - 請求項8又は9に記載の方法であって、
前記システムは、質問文と前記質問文に対する回答文とを格納し、かつ、分野と関連付けられているQ&Aデータを格納し、
前記質問文は、代表文と前記代表文の言い換え文とを含み、
前記第1テンプレートデータの抽象化言い換え文は、前記代表文の言い換え文の抽象化言い換え文を含み、
前記方法は、前記システムが、
前記Q&Aデータにおいて、前記代表文と前記代表文の言い換え文の共通語を変数に変換して、抽象化代表文と抽象化言い換え文のペアを生成し、
前記Q&Aデータにおいて、前記抽象化代表文と前記抽象化言い換え文の同一ペアが生成された、代表文と言い換え文のペアの件数を言い換え件数と決定し、
前記言い換え件数に基づいて、前記言い換え文候補を提示する、方法。 - 請求項8に記載の方法であって、
前記システムは、
代表文と前記代表文の言い換え文とを含む質問文と前記質問文に対する回答文とを格納し、かつ、分野と関連付けられてるQ&Aデータと、
前記ユーザ採用された言い換え文及び当該言い換え文の入力発話文を格納する、言い換え文登録履歴と、を格納し、
前記方法は、前記システムが、
前記Q&Aデータにおいて、前記代表文と前記代表文の言い換え文の前記所定品詞の共通語を変数に変換して、抽象化代表文と抽象化言い換え文のペアを生成し、当該ペアを第2テンプレートデータに含め、
前記言い換え文登録履歴において、前記入力発話文と前記入力発話文の言い換え文の前記所定品詞の共通語を変数に変換して、抽象化発話文と抽象化言い換え文のペアを生成し、当該ペアを第3テンプレートデータに含め、
前記第2テンプレートデータと前記第3テンプレートデータにおける共通の言い換え文によって、前記第2テンプレートデータと前記第3テンプレートデータを結合したデータを、前記第1テンプレートデータに含める、方法。 - 請求項13に記載の方法であって、
前記システムは、前記Q&Aデータと前記言い換え文登録履歴の複数のペアを含み、
前記方法は、前記システムが、
前記複数のペアの各ペアから前記第2テンプレートデータ及び前記第3テンプレートデータを生成し、
各ペアの前記第2テンプレートデータ及び前記第3テンプレートデータを結合したデータを、前記第1テンプレートデータに含める、方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021050448A JP2022148678A (ja) | 2021-03-24 | 2021-03-24 | 言い換え文候補を提示するシステム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021050448A JP2022148678A (ja) | 2021-03-24 | 2021-03-24 | 言い換え文候補を提示するシステム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022148678A true JP2022148678A (ja) | 2022-10-06 |
Family
ID=83463641
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021050448A Pending JP2022148678A (ja) | 2021-03-24 | 2021-03-24 | 言い換え文候補を提示するシステム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2022148678A (ja) |
-
2021
- 2021-03-24 JP JP2021050448A patent/JP2022148678A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11645314B2 (en) | Interactive information retrieval using knowledge graphs | |
US10282468B2 (en) | Document-based requirement identification and extraction | |
US7533089B2 (en) | Hybrid approach for query recommendation in conversation systems | |
US20190361977A1 (en) | Training data expansion for natural language classification | |
US11010700B2 (en) | Identifying task and personality traits | |
KR101751113B1 (ko) | 기억 능력을 이용하는 다중 사용자 기반의 대화 관리 방법 및 이를 수행하는 장치 | |
JP4901155B2 (ja) | 音声認識装置が使用するのに適した文法を生成するための方法、媒体、およびシステム | |
US10713288B2 (en) | Natural language content generator | |
JP2009193532A (ja) | 対話管理装置、方法及びプログラム、並びに意識抽出システム | |
AU2022223275B2 (en) | Auditing citations in a textual document | |
JP6988924B2 (ja) | 質問群抽出方法、質問群抽出装置および質問群抽出プログラム | |
US20220261545A1 (en) | Systems and methods for producing a semantic representation of a document | |
CN111159220A (zh) | 用于输出结构化查询语句的方法和装置 | |
JP2020035019A (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP5152314B2 (ja) | 対話管理装置、方法及びプログラム、並びに意識抽出システム | |
US20200183962A1 (en) | Identifying and prioritizing candidate answer gaps within a corpus | |
US20220147719A1 (en) | Dialogue management | |
WO2023103815A1 (en) | Contextual dialogue framework over dynamic tables | |
CN110249326B (zh) | 自然语言内容生成器 | |
US10762895B2 (en) | Linguistic profiling for digital customization and personalization | |
JP2022148678A (ja) | 言い換え文候補を提示するシステム | |
US20210157881A1 (en) | Object oriented self-discovered cognitive chatbot | |
JP2020149539A (ja) | 対話型システムの支援装置、及び対話型システムの支援方法 | |
US11705122B2 (en) | Interface-providing apparatus and interface-providing method | |
US11397862B2 (en) | Configuring metrics and recall levels for natural language processing annotator |