JP7137028B1 - 質問文生成装置、質問文生成方法、質問文生成プログラム - Google Patents

質問文生成装置、質問文生成方法、質問文生成プログラム Download PDF

Info

Publication number
JP7137028B1
JP7137028B1 JP2022028009A JP2022028009A JP7137028B1 JP 7137028 B1 JP7137028 B1 JP 7137028B1 JP 2022028009 A JP2022028009 A JP 2022028009A JP 2022028009 A JP2022028009 A JP 2022028009A JP 7137028 B1 JP7137028 B1 JP 7137028B1
Authority
JP
Japan
Prior art keywords
question sentence
question
words
acquired
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022028009A
Other languages
English (en)
Other versions
JP2023124315A (ja
Inventor
洋 柳沢
恵美 井ノ口
晨博 清宮
亮太 小林
洵 長谷川
育美 森澤
沙季 竹原
祐也 生田目
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JSOL Corp
Original Assignee
JSOL Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JSOL Corp filed Critical JSOL Corp
Priority to JP2022028009A priority Critical patent/JP7137028B1/ja
Application granted granted Critical
Publication of JP7137028B1 publication Critical patent/JP7137028B1/ja
Publication of JP2023124315A publication Critical patent/JP2023124315A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

【課題】 チャットボットのテストなどに用いる質問文を効率良く生成できる質問文生成装置、質問文生成方法、質問文生成プログラムを提供する。【解決手段】 質問文を生成する質問文生成装置100であって、ユーザ会話ログ611、登録済FAQ612、テスト質問文613などから質問文を取得し、取得した質問文を構成する1つ以上の単語に対する単語類似度算出モデル68の適用結果に基づいて、取得した質問文とは異なる新たな質問文を生成する。【選択図】 図1

Description

本開示は、質問文生成装置、質問文生成方法、質問文生成プログラムに関する。
質問文と回答文との組合せからなる多数の登録データ(以下、FAQという)を備え、ユーザからの質問文に対して、対応する回答文を自動的に返す技術(以下、チャットボットという)が知られている(例えば、特許文献1参照)。チャットボットを運用していく場合、追加や変更をしたFAQへの質問文に対してチャットボットが正しい回答文を返せるかどうか(以下、回答精度という)の確認と、回答文が芳しくない場合の回答精度向上のためのチューニングが有用である。
このためには、チャットボットの運用に携わるテスト実施者(以下、テスト実施者)が、チャットボットの回答精度を確認するためのテスト質問文を作成する必要がある。そして、このテスト質問文がどれだけ実際のチャットボット利用者の質問を想定した質問文になっているかが重要となる。
特開2009-3533号公報
しかしながら、テスト質問文の作成は、特有の思考特性や熟練度を要する負荷の高い作業である。また、テスト実施者の思考特性や熟練度によっては、作成したテスト質問文が似たような文章ばかりになってしまい、バリエーション豊富なテスト質問文を作成できない場合がある。このような場合は、チャットボットの回答精度の確認やチューニングが不十分なものになってしまう可能性がある。
そこで、本開示は、チャットボットのテストなどに用いる質問文を効率良く生成できる質問文生成装置、質問文生成方法、質問文生成プログラムを提供することを目的とする。
1つの側面では、以下のような解決手段を提供する。
(1)質問文を取得する質問文取得部と、取得した質問文を構成する1つ以上の単語に対する機械学習モデルの適用結果に基づいて、前記取得した質問文とは異なる新たな質問文を生成する質問文生成部と、を備えることを特徴とする。
(2)上記(1)の構成において、前記機械学習モデルは、単語間の類似度を数値化可能であり、前記質問文生成部は、前記取得した質問文を構成する1つ以上の単語に対する前記機械学習モデルの適用結果に基づいて、前記取得した質問文の単語を前記類似度の高い単語に置き換えることで、前記取得した質問文とは異なる新たな質問文を生成することを特徴とする。
(3)上記(1)又は(2)の構成において、前記機械学習モデルは、質問文において前後への現れやすさを示す周辺出現度であって、単語間の周辺出現度、フレーズ間の周辺出現度、単語とフレーズ間の周辺出現度の少なくともいずれ1つを含む周辺出現度を数値化可能であり、前記質問文生成部は、前記取得した質問文を構成する1つ以上の単語に対する前記機械学習モデルの適用結果に基づいて、前記取得した質問文の単語又はフレーズの前又は後ろの単語又はフレーズを前記周辺出現度の高い単語又はフレーズに置き換えることで、前記取得した質問文とは異なる新たな質問文を生成することを特徴とする。
(4)上記(1)~(3)のいずれかの構成において、前記機械学習モデルは、単語間の類似度と、質問文において前後への現れやすさを示す周辺出現度であって、単語間の周辺出現度、フレーズ間の周辺出現度、単語とフレーズ間の周辺出現度の少なくともいずれ1つを含む周辺出現度と、を数値化可能であり、前記質問文生成部は、前記取得した質問文を構成する1つ以上の単語に対する前記機械学習モデルの適用結果に基づいて、前記取得した質問文の単語を前記類似度の高い単語に置き換える処理と、前記取得した質問文の単語又はフレーズの前または後ろの単語又はフレーズを前記周辺出現度の高い単語及びフレーズに置き換える処理と、を重層的に行うことで、前記取得した質問文とは異なる新たな質問文を生成することを特徴とする。
(5)上記(1)~(4)のいずれかの構成において、既存の質問文が登録される質問文登録部と、前記質問文生成部が生成した新たな質問文と前記質問文登録部に登録された質問文との類似度を算出する質問妥当性確認部と、を更に備えることを特徴とする。
(6)上記(1)~(5)のいずれかの構成において、前記取得した質問文には、チャットボットのユーザ会話ログ、登録済FAQ、ホームページ上に掲載している「よくあるご質問」や「FAQ」の内容、電話やメール・文書による問合せ記録、ホームページの問合せフォームからの問合せ内容、顧客の受付窓口での応対記録及びテスト質問文のうち少なくともいずれか1つが含まれることを特徴とする。
(7)質問文を取得する質問文取得ステップと、前記取得した質問文を構成する1つ以上の単語に対する機械学習モデルの適用結果に基づいて、前記取得した質問文とは異なる新たな質問文を生成する質問文生成ステップと、を備えることを特徴とする。
(8)質問文を取得し、前記取得した質問文を構成する1つ以上の単語に対する機械学習モデルの適用結果に基づいて、前記取得した質問文とは異なる新たな質問文を生成する処理をコンピュータに実行させることを特徴とする。
本開示によれば、チャットボットのテストなどに用いる質問文を効率良く生成することが可能となる。
質問文生成装置の機能構成及び処理の流れを示すブロック図である。 ユーザ会話ログ、登録済FAQ、分かち書きデータのデータレイアウトを示す図である。 単語類似度、質問文、質問類似度のデータレイアウトを示す図である。 単語類似度算出モデル生成器の処理を示す図である。 単語類似度算出器の処理を示す図である。 類似単語抽出器の処理を示す図である。 質問文増幅器の処理(1)を示す図である。 質問文増幅器の処理(2)を示す図である。 質問文増幅器の処理(3)を示す図である。 質問文妥当性確認器の処理を示す図である。
以下、添付図面を参照しながら各実施例について詳細に説明する。
(質問文生成装置)
質問文生成装置100は、チャットボットのテストに用いる質問文を生成する。本実施形態の質問文生成装置100は、図1に示すように、コンピュータなどのハードウェアと、質問文生成プログラムなどのソフトウェアとの協働により実現される機能構成を備える。この機能構成には、分かち書き器1、単語類似度算出モデル生成器2、単語類似度算出器3、質問文生成器4(質問文取得部、質問文生成部)、質問文妥当性確認器5(質問文妥当性確認部)などが含まれる。また、質問文生成器4には、サブの機能構成として、類似単語抽出器41、入力文抽出器42、質問文増幅器43などが含まれる。
また、質問文生成装置100の記憶部6には、質問文の生成に使用するデータやモデルが記憶される。このデータやモデルには、入力質問文61、分かち書きデータ63、単語類似度64、閾値65、質問文66、質問文類似度67、単語類似度算出モデル68などが含まれる。なお、本実施形態の入力質問文61には、後述するユーザ会話ログ611、登録済FAQ612、テスト質問文613などが含まれるが、それ以外に、ホームページ上に掲載している「よくあるご質問」や「FAQ」の内容、電話やメール・文書による問合せ記録、ホームページの問合せフォームからの問合せ内容、顧客の受付窓口での応対記録、テスト実施者が新たに考えた質問文なども含めることができる。
(質問文生成装置のデータ及びモデル)
ユーザ会話ログ611は、チャットボットを利用するユーザが問合せをしてきた際の会話(質問であるユーザ会話と回答であるボット会話とを含む)の記録データである。ユーザ会話ログ611は、例えば、図2の上段に示すようなユーザ会話ログテーブルに格納されている。一つのユーザ会話ログ611(一つのレコード)には、ユーザ会話ログ611を特定するためのユーザ会話ログIDと、ユーザの質問内容であるユーザ会話データと、質問に対する回答内容であるボット会話データと、ユーザ会話ログ611の作成日時データと、が含まれる。
登録済FAQ612は、あらかじめチャットボットに登録されている質問文と回答文の組合せデータである。登録済FAQ612は、例えば、図2の中段に示すような登録済FAQテーブル(質問文登録部)に格納されている。一つの登録済FAQ612には、登録済FAQ612を特定するための登録済FAQIDと、あらかじめ作成された質問文データと、質問文データに対応してあらかじめ作成された回答文データと、登録済FAQ612の作成日時データと、が含まれる。なお、テスト質問文613は、質問文生成装置100によって生成された質問文データ、テスト実施者が作成した質問文データ、テストに使用した質問文データなどを含めることができる。そのデータ構造は、後述する質問文66と同様なので、詳細な説明は省略する。
分かち書きデータ63は、入力質問文61のうち質問部分を対象とし、単語間にスペース等を入れて分かち書きし、各単語に品詞を付けたデータである。例えば、「ATM で 振込 を したい 。」のように分かち書きした後、「ATM:名詞、で:助詞、振込:名詞、を:助詞、したい:動詞(活用形)」のように各単語に品詞が付与される。分かち書きデータ63は、例えば、図2の下段に示すような分かち書きデータテーブルに格納されている。一つの分かち書きデータ63には、分かち書きデータ63を特定するための分かち書きデータIDと、元データを特定するための元データIDと、元データを分かち書きした分かち書き文データと、分かち書きデータ63の作成日時データと、が含まれる。この分ち書きデータ63には、過去に実施した際に生成されたデータも含まれており、新規の単語が追加されていく。
単語類似度算出モデル68は、分かち書きデータ63を利用して、各単語間の類似度と、質問文において前後への現れやすさを示す周辺出現度であって、単語間の周辺出現度、フレーズ間の周辺出現度、単語とフレーズ間の周辺出現度の少なくともいずれ1つを含む周辺出現度と、を数値化する機械学習モデルである。ここでフレーズとは複数の単語が連なって構成される単語群をいう。
単語類似度64は、分かち書きデータ63内の各単語間の類似度(どの程度似ているかを示す数値)を示すデータである。単語類似度64は、例えば、図3の上段に示すような単語類似度テーブルに格納されている。一つの単語類似度64には、単語類似度64を特定するための単語類似度IDと、単語データと、類似単語データと、単語データと類似単語データの類似度を示す類似度データと、単語類似度64の作成日時データと、が含まれる。
閾値65は、質問文生成器4による質問文の生成において類似度がどの程度の単語を対象とするかを設定する数値である。
質問文66は、質問文生成器4によって生成された質問文データである。質問文66は、例えば、図3の中段に示すような質問文テーブルに格納されている。一つの質問文66には、質問文66を特定するための質問文IDと、生成した質問文データと、質問文66の作成日時データと、が含まれる。
質問文類似度67は、生成された質問文データと登録済FAQ612との類似度を示すデータである。質問文類似度67は、例えば、図3の下段に示すような質問文類似度テーブルに格納されている。一つの質問文類似度67(一つのレコード)には、生成した質問文66を特定するための質問文IDと、類似する登録済FAQ612を特定するための登録済FAQIDと、両者の類似度を示す類似度データと、質問文類似度67の作成日時データと、が含まれる。なお、質問文IDと類似する登録済FAQIDは、多対多で対応しており、複数の類似する登録済FAQIDと対応する質問文IDについては、複数のレコードが生成される。
(質問文生成装置の機能構成)
つぎに、質問文生成装置100の各機能構成について、図1及び図4~図10を参照して説明する。
分かち書き器1は、入力質問文61のうち質問文の部分を分かち書きし、分かち書きデータ63として記憶部6の分かち書きデータテーブルに登録する。その際には、分かち書きした各単語の品詞も登録する(図4参照)。
単語類似度算出モデル生成器2は、分かち書きデータ63を利用した機械学習に基づいて、各単語間の類似度と、質問文において前後への現れやすさを示す各単語及びフレーズ間の周辺出現度とを算出可能な単語類似度算出モデル68を生成する。分かち書きデータ63を利用した機械学習において、単語の連なりの頻度、出現確率などに応じてフレーズが生成され、学習データとして利用される。フレーズは分かち書きデータ63にあらかじめ設定されていてもよい。
例えば、図4に示すように、単語類似度算出モデル生成器2は、分かち書きデータ63を読み込み、ベクトル変換アルゴリズムを用いて、入力された全単語及びフレーズを対象とした分散表現を構築する。ここで構築される分散表現が単語類似度算出モデル68となる。この単語類似度算出モデル68に任意の単語を与えると、その単語に似た単語(類似単語)の一覧や、質問文において前後に現れやすい単語(周辺出現単語)や前後に現れやすい単語群(フレーズ)の一覧を出力することが可能になる。
単語類似度算出器3は、分かち書きデータ63から名詞と動詞を抽出する。その後、抽出した各単語について、単語類似度算出モデル68を利用して各単語間の類似度を数値化し、単語類似度64として記憶部6の単語類似度テーブルに登録する(図5参照)。
質問文生成器4の類似単語抽出器41は、単語類似度64を利用して、閾値65以上の類似度を持つ単語の組合せを抽出する(図6参照)。対象の品詞は、名詞と動詞とする。
質問文生成器4の入力文抽出器42は、類似単語抽出器41で抽出された単語を順次利用し、該当する単語が使われている質問文を入力質問文61の中から抽出する。なお、質問文生成器4による質問文生成方法には、類似単語抽出器41で抽出された単語を起点として新たな質問文を生成する第1質問文生成方法と、入力質問文61から順次読み込まれる質問文を起点として新たな質問文を生成する第2質問文生成方法と、が含まれる。第1質問文生成方法における入力文抽出器42は、上述のように、類似単語抽出器41で抽出された単語を順次利用し、該当する単語が使われている質問文を入力質問文61の中から抽出するが、第2質問文生成方法における入力文抽出器42は、入力質問文61から質問文を順次読み込み、類似単語抽出器41を参照しながら質問文中の単語を処理する。
質問文生成器4の質問文増幅器43は、第1質問文生成方法の場合、入力文抽出器42で抽出された質問文の中で検索対象となった単語部分をその類似単語に置き換え(以下、置換後単語という)、新たな質問文候補とする。例えば、図7に示すように、対象の質問文が「インターネットバンキングで振込を行いたい。」であった場合、「インターネットバンキング」の部分を類似度の高い単語である「ネットバンキング」や「パソコン」に置き換える。また、「振込」の部分を類似度の高い単語である「振込み」や「振り込み」に置き換える。
つぎに、質問文増幅器43は、置換後単語の後続単語として現れやすい単語群候補を単語類似度算出モデル68に問合せ、返された単語群候補をつなげて新たな質問文候補を生成する。質問文増幅器43から単語類似度算出モデル68への問合せは、1単語だけではなく、返す単語数を指定して複数語群(フレーズ)を返すように指示することができる。具体的な処理としては、返す単語数を指定して問合せをするだけでなく、その単語数をランダムに変えたり、文中の単語の位置に応じて変えたりすることが考えられる。例えば、図7に示す例では、「ネットバンキングで振込を行いたい。」という質問文からは、「ネットバンキング」の後続フレーズとして返す単語数を、質問文の後続単語数に比べて十分大きい数字(例えば7)に設定して問い合わせた結果をつなげることで、「ネットバンキングで口座を作りたい。」や「ネットバンキングが使えない。」が生成される。同様にして、「パソコンで振込を行いたい。」という質問文からは「パソコンでインターネットバンキングをしたい。」や「パソコンで口座を作りたい。」が生成される。また、「インターネットバンキングで振込みを行いたい。」という質問文からは「インターネットバンキングで振込みがしたい。」や「インターネットバンキングで振込みをやってみたい。」が生成される。
つぎに、質問文増幅器43は、置換後単語の前述単語として現れやすい単語群候補を単語類似度算出モデル68に問合せ、返された単語群候補をつなげて新たな質問文候補を生成する。例えば、図8に示すように、「ネットバンキングで口座を作りたい。」という質問文からは「ATMで口座を作りたい。」が生成される。また、「ネットバンキングが使えない。」という質問文からは「ペイジーが使えない。」や「パソコンが使えない。」が生成される。また、「インターネットバンキングで振込みがしたい。」という質問文からは「ATMで振込みがしたい。」、「コンビニで振込みがしたい。」、「スマホで振込みがしたい。」などが生成される。なお、図8に示す単語類似度算出モデル68への問合せも、1単語だけではなく、複数語群(フレーズ)を返すように指定して行ったものである。
そして、質問文増幅器43は、図9に示すように、新たに生成された質問文候補を質問文66として記憶部6の質問文テーブルに登録する。なお、図7及び図8に示す例では、2単語「インターネットバンキング」、「振込」を対象として単語の置き換えを行ったが、実際の処理では、動詞部分である「行い(たい)」についても同様な置き換え処理が行われる。なお、類似単語による置換処理、後続単語(群)による置換処理、前述単語(群)による置換処理の順番や回数は、上述した一連の手順に限定されない。例えば、処理の順番や繰り返し回数を任意に組み合わせて実行することで、一つの質問文から、その中の単語を入れ替えて複数の新たな質問文を生成することが可能であり、更に生成した質問文の単語を入れ替えて新たな質問文を生成するという具合に質問文を重層的に処理し、増殖させることができる。また、質問文増幅器43は、第2質問文生成方法の場合、入力文抽出器42が順次読み込む質問文を対象とし、その質問文から単語を抽出し、抽出した単語が類似単語抽出器41にあるか否かを判定し、あった場合、その単語部分を類似単語に置き換える。以降の処理手順は、第1質問文生成方法と同様である。
質問文妥当性確認器5は、質問文生成器4で生成された質問文候補を順次読込み、文法や文全体として意味の通った質問文かどうかを判断する。その後、問題ないと判断された質問文について、登録済FAQ612の質問文との類似度を算出する。例えば、文章全体をベクトル化して文章単位で比較できるアルゴリズムを使用して文章間の類似度を算出する。ここで算出された質問文類似度は、質問文ID及び類似する登録済FAQIDを付与した形で質問文類似度67として記憶部6の質問文類似度テーブルに登録する。なお、質問文類似度は、既存の質問文に似通っていると高い類似度が出て、似ていないほど低い数値が出る。
また、質問文妥当性確認器5は、図10に示すように、チャットボットのテスト実施者に対して、新たに生成した質問文を、登録済FAQ612との類似度に紐付けて提供(表示)することができる。テスト実施者は、提供された質問文の要否を確認した上で、必要な質問文を取得し、チャットボットのテストに使用することができる。
以上のように構成された本実施形態の質問文生成装置100によれば、質問文を取得し、取得した質問文を構成する1つ以上の単語に対する単語類似度算出モデル68の適用結果に基づいて、取得した質問文とは異なる新たな質問文を生成する質問文生成器4を備える。これにより、チャットボットのテストなどに用いる質問文を効率良く生成できる。
また、質問文生成器4は、取得した質問文の単語に対する単語類似度算出モデル68の適用結果に基づいて、取得した質問文の単語を類似度の高い単語に置き換える。これにより、類似度の高い単語を用いた新たな質問文を自動的に生成することが可能になる。
また、質問文生成器4は、取得した質問文の単語又はフレーズに対する単語類似度算出モデル68の適用結果に基づいて、取得した質問文の単語又はフレーズを周辺出現度の高い単語又はフレーズに置き換える。これにより、周辺出現度の高い単語又はフレーズを用いた新たな質問文を自動的に生成することが可能になる。
また、質問文生成器4は、取得した質問文の単語に対する単語類似度算出モデル68の適用結果に基づいて、取得した質問文の単語を類似度の高い単語に置き換える処理と、取得した質問文の単語又はフレーズを周辺出現度の高い単語又はフレーズに置き換える処理と、を重層的に行う。これにより、類似度が高い単語と周辺出現度の高い単語又はフレーズを複合的に用いた新たな質問文を自動的に生成することが可能になる。
また、質問文生成装置100は、質問文生成器4が生成した新たな質問文と登録済FAQ612の質問文との類似度を算出する質問妥当性確認器5を更に備えるので、算出した類似度に基づいて、生成した新たな質問文の評価(有効性の確認など)を容易に行うことができる。
また、質問文生成器4が取得する質問文には、チャットボットのユーザ会話ログ611、登録済FAQ612、ホームページ上に掲載している「よくあるご質問」や「FAQ」の内容、電話やメール・文書による問合せ記録、ホームページの問合せフォームからの問合せ内容、顧客の受付窓口での応対記録及びテスト質問文613が含まれるので、テスト質問作成者の思考特性や熟練度に依存しない「チャットボット利用者が使ってきそうな質問文」を新たに自動でたくさん作りだせる。
以上、各実施例について詳述したが、特定の実施例に限定されるものではなく、特許請求の範囲に記載された範囲内において、種々の変形及び変更が可能である。また、前述した実施例の構成要素を全部又は複数を組み合わせることも可能である。
100 質問文生成装置
1 分かち書き器
2 単語類似度算出モデル生成器
3 単語類似度算出器
4 質問文生成器
41 類似単語抽出器
42 入力文抽出器
43 質問文増幅器
5 質問文妥当性確認器
6 記憶部
61 入力質問文
611 ユーザ会話ログ
612 登録済FAQ
613 テスト質問文
63 分かち書きデータ
64 単語類似度
65 閾値
66 質問文
67 質問文類似度
68 単語類似度算出モデル

Claims (7)

  1. 質問文を取得する質問文取得部と、
    取得した質問文を構成する1つ以上の単語に対する機械学習モデルの適用結果に基づいて、前記取得した質問文とは異なる新たな質問文を生成する質問文生成部と、を備え
    前記機械学習モデルは、質問文において前後への現れやすさを示す周辺出現度であって、単語間の周辺出現度、フレーズ間の周辺出現度、単語とフレーズ間の周辺出現度の少なくともいずれ1つを含む周辺出現度を数値化可能であり、
    前記質問文生成部は、前記取得した質問文を構成する1つ以上の単語に対する前記機械学習モデルの適用結果に基づいて、前記取得した質問文の単語又はフレーズの前又は後ろの単語又はフレーズを前記周辺出現度の高い単語又はフレーズに置き換えることで、前記取得した質問文とは異なる新たな質問文を生成する、質問文生成装置。
  2. 前記機械学習モデルは、単語間の類似度を数値化可能であり、
    前記質問文生成部は、前記取得した質問文を構成する1つ以上の単語に対する前記機械学習モデルの適用結果に基づいて、前記取得した質問文の単語を前記類似度の高い単語に置き換えることで、前記取得した質問文とは異なる新たな質問文を生成する、請求項1に記載の質問文生成装置。
  3. 前記機械学習モデルは、単語間の類似度と、質問文において前後への現れやすさを示す周辺出現度であって、単語間の周辺出現度、フレーズ間の周辺出現度、単語とフレーズ間の周辺出現度の少なくともいずれ1つを含む周辺出現度と、を数値化可能であり、
    前記質問文生成部は、前記取得した質問文を構成する1つ以上の単語に対する前記機械学習モデルの適用結果に基づいて、前記取得した質問文の単語を前記類似度の高い単語に置き換える処理と、前記取得した質問文の単語又はフレーズの前または後ろの単語又はフレーズを前記周辺出現度の高い単語及びフレーズに置き換える処理と、を重層的に行うことで、前記取得した質問文とは異なる新たな質問文を生成する、請求項1又は2に記載の質問文生成装置。
  4. 既存の質問文が登録される質問文登録部と、
    前記質問文生成部が生成した新たな質問文と前記質問文登録部に登録された質問文との類似度を算出する質問妥当性確認部と、を更に備える、請求項1~3のいずれか1項に記載の質問文生成装置。
  5. 前記取得した質問文には、チャットボットのユーザ会話ログ、登録済FAQ、ホームページ上に掲載している「よくあるご質問」又は「FAQ」の内容、電話メール又は文書による問合せ記録、ホームページの問合せフォームからの問合せ内容、顧客の受付窓口での応対記録及びテスト質問文のうち少なくともいずれか1つが含まれる、請求項1~4のいずれか1項に記載の質問文生成装置。
  6. コンピュータが、質問文を取得する質問文取得ステップと、
    前記コンピュータが、前記取得した質問文を構成する1つ以上の単語に対する機械学習モデルの適用結果に基づいて、前記取得した質問文とは異なる新たな質問文を生成する質問文生成ステップと、を備え
    前記機械学習モデルは、質問文において前後への現れやすさを示す周辺出現度であって、単語間の周辺出現度、フレーズ間の周辺出現度、単語とフレーズ間の周辺出現度の少なくともいずれ1つを含む周辺出現度を数値化可能であり、
    前記質問文生成ステップは、前記取得した質問文を構成する1つ以上の単語に対する前記機械学習モデルの適用結果に基づいて、前記取得した質問文の単語又はフレーズの前又は後ろの単語又はフレーズを前記周辺出現度の高い単語又はフレーズに置き換えることで、前記取得した質問文とは異なる新たな質問文を生成する、質問文生成方法。
  7. 質問文を取得し、
    前記取得した質問文を構成する1つ以上の単語に対する機械学習モデルの適用結果に基づいて、前記取得した質問文とは異なる新たな質問文を生成する
    処理をコンピュータに実行させ、
    前記機械学習モデルは、質問文において前後への現れやすさを示す周辺出現度であって、単語間の周辺出現度、フレーズ間の周辺出現度、単語とフレーズ間の周辺出現度の少なくともいずれ1つを含む周辺出現度を数値化可能であり、
    前記取得した質問文とは異なる新たな質問文を生成する処理は、前記取得した質問文を構成する1つ以上の単語に対する前記機械学習モデルの適用結果に基づいて、前記取得した質問文の単語又はフレーズの前又は後ろの単語又はフレーズを前記周辺出現度の高い単語又はフレーズに置き換えることで、前記取得した質問文とは異なる新たな質問文を生成する、質問文生成プログラム。
JP2022028009A 2022-02-25 2022-02-25 質問文生成装置、質問文生成方法、質問文生成プログラム Active JP7137028B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022028009A JP7137028B1 (ja) 2022-02-25 2022-02-25 質問文生成装置、質問文生成方法、質問文生成プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022028009A JP7137028B1 (ja) 2022-02-25 2022-02-25 質問文生成装置、質問文生成方法、質問文生成プログラム

Publications (2)

Publication Number Publication Date
JP7137028B1 true JP7137028B1 (ja) 2022-09-13
JP2023124315A JP2023124315A (ja) 2023-09-06

Family

ID=83271756

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022028009A Active JP7137028B1 (ja) 2022-02-25 2022-02-25 質問文生成装置、質問文生成方法、質問文生成プログラム

Country Status (1)

Country Link
JP (1) JP7137028B1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024171395A1 (ja) * 2023-02-16 2024-08-22 日本電信電話株式会社 生成装置、生成方法および生成プログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017037588A (ja) 2015-08-14 2017-02-16 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
JP2020190970A (ja) 2019-05-23 2020-11-26 株式会社日立製作所 文書処理装置およびその方法、プログラム
JP2021051567A (ja) 2019-09-25 2021-04-01 株式会社日立製作所 情報処理方法および情報処理装置
JP2021108033A (ja) 2019-12-27 2021-07-29 カラクリ株式会社 質問回答表示サーバ、質問回答表示方法及び質問回答表示プログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017037588A (ja) 2015-08-14 2017-02-16 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
JP2020190970A (ja) 2019-05-23 2020-11-26 株式会社日立製作所 文書処理装置およびその方法、プログラム
JP2021051567A (ja) 2019-09-25 2021-04-01 株式会社日立製作所 情報処理方法および情報処理装置
JP2021108033A (ja) 2019-12-27 2021-07-29 カラクリ株式会社 質問回答表示サーバ、質問回答表示方法及び質問回答表示プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024171395A1 (ja) * 2023-02-16 2024-08-22 日本電信電話株式会社 生成装置、生成方法および生成プログラム

Also Published As

Publication number Publication date
JP2023124315A (ja) 2023-09-06

Similar Documents

Publication Publication Date Title
US11455475B2 (en) Human-to-human conversation analysis
CN106776544B (zh) 人物关系识别方法及装置和分词方法
CN111666746B (zh) 会议纪要的生成方法及装置、电子设备及存储介质
US11531693B2 (en) Information processing apparatus, method and non-transitory computer readable medium
US8515986B2 (en) Query pattern generation for answers coverage expansion
KR20040068319A (ko) 콘텐트 변환 방법 및 장치
Mukherjee et al. Ectsum: A new benchmark dataset for bullet point summarization of long earnings call transcripts
Brown et al. Mechanized margin to digitized center: black feminism's contributions to combatting erasure within the digital humanities
WO2021068490A1 (zh) 答复消息生成方法、装置、计算机设备和存储介质
KR20210070904A (ko) 다중 문서 질의 응답을 위한 방법 및 장치
CN109389427A (zh) 问卷推送方法、装置、计算机设备和存储介质
Alhassan et al. A novel framework for Arabic dialect chatbot using machine learning
CN109615009B (zh) 一种学习内容推荐方法及电子设备
CN116227466B (zh) 一种语义不同措辞相似的句子生成方法、装置及设备
JP7137028B1 (ja) 質問文生成装置、質問文生成方法、質問文生成プログラム
Wang et al. Large language models as source planner for personalized knowledge-grounded dialogue
Elvir et al. Remembering a conversation–a conversational memory architecture for embodied conversational agents
CN114896382A (zh) 人工智能问答模型生成方法、问答方法、装置及存储介质
Yen et al. Unanswerable question correction in question answering over personal knowledge base
Zhu Deep learning for Chinese language sentiment extraction and analysis
Adolphs et al. Crowdsourcing formulaic phrases: towards a new type of spoken corpus
JP7282014B2 (ja) ワークショップ支援システム及びワークショップ支援方法
JP6942759B2 (ja) 情報処理装置、プログラム及び情報処理方法
Ma et al. Automatic question generation based on MOOC video subtitles and knowledge graph
CN116680379A (zh) 文本处理方法、装置、电子设备和计算机可读存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220310

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20220310

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220607

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220719

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220830

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220901

R150 Certificate of patent or registration of utility model

Ref document number: 7137028

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350