JP2020135402A - 情報処理装置、情報処理システム、情報処理方法及びプログラム - Google Patents

情報処理装置、情報処理システム、情報処理方法及びプログラム Download PDF

Info

Publication number
JP2020135402A
JP2020135402A JP2019027889A JP2019027889A JP2020135402A JP 2020135402 A JP2020135402 A JP 2020135402A JP 2019027889 A JP2019027889 A JP 2019027889A JP 2019027889 A JP2019027889 A JP 2019027889A JP 2020135402 A JP2020135402 A JP 2020135402A
Authority
JP
Japan
Prior art keywords
data
intermediate data
information
information processing
question
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019027889A
Other languages
English (en)
Other versions
JP7230573B2 (ja
Inventor
晴子 温井
Haruko Nukui
晴子 温井
孝仁 臼井
Takahito Usui
孝仁 臼井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2019027889A priority Critical patent/JP7230573B2/ja
Publication of JP2020135402A publication Critical patent/JP2020135402A/ja
Application granted granted Critical
Publication of JP7230573B2 publication Critical patent/JP7230573B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】対話システムを効率良く作成し、且つ応答の精度を向上させることを目的とする。
【解決手段】ユーザからの入力データに対して応答データを出力する対話システムと接続される情報処理装置であって、所定の記憶部から、質問と前記質問に対する回答を含む情報を収集する情報収集部と、収集した情報から前記質問の内容と前記回答の内容とを含む中間データを生成する中間データ生成部と、前記質問の内容を示すパターンデータの入力を受け付ける入力受付部と、前記パターンデータが対応付けられた前記中間データに基づき、前記対話システムへの学習用データを生成する学習用データ生成部と、前記学習用データを前記対話システムに出力する出力部と、を有する。
【選択図】図1

Description

本発明は、情報処理装置、情報処理システム、情報処理方法及びプログラムに関する。
近年では、ユーザが入力したテキストデータや音声データからキーワードを抽出し、予め作成されたデータベースを参照して、キーワードに基づく応答を出力する対話システム(チャットボット)が知られている。この対話システムは、人工知能を活用したものであり、人工知能は入力されたデータを解析して応答を出力することで対話を学習していく。
従来の対話システムにおいて参照先となるデータベースは、他のシステムで管理されるデータベースを元に作成される場合がある。単発で対話システムを作成する場合には、このデータベースから人が必要な情報を選択し、一部加工をし、対話システムに登録することで、対話システムを作成できる。しかしながら、対話システムを多数作成する場合には大変効率が悪く、また、参照先となるデータベースの情報が更新されたにも拘わらず、改めて対話システムの関連情報が更新されないという問題があった。
開示の技術は、対話システムを効率良く作成し、応答の精度を向上させることを目的とする。
開示の技術は、ユーザからの入力データに対して応答データを出力する対話システムと接続される情報処理装置であって、所定の記憶部から、質問と前記質問に対する回答を含む情報を収集する情報収集部と、収集した情報から前記質問の内容と前記回答の内容とを含む中間データを生成する中間データ生成部と、前記質問の内容を示すパターンデータの入力を受け付ける入力受付部と、前記パターンデータが対応付けられた前記中間データに基づき、前記対話システムへの学習用データを生成する学習用データ生成部と、前記学習用データを前記対話システムに出力する出力部と、を有する。
対話システムを効率良く作成し、且つ応答の精度を向上させることができる。
情報処理システムのシステム構成の一例を示す図である。 情報処理装置のハードウェア構成の一例を示す図である。 管理端末のハードウェア構成図である。 情報処理装置の機能を説明する図である。 情報処理装置の動作を説明する第一のフローチャートである。 中間データの生成について説明する第一の図である。 中間データの生成について説明する第二の図である。 中間データの生成について説明する第三の図である。 情報処理装置の動作を説明する第二のフローチャートである。 パターンデータの入力について説明する第一の図である。 パターンデータの入力について説明する第二の図である。 情報処理装置の動作を説明する第三のフローチャートである。
以下に、図面を参照して、実施形態について説明する。図1は、情報処理システムのシステム構成の一例を示す図である。
本実施形態の情報処理システム100は、情報処理装置200と管理端末300とを有する。情報処理装置200と管理端末300とは、ネットワーク等を介して接続される。
また、本実施形態の情報処理装置200は、データベース群400と、対話システム500と、ネットワーク等を介して接続される。
データベース群400は、例えば、グループウェアによって管理される複数のデータベースを含む。データベース群400に含まれる各データベースは、1つの記憶装置内に設けられていても良いし、複数の記憶装置に設けられていても良い。
図1では、例えば、データベース群400は、社内規定データベース400−1、マニュアルデータベース400−2、・・・、Q&Aデータベース400−Nを含む。社内規定データベース400−1は、例えば、グループウェアが導入された企業等において定められ規定に関する情報が格納される。マニュアルデータベース400−2は、例えば、グループウェアが導入された企業において使用されているマニュアルに関する情報が格納される。Q&Aデータベース400−Nは、グループウェアに対する質問と、質問に対する回答に関する情報が格納される。
尚、データベース群400に含まれるデータベースの数は任意の数であって良い。また、図1の例では、データベース群400としたが、情報処理システム100に含まれるデータベースは、複数ではなくても良い。
本実施形態の対話システム500は、ユーザによって、テキストデータや音声データ等の入力データが入力されると、入力データからキーワードを抽出し、予め参照先として作成された参照先データベース510から、キーワードに対応した応答データ(回答)を出力する。
対話システム500の参照先データベース510は、データベース群400に含まれる各データベースを用いて作成される。また、対話システム500は、入力データからキーワードを抽出して参照先データベースから応答データを得る処理を、人工知能に行わせる。言い換えれば、対話システム500は、参照先データベース510から、ユーザの質問に対応する回答を取得して出力する「対話」を、人工知能を介して行う。
人工知能は、参照先データベース510を参照した対話を繰り返すことによって対話を学習し、入力に対する回答の精度を向上させる。したがって、参照先データベース510に格納されたデータは、対話システム500の人工知能による対話の学習に用いられる学習用データと言える。
本実施形態の情報処理システム100では、データベース群400に格納された情報が更新された場合に、更新後のデータを人工知能による学習に用いられる学習用データの形式に変換して、対話システム500に提供する。
本実施形態では、この構成により、対話システム500の参照先データベース510に対し、参照先データベース510の元となるデータベース群400の更新を反映させることができる。
データベース群400の更新とは、例えば、データベース群400に含まれるデータベースに対する情報の追加・変更や、データベース群400に対する新たなデータベースの追加等を含む。
具体的には、本実施形態の情報処理システム100は、情報処理装置200により、データベース群400から定期的にデータを収集する(ステップS1)。
そして、情報処理装置200は、収集した情報を中間データに変換する。中間データの詳細は後述する。また、情報処理装置200は、データベース群400に対する更新の有無を判定し、更新があった場合には、管理端末300のユーザに対し、パターンデータを入力させる(ステップS2)。管理端末300のユーザとは、例えば、情報処理システム100の管理者等である。
パターンデータとは、中間データに含まれる質問の内容と同義の内容を示す少なくとも1つのテキストデータである。具体的には、パターンデータとは、中間データに含まれる質問の趣旨が変わらないように、表現の仕方(言い回し)を変えた質問文を示すテキストデータである。パターンデータの詳細は後述する。
管理端末300において、パターンデータが入力されると(ステップS3)、情報処理装置200は、中間データとパターンデータとを用いて学習用データを生成し、対話システム500に出力する(ステップS4)。
また、本実施形態の対話システム500は、対話システム500の対話に関するユーザからの評価を示す評価情報を収集し、情報処理装置200へ送信する(ステップS5)。
情報処理装置200は、評価情報に応じて、データベース群400に対して評価情報が示す内容を反映させるように、通知等を行っても良い(ステップS6)。尚、この通知は、データベース群400を管理する管理者等に通知されても良い。
このように、本実施形態によれば、対話システム500がユーザとの対話を行う際に参照される参照先データベース510の元となるデータベース群400が更新された場合に、参照先データベース510にこの更新を反映させることができる。したがって、本実施形態によれば、対話システムの応答の精度を向上させることができる。
また、本実施形態では、人により入力されたパターンデータを用いて生成した学習用データを、対話システム500に提供することで、対話システム500とユーザとの対話をより自然なものとすることができる。
尚、本実施形態の情報処理装置200は、複数のコンピュータによって実現されても良いし、1台のコンピュータによって実現されても良い。
以下に、本実施形態の情報処理システム100の有する情報処理装置200と管理端末300について説明する。
以下に、図2を参照して、情報処理装置200のハードウェア構成の一例を示す。図2は、情報処理装置のハードウェア構成の一例を示す図である。
情報処理装置200は、コンピュータによって構築されており、図2に示されているように、CPU201、ROM202、RAM203、HD204、HDD(Hard Disk Drive)コントローラ205、ディスプレイ206、外部機器接続I/F(Interface)208、ネットワークI/F209、バスライン210、キーボード211、ポインティングデバイス212、DVD−RW(Digital Versatile Disk Rewritable)ドライブ214、メディアI/F216を備えている。
これらのうち、CPU201は、情報処理装置200全体の動作を制御する。ROM202は、IPL等のCPU201の駆動に用いられるプログラムを記憶する。RAM203は、CPU201のワークエリアとして使用される。HD204は、プログラム等の各種データを記憶する。HDDコントローラ205は、CPU201の制御にしたがってHD204に対する各種データの読み出し又は書き込みを制御する。
ディスプレイ206は、カーソル、メニュー、ウィンドウ、文字、又は画像などの各種情報を表示する。外部機器接続I/F208は、各種の外部機器を接続するためのインターフェースである。この場合の外部機器は、例えば、USB(Universal Serial Bus)メモリやプリンタ等である。ネットワークI/F209は、通信ネットワークを利用してデータ通信をするためのインターフェースである。バスライン210は、図2に示されているCPU201等の各構成要素を電気的に接続するためのアドレスバスやデータバス等である。
また、キーボード211は、文字、数値、各種指示などの入力のための複数のキーを備えた入力手段の一種である。ポインティングデバイス212は、各種指示の選択や実行、処理対象の選択、カーソルの移動などを行う入力手段の一種である。DVD−RWドライブ514は、着脱可能な記録媒体の一例としてのDVD−RW213に対する各種データの読み出し又は書き込みを制御する。なお、DVD−RWに限らず、DVD−R等であってもよい。メディアI/F216は、フラッシュメモリ等の記録メディア215に対するデータの読み出し又は書き込み(記憶)を制御する。
次に、図3を参照して、管理端末300にハードウェア構成について説明する。図3は、管理端末のハードウェア構成図である。本実施形態の管理端末300は、例えば、情報処理システム100の管理者によって使用される端末装置である。
図3に示されているように、管理端末300は、CPU301、ROM302、RAM303、EEPROM304、CMOSセンサ305、撮像素子I/F306、加速度・方位センサ307、メディアI/F309、GPS受信部411を備えている。
これらのうち、CPU301は、管理端末300全体の動作を制御する。ROM302は、CPU301やIPL等のCPU301の駆動に用いられるプログラムを記憶する。RAM303は、CPU301のワークエリアとして使用される。EEPROM304は、CPU301の制御にしたがって、スマートフォン用プログラム等の各種データの読み出し又は書き込みを行う。CMOS(Complementary Metal Oxide Semiconductor)センサ305は、CPU301の制御に従って被写体(主に自画像)を撮像して画像データを得る内蔵型の撮像手段の一種である。なお、CMOSセンサではなく、CCD(Charge Coupled Device)センサ等の撮像手段であってもよい。撮像素子I/F306は、CMOSセンサ305の駆動を制御する回路である。加速度・方位センサ307は、地磁気を検知する電子磁気コンパスやジャイロコンパス、加速度センサ等の各種センサである。メディアI/F309は、フラッシュメモリ等の記録メディア308に対するデータの読み出し又は書き込み(記憶)を制御する。GPS受信部311は、GPS衛星からGPS信号を受信する。
また、管理端末300は、遠距離通信回路312、CMOSセンサ313、撮像素子I/F314、マイク315、スピーカ316、音入出力I/F317、ディスプレイ318、外部機器接続I/F(Interface)319、近距離通信回路320、近距離通信回路320のアンテナ320a、及びタッチパネル321を備えている。
これらのうち、遠距離通信回路312は、通信ネットワークを介して、他の機器と通信する回路である。CMOSセンサ313は、CPU301の制御に従って被写体を撮像して画像データを得る内蔵型の撮像手段の一種である。撮像素子I/F314は、CMOSセンサ313の駆動を制御する回路である。マイク315は、音を電気信号に変える内蔵型の回路である。スピーカ316は、電気信号を物理振動に変えて音楽や音声などの音を生み出す内蔵型の回路である。音入出力I/F317は、CPU301の制御に従ってマイク315及びスピーカ316との間で音信号の入出力を処理する回路である。ディスプレイ318は、被写体の画像や各種アイコン等を表示する液晶や有機EL(Electro Luminescence)などの表示手段の一種である。外部機器接続I/F319は、各種の外部機器を接続するためのインターフェースである。近距離通信回路320は、NFC(Near Field Communication)やBluetooth(登録商標)等の通信回路である。タッチパネル321は、利用者がディスプレイ318を押下することで、管理端末300を操作する入力手段の一種である。
また、管理端末300は、バスライン310を備えている。バスライン310は、図3に示されているCPU301等の各構成要素を電気的に接続するためのアドレスバスやデータバス等である。
次に、図4を参照して、本実施形態の情報処理装置200の機能について説明する。図4は、情報処理装置の機能を説明する図である。
本実施形態の情報処理装置200は、ファイル出力処理部250を有する。ファイル出力処理部250は、CPU201がRAM202等に格納されたプログラムを読み出して実行することで実現される。
ファイル出力処理部250は、入力受付部251、情報収集部252、中間データ生成部253、中間データ特定部254、対応付け部255、学習用データ生成部256、出力部257、表示制御部258、記憶部259を有する。
本実施形態の入力受付部251は、情報処理装置200に対する各種の入力を受け付ける。具体的には、入力受付部251は、管理端末300からのパターンデータの入力等を受け付ける。
情報収集部252は、データベース群400の各データベースに格納された情報を収集する。具体的には、情報収集部252は、各データベースに格納された情報のうち、質問と質問に対する回答を含む情報を収集する。以下の説明では、データベース群400から収集した、質問と質問に対する回答を含む情報を、FAQ(Frequently Asked Questions)情報と呼ぶ。
情報収集部252は、定期的に各データベースからFAQ情報の収集を行っても良いし、管理端末300からの指示に応じてFAQ情報の収集を行っても良い。また、情報収集部252は、データベース群400が更新された場合に、FAQ情報の収集を行っても良い。
さらに、情報収集部252は、データベース群400に含まれるデータベースのうち、予め情報の収集の対象として設定されたデータベースからFAQ情報を収集しても良い。この場合、情報の収集対象とされるデータベースは、それぞれに格納された情報同士が関連しているデータベースであっても良い。
具体的には、例えば、情報の収集対象として、データベース群400のうち、人事に関する情報が格納されたデータベースが設定されていても良い。また、例えば、情報の収集対象として、データベース群400のうち、経理に関する情報が格納されたデータベースが設定されていても良い。
また、情報収集部252は、予め設定された所定の条件を満たすFAQ情報を収集しても良い。所定の条件とは、例えば、データベース群400を管理するシステムのユーザに閲覧される頻度が一定以上であること等である。
中間データ生成部253は、情報収集部252が収集したFAQ情報から中間データを生成する。中間データは、情報収集部252が収集したFAQ情報を学習用データ生成部256による処理が可能な形式としたデータである。
より具体的には、中間データ生成部253は、FAQ情報に含まれる質問の内容と回答の内容とを抽出し、対応付けたデータである。したがって、中間データは、FAQ情報に含まれる質問と、質問に対する回答と、を含むデータとなる。中間データ生成部253により生成された中間データは、記憶部259に保持される。
中間データ特定部254は、記憶部259に保持された中間データの中から、パターンデータの入力の有無や入力内容の見直しが必要とされる中間データを特定する。具体的には、中間データ特定部254は、パターンデータが対応付けられていない中間データや、対応付けられたパターンデータの数が所定数未満である中間データを特定する。
本実施形態では、パターンデータが対応付けられていない中間データの元となるFAQ情報は、新たにデータベース群400に追加された情報か、又は、既存の情報が変更された情報である。したがって、本実施形態の中間データ特定部254は、データベース群400の更新を検出する更新検出機能を有していると言える。
また、中間データ特定部254は、例えば、データベース群400においてFAQ情報が更新されたことを示す通知を受けていた場合には、更新されたFAQ情報から生成された中間データを入力内容の見直しが必要とされる中間データに特定しても良い。
対応付け部255は、管理端末300から入力されたパターンデータを、中間データと対応付けて、記憶部259に保持させる。
学習用データ生成部256は、記憶部259において保持された、パターンデータが対応付けられた中間データを、参照先データベース510と対応した形式のデータに変換する。言い換えれば、学習用データ生成部256は、パターンデータが対応付けられた中間データから、対話システム500の人工知能の学習に用いる学習用データを生成する。生成された学習用データは、出力部257によって出力されるまで、記憶部259に保持される。
尚、参照先データベース510と対応した形式のデータとは、CSV(Comma Separated Values)形式のデータや、JSON(JavaScript(登録商標) Object Notation)形式のデータである。
出力部257は、学習用データ生成部256によって生成された学習用データを出力する。具体的には、出力部257は、対話システム500に学習用データを送信しても良いし、対話システム500で読取可能な記録媒体に学習用データを書き込んでも良い。
表示制御部258は、管理端末300に各種の画面を表示させる。具体的には、表示制御部258は、管理端末300に、中間データ特定部254により特定された中間データの一覧が表示された画面や、パターンデータの入力画面等を表示させる。
記憶部259は、中間データやパターンデータが出力部257によって出力されるまで保持する。
次に、図5を参照して、本実施形態の情報処理装置200による情報の収集について説明する。図5は、情報処理装置の動作を説明する第一のフローチャートである。図5に示す処理は、定期的に実行されても良いし、管理端末300からの指示によって実行されても良い。また、図5に示す処理は、データベース群400において情報の収集の対象とされたデータベースが更新された場合に、更新に応じて実行されても良い。
本実施形態の情報処理装置200は、情報収集部252により、情報の収集の対象となるデータベースが設定されているか否かを判定する(ステップS501)。ステップS501において、該当するデータベースが設定されていない場合、情報処理装置200は、表示制御部258により、管理端末300に、情報の収集の対象とされるデータベースの設定画面を表示させ(ステップS502)、ステップS501に戻る。
ステップS501において、情報の収集の対象となるデータベースが設定されていた場合、情報処理装置200は、情報収集部252により、設定された各データベースに格納されたFAQ情報を収集する(ステップS503)。
続いて、情報処理装置200は、情報収集部252によってFAQ情報が収集されると、中間データ生成部253により、収集したFAQ情報を中間データに変換する(ステップS504)。
続いて、情報処理装置200は、中間データ生成部253による中間データへの変換処理が終了したか否かを判定する(ステップS505)。ステップS505において、中間データへの変換処理が終了していない場合、情報処理装置200は、ステップS504に戻り、中間データへの変換処理が終了するまで待機する。
ステップS505において、中間データへの変換処理が終了した場合、情報処理装置200は、表示制御部258により、中間データの生成が完了したことを示す通知を管理端末300に送信し(ステップS506)、処理を終了する。
尚、本実施形態の情報収集部252は、一度収集した情報については、その情報が更新された場合にのみ、収集しても良い。つまり、情報収集部252は、情報を収集する際に、過去に収集した情報との差分となる情報を収集しても良い。
以下に、図6乃至図8を参照して、中間データの生成について説明する。図6は、中間データの生成について説明する第一の図である。
図6(A)は、社内規定データベース400−1に格納されていたFAQ情報の一例を示す図であり、図6(B)は、マニュアルデータベース400−2に格納されていたFAQ情報の他の例を示す図である。
図6(A)にFAQ情報60Aは、質問文61と回答文62とが、同じページに表示される文書形式の情報である。図6(B)に示すFAQ情報60Bは、質問文を親文書63−1とし、回答文を子文書63−2とした文書形式の情報である。
本実施形態の中間データ生成部253は、社内規定データベース400−1から収集されたこれらのFAQ情報60A、60Bを、質問文と回答文が1つの文書となる形式の中間データに変換する。
図7は、中間データの生成について説明する第二の図である。図7(A)は、画像データが含まれるFAQ情報の一例を示す図であり、図7(B)は、図7(A)に示すFAQ情報から生成された中間データの一例を示す図である。
図7(A)に示すFAQ情報70Aは、質問文71と画像データ72が含まれる。この場合、中間データ生成部253は、FAQ情報70Aから画像データ72を取り除き、図7(B)に示すように、FAQ情報70Aを質問文71のみを含む中間データ70Bに変換する。
図8は、中間データの生成について説明する第三の図である。図8(A)は、質問の回答を表示させるリンクを含むFAQ情報の一例を示す図であり、図8(B)は、図8(A)に示すFAQ情報から生成された中間データの一例を示す図である。
図8(A)に示すFAQ情報80Aでは、質問文81と、質問文81に対する回答文の格納先を示すリンク82とが対応付けられている。FAQ情報80Aでは、質問文83と、質問文83に対応する回答文の格納先を示すリンク84と対応付けられている。
この場合、中間データ生成部253は、FAQ情報80Aを、図8(B)に示すように、リンク82、84をテキストデータ82A、84Aとした中間データ80Bに変換する。
本実施形態では、以上のようにして、データベース群400から収集された情報を中間データに変換する。
次に、図9を参照して、パターンデータの入力について説明する。図9は、情報処理装置の動作を説明する第二のフローチャートである。
本実施形態の情報処理装置200は、入力受付部251により、パターンデータの入力画面の表示指示を受け付けたか否かを判定する(ステップS901)。ステップS901において、入力画面の表示指示を受け付けない場合、情報処理装置200は、待機する。
ステップS901において、入力画面の表示指示を受け付けた場合、情報処理装置200は、中間データ特定部254により、記憶部259に保持された中間データの中から、パターンデータの入力や見直しが必要な中間データを特定する(ステップS902)。
具体的には、中間データ特定部254は、中間データ生成部253によって生成されて記憶部259に保持された中間データに、パターンデータが対応付けられていない場合、この中間データを、パターンデータの入力が必要な中間データに特定する。
また、中間データ特定部254は、記憶部259に保持された中間データに対応付けられたパターンデータの数が所定数未満である場合に、この中間データをパターンデータの見直しが必要な中間データに特定する。
したがって、データベース群400の更新(変更)によって、新たなデータベース群400に追加された情報や、更新された情報から生成された中間データは、パターンデータが対応付けられていないため、パターンデータの入力が必要な中間データに特定される。
また、パターンデータの入力が完了していない中間データは、パターンデータの数が所定数未満であり、見直しが必要な中間データとして特定される。
続いて、情報処理装置200は、表示制御部258により、特定された中間データを含む中間データの一覧を管理端末300に表示させる(ステップS905)。このとき、表示制御部258は、中間データ特定部254によって特定された中間データの一覧を表示させても良い。このとき、表示制御部258は、中間データ特定部254によって特定された中間データのうち、パターンデータが対応付けられていない中間データの表示態様と、パターンデータが所定数未満である中間データの表示態様とを異ならせても良い。
また、表示制御部258は、記憶部259に保持されている中間データ全ての一覧を表示させても良い。この場合、表示制御部258は、中間データ特定部254によって特定された中間データの表示態様と、特定されていない中間データの表示態様とを異ならせても良い。
続いて、情報処理装置200は、入力受付部251により、管理端末300に表示された一覧から、中間データの選択を受け付けたか否かを判定する(ステップS904)。
ステップS904において、中間データの選択を受け付けない場合、情報処理装置200は、選択を受け付けるまで待機する。
ステップS904において、選択を受け付けた場合、情報処理装置200は、表示制御部258により、パターンデータの入力画面を管理端末300に表示させる(ステップS905)。
続いて、情報処理装置200は、入力受付部251により、パターンデータの入力を受け付けたか否かを判定する(ステップS906)。ステップS906において、パターンデータの入力を受け付けていない場合、情報処理装置200は、パターンデータの入力を受け付けるまで待機する。
ステップS906において、パターンデータの入力を受け付けた場合、情報処理装置200は、対応付け部255により、入力されたパターンデータと、選択された中間データとを対応付けて、記憶部259に保持させる(ステップS907)。
続いて、情報処理装置200は、入力受付部251により、パターンデータの入力の終了指示を受け付けたか否かを判定する(ステップS908)。ステップS908において、終了指示を受け付けていない場合、情報処理装置200は、終了指示を受け付けるまで待機する。
ステップS908において、パターンデータの入力の終了指示を受け付けた場合、情報処理装置200は、処理を終了する。
尚、図9の例では、中間データ特定部254は、パターンデータの入力画面の表示指示を受け付けて、中間データを特定する処理を行うものとしたが、これに限定されない。
中間データ特定部254は、例えば、図5に示す処理によって中間データが生成された時点で、パターンデータが対応付けられていない、又は、対応付けられたパターンデータが所定数未満である中間データを特定しても良い。その場合は、図5に示す処理によって、中間データの生成が終了した後に、パターンデータの入力が必要な中間データが存在することを示す通知を管理端末300へ送信しても良い。
管理端末300では、この通知を受信すると、管理端末300のユーザに対してパターンデータの入力画面の表示を促すメッセージ等を通知しても良い。
以下に、図10と図11を参照して、パターンデータの入力について説明する。図10は、パターンデータの入力について説明する第一の図である。
図10に示す画面101は、管理端末300のディスプレイ318に表示される画面の一例であり、図9のステップS903で表示される中間データの一覧画面を示している。
画面101は、中間データ特定部254によって特定された中間データと、特定されていない中間データとを含む、記憶部259に格納された全ての中間データの一覧が表示された例を示している。
画面101に示す中間データの一覧において、中間データ102と中間データ103は、中間データ特定部254によって、パターンデータが対応付けられていない中間データとして特定されたものである。つまり、中間データ102と中間データ103に対応するパターンデータは未入力である。したがって、中間データ102と中間データ103の元となるFAQ情報は、データベース群400に新たに追加された情報であるか、又は、変更された情報であることがわかる。
また、画面101において、中間データ104は、対応付けられたパターンデータの数が所定数未満であるために特定されたものである。
本実施形態では、中間データ102、103の表示態様と、中間データ104の表示態様とを異ならせている。具体的には、中間データ102と中間データ103は、パターンデータの入力を行わなければならないものとして、中間データ104よりも強調された表示態様とされる。
具体的には、例えば、中間データ102、103と中間データ104のそれぞれに異なる色のマーカを付与しても良い。また、中間データ102、103は赤字且つボールド体で表示させ、中間データ104は、青字で表示させる、等として、両者の表示態様を異ならせても良い。
また、画面101において、中間データ105は、中間データ特定部254によって特定されていない中間データである。つまり、中間データ105は、所定数よりも多数のパターンデータが対応付けられており、パターンデータの入力を行う必要がない中間データである。
本実施形態では、中間データ105の表示態様と、中間データ104の表示態様とも異ならせる。具体的には、中間データ105は、強調表示を行わないことによって、両者の表示態様を異ならせても良い。
尚、図10の例では、中間データ特定部254によって特定された中間データを強調表示させるものとしたが、これに限定されない。画面101では、例えば、所定数以上のパターンデータが対応付けられている中間データであっても、中間データの元となるFAQ情報が更新されている場合には、この中間データも、パターンデータを見直す必要があるものとして、強調表示されても良い。
本実施形態の情報処理装置200は、管理端末300の画面101において、例えば、中間データ102を選択する操作が行われると、管理端末300の画面101を図11に示すパターンデータの入力画面に遷移させる。
図11は、パターンデータの入力について説明する第二の図である。図11に示す画面111は、図9のステップS905において、管理端末300に表示される入力画面である。
図11の画面111には、中間データに含まれる質問文を示すテキストデータが表示される表示欄111Aと、パターンデータの入力欄111Bとを有する。
表示欄111Aには、例えば、画面101において選択された中間データに含まれる質問文のテキストデータが表示される。また、入力欄111Bには、管理端末300のユーザ等によって、表示欄111Aに表示された質問文の内容を変えずに表現を変えた質問文のテキストデータが入力される。
図11では、表示欄111Aに表示された質問文112に対して、入力欄111Bに、質問の内容を変えずに表現の仕方を変えた5つの質問文113が入力されている。また、図11では、表示欄111Aに表示された質問文114に対して、入力欄111Bに、質問の内容を変えずに表現の仕方を変えた3つの質問文115が入力されている。
本実施形態では、入力欄111Bに入力される複数の質問文のテキストデータのそれぞれが、表示欄111Aに表示された質問文を含む中間データと対応付けられるパターンデータとなる。
本実施形態では、所定数以上のパターンデータが対応付けられた中間データから、学習用データを生成し、対話システム500に提供する。
以下に、図12を参照して、学習用データの生成について説明する。図12は、情報処理装置の動作を説明する第三のフローチャートである。
本実施形態の情報処理装置200は、入力受付部251により、学習用データの出力要求を受け付けたか否かを判定する(ステップS1201)。ステップS1201において、出力要求を受け付けていない場合、情報処理装置200は、出力要求を受け付けるまで待機する。
ステップS1201において、出力要求を受け付けた場合、情報処理装置200は、学習用データ生成部256により、記憶部259に格納された中間データのうち、所定数以上のパターンデータが対応付けられた中間データを、パターンデータと共に抽出する(ステップS1202)。
続いて、情報処理装置200は、学習用データ生成部256により、抽出された中間データとパターンデータを学習用データに変換する(ステップS1203)。続いて、情報処理装置200は、出力部257により学習用データを出力し(ステップS1204)、処理を終了する。
本実施形態では、このように、データベース群400から収集した情報から生成された中間データに含まれる質問文を元にして、人(管理端末300のユーザ)が考えた複数パターンの言い回しを対応付ける。そして、複数パターンの言い回しが対応付けられた中間データに基づき、学習用データを生成して、対話システム500に提供する。
このため、本実施形態によれば、対話システム500の人工知能に、1つの質問文の内容に対して複数パターンの表現の仕方を学習させることができる。したがって、例えば、対話システム500は、データベース群400のFAQ情報に含まれる質問文とは異なる表現で、この質問文と同義の内容の質問が入力された場合でも、質問の内容に対応した応答を出力できるようになる。
また、本実施形態では、対話システム500において、質問に対する回答が役に立ったか否かを示す評価情報を収集し、収集された評価情報を情報処理装置200に出力しても良い。この評価情報は、例えば、対話システム500のユーザによって入力される。
情報処理装置200は、例えば、評価情報に応じて、パターンデータの見直しを促す通知を管理端末300に送信しても良い。管理端末300は、この通知を参照して、パターンデータを再入力しても良い。
また、本実施形態では、中間データとパターンデータとに基づき学習用データを生成しているが、中間データ生成部253を、パターンデータの内容も含んだ中間データを生成する構成としてもよい。また、中間データ生成部253による中間データの生成という構成に変えて、学習用データ生成部256を、収集したFAQ情報とパターンデータとに基づく学習用データを生成する構成としてもよい。
このように、本実施形態では、対話システム500のユーザによる評価情報に基づきパターンデータを変更することで、評価情報を反映させた学習用データを対話システム500へ提供することができる。
上記で説明した実施形態の各機能は、一又は複数の処理回路によって実現することが可能である。ここで、本明細書における「処理回路」とは、電子回路により実装されるプロセッサのようにソフトウェアによって各機能を実行するようプログラミングされたプロセッサや、上記で説明した各機能を実行するよう設計されたASIC(Application Specific Integrated Circuit)、DSP(digital signal processor)、FPGA(field programmable gate array)や従来の回路モジュール等のデバイスを含むものとする。
以上、各実施形態に基づき本発明の説明を行ってきたが、上記実施形態に示した要件に本発明が限定されるものではない。これらの点に関しては、本発明の主旨をそこなわない範囲で変更することができ、その応用形態に応じて適切に定めることができる。
100 情報処理システム
200 情報処理装置
250 ファイル出力処理部
251 入力受付部
252 情報収集部
253 中間データ生成部
254 中間データ特定部
255 対応付け部
256 学習用データ生成部
257 出力部
258 表示制御部
259 記憶部
300 管理端末
400 データベース群
500 対話システム
510 参照先データベース
特開2018−081444号公報

Claims (13)

  1. ユーザからの入力データに対して応答データを出力する対話システムと接続される情報処理装置であって、
    所定の記憶部から、質問と前記質問に対する回答を含む情報を収集する情報収集部と、
    収集した情報から前記質問の内容と前記回答の内容とを含む中間データを生成する中間データ生成部と、
    前記質問の内容を示すパターンデータの入力を受け付ける入力受付部と、
    前記パターンデータが対応付けられた前記中間データに基づき、前記対話システムへの学習用データを生成する学習用データ生成部と、
    前記学習用データを前記対話システムに出力する出力部と、を有する、情報処理装置。
  2. 前記中間データの一覧を管理端末に表示させる表示制御部と、を有し、
    前記表示制御部は、さらに、
    前記一覧において中間データの選択を受け付けて、選択された中間データと対応するパターンデータの入力画面を前記管理端末に表示させる、請求項1記載の情報処理装置。
  3. 前記中間データ生成部により生成された中間データの中から、更新された情報から生成された中間データを特定する中間データ特定部を有し、
    前記中間データ特定部は、
    前記中間データ生成部により生成された中間データのうち、前記パターンデータが対応付けられていない中間データを特定する、請求項2記載の情報処理装置。
  4. 前記中間データ特定部は、
    前記中間データ生成部により生成された中間データのうち、対応付けられた前記パターンデータが所定数未満である中間データを特定する、請求項3記載の情報処理装置。
  5. 前記表示制御部は、
    前記一覧において、前記パターンデータが対応付けられていない中間データの表示態様と、対応付けられた前記パターンデータが所定数未満である中間データの表示態様とを異ならせる、請求項4記載の情報処理装置。
  6. 前記情報収集部は、
    複数の前記所定の記憶部において、予め情報の収集対象として設定されたデータベースから情報を収集する、請求項1乃至5の何れか一項に記載の情報処理装置。
  7. 前記情報収集部は、
    複数の前記所定の記憶部において、閲覧頻度が所定の頻度以上である情報を収集する、請求項1乃至6の何れか一項に記載の情報処理装置。
  8. 前記パターンデータは、前記質問の内容を、該内容を問う表現とは異なる言い方で表現したテキストデータである、請求項1乃至7の何れか一項に記載の情報処理装置。
  9. ユーザからの入力データに対して応答データを出力する対話システムと接続される情報処理システムであって
    所定の記憶部から、質問と前記質問に対する回答を含む情報を収集する情報収集部と、
    収集した情報から前記質問の内容と前記回答の内容とを含む中間データを生成する中間データ生成部と、
    前記質問の内容を示すパターンデータの入力を受け付ける入力受付部と、
    前記パターンデータが対応付けられた前記中間データに基づき、前記対話システムへの学習用データを生成する学習用データ生成部と、
    前記学習用データを前記対話システムに出力する出力部と、を有する、情報処理システム。
  10. ユーザからの入力データに対して応答データを出力する対話システムと接続される情報処理装置による情報処理方法であって、前記情報処理装置が、
    所定の記憶部から、質問と前記質問に対する回答を含む情報を収集する工程と、
    収集した情報から前記質問の内容と前記回答の内容とを含む中間データを生成する工程と、
    前記質問の内容を示すパターンデータの入力を受け付ける工程と、
    前記パターンデータが対応付けられた前記中間データに基づき、前記対話システムへの学習用データを生成する工程と、
    前記学習用データを前記対話システムに出力する工程と、を実行する情報処理方法。
  11. ユーザからの入力データに対して応答データを出力する対話システムと接続される情報処理装置に、
    所定の記憶部から、質問と前記質問に対する回答を含む情報を収集する処理と、
    収集した情報から前記質問の内容と前記回答の内容とを含む中間データを生成する処理と、
    前記質問の内容を示すパターンデータの入力を受け付ける処理と、
    前記パターンデータが対応付けられた前記中間データに基づき、前記対話システムへの学習用データを生成する処理と、
    前記学習用データを前記対話システムに出力する処理と、を実行させるプログラム。
  12. ユーザからの入力データに対して応答データを出力する対話システムと接続される情報処理装置であって、
    所定の記憶部から、質問と前記質問に対する回答を含む情報を収集する情報収集部と、
    前記質問の内容について、異なる言い方にて当該内容を表現したパターンデータの入力を受け付ける入力受付部と、
    受け付けた前記パターンデータ、前記質問の内容、および前記質問に対する回答の内容とに基づく中間データを生成する中間データ生成部と、
    生成された前記中間データに基づき、前記対話システムへの学習用データを生成する学習用データ生成部と、
    前記学習用データを前記対話システムに出力する出力部と、を有する、情報処理装置。
  13. ユーザからの入力データに対して応答データを出力する対話システムと接続される情報処理装置であって、
    所定の記憶部から、質問と前記質問に対する回答を含む情報を収集する情報収集部と、
    前記質問の内容について、異なる言い方にて当該内容を表現したパターンデータの入力を受け付ける入力受付部と、
    受け付けた前記パターンデータ、前記質問の内容、および前記質問に対する回答の内容とに基づき、前記対話システムへの学習用データを生成する学習用データ生成部と、
    前記学習用データを前記対話システムに出力する出力部と、を有する、情報処理装置。
JP2019027889A 2019-02-19 2019-02-19 情報処理装置、情報処理システム、情報処理方法及びプログラム Active JP7230573B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019027889A JP7230573B2 (ja) 2019-02-19 2019-02-19 情報処理装置、情報処理システム、情報処理方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019027889A JP7230573B2 (ja) 2019-02-19 2019-02-19 情報処理装置、情報処理システム、情報処理方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2020135402A true JP2020135402A (ja) 2020-08-31
JP7230573B2 JP7230573B2 (ja) 2023-03-01

Family

ID=72278679

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019027889A Active JP7230573B2 (ja) 2019-02-19 2019-02-19 情報処理装置、情報処理システム、情報処理方法及びプログラム

Country Status (1)

Country Link
JP (1) JP7230573B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11809472B2 (en) 2021-03-23 2023-11-07 Ricoh Company, Ltd. Service providing system, information processing apparatus, information processing method

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0877179A (ja) * 1994-09-02 1996-03-22 Fujitsu Ltd 文書索引生成装置
JP2019020995A (ja) * 2017-07-14 2019-02-07 Jeインターナショナル株式会社 自動応答サーバー装置、端末装置、応答システム、応答方法、およびプログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0877179A (ja) * 1994-09-02 1996-03-22 Fujitsu Ltd 文書索引生成装置
JP2019020995A (ja) * 2017-07-14 2019-02-07 Jeインターナショナル株式会社 自動応答サーバー装置、端末装置、応答システム、応答方法、およびプログラム

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
斉藤 壮司: "SMBCグループ チャットボット導入、正答率9割に Azure上に構築、社内で活用", 日経コンピュータ, vol. 第963号, JPN6022045954, 26 April 2018 (2018-04-26), pages 084 - 087, ISSN: 0004909432 *
斎藤 由香梨: "質問応答システムにおけるマニュアルからの技術情報抽出", 第49回(平成6年後期)全国大会, JPN6022045955, 20 September 1994 (1994-09-20), pages 4 - 177, ISSN: 0004909433 *
胡 海青: "ベクトル空間モデルに基づく特定領域向け中国語質問応答システムの構築", 電気学会論文誌C, vol. 第125巻 第5号, JPN6022045956, 1 May 2005 (2005-05-01), pages 698 - 706, ISSN: 0004909434 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11809472B2 (en) 2021-03-23 2023-11-07 Ricoh Company, Ltd. Service providing system, information processing apparatus, information processing method

Also Published As

Publication number Publication date
JP7230573B2 (ja) 2023-03-01

Similar Documents

Publication Publication Date Title
WO2013157322A1 (ja) 情報処理装置およびプログラム
CN102334117B (zh) 信息处理设备、信息处理方法、程序以及信息处理系统
JP2006514493A (ja) 変更要求フォームの注釈
CN106462567A (zh) 增强的数据视图
CN105912119A (zh) 用于字符输入的方法和可穿戴装置
JP2022067402A (ja) 情報処理装置、情報処理方法、情報処理プログラム、情報処理システム
JP7201031B2 (ja) 電子機器、プログラム、グラフ画像生成システムおよび画像生成方法
JP6596373B2 (ja) 表示処理装置及び表示処理プログラム
JP7230573B2 (ja) 情報処理装置、情報処理システム、情報処理方法及びプログラム
CN113935332A (zh) 图书分级方法及图书分级设备
US20210089717A1 (en) Method and apparatus for recommending word
JP2010108331A (ja) 情報処理装置、アプリケーション起動方法およびプログラム
JP2009205348A (ja) 自動対話処理システム
JP2018109893A (ja) 情報処理方法、装置、及びプログラム
JP2021071758A (ja) プログラム、方法、及び情報処理システム
US11804055B2 (en) Information processing apparatus, information processing method, and information processing system
JP5876180B1 (ja) 情報リンクシステム、情報リンクプログラム、及び情報リンクシステムの運用方法
JP7318401B2 (ja) 連携処理装置、方法、およびプログラム
JP6455224B2 (ja) 議論支援プログラム、議論支援方法および議論支援装置
JP7380653B2 (ja) 情報処理装置、情報処理方法、情報処理プログラム、情報処理システム
US20230386508A1 (en) Information processing apparatus, information processing method, and non-transitory recording medium
JP7427936B2 (ja) ユーザサポートシステム、ユーザサポート方法およびプログラム
WO2022019145A1 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
JP2010244402A (ja) 電子書籍表示装置、電子書籍表示方法および電子書籍表示プログラム
JP2023127538A (ja) 情報処理装置、情報処理システム、情報処理方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211119

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220930

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221101

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230117

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230130

R151 Written notification of patent or utility model registration

Ref document number: 7230573

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151