JP7099397B2 - Q&a抽出装置、方法、プログラム、および応答システム - Google Patents

Q&a抽出装置、方法、プログラム、および応答システム Download PDF

Info

Publication number
JP7099397B2
JP7099397B2 JP2019078072A JP2019078072A JP7099397B2 JP 7099397 B2 JP7099397 B2 JP 7099397B2 JP 2019078072 A JP2019078072 A JP 2019078072A JP 2019078072 A JP2019078072 A JP 2019078072A JP 7099397 B2 JP7099397 B2 JP 7099397B2
Authority
JP
Japan
Prior art keywords
question
answer
index
beginning
extraction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019078072A
Other languages
English (en)
Other versions
JP2020177360A (ja
Inventor
隆一 高野
朋之 田附
潔 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2019078072A priority Critical patent/JP7099397B2/ja
Publication of JP2020177360A publication Critical patent/JP2020177360A/ja
Application granted granted Critical
Publication of JP7099397B2 publication Critical patent/JP7099397B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、Q&A抽出装置、方法、プログラム、および応答システムに関する。
従来、音声やテキストによる人間からの質問に対してコンピュータが回答することができる自動応答システム(チャットボットとも呼ばれる)が知られている(特許文献1等)。
このような自動応答システムでは、あらかじめ、多数の質問や回答(以下、Q&Aともいう)のデータを収集しておく必要がある。例えば、自動応答システムでは、収集した質問や回答のデータを教師データとして手作業により作成し、機械学習を行って自動応答のための学習済みモデルを生成したり(機械学習型の自動応答システムの場合)、あるいは、収集した質問や回答のデータをもとに自動応答のためのシナリオを手作業により作成したり(ルールベース型の自動応答システムの場合)する。
しかしながら、多数の質問や回答を収集し、教師データや自動応答のためのシナリオを手作業で作成することは手間と時間がかかり容易ではない。
そこで、本発明の一実施形態では、教師データ又は自動応答のためのシナリオを作成する負荷を軽減することを目的とする。
上述した課題を解決するために、本発明の一実施形態は、質問と回答とのうちの少なくとも一方を識別するための指標を設定する設定部と、前記指標に基づいて、データの中から前記質問と前記回答とのうちの少なくとも一方を抽出する抽出部と、を備える。
本発明の一実施形態によれば、教師データ又は自動応答のためのシナリオを作成する負荷を軽減することができる。
本発明の一実施形態に係るQ&A抽出装置を含む応答システムの全体の構成図である。 本発明の一実施形態に係るQ&A抽出装置および応答装置のハードウェア構成図である。 本発明の一実施形態に係る質問用装置のハードウェア構成図である。 本発明の一実施形態に係る質問と回答の収集例を説明するための図である。 本発明の一実施形態に係るQ&A抽出装置の機能ブロック図である。 本発明の一実施形態に係る会話の音声内の指標を説明するための図である。 本発明の一実施形態に係るウェブページ内のフォーマットによる指標を説明するための図である。 本発明の一実施形態に係るQ&A記憶部に格納されるデータの一例である。 本発明の一実施形態に係るQ&A抽出の処理のフローチャートである。 本発明の一実施形態に係るQ&A抽出の処理のフローチャートである。
以下、各実施形態について添付の図面を参照しながら説明する。なお、本明細書および図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複した説明を省略する。
<システム構成>
図1は、本発明の一実施形態に係るQ&A抽出装置10(情報処理装置の一例)を含む応答システム1の全体の構成図である。図1に示されるように、応答システム1は、Q&A抽出装置(以下、単に抽出装置ともいう)10、応答装置20、質問用装置30を含む。応答装置20は、質問用装置30および抽出装置10と任意のネットワーク40によって通信可能に接続されている。以下、それぞれについて説明する。
なお、図1では、抽出装置10と応答装置20とを別々の装置として説明しているが、抽出装置10と応答装置20とを1つの装置として実装する(例えば、既存の応答装置20内に抽出装置10を設置する)ようにしてもよい。
Q&A抽出装置10は、応答装置20が提供する自動応答サービスのために用いられる質問データと回答データとのうちの少なくとも一方を抽出する装置である。具体的には、抽出装置10は、マイク51(図4を参照しながら後述する)によって取得された音声データの中から、質問データと回答データとのうちの少なくとも一方を抽出することができる。また、抽出装置10は、ウェブページの中から、質問データと回答データとのうちの少なくとも一方を抽出することができる。後段で、図5を参照しながら、Q&A抽出装置10について詳細に説明する。
応答装置20は、質問用装置30からの質問に応答する装置である。具体的には、応答装置20は、質問用装置30から質問を受信する。また、応答装置20は、質問用装置30へ回答を送信する。
応答装置20は、音声により質問を受け付ける構成としてもよいし、テキストにより質問を受け付ける構成としてもよい。また、応答装置20は、音声により応答する構成としてもよいし、テキストにより応答する構成としてもよい。
応答装置20は、機械学習により生成された学習済みモデルに質問を入力することによって出力される回答を用いて応答する構成とすることができる。あるいは、応答装置20は、あらかじめ定められたシナリオに従って回答する構成とすることができる。つまり、応答装置20は、抽出装置10が抽出した質問や回答のデータを教師データとして機械学習を行って自動応答のための学習済みモデルを生成したり(機械学習型の場合)、あるいは、抽出装置10が抽出した質問や回答のデータをもとに自動応答のためのシナリオを生成したり(ルールベース型の場合)することができる。
質問用装置30は、応答装置20が提供する自動応答サービスに対して質問をしたい者が利用する装置である。質問用装置30は、例えば、図3で説明するようなデジタルサイネージ31、コントローラ32、マイク33、スピーカ34から構成される。なお、質問用装置30は、パーソナルコンピュータ、タブレット、スマートフォン等の任意のコンピュータであってもよい。例えば、質問用装置30は、観光地に設置される観光地を案内するための装置であり、観光地の訪問者からの質問を受け付ける。
<ハードウェア構成>
図2は、本発明の一実施形態に係るQ&A抽出装置10および応答装置20のハードウェア構成図である。抽出装置10、応答装置20は、1または複数のコンピュータからなる。
抽出装置10、応答装置20は、CPU(Central Processing Unit)11、ROM(Read Only Memory)12、RAM(Random Access Memory)13を有する。CPU11、ROM12、RAM13は、いわゆるコンピュータを形成する。
また、抽出装置10、応答装置20は、補助記憶装置14、表示装置15、操作装置16、I/F(Interface)装置17、ドライブ装置18を有する。なお、抽出装置10、応答装置20の各ハードウェアは、バス19を介して相互に接続されている。
CPU11は、補助記憶装置14にインストールされている各種プログラムを実行する演算デバイスである。
ROM12は、不揮発性メモリである。ROM12は、補助記憶装置14にインストールされている各種プログラムをCPU11が実行するために必要な各種プログラム、データ等を格納する主記憶デバイスとして機能する。具体的には、ROM12はBIOS(Basic Input/Output System)やEFI(Extensible Firmware Interface)等のブートプログラム等を格納する、主記憶デバイスとして機能する。
RAM13は、DRAM(Dynamic Random Access Memory)やSRAM(Static Random Access Memory)等の揮発性メモリである。RAM13は、補助記憶装置14にインストールされている各種プログラムがCPU11によって実行される際に展開される作業領域を提供する、主記憶デバイスとして機能する。
補助記憶装置14は、各種プログラムや、各種プログラムが実行される際に用いられる情報を格納する補助記憶デバイスである。
表示装置15は、抽出装置10、応答装置20の内部状態等を表示する表示デバイスである。
操作装置16は、抽出装置10、応答装置20の管理者が抽出装置10、応答装置20に対して各種指示を入力する入力デバイスである。
I/F装置17は、ネットワーク40に接続し、抽出装置10、応答装置20、質問用装置30と通信を行うための通信デバイスである。
ドライブ装置18は記憶媒体21をセットするためのデバイスである。ここでいう記憶媒体21には、CD-ROM、フレキシブルディスク、光磁気ディスク等のように情報を光学的、電気的あるいは磁気的に記録する媒体が含まれる。また、記憶媒体21には、EPROM (Erasable Programmable Read Only Memory)、フラッシュメモリ等のように情報を電気的に記録する半導体メモリ等が含まれていてもよい。
なお、補助記憶装置14にインストールされる各種プログラムは、例えば、配布された記憶媒体21がドライブ装置18にセットされ、該記憶媒体21に記録された各種プログラムがドライブ装置18により読み出されることでインストールされる。あるいは、補助記憶装置14にインストールされる各種プログラムは、I/F装置17を介して、ネットワーク40とは異なる他のネットワークよりダウンロードされることでインストールされてもよい。
図3は、本発明の一実施形態に係る質問用装置30のハードウェア構成図である。図3に示されるように、質問用装置30は、デジタルサイネージ31、コントローラ32、マイク33、スピーカ34を含むことができる。
デジタルサイネージ31は、例えば、タッチパネル式のサイネージである。デジタルサイネージ31は、例えば、ウェブブラウザを介して、ユーザに自動応答サービスを提供することができる。具体的には、デジタルサイネージ31は、マイク33に向かって質問を発するよう促す画面を表示することができる。また、デジタルサイネージ31は、タッチパネルを用いて質問を入力するよう促す画面を表示することができる。また、デジタルサイネージ31は、応答装置20から送信された回答を表示することができる。
コントローラ32は、デジタルサイネージ31を制御するための装置である。
マイク33は、応答装置20が提供する自動応答サービスに対して質問をしたい者が発した音声(質問)を取得する。
スピーカ34は、応答装置20から送信された音声データ(回答)を再生する。
図4は、本発明の一実施形態に係る質問と回答の収集例を説明するための図である。図4に示されるように、質問者60(例えば、観光地を訪問した訪問者)と回答者50(例えば、観光地を案内する案内者)の会話が、回答者50が装着しているマイク51によって録音される。Q&A抽出装置10は、このように取得された会話の音声データの中から、質問データと回答データとのうちの少なくとも一方を抽出することができる。
<機能ブロック>
図5は、本発明の一実施形態に係るQ&A抽出装置10の機能ブロック図である。図5に示されるように、抽出装置10は、設定部101、音声取得部102、ウェブページ検索部103、抽出部104、Q&A記憶部105を含む。また、抽出装置10は、プログラムを実行することで、設定部101、音声取得部102、ウェブページ検索部103、抽出部104として機能する。以下、それぞれについて説明する。
設定部101は、質問文や回答文を識別するための指標を設定する。具体的には、設定部101は、抽出装置10の操作装置16または他のコンピュータ等によって入力された設定を受け付ける。また、設定部101は、受け付けた設定を抽出部104が参照できるように抽出装置10内等のメモリに記憶する。
ここで、質問文や回答文を識別するための指標について説明する。以下、<会話の音声内の指標>、<ウェブページ内のフォーマットによる指標>、<ウェブページ内の自然言語解析による指標>の3つの例について説明する。
<会話の音声内の指標>
設定部101は、質問者と回答者との会話(例えば、観光地の案内者と訪問者との会話)内で、質問文の始まりおよび終わり、および、回答文の始まりおよび終わりに発せられるべき文言(以下、キーワードともいう)を、質問文や回答文を識別するための指標として設定することができる。以下、図6を参照しながら、<会話の音声内の指標>について詳細に説明する。
図6は、本発明の一実施形態に係る会話の音声内の指標を説明するための図である。図6では、左から右へ時間が経過する。例えば、質問文の始まりのキーワードを「はい、ご質問ですね」とし、質問文の終わりのキーワードを「あなたのご質問は以上ですね」とし、回答の始まりを「それに対する答えは」とし、回答の終わりを「以上です」とする。回答する人(あるいは質問する人)がこれらのキーワードを発することによって、質問文の始まりのキーワード(「はい、ご質問ですね」)から質問文の終わりのキーワード(「あなたのご質問は以上ですね」)までの間に発せられた音声が質問文であると識別されることとなる。また、回答する人(あるいは質問する人)がこれらのキーワードを発することによって、回答文の始まりのキーワード(「それに対する答えは」)から回答文の終わりのキーワード(「以上です」)までの間に発せられた音声が回答文であると識別されることとなる。
なお、会話の終わりのキーワードを設定することによって、会話が終了したことを識別できるようにしてもよい。あるいは、会話の始まりおよび終わりのキーワードを設定することによって、会話の始まりのキーワードから会話の終わりのキーワードまでの間に発せられた音声が、1つの会話であると識別できるようにしてもよい。
<ウェブページ内のフォーマットによる指標>
設定部101は、ウェブページ内の所定のフォーマットを、質問文や回答文を識別するための指標として設定することができる。以下、図7を参照しながら、<ウェブページ内のフォーマットによる指標>について詳細に説明する。
図7は、本発明の一実施形態に係るウェブページ内のフォーマットによる指標を説明するための図である。図7は、FAQ(よくある質問とその回答)のウェブページを示す。FAQのウェブページが所定のフォーマットで作成されると、質問文のフォーマットで記載された文章は質問文であると識別され、回答文のフォーマットで記載された文章は回答文であると識別されることとなる。以下、2つのフォーマット例を説明する。なお、<<フォーマット例1>>と<<フォーマット例2>>とを組み合わせてもよい。
<<フォーマット例1>>
例えば、設定部101は、HTML(HyperText Markup Language)の所定の属性(例えば、隠し属性<hidden>)を、質問文や回答文を識別するための指標として設定することができる。そのため、FAQのウェブページの作成者は、隠し属性<hidden>を用いて、質問文の始まりおよび終わり、および、回答文の始まりおよび終わりを指定することができる。なお、質問文の始まりおよび終わり、および、回答文の始まりおよび終わりの指定は、隠し属性<hidden>であるので、図7のように、ユーザのウェブブラウザ上には表示されない。
なお、一連の文章の終わりの隠し属性<hidden>を設定することによって、一連の文章が終了したことを識別できるようにしてもよい。あるいは、一連の文章の始まりおよび終わりの隠し属性<hidden>を設定することによって、一連の文章の始まりの隠し属性<hidden>から一連の文章の終わりの隠し属性<hidden>までの間に記載された文章が、1つのFAQの対であると識別できるようにしてもよい。
<<フォーマット例2>>
例えば、設定部101は、ウェブページ内で文章が配置される位置を、質問文や回答文を識別するための指標として設定することができる。そのため、FAQのウェブページの作成者は、例えば、図7のように、左側の欄に配置される文章を質問文、右側の欄に配置される文章を回答文と指定することができる。
<ウェブページ内の自然言語解析による指標>
設定部101は、質問または質問内の一部の文言を、回答文を識別するための指標として設定することができる。例えば、設定部101は、質問者が質問用装置30に入力した質問または質問内の一部の文言、あるいは、応答システム1のシステム管理者等が指定した質問または質問内の一部の文言を、指標として設定することができる。
図5の説明に戻る。音声取得部102は、質問者と回答者との会話の音声データを取得する。例えば、音声取得部102は、回答者が装着しているマイク51(図4参照)が集音した質問者と回答者との会話の音声データを取得する。また、音声取得部102は、取得した音声データをテキスト化して文書データを生成する。また、音声取得部102は、生成した文書データを抽出部104が参照できるように抽出装置10内等のメモリに記憶する。
なお、本発明の一実施形態では、Q&A抽出装置10は、音声データをテキスト化して文書データを生成することなく、音声データのままで処理を行う(つまり、音声データから質問文、回答文を特定して抽出する)構成とすることもできる。
ウェブページ検索部103は、ウェブページ(HTML)を取得する。例えば、ウェブページ検索部103は、指定された範囲または全てのウェブページから情報を収集(クロール)する。また、ウェブページ検索部103は、収集した情報をテキスト化して文書データを生成する。また、ウェブページ検索部103は、生成した文書データを抽出部104が参照できるように抽出装置10内等のメモリに記憶する。
抽出部104は、音声取得部102が生成した文書データ、ウェブページ検索部103が生成した文書データの中から、設定部101が設定した指標に基づいて、質問と回答とのうちの少なくとも一方を抽出する。また、抽出部104は、抽出した質問および回答をQ&A記憶部105に記憶する。以下、<会話の音声内の指標に基づいて抽出>、<ウェブページ内のフォーマットによる指標に基づいて抽出>、<ウェブページ内の自然言語解析による指標に基づいて抽出>の3つの例に分けて説明する。
<会話の音声内の指標に基づいて抽出>
抽出部104は、音声取得部102が生成した文書データの中から、設定部101によって設定された質問文の始まりおよび終わり、および、回答文の始まりおよび終わりに発せられるべきキーワードを検索する。また、抽出部104は、質問文の始まりのキーワードから質問文の終わりのキーワードまでの間の文章を質問として抽出する。また、抽出部104は、回答文の始まりのキーワードから回答文の終わりのキーワードまでの間の文章を回答として抽出する。
このように、<会話の音声内の指標に基づいて抽出>では、回答する人(あるいは質問する人)は、所定のキーワードを発するだけで会話内の質問と回答とをQ&Aとして登録することができる。また、所定のキーワードが発せられないかぎり質問と回答とが登録されないので、不必要な会話(例えば、応答装置20が必要としない情報)が登録されずに済む。
<ウェブページ内のフォーマットによる指標に基づいて抽出>
抽出部104は、ウェブページ検索部103が生成した文書データの中から、設定部101によって設定されたフォーマットで記載された文章を抽出する。以下、上述した2つのフォーマット例に分けて説明する。
<<フォーマット例1のウェブページからの抽出>>
例えば、抽出部104は、ウェブページ検索部103が生成した文書データの中から、設定部101によって設定されたHTMLの所定の属性(例えば、隠し属性<hidden>)を検索する。また、抽出部104は、HTMLの所定の属性(例えば、隠し属性<hidden>)を用いて指定された、質問文の始まりおよび終わり、および、回答文の始まりおよび終わりを検索する。また、抽出部104は、質問文の始まりの隠し属性<hidden>から質問文の終わりの隠し属性<hidden>までの間の文章を質問として抽出する。また、抽出部104は、回答文の始まりの隠し属性<hidden>から回答文の終わりの隠し属性<hidden>までの間の文章を回答として抽出する。
<<フォーマット例2のウェブページからの抽出>>
例えば、抽出部104は、ウェブページ検索部103が生成した文書データの中から、設定部101によって設定された位置に配置される文章を検索する。また、抽出部104は、質問文が配置されるべきと設定部101によって設定された位置にある文章を質問として抽出する。また、抽出部104は、回答文が配置されるべきと設定部101によって設定された位置にある文章を回答として抽出する。
このように、<ウェブページ内のフォーマットによる指標に基づいて抽出>では、ウェブページの作成者は、所定のフォーマットでFAQを記載するだけでFAQ内の質問と回答とをQ&Aとして登録することができる。また、ウェブページ内のFAQが更新されると、更新されたFAQ内の質問と回答とが自動的にQ&Aとして登録される。
<ウェブページ内の自然言語解析による指標に基づいて抽出>
抽出部104は、ウェブページ検索部103が生成した文書データを自然言語解析し、設定部101によって設定された質問または質問内の一部の文言に対する回答を抽出する。
ここで、<ウェブページ内の自然言語解析による指標に基づいて抽出>が行われるタイミングの例について説明する。
<タイミング1>
応答装置20が、<会話の音声内の指標に基づいて抽出>や<ウェブページ内のフォーマットによる指標に基づいて抽出>によって事前に収集された質問および回答を用いて稼働中であるとする。抽出部104は、応答装置20が質問用装置30からの質問に対する回答を見つけ出せないときに、<ウェブページ内の自然言語解析による指標に基づいて抽出>によって回答を見つけ出す構成とすることができる。
<タイミング2>
抽出部104は、<会話の音声内の指標に基づいて抽出>や<ウェブページ内のフォーマットによる指標に基づいて抽出>と同様に、<ウェブページ内の自然言語解析による指標に基づいて抽出>によって回答を収集する構成とすることができる。応答装置20は、<会話の音声内の指標に基づいて抽出><ウェブページ内のフォーマットによる指標に基づいて抽出><ウェブページ内の自然言語解析による指標に基づいて抽出>によって収集された質問および回答を用いて稼働することができる。
Q&A記憶部105は、抽出部104が抽出した質問および回答を格納する。以下、図8を参照しながら、Q&A記憶部105に格納されるデータについて詳細に説明する。
図8は、本発明の一実施形態に係るQ&A記憶部105に格納されるデータの一例である。図8に示されるように、Q&A記憶部105には、質問のデータと回答のデータとが対応付けられて格納される。上述した<会話の音声内の指標に基づいて抽出><ウェブページ内のフォーマットによる指標に基づいて抽出>では、抽出部104が抽出した質問と回答とが対応付けられて格納される。また、上述した<ウェブページ内の自然言語解析による指標に基づいて抽出>では、指標となった質問と、抽出部104が抽出した回答とが対応付けられて格納される。
なお、図8に示されるように、質問のデータは、質問文だけでなく、質問文に含まれる検索キーワード(質問用装置30で指定されるであろうキーワード)も格納するようにしてもよい。また、回答のデータは、回答文だけでなく、応答装置20が応答する際のキャラクターの声、動作、遷移するURLも格納するようにしてもよい。
図9は、本発明の一実施形態に係るQ&A抽出<会話の音声内の指標に基づいて抽出>
の処理のフローチャートである。
ステップ11(S11)において、音声取得部102は、質問者と回答者との会話の音声データを取得する。
ステップ12(S12)において、音声取得部102は、S11で取得した音声データを解析する。具体的には、音声取得部102は、S11で取得した音声データをテキスト化して文書データを生成する。そして、音声取得部102は、生成した文書データを抽出部104が参照できるように抽出装置10内等のメモリに記憶する。
ステップ13(S13)において、抽出部104は、S12で生成された文書データの中から、設定部101によって設定された会話の終わりのキーワードを時間の経過に沿って検索する。会話の終わりのキーワードが検出された場合には処理を終了し、検出されなかった場合にはステップ14へ進む。
ステップ14(S14)において、抽出部104は、S12で生成された文書データの中から、設定部101によって設定された質問文の始まりのキーワードを時間の経過に沿って検索する。質問文の始まりのキーワードが検出された場合にはステップ15へ進み、検出されなかった場合にはステップ16へ進む。
ステップ15(S15)において、抽出部104は、S12で生成された文書データの中から、設定部101によって設定された質問文の終わりのキーワードを時間の経過に沿って検索する。そして、抽出部104は、質問文の始まりのキーワードから質問文の終わりのキーワードまでの間の文章を質問として抽出して、Q&A記憶部105に記憶する。
ステップ16(S16)において、抽出部104は、S12で生成された文書データの中から、設定部101によって設定された回答文の始まりのキーワードを時間の経過に沿って検索する。回答文の始まりのキーワードが検出された場合にはステップ17へ進み、検出されなかった場合にはステップ11へ戻る。
ステップ17(S17)において、抽出部104は、S12で生成された文書データの中から、設定部101によって設定された回答文の終わりのキーワードを時間の経過に沿って検索する。そして、抽出部104は、回答文の始まりのキーワードから回答文の終わりのキーワードまでの間の文章を回答として抽出して、Q&A記憶部105に記憶する。
図10は、本発明の一実施形態に係るQ&A抽出<ウェブページ内のフォーマットによる指標に基づいて抽出>の処理のフローチャートである。
ステップ21(S21)において、ウェブページ検索部103は、ウェブページ(HTML)を取得する。具体的には、ウェブページ検索部103は、指定された範囲または全てのウェブページから情報を収集(クロール)する。
ステップ22(S22)において、ウェブページ検索部103は、S21で取得したウェブページを解析する。具体的には、ウェブページ検索部103は、収集した情報をテキスト化して文書データを生成する。そして、ウェブページ検索部103は、生成した文書データを抽出部104が参照できるように抽出装置10内等のメモリに記憶する。
ステップ23(S23)において、抽出部104は、S22で生成された文書データの中から、設定部101によって設定された一連の文章の終わりの隠し属性<hidden>を先頭から順に検索する。一連の文章の終わりの隠し属性<hidden>が検出された場合には処理を終了し、検出されなかった場合にはステップ24へ進む。
ステップ24(S24)において、抽出部104は、S22で生成された文書データの中から、設定部101によって設定された質問文の始まりの隠し属性<hidden>を先頭から順に検索する。質問文の始まりの隠し属性<hidden>が検出された場合にはステップ25へ進み、検出されなかった場合にはステップ26へ進む。
ステップ25(S25)において、抽出部104は、S22で生成された文書データの中から、設定部101によって設定された質問文の終わりの隠し属性<hidden>を先頭から順に検索する。そして、抽出部104は、質問文の始まりの隠し属性<hidden>から質問文の終わりの隠し属性<hidden>までの間の文章を質問として抽出して、Q&A記憶部105に記憶する。
ステップ26(S26)において、抽出部104は、S22で生成された文書データの中から、設定部101によって設定された回答文の始まりの隠し属性<hidden>を先頭から順に検索する。回答文の始まりの隠し属性<hidden>が検出された場合にはステップ27へ進み、検出されなかった場合にはステップ21へ戻る。
ステップ27(S27)において、抽出部104は、S22で生成された文書データの中から、設定部101によって設定された回答文の終わりの隠し属性<hidden>を先頭から順に検索する。そして、抽出部104は、回答文の始まりの隠し属性<hidden>から回答文の終わりの隠し属性<hidden>までの間の文章を回答として抽出して、Q&A記憶部105に記憶する。
上記で説明した実施形態の各機能は、一又は複数の処理回路によって実現することが可能である。ここで、本明細書における「処理回路」とは、電子回路により実装されるプロセッサのようにソフトウェアによって各機能を実行するようプログラミングされたプロセッサや、上記で説明した各機能を実行するよう設計されたASIC(Application Specific Integrated Circuit)、DSP(digital signal processor)、FPGA(field programmable gate array)や従来の回路モジュール等のデバイスを含むものとする。
なお、上記実施形態に挙げた構成等に、その他の要素との組み合わせ等、ここで示した構成に本発明が限定されるものではない。これらの点に関しては、本発明の趣旨を逸脱しない範囲で変更することが可能であり、その応用形態に応じて適切に定めることができる。
1 応答システム
10 Q&A抽出装置
20 応答装置
30 質問用装置
40 ネットワーク
31 デジタルサイネージ
32 コントローラ
33 マイク
34 スピーカ
50 回答者
51 マイク
60 質問者
101 設定部
102 音声取得部
103 ウェブページ検索部
104 抽出部
105 Q&A記憶部
特開2001-256036号公報

Claims (6)

  1. 質問と回答とのうちの少なくとも一方を識別するための指標を設定し、前記指標は、前記質問の始まりおよび終わり、および、前記回答の始まりおよび終わりを示す設定部と、
    前記指標に基づいて、データの中から前記質問と前記回答とのうちの少なくとも一方を抽出する抽出部と
    を備えた情報処理装置。
  2. 質問者と回答者との会話の音声データを取得し、前記音声データをテキスト化して前記データを生成する音声取得部をさらに備え、
    前記指標は、前記質問の始まりおよび終わり、および、前記回答の始まりおよび終わりに発せられるキーワードである、請求項1に記載の情報処理装置。
  3. ウェブページのうち、指定された範囲または前記ウェブページの全体から情報を収集し、前記情報をテキスト化して前記データを生成するウェブページ検索部をさらに備え、
    前記指標は、前記ウェブページ内の隠し属性であり、
    質問の始まりの隠し属性から質問の終わりの隠し属性までの間の文章が前記質問として抽出され、回答の始まりの隠し属性から回答の終わりの隠し属性までの間の文章が前記回答として抽出される、請求項1に記載の情報処理装置。
  4. コンピュータが実行する方法であって、
    質問と回答とのうちの少なくとも一方を識別するための指標を設定し、前記指標は、前記質問の始まりおよび終わり、および、前記回答の始まりおよび終わりを示すステップと、
    前記指標に基づいて、データの中から前記質問と前記回答とのうちの少なくとも一方を抽出するステップと
    を含む方法。
  5. コンピュータを
    質問と回答とのうちの少なくとも一方を識別するための指標を設定し、前記指標は、前記質問の始まりおよび終わり、および、前記回答の始まりおよび終わりを示す設定部、
    前記指標に基づいて、データの中から前記質問と前記回答とのうちの少なくとも一方を抽出する抽出部、として機能させるためのプログラム。
  6. 情報処理装置と、応答装置と、質問用装置とを含む応答システムであって、
    前記情報処理装置は、
    質問と回答とのうちの少なくとも一方を識別するための指標を設定し、前記指標は、前記質問の始まりおよび終わり、および、前記回答の始まりおよび終わりを示す設定部と、
    前記指標に基づいて、データの中から前記質問と前記回答とのうちの少なくとも一方を抽出する抽出部と、を備え、
    前記応答装置は、前記抽出部が抽出した前記質問および前記回答に基づいて、前記質問用装置から受信した質問に対して回答を送信し、
    前記質問用装置は、前記応答装置へ質問を送信し、前記応答装置から回答を受信する、
    応答システム。
JP2019078072A 2019-04-16 2019-04-16 Q&a抽出装置、方法、プログラム、および応答システム Active JP7099397B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019078072A JP7099397B2 (ja) 2019-04-16 2019-04-16 Q&a抽出装置、方法、プログラム、および応答システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019078072A JP7099397B2 (ja) 2019-04-16 2019-04-16 Q&a抽出装置、方法、プログラム、および応答システム

Publications (2)

Publication Number Publication Date
JP2020177360A JP2020177360A (ja) 2020-10-29
JP7099397B2 true JP7099397B2 (ja) 2022-07-12

Family

ID=72937350

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019078072A Active JP7099397B2 (ja) 2019-04-16 2019-04-16 Q&a抽出装置、方法、プログラム、および応答システム

Country Status (1)

Country Link
JP (1) JP7099397B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7552654B2 (ja) 2022-05-31 2024-09-18 株式会社リコー 情報処理装置、プログラム、情報処理システム及び情報処理方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006092473A (ja) 2004-09-27 2006-04-06 Toshiba Corp 回答支援システムおよび装置、回答支援プログラム
JP2011123565A (ja) 2009-12-08 2011-06-23 Nomura Research Institute Ltd Faq候補抽出システムおよびfaq候補抽出プログラム
JP2018513480A (ja) 2015-12-30 2018-05-24 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 情報抽出方法及び装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH113335A (ja) * 1997-06-13 1999-01-06 Fuji Xerox Co Ltd 質問回答管理装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006092473A (ja) 2004-09-27 2006-04-06 Toshiba Corp 回答支援システムおよび装置、回答支援プログラム
JP2011123565A (ja) 2009-12-08 2011-06-23 Nomura Research Institute Ltd Faq候補抽出システムおよびfaq候補抽出プログラム
JP2018513480A (ja) 2015-12-30 2018-05-24 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 情報抽出方法及び装置

Also Published As

Publication number Publication date
JP2020177360A (ja) 2020-10-29

Similar Documents

Publication Publication Date Title
US11262979B2 (en) Machine learning webpage accessibility testing tool
US10115056B2 (en) Method and apparatus for responding to an inquiry
US10546508B2 (en) System and method for automated literacy assessment
WO2018161917A1 (zh) 智能评分方法及装置、计算机设备及计算机可读介质
US9766868B2 (en) Dynamic source code generation
JP2013044770A (ja) 学習支援システム及び学習支援方法
US20140164296A1 (en) Chatbot system and method with entity-relevant content from entity
US10089898B2 (en) Information processing device, control method therefor, and computer program
WO2019146753A1 (ja) 脳活動を利用した語学能力評価装置、及び語学能力評価システム
KR20130086971A (ko) 음성인식 질의응답 시스템 및 그것의 운용방법
JP7099397B2 (ja) Q&a抽出装置、方法、プログラム、および応答システム
JP6166831B1 (ja) 単語学習支援装置、単語学習支援プログラム、単語学習支援方法
JP2018130454A (ja) 軽度認知障害検査システム及び軽度認知障害検査プログラム
JP2021022292A (ja) 情報処理装置、プログラム及び情報処理方法
JP4659433B2 (ja) 問題自動作成装置および問題自動作成プログラム
WO2016147330A1 (ja) テキスト処理方法、及びテキスト処理システム
JP2013109575A (ja) メンタルケア装置、メンタルケア方法及びメンタルケアプログラム
JP2013506187A (ja) 表現および説明抽出のための文書処理装置および方法
KR102207304B1 (ko) 온라인 영어 학습 서비스 및 이를 운용하는 관리 서버
JP6437684B1 (ja) 問題作成支援システム、方法、およびプログラム
JP7131518B2 (ja) 電子機器、発音学習方法、サーバ装置、発音学習処理システムおよびプログラム
KR101786019B1 (ko) 지능형 문장 자동 완성 방법 및 장치
JP7180168B2 (ja) 情報処理システム、情報処理方法及びプログラム
JP7537464B2 (ja) 情報処理装置、情報処理システム、情報処理方法及びプログラム
KR102260558B1 (ko) 챗봇용 학습 데이터 생성 시스템 및 그 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210304

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220111

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220112

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220225

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220531

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220613

R151 Written notification of patent or utility model registration

Ref document number: 7099397

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151