JP2021022292A - 情報処理装置、プログラム及び情報処理方法 - Google Patents

情報処理装置、プログラム及び情報処理方法 Download PDF

Info

Publication number
JP2021022292A
JP2021022292A JP2019139791A JP2019139791A JP2021022292A JP 2021022292 A JP2021022292 A JP 2021022292A JP 2019139791 A JP2019139791 A JP 2019139791A JP 2019139791 A JP2019139791 A JP 2019139791A JP 2021022292 A JP2021022292 A JP 2021022292A
Authority
JP
Japan
Prior art keywords
unit
answer
sentence
evaluation
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019139791A
Other languages
English (en)
Other versions
JP6942759B2 (ja
Inventor
将啓 下沢
Masahiro Shimozawa
将啓 下沢
永浩 向井
Nagahiro Mukai
永浩 向井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Research Institute Inc
Nextremer Co Ltd
Original Assignee
Mitsubishi Research Institute Inc
Nextremer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Research Institute Inc, Nextremer Co Ltd filed Critical Mitsubishi Research Institute Inc
Priority to JP2019139791A priority Critical patent/JP6942759B2/ja
Publication of JP2021022292A publication Critical patent/JP2021022292A/ja
Application granted granted Critical
Publication of JP6942759B2 publication Critical patent/JP6942759B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】簡易な構成で正確な回答を出力できる情報処理装置、プログラム及び情報処理方法を提供する。【解決手段】システムにおいて、情報処理装置は、入力部112から入力された質問に対する回答に関する文章を選択する文章選択部10と、文章選択部10で選択された文章を用語に分割する用語分割部30と、分割された用語が回答の始点になる可能性に関する第一評価と、分割された用語が回答の終点になる可能性に関する第二評価とを行う評価部40と、文章選択部で選択された文章を複数のパラグラフに分割する文章分割部50と、文章選択部10で選択された文章内から回答を抽出する抽出部20と、抽出部20で抽出された回答を出力する出力部70と、を有する。【選択図】図1

Description

本発明は、複数のデータに基づいて学習を行って学習済みモデルを生成する情報処理装置及び情報処理方法に関する。
従来から、質問に対する回答を自動的に行う装置が提案されている。例えば特許文献1では、チャット相手となる端末装置から受信した質問を表す問合せ質問文と、問合せ質問文に対して応答を行ったことを示す応答情報と、応答に対して端末装置から所定の返答を受け付けたことを示す返答情報と、を含むチャットログを生成するチャットシステムが提案されている。
特許第6457600号
本発明は、従来とは異なる態様を採用し、簡易な構成で正確な回答を出力できる情報処理装置等を提供する。
本発明による情報処理装置は、
入力部から入力された質問に対する回答に関する文章を選択する文章選択部と、
文章選択部で選択された前記文章内から回答を抽出する抽出部と、
前記抽出部で抽出された回答を出力する出力部と、
を備えてもよい。
本発明による情報処理装置は、
前記文章を用語に分割する用語分割部と、
分割された用語が回答の始点になる可能性に関する第一評価と、分割された用語が回答の終点になる可能性に関する第二評価とを行う評価部と、
を備え、
前記抽出部が、前記評価部による評価結果に基づいて回答を抽出してもよい。
本発明による情報処理装置は、
前記文章選択部で選択された文章を複数のパラグラフに分割する文章分割部を備え、
前記評価部は前記パラグラフ内で第一評価及び第二評価を行い、
前記抽出部は、各パラグラフにおける前記評価部による評価結果を比較して回答を抽出してもよい。
本発明による情報処理装置において、
前記文章選択部は複数の文章を選択し、
前記評価部は選択された複数の文章内で第一評価及び第二評価を行い、
前記抽出部は、各文章における前記評価部による評価結果を比較して回答を抽出してもよい。
本発明による情報処理装置において、
入力部からの入力を受け、前記文章選択部は、ウェブサイトにおける公開文章、記憶部で記憶されている内部文章、並びに公開文章及び内部文章の両方のいずれを選択してもよい。
本発明による情報処理装置において、
複数の質問を一度に入力可能となり、
前記出力部は各質問に対する回答を表形式で出力してもよい。
本発明による情報処理装置は、
自動で複数の質問を行い、前記出力部から出力された各質問に対する回答を自動で収集する情報収集部を備えてもよい。
本発明による情報処理方法は、
入力部から入力された質問に対する回答に関する文章を文章選択部が選択する工程と、
文章選択部で選択された文章内から回答を抽出部が抽出する工程と、
前記抽出部で抽出された回答を出力部が出力する工程と、
を備えてもよい。
本発明によるプログラムは、
情報処理装置にインストールされるプログラムであって、
前記情報処理装置は、
入力部から入力された質問に対する回答に関する文章を選択する文章選択部と、
文章選択部で選択された前記文章内から回答を抽出する抽出部と、
前記抽出部で抽出された回答を出力する出力部と、
を備えてもよい。
本発明の一態様として、文章を用語に分割し、評価部40が分割された用語が回答の始点になる可能性に関する第一評価と、分割された用語が回答の終点になる可能性に関する第二評価とを行うことで、抽出部20が回答を抽出する態様を採用した場合には、回答の始点と回答の終点という2つの点に着目して回答を抽出することから、簡易な構成で正確な回答を抽出できる。
本発明の実施の形態による情報処理装置を含むシステム概要を説明するためのブロック図。 本発明の実施の形態で「本場所の初日はいつですか?」という質問が入力された場合の処理態様を説明するための図。 図2で示した質問が行われた場合の合計スコア及び回答候補(Answer候補)を示した図。 本発明の実施の形態において、入力部から複数の質問が一度に入力される場合の態様を示した図。 本発明の実施の形態において、入力部から複数の質問が一度に入力された場合において、表形式で回答を出力する態様を示した図。 本実施の形態による処理態様の一例を示した図。 本発明の実施の形態において、文書分割部がパラグラフ毎に文章を分割し、評価部が各パラグラフでの評価を行う態様を説明するための図。 本発明の実施の形態における用語分割部、評価部等の学習態様の一例を説明するための図。 本発明の実施の形態において、学習の際に利用する文脈(Context)、質問(question)及び回答(answer)を示した図。
《構成》
本実施の形態の情報処理装置は、一つの装置から構成されてもよいし複数の装置から構成されてもよい。本実施の形態では、本実施の形態の情報処理装置を用いた情報処理方法、情報処理装置を生成するためにインストールされるプログラム(サーバプログラム)や、当該プログラムを記憶したUSB、DVD等からなる記憶媒体も提供される。また、本実施の形態では、ユーザ端末にインストールされるプログラム(ユーザプログラム)や、当該プログラムを記憶したUSB、DVD等からなる記憶媒体も提供される。
図1に示すように、本実施の形態の情報処理装置は、ユーザが質問を入力するための入力部112と、入力部112から入力された質問に対する回答に関する文章を選択する文章選択部10と、文章選択部10で選択された文章内から回答を抽出する抽出部20と、抽出した回答を出力する出力部70と、を有してもよい。入力部112はユーザが所有するスマートフォン、タブレット、PCの入力端末等であってもよいし、管理者が管理する入力端末であってもよい。出力部70からの出力される情報はユーザが所有するスマートフォン、タブレット、PCの表示画面や管理者が管理する端末の表示画面等からなる表示部111で表示されるようにしてもよい。なお、本実施の形態の文書には文脈(context)が含まれている。
本実施の形態の情報処理装置は、文章選択部10で選択した文章を単語等の用語に分割する用語分割部30と、分割された用語が回答の始点になる可能性に関する第一評価と、分割された用語が回答の終点になる可能性に関する第二評価とを行う評価部40と、を有してもよい。抽出部20は、評価部40による評価結果に基づいて回答を抽出してもよい。より具体的には、回答の始点になる可能性が最も高い用語と、回答の終点になる可能性が最も高い用語と、これらの用語の間にある内容をそのまま抽出し、回答するようにしてもよい。このように既存の文章の内容をそのまま抽出することから、改めて文章を準備する必要が無い点で有益である。用語分割部30によって分割されて得られる用語は最小の構成単位である「トークン」であってもよい。
評価部40は、用語(トークン)毎に回答の始点になる確率及び回答の終点になる確率を算出して、スコア化してもよい。そして、始点になるスコアの高いトークンを所定数(例えば上位5個、10個等)だけ抽出し、また終点になるスコアの高いトークンを所定数(例えば上位5個、10個等)だけ抽出し、始点が終点よりも前に存在するという条件の下、合計スコアが最も高いものを質問の答えとして抽出部20が抽出してもよい。スコアの高いトークンは記憶部80で記憶され、後で管理者が確認できるようにしてもよい。評価部40は、分割されたトークンに対する始点になるスコア及び終点になるスコアを総当たりで評価してもよい。
また合計スコアが閾値以下である場合には、抽出部20による答えの抽出は行われず、出力部70は答えが見当たらない旨出力するようにしてもよい。合計スコアが最も高い答えを出力部70は出力し、ユーザから答えとして適切ではない旨の入力が入力部112を介して行われると、合計スコアが2番目に高い答えを出力部70が出力するようにしてもよい。この処理が繰り返され、すなわち合計スコアが高い答えから順にユーザに提供されるようにしてもよい。
一例として、図2に示すように、「本場所の初日はいつですか?」という質問が入力部112から入力された場合に、文章選択部10が「「両国国技館」で行われる年3回、15日間の本場所は1月、5月、9月に行われます。各月の第2日曜日が初日で、16日後が千秋楽です。」という文章を選択したときを想定する。この場合、用語分割部30はこの文章を例えば「「」「両国」「国技館」「」」「で」「行われる」「年」「3回」「、」「15日間」「の」「本場所」「は」「1月」「、」「5月」「、」「9月」「に」「行われ」「ます」「。」「各月」「の」「第2」「日曜日」「が」「初日」「で」「、」「16日後」「が」「千秋楽」「です」「。」という用語に分割する。そして評価部40が各用語に関する評価を行い、例えば「各月」「の」「第2」「日曜日」「が」「初日」「で」という用語に対して、評価部40は回答の始点になる可能性に関する第一評価として「0.8」「0.3」「0.6」「0.5」「0.1」「0.4」「0.1」という評価点を与え、回答の終点になる可能性に関する第二評価として「0.3」「0.2」「0.4」「0.8」「0.1」「0.5」「0.3」という評価点を与える(図2参照)。その結果として、「各月の第2日曜日」が質問への回答であることが抽出部20で抽出され、出力部70から出力され、表示部111で表示されることになる(図3参照)。
図1に示すように、本実施の形態の情報処理装置は、文章選択部10で選択された文章を複数のパラグラフに分割する文章分割部50を有してもよい(図7参照)。評価部40はパラグラフ内で第一評価及び第二評価を行ってもよい。抽出部20は、各パラグラフにおける評価部40による評価結果を比較して回答を抽出してもよい。より具体的には、抽出部20は各パラグラフにおける評価部40での評価結果が最も優れたものを抽出し、抽出された各回答候補の中で最も評価部40での評価結果が優れた部分(例えば最も評価点が高い始点と終点の間の部分)を回答として抽出してもよい。
文章分割部50は、前処理として、所定文字数(例えば380文字)以下かつ句点で終わるように文章を分割してもよい。
文章選択部10によって選択される文書は情報処理装置の記憶部80(ローカルエリア)に予め記憶されている文章であってもよいし、文章選択部10がウェブサイトを検索して文章(公開文書)を選択してもよい。文書選択部10は複数の文章を選択してもよく、例えば閾値(例えば10個や50個等)の文章を記憶部80やウェブサイトから選択し、評価部40が選択された複数の文章内で第一評価及び第二評価を行ってもよい。そして、抽出部20は各文章における評価部40による評価結果を比較し、評価結果が優れた部分(例えば最も評価点が高い始点と終点の間の部分)を回答として抽出してもよい。なお、記憶部80で記憶されている文章は会社や自治体等の組織内で管理されている内部文書であってもよい。
また評価部40での評価結果が閾値以上になるまで文章選択部10によって文書が選択されるようになってもよい。この態様を採用する場合には、信頼性が一定程度認められる回答がユーザに出力されることになる点で有益である。文章選択部10は検索された結果として出力される上位の文章を順に選択するようにしてもよい。評価結果に対する閾値や文書選択部10が選択する文章の数等の様々な情報は管理者端末210からの入力によって変更できるようになってもよい(図1参照)。管理者端末210も入力部211と表示部212を有してもよい。
入力部112からの入力を受け、文章選択部10が、ウェブサイトにおける公開文章、記憶部80で記憶されている内部文章並びに公開文章及び内部文章の両方のいずれを選択するようになってもよい。例えばユーザがユーザ端末110から、公開文章、内部文章、公開文章及び内部文章の両方のいずれを回答選択対象とするかを選択するようにしてもよい。
入力部112から複数の質問を一度に入力可能となってもよい(図4参照)。出力部70は各質問に対する回答を表形式で出力するようにしてもよい(図5参照)。図4に示す態様では、予め選択された複数の企業に関し、「住所は?」、「本社は何番出口から行けばいい?」、「社長の名前は?」、「創業は何年?」、「株価は?」、「主な出身者は?」、「30歳での年収は?」という質問が一度に入力されており、図5ではこれらの質問に対する回答が一覧表として出力されている。また、管理者端末210やユーザ端末110からの入力によって、複数の質問に対する回答が一つの文章から抽出されるように選択できるようにしてもよい。この態様によれば、特定の文章だけから適宜回答を抽出できることになる。
質問で用いられた言語で回答するようにしてもよい。つまり、入力部112から日本語等の第一言語で入力された場合には、文書選択部10は第一言語が記載された文章を選択し、抽出部20は当該文章の中から第一言語で記載された回答を抽出し、出力部70が抽出された結果を出力するようにしてもよい。また、入力部112からの指示にしたがって回答される言語が選択されてもよい。つまり、入力部112から日本語等の第一言語で入力された場合であっても、英語等の第二言語での回答を行うよう入力された場合には、文書選択部10は第二言語が記載された文章を選択し、抽出部20は当該文章の中から第二言語で記載された回答を抽出し、出力部70が抽出された結果を出力するようにしてもよい。
複数の情報ソースに複数の質問を一度に質問を行い、回答を自動で収集する情報収集部60が設けられてもよい(図1参照)。図4に示す態様では、情報収集部60によって予め複数の企業が選択され、情報収集部60によって「住所は?」「本社は何番出口から行けばいい?」「社長の名前は?」「創業は何年?」「株価は?」「主な出身者は?」「30歳での年収は?」という質問が行われ、文章選択部10、用語分割部30、評価部40及び抽出部20での処理が行われ、出力部70から回答が情報収集部60に対して行われる態様となっている。このようにして収集された回答は記憶部80で記憶され、ユーザからの要求に応じて出力部70から出力され、表示部111で表示されるようにしてもよい(図5参照)。情報収集部60を採用した場合には、自動で回答を取得することができ、当該回答を用いて、マニュアル・規則等に対する問い合わせに対するチャットボットで利用することもできる。
文章選択部10の一機能又は全機能を実現するためにRPA(Robotic Process Automation)が用いられてもよい。例えばウェブサイトでの文章の検索や内部文章の検索にRPAが用いられてもよい。
用語分割部30及び評価部40の各々は、人工知能機能を有しており、機械学習を行ってもよい。機械学習技術として、様々なモデルを採用することができ、例えばディープニューラルネットワークモデルを採用してもよく、その一例としてBERT(Bidirectional Encoder Representations from Transformers)を採用してもよい。
用語分割部30及び評価部40の各々の学習のために、Wikipedia(登録商標)を含む500以上の記事、10万ペア以上の質問回答ペア(300万単語のテキストデータ)を用いてもよい。例えば図8に示すように、ソーステキスト、質問(Question)及び回答(Answer)を用いて用語分割部30及び評価部40の各々が機械学習を行ってもよい。なお、文章選択部10及び/又は文章分割部50も人工知能機能を有してもよく、この場合にも機械学習技術として様々なモデルを採用することができる。学習済み言語モデルを使用する場合には、回答が含まれる文章があれば、データ整形やラベル付、質問に対する回答を学習することは不要になる。
学習の際に利用する質問回答については、文脈(Context)、質問(question)、回答(answer)、回答インデックス(answer_index)の組(ペア)を用いてもよい(図9参照)。回答は文脈内から切り出される文字列であってもよい。回答インデックスは文脈内の回答の位置を示している。1種の文脈に対して、複数の質問を持ってもよい。
なお、評価部40は選択した文章内に回答がない質問については文章の最初の用語(トークン)が始点・終点の確率が共に高いものとして学習してもよい。この場合において、文章の最初の用語(トークン)が最も始点スコア及び終点スコアが高いときには、抽出部20による答えの抽出は行われず、出力部70は答えが見当たらない旨出力するようにしてもよい。
用語分割部30は、前処理として、ニューラル言語処理向けのトークナイザ・脱トークナイザであるSentencePieceによる分かち書きを行ってもよい。低頻度の語(固有名詞等)は文字単位まで細かく分割し、高頻度語(例えば「によって」、「された」等)は機能単位でまとめてトークン化してもよい。
前処理として、HTMLタグの除去等のクレンジングを行うクレンジング部90が設けられてもよい。
文章選択部10、抽出部20、用語分割部30、評価部40、文章分割部50、情報収集部60、出力部70、クレンジング部90等は一つのユニット(制御ユニット)によって実現されてもよいし、異なるユニットによって実現されてもよい。複数の「部」による機能が統合されてもよく、例えば抽出部20及び評価部40の機能が一つのユニットによって実現されてもよい。また、章選択部10、抽出部20、用語分割部30、評価部40、文章分割部50、情報収集部60、出力部70、クレンジング部90等は回路構成によって実現されてもよい。
本実施の形態による処理態様の一例について図6を用いて説明する。
検索ワード及び/又は質問リストがユーザから入力部112を介して入力される。
入力された検索ワード及び/又は質問リストを用いて、ウェブサイト(Webサイト)及び/又は所属する組織が管理しているファイルシステム内の情報から文章選択部10が文章を選択する。質問リストが用いられた場合には、質問リストから検索ワードが抽出されて、検索が行われる。文章の選択は、RPAがクローリングを行うことで実現されてもよい(この場合、RPAが文章選択部10の一部を構成することになる。)。文章は、パワーポイント(登録商標)、ワード、PDF、html、txt等の様々な形式で取得される。クローリングとは、ウェブサイト上やファイルシステム内の文書等を周期的に取得し、自動的にデータベース化することであり、このようなクローリングを行うプログラムのことをクローラという。
クローリングすることで得られた検索結果ファイル及び検索結果ファイル情報と、ユーザから入力された質問リストに対する前処理が行われる。前処理としては、HTMLやPDFからテキストデータを抽出するテキスト抽出、タグを除去したりするクレンジング、パラグラフ分割等を挙げることができる。
前処理が行われた収集された文章(Context)と質問を用いて文章の一部を抽出する抽出読解処理が行われる。この際、トークン分割が行われ、回答文字列の抽出が行われる。このようなトークン分割及び回答文字列の抽出は事前に学習した学習済モデルが用いられる。各質問に対して検索結果ファイルの各々に対してトークン分割及び回答文字列の抽出が行われる。各質問に対しては最も可能性の高い回答が出力されるように選択されてもよい。
全ての検索結果ファイルに対して全ての質問に対する回答抽出が行われると、検索結果ファイル情報、質問リスト及び回答リストを用いて後処理が行われる。後処理としては、回答となる文面の文末の助詞や句点を削除するといった回答クレンジング、一覧表生成、結果画面生成等が行われる。回答クレンジングはクレンジング部90で行われ、一覧表生成及び結果画面生成は出力部70で行われてもよい。なお、選択された文章に関し、閾値以上の回答が得られない場合には、新たな文章が選択されるようにしてもよい。
後処理後のデータは出力部70によって出力される。この際、一覧表がExcelやcsvで出力されてもよいし、表示部111を介してユーザに提示されてもよい。
《効果》
次に、上述した構成からなる本実施の形態による効果であって、未だ説明していないものを中心に説明する。
本実施の形態において、入力部112から入力された質問に対する回答に関する文章を選択し、選択された文章内から回答を抽出する態様を採用する場合には、少ない事前準備で適切な回答を返すことができる。既存のチャットボットでは、回答として予め用意された固定の文字列が記憶部で記憶し、事前に用意した質問集の中で、回答(クエリ)に一番近いものを選択し、その回答を固定的に提示する態様となっている。このため、事前に多くの質問回答ペア、応答シナリオ等を作成する必要があり、かつ継続的なメンテナンスが必要となる。
他方、本態様によれば、回答の始点スコアや終点スコアを算出するための学習を行うだけでよく、初見の文章を読み解くため、事前に読解対象の大量文章を読み込ませる予習は不要となる。また、大量の質問回答ペアや応答シナリオ等のルール作成やメンテナンスも不要となる。また、文字列として抽出するので、未知語にも対応可能となる。さらに、本ユーザが質問を(検索ワードとは異なり)自然文で入力したとしても、当該質問から回答を抽出するので、情報探索スキルやノウハウも特に必要なく、ユーザの求めている回答を得ることができる。
本実施の形態のように、文章を用語に分割し、評価部40が分割された用語が回答の始点になる可能性に関する第一評価と、分割された用語が回答の終点になる可能性に関する第二評価とを行うことで、抽出部20が回答を抽出する態様を採用した場合には、回答の始点と回答の終点という2つの点に着目して回答を抽出することから、簡易な構成で正確な回答を抽出できる。
文章を複数のパラグラフに分割し、評価部40がパラグラフ内で第一評価及び第二評価を行い、各パラグラフにおける評価部40による評価結果を比較して抽出部20が回答を抽出する態様を採用した場合には(図7参照)、複数のパラグラフ毎に処理することができる点で処理を簡易・迅速に行うことができる。
文章選択部10が複数の文章を選択し、評価部40が選択された複数の文章内で第一評価及び第二評価を行い、抽出部20が各文章における評価部40による評価結果を比較して回答を抽出する態様を採用した場合には(図6参照)、複数の文書を用いて回答を抽出することから、より高い精度の回答を提供することを期待できる。
入力部112からの入力を受け、文章選択部10が、ウェブサイトにおける公開文章、記憶部80で記憶されている内部文章並びに公開文章及び内部文章の両方のいずれを選択する態様を採用する場合には、ユーザの選択に従って回答源を選択することができる。なお、文書選択部10において、組織内の内部情報とウェブサイトの公開情報の両方を選択する場合には、公開されている情報と非公開の情報の両方を用いて回答を得ることができ、ユーザがアクセス可能な情報において最も精度の高い回答を得ることを期待できる。
複数の質問を一度に入力可能となり、出力部70が各質問に対する回答を表形式で出力する態様を採用した場合には(図4及び図5参照)、ユーザは複数の質問に対する回答を一度に表形式で受け取ることができ、一気に多くの情報を得ることができるようになる。なお、複数の質問を一度に入力した場合でも回答は表形式で行われなくてもよく、例えば質問に対する回答が表示部111で順次表示されるようにしてもよい。
本実施の形態の情報処理装置は、複数の質問を行って回答を得ることで、自動車等の製品情報を取得するために用いられてもよいし、要約文やまとめの文章を作成するために利用されてもよい。
上述した実施の形態の記載及び図面の開示は、特許請求の範囲に記載された発明を説明するための一例に過ぎず、上述した実施の形態の記載又は図面の開示によって特許請求の範囲に記載された発明が限定されることはない。また、出願当初の特許請求の範囲の記載は出願時での権利要求範囲に過ぎず、適宜変更できる点では留意が必要である。
10 文章選択部
20 抽出部
30 用語分割部
40 評価部
50 文章分割部
60 情報収集部
70 出力部
80 記憶部
112 入力部

Claims (9)

  1. 入力部から入力された質問に対する回答に関する文章を選択する文章選択部と、
    文章選択部で選択された前記文章内から回答を抽出する抽出部と、
    前記抽出部で抽出された回答を出力する出力部と、
    を備える情報処理装置。
  2. 前記文章を用語に分割する用語分割部と、
    分割された用語が回答の始点になる可能性に関する第一評価と、分割された用語が回答の終点になる可能性に関する第二評価とを行う評価部と、
    を備え、
    前記抽出部は、前記評価部による評価結果に基づいて回答を抽出する請求項1に記載の情報処理装置。
  3. 前記文章選択部で選択された文章を複数のパラグラフに分割する文章分割部を備え、
    前記評価部は前記パラグラフ内で第一評価及び第二評価を行い、
    前記抽出部は、各パラグラフにおける前記評価部による評価結果を比較して回答を抽出する請求項2に記載の情報処理装置。
  4. 前記文章選択部は複数の文章を選択し、
    前記評価部は選択された複数の文章内で第一評価及び第二評価を行い、
    前記抽出部は、各文章における前記評価部による評価結果を比較して回答を抽出する請求項2又は3のいずれかに記載の情報処理装置。
  5. 入力部からの入力を受け、前記文章選択部は、ウェブサイトにおける公開文章、記憶部で記憶されている内部文章、並びに公開文章及び内部文章の両方のいずれを選択する、請求項1乃至4のいずれか1項に記載の情報処理装置。
  6. 複数の質問を一度に入力可能となり、
    前記出力部は各質問に対する回答を表形式で出力する請求項1乃至5のいずれか1項に記載の情報処理装置。
  7. 自動で複数の質問を行い、前記出力部から出力された各質問に対する回答を自動で収集する情報収集部を備える請求項1乃至6のいずれか1項に記載の情報処理装置。
  8. 入力部から入力された質問に対する回答に関する文章を文章選択部が選択する工程と、
    文章選択部で選択された文章内から回答を抽出部が抽出する工程と、
    前記抽出部で抽出された回答を出力部が出力する工程と、
    を備える情報処理方法。
  9. 情報処理装置にインストールされるプログラムであって、
    前記情報処理装置は、
    入力部から入力された質問に対する回答に関する文章を選択する文章選択部と、
    文章選択部で選択された前記文章内から回答を抽出する抽出部と、
    前記抽出部で抽出された回答を出力する出力部と、
    を備えるプログラム。
JP2019139791A 2019-07-30 2019-07-30 情報処理装置、プログラム及び情報処理方法 Active JP6942759B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019139791A JP6942759B2 (ja) 2019-07-30 2019-07-30 情報処理装置、プログラム及び情報処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019139791A JP6942759B2 (ja) 2019-07-30 2019-07-30 情報処理装置、プログラム及び情報処理方法

Publications (2)

Publication Number Publication Date
JP2021022292A true JP2021022292A (ja) 2021-02-18
JP6942759B2 JP6942759B2 (ja) 2021-09-29

Family

ID=74573333

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019139791A Active JP6942759B2 (ja) 2019-07-30 2019-07-30 情報処理装置、プログラム及び情報処理方法

Country Status (1)

Country Link
JP (1) JP6942759B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113836905A (zh) * 2021-09-24 2021-12-24 网易(杭州)网络有限公司 一种主题提取方法、装置、终端及存储介质
JP2023014490A (ja) * 2021-07-19 2023-01-31 株式会社リコー 情報処理装置、情報処理システム、情報処理方法、及びプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006344102A (ja) * 2005-06-10 2006-12-21 Fuji Xerox Co Ltd 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
JP2019220142A (ja) * 2018-06-18 2019-12-26 日本電信電話株式会社 回答学習装置、回答学習方法、回答生成装置、回答生成方法、及びプログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006344102A (ja) * 2005-06-10 2006-12-21 Fuji Xerox Co Ltd 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
JP2019220142A (ja) * 2018-06-18 2019-12-26 日本電信電話株式会社 回答学習装置、回答学習方法、回答生成装置、回答生成方法、及びプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
西田光甫 他6名: "抽出型要約との同時学習による回答根拠を提示可能な機械読解", 言語処理学会第25回年次大会 発表論文集[ONLINE], JPN6020050566, 4 March 2019 (2019-03-04), JP, pages 25 - 28, ISSN: 0004419656 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023014490A (ja) * 2021-07-19 2023-01-31 株式会社リコー 情報処理装置、情報処理システム、情報処理方法、及びプログラム
CN113836905A (zh) * 2021-09-24 2021-12-24 网易(杭州)网络有限公司 一种主题提取方法、装置、终端及存储介质
CN113836905B (zh) * 2021-09-24 2023-08-08 网易(杭州)网络有限公司 一种主题提取方法、装置、终端及存储介质

Also Published As

Publication number Publication date
JP6942759B2 (ja) 2021-09-29

Similar Documents

Publication Publication Date Title
US11914954B2 (en) Methods and systems for generating declarative statements given documents with questions and answers
KR101968102B1 (ko) 논팩토이드형 질의 응답 시스템 및 컴퓨터 프로그램
CN108563620A (zh) 文本自动写作方法和系统
US20140351228A1 (en) Dialog system, redundant message removal method and redundant message removal program
KR20160026892A (ko) 논팩토이드형 질의 응답 시스템 및 방법
JP2010015571A (ja) エッセイ中の過度の反復語使用の自動評価
JP2020191075A (ja) Web APIおよび関連エンドポイントの推薦
US10191975B1 (en) Features for automatic classification of narrative point of view and diegesis
Ketmaneechairat et al. Natural language processing for disaster management using conditional random fields
Rupp et al. Dealing with heterogeneous big data when geoparsing historical corpora
JP6942759B2 (ja) 情報処理装置、プログラム及び情報処理方法
WO2014000764A1 (en) A system and method for automatic generation of a reference utility
Wijeratne et al. Natural language processing for government: Problems and potential
Albuquerque et al. UlyssesNER-Br: a corpus of Brazilian legislative documents for named entity recognition
Curtotti et al. A right to access implies a right to know: An open online platform for research on the readability of law
KR20200064490A (ko) 프로필 자동생성서버 및 방법
Riza et al. Natural language processing and levenshtein distance for generating error identification typed questions on TOEFL
US8666987B2 (en) Apparatus and method for processing documents to extract expressions and descriptions
Bautista et al. Can Numerical Expressions Be Simpler? Implementation and Demostration of a Numerical Simplification System for Spanish.
JP5877775B2 (ja) コンテンツ管理装置、コンテンツ管理システム、コンテンツ管理方法、プログラム、及び記憶媒体
Tyers et al. What shall we do with an hour of data? Speech recognition for the un-and under-served languages of Common Voice
CN114722174A (zh) 提词方法和装置、电子设备及存储介质
CN113901793A (zh) 结合rpa和ai的事件抽取方法及装置
KR102072708B1 (ko) 텍스트 콘텐츠의 장르를 추론하는 방법 및 컴퓨터 프로그램
Contractor et al. Text retrieval using sms queries: Datasets and overview of fire 2011 track on sms-based faq retrieval

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190730

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200915

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201106

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210303

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210817

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210908

R150 Certificate of patent or registration of utility model

Ref document number: 6942759

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150