JP2023073095A - 情報処理装置、情報処理方法および情報処理用プログラム - Google Patents
情報処理装置、情報処理方法および情報処理用プログラム Download PDFInfo
- Publication number
- JP2023073095A JP2023073095A JP2021185924A JP2021185924A JP2023073095A JP 2023073095 A JP2023073095 A JP 2023073095A JP 2021185924 A JP2021185924 A JP 2021185924A JP 2021185924 A JP2021185924 A JP 2021185924A JP 2023073095 A JP2023073095 A JP 2023073095A
- Authority
- JP
- Japan
- Prior art keywords
- information
- basic information
- editing
- sentence
- user terminal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 44
- 238000003672 processing method Methods 0.000 title claims description 5
- 238000012545 processing Methods 0.000 claims abstract description 52
- 238000000034 method Methods 0.000 claims abstract description 29
- 230000005540 biological transmission Effects 0.000 claims abstract description 8
- 230000004044 response Effects 0.000 claims description 8
- 230000006870 function Effects 0.000 description 21
- 238000010586 diagram Methods 0.000 description 9
- 230000008929 regeneration Effects 0.000 description 5
- 238000011069 regeneration method Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012790 confirmation Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000010079 rubber tapping Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】この開示は、言語モデルを利用して要約文を生成するのに適した情報処理装置に関し、ユーザの求める要約文を精度良く生成することを目的とする。【解決手段】ユーザ端末の要求に応じて言語データを受信する言語データ受信20と、言語データを加工して、要約生成の基礎となる要約基礎情報を生成する言語データ加工部22と、要約基礎情報を含む提示情報をユーザ端末に送信するための送信部30と、ユーザ端末から、提示情報に関する編集情報を受信する編集情報受信部32と、要約基礎情報の入力を受けて要約文を生成する大規模言語モデル28に、編集情報を提供して、編集情報が反映された要約文を生成させる要約生成部24とを備える。【選択図】図2
Description
この開示は、情報処理装置、情報処理方法および情報処理用プログラムに係り、特に、言語モデルを利用して要約文を生成するのに適した情報処理装置、情報処理方法および情報処理用プログラムに関する。
特許文献1には、音声データをテキスト化して、その内容の要約文を生成する対話要約生成装置が開示されている。より具体的には、ここには、対話音声データを発話単位に分離し、分離された音声を認識することで対話音声テキストを生成し、更に、そのテキストの要約文を生成する装置が開示されている。この装置によれば、例えば、コールセンターでの会話の要約文を容易に生成することができる。
この開示の第1の態様は、情報処理装置であって、ユーザ端末の要求に応じて言語データを取得する言語データ取得処理と、前記言語データを加工して、要約基礎情報を生成する言語データ加工処理と、前記要約基礎情報を含む提示情報を前記ユーザ端末に送信するための送信処理と、前記ユーザ端末から、前記提示情報に関する編集情報を受信する編集情報受信処理と、言語モデルに、前記編集情報を提供して、前記編集情報に応じて、前記要約基礎情報に対する要約文を生成させる要約生成処理と、を実行するように構成された演算処理ユニットを備えることが望ましい。
また、第2の態様は、情報処理方法であって、ユーザ端末の要求に応じて言語データを取得することと、前記言語データを加工して、要約基礎情報を生成することと、前記要約基礎情報を含む提示情報を前記ユーザ端末に送信することと、前記ユーザ端末から、前記提示情報に関する編集情報を受信することと、言語モデルに、前記編集情報を提供して、前記編集情報に応じて、前記要約基礎情報に対する要約文を生成させることと、を含むことが望ましい。
また、第3の態様は、情報処理用プログラムであって、演算処理ユニットに、ユーザ端末の要求に応じて言語データを受信することと、前記言語データを加工して、要約基礎情報を生成することと、前記要約基礎情報を含む提示情報を前記ユーザ端末に送信することと、前記ユーザ端末から、前記提示情報に関する編集情報を受信することと、言語モデルに、前記編集情報を提供して、前記編集情報に応じて、前記要約基礎情報に対する要約文を生成させることと、を実行させるプログラムを含むことが望ましい。
実施の形態1.
[実施の形態1の構成および動作]
図1は、本開示の実施の形態1の主要部の構成を示す。図1に示す構成は、要約生成装置として機能する情報処理装置10を備えている。情報処理装置10は、ネットワーク12に接続されている。また、ネットワーク12には、有線または無線の経路を介してユーザ端末14が接続されている。ユーザ端末14は、パーソナルコンピューター、スマートフォン、タブレット端末などにより実現される。
[実施の形態1の構成および動作]
図1は、本開示の実施の形態1の主要部の構成を示す。図1に示す構成は、要約生成装置として機能する情報処理装置10を備えている。情報処理装置10は、ネットワーク12に接続されている。また、ネットワーク12には、有線または無線の経路を介してユーザ端末14が接続されている。ユーザ端末14は、パーソナルコンピューター、スマートフォン、タブレット端末などにより実現される。
情報処理装置10は、汎用のコンピュータシステムにより実現することができる。具体的には、情報処理装置10は、演算処理ユニット、メモリ、入出力インターフェース、および通信インターフェース等のハードウェアを備えている。情報処理装置10の機能は、メモリに格納されているプログラムに沿った処理を演算処理ユニットが実行することで実現される。このプログラムは、プログラムモジュールと表現されてもよいし、されなくてもよい。
図2は、情報処理装置10の構成を機能的に説明するためのブロック図である。図2に示すように、情報処理装置10は、言語データ受信部20を備えている。言語データ受信部20には、ネットワーク12を介して言語データが提供される。言語データは、ユーザ端末14の要求に応じて、テキスト形式或いは音声形式で提供される。言語データは、ユーザ端末14から提供されてもよい。また、ユーザ端末14からの直接的、または間接的な要求を受けて他の装置から提供されてもよい。
言語データ受信部20は、言語データを音声形式で受信した場合は、周知の手法により、その内容をテキスト形式に変換する。そして、言語データ受信部20は、受信した言語データに対応するテキストデータを、言語データ加工部22に提供する。言語データ加工部22は、受信したテキストデータを加工して要約文の基礎となる要約基礎情報を生成する。
図3は、言語データ加工部22の機能を実現するために、つまり、要約基礎情報を生成するために、情報処理装置10が実行する処理の流れを説明するためのフローチャートである。図3に示すルーチンでは、先ず、言語データ受信部20から提供されるテキストデータから不要文が削除される(ステップ100)。具体的には、テキストデータに含まれる文の夫々に周知の文評価スコア関数を適用することで、それらの重要度が計算される。そして、重要度が評価閾値に満たない文が不要な文として削除される。
次に、周知の抽出型要約手法により、文の選別と並び変えが行われる(ステップ102)。
次いで、処理の対象であるテキストデータに含まれる文の数が、判定閾値N以下であるか否かが判別される(ステップ104)。判定閾値Nは、テキストデータが、要約文の生成が可能な程度に単純なものであるか否かを判断するために設定された値である。本ステップ104において、文数がN以下であると判別された場合は、テキストデータの更なる単純化は不要であると判断できる。この場合、以後速やかに本ルーチンの処理が終了される。
一方、上記ステップ104において、テキストデータの文数がN以下でないと判別された場合は、ステップ102で選別された文に対して分割処理が施される(ステップ106)。具体的には、周知のデータクラスタリングの手法により、個々の文データが分割される。但し、分割の手法はこれに限定されるものではなく、例えば、個々の文データを予め設定した数に分割することとしてもよい。
次に、要約生成のために、自然文を要約基礎情報として使用するか否かが判別される(ステップ108)。本実施形態の情報処理装置10は、自然文型の要約基礎情報を受けて要約文を生成する機能と、構造解析がなされた単語型の要約基礎情報を受けて要約文を生成する機能とを併せ持っている。本ステップ108では、自然文型の要約基礎情報を使用するモードが選択されているか否かが判別される。
上記ステップ108で、自然文を要約基礎情報として使用するモードが選択されていると判別された場合は、言語データに更なる加工を施す必要がないと判断できる。この場合、情報加工の処理を終えるべく速やかに本ルーチンの処理が終了される。
一方、上記ステップ108の判別が否定された場合は、単語型の要約基礎情報を生成するべく、分割された文データからデータ構造が抽出される(ステップ110)。ここでは、具体的には、下記の三つの処理が順次実行される。
1.M個の単語から構成されている文xn=[w1w2w3…wM]に対して形態素解析器(例えばMeCab-paeser)を適用して可能な限り単語を抽出する。
2.抽出された単語群から、名詞・動詞・形容詞・副詞の品詞ラベルに該当する単語を活用標準型で抽出する。
3.抽出された単語群に対してデータ構造を与える関数またはルールを適用する。
1.M個の単語から構成されている文xn=[w1w2w3…wM]に対して形態素解析器(例えばMeCab-paeser)を適用して可能な限り単語を抽出する。
2.抽出された単語群から、名詞・動詞・形容詞・副詞の品詞ラベルに該当する単語を活用標準型で抽出する。
3.抽出された単語群に対してデータ構造を与える関数またはルールを適用する。
以上の処理により、言語データ受信部20から提供されるテキストデータに基づいて、要約基礎情報が生成される。このようにして生成された要約基礎情報は、図2に示すように、要約生成部24に提供される。要約生成部24は、また、要約サンプルデータベース(DB)26から要約サンプルセットの提供を受けることができる。
図4は、要約サンプルDB26に格納されている要約サンプルセットの例を示す。この例では、識別番号1の要約サンプルセットと識別番号2の要約サンプルセットが、夫々、「要約基礎情報サンプル_自然文型」と「要約基礎情報サンプル_単語型」と「要約文サンプル」とを含んでいる。また、識別番号3の要約サンプルセットと識別番号4の要約サンプルセットが、夫々、「要約基礎情報サンプル_単語型」と「要約文サンプル」とを含んでいる。
「要約基礎情報サンプル_自然文型」には、要約文の基礎となる内容を自然文で記述した内容が含まれている。一方、「要約基礎情報サンプル_単語型」には、要約文の基礎となる内容を単語で記述した内容が含まれている。「要約基礎情報サンプル_単語型」は、「要約基礎情報サンプル_自然文型」のように自然文で記述されたテキストデータに、上記ステップ110で説明した処理と同様の処理を施すことで予め準備されたものである。また、「要約文サンプル」には、夫々の要約サンプルセットの「要約基礎情報サンプル_自然文型」または「要約基礎情報サンプル_単語型」に記述されている事項の要約文が含まれている。
図2に示すように、要約生成部24は、大規模言語モデル28にアクセスすることができる。要約生成部24は、言語データ加工部22から受け取った要約基礎情報と、要約サンプルDB26から取得した要約サンプルセットとを大規模言語モデル28に提供して、大規模言語モデル28に、要約基礎情報に対応する要約文を生成させることができる。
大規模言語モデル28としては、例えば、下記文献に記載されているGPT-3を用いることができる。
“Language Models are Few-Shot Learners” Tom B. Brown, Benjamin Mann, Nick Ryder, Melanie Subbiah, Jared Kaplany, Prafulla Dhariwal, Arvind Neelakantan, Pranav Shyam, Girish Sastry, Amanda Askell, Sandhini Agarwal, Ariel Herbert-Voss, Gretchen Krueger, Tom Henighan, Rewon Child, Aditya Ramesh, Daniel M. Ziegler, Jeffrey Wu, Clemens Winter, Christopher Hesse, Mark Chen, Eric Sigler, Mateusz Litwin, Scott Gray, Benjamin Chess, Jack Clark, Christopher Berner, Sam McCandlish, Alec Radford, Ilya Sutskever, Dario Amodei, arXiv: 2005. 14165v4 [cs.CL], 22 Jul 2020.
“Language Models are Few-Shot Learners” Tom B. Brown, Benjamin Mann, Nick Ryder, Melanie Subbiah, Jared Kaplany, Prafulla Dhariwal, Arvind Neelakantan, Pranav Shyam, Girish Sastry, Amanda Askell, Sandhini Agarwal, Ariel Herbert-Voss, Gretchen Krueger, Tom Henighan, Rewon Child, Aditya Ramesh, Daniel M. Ziegler, Jeffrey Wu, Clemens Winter, Christopher Hesse, Mark Chen, Eric Sigler, Mateusz Litwin, Scott Gray, Benjamin Chess, Jack Clark, Christopher Berner, Sam McCandlish, Alec Radford, Ilya Sutskever, Dario Amodei, arXiv: 2005. 14165v4 [cs.CL], 22 Jul 2020.
要約生成部24は、大規模言語モデル28が生成した要約文を受け取って、その内容を送信部30に提供する。送信部30は、このようにして受け取った要約文の内容を、ネットワーク12を介してユーザ端末14に送信することができる。
情報処理装置10は、更に、編集情報受信部32を備えている。編集情報受信部32は、ネットワーク12を介して、ユーザ端末14の指令に基づく編集情報を受信する。編集情報受信部32が受信した編集情報は、要約生成部24に提供される。そして、要約生成部24は、その編集情報を反映させることにより、要約文を再生成することができる。
以下、要約生成部24の機能について詳細に説明する。要約生成部24は、言語データ加工部22から上記の要約基礎情報を受信すると、サンプル特定処理と要約生成処理とを実行する。
図5は、サンプル特定処理の機能を実現するために情報処理装置10が実行する処理の流れを説明するためのフローチャートである。図5に示すルーチンでは、先ず、言語データ加工部22から提供された要約基礎情報と、要約サンプルDB26に格納されている全ての要約サンプルセットとについて、特徴量が計算される(ステップ120)。
次に、要約基礎情報の特徴量と、要約サンプルセットの特徴量の類似度が計算される(ステップ122)。類似度の計算は、全ての要約サンプルセットについて実行される。
次いで、類似度の高い要約サンプルセットが抽出される(ステップ124)。抽出する要約サンプルセットの数は、初期設定により、或いはユーザの指定により決定されている。ここでは、上記ステップ122で計算された類似度が高い順に、既定数の要約サンプルセットが抽出される。以上の処理により、サンプル特定処理が実現される。
要約生成部24は、要約基礎情報と、抽出された要約サンプルセットとに基づいて要約生成処理を実行する。本実施形態では、上記の通り、要約生成のために、自然文型の要約基礎情報と単語型の要約基礎情報の双方が用いられる。
図6は、自然文型の要約基礎情報が用いられる場合の要約生成処理の流れを説明するための図である。図6に示す例では、「要約基礎情報(自然文型)」が、以下に示す三つのパートで構成されている。
1(上段).第1の要約サンプルセット38:自然文の記述とその要約文とを含む。
2(中段).第2の要約サンプルセット40:自然文の記述とその要約文とを含む。
3(下段).要約文の基礎となる要約基礎情報42:自然文型の記述を含む。
1(上段).第1の要約サンプルセット38:自然文の記述とその要約文とを含む。
2(中段).第2の要約サンプルセット40:自然文の記述とその要約文とを含む。
3(下段).要約文の基礎となる要約基礎情報42:自然文型の記述を含む。
自然文型の要約基礎情報を用いるモードでは、上記の「要約基礎情報(自然文型)」が大規模言語モデル28に提供される。大規模言語モデル28は、そのような要約基礎情報を受けると、第1の要約サンプルセット38および第2の要約サンプルセット40の関係に基づいて、要約基礎情報42の要約文44を生成する。生成された要約文44は、大規模言語モデル28から要約生成部24に向けて出力される。
図7は、単語型の要約基礎情報が用いられる場合の要約生成処理の流れを説明するための図である。図7に示す例では、「要約基礎情報(単語型)」が、以下に示す三つのパートで構成されている。
1(上段).第1の要約サンプルセット46:単語型の記述とその要約文とを含む。
2(中段).第2の要約サンプルセット48:単語型の記述とその要約文とを含む。
3(下段).要約文の基礎となる要約基礎情報50:単語型の記述を含む。
1(上段).第1の要約サンプルセット46:単語型の記述とその要約文とを含む。
2(中段).第2の要約サンプルセット48:単語型の記述とその要約文とを含む。
3(下段).要約文の基礎となる要約基礎情報50:単語型の記述を含む。
単語型の要約基礎情報を用いるモードでは、上記のような「要約基礎情報(単語型)」が大規模言語モデル28に提供される。大規模言語モデル28は、そのような要約基礎情報を受けると、第1の要約サンプルセット46および第2の要約サンプルセット48に基づいて、要約基礎情報50の要約文52を生成する。生成された要約文52は、大規模言語モデル28から要約生成部24に向けて出力される。
要約生成部24は、要約生成処理で受け取った要約文と、サンプル特定処理で抽出された要約サンプルセットとを送信部30に提供する。言語データ加工部22が要約基礎情報を送信部30に提供する。送信部30は、それらの提示情報をネットワーク12を介してユーザ端末14に送信する。
図8は、送信部30から上記の提示情報を受信したユーザ端末14に表示される編集画面54の一例を示す。より具体的には、図8は、要約生成の際に図6に示す「要約基礎情報(自然文型)」が用いられた場合の編集画面54を示している。ユーザ端末14は、提示情報に基づく編集画面54を表示する。
編集画面54には、プロンプト編集欄56が表示される。プロンプト編集欄56には、要約生成の際に基礎とされた全ての要約サンプルセットが表示される。プロンプト編集欄56の画面サイズが、表示すべき内容に対して小さい場合は、スクロール機能が有効になる。この場合、ユーザは、スクロール操作を行うことで表示の全てを視認することができる。図8は、プロンプト編集欄56に、図6に示す第1の要約サンプルセット46の全体と、第2の要約サンプルセット48の一部とが表れている状態を例示している。
編集画面54において、ユーザが各欄を選択すると、選択された欄が全体表示されてもよい。この際、表示内容が画面に収まらなければスクロール機能が有効になるようにしてもよい。更に、編集画面54において、ユーザが各欄を選択すると、各欄の編集用ページのウィンドウまたはタブが生成されてもよいし、されなくてもよい。
ユーザは、プロンプト編集欄56の枠内で、要約文の基礎とするべき要約サンプルセットの内容を編集することができる。編集は、プロンプト編集欄56に表示されている内容を書き換えることにより行うことができる。更に、ユーザが、自ら探し出したコンテンツ(記事等)と要約文の組み合わせを、プロンプト編集欄56に貼り付けることにより、要約サンプルセットの全体を入れ替えることによる編集も可能である。
編集画面54には、ユーザ入力編集欄58が表示される。ユーザ入力編集欄58には、要約生成の基礎とされた要約基礎情報が表示される。図8に示す例では、図6に示す自然文型の要約基礎情報42が、ユーザ入力編集欄58に表示されている。
ユーザは、ユーザ入力編集欄58の枠内で、要約文の基礎として用いられた要約基礎情報を編集することができる。編集は、ユーザ入力編集欄58に表示されている内容を書き換える手法、或いはコピーペーストにより所望のテキストを貼り付ける手法により行うことができる。
要約基礎情報は、音声またはテキストで提供された言語データに加工を施すことで生成されている。この際の加工では、ユーザが重要であると考えている単語や文書が削除され、重要でないと考えている部分が残されることがある。ユーザ入力編集欄58の編集では、要約基礎情報がユーザの意図に沿わない内容になっている場合に、その内容を適切なものに正すことができる。
編集画面54には、また、要約文欄60が表示される。要約文欄60には、大規模言語モデル28によって生成された要約文が表示される。ユーザは、要約文欄60により、現在の条件下で生成された要約文を確認することができる。
編集画面54には、更に、「再生成(ボタン)」62が表示されている。ユーザは、プロンプト編集欄56またはユーザ入力編集欄58、或いはそれら双方に必要な編集を施した後、「再生成(ボタン)」62を選択することで、編集操作の完了をユーザ端末14に知らせることができる。選択操作については、タップ等様々なものが考えられる。ユーザ端末14は、編集操作の完了を検知すると、編集情報を情報処理装置10に向けて送信する。編集情報は、編集済みの要約サンプルセットと編集済みの要約基礎情報の少なくとも一方を含む。
ユーザ端末14により要約文の再生成が求められると、編集情報受信部32によって編集情報が受信される。受信された編集情報は要約生成部24に提供される。要約生成部24は、編集情報に含まれる情報、つまり、編集済みの要約サンプルセット、および編集済みの要約基礎情報に基づいて要約生成36の処理を実行する。
図9は、要約文を再生成するために情報処理装置10が実行する処理の流れを説明するためのフローチャートである。図9に示すルーチンでは、先ず、ユーザ端末14の編集画面54を通してユーザによる編集操作を受け付ける(ステップ130)。具体的には、ユーザ端末14に編集画面54を表示させ、要約サンプルセットおよび要約基礎情報についてのユーザによる編集を受け付ける。
次に、編集の確定操作が実行されたか否かが判別される(ステップ132)。具体的には、ユーザ端末14において「再生成(ボタン)」がタップされたか否かを判別する。
そして、編集の確定操作が検知されたら、再生成が要求されたと判断して、要約文を再生成するための処理が実施される(ステップ134)。具体的には、編集画面54を通して受け付けた編集後の要約サンプルセットおよび要約基礎情報が、再生成のために大規模言語モデル28に提供される。
大規模言語モデル28は、上記の処理により要約基礎情報等を受け取ると、要約文を再生成して情報処理装置10に提供する。情報処理装置10は、大規模言語モデル28から再生成された要約文を受け取ると、その要約文をユーザ端末14に向けて出力する(ステップ136)。
以後、ユーザの判断に従って、要約文の更なる再生成を実施するか、今回生成した要約文を最終出力とするかが選択される(ステップ138)。具体的には、ユーザ端末14において再び「再生成(ボタン)」がタップされた場合は、更なる再生成を実施するべく、上記ステップ130の処理が再び実施される。一方、ユーザ端末14から要約確定の指令を受けた場合、或いは「再生成(ボタン)」がタップされることなく一定の時間が経過した場合は、最新の要約文を最終出力として確定する(ステップ140)。
[実施の形態1の効果]
上述した通り、本実施形態の情報処理装置10は、要約生成の基礎として用いる要約基礎情報をユーザ端末14に提供して、その編集の機会をユーザに与える。このため、ユーザは、要約文の基礎となる要約基礎情報が適切であるか否かを判断し、不適切である場合には、その内容を編集することができる。例えば、要約基礎情報から重要な内容が削除されていれば、その内容を含むように要約基礎情報を編集することができる。また、要約基礎情報に、重要でない内容が含まれていれば、要約基礎情報からその内容を削除することができる。このような編集によれば、ユーザの意図する要約文を得るのに適した要約基礎情報を大規模言語モデル28に与えることができる。このため、本実施形態によれば、ユーザの求める要約文を精度良く生成する機能を実現することができる。
上述した通り、本実施形態の情報処理装置10は、要約生成の基礎として用いる要約基礎情報をユーザ端末14に提供して、その編集の機会をユーザに与える。このため、ユーザは、要約文の基礎となる要約基礎情報が適切であるか否かを判断し、不適切である場合には、その内容を編集することができる。例えば、要約基礎情報から重要な内容が削除されていれば、その内容を含むように要約基礎情報を編集することができる。また、要約基礎情報に、重要でない内容が含まれていれば、要約基礎情報からその内容を削除することができる。このような編集によれば、ユーザの意図する要約文を得るのに適した要約基礎情報を大規模言語モデル28に与えることができる。このため、本実施形態によれば、ユーザの求める要約文を精度良く生成する機能を実現することができる。
また、上述した実施の形態1では、大規模言語モデル28が要約生成の際に参照する要約サンプルセットをユーザ端末14に提供して、その編集の機会をユーザに与える。このため、ユーザは、要約サンプルセットが適切であるか否かを判断し、不適切である場合には、その内容を編集することができる。例えば、要約サンプルセットに含まれる要約文サンプルが、意図する文字数より多くの文字数を含んでいる場合は、その文字数を減らすように要約文サンプルを編集することができる。また、要約サンプルセットに含まれる要約文サンプルの体裁が、意図する体裁でない場合は、意図に沿うように要約文サンプルを編集することができる。このような編集によれば、ユーザの意図する要約文を得るのに適した要約サンプルセットを大規模言語モデル28に与えることができる。このため、本実施形態によれば、ユーザの求める要約文を精度良く生成する機能を実現することができる。
また、上述した実施の形態1では、要約サンプルDB26に格納されている要約サンプルセットから、要約基礎情報と類似するものを抽出して要約生成の基礎とすることができる。要約サンプルセットに含まれる自然文型または単語型の要約基礎情報が、要約生成の基礎となる要約基礎情報と大きく乖離していると、大規模言語モデル28にとって、要約サンプルセットに含まれる情報を適切に要約生成に活用することが困難になる。一方、文字数や体裁等の特徴量が要約基礎情報の特徴量と類似した要約サンプルセットが与えられれば、大規模言語モデル28にとって、要約サンプルセットに含まれる情報を活用するのが容易となる。本実施形態では、大規模言語モデル28に、要約基礎情報と類似した要約サンプルセットを提供することができるため、ユーザの求める要約文を精度良く生成する機能を実現することができる。
また、上述した実施の形態1では、要約サンプルDB26に格納されている全ての要約サンプルセットと要約基礎情報とについて特徴量を計算する。例えば、要約サンプルに含まれる自然文型または単語型の要約基礎情報サンプルの文字数、体裁、データ構造等、並びに要約基礎情報の文字数、体裁、データ構造等が特徴量として計算される。そして、要約基礎情報の特徴量と類似する特徴量を有する要約サンプルセットが類似した要約サンプルセットとして抽出される。このような手法によれば、要約基礎情報と構造が類似した要約サンプルセットを、適切に大規模言語モデル28に提供することができる。このため、本実施形態によれば、ユーザの求める要約文を精度良く生成する機能を実現することができる。
また、上述した実施の形態1では、要約サンプルセットに、自然文型または単語型の要約基礎情報サンプルと、その要約基礎情報サンプルに対応する要約文サンプルとを含めることとしている。大規模言語モデル28は、要約サンプルセット中の要約基礎情報サンプルと要約文サンプルとの関係に基づいて、要約基礎情報に対する要約文を推定することができる。このため、本実施形態によれば、要約サンプルセットの情報を有効に活用して、ユーザの求める要約文を精度良く生成する機能を実現することができる。
また、上述した実施の形態1では、大規模言語モデル28が生成した要約文をユーザ端末14の編集画面54に表示させる。このため、ユーザは、要約生成の基礎とされた「要約基礎情報」および「要約サンプルセット」と、要約生成の結果である「要約文」とを対比して視認することができる。そして、現在の「要約文」が、意図に沿ったものであるか否かを判断したうえで、「要約基礎情報」或いは「要約サンプルセット」について、編集の要否を判断することができる。このため、本実施形態によれば、ユーザにとって作業性に優れた編集機能を提供することができる。
[実施の形態1の変形例]
ところで、上述した実施の形態1では、ユーザ端末14の編集画面54に、要約サンプルセットと、要約基礎情報と、要約文とを表示することとしている。しかしながら、編集画面54に表示する内容はこれに限定されるものではない。例えば、要約サンプルセットと要約文とを省略して、「要約基礎情報」だけを編集画面54に表示することとしてもよい。ユーザは、この場合も、要約文の基礎となる要約基礎情報が適切なものであるか否かを判断し、その内容を適切なものに編集することはできる。このため、当該変形例によっても、ユーザの求める要約文を生成する機能は実現することができる。尚、この場合、要約サンプルセットの特定も要約文の生成も要約基礎情報の提示前に実行する必要はなく、ユーザによる編集の後に実行することとしてもよい。この場合、編集後が一度目の要約文の生成となる。また、この場合、要約文の生成、再生成は、特定した要約サンプルセットと編集済みの要約基礎情報とに基づいて行われる。
ところで、上述した実施の形態1では、ユーザ端末14の編集画面54に、要約サンプルセットと、要約基礎情報と、要約文とを表示することとしている。しかしながら、編集画面54に表示する内容はこれに限定されるものではない。例えば、要約サンプルセットと要約文とを省略して、「要約基礎情報」だけを編集画面54に表示することとしてもよい。ユーザは、この場合も、要約文の基礎となる要約基礎情報が適切なものであるか否かを判断し、その内容を適切なものに編集することはできる。このため、当該変形例によっても、ユーザの求める要約文を生成する機能は実現することができる。尚、この場合、要約サンプルセットの特定も要約文の生成も要約基礎情報の提示前に実行する必要はなく、ユーザによる編集の後に実行することとしてもよい。この場合、編集後が一度目の要約文の生成となる。また、この場合、要約文の生成、再生成は、特定した要約サンプルセットと編集済みの要約基礎情報とに基づいて行われる。
また、編集画面54には、要約文を省略して「要約サンプルセット」と「要約基礎情報」を表示してもよい。この場合、ユーザは、要約文の基礎となる「要約サンプルセット」と「要約基礎情報」が適切なものであるか否かを判断し、その内容を適切なものに編集することはできる。このため、当該変形例によっても、ユーザの求める要約文を生成する機能は実現することができる。尚、この場合、要約サンプルセットと要約基礎情報を編集画面54に表示させる以前の要約生成が不要となる。そして、ユーザによる編集後が一度目の要約文の生成となる。
更には、編集画面54には、要約サンプルセットを省略して「要約基礎情報」と「要約文」を表示してもよい。この場合、ユーザは、生成された「要約文」を確認したうえで、「要約基礎情報」を適切に修正することができる。このため、当該変形例によっても、ユーザの求める要約文を生成する機能は実現することができる。
本開示の実施形態を諸図面や実施例に基づき説明してきたが、当業者であれば本開示に基づき種々の変形や修正を行うことが容易であることに注意されたい。従って、これらの変形や修正は本開示の範囲に含まれることに留意されたい。限定でなく例として、各処理、各ステップ等に含まれる機能等は論理的に矛盾しないように再配置可能であり、複数の処理やステップ等を1つに組み合わせたり、或いは分割したりすることが可能である。また、各実施形態に示す構成を適宜組み合わせることとしてもよい。
10 情報処理装置
14 ユーザ端末
20 言語データ受信部
22 言語データ加工部
24 要約生成部
26 要約サンプルデータベース(DB)
28 大規模言語モデル
32 編集情報受信部
38、46 第1の要約サンプルセット
40、48 第2の要約サンプルセット
42、50 要約基礎情報
44、52 要約文
54 編集画面
56 プロンプト編集欄
58 ユーザ入力編集欄
60 要約文欄
62 再生成(ボタン)
14 ユーザ端末
20 言語データ受信部
22 言語データ加工部
24 要約生成部
26 要約サンプルデータベース(DB)
28 大規模言語モデル
32 編集情報受信部
38、46 第1の要約サンプルセット
40、48 第2の要約サンプルセット
42、50 要約基礎情報
44、52 要約文
54 編集画面
56 プロンプト編集欄
58 ユーザ入力編集欄
60 要約文欄
62 再生成(ボタン)
Claims (8)
- ユーザ端末の要求に応じて言語データを取得する言語データ取得処理と、
前記言語データを加工して、要約基礎情報を生成する言語データ加工処理と、
前記要約基礎情報を含む提示情報を前記ユーザ端末に送信するための送信処理と、
前記ユーザ端末から、前記提示情報に関する編集情報を受信する編集情報受信処理と、
言語モデルに、前記編集情報を提供して、前記編集情報に応じて、前記要約基礎情報に対する要約文を生成させる要約生成処理と、
を実行するように構成された演算処理ユニットを備える情報処理装置。 - 前記言語モデルは、要約サンプルセットを受け付けて、当該要約サンプルセットの情報に応じて前記要約基礎情報に対する要約文を生成し、
前記提示情報は、前記要約基礎情報と共に、前記言語モデルに提供する要約サンプルセットを含み、
前記編集情報は、前記要約基礎情報に関する編集情報、および前記要約サンプルセットに関する編集情報の少なくとも一方を含む請求項1に記載の情報処理装置。 - 前記演算処理ユニットは、前記要約基礎情報と類似する要約サンプルセットを特定するサンプル特定処理を更に実行するように構成され、
前記提示情報に含まれる前記要約サンプルセットは、前記サンプル特定処理で特定された要約サンプルセットである請求項2に記載の情報処理装置。 - 前記サンプル特定処理は、
複数の要約サンプルセットの夫々について、前記要約基礎情報との類似度を計算する処理と、
前記類似度に基づいて前記特定を実施する処理と、
を含む請求項3に記載の情報処理装置。 - 前記要約サンプルセットは、要約基礎情報サンプルと、当該要約基礎情報サンプルに対する要約文サンプルとを含む請求項2乃至4の何れか1項に記載の情報処理装置。
- 前記演算処理ユニットは、前記言語モデルに前記要約基礎情報を提供して、当該要約基礎情報に対する要約文を生成させる処理を更に実行するように構成され、
前記提示情報は、前記要約基礎情報と共に、当該要約基礎情報に対して生成された要約文を含む請求項1乃至5の何れか1項に記載の情報処理装置。 - ユーザ端末の要求に応じて言語データを取得することと、
前記言語データを加工して、要約基礎情報を生成することと、
前記要約基礎情報を含む提示情報を前記ユーザ端末に送信することと、
前記ユーザ端末から、前記提示情報に関する編集情報を受信することと、
言語モデルに、前記編集情報を提供して、前記編集情報に応じて、前記要約基礎情報に対する要約文を生成させることと、
を含む情報処理方法。 - 演算処理ユニットに、
ユーザ端末の要求に応じて言語データを受信することと、
前記言語データを加工して、要約基礎情報を生成することと、
前記要約基礎情報を含む提示情報を前記ユーザ端末に送信することと、
前記ユーザ端末から、前記提示情報に関する編集情報を受信することと、
言語モデルに、前記編集情報を提供して、前記編集情報に応じて、前記要約基礎情報に対する要約文を生成させることと、
を実行させるプログラムを含む情報処理用プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021185924A JP2023073095A (ja) | 2021-11-15 | 2021-11-15 | 情報処理装置、情報処理方法および情報処理用プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021185924A JP2023073095A (ja) | 2021-11-15 | 2021-11-15 | 情報処理装置、情報処理方法および情報処理用プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023073095A true JP2023073095A (ja) | 2023-05-25 |
Family
ID=86425406
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021185924A Pending JP2023073095A (ja) | 2021-11-15 | 2021-11-15 | 情報処理装置、情報処理方法および情報処理用プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2023073095A (ja) |
-
2021
- 2021-11-15 JP JP2021185924A patent/JP2023073095A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6799574B2 (ja) | 音声対話の満足度の確定方法及び装置 | |
US10489112B1 (en) | Method for user training of information dialogue system | |
CN109360550B (zh) | 语音交互系统的测试方法、装置、设备和存储介质 | |
US7974835B2 (en) | Method, system, and apparatus for natural language mixed-initiative dialogue processing | |
US7054817B2 (en) | User interface for speech model generation and testing | |
CN110164435A (zh) | 语音识别方法、装置、设备及计算机可读存储介质 | |
US20140122083A1 (en) | Chatbot system and method with contextual input and output messages | |
JP3523213B2 (ja) | コマンド処理装置、コマンド処理方法、及びコマンド処理プログラム | |
US20080077869A1 (en) | Conference supporting apparatus, method, and computer program product | |
JP2002513185A (ja) | ローカルコンピュータ及びインターネットとともに使用するインテリジェントアシスタント | |
KR20090058409A (ko) | 편집 가능한 개인 사전을 제공하고 활용하는 방법 및시스템 | |
CN107943770A (zh) | 基于零配件交易平台的网页表格快速输入方法及装置 | |
US20150121200A1 (en) | Text processing apparatus, text processing method, and computer program product | |
CN111142667A (zh) | 一种基于文本标记生成语音的系统和方法 | |
JPH07222248A (ja) | 携帯型情報端末における音声情報の利用方式 | |
CN117851457A (zh) | 图表生成方法、装置、设备及存储介质 | |
US5212634A (en) | Method of and apparatus for automatically generating application program | |
CN102323858A (zh) | 识别输入时修改项的输入方法、终端及系统 | |
JP2023073095A (ja) | 情報処理装置、情報処理方法および情報処理用プログラム | |
CN112242132A (zh) | 语音合成中的数据标注方法、装置和系统 | |
CN115186070A (zh) | 信息处理方法、装置、设备、存储介质及程序产品 | |
CN111832268B (zh) | 信息交互方法、可读存储介质和电子设备 | |
CN112487170B (zh) | 面向场景配置的人机交互对话机器人系统 | |
WO2021142607A1 (zh) | 一种车辆诊断过程回放方法、设备及可读存储介质 | |
CN113590871A (zh) | 一种音频分类方法、装置及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20230829 |