JP7317887B2 - 情報処理装置、情報処理方法および情報処理プログラム - Google Patents

情報処理装置、情報処理方法および情報処理プログラム Download PDF

Info

Publication number
JP7317887B2
JP7317887B2 JP2021071288A JP2021071288A JP7317887B2 JP 7317887 B2 JP7317887 B2 JP 7317887B2 JP 2021071288 A JP2021071288 A JP 2021071288A JP 2021071288 A JP2021071288 A JP 2021071288A JP 7317887 B2 JP7317887 B2 JP 7317887B2
Authority
JP
Japan
Prior art keywords
data
constraint
information processing
candidate
generated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021071288A
Other languages
English (en)
Other versions
JP2022165786A (ja
Inventor
知秀 柴田
隼人 小林
拓明 田口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2021071288A priority Critical patent/JP7317887B2/ja
Publication of JP2022165786A publication Critical patent/JP2022165786A/ja
Application granted granted Critical
Publication of JP7317887B2 publication Critical patent/JP7317887B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

特許法第30条第2項適用 公開日 令和3年4月12日 言語処理学会第27回年次大会(NLP2021)プログラム https://www.anlp.jp/proceedings/annual_meeting/2021/ 公開日 令和3年4月12日 投稿論文 https://www.anlp.jp/proceedings/annual_meeting/2021/pdf_dir/B7-3.pdf
本発明は、情報処理装置、情報処理方法および情報処理プログラムに関する。
近年、例えば、ニュース記事を配信するサービス等において、ニュース記事の要点を押さえた短い見出し等の要約を自動で作成する技術が提案されている。
特開2021-033995号公報
しかしながら、従来技術では、適切な要約を生成する点で更なる改善の余地があった。例えば、ニュース記事の見出しを作成する場合、同じニュース記事であっても編集者によって求める見出しが異なる場合があり、編集者によって自動作成された見出しが適切ではないと感じるおそれがあった。
本願は、上記に鑑みてなされたものであって、適切な要約を生成することができる情報処理装置、情報処理方法および情報処理プログラムを提供することを目的とする。
本願に係る情報処理装置は、生成部と、更新部とを備える。前記生成部は、元データに基づいて生成される要約データであって、クライアントユーザから受け付けた所定の制約条件に従って制約された前記要約データの候補データを生成する。前記更新部は、前記生成部によって生成された前記候補データに基づいて前記制約条件を更新する。前記生成部は、前記更新部によって更新された前記制約条件を用いて前記要約データの確定データを生成する。
実施形態の一態様によれば、適切な要約を生成することができるという効果を奏する。
図1は、実施形態に係る情報処理の一例を示す図である。 図2は、実施形態に係る情報処理システムの一例を示す図である。 図3は、実施形態に係る元データDBの一例を示す図である。 図4は、実施形態に係る制約条件DBの一例を示す図である。 図5は、実施形態に係るモデルDBの一例を示す図である。 図6は、クライアント端末の表示部に表示される表示画面の一例を示す図である。 図7は、実施形態に係る情報処理装置によって実行される処理の一例を示すフローチャートである。 図8は、ハードウェア構成の一例を示す図である。
以下に、本願に係る情報処理装置、情報処理方法および情報処理プログラムを実施するための形態(以下、「実施形態」と記載する)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理方法および情報処理プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
(実施形態)
〔情報処理の概要〕
まず、図1を参照して、本開示の例示的な実施形態について詳細に説明する。図1は、実施形態に係る情報処理の一例を示す図である。図1に示す情報処理は、実施形態に係る情報処理装置1が情報処理方法を実行することで行われる処理である。
実施形態に係る情報処理は、例えば、ニュース等の記事である元データから、要点を押さえた短い見出し等の要約データを生成する処理であり、本開示では、編集者等のクライアントユーザが記事に含まれる特定のキーワード等を制約として与えてインタラクティブに要約データを生成する。
ここで、日々のニュース記事の見出しは、ニュース記事を作成したクライアントユーザが手作業で作成している場合があり、クライアントユーザにとっては手間のかかる作業である。このため、従来は、見出しの候補を自動作成してクライアントユーザに提示する技術が種々提案されている。しかしながら、同じニュース記事であっても、編集者の考え方によって作成される見出しが異なることが一般的であるため、編集者によっては、自動作成された見出しが的外れな(精度が低い)ものであると感じてしまうおそれがあった。このように、従来は、より適切な要約データを生成する点で改善の余地があった。
そこで、実施形態に係る情報処理では、要約データを自動生成してクライアントユーザに提示し、クライアントユーザから新たな制約条件を受け付けて要約データを再生成することで、徐々に制約条件を更新しながら要約データを生成する。
図1では、元データである「火山灰の量は?気象庁が24日から新しい降灰予報スタート・・・火山灰も広い範囲にわたって私たちの生活に大きな被害を与えます。気象庁は、3月24日から新しい降灰予報を順次スタートさせます。これまでの降灰予報をバージョンアップさせたこの予報は、一体どのようなものなのでしょうか。」から見出しである要約データを生成する例を示している。また、このような元データを入力したクライアントユーザは、「新しい降灰予報、気象庁開始へ」といったような大まかな見出し案を想定していることとする。
図1に示すように、まず、情報処理装置1は、元データを受け付ける(ステップS1)。図1に示す例では、元データとしてニュースの記事であるテキストデータを受け付ける場合を示しているが、元データは、テキストデータに限らず、画像データや音声データ等であってもよい。
つづいて、情報処理装置1は、元データから要約データの候補データ(制約なし)を生成する(ステップS2)。図1に示すように、情報処理装置1は、事前に学習したテキスト変換モデル等のモデルを用いて元データから要約データを生成することができる。
かかるモデルには、制約条件なしのモデルと、制約条件ありのモデルとが含まれる。制約条件なしのモデルは、過去の元データと、正解要約データとをデータセットとして学習することで生成可能である。
また、制約条件ありのモデルは、制約条件なしのモデルに元データを入力して得られた要約データと、クライアントユーザが事前に準備した正解要約データとを用いて生成される。具体的には、制約条件ありのモデルは、正解要約データに有って要約データ(モデル出力)に無いキーワード(フレーズ、文でもよい)を制約条件として抽出し、上記したデータセットに抽出した制約条件を加えた制約条件付きデータセットを用いることで生成可能である。さらに、制約条件ありのモデルは、上記で生成した制約条件ありのモデルに元データを入力して得られた要約データに無く、正解要約データに有るキーワード(フレーズ、文でもよい)を制約条件として抽出し、制約条件付きデータセットにさらに制約条件を加えた複数制約条件付きデータセットを用いることで生成可能である。複数制約条件付きデータセットと用いた場合に生成されるモデルは、複数の制約条件を満たすような要約データを出力するモデルとなる。
ステップS2では、情報処理装置1は、制約条件なしのモデルを用いて要約データの候補データ(制約なし)を生成する。図1に示す例では、制約なしの候補データとして「火山灰の量は?気象庁」が生成された例を示している。
つづいて、情報処理装置1は、生成した候補データ(制約なし)をクライアント端末100へ提示する(ステップS3)。つづいて、情報処理装置1は、クライアント端末100から制約条件を受け付ける(ステップS4)。制約条件は、キーワード制約、フレーズ制約、文制約等がある。なお、キーワード制約は、単語(キーワード)単位で制約することであり、フレーズ制約は、複数の単語からなるフレーズ単位で制約することであり、文制約は、文(センテンス)単位で制約することである。
なお、制約条件は、キーワードやフレーズ、文を要約データに含ませるように制約する条件であってもよく、要約データに含ませないように制約する条件であってもよい。また、制約条件は、文字数の制約条件、画像の制約条件、音声の制約条件等を含んでもよい。また、例えば、制約条件に複数のキーワード制約(あるいは、フレーズ制約、文制約、制約の組み合わせ)が含まれる場合には、AND条件とOR条件とを含んでもよい。
図1に示す例では、情報処理装置1は、「新しい」というキーワードを要約データに含むように制約するキーワード制約を制約条件として受け付けたとする。
つづいて、情報処理装置1は、受け付けた制約条件に基づいて、元データから要約データの候補データ(制約あり)を生成する(ステップS5)。具体的には、情報処理装置1は、上記した制約条件ありのモデルに元データおよびキーワード制約「新しい」を入力し、要約データの候補データ(制約あり(1))として「火山灰の量は?新しい降灰予報」を生成(出力)する。
つづいて、情報処理装置1は、生成した候補データ(制約あり)をクライアント端末100へ提示する(ステップS6)。つづいて、情報処理装置1は、クライアント端末100から制約条件を受け付ける(ステップS7)。ステップS7では、気象庁というフレーズを要約データに含むように制約するフレーズ制約を制約条件として受け付けたとする。
つづいて、情報処理装置1は、受け付けた制約条件に基づいて、元データから要約データの候補データ(制約あり)を生成する(ステップS8)。具体的には、情報処理装置1は、上記した制約条件ありのモデルに元データおよびフレーズ制約「気象庁」を入力し、要約データの候補データ(制約あり(2))として「火山灰の量は?気象庁新予報」を生成(出力)する。
つづいて、情報処理装置1は、生成した候補データ(制約あり)をクライアント端末100へ提示する(ステップS9)。つづいて、情報処理装置1は、クライアント端末100から制約条件を受け付ける(ステップS10)。ステップS10では、降灰というキーワードを要約データに含むように制約するキーワード制約を制約条件として受け付けたとする。
つづいて、情報処理装置1は、受け付けた制約条件に基づいて、元データから要約データの候補データ(制約あり)を生成する(ステップS11)。具体的には、情報処理装置1は、上記した制約条件ありのモデルに元データおよびキーワード制約「降灰」を入力し、要約データの候補データ(制約あり(3))として「気象庁、24日から新しい降灰予報」を生成(出力)する。
つづいて、情報処理装置1は、生成した候補データ(制約あり)をクライアント端末100へ提示する(ステップS12)。つづいて、情報処理装置1は、クライアント端末100から要約データの確定指示を受け付けたとする(ステップS13)。
情報処理装置1は、確定指示を受け付けた場合、直前に提示した候補データを要約データの確定データとして確定する(ステップS14)。
このように、実施形態に係る情報処理装置1では、生成した候補データをクライアントユーザに提示して制約条件を徐々に更新しつつ要約データを確定させることで、クライアントユーザが望むような要約データを生成することができる。すなわち、実施形態に係る情報処理装置1によれば、適切な要約(データ)を生成することができる。
以下、このような情報処理を行う情報処理装置1について詳細に説明する。
〔情報処理システム〕
次に、図2を参照して、情報処理装置1を含む情報処理システムの構成例について説明する。
〔情報処理システムの構成要素〕
図2は、実施形態に係る情報処理システムSの一例を示す図である。図2に示されるように、情報処理システムSは、情報処理装置1、クライアント端末100およびユーザ端末200等の構成要素を含む。図2中では図示していないが、情報処理システムSは、複数台の情報処理装置1や、複数台のクライアント端末100や、複数台のユーザ端末200を含んでもよい。また、情報処理システムSは、情報処理装置1に関係するエンティティ(例えば、業者、エンドユーザ)の装置等の、他の構成要素を含んでもよい。
情報処理システムSにおいて、情報処理装置1、クライアント端末100およびユーザ端末200は、それぞれネットワークNと有線又は無線により接続される。ネットワークNは、例えば、インターネット、WAN(Wide Area Network)、LAN(Local Area Network)等のネットワークである。情報処理システムSの構成要素は、ネットワークNを介して互いに通信を行うことができる。
情報処理装置1は、実施形態に係る情報処理方法を実行する装置である。情報処理装置1は、元データに基づいて要約データを生成・提示する処理や、制約条件の受付・更新する処理を行う。なお、情報処理装置1は、サーバを含む、任意のタイプの情報処理装置であってもよい。複数台の情報処理装置1が、ウェブサーバ、アプリケーションサーバ、データベースサーバ等の各種サーバの機能をそれぞれ提供してもよい。情報処理装置1の構成例の詳細については、後述する。
クライアント端末100は、情報処理装置1によって提供されるサービスの編集等を行うクライアントユーザによって利用される端末装置である。クライアントユーザは、例えば、ニュースアプリ等の記事を編集する編集者である。クライアント端末100は、インターネット上の各種サービス(例えば、ポータルサイト、ポータルアプリ)を介して、各種情報を送信または受信することができる。クライアント端末100は、スマートフォン、デスクトップ型PC、ノート型PC、タブレット型PC等の任意のタイプの情報処理装置を用いることができる。
ユーザ端末200は、情報処理装置1によって提供されるサービスを利用するユーザによって利用される端末装置である。ユーザ端末200は、インターネット上の各種サービス(例えば、ポータルサイト、ポータルアプリ)を介して、各種情報を送信または受信することができる。ユーザ端末200は、スマートフォン、デスクトップ型PC、ノート型PC、タブレット型PC等の任意のタイプの情報処理装置を用いることができる。
〔情報処理装置の構成〕
図2に示されるように、情報処理装置1は、通信部2と、制御部3と、記憶部4とを有する。なお、情報処理装置1は、情報処理装置1を利用する管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(液晶ディスプレイ等)を有してもよい。
(通信部2)
通信部2は、例えば、NIC(Network Interface Card)等によって実現される。通信部2は、有線または無線によりネットワーク網と接続される。通信部2は、クライアント端末100およびユーザ端末200に、ネットワークNを介して、通信可能に接続されてもよい。通信部2は、クライアント端末100およびユーザ端末200の間で、ネットワーク網を介して、情報の送受信を行うことができる。
(記憶部4)
記憶部4は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。図2に示されるように、記憶部4は、元データDB(DataBase)41と、制約条件DB42と、モデルDB43とを有する。
(元データDB41)
図3は、実施形態に係る元データDB41の一例を示す図である。元データDB41は、クライアント端末100から受け付けた元データを含むデータベースである。
図3の例では、元データDB41は、「データID」、「元データ」、「要約データ」、「確定フラグ」等の項目を有する。
「データID」は、元データを識別する識別子である。「元データ」は、元データの内容を含む情報である。すなわち、「元データ」には、テキストデータや、画像データ、音声データ等が含まれる。「要約データ」は、後述する生成部32によって生成された要約データ(候補データおよび確定データ)を含む情報である。「確定フラグ」は、確定指示を受け付けたか否かを示す情報である。例えば、「確定フラグ」が「0」は、まだ確定指示を受け付けていない状態を示し、「1」は、確定指示を受け付けた状態であることを示す。
(制約条件DB42)
図4は、実施形態に係る制約条件DB42の一例を示す図である。制約条件DB42は、クライアント端末100から受け付けた制約条件を含む情報である。
図4の例では、制約条件DB42は、「条件ID」、「クライアントID」、「データID」、「制約条件」等の項目を有する。
「条件ID」は、制約条件を識別する識別子である。「クライアントID」は、クライアントユーザ(あるいはクライアント企業)を識別する識別子である。「データID」は、元データを識別する識別子である。「制約条件」は、クライアント端末100から受け付けた制約条件を含む情報である。
(モデルDB43)
図5は、実施形態に係るモデルDB43の一例を示す図である。モデルDB43は、元データから要約データを生成するためのモデルを含む情報である。
図5の例では、モデルDB43は、「モデルID」、「カテゴリ」、「モデル」等の項目を有する。
「モデルID」は、モデルを識別する識別子である。「カテゴリ」は、元データおよび要約データのカテゴリを示す情報である。「モデル」は、モデルの情報であり、「制約なし」および「制約あり」等の項目を有する。
「制約なし」は、上記した制約条件なしのモデルを含む情報である。「制約あり」は、上記した制約条件ありのモデルを含む情報である。なお、「制約あり」は、制約条件(あるいは複数の制約条件の組み合わせ)毎の項目を有してもよい。
(制御部3)
制御部3は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)等のプロセッサによって、情報処理装置100内部の記憶装置に記憶されている各種プログラム(判定プログラムの一例に相当)がRAM等を作業領域として実行されることにより実現される。また、制御部3は、コントローラ(controller)であり、例えば、ASIC(Application Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)、GPGPU(General Purpose Graphic Processing Unit)等の集積回路により実現されてもよい。
制御部3は、図2に示されるように、受付部31と、生成部32と、更新部33と、提示部34とを有し、以下に説明する情報処理の機能や作用を実現又は実行する。また、制御部3は、図1で説明した情報処理を実現することができる。情報処理装置1の1つまたは複数のプロセッサは、情報処理装置1の1つまたは複数のメモリに記憶された命令を実行することによって、制御部3内の各機能を実現することができる。なお、制御部3の内部構成は、図2に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。例えば、生成部32は、生成部32以外の部に関して後述する情報処理の全部または一部を行ってもよい。
受付部31は、各種情報を受け付ける。例えば、受付部31は、サービスにおける元データを受け付ける。元データは、図1で示したように、例えば、テキストデータである。また、元データは、テキストデータに限らず、画像データ、音声データ、または、これらデータを組み合わせたデータ(テキストデータ+画像データ等)が含まれてもよい。
また、受付部31は、要約データに与える制約条件を受け付ける。制約条件は、上記したように、要約データに含まれるキーワードのテキストを制約するキーワード制約や、要約データに含まれるフレーズのテキストを制約するフレーズ制約、要約データに含まれる文のテキストを制約する文制約等がある。なお、制約条件は、キーワードや、フレーズ、文を要約データに含むように制約する条件であってもよく、キーワードや、フレーズ、文を要約データに含まないように制約する条件であってもよい。つまり、制約条件は、要約データに所定のテキストを含ませる制約であってもよく、要約データに所定のテキストを含ませない制約であってもよい。また、制約条件は、要約データがテキストデータの場合、要約データにおける文字数を制約する文字数制約が含まれてもよい。
文字数制約は、要約データの文字数を所定の閾値未満に収める制約や、所定の閾値以上の文字数とする制約、文字数を指定する制約等がある。また、文字数制約は、例えば、提示された候補データの文字数よりも多くする(あるいは少なくする)という制約であってもよい。
また、制約条件は、要約データが画像データである場合、特定の対象物が映る(あるいは映らない)画像を抽出するという制約条件であってもよい。また、制約条件は、要約データが音声データである場合、声の調子、音声の再生スピード、訛り、性別等を指定する制約であってもよい。
なお、制約条件は、候補データが提示された後のタイミングで受け付けるようにしてもよく、元データと同じタイミングで受け付けるようにしてもよい。
また、上述したように、制約条件は、徐々に更新する特性を有するため、前回(あるいはもっと前)に受け付けた制約条件に対するAND条件、あるいは、OR条件を含んでもよい。
また、受付部31は、提示部34によって提示された候補データを要約データの確定データとして確定させる確定指示を受け付ける。
生成部32は、受付部31が受け付けた元データおよび制約条件に基づいて、元データを要約した要約データの候補データを生成する。具体的には、生成部32は、受付部31が元データのみ(制約条件なし)受け付けた場合、モデル情報43における制約条件なしのモデルのうち、クライアントユーザによって指定されたカテゴリのモデルに元データを入力してモデルから出力された要約データを候補データとして生成する。
また、生成部32は、受付部31によって制約条件が受け付けられた場合、制約条件に合致した制約条件ありのモデルに元データを入力してモデルから出力された要約データを候補データとして生成する。
なお、生成部32は、更新部33によって制約条件が更新された場合には、更新された制約条件に合致した制約条件ありのモデルに元データを入力してモデルから出力された要約データを候補データとして生成する。
また、生成部32は、受付部31が確定指示を受け付けた場合には、直前に生成した候補データを要約データの確定データとして確定し、記憶部4に記憶された元データDB41の「確定フラグ」を0から1へ更新する。
そして、要約データの確定データが確定することで、サービスを利用するユーザは、ユーザ端末200を介して確定データである要約データや対応する元データを閲覧することができるようになる。
なお、生成部32によって生成される要約データは、元データと同じデータ種別である場合に限らず、異なるデータ種別であってもよい。例えば、元データがテキストデータである場合には、要約データが画像データや音声データであってもよい。つまり、生成部32は、元データとはデータ種別が異なる要約データを出力するモデルを用いて要約データを生成してもよい。
更新部33は、生成部32によって生成された候補データに基づいて、制約条件を更新する。具体的には、更新部33は、新たに制約条件を受け付けられた場合には、過去の制約条件に新たな制約条件を加えることで更新する。つまり、更新部33は、過去の制約条件と新たな制約条件とをすべて含んだ制約条件に更新する。換言すれば、更新部33は、提示部34によって提示された候補データに対する制約条件の追加をクライアントユーザから受け付けた場合、候補データに対応する制約条件を更新する。
なお、更新部33は、例えば、クライアント端末100から過去の制約条件のうち、指定された一部の制約条件を加える指示があった場合には、指定された一部の制約条件および新たな制約条件を含む制約条件に更新する。また、更新部33は、過去の制約条件を破棄する指示があった場合には、新たな制約条件のみの制約条件に更新する。
提示部34は、生成部32によって生成された要約データの候補データをクライアント端末100へ提示する。例えば、提示部34は、候補データがテキストデータや画像データである場合には、クライアント端末100の表示部(不図示)に候補データを表示する。
また、提示部34は、候補データが音声データである場合には、クライアント端末100のスピーカ(不図示)を介して候補データを音声出力する。この際、提示部34は、クライアント端末100に音声のテキストデータを併せて表示してもよい。
また、提示部34は、前回提示した候補データからの変更箇所を強調表示するようにしてもよい。また、提示部34は、新たに提示する候補データとともに、前回提示した候補データを提示してもよい。
次に、図6を用いて、クライアント端末100の表示部に表示される表示画面について説明する。図6は、クライアント端末100の表示部に表示される表示画面500の一例を示す図である。図6に示す表示画面500は、情報処理装置1によって生成されて送信されてもよく、あるいは、情報処理装置1からクライアント端末100に提供されるプログラムに従ってクライアント端末100が描画してもよい。
図6に示すように、表示画面500には、元データを入力(編集)可能な入力項目501と、制約条件を入力可能な入力項目502と、元データから要約データを生成するための要約生成ボタン503と、要約データ(候補データ)が表示される表示領域504と、確定指示を情報処理装置1へ送信するための確定ボタン505とが表示される。
また、入力項目502には、制約条件が編集可能に表示される表示領域502aと、制約条件を追加するための追加ボタン502bと、各制約条件を組み込むか否かを選択するチェックボックス502cとが含まれる。
クライアントユーザは、例えば、追加ボタン502bを押下し、追加したい制約条件(キーワードや、フレーズ、文)を入力項目501に表示された元データから選択することで制約条件を追加することができる。
〔処理フロー〕
次に、図7を参照して、実施形態に係る情報処理装置1による処理の手順について説明する。図7は、実施形態に係る情報処理装置1によって実行される処理の一例を示すフローチャートである。
図7に示すように、受付部31は、まず、クライアント端末100から元データを受け付ける(ステップS101)。
つづいて、生成部32は、元データをモデルに入力することで、要約データの候補データ(制約条件なし、または、制約条件あり)を生成する(ステップS102)。
つづいて、提示部34は、生成した要約データの候補データをクライアント端末100を介してクライアントユーザへ提示する(ステップS103)。
つづいて、受付部31は、クライアント端末100から候補データに対する確定指示または制約条件のいずれを受け付けたかを判定する(ステップS104)。
生成部32は、受付部31によって確定指示が受け付けられた場合(ステップS104:Yes)、直前に提示した候補データを要約データの確定データとして確定させ(ステップS105)、処理を終了する。
一方、更新部33は、受付部31によって制約条件が受け付けられた場合(ステップS104:No)、制約条件を更新し(ステップS106)、ステップS102に移行する。かかる場合、生成部32は、ステップS102において、更新された制約条件を用いて要約データの候補データを生成する。
〔その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の一部を手動的に行うこともできる。あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
例えば、図2に示した記憶部4の一部又は全部は、情報処理装置1によって保持されるのではなく、ストレージサーバ等に保持されてもよい。この場合、情報処理装置1は、ストレージサーバにアクセスすることで、各種情報を取得する。
〔ハードウェア構成〕
また、上述してきた実施形態に係る情報処理装置1は、例えば図8に示すような構成のコンピュータ1000によって実現される。図8は、ハードウェア構成の一例を示す図である。コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力IF(Interface)1060、入力IF1070、ネットワークIF1080がバス1090により接続された形態を有する。
演算装置1030は、一次記憶装置1040や二次記憶装置1050に格納されたプログラムや入力装置1020から読み出したプログラム等に基づいて動作し、各種の処理を実行する。一次記憶装置1040は、RAM等、演算装置1030が各種の演算に用いるデータを一時的に記憶するメモリ装置である。また、二次記憶装置1050は、演算装置1030が各種の演算に用いるデータや、各種のデータベースが登録される記憶装置であり、ROM(Read Only Memory)、HDD(Hard Disk Drive)、フラッシュメモリ等により実現される。
出力IF1060は、モニタやプリンタといった各種の情報を出力する出力装置1010に対し、出力対象となる情報を送信するためのインタフェースであり、例えば、USB(Universal Serial Bus)やDVI(Digital Visual Interface)、HDMI(登録商標)(High Definition Multimedia Interface)といった規格のコネクタにより実現される。また、入力IF1070は、マウス、キーボード、およびスキャナ等といった各種の入力装置1020から情報を受信するためのインタフェースであり、例えば、USB等により実現される。
なお、入力装置1020は、例えば、CD(Compact Disc)、DVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等から情報を読み出す装置であってもよい。また、入力装置1020は、USBメモリ等の外付け記憶媒体であってもよい。
ネットワークIF1080は、ネットワークNを介して他の機器からデータを受信して演算装置1030へ送り、また、ネットワークNを介して演算装置1030が生成したデータを他の機器へ送信する。
演算装置1030は、出力IF1060や入力IF1070を介して、出力装置1010や入力装置1020の制御を行う。例えば、演算装置1030は、入力装置1020や二次記憶装置1050からプログラムを一次記憶装置1040上にロードし、ロードしたプログラムを実行する。
例えば、コンピュータ1000が情報処理装置1として機能する場合、コンピュータ1000の演算装置1030は、一次記憶装置1040上にロードされたプログラムを実行することにより、制御部3の機能を実現する。
〔効果〕
上述してきたように、実施形態に係る情報処理装置1は、生成部32と、更新部33とを備える。生成部32は、元データに基づいて生成される要約データであって、クライアントユーザから受け付けた所定の制約条件に従って制約された要約データの候補データを生成する。更新部33は、生成部32によって生成された候補データに基づいて制約条件を更新する。生成部32は、更新部33によって更新された制約条件を用いて要約データの確定データを生成する。提示部34は、生成部32によって生成された要約データの候補データをユーザへ提示する。更新部33は、提示部34によって提示された候補データに対する制約条件の追加をユーザから受け付けた場合、候補データに対応する制約条件を更新する。生成部32は、提示部34によって提示された候補データの確定指示をユーザから受け付けた場合、候補データを確定データとして確定する。制約条件は、要約データに含まれるキーワードのテキストを制約するキーワード制約を含む。制約条件は、要約データに含まれるフレーズのテキストを制約するフレーズ制約の内容を含む。制約条件は、要約データに含まれる文のテキストを制約する文制約の内容を含む。制約条件は、要約データにテキストを含ませる制約である。生成部32は、制約条件として受け付けたテキストを類語変換したテキストとして要約データに含ませる。制約条件は、要約データにテキストを含ませない制約である。制約条件は、要約データにおける文字数を制約する文字数制約を含む。元データおよび要約データは、データ種別が同じである。元データおよび要約データは、データ種別が異なる。データ種別は、テキスト、画像および音声の少なくとも1つを含む。これにより、適切な要約を生成することができる。
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
〔その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
また、上述してきた実施形態に記載した各処理は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
また、上記してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、受付部31は、受付手段や受付回路に読み替えることができる。
1 情報処理装置
2 通信部
3 制御部
4 記憶部
31 受付部
32 生成部
33 更新部
34 提示部
100 クライアント端末
200 ユーザ端末
N ネットワーク
S 情報処理システム

Claims (13)

  1. 元データに基づいて生成される要約データであって、クライアントユーザから受け付けた所定の制約条件に従って制約された前記要約データの候補データを学習により生成したモデルを用いて生成する生成部と、
    前記生成部によって生成された前記要約データの候補データをユーザへ提示する提示部と、
    前記提示部によって提示された前記候補データに対する前記制約条件の追加を前記ユーザから受け付けた場合、当該候補データに対応する前記制約条件に前記ユーザから新たに受け付けた前記制約条件を加えることで更新する更新部と、
    を備え、
    前記生成部は、
    前記更新部によって更新された前記制約条件を用いて前記要約データの候補データを生成し、前記提示部によって提示された当該候補データの確定指示を前記ユーザから受け付けた場合、当該候補データを確定データとして確定し、
    前記モデルは、
    制約条件なしのモデルと、制約条件ありのモデルとを含み、
    前記制約条件なしのモデルは、
    過去の元データと、正解データである正解要約データとをデータセットとして学習することで生成され、
    前記制約条件ありのモデルは、
    前記制約条件なしのモデルに元データを入力して得られた要約データと、正解データとなる正解要約データ当該正解要約データに有って当該要約データに無いキーワードである制約条件とをデータセットとして学習することで生成されること
    を特徴とする情報処理装置。
  2. 前記制約条件は、
    前記要約データに含まれるキーワードのテキストを制約するキーワード制約を含むこと
    を特徴とする請求項1に記載の情報処理装置。
  3. 前記制約条件は、
    前記要約データに含まれるフレーズのテキストを制約するフレーズ制約の内容を含むこと
    を特徴とする請求項1または2に記載の情報処理装置。
  4. 前記制約条件は、
    前記要約データに含まれる文のテキストを制約する文制約の内容を含むこと
    を特徴とする請求項1~3のいずれか1つに記載の情報処理装置。
  5. 前記制約条件は、
    前記要約データに前記テキストを含ませる制約であること
    を特徴とする請求項2~4のいずれか1つに記載の情報処理装置。
  6. 前記生成部は、
    前記制約条件として受け付けた前記テキストを類語変換したテキストとして前記要約データに含ませること
    を特徴とする請求項5に記載の情報処理装置。
  7. 前記制約条件は、
    前記要約データに前記テキストを含ませない制約であること
    を特徴とする請求項2~4のいずれか1つに記載の情報処理装置。
  8. 前記制約条件は、
    前記要約データにおける文字数を制約する文字数制約を含むこと
    を特徴とする請求項1~7のいずれか1つに記載の情報処理装置。
  9. 前記元データおよび前記要約データは、データ種別が同じであること
    を特徴とする請求項1~8のいずれか1つに記載の情報処理装置。
  10. 前記元データおよび前記要約データは、データ種別が異なること
    を特徴とする請求項1~9のいずれか1つに記載の情報処理装置。
  11. 前記データ種別は、
    テキスト、画像および音声の少なくとも1つを含むこと
    を特徴とする請求項9または10に記載の情報処理装置。
  12. コンピュータが実行する情報処理方法であって、
    元データに基づいて生成される要約データであって、クライアントユーザから受け付けた所定の制約条件に従って制約された前記要約データの候補データを学習により生成したモデルを用いて生成する生成工程と、
    前記生成工程によって生成された前記要約データの候補データをユーザへ提示する提示工程と、
    前記提示工程によって提示された前記候補データに対する前記制約条件の追加を前記ユーザから受け付けた場合、当該候補データに対応する前記制約条件に前記ユーザから新たに受け付けた前記制約条件を加えることで更新する更新工程と、
    を含み、
    前記生成工程は、
    前記更新工程によって更新された前記制約条件を用いて前記要約データの候補データを生成し、前記提示工程によって提示された当該候補データの確定指示を前記ユーザから受け付けた場合、当該候補データを確定データとして確定し、
    前記モデルは、
    制約条件なしのモデルと、制約条件ありのモデルとを含み、
    前記制約条件なしのモデルは、
    過去の元データと、正解データである正解要約データとをデータセットとして学習することで生成され、
    前記制約条件ありのモデルは、
    前記制約条件なしのモデルに元データを入力して得られた要約データと、正解データとなる正解要約データ当該正解要約データに有って当該要約データに無いキーワードである制約条件とをデータセットとして学習することで生成されること
    を特徴とする情報処理方法。
  13. 元データに基づいて生成される要約データであって、クライアントユーザから受け付けた所定の制約条件に従って制約された前記要約データの候補データを学習により生成したモデルを用いて生成する生成手順と、
    前記生成手順によって生成された前記要約データの候補データをユーザへ提示する提示手順と、
    前記提示手順によって提示された前記候補データに対する前記制約条件の追加を前記ユーザから受け付けた場合、当該候補データに対応する前記制約条件に前記ユーザから新たに受け付けた前記制約条件を加えることで更新する更新手順と、
    をコンピュータによって実行させ、
    前記生成手順は、
    前記更新手順によって更新された前記制約条件を用いて前記要約データの候補データを生成し、前記提示手順によって提示された当該候補データの確定指示を前記ユーザから受け付けた場合、当該候補データを確定データとして確定し、
    前記モデルは、
    制約条件なしのモデルと、制約条件ありのモデルとを含み、
    前記制約条件なしのモデルは、
    過去の元データと、正解データである正解要約データとをデータセットとして学習することで生成され、
    前記制約条件ありのモデルは、
    前記制約条件なしのモデルに元データを入力して得られた要約データと、正解データとなる正解要約データ当該正解要約データに有って当該要約データに無いキーワードである制約条件とをデータセットとして学習することで生成されること
    を特徴とする情報処理プログラム。
JP2021071288A 2021-04-20 2021-04-20 情報処理装置、情報処理方法および情報処理プログラム Active JP7317887B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021071288A JP7317887B2 (ja) 2021-04-20 2021-04-20 情報処理装置、情報処理方法および情報処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021071288A JP7317887B2 (ja) 2021-04-20 2021-04-20 情報処理装置、情報処理方法および情報処理プログラム

Publications (2)

Publication Number Publication Date
JP2022165786A JP2022165786A (ja) 2022-11-01
JP7317887B2 true JP7317887B2 (ja) 2023-07-31

Family

ID=83851339

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021071288A Active JP7317887B2 (ja) 2021-04-20 2021-04-20 情報処理装置、情報処理方法および情報処理プログラム

Country Status (1)

Country Link
JP (1) JP7317887B2 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018128805A (ja) 2017-02-07 2018-08-16 ヤフー株式会社 生成装置、生成方法及び生成プログラム
JP2019101754A (ja) 2017-12-01 2019-06-24 キヤノン株式会社 要約装置及びその制御方法、要約システム、プログラム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3206600B2 (ja) * 1989-01-30 2001-09-10 富士ゼロックス株式会社 文書生成装置
JPH10254876A (ja) * 1997-03-07 1998-09-25 Omron Corp 文書要約方法及び文書要約装置
JP4259179B2 (ja) * 2003-05-23 2009-04-30 日本電信電話株式会社 文書分析方法及び装置及び文書分析プログラム及び文書分析プログラムを格納した記憶媒体
JP2015032905A (ja) * 2013-07-31 2015-02-16 キヤノンマーケティングジャパン株式会社 情報処理装置、情報処理方法、プログラム
KR102025362B1 (ko) * 2013-11-07 2019-09-25 한화테크윈 주식회사 검색 시스템 및 영상 검색 방법
JP6698006B2 (ja) * 2016-12-14 2020-05-27 日本電信電話株式会社 要約生成装置、方法、及びプログラム
JP6508635B2 (ja) * 2017-06-22 2019-05-08 オリンパス株式会社 再生装置、再生方法、再生プログラム
KR102536057B1 (ko) * 2018-08-28 2023-05-26 십일번가 주식회사 이미지 검색을 위한 요약 정보 제공 방법 및 이를 지원하는 서비스 장치
US11080317B2 (en) * 2019-07-09 2021-08-03 International Business Machines Corporation Context-aware sentence compression

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018128805A (ja) 2017-02-07 2018-08-16 ヤフー株式会社 生成装置、生成方法及び生成プログラム
JP2019101754A (ja) 2017-12-01 2019-06-24 キヤノン株式会社 要約装置及びその制御方法、要約システム、プログラム

Also Published As

Publication number Publication date
JP2022165786A (ja) 2022-11-01

Similar Documents

Publication Publication Date Title
JP6355800B1 (ja) 学習装置、生成装置、学習方法、生成方法、学習プログラム、および生成プログラム
Eskenazi et al. Crowdsourcing for speech processing: Applications to data collection, transcription and assessment
US20140122083A1 (en) Chatbot system and method with contextual input and output messages
US20210377190A1 (en) Conversation-enabled document system and method
US20070288837A1 (en) System and method for providing content management via web-based forms
WO2020216310A1 (zh) 用于生成应用的方法、终端设备和计算机可读介质
Chung et al. End-to-end conversion speed analysis of an fpt. ai-based text-to-speech application
CN115510347A (zh) 演示文稿的转换方法、装置、电子设备及存储介质
WO2019245033A1 (ja) 動画編集サーバおよびプログラム
US20140356820A1 (en) Language teaching material customizing system, language teaching material customizing method and recording medium
CN110020132B (zh) 关键词推荐方法、装置、计算设备及存储介质
JP7317887B2 (ja) 情報処理装置、情報処理方法および情報処理プログラム
KR20190061895A (ko) 웹 기반 문서의 템플릿을 변경하는 웹 기반 문서 편집 서버 및 이의 동작 방법
JP6903365B1 (ja) サーバおよびデータ割り当て方法
WO2023121681A1 (en) Automated text-to-speech pronunciation editing for long form text documents
US11494802B2 (en) Guiding customized textual persuasiveness to meet persuasion objectives of a communication at multiple levels
CN111310434B (zh) 文本生成方法和装置、电子设备和存储介质
CN113761113A (zh) 用于看图讲故事的用户交互方法和装置
KR101857997B1 (ko) 전자 문서에 대한 검색 기능을 제공하는 온라인 문서 작성 서비스 장치 및 그 동작 방법
US20210216886A1 (en) Information providing system and data structure
CN113626722A (zh) 舆论引导方法、装置、设备及计算机可读存储介质
KR102353797B1 (ko) 영상 컨텐츠에 대한 합성음 실시간 생성에 기반한 컨텐츠 편집 지원 방법 및 시스템
JP2021067922A (ja) 映像コンテンツに対する合成音のリアルタイム生成を基盤としたコンテンツ編集支援方法およびシステム
JP2024068212A (ja) ページ生成装置、ウェブページの生産方法、およびプログラム
JP2010049411A (ja) 文書データ解析装置およびプログラム

Legal Events

Date Code Title Description
A80 Written request to apply exceptions to lack of novelty of invention

Free format text: JAPANESE INTERMEDIATE CODE: A80

Effective date: 20210519

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211118

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20211118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220222

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220425

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20220705

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221005

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20221005

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20221012

C21 Notice of transfer of a case for reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C21

Effective date: 20221018

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20221104

C211 Notice of termination of reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C211

Effective date: 20221108

C22 Notice of designation (change) of administrative judge

Free format text: JAPANESE INTERMEDIATE CODE: C22

Effective date: 20221122

C22 Notice of designation (change) of administrative judge

Free format text: JAPANESE INTERMEDIATE CODE: C22

Effective date: 20230131

C13 Notice of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: C13

Effective date: 20230207

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230410

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230719

R150 Certificate of patent or registration of utility model

Ref document number: 7317887

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350