JP2021131769A - 要約生成プログラム、要約生成装置および要約生成方法 - Google Patents
要約生成プログラム、要約生成装置および要約生成方法 Download PDFInfo
- Publication number
- JP2021131769A JP2021131769A JP2020027354A JP2020027354A JP2021131769A JP 2021131769 A JP2021131769 A JP 2021131769A JP 2020027354 A JP2020027354 A JP 2020027354A JP 2020027354 A JP2020027354 A JP 2020027354A JP 2021131769 A JP2021131769 A JP 2021131769A
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- content
- user
- emotion
- processed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
Description
現在、ロボットをはじめ様々な機器などにAI(実行知能)が搭載されるようになってきており、ユーザ個々により適応した対話やリコメンデーションおよび文章要約を実現することが期待されている。
実施形態に係る要約生成プログラムは、上述した実施形態に係る要約生成処理をコンピュータに実行させるためのプログラムである。具体的には、実施形態に係る要約生成プログラムは、ユーザの興味を示すユーザ情報と、処理対象のコンテンツとを取得する取得手順と、処理対象のコンテンツに含まれる文章のうち、ユーザ情報が示す興味の対象が話題となっている文章である対象文を抽出する抽出手順と、対象文に基づいて、処理対象のコンテンツの内容が要約された要約文を生成する生成手順とをコンピュータに実行させるためのプログラムである。
ここからは、図1を用いて、実施形態に係る要約生成装置100によって行われる要約生成処理の全体像について説明する。図1は、実施形態に係る要約生成処理の全体像を示す図である。また、本実施形態では、処理対象のコンテンツを「スポーツ記事による記事コンテンツ」とする。そして、本実施形態では、ユーザを特定のスポーツ(例えば、野球)におけるチームのファン(あるいは、特定のスポーツ選手のファン)であるものとして、このユーザの興味や趣向が反映された要約を生成する場面を一例に挙げる。
ここからは、図2を用いて、実施形態に係る要約生成装置100によって行われる要約生成処理の一例について説明する。具体的には、図2では、記事コンテンツC1に含まれる文章の具体例を用いて、図1で示した流れに応じた要約生成処理の一例を示す。なお、図1と重複する説明については、簡略化または省略する。また、図2に示すステップ番号(S1など)は、図1に示すステップ番号に対応する。
次に、図4を用いて、実施形態に係る要約生成装置100について説明する。図4は、実施形態に係る要約生成装置100の構成例を示す図である。図4に示すように、要約生成装置100は、通信部110と、記憶部120と、制御部130とを有する。
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部110は、ネットワークNと有線または無線で接続され、例えば、ユーザが有する端末装置との間で情報の送受信を行う。
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ等の半導体メモリ素子またはハードディスク、光ディスク等の記憶装置によって実現される。記憶部120は、辞書データベース121と、ユーザ情報記憶部122と、コンテンツ記憶部123と、要約情報記憶部124とを有する。
辞書データベース121は、例えば、一般用語辞書、シソーラス辞書、固有名詞辞書に対応する。また、例えば、固有名詞辞書では、正式な固有名詞に対して、異なる表現の固有名詞が紐付けられている。また、要約生成装置100は、ユーザの動向に基づいて、時期に影響される用語を学習し、学習した用語とその時期とを紐付けておいてもよい。
ユーザ情報記憶部122は、ユーザの興味を示すユーザ情報を記憶する。例えば、後述する受付部131は、このようなユーザ情報の登録をユーザから受け付けた場合には、このユーザを識別する識別情報(ユーザID)に対して、受け付けたユーザ情報を対応付けてユーザ情報記憶部122に格納する。
コンテンツ記憶部123は、処理対象のコンテンツを記憶する。例えば、後述する取得部132は、処理対象のコンテンツを取得すると、取得した処理対象のコンテンツをコンテンツ記憶部123に格納する。例えば、後述する取得部132は、受付部131により処理対象のコンテンツの登録が受け付けられた場合には、登録元のユーザを識別する識別情報(ユーザID)に対して、受け付られたコンテンツを対応付けてコンテンツ記憶部123に格納する。
要約情報記憶部124は、処理対象のコンテンツの内容が要約された要約文を示す文章情報を記憶する。例えば、後述する生成部134は、ユーザによるユーザ情報の登録に応じて、このユーザに対して要約文を生成した場合には、このユーザを識別する識別情報(ユーザID)に対して、生成した要約文を対応付けて要約情報記憶部124に格納する。
制御部130は、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、要約生成装置100内部の記憶装置に記憶されている各種プログラム(例えば、実施形態に係る要約生成プログラム)がRAMを作業領域として実行されることにより実現される。また、制御部130は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
受付部131は、ユーザの興味を示すユーザ情報の登録を受け付ける。例えば、受付部131は、ユーザ操作に応じてこのユーザの端末装置から送信されたユーザ情報を受け付け、ユーザ情報を受け付けた場合には、ユーザ情報の登録を受け付けを完了させる。また、受付部131は、ユーザから処理対象のコンテンツの登録も受け付けることができる。
取得部132は、ユーザの興味を示すユーザ情報と、処理対象のコンテンツとを取得する。図1の例では、取得部132は、ユーザU1に対応するユーザ情報として、「チームTa」のファン(「チームTa」に興味がある、あるいは、「チームTa」が好き)といったことを示すユーザ情報を取得している。また、図1の例では、取得部132は、ユーザU1に対応するユーザ情報として、「PY1選手」のファン(「PY1選手」に興味がある、あるいは、「PY1選手」が好き)といったことを示すユーザ情報を取得している。また、図1の例では、取得部132は、処理対象のコンテンツとして、1ヶ月分の記事コンテンツ群を取得している。また、図1の例では、取得部132は、1ヶ月分の記事コンテンツ群に対して絞り込みが行われた後では、記事コンテンツC1を処理対象のコンテンツとして取得している。
抽出部133は、処理対象のコンテンツに含まれる文章のうち、ユーザ情報が示す興味の対象が話題となっている文章である対象文を抽出する。例えば、抽出部133は、興味の対象として、処理対象のコンテンツに含まれる文章中の固有名詞が指し示す対象であって、ユーザが興味を有する対象が話題となっている文章を対象文として抽出する。
生成部134は、抽出部133により抽出された対象文に基づいて、処理対象のコンテンツの内容が要約された要約文を生成する。例えば、生成部134は、対象文が構文解析された解析結果である木構造に基づいて、処理対象のコンテンツの内容が要約された要約文を生成する。例えば、生成部134は、対象文が構文解析された解析結果である木構造を構成するノードである文節に基づいて、処理対象のコンテンツの内容が要約された要約文を生成する。
推定部135は、ユーザによる興味の対象に対するユーザの嗜好性に基づいて、感情の種別ごとに、要約文の内容に対するそれぞれの感情の度合いを示す感情値(PN値)を推定する。例えば、推定部135は、ユーザの感情の種別として、肯定的な感情(ポジティブな感情)および否定的な感情(ネガティブな感情)それぞれについて、要約文の内容に対する感情の度合いを示す感情値を推定する。
出力部136は、ユーザに対して、処理対象のコンテンツの内容が要約された要約文を出力する。例えば、出力部136は、処理対象のコンテンツの内容が要約された要約文として、推定部135により推定されたPN値が付与された要約文を出力する。例えば、出力部136は、PN値付きの要約文がユーザの端末装置に表示されるよう、PN値付きの要約文を係る端末装置に送信する。
第1制御部137は、任意の文章と、当該任意の文章に対してユーザが評価した値であって、当該任意の文章の内容に対する感情の度合いを示す感情値との関係性が学習されたモデルを学習する。具体的には、第1制御部137は、固有名詞が除外された任意の文章と、当該任意の文章に対してユーザが評価した値であって、当該任意の文章の内容に対する感情の度合いを示す感情値との関係性が学習されたモデルを生成する。また、ここでいう感情とは肯定的な感情(ポジティブ)感情、および、否定的な感情(ネガティブ感情)である。
第2制御部138は、単語と単語の関連性(類似性)を示す単語間距離を算出する。例えば、第2制御部138は、固有名詞と一般的用語との単語間距離を算出する。また、第2制御部138は、記事などの一般知識に基づいて、固有名詞と一般用語とをクラスタリングする。そして、第2制御部138は、同一クラスタ内の単語が、自動的に同じ意味的指向を持つように制御する。このような制御によれば、ユーザがクラスタ内の単語に対してだけ感情値を評価しさえすれば、ユーザ評価が行われておらず感情値が未知の固有名詞も動的に感情値が算出されることになる。この結果、第1制御部137は、数が多いうえに経時的にその数が変化するという性質を有するがゆえにユーザ評価が行われていない固有名詞に対する感情値を得ることができるようになるため、この感情値を用いることでより高精度なモデルを生成することができるようになる。
次に、図6を用いて、実施形態に係る要約生成処理の手順について説明する。図6は、実施形態に係る要約生成処理手順を示すフローチャートである。
また、上記実施形態に係る要約生成装置100は、例えば図7に示すような構成のコンピュータ1000によって実現される。図7は、要約生成装置100の機能を実現するコンピュータ1000の一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
120 記憶部
121 辞書データベース
122 ユーザ情報記憶部
123 コンテンツ記憶部
124 要約情報記憶部
130 制御部
131 受付部
132 取得部
133 抽出部
134 生成部
135 推定部
136 出力部
137 第1制御部
138 第2制御部
Claims (17)
- ユーザの興味を示すユーザ情報と、処理対象のコンテンツとを取得する取得手順と、
前記処理対象のコンテンツに含まれる文章のうち、前記ユーザ情報が示す興味の対象が話題となっている文章である対象文を抽出する抽出手順と、
前記対象文に基づいて、処理対象のコンテンツの内容が要約された要約文を生成する生成手順と
をコンピュータに実行させるための要約生成プログラム。 - 前記抽出手順は、前記興味の対象として、前記文章に含まれる固有名詞が指し示す対象であって、前記ユーザ情報が示す興味の対象が話題となっている文章を前記対象文として抽出する
ことを特徴とする請求項1に記載の要約生成プログラム。 - 前記抽出手順は、前記文章に含まれる異なる複数の固有名詞のうち同義の固有名詞が指し示す対象であって、前記ユーザ情報が示す興味の対象が話題となっている文章を前記対象文として抽出する
ことを特徴とする請求項2に記載の要約生成プログラム。 - 前記抽出手順は、前記処理対象のコンテンツに含まれる文章のうち、主語が含まれない文章について主語を推定し、推定した主語が、前記同義の固有名詞が指し示す対象となっている文章を前記対象文として抽出する
ことを特徴とする請求項3に記載の要約生成プログラム。 - 前記生成手順は、前記対象文が構文解析された解析結果である木構造に基づいて、前記処理対象のコンテンツの内容が要約された要約文を生成する
ことを特徴とする請求項1〜4のいずれか1つに記載の要約生成プログラム。 - 前記生成手順は、前記木構造を構成するノードである文節に基づいて、前記処理対象のコンテンツの内容が要約された要約文を生成する
ことを特徴とする請求項5に記載の要約生成プログラム。 - 前記生成手順は、前記文節のうち、前記興味の対象に対する前記ユーザの嗜好性に応じて前記ユーザの感情の変動に影響すると推測される単語を含む文節に基づいて、前記処理対象のコンテンツの内容が要約された要約文を生成する
ことを特徴とする請求項6に記載の要約生成プログラム。 - 前記生成手順は、前記単語として、前記興味の対象に対する前記ユーザの嗜好性に応じて前記ユーザの感情の度合いを示す感情値を変動させると推測される単語を含む前記文節に基づいて、前記処理対象のコンテンツの内容が要約された要約文を生成する
ことを特徴とする請求項7に記載の要約生成プログラム。 - 前記生成手順は、前記単語のうち、現在時期に関連する単語を含む前記文節を優先的に用いて、前記処理対象のコンテンツの内容が要約された要約文を生成する
ことを特徴とする請求項7または8に記載の要約生成プログラム。 - 前記生成手順は、前記興味の対象に関連する単語であって、前記ユーザの嗜好性とより関連性の高いの高い単語を含む前記文節を優先的に用いて、前記処理対象のコンテンツの内容が要約された要約文を生成する
ことを特徴とする請求項6〜9のいずれか1つに記載の要約生成プログラム。 - 前記生成手順は、前記木構造に沿って、前記文節から分岐する分岐数が所定数以下となるように、前記文節をつなぐことで、前記処理対象のコンテンツの内容が要約された要約文を生成する
ことを特徴とする請求項6〜10のいずれか1つに記載の要約生成プログラム。 - 前記興味の対象に対する前記ユーザの嗜好性に基づいて、感情の種別ごとに、前記要約文の内容に対する感情の度合いを示す感情値を推定する推定手順
をコンピュータにさらに実行させる
ことを特徴とする請求項1〜11のいずれか1つに記載の要約生成プログラム。 - 前記推定手順は、前記ユーザの感情の種別として、肯定的な感情および否定的な感情それぞれについて、前記要約文の内容に対する感情の度合いを示す感情値を推定する
ことを特徴とする請求項12に記載の要約生成プログラム。 - 前記推定手順は、固有名詞が除外された任意の文章と、当該任意の文章に対してユーザが評価した値であって、当該任意の文章の内容に対する感情の度合いを示す感情値との関係性が学習されたモデルに基づいて、前記要約文の内容に対する感情の度合いを示す感情値を推定する
ことを特徴とする請求項12または13に記載の要約生成プログラム。 - 前記推定手順は、前記モデルとして、肯定的な感情および否定的な感情うち、ユーザの嗜好性と要約文の内容との関係性に応じた感情ほど高い感情値を出力するように学習されたモデルに基づいて、前記要約文の内容に対する感情の度合いを示す感情値を推定する
ことを特徴とする請求項14に記載の要約生成プログラム。 - ユーザの興味を示すユーザ情報と、処理対象のコンテンツとを取得する取得部と、
前記処理対象のコンテンツに含まれる文章のうち、前記ユーザ情報が示す興味の対象が話題となっている文章である対象文を抽出する抽出部と、
前記対象文に基づいて、処理対象のコンテンツの内容が要約された要約文を生成する生成部と
を有することを特徴とする要約生成装置。 - 要約生成装置が実行する要約生成方法であって、
ユーザの興味を示すユーザ情報と、処理対象のコンテンツとを取得する取得工程と、
前記処理対象のコンテンツに含まれる文章のうち、前記ユーザ情報が示す興味の対象が話題となっている文章である対象文を抽出する抽出工程と、
前記対象文に基づいて、処理対象のコンテンツの内容が要約された要約文を生成する生成工程と
を含むことを特徴とする要約生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020027354A JP7152437B2 (ja) | 2020-02-20 | 2020-02-20 | 要約生成プログラム、要約生成装置および要約生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020027354A JP7152437B2 (ja) | 2020-02-20 | 2020-02-20 | 要約生成プログラム、要約生成装置および要約生成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021131769A true JP2021131769A (ja) | 2021-09-09 |
JP7152437B2 JP7152437B2 (ja) | 2022-10-12 |
Family
ID=77551089
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020027354A Active JP7152437B2 (ja) | 2020-02-20 | 2020-02-20 | 要約生成プログラム、要約生成装置および要約生成方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7152437B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2023041068A (ja) * | 2021-09-10 | 2023-03-23 | 株式会社ミンカブ・ジ・インフォノイド | 試合記載生成装置、試合記載生成方法、及びコンピュータプログラム |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010128677A (ja) * | 2008-11-26 | 2010-06-10 | Nippon Telegr & Teleph Corp <Ntt> | テキスト要約装置、その方法およびプログラム |
JP2016118813A (ja) * | 2014-12-18 | 2016-06-30 | 三星電子株式会社Samsung Electronics Co.,Ltd. | コンテンツ再生装置 |
JP2016164700A (ja) * | 2015-03-06 | 2016-09-08 | 富士通株式会社 | 情報処理装置、要約文編集方法、及びプログラム |
JP2017037601A (ja) * | 2015-08-14 | 2017-02-16 | Psソリューションズ株式会社 | 対話インターフェース |
JP2017054509A (ja) * | 2015-09-09 | 2017-03-16 | ウバープル カンパニー リミテッド | 文抽出方法及びシステム |
-
2020
- 2020-02-20 JP JP2020027354A patent/JP7152437B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010128677A (ja) * | 2008-11-26 | 2010-06-10 | Nippon Telegr & Teleph Corp <Ntt> | テキスト要約装置、その方法およびプログラム |
JP2016118813A (ja) * | 2014-12-18 | 2016-06-30 | 三星電子株式会社Samsung Electronics Co.,Ltd. | コンテンツ再生装置 |
JP2016164700A (ja) * | 2015-03-06 | 2016-09-08 | 富士通株式会社 | 情報処理装置、要約文編集方法、及びプログラム |
JP2017037601A (ja) * | 2015-08-14 | 2017-02-16 | Psソリューションズ株式会社 | 対話インターフェース |
JP2017054509A (ja) * | 2015-09-09 | 2017-03-16 | ウバープル カンパニー リミテッド | 文抽出方法及びシステム |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2023041068A (ja) * | 2021-09-10 | 2023-03-23 | 株式会社ミンカブ・ジ・インフォノイド | 試合記載生成装置、試合記載生成方法、及びコンピュータプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP7152437B2 (ja) | 2022-10-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3607470B1 (en) | Conversation bot discovery and response fusion | |
JP4664355B2 (ja) | 検索エンジンにおいて検索結果を可変的にパーソナライズ化すること | |
WO2017041372A1 (zh) | 基于人工智能的人机交互方法和系统 | |
JP6381775B2 (ja) | 情報処理システム及び情報処理方法 | |
EP3631650A1 (en) | Recommending friends in automated chatting | |
Gossen | Search engines for children: search user interfaces and information-seeking behaviour | |
Strohmaier et al. | Acquiring knowledge about human goals from search query logs | |
JP6796384B2 (ja) | 辞書構築装置、情報処理装置、評価語辞書の生産方法、情報処理方法、およびプログラム | |
EP4231172A1 (en) | Aspect-aware autocomplete query | |
WO2012121055A1 (ja) | 情報提供装置、情報提供方法、および、記憶媒体 | |
JP7152437B2 (ja) | 要約生成プログラム、要約生成装置および要約生成方法 | |
US8930351B1 (en) | Grouping of users | |
Papenmeier et al. | 'A Modern Up-To-Date Laptop'-Vagueness in Natural Language Queries for Product Search | |
JP6034459B1 (ja) | 対話インターフェース | |
Pérez-Hernández | Building brand narratives with hashtags<? br?> on Twitter: A cognitive-pragmatic analysis on the emergence of a new advertising subgenre | |
Shibata et al. | Utilizing core-query for context-sensitive Ad generation based on dialogue | |
JP2016177690A (ja) | サービス推薦装置およびサービス推薦方法並びにサービス推薦プログラム | |
JP7106500B2 (ja) | 提供装置、提供方法及び提供プログラム | |
JP4712221B2 (ja) | 主観的特徴要素生成装置、主観的特徴要素生成方法、及び主観的特徴要素生成プログラム | |
JP7249222B2 (ja) | 情報処理装置、情報処理方法および情報処理プログラム | |
Fisher et al. | Health information portals: How can we improve the user's search experience? | |
JP6852520B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
Papangelis et al. | A recommender system for assistive environments | |
Neugarten | Delicious angst and tooth-rotting fluff: Distant reading community discourses of emotion in Harry Potter fanfiction comments | |
Beller et al. | Predicting fine-grained social roles with selectional preferences |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210210 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220204 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220315 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220513 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220913 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220929 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7152437 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |