JP2022131963A - Summary generation device and summary generation method - Google Patents
Summary generation device and summary generation method Download PDFInfo
- Publication number
- JP2022131963A JP2022131963A JP2021031239A JP2021031239A JP2022131963A JP 2022131963 A JP2022131963 A JP 2022131963A JP 2021031239 A JP2021031239 A JP 2021031239A JP 2021031239 A JP2021031239 A JP 2021031239A JP 2022131963 A JP2022131963 A JP 2022131963A
- Authority
- JP
- Japan
- Prior art keywords
- range
- sentences
- content
- constituent
- target content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 78
- 239000000470 constituent Substances 0.000 claims abstract description 80
- 238000000605 extraction Methods 0.000 claims abstract description 52
- 238000012545 processing Methods 0.000 abstract description 28
- 238000004364 calculation method Methods 0.000 abstract description 7
- 239000000284 extract Substances 0.000 abstract description 7
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 23
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 15
- 229910052709 silver Inorganic materials 0.000 description 15
- 239000004332 silver Substances 0.000 description 15
- 238000010586 diagram Methods 0.000 description 14
- 238000004891 communication Methods 0.000 description 8
- 239000000203 mixture Substances 0.000 description 5
- 230000006399 behavior Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000008929 regeneration Effects 0.000 description 2
- 238000011069 regeneration method Methods 0.000 description 2
- 239000012141 concentrate Substances 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Images
Landscapes
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
特許法第30条第2項適用申請有り 公開の事実1:令和2(2020)年6月8日に、2020年度人工知能学会全国大会(第34回)論文のウェブサイト(https://drive.google.com/file/d/1GF6q7bimI8W7tTXw2DtJWb50gu1l_q1v/view?usp=sharing)に掲載 公開の事実2:令和2(2020)年9月1日に、電子情報通信学会メディアエクスペリエンス・バーチャル環境基礎(MVE研究会)論文集のウェブサイト(https://www.ieice.org/ken/user/index.php?cmd=login&back_url= https%3A%2F%2Fwww.ieice.org%2Fken%2Fpaper%2F20200908w1zT%2F)に掲載There is an application for application of
本開示は、要約生成装置及び要約生成方法に関する。 The present disclosure relates to a summary generation device and a summary generation method.
ドラマや小説や漫画などのストーリー性があるコンテンツは、再生を中断した後に再開する際、以前の再生内容を忘れていることがある。その点、時系列に沿った複数のエピソードから構成され、エピソードの冒頭に前回エピソードまでのあらすじや、次回エピソードの予告などが再生されることがある。 Contents that have a story, such as dramas, novels, and comics, sometimes forget the previous playback contents when resuming playback after being interrupted. In that respect, it is composed of multiple episodes in chronological order, and at the beginning of the episode, the synopsis up to the previous episode, the preview of the next episode, etc. may be played.
昨今、ドラマなどストーリー性があるコンテンツの再生がテレビなどの受動的な形態から、いわゆるサブスクリプションサービスなどの再生期間に対して課金され、オンラインなどによる主体的な形態に変化している。 In recent years, the reproduction of contents with stories such as dramas has changed from a passive form such as television to a proactive form such as online where a charge is made for the reproduction period such as a so-called subscription service.
このような形態でコンテンツを再生する場合、エピソードの冒頭にのみ要約が提示される従来のスタイルでは、エピソード途中の中断位置から再生を再開する場合に要約が提示されない。そのため、再生を再開する際に適した要約とならない場合がある。 When content is reproduced in such a form, the conventional style of presenting a summary only at the beginning of an episode does not present a summary when resuming reproduction from a position interrupted in the middle of the episode. Therefore, the summary may not be suitable for resuming playback.
この点、例えば、特開2007-336085号公報(以下、特許文献1)は、コンテンツの再生を中断した位置以降の予告を生成する方法を開示している。 In this respect, for example, Japanese Patent Application Laid-Open No. 2007-336085 (hereinafter referred to as Patent Document 1) discloses a method of generating an advance notice after the position where reproduction of content is interrupted.
しかしながら、任意の中断位置から再生が再開される場合、中断位置によっては、単に、以前の再生範囲から抽出した文や、以降の範囲から抽出した文だけでは理解されやすい要約とならない場合もある。そのため、中断位置に応じて理解されやすい要約を生成できる要約生成装置及び要約生成方法であることが望まれる。 However, when the playback is resumed from an arbitrary interrupted position, depending on the interrupted position, the sentences extracted from the previous playback range or the sentences extracted from the subsequent range may not be an easy-to-understand summary. Therefore, it is desirable to have a summary generation device and a summary generation method that can generate an easy-to-understand summary according to the interruption position.
ここで、要約生成装置は対象コンテンツの要約を生成する要約生成装置であって、プロセッサを備える。プロセッサは、対象コンテンツの中断位置から第1の範囲を決定し、再生中断位置から決定される、要約の構成文を抽出する範囲である第2の範囲に含まれる文の指標値を、第1の範囲から算出し、指標値に基づいて第2の範囲から要約の構成文を抽出する、ように構成されている。 Here, the summary generation device is a summary generation device that generates a summary of target content, and includes a processor. The processor determines a first range from the interruption position of the target content, and sets the index value of the sentence included in the second range, which is the range for extracting the constituent sentences of the summary, determined from the reproduction interruption position to the first range. is calculated from the range of , and a constituent sentence of the summary is extracted from the second range based on the index value.
また、要約生成方法は対象コンテンツの要約を生成する方法であって、対象コンテンツの中断位置から第1の範囲を決定し、要約の構成文を抽出する範囲である第2の範囲に含まれる文の指標値を第1の範囲から算出し、指標値に基づいて第2の範囲から要約の構成文を抽出する、ことを含む。 Also, the method for generating a summary is a method for generating a summary of target content, in which a first range is determined from the interruption position of the target content, and sentences included in a second range, which is a range for extracting constituent sentences of the summary. from the first range, and extracting the constituent sentences of the summary from the second range based on the index value.
更なる詳細は、後述の実施形態として説明される。 Further details are described as embodiments below.
<1.要約生成装置及び要約生成方法の概要> <1. Outline of summary generation device and summary generation method>
(1)ある実施の形態に従う要約生成装置は、対象コンテンツの要約を生成する要約生成装置であって、プロセッサを備え、プロセッサは、対象コンテンツの再生中断位置から対象コンテンツにおける第1の範囲を決定し、再生中断位置から決定される、対象コンテンツにおける要約の構成文を抽出する範囲であって、第1の範囲とは少なくとも一部が異なる第2の範囲に含まれる文の指標値を、第1の範囲から算出し、指標値に基づいて第2の範囲から要約の構成文を抽出する、ように構成されている。 (1) A summary generation device according to an embodiment is a summary generation device that generates a summary of target content, and includes a processor, and the processor determines a first range in target content from a playback interruption position of target content. Then, the index value of the sentence included in the second range, which is the range for extracting the constituent sentences of the summary in the target content and which is at least partially different from the first range, is determined from the playback interruption position, 1 range, and based on the index value, extract constituent sentences of the summary from the second range.
対象コンテンツは、ストーリー性を有するものであって、時系列に再生される。例えば、映画やドラマやアニメーションなどの動画、小説などの文学作品、講演や授業などのパフォーマンス、などが相当する。再生される要素は、テキスト、楽曲、画像などを含むが、ここでは、テキストに着目する。テキストは、セリフであっても、文章や名詞であってもよい。テキストには、同時に再生される楽曲や画像が付加されていてもよい。 The target content has a story and is reproduced in chronological order. For example, videos such as movies, dramas, and animations, literary works such as novels, and performances such as lectures and classes are equivalent. Elements to be reproduced include text, music, images, etc., but the focus here is on text. The text may be serifs, sentences or nouns. The text may be accompanied by a piece of music or an image to be played at the same time.
要約は、コンテンツのある範囲(以下、要約対象範囲)のストーリーを短く編集したものである。要約は、第1の要約か第2の要約かである。第1の要約はいわゆるあらすじであり、第2の要約はいわゆる予告である。第1の要約は、再生を開始する時点(以下、開始位置)より前の範囲を紹介する要約を指す。第2の要約は、開始位置より後の範囲を紹介する要約を指す。第2の要約には、開始位置より先の内容が含まれていてもよい。 A summary is a short edited version of a story within a certain range of content (hereinafter referred to as a summary target range). The abstract is either the primary abstract or the secondary abstract. The first summary is a so-called synopsis and the second summary is a so-called preview. The first summary refers to a summary that introduces a range before the time point at which playback is started (hereinafter referred to as the start position). A second summary refers to a summary that introduces the range after the starting position. The second summary may contain content beyond the start location.
第1の範囲は、第2の範囲に含まれる文の指標値を算出するために用いられる範囲であって、対象コンテンツ内の範囲である。第1の範囲は、例えば、予想再生範囲である。予想再生範囲は、再生中断位置より後の範囲であって、再生中断位置から所定の範囲である。所定の範囲は、予め設定された範囲であってよい。所定の範囲は、ユーザの属性や、対象コンテンツの属性や、ユーザの再生傾向などから決定されてもよい。ユーザの再生傾向は、例えば、ユーザの再生行動などである。又は、一般的な再生量の平均値が用いられてもよい。 The first range is a range used for calculating the index value of sentences included in the second range, and is a range within the target content. The first range is, for example, the expected playback range. The expected reproduction range is a range after the reproduction interruption position and a predetermined range from the reproduction interruption position. The predetermined range may be a preset range. The predetermined range may be determined based on the attributes of the user, the attributes of the target content, the user's playback tendency, and the like. The user's playback tendency is, for example, the user's playback behavior. Alternatively, an average value of general regeneration amounts may be used.
再生中断位置は、再生が中断された位置である。一例として、再生中断位置は、再生の開始位置と一致する。その場合、中断位置は、要約生成する基準となる位置である。 The reproduction interruption position is the position where the reproduction is interrupted. As an example, the playback interruption position coincides with the playback start position. In that case, the interruption position is a reference position for generating a summary.
第2の範囲は、要約対象範囲であって、再生中断位置に基づいて決定される。第2の範囲は第1の範囲と異なっていてもよいし、一致していてもよいし、少なくとも一部が重複していてもよい。 The second range is the summary target range and is determined based on the playback break position. The second range may be different from, coincide with, or at least partially overlap with the first range.
要約対象範囲は、例えば、ストーリーの最初から、再生中断位置を基準として決定される予想再生範囲の終了までの範囲である。予想再生範囲は、ユーザの視聴・読書行動、一般的視聴読書の平均量、又は、提供者の規定、などにより定められる。要約対象範囲を適切に設定することによって、より理解されやすい要約を生成することができる。 The summary target range is, for example, the range from the beginning of the story to the end of the expected playback range determined based on the playback interruption position. The expected playback range is determined by the user's viewing/reading behavior, the average amount of general viewing/reading, or the provider's definition. A more understandable summary can be generated by appropriately setting the summary target range.
指標値は、第2の範囲に含まれる文について、第1の範囲から算出される値であって、例えば、重要度を含む。第1の範囲から算出される指標値に基づいて第2の範囲から要約の構成文を抽出することで、生成される要約は、再生中断位置から決定される第1の範囲を考慮した文を含むものとなる。これにより、再生を再開する際に適した要約を生成することができるようになる。 The index value is a value calculated from the first range for sentences included in the second range, and includes, for example, importance. By extracting the constituent sentences of the summary from the second range based on the index value calculated from the first range, the generated summary includes sentences that take into account the first range determined from the playback interruption position. shall include. This makes it possible to generate a digest suitable for resuming playback.
(2)好ましくは、指標値は、第1の範囲に含まれる語句に基づいて得られる値を含む。第1の範囲に含まれる語句に基づいて得られる値は、例えば、重要度である。これにより、生成される要約は、第1の範囲に含まれる語句に基づいて得られる値を考慮した文を含むものとなる。 (2) Preferably, the index value includes a value obtained based on words included in the first range. A value obtained based on the words included in the first range is, for example, importance. As a result, the generated summary includes sentences that take into account the values obtained based on the words included in the first range.
(3)好ましくは、第1の範囲は、再生中断位置より後の範囲であって、再生中断位置から決定される対象コンテンツの予想再生範囲である。これにより、中断後に再開される再生内容を考慮した要約を生成することができるようになる。 (3) Preferably, the first range is a range after the reproduction interruption position and is a predicted reproduction range of the target content determined from the reproduction interruption position. As a result, it becomes possible to generate a summary that takes into consideration the playback content that is resumed after the interruption.
(4)好ましくは、第2の範囲は、要約が第1の要約か第2の要約かによって決定され、第1の要約は、再生中断位置よりも後を含まない範囲を第2の範囲として生成される要約であり、第2の要約は、再生中断位置よりも後を含む範囲を第2の範囲として生成される要約である。第1の要約はあらすじであって、第2の要約は予告である。これにより、第1の要約には、再生中断位置までの範囲から抽出された文が含まれる。そのため、ユーザに再生中断位置までの内容が思い出させ、再生意欲を高める要約が生成されるようになる。また、第2の要約には、再生中断位置以降の文が含まれる。そのため、ユーザの再生意欲を高める要約が生成されるようになる。 (4) Preferably, the second range is determined by whether the summary is the first summary or the second summary. The second summary is a summary generated with the second range including the position after the reproduction interruption position. The first summary is a synopsis and the second summary is a preview. Thus, the first summary includes sentences extracted from the range up to the playback interruption position. Therefore, a summary is generated that reminds the user of the content up to the point where the reproduction is interrupted and increases the desire to reproduce. Also, the second summary includes sentences after the playback interruption position. Therefore, a summary that increases the user's willingness to reproduce is generated.
(5)好ましくは、要約の構成文を抽出することは、指標値に基づいて、構成文に含まれる複数の文を第2の範囲から逐次抽出することで、逐次抽出された文を有する部分集合を生成することを含み、指標値は、第2の範囲に含まれる文と部分集合との類似度を含む。このとき、指標値に基づいて抽出することが、類似度が高い文を抽出することである場合、構成文が内容の統一性ある文の集合となり、要約文の内容が明確になりやすい。また、指標値に基づいて抽出することが、類似度が低い文を抽出することである場合、構成文が多様性ある文の集合となり、バランスよい内容の要約になりやすい。 (5) Preferably, extracting the constituent sentences of the summary includes sequentially extracting a plurality of sentences included in the constituent sentences from the second range based on the index value, and extracting the portion having the sequentially extracted sentences generating a set, wherein the index value includes a similarity between the sentences included in the second range and the subset; At this time, if the extraction based on the index value is to extract sentences with a high degree of similarity, the constituent sentences will be a set of sentences with unity in content, and the content of the summary sentence will tend to be clear. Also, if the extraction based on the index value is to extract sentences with a low degree of similarity, the constituent sentences will be a diverse set of sentences, and the summary will tend to have a well-balanced content.
(6)好ましくは、部分集合は、対象コンテンツに予め用意されている要約から抽出された文を含む。これにより、対象コンテンツに予め用意されている要約の構成文を利用して要約が生成されることになる。そのため、構成文のすべての文を指標値に基づいて抽出するより処理が容易になる。 (6) Preferably, the subset includes sentences extracted from a pre-prepared summary of the target content. As a result, a summary is generated using the constituent sentences of the summary prepared in advance for the target content. Therefore, the processing becomes easier than extracting all the constituent sentences based on the index value.
(7)好ましくは、プロセッサは、さらに、対象コンテンツに基づいて参照用コンテンツを選択するよう構成されており、第2の範囲から要約の構成文を抽出することは、参照用コンテンツに対応付けられた抽出用データを参照して、第2の範囲から要約の構成文を抽出することを含む。参照用コンテンツは対象コンテンツとは異なるコンテンツであって、要約が用意されているコンテンツである。抽出用データは、参照用コンテンツに用意されている要約の構成文の、参照用コンテンツでの位置の傾向を表したデータである。抽出用データを用いて、第2の範囲から要約の構成文を抽出することで、対象コンテンツの要約を容易に生成できるとともに、参照用コンテンツと同程度に理解されやすい要約を生成することができる。 (7) Preferably, the processor is further configured to select the reference content based on the target content, and extracting the constituent sentences of the summary from the second range is associated with the reference content. extracting the constituent sentences of the summary from the second range with reference to the extracted data. The reference content is content different from the target content, and is content for which a summary has been prepared. The extraction data is data representing the tendency of the positions of the summary constituent sentences prepared in the reference content in the reference content. By extracting the constituent sentences of the summary from the second range using the extraction data, it is possible to easily generate a summary of the target content and to generate a summary that is as easy to understand as the reference content. .
(8)ある実施の形態に従う要約生成方法は対象コンテンツの要約を生成する方法であって、(1)~(7)に記載の要約生成装置において対象コンテンツの要約を生成する方法である。これにより、(1)~(7)に記載の要約生成装置により生成される要約が得られる。 (8) A method of generating a summary according to an embodiment is a method of generating a summary of target content, and is a method of generating a summary of target content in the summary generation device described in (1) to (7). As a result, a summary generated by the summary generation device described in (1) to (7) is obtained.
<2.要約生成方法及び要約生成装置の例> <2. Example of summary generation method and summary generation device>
[第1の実施の形態] [First embodiment]
本実施の形態に係る要約生成装置10は、コンテンツの要約を生成する。本実施の形態において扱うコンテンツは、ストーリー性を有するものであって、時系列に再生される。例えば、映画やドラマやアニメーションなどの動画、小説などの文学作品、講演や授業などのパフォーマンス、などが相当する。再生される要素は、テキスト、楽曲、画像などを含むが、ここでは、テキストに着目する。テキストは、セリフであっても、文章や名詞であってもよい。テキストには、同時に再生される楽曲や画像が付加されていてもよい。
A
要約は、コンテンツのある範囲(以下、要約対象範囲)のストーリーを短く編集したものである。要約は、あらすじ(第1の要約)か予告(第2の要約)かである。あらすじは、再生を開始する時点(以下、開始位置)より前の範囲を紹介する要約を指す。予告は、開始位置より後の範囲を紹介する要約を指す。予告には、開始位置より先の内容が含まれていてもよい。 A summary is a short edited version of a story within a certain range of content (hereinafter referred to as a summary target range). The summary is either a synopsis (first summary) or an advance notice (second summary). The synopsis refers to a summary that introduces the range before the point of time when playback starts (hereinafter referred to as the start position). Trailer refers to a summary that introduces the range after the starting position. The advance notice may include content beyond the start position.
図1を参照して、要約生成装置10は、プロセッサ11とメモリ12とを有するコンピュータで構成される。プロセッサ11は、例えば、CPUである。メモリ12は、フラッシュメモリ、EEPROM、ROM、RAMなどを含む。または、メモリ12は、一次記憶装置であってもよいし、二次記憶装置であってもよい。
Referring to FIG. 1,
メモリ12は、プロセッサ11で実行される生成プログラム121を記憶している。プロセッサ11は、生成プログラム121を実行することによって、要約生成処理を実行する。要約生成処理は、要約を生成する対象のコンテンツ(以下、対象コンテンツ)の要約を生成するための処理を指す。
The
メモリ12は、さらに、1又は複数のコンテンツ情報122を記憶している。コンテンツ情報122は、対象コンテンツに関する情報であって、要約生成基準位置に関する情報を含む。一例として、要約生成基準位置は中断位置とし、その場合、コンテンツ情報122は中断位置情報21を含む。以降の説明では、中断位置は開始位置と一致するものとする。
コンテンツ情報122は、1又は複数の要約情報22を含んでもよい。要約情報22は、対象コンテンツに対して予め用意された要約であって、詳細は後述する。
Content information 122 may include one or
なお、コンテンツ情報122は、すべて、又は、少なくとも一部が、図11のサーバ30等の要約生成装置10の外部装置に記憶されていてもよい。その場合、要約生成装置10は必要に応じて外部装置にアクセスし、コンテンツ情報122を読み出して用いる。又は、要約生成装置10がサーバ30を有していてもよい。
All or at least part of the content information 122 may be stored in an external device of the
図1は、実施の形態に係る要約生成装置10が、コンテンツの再生装置15も兼ねている例を示している。なお、要約生成装置10が再生装置15を兼ねることは必須ではない。要約生成装置10は、再生装置15に搭載されたり、再生装置15から直接又は間接的に必要な情報を取得したりするものであってもよいし、独立した装置であってもよい。
FIG. 1 shows an example in which a
図1の場合、要約生成装置10は、再生に関するユーザ操作などを受け付ける操作部17を有する。また、要約生成装置10は、コンテンツを再生する再生装置15を有する。
In the case of FIG. 1, the
プロセッサ11は、操作部17から入力される操作信号に従って、再生装置15で指定されたコンテンツを再生させる再生処理116を実行する。再生装置15は、プロセッサ11からの制御信号に従って指定されたコンテンツを再生する。
The
再生処理116は、コンテンツの再生が中断された位置を示す中断位置情報21を、再生されたコンテンツのコンテンツ情報122として、メモリ12に格納する処理を含む。これにより、再生装置15でコンテンツの再生が中断されると、そのコンテンツについての中断位置情報21がメモリ12に記憶される。
The
要約生成装置10は、ディスプレイ14を有していてもよい。ディスプレイ14は、生成された要約を出力する出力装置の一例である。出力装置は、ディスプレイ14に替えて、又は、加えて、スピーカなどの他の形態の出力を行うものであってもよい。要約生成装置10がコンテンツの再生装置も兼ねる場合、ディスプレイ14は、再生されたコンテンツの出力装置の一例でもある。
The
要約生成装置10は、インターネットなどのネットワークを介して他の装置と通信可能な通信装置13を有していてもよい。一例として、通信装置13によって、生成された要約を他の装置に出力してもよい。その場合、通信装置13も、生成された要約を出力する出力装置の一例である。また、コンテンツ情報122が他の装置に記憶されおり、要約生成装置10は、通信装置13が他の装置にアクセスすることによって、コンテンツ情報122を他の装置から読み出してもよい。
The
対象コンテンツは、一例として、図2に示されたように、1又は複数のシーズン(期)で構成されていてもよい。各シーズンは1つのストーリーを構成し、1又は複数のシーズンで、全体として大きなストーリーを構成してもよい。 As an example, the target content may consist of one or more seasons (terms), as shown in FIG. Each season makes up a story, and one or more seasons may make up a larger story as a whole.
各シーズンは、一例として、複数のエピソード(話)に区分されていてもよい。エピソードは、1つの完結したストーリーであって、対象コンテンツは、ストーリーごとに再生されることが想定されている。具体的には、シーズン1は、複数のエピソードEP11,EP12,…EP1nを含む。シーズン2は、複数のエピソードEP21,EP22,…EP2nを含む。各エピソードは、1又は複数の、音声又は文字である文Qを含む。
Each season may be divided into a plurality of episodes (talks), for example. An episode is one complete story, and target content is assumed to be reproduced for each story. Specifically,
対象コンテンツには、エピソードごとに、部分要約が用意されていてもよい。部分要約は、以前のエピソードを要約対象範囲とした要約を指す。具体的に、エピソードEP12はエピソードEP11を要約対象範囲とした部分要約AB12を含み、エピソードEP1nはエピソードEP11~EP1(n-1)を要約対象範囲とした部分要約AB1nを含む。 A partial summary may be prepared for each episode of the target content. A partial summary refers to a summary that covers the previous episode. Specifically, episode EP12 includes a partial summary AB12 whose summary target range is episode EP11, and episode EP1n includes a partial summary AB1n whose summary target range is episodes EP11 to EP1(n−1).
なお、対象コンテンツに部分要約が用意されている例については第2の実施の形態以降で用い、第1の実施の形態においては、対象コンテンツに部分要約が用意されていない、又は、用意されている部分要約を用いないものとする。 An example in which a partial summary is prepared for the target content will be used in the second and subsequent embodiments. Do not use partial summaries.
対象コンテンツが想定通りエピソード単位で再生される場合、部分要約は、エピソードの再生に先立って再生される。そのため、ユーザは、エピソードの再生に先立って前エピソードまでのあらすじを確認できる。 If the target content is played in units of episodes as expected, the partial summary is played before the episode is played. Therefore, the user can check the synopsis up to the previous episode before playing back the episode.
詳細には、部分要約の構成文CS1,CS2,CS3…は、部分要約を構成する構成単位であって、要約対象範囲に含まれる文Qから抽出されたものである。具体的には、部分要約AB12の構成文CS1,CS2,CS3…は、エピソードEP11から抽出された1又は複数の文qの集合(以下、部分集合とも称する)である。 Specifically, sentences CS1, CS2, CS3, . Specifically, the constituent sentences CS1, CS2, CS3, .
図1を参照して、要約生成装置10のプロセッサ11が実行する要約生成処理は、第1の決定処理111を含む。第1の決定処理111は、対象コンテンツにおける予想再生範囲(第1の範囲)を中断位置から決定することを含む。予想再生範囲は、中断位置より後の範囲であって、中断位置から所定の範囲である。所定の範囲は、予め設定された範囲であってよい。他の例として、所定の範囲は、ユーザの属性や、対象コンテンツの属性や、ユーザの再生傾向などから決定されてもよい。ユーザの再生傾向は、例えば、ユーザの再生行動などである。又は、一般的な再生量の平均値が用いられてもよい。
With reference to FIG. 1 , the summary generating process executed by
要約生成処理は、第2の決定処理112を含む。第2の決定処理112は、対象コンテンツについて要約対象範囲(第2の範囲)を決定することを含む。要約対象範囲は、予想再生範囲とは少なくとも一部が異なっていてもよい。少なくとも一部が異なることは、全く異なる範囲であってもよいし、一部範囲が重複していてもいい。
The summary generation process includes a
要約対象範囲は、少なくとも中断位置に基づいて決定される。好ましくは、要約対象範囲は、中断位置と、生成する要約があらすじであるのか予告であるのかと、の両方に基づいて決定される。要約対象範囲の決定方法について、図3を用いて説明する。 A summary target range is determined based at least on the break position. Preferably, the summary target range is determined based on both the break position and whether the summary to be generated is a synopsis or an advance preview. A method for determining a summary target range will be described with reference to FIG.
図3において、矢印は対象コンテンツであるコンテンツCを表しており、矢印の方向、つまり、左から右に時系列に沿って再生されることを示している。図3の矢印の始点である位置P0は、コンテンツCのあるシーズンの開始位置に相当する。つまり、図3は、コンテンツCのあるシーズンの最初からの再生の様子を示している。図3に表された部分要約ABn,ABn+1はコンテンツCに用意されていなくてもよい。第1の実施の形態においては、これら部分要約はコンテンツCに含まれないものとする。 In FIG. 3, an arrow indicates content C, which is the target content, and indicates that the content is reproduced in the direction of the arrow, that is, from left to right in chronological order. A position P0, which is the starting point of the arrow in FIG. In other words, FIG. 3 shows how content C is played back from the beginning of a certain season. The partial summaries ABn and ABn+1 shown in FIG. 3 may not be prepared for the content C. It is assumed that these partial summaries are not included in the content C in the first embodiment.
位置P1はエピソードnの開始位置であり、位置P4はエピソードnの終了位置である。位置P2は、コンテンツCのコンテンツ情報122に含まれる中断位置情報21に示される中断位置に相当する位置であって、次回の開始位置に相当する。コンテンツCの中断位置P2から位置P3までの範囲H3が、第1の決定処理111によって決定された予想再生範囲とする。
Position P1 is the start position of episode n and position P4 is the end position of episode n. The position P2 is a position corresponding to the interruption position indicated by the
第2の決定処理112において、プロセッサ11は、中断位置P2に基づいて要約対象範囲を決定する。この例では、プロセッサ11は、中断位置と、生成する要約があらすじであるのか予告であるのかと、の両方に基づいて要約対象範囲を決定する。
In a
生成する要約が予告の場合、一例として、プロセッサ11は、シーズンの開始位置P0から、中断位置P2から後の位置P3までの範囲H4を要約対象範囲とする。予告の他の例として、プロセッサ11は、予想再生範囲と一致した、位置P2から位置P3までの範囲H3を要約対象範囲としてもよい。すなわち、要約が予告の場合、要約対象範囲に中断位置P2より前の範囲を含んでもよいし、後の範囲のみであってもよい。これにより、生成される予告には、予想再生範囲から抽出された文も含まれる。そのため、ユーザは、予想再生範囲の内容が想像され、再生意欲が高められる。
When the summary to be generated is an advance notice, as an example, the
なお、位置P3が位置P4に近づきすぎると、つまり、エピソード結末までを要約対象範囲とすると、そのエピソードの結末が予告に含まれる可能性が高まる。すなわち、いわゆるネタバレになってしまう可能性がある。そのため、好ましくは、要約が予告の場合の要約対象範囲は、エピソードの終了の位置P4より前の位置までの範囲とする。 Note that if the position P3 is too close to the position P4, that is, if the summary target range is up to the end of the episode, the possibility that the end of the episode will be included in the preview increases. That is, there is a possibility that it will become a so-called spoiler. Therefore, preferably, the summary target range when the summary is an advance notice is the range up to the position before the end position P4 of the episode.
生成する要約があらすじの場合、一例として、プロセッサ11は、シーズンの開始位置P0から中断位置P2までの範囲H5を要約対象範囲とする。これにより、生成されるあらすじには、中断位置P2までの範囲から抽出された文も含まれる。そのため、ユーザは、中断位置P2までの内容が思い出され、再生意欲が高められる。
When the summary to be generated is a synopsis, as an example, the
プロセッサ11の実行する要約生成処理は、抽出処理114を含む。抽出処理114は、要約対象範囲から要約の構成文として文を抽出することを含む。抽出処理114において、プロセッサ11は、選択処理111によって選択した参照用コンテンツの抽出用データ34を用いる。
The abstract generation process executed by
要約生成処理は、算出処理113を含む。算出処理113は、要約対象範囲に含まれる各文の指標値を、予想再生範囲から算出することを含む。指標値は、予想再生範囲に含まれる語句に基づいて得られる値を含む。予想再生範囲に含まれる語句に基づいて得られる値は、例えば、重要度である。具体的に、プロセッサ11は、予想再生範囲に含まれる語句を用いて、要約対象範囲に含まれる各文の指標値を算出する。
The summary generation process includes
ここでの重要度は、要約対象範囲に含まれる各文に含まれる語句について、予想再生範囲における重要性を表す値である。重要度の具体的な算出方法は限定されない。重要度は、一例として、語句の出現頻度であってもよい。例えば、要約対象範囲に含まれる各文に含まれる語句について、予想再生範囲における出現頻度が高いほど、その文の重要度が高いと算出されてもよい。 Here, the degree of importance is a value representing the importance in the expected playback range of words included in each sentence included in the range to be summarized. A specific calculation method of importance is not limited. The degree of importance may be, for example, the appearance frequency of words. For example, it may be calculated that the higher the appearance frequency in the expected playback range of a phrase included in each sentence included in the summary target range, the higher the importance of that sentence.
又、出現頻度に替えて、あるいは加えて、語句の再生状況で重要度が算出されてもよい。語句の再生状況は、要約対象範囲に含まれる各文に含まれる語句について、予想再生範囲における再生での音声や背景音の盛り上がり(音量や音域など)、映像の明暗や色合いの変化、映像内の特定のオブジェクトなどを指す。 Also, instead of or in addition to the frequency of appearance, the importance may be calculated based on the reproduction status of the phrase. Regarding the playback status of phrases, for phrases included in each sentence included in the summary target range, the excitement of voice and background sound (volume, range, etc.) during playback within the expected playback range, changes in the brightness and color of the video, and changes in the video refers to a specific object, etc.
他の例として、重要度の算出にいわゆるページランクの考え方が用いられてもよい。すなわち、要約対象範囲に含まれる各文に含まれる語句について、予想再生範囲においてより参照される語句ほど、その文の重要度が高いと算出する。算出には、予め記憶している関数が用いられてもよい。また、他の例として、重要度の算出に、予想再生範囲における他の語句への関連性の高さを用いてもよいし、それらを組み合わせて用いてもよい。 As another example, the concept of so-called page rank may be used to calculate the degree of importance. That is, with regard to the words included in each sentence included in the range to be summarized, the more often the word is referred to in the expected reproduction range, the higher the importance of the sentence is calculated. A function stored in advance may be used for the calculation. As another example, the degree of importance may be calculated using the degree of relevance to other words in the expected playback range, or a combination thereof.
好ましくは、指標値は、部分集合との類似度を含む。部分集合は、一例として、後述する抽出処理114によって構成文とする複数の文を要約対象範囲から逐次抽出する際に、逐次抽出された文の集合を指す。類似度は、一例として、部分集合に対する類似度である。この場合、指標値は、一例として、重要度と類似度とを用いて算出されるMMR(Maximal Marginal Relevance:周辺関連性最大化)スコアである。
Preferably, the index value includes similarity with the subset. For example, a subset refers to a set of sentences sequentially extracted when a plurality of sentences to be constituent sentences are sequentially extracted from the summary target range by the
プロセッサ11は、要約対象範囲に含まれる各文qについての重要度I(q)と、部分集合kに対する類似度Sim(q,k)と、を用いて、下の式(1)で各文qのMMRスコアMMR(q)を算出する。なお、係数λは、0以上、1以下の値である。一例として、係数λは0.5とする。
MMR(q)=λI(q)-(1-λ)Sim(q,k) …(1)
Using the importance I(q) for each sentence q included in the summary target range and the similarity Sim(q, k) for the subset k, the
MMR(q)=λI(q)−(1−λ)Sim(q,k) (1)
式(1)に示されるように、MMRスコアは、係数λが1に近い程、重要度を重視する値になり、係数λが0に近い程、類似度を重視する値になる。重要度を重視する場合、予想再生範囲における重要度の高い語句を含む文ほどMMRスコアが大きくなる。一方、類似度を重視する場合、部分集合に対する類似度が低い文ほどMMRスコアが大きくなる。 As shown in Equation (1), the closer the coefficient λ is to 1, the more important the MMR score is, and the closer the coefficient λ is to 0, the more important is the similarity. When importance is placed on importance, the MMR score increases for sentences that include words and phrases with higher importance in the expected reproduction range. On the other hand, when the similarity is emphasized, a sentence with a lower similarity to the subset has a higher MMR score.
後述する抽出処理114にてMMRスコアの高い文を抽出する場合、予想再生範囲における重要度の高い語句を含み、部分集合とは類似しない文が抽出されやすくなる。その結果、構成文が、予想再生範囲と関連し、かつ、多様性ある文の集合となり得る。
When extracting sentences with a high MMR score in
要約生成処理は、抽出処理114を含む。抽出処理114は、要約対象範囲に含まれる各文の指標値に基づいて、要約対象範囲から文を要約の構成文として抽出することを含む。構成文として用いる文の数は予め規定されているものとする。その場合、一例として、プロセッサ11は、要約対象範囲に含まれる文のうちの指標値の高い文から順に、規定数までの文を構成文として抽出する。
The abstract generation process includes
図4を用いて抽出処理114の具体例を説明する。図4の例では、指標値としてMMRスコアを用いるものとする。要約対象範囲に文q1~文q4が含まれているとする。算出処理113では、予想再生範囲に含まれる語句に基づいて文q1~文q4それぞれの重要度が算出される。
A specific example of the
図4を参照して、構成文として1つの文も抽出されていない抽出処理114の開始時には、部分集合は0であるため、部分集合に対する文q1~文q4それぞれの類似度は0と算出される。従って、このとき文q1~文q4それぞれのMMRスコアは重要度と一致する。各MMRスコアの大小関係がq2>q3>q1>q4である場合、抽出処理114においては、MMRスコアの最も高い文q2が構成文として抽出される(ステップS1)。
Referring to FIG. 4, at the start of
文q2が抽出されると、抽出後の要約対象範囲に含まれる文q1,q3,q4それぞれについて、部分集合との類似度が算出される。ここでの部分集合は、文q2となる。算出された類似度を用いて文q1,q3,q4それぞれのMMRスコアが算出される(ステップS2)。各MMRスコアの大小関係がq4>q3>q1である場合、抽出処理114においては、MMRスコアの最も高い文q4が構成文として抽出される(ステップS3)。 When the sentence q2 is extracted, the degree of similarity with the subset is calculated for each of the sentences q1, q3, and q4 included in the summary target range after extraction. The subset here is sentence q2. MMR scores of sentences q1, q3, and q4 are calculated using the calculated similarities (step S2). If the magnitude relation of each MMR score is q4>q3>q1, the sentence q4 with the highest MMR score is extracted as a constituent sentence in the extraction process 114 (step S3).
抽出処理114においてプロセッサ11は上の処理を規定数の文が抽出されるまで繰り返す。これにより、予想再生範囲に関連した文が構成文として抽出されるとともに、要約全体の複数の文の関連も考慮して抽出される。MMRスコアを指標値として用いる場合、類似度については先に抽出された文からなる部分集合に対して低い文が抽出されやすいため、バランスのよい内容の要約が生成される可能性が高い。
In
なお、MMRスコアは、重要度と類似度とを用いた指標値の一例である。他の例として、下の式(2)のように、類似度を重要度に加えて得られる指標値Ivを用いてもよい。
Iv(q)=λI(q)+(1-λ)Sim(q,k) …(2)
Note that the MMR score is an example of an index value using importance and similarity. As another example, an index value Iv obtained by adding the degree of similarity to the degree of importance may be used, as in Equation (2) below.
Iv(q)=λI(q)+(1−λ)Sim(q,k) (2)
後述する抽出処理114にて指標値Ivの高い文を抽出する場合、予想再生範囲における重要度の高い語句を含み、部分集合とは類似する文が抽出されやすくなる。その結果、構成文が、予想再生範囲と関連し、かつ、内容に統一性ある文の集合となり得る。
When extracting sentences with a high index value Iv in
要約生成処理は、生成処理115を含む。生成処理115は、抽出処理114で構成文として抽出された文を配置することを含む。ここでは、配置の方法は特定の方法に限定されない。一例として、要約対象範囲での出現順に応じて配置する方法であってよい。他の例として、算出された指標値の大きさによって配置する方法であってよい。
The summary generation process includes
なお、このとき、プロセッサ11は、複数の文の間の類似性や対比などを用いて、複数の文をグループ化し、グループ単位で配置するようにしてもよい。これにより、対話のような複数の文がグループ化されている場合に、それらを用いて自然な要約が生成されるようになる。
At this time, the
図5を用いて、本実施の形態に係る要約生成方法について説明する。図5のフローチャートに表された処理は、本実施の形態に係る要約生成方法に従った要約生成処理であって、プロセッサ11が生成プログラム121を実行することに実現される。図5の処理は、再生装置15が対象コンテンツを再生する際や、要約の提示を指示するユーザ操作を受け付けたときなどに開始される。
A summary generation method according to the present embodiment will be described with reference to FIG. The process shown in the flowchart of FIG. 5 is a summary generation process according to the summary generation method according to the present embodiment, and is implemented by
図5を参照して、プロセッサ11は、対象コンテンツのコンテンツ情報122から中断位置を読み取り、中断位置に基づいて予想再生範囲を決定する(ステップS101)。ステップS101では、一例として、プロセッサ11は、中断位置から予め設定された範囲を予想再生範囲とする。
Referring to FIG. 5,
また、プロセッサ11は、中断位置と、生成する要約があらすじであるのか予告であるのかと、の両方に基づいて要約対象範囲を決定する(ステップS103)。ステップS101とステップS103とは処理順はいずれが先であってもよい。
Also, the
プロセッサ11は、ステップS101で決定した予想再生範囲に含まれる語句に基づいて、ステップS103で決定した要約対象範囲に含まれる各文の重要度を算出する(ステップS105)。また、プロセッサ11は、要約構成文としてすでに抽出した文を部分集合として、要約対象範囲に含まれる文のうちの要約構成文として抽出されていない各文について、部分集合に対する類似度を算出する(ステップS107)。
プロセッサ11は、ステップS105で算出された重要度とステップS107で算出された類似度とを上記の式(1)に代入することで、要約対象範囲に含まれる文のうちの要約構成文として抽出されていない各文について、指標値の一例としてMMRスコアを算出する(ステップS109)。そして、プロセッサ11は、MMRスコアの最も高い文を構成文として抽出する(ステップS111)。
The
構成文として抽出された文が規定数に達していない場合(ステップS113でNO)、プロセッサ11は、上記のステップS107~S111を繰り返す。これにより、構成文とする文が逐次抽出される。構成文として1文が抽出される度に部分集合となる文が増加し、それに伴って未抽出の文の類似度が算出し直される。そのため、構成文として1文が抽出される度にMMRスコアが変化する。
If the number of sentences extracted as constituent sentences does not reach the specified number (NO in step S113),
構成文として抽出された文が規定数に達すると(ステップS113でYES)、プロセッサ11は、抽出された文を配置することで要約を生成する(ステップS115)。
When the number of sentences extracted as constituent sentences reaches the prescribed number (YES in step S113),
[第2の実施の形態] [Second embodiment]
第2の実施の形態に係る要約生成装置10は、要約生成処理において、対象コンテンツに用意されている部分要約を利用して要約を生成する。第2の実施の形態において、プロセッサ11は、部分要約にシルバースタンダードサマリーアルゴリズム(SSSA)を応用する。SSSAの適用に関しては、山西良典、西原陽子、及び金田大地,”部分要約とSilver Standard Summary Algorithm の応用による小説の次回予告生成”,[online],令和2年6月9日,人工知能学会,[令和2年6月9日検索],インターネット<URL:https://doi.org/10.11517/pjsai.JSAI2020.0_3K5OS5b01>に開示されている。
The
SSSAを適用した処理において、プロセッサ11は、対象コンテンツに用意されている部分要約をゴールドスタンダードとして利用する。この場合、図6に表されたように、第2の実施の形態において、要約生成処理は、さらに、第3の決定処理117を含む。第3の決定処理117は、中断位置に基づいて、対象コンテンツに用意されている複数の部分要約のうちの、要約の生成に用いる部分要約をゴールドスタンダードと決定することを含む。
In SSSA-applied processing, the
第3の決定処理117において、プロセッサ11は、中断位置と、生成する要約があらすじであるか予告であるかと、に応じたゴールドスタンダード決定範囲内にある位置に対応付けられた部分要約を、ゴールドスタンダードと決定する。これにより、開始位置が中断位置に近いエピソードに対応した部分要約がゴールドスタンダードと決定される。具体例として、中断位置の属するエピソードの次のエピソードに対応した部分要約が挙げられる。生成する要約が予告である場合、一例として、ゴールドスタンダード決定範囲は中断位置から先の範囲とする。
In a
第3の決定処理117は、中断位置と、生成する要約があらすじであるか予告であるかと、に応じて、ゴールドスタンダードからシルバースタンダード要約を決定することを含む。シルバースタンダード要約は、ゴールドスタンダードの構成文のうちの、要約の生成に用いる文を指す。一例として、プロセッサ11は、ゴールドスタンダードの構成文のうちの、対象コンテンツにおける出現位置が中断位置からシルバースタンダード要約決定範囲内にある文をシルバースタンダード要約に決定する。生成する要約が予告である場合、一例として、シルバースタンダード要約決定範囲は中断位置から先の範囲とする。
A
第2の実施の形態に係る制御方法を、図7を用いて説明する。また、第2の実施の形態に係る制御方法の具体例について、図3、図8~図10を用いて説明する。図8~図10は、「銀河鉄道の夜」(宮沢賢治「銀河鉄道の夜」青空文庫より引用)を対象コンテンツCとして要約を生成する例を表している。最左列の文番号は、冒頭からすべての文に順に割り当てた番号である。ここでは、要約対象範囲が中断位置より後の範囲を含む予告を生成する場合を説明する。 A control method according to the second embodiment will be described with reference to FIG. A specific example of the control method according to the second embodiment will be described with reference to FIGS. 3 and 8 to 10. FIG. 8 to 10 show an example of generating a summary with target content C of "Night on the Galactic Railroad" (quoted from Kenji Miyazawa's "Night on the Galactic Railroad" Aozora Bunko). Sentence numbers in the leftmost column are numbers assigned to all sentences in order from the beginning. Here, a case will be described in which the summary target range generates an advance notice including the range after the interruption position.
図7のフローチャートは、第1の実施の形態に係る要約生成方法の具体例を表した図5のフローチャートに加えて、ステップS201,S203の処理が異なっている。すなわち、第2の実施の形態に係る要約生成方法では、プロセッサ11は、対象コンテンツに用意されている部分要約のうちの、要約の生成に用いる部分要約をゴールドスタンダードとして決定し(ステップS201)、その構成文の中から、要約の生成に用いる文をシルバースタンダード要約として決定する(ステップS203)。
The flowchart of FIG. 7 differs from the flowchart of FIG. 5 showing a specific example of the abstract generation method according to the first embodiment in the processing of steps S201 and S203. That is, in the summary generation method according to the second embodiment, the
図3の例の場合、コンテンツCの位置P1には、エピソードnに対応した部分要約ABnが配置されている。位置P4には、次のエピソードn+1に対応した部分要約ABn+1が配置されている。これら部分要約ABn,ABn+1は、コンテンツCのコンテンツ情報122に含まれる要約情報22に示されている。
In the example of FIG. 3, at position P1 of content C, a partial summary ABn corresponding to episode n is arranged. A partial summary ABn+1 corresponding to the next episode n+1 is placed at position P4. These partial summaries ABn and ABn+1 are shown in the
部分要約ABnの要約対象範囲は範囲H1である。すなわち、この例の部分要約ABnは、位置P0から位置P1までを要約対象範囲とした、エピソードnのあらすじである。部分要約ABn+1の要約対象範囲は範囲H2である。すなわち、この例の部分要約ABn+1は、位置P0から位置P4までを要約対象範囲とした、エピソードn+1のあらすじである。 The summary target range of the partial summary ABn is the range H1. That is, the partial summary ABn in this example is a synopsis of the episode n with the range from position P0 to position P1 to be summarized. The summary target range of partial summary ABn+1 is range H2. That is, the partial summary ABn+1 in this example is a synopsis of the episode n+1 with the range from position P0 to position P4 as the summary target range.
生成する要約が予告である場合、一例として、ゴールドスタンダード決定範囲は中断位置から先の範囲H6とする。この場合、第3の決定処理117において、中断位置P2から範囲H6にある位置に対応付けられた部分要約をゴールドスタンダードと決定するとすると、図3の例の場合、プロセッサ11は、エピソードnが終了する位置P4に対応付けられた部分要約をゴールドスタンダードと決定する。
If the summary to be generated is an advance notice, as an example, the gold standard determination range is set to the range H6 from the interrupt position. In this case, in the
生成する要約が予告である場合、一例として、シルバースタンダード要約決定範囲は中断位置から先の範囲H6とする。この場合、プロセッサ11は、ゴールドスタンダードの構成文のうちの、対象コンテンツにおける出現位置が中断位置から先の範囲H6内にある文をシルバースタンダード要約に決定する。なお、ここでは一例として、ゴールドスタンダードとする部分要約を決定する範囲と、ゴールドスタンダードの構成文のうちのシルバースタンダード要約に決定する範囲と、が同じ範囲H6としているが、これら範囲は異なってもよい。
If the summary to be generated is an advance notice, as an example, the silver standard summary decision range is set to the range H6 from the interruption position. In this case, the
図8を参照して、「銀河鉄道の夜」(宮沢賢治「銀河鉄道の夜」青空文庫より引用)が文番号130まで読了されているとする。この場合、コンテンツ情報122に、文番号130が中断位置P2として記憶される。
Referring to FIG. 8, it is assumed that "Night on the Galactic Railroad" (quoted from Kenji Miyazawa's "Night on the Galactic Railroad" Aozora Bunko) has been read up to sentence
文番号130の属するエピソードnの終了が文番号191である場合、文番号192が次のエピソードn+1の開始位置である位置P4となる。この場合、例えば、図8に示されたように、文番号192の直前に、エピソードn+1に対応した部分要約ABn+1が配置されている。
If the end of episode n to which
部分要約ABn+1の要約対象範囲である範囲H2は文番号1から文番号191である。部分要約ABn+1に対応した位置P4は、中断位置P2から後の範囲H6に含まれている。そのため、プロセッサ11は第3の決定処理117において、部分要約ABn+1をゴールドスタンダートと決定する。
The range H2, which is the summary target range of the partial summary ABn+1, is from
図9は、部分要約ABn+1の構成文の具体例を表している。図9を参照して、部分要約ABn+1は、一例として、範囲H2(文番号1~191)から抽出された、文番号5,21,31,55,120,163,170,191の8つの文を構成文としている。
FIG. 9 shows a specific example of a constituent sentence of a partial
このとき、文番号5,21,31,55,120であるグループK1は中断位置P2以前から抽出され、文番号163,170,191であるグループK2は位置P2より後から抽出されている。すなわち、グループK2は中断位置P2から後の範囲H6に含まれた文のグループであり、グループK1は含まれていない文のグループである。そのため、プロセッサ11は第3の決定処理117において、グループK2をシルバースタンダード要約と決定する。
At this time, the group K1 with
第2の実施の形態に係る要約生成方法においても、以降は、第1の実施の形態に係る要約生成方法と同様にしてプロセッサ11は要約を生成する。すなわち、図7を参照して、プロセッサ11は、ステップS203で決定されたシルバースタンダード要約(グループK2:文番号163,170,191)を部分集合とし、要約対象範囲に含まれる文のうちの要約構成文として抽出されていない各文について、部分集合に対する類似度を算出する(ステップS107)。
Also in the abstract generation method according to the second embodiment,
なお、ここでの他の例として、プロセッサ11は、シルバースタンダード要約とされなかった1又は複数の文(例えばグループK1:文番号5,21,31,55,120)や、ゴールドスタンダードである部分要約の構成文すべて(例えば、グループK1+K2:文番号5,21,31,55,120,163,170,191)を部分集合として、要約対象範囲に含まれる文のうちの要約構成文として抽出されていない各文について、この部分集合に対する類似度を算出してもよい。
Note that, as another example here, the
プロセッサ11は、重要度と類似度とを用いて、要約対象範囲に含まれる文のうちの要約構成文として抽出されていない各文についてMMRスコアを算出する(ステップS109)。そして、プロセッサ11は、MMRスコアの最も高い文を構成文として抽出する(ステップS111)。
構成文として抽出された文が規定数に達していない場合(ステップS113でNO)、プロセッサ11は、上記のステップS107~S111を繰り返す。
If the number of sentences extracted as constituent sentences does not reach the specified number (NO in step S113),
一例として、要約対象範囲から、読み終わりの位置である文番号130より後の文番号131,132,133,134,138を抽出したとする。予告を生成する場合、図10に表されたように、プロセッサ11は、シルバースタンダード要約とした文番号163,170,191(グループK2)に、新たに抽出された文番号131,132,133,134,138(グループK3)を加えて要約の構成文とする。
As an example, assume that
なお、図10において、予告としての要約の構成文には、中断位置P2より前の文と後の文との両方が含まれてもよい。言い換えると、予告としての要約の構成文は中断位置P2より後の文ばかりに限定されない。例えば、中断位置P2より後の文が1つでも構成文に含まれる場合には、その要約を予告として取り扱ってもよい。 In FIG. 10, the composition sentences of the summary as an advance notice may include both the sentences before and after the interruption position P2. In other words, the constituent sentences of the summary as an advance notice are not limited to the sentences after the interruption position P2. For example, if even one sentence after the interruption position P2 is included in the constituent sentences, the summary may be treated as an advance notice.
このようにゴールドスタンダードを利用することにより、構成文のすべての文を抽出するよりも抽出する文の数が少なくなり、処理が容易になる。すなわち、ステップS107~S113を繰り返す回数を低減できる。また、ゴールドスタンダードからシルバースタンダード要約を決定して部分集合として用いることで、より適した内容の要約を生成することができる。 By using the gold standard in this way, the number of sentences to be extracted is smaller than that of extracting all sentences of the constituent sentences, and processing is facilitated. That is, the number of times steps S107 to S113 are repeated can be reduced. Also, by determining the silver standard abstract from the gold standard and using it as a subset, it is possible to generate a more suitable abstract.
[第3の実施の形態] [Third embodiment]
第3の実施の形態に係る要約生成装置10は、要約生成処理において、参照用コンテンツを用いる。参照用コンテンツは、対象コンテンツの要約の構成文を抽出する際に参照する、対象コンテンツ以外のコンテンツであって、要約が用意されているコンテンツを指す。
The
一例として、参照用コンテンツとして用いられるコンテンツに関する情報を、要約生成装置10は、他の装置から取得するものとする。図11は、第3の実施の形態に係る要約生成装置10を表した図である。図11に表されたように、第3の実施の形態に係る要約生成装置10は、通信装置13によって他の装置としてサーバ30と通信可能とする。
As an example, it is assumed that the
サーバ30は、複数のコンテンツそれぞれに対応付けられたコンテンツデータ31A,31B,・・・31を記憶している。コンテンツデータ31A,31B,・・・31は、要約生成装置10のプロセッサ11で実行される要約生成処理にて用いられる。コンテンツデータ31がコンテンツに対応付けられていることは、コンテンツデータ31がコンテンツそのものを含むものでなくてもよく、コンテンツを指す名称や識別子などの情報を含むことを指す。
The
なお、サーバ30は、図11の例では要約生成装置10の外部装置であって、通信装置13がネットワーク70を介してアクセスする装置であるものとしている。しかしながら、他の例として、サーバ30は要約生成装置10に搭載される記憶装置であってもよい。
In the example of FIG. 11, the
コンテンツデータ31は、それぞれ、属性32を含む。属性32は、コンテンツのストーリーの特性を表す情報であって、一例として、ストーリー全体の文を単語ベクトル化した値である。また、属性32は、ストーリー全体の文を単語ベクトル化した値に変えて、又は、加えて、ジャンル、脚本家、シーズン番号、再生対象者の特性、などのメタ情報であってもよい。
The
参照用コンテンツとして利用可能なコンテンツデータ31は、部分要約33を含んでいる。図11では、コンテンツデータ31が、複数の部分要約33A,33B,33C,・・・を含んでいる場合を示している。部分要約33A,33B,33C,・・・は、コンテンツのエピソードごとに用意されており、以前のエピソードを要約対象範囲とした要約を指す。
コンテンツデータ31は、それぞれ、抽出用データ34を含む。抽出用データ34は、1又は複数の部分要約33A,33B,33C,・・・それぞれの構成文の、コンテンツでの位置の傾向を表したデータである。抽出用データ34について、具体的に、図12を用いて説明する。
Each
図12は、実際のコンテンツA,Bにおける、部分要約の構成文とした文の、コンテンツA,Bにおける分布を表した図である。図12の横軸はエピソードナンバーEPを指し、縦軸は構成文とした文の要約対象範囲からの抽出位置PPを指している。図12では、エピソードごとに、対応する部分要約の構成文とした文それぞれの抽出位置PPをプロットしている。 12A and 12B are diagrams showing the distribution in the actual contents A and B of the sentences constituting the partial summary in the actual contents A and B. FIG. The horizontal axis of FIG. 12 indicates the episode number EP, and the vertical axis indicates the extraction position PP from the summary target range of the constituent sentences. FIG. 12 plots the extraction position PP of each of the sentences constituting the corresponding partial summary for each episode.
コンテンツA,Bは、3シーズン以上が放映されている世界的に人気が高い連続ドラマである。図12は、コンテンツA,Bの全シーズンのうちの3シーズンまでを用い、3シーズン分のすべてのエピソードそれぞれの部分要約の構成文とした文の、要約対象範囲からの抽出位置PPを表している。部分要約は、各エピソードの開始から3分以内の文を用いている。 Contents A and B are serial dramas that have been aired for three or more seasons and are popular all over the world. FIG. 12 shows the extraction position PP of sentences constituting partial summaries of all episodes of all three seasons, using up to three seasons out of all seasons of contents A and B, extracted from the summary target range. there is Partial summaries use sentences within 3 minutes of the beginning of each episode.
構成文として抽出された文qの抽出位置PP(q)は、下の手順で得られる。すなわち、下の式(3)によって、文qを抽出したエピソードeに含まれる全文(個数Ne)中の出現位置を正規化した値EPe(q)を得る。
EPe(q)=Pe(q)/Ne …(3)
The extraction position PP(q) of sentence q extracted as a constituent sentence is obtained by the following procedure. That is, the expression (3) below obtains a value EPe(q) obtained by normalizing the appearance positions in all sentences (number Ne) included in episode e from which sentence q is extracted.
EPe(q)=Pe(q)/Ne (3)
次に、値EPe(q)を用いて、下の式(4)で定義される絶対位置AP(q)を得る。
AP(q)=EPe(q)+(e-1) …(4)
The value EPe(q) is then used to obtain the absolute position AP(q) defined in equation (4) below.
AP(q)=EPe(q)+(e−1) (4)
そして、下の式(5)で定義される、過去相対位置である抽出位置PP(q)を得る。過去相対位置は、文qを構成要素とする部分要約の対象のエピソードナンバーe’を1とした場合の、文qの相対的な位置を表したものである。
PP(q)=AP(q)/(e’-1) …(5)
Then, the extracted position PP(q), which is the past relative position, defined by the following equation (5) is obtained. The past relative position represents the relative position of the sentence q when the episode number e', which is the object of the partial summary with the sentence q as a constituent element, is set to 1.
PP(q)=AP(q)/(e'-1) (5)
一例として、エピソードナンバー3に対応した部分要約の構成文について絶対位置APが1.4591であった場合、式(5)より抽出位置PP=0.7295が得られる。抽出位置PPを過去相対位置で表すことによって、シーズンの開始から部分要約の位置までの範囲での相対的な位置関係を考慮することが可能となる。これにより、文の抽出位置について、コンテンツを超えた比較考察が可能になる。 As an example, if the absolute position AP of the constituent sentence of the partial summary corresponding to episode number 3 is 1.4591, the extraction position PP=0.7295 is obtained from equation (5). Representing the extracted position PP by the past relative position makes it possible to consider the relative positional relationship in the range from the start of the season to the position of the partial summary. As a result, it becomes possible to compare and consider the extraction position of the sentence beyond the contents.
発明者らは、コンテンツA,Bを含め、それぞれ、3シーズン以上が放映されている世界的に人気が高い連続ドラマである複数のコンテンツについて、コンテンツA,Bと同様に、部分要約の構成文とした文の、コンテンツにおける分布を調べた。 The inventors, including the contents A and B, for a plurality of contents that are serial dramas that are highly popular in the world and have been aired for three seasons or more, have the composition sentences of the partial summaries in the same way as the contents A and B. We examined the distribution of the sentences in the content.
その結果、発明者らは、図12に示されるように、複数コンテンツに共通して、シーズン1については、抽出位置PPが0.0と1.0とに集中している傾向に気付いた。抽出位置PPは、値が小さいほど(0に近いほど)、抽出位置が要約対象範囲の最初、つまり、シーズンの最初に近い。値が大きいほど(1に近いほど)、抽出位置が要約対象範囲の最後、つまり、対応するエピソードの直前のエピソードの最後に近いことを表している。そのため、複数コンテンツに共通して、シーズン1については、部分要約の構成文とした文が、要約対象範囲の序盤と終盤とに偏る傾向にあると考察された(考察1)。
As a result, as shown in FIG. 12, the inventors have noticed a tendency for the extraction positions PP to concentrate at 0.0 and 1.0 for
また、発明者らは、複数コンテンツに共通して、0.0と1.0との中間付近に、抽出位置PPのプロットが右下がりに連続して存在していることに気付いた。これは、各部分要約が、該当するシーズンの同一の位置の文を構成文として用いる傾向にあると考察された(考察2)。つまり、複数コンテンツに共通して、特定の重要度の高い文を各部分要約で用いる傾向にあると考察された。 In addition, the inventors noticed that, in common with a plurality of contents, the plot of the extraction position PP continuously descends to the right near the middle between 0.0 and 1.0. It was considered that each partial summary tends to use sentences at the same position in the corresponding season as constituent sentences (Consideration 2). In other words, it was considered that there is a tendency to use specific high-importance sentences in each partial summary in common with multiple contents.
また、発明者らは、図12に示されたように、コンテンツA,Bで、シーズン1~シーズン3それぞれの抽出位置PPの分布傾向が異なる場合があることに気付いた。これは、部分要約の構成文とする文の抽出傾向が、コンテンツごと、及び、又は、シーズンごとに異なる場合があると考察された(考察3)。
Moreover, the inventors have noticed that the distribution tendencies of the extraction positions PP of the
発明者らは、考察1,2より、要約対象範囲を序盤、中盤、終盤の3つに区分して、部分要約ごとに、構成文とした全文の、各区分における抽出割合を抽出用データ34として用いるものとした。一例として、序盤s、中盤c、終盤eは、それぞれ、シーズンの開始から20%、60%、及び20%の範囲とする。
Based on
図12において点線で示されている、コンテンツAのエピソード50に着目すると、エピソード50に対応する部分要約の構成文とされた文は、要約対象範囲の序盤sに50%、中盤cに30%、及び、終盤eに20%存在していることが読み取られる。すなわち、コンテンツAのエピソード50に対応した部分要約は、シーズン3の開始からエピソード49の最後までの範囲の序盤sから50%、中盤cから30%、及び、終盤eから20%の文が構成文として抽出されて生成されたものであることが読み取られる。
Focusing on the
抽出用データ34は、各エピソードに対応した部分要約の構成文とした文の、各区分からの抽出割合を表す。つまり、抽出用データ34は、コンテンツの部分要約の構成文とした文の、コンテンツにおける相対的な位置の傾向を表したデータと言える。
The
抽出用データ34は、一例として、図13に示されたような表形式で示すことができる。すなわち、図13を参照して、コンテンツAの抽出用データ34は、コンテンツAのシーズン3までについて、すべてのエピソード1~69について、部分要約の構成文とした文の、要約対象範囲の序盤s、中盤c、終盤eそれぞれの抽出割合を示している。例えば、エピソード50については、序盤s、中盤c、終盤eそれぞれに50%、30%、20%が規定されている。
As an example, the
また、発明者らは、考察3より、対象コンテンツに適したコンテンツを参照用コンテンツとして、要約生成処理に用いるものとした。そのため、図11に示されたように、サーバ30には複数のコンテンツデータ31A,31B,・・・31が記憶され、それぞれに、抽出用データ34が含まれている。
In addition, from consideration 3, the inventors decided to use the content suitable for the target content as the reference content for the summary generation process. Therefore, as shown in FIG. 11, the
図11を参照して、第3の実施の形態において、要約生成処理は、さらに、選択処理118を含む。選択処理118は、参照用コンテンツを選択することを含む。参照用コンテンツは、一例として、サーバ30に記憶されているコンテンツデータ31A,31B,…31の中から選択される。
Referring to FIG. 11, in the third embodiment, the summary generation process further includes
選択処理118では、コンテンツデータ31に含まれる属性32に基づき、対象コンテンツとストーリーの特性が関連あるコンテンツデータ31が選択される。選択処理118では、一例として、ストーリー全体の文を単語ベクトル化した値が、対象コンテンツのその値から所定範囲にあるコンテンツが参照用コンテンツとして抽出される。また、他の例として、ジャンル、脚本家、シーズン番号、及び、再生対象者の特性、のうちのいずれか、あるいは、少なくとも1つについて、一致、もしくは近似したコンテンツが参照用コンテンツとして抽出されてもよい。
In the
第3の実施の形態では、抽出処理114において、プロセッサ11は、参照用コンテンツに対応付けられた抽出用データ34を用いて、対象コンテンツから要約の構成文とする文を抽出する。詳しくは、プロセッサ11は、参照用コンテンツに対応付けられた抽出用データ34に示される、該当するエピソードの要約についての、要約対象範囲の序盤s、中盤c、終盤eそれぞれの抽出割合を参照する。該当するエピソードは、位置P2近傍に開始位置があるエピソードであって、図6の例の場合、例えばエピソードn+1である。また、この例の場合、エピソードnであってもよい。
In the third embodiment, in the
該当するエピソードn+1の要約ABn+1についての要約対象範囲の序盤s、中盤c、終盤eそれぞれの抽出割合が、図13に示された50%、30%、20%であるものとする。この場合、プロセッサ11は、対象コンテンツについてこの割合を適用して、MMRスコアに基づいて文を抽出する。この例の場合、構成文とする文の数を10とした場合、要約対象範囲の序盤s、中盤c、終盤eそれぞれから5、3、及び、2の文をMMRスコアに基づいて抽出する。
Assume that the extraction ratios of the beginning s, middle c, and end e of the summary target range for the summary ABn+1 of the applicable episode n+1 are 50%, 30%, and 20%, respectively, shown in FIG. In this case,
これにより、対象コンテンツについて、ストーリーの特性が関連ある参照用コンテンツに用意されている部分要約と同様の傾向で要約対象範囲から文が抽出して要約が生成される。そのため、要約を容易に生成することができる。 As a result, for the target content, a summary is generated by extracting sentences from the range of the target content with the same tendency as the partial summary prepared for the reference content having the story characteristic. Therefore, a summary can be easily generated.
第3の実施の形態に係る要約生成装置10は、要約生成処理において、さらに、配置用データを用いてもよい。配置用データは、要約が用意されているコンテンツにおいて、構成文とした文のコンテンツ中での位置の順序と、部分要約における配置順序との不一致の評価値である。配置用データ35は、例えば、ジャロ・ウィンクラー距離とする。
The
この場合、図11に表されたように、コンテンツデータ31は、それぞれ、配置用データ35を含んでいる。コンテンツAの配置用データ35は、例えば、コンテンツAのシーズン3までについて、すべてのエピソード1~69について、部分要約の構成文とした文の、要約対象範囲の序盤s、中盤c、終盤eそれぞれの抽出割合を示している。例えば、エピソード50については、序盤s、中盤c、終盤eそれぞれに50%、30%、20%が規定されている。
In this case, as shown in FIG. 11, each of the
発明者らは、部分要約の構成文とされた文の、部分要約における配置順序がコンテンツ中での位置の順序とは異なっている、つまり、不一致の場合があることに気付いた。そこで、コンテンツAを含む複数コンテンツについて、部分要約における配置順序と、コンテンツにおける出現順との不一致を表す指標値としてジャロ・ウィンクラー距離を算出し、検証した。ジャロ・ウィンクラー距離は、1に近い方が、部分要約における配置順序がコンテンツ中での位置の順序と近い、つまり、不一致が小さいことを示している。 The inventors have noticed that the arrangement order in the partial summary differs from the positional order in the content, that is, there is a mismatch in some cases. Therefore, for a plurality of contents including content A, the Jaro-Winkler distance was calculated and verified as an index value representing the discrepancy between the arrangement order in the partial summary and the appearance order in the content. The closer the Jaro-Winkler distance is to 1, the closer the arrangement order in the partial summary is to the positional order in the content, that is, the smaller the mismatch.
発明者らは、多数の作品を調査し、シーズンごとのジャロ・ウィンクラー距離の平均値を求めたところ、ほとんどの作品が0.65~0.85になることがわかった。これは、部分要約においてコンテンツとは異なる順序で文が配置されている場合が多いことを示している。 When the inventors investigated a large number of works and calculated the average value of the Jaro-Winkler distance for each season, it was found that most of the works ranged from 0.65 to 0.85. This indicates that sentences are often arranged in a different order than the content in the partial summary.
部分要約における配置順序とコンテンツにおける出現順との不一致が大きいほど、要約によってコンテンツの内容が完全には理解されにくくなる。逆に、不一致が小さいほど、コンテンツの内容が理解されやすくなると考えられる。そのため、コンテンツの属性に応じて使い分けられていることが考えられる。 The greater the discrepancy between the arrangement order in the partial summary and the appearance order in the content, the more difficult it is for the summary to fully understand the content. Conversely, it is believed that the smaller the discrepancy, the easier it is for the content to be understood. Therefore, it is conceivable that they are used properly according to the attribute of the content.
すなわち、サスペンスなどの、要約によってコンテンツの内容が完全に理解されない方が好まれるコンテンツのカテゴリの場合、要約対象範囲などによって、適切な不一致とすることで、内容の理解と再生意欲とのバランスが図られると考察された。そこで、第3の実施の形態に係る要約生成装置10では、コンテンツごとに用意された配置用データ35を、対象コンテンツの要約の生成に用いてもよい。
In other words, in the case of content categories such as suspense, where it is preferable that the contents of the content are not completely understood by summarization, appropriate inconsistency is achieved depending on the scope of the summary, etc., so that the understanding of the content and the willingness to play are balanced. It was considered to be planned. Therefore, in the
配置用データ35は、一例として、図14に示されたような表形式で示すことができる。図14の配置用データ35は、一例として、コンテンツA、B、Cのシーズン1、2、3および全シーズン、それぞれの配置用データ(ジャロ・ウィンクラー距離)を示している。ジャロ・ウィンクラー距離は、コンテンツ中での文の位置の順序と、部分要約における配置順序とが完全に一致する場合は1、全く類似しない場合は0となる。なお、図14の配置用データ35の例では、配置用データの値がシーズンごとに示されているが、コンテンツごとに1つ示されるものでもよい。
The
第3の実施の形態に係る要約生成装置10では、対象コンテンツに関連するコンテンツの配置用データを、構成文として抽出された文の配置に用いる。一例として、参照用コンテンツの配置用データを用いる。又は、第3の実施の形態に係る要約生成方法においては、抽出された文の要約における配置順序を、対象コンテンツにおける出現順と一致させるか、関連するコンテンツの配置用データを用いた配置とするか、を選択可能としてもよい。選択は、例えば、要約生成者によって行われるものであってもよい。
In the
具体的には、生成処理115において、プロセッサ11は、構成文として抽出された複数の文を、配置用データ35に基づいて配置する。一例として、プロセッサ11は、抽出された複数の文を、ジャロ・ウィンクラー距離が参照用コンテンツの配置用データ35に示されるジャロ・ウィンクラー距離と同一、又は、所定範囲内の値となるように並べ替える。これにより、要約から対象コンテンツの内容の把握されやすさが参照用コンテンツのそれと同じようにすることができる。
Specifically, in the
<3.付記>
本発明は、上記実施形態に限定されるものではなく、様々な変形が可能である。例えば、第1の実施の形態~第3の実施の形態のうちの少なくとも2つが組み合わされてもよい。
<3. Note>
The present invention is not limited to the above embodiments, and various modifications are possible. For example, at least two of the first to third embodiments may be combined.
10 :要約生成装置
11 :プロセッサ
12 :メモリ
13 :通信装置
14 :ディスプレイ
15 :再生装置
17 :操作部
21 :中断位置情報
22 :要約情報
30 :サーバ
31 :コンテンツデータ
31A :コンテンツデータ
31B :コンテンツデータ
32 :属性
33 :部分要約
33B :部分要約
33C :部分要約
34 :抽出用データ
35 :配置用データ
70 :ネットワーク
111 :選択処理
112 :第2の決定処理
113 :算出処理
114 :抽出処理
115 :生成処理
116 :再生処理
117 :第3の決定処理
118 :選択処理
121 :生成プログラム
122 :コンテンツ情報
AB12 :部分要約
AB1n :部分要約
ABn :部分要約
C :コンテンツ
CS1 :構成文
CS2 :構成文
CS3 :構成文
EP10 :エピソード
EP11 :エピソード
EP12 :エピソード
EP1n :エピソード
EP21 :エピソード
EP22 :エピソード
H1 :範囲
H2 :範囲
H3 :範囲
H4 :範囲
H5 :範囲
H6 :範囲
K1 :グループ
K2 :グループ
K3 :グループ
P0 :開始位置
P2 :中断位置
PP :抽出位置
q :文
q1 :文
q2 :文
q3 :文
q4 :文
10: Summary generation device 11: Processor 12: Memory 13: Communication device 14: Display 15: Playback device 17: Operation unit 21: Interruption position information 22: Summary information 30: Server 31:
Claims (8)
プロセッサを備え、
前記プロセッサは、
前記対象コンテンツの再生中断位置から前記対象コンテンツにおける第1の範囲を決定し、
前記再生中断位置から決定される、前記対象コンテンツにおける前記要約の構成文を抽出する範囲であって、前記第1の範囲とは少なくとも一部が異なる第2の範囲に含まれる文の指標値を、前記第1の範囲から算出し、
前記指標値に基づいて前記第2の範囲から前記要約の構成文を抽出する、ように構成されている
要約生成装置。 A summary generation device for generating a summary of target content,
with a processor
The processor
determining a first range in the target content from a playback interruption position of the target content;
an index value of a sentence included in a second range, which is determined from the playback interruption position and which is a range for extracting the constituent sentences of the summary in the target content, and which is at least partially different from the first range; , calculated from said first range,
A summary generation device configured to extract constituent sentences of the summary from the second range based on the index value.
請求項1に記載の要約生成装置。 2. The summary generation device according to claim 1, wherein said index value includes a value obtained based on words included in said first range.
請求項1又は2に記載の要約生成装置。 3. The summary generating apparatus according to claim 1, wherein the first range is a range after the reproduction interruption position and is an expected reproduction range of the target content determined from the reproduction interruption position.
前記第1の要約は、前記再生中断位置よりも後を含まない範囲を前記第2の範囲として生成される要約であり、
前記第2の要約は、前記再生中断位置よりも後を含む範囲を前記第2の範囲として生成される要約である
請求項1~3のいずれか一項に記載の要約生成装置。 the second range is determined by whether the summary is a first summary or a second summary;
The first summary is a summary generated with a range that does not include after the reproduction interruption position as the second range,
The summary generation device according to any one of claims 1 to 3, wherein the second summary is a summary generated with a range including after the reproduction interruption position as the second range.
前記指標値は、前記第2の範囲に含まれる文と前記部分集合との類似度を含む
請求項1~4のいずれか一項に記載の要約生成装置。 Extracting the constituent sentences of the summary includes sequentially extracting a plurality of sentences included in the constituent sentences from the second range based on the index value, thereby obtaining a portion having the sequentially extracted sentences. generating a set;
5. The summary generation device according to any one of claims 1 to 4, wherein said index value includes a degree of similarity between sentences included in said second range and said subset.
請求項5に記載の要約生成装置。 6. The summary generation device according to claim 5, wherein said subset includes sentences extracted from a summary prepared in advance for said target content.
前記対象コンテンツに基づいて参照用コンテンツを選択するよう構成されており、
前記第2の範囲から前記要約の構成文を抽出することは、
前記参照用コンテンツに対応付けられた抽出用データを参照して、前記第2の範囲から前記要約の前記構成文を抽出することを含む
請求項1~6のいずれか一項に記載の要約生成装置。 The processor further
configured to select reference content based on the target content;
Extracting constituent sentences of the summary from the second range includes:
7. The summary generation according to any one of claims 1 to 6, comprising extracting the constituent sentences of the summary from the second range by referring to extraction data associated with the reference content. Device.
前記対象コンテンツの再生中断位置から前記対象コンテンツにおける第1の範囲を決定し、
前記対象コンテンツにおける前記要約の構成文を抽出する範囲であって、前記第1の範囲とは少なくとも一部が異なる第2の範囲に含まれる文の指標値を、前記第1の範囲から算出し、
前記指標値に基づいて前記第2の範囲から前記要約の構成文を抽出する、ことを含む
要約生成方法。 A summary generation method for generating a summary of target content, comprising:
determining a first range in the target content from a playback interruption position of the target content;
calculating, from the first range, an index value of a sentence contained in a second range, which is a range from which the constituent sentences of the summary in the target content are extracted and which is at least partially different from the first range; ,
extracting constituent sentences of the summary from the second range based on the index value.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021031239A JP2022131963A (en) | 2021-02-26 | 2021-02-26 | Summary generation device and summary generation method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021031239A JP2022131963A (en) | 2021-02-26 | 2021-02-26 | Summary generation device and summary generation method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022131963A true JP2022131963A (en) | 2022-09-07 |
Family
ID=83153004
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021031239A Pending JP2022131963A (en) | 2021-02-26 | 2021-02-26 | Summary generation device and summary generation method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2022131963A (en) |
-
2021
- 2021-02-26 JP JP2021031239A patent/JP2022131963A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10971121B2 (en) | Systems and methods for transforming digital audio content into visual topic-based segments | |
US11264006B2 (en) | Voice synthesis method, device and apparatus, as well as non-volatile storage medium | |
US20110222788A1 (en) | Information processing device, information processing method, and program | |
TWI474200B (en) | Scene clip playback system, method and recording medium | |
US20130246063A1 (en) | System and Methods for Providing Animated Video Content with a Spoken Language Segment | |
US20220208155A1 (en) | Systems and methods for transforming digital audio content | |
CN105488094A (en) | Voice searching metadata through media content | |
KR20150135544A (en) | Video Recommendation based on Video Co-occurrence Statistics | |
JP5706718B2 (en) | Movie synthesis system and method, movie synthesis program and storage medium thereof | |
US11995123B2 (en) | Generating verified content profiles for user generated content | |
CN112507163A (en) | Duration prediction model training method, recommendation method, device, equipment and medium | |
US20240087547A1 (en) | Systems and methods for transforming digital audio content | |
Ramon et al. | Sports coverage on BBC ALBA: Content, value, and position in the Scottish broadcasting landscape | |
JP2003084783A (en) | Method, device, and program for playing music data and recording medium with music data playing program recorded thereon | |
JP2019008779A (en) | Text extraction apparatus, comment posting apparatus, comment posting support apparatus, reproduction terminal, and context vector calculation apparatus | |
KR102570134B1 (en) | Method for generating short-form clip and system thereof | |
JP2022131963A (en) | Summary generation device and summary generation method | |
US11386163B2 (en) | Data search method and data search system thereof for generating and comparing strings | |
JP5499566B2 (en) | Movie playback device, movie playback method and program | |
WO2022163023A1 (en) | Content correction device, content delivery server, content correction method, and recording medium | |
CA3208553A1 (en) | Systems and methods for transforming digital audio content | |
JP6900334B2 (en) | Video output device, video output method and video output program | |
KR102566303B1 (en) | Method for arranging content according to user's preference and system thereof | |
CN112233647A (en) | Information processing apparatus and method, and computer-readable storage medium | |
CN109672942A (en) | Subtitle adjusting method and device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A80 Effective date: 20210312 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240216 |