JP2014203383A - Relay section extraction device, and program - Google Patents

Relay section extraction device, and program Download PDF

Info

Publication number
JP2014203383A
JP2014203383A JP2013081206A JP2013081206A JP2014203383A JP 2014203383 A JP2014203383 A JP 2014203383A JP 2013081206 A JP2013081206 A JP 2013081206A JP 2013081206 A JP2013081206 A JP 2013081206A JP 2014203383 A JP2014203383 A JP 2014203383A
Authority
JP
Japan
Prior art keywords
relay
sentence
comment
location
relay section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013081206A
Other languages
Japanese (ja)
Other versions
JP6069077B2 (en
Inventor
山田 一郎
Ichiro Yamada
一郎 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP2013081206A priority Critical patent/JP6069077B2/en
Publication of JP2014203383A publication Critical patent/JP2014203383A/en
Application granted granted Critical
Publication of JP6069077B2 publication Critical patent/JP6069077B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

PROBLEM TO BE SOLVED: To extract relay sections contained in a program.SOLUTION: A location identification unit 11 of a relay section extraction device 1 extracts expressions related to a location from respective sentences represented by text data associated with video data of a news program and identifies the location from the extracted expressions. A sentence classification unit 12 determines whether or not the respective sentences represented by the text data are comments related to a relay. On the basis of types of respective comments of two different sentences that have been determined as comments using expressions related to the relay by the sentence classification unit 12 and a difference between locations of the two different sentences that the location identification unit 11 has identified, a relay section extraction unit 15 extracts sections in the video data corresponding to the two different sentences, as the relay sections.

Description

本発明は、中継区間抽出装置、及びプログラムに関する。   The present invention relates to a relay section extraction device and a program.

従来、サッカー中継などのシーンを分類する技術として、サッカー中継のアナウンスコメントを試合記述文と解説文の2種類に分類し、試合記述文のまとまりを一つの意味のある区間として抽出する手法や、番組中の特徴的な表現が使われる区間を抽出する手法が提案されている(例えば、非特許文献1、非特許文献2参照。)。   Conventionally, as a technique to classify scenes such as soccer broadcasts, a method of classifying soccer broadcast announcement comments into two types of game description and commentary, and extracting a set of match description sentences as one meaningful section, A method for extracting a section in which a characteristic expression in a program is used has been proposed (see, for example, Non-Patent Document 1 and Non-Patent Document 2).

山田一郎、佐野雅規、住吉英樹、柴田正啓、八木伸行、「アナウンサーと解説者のコメントを利用したサッカー番組セグメントメタデータ自動生成」、電子情報通信学会論文誌D,Vol.J89-D,No.10、2006年、p.2328−2337Ichiro Yamada, Masanori Sano, Hideki Sumiyoshi, Masahiro Shibata, Nobuyuki Yagi, “Automatic Generation of Soccer Program Segment Metadata Using Comments of Announcer and Commentator”, IEICE Transactions D, Vol. J89-D, No. 10, 2006, p.2328-2337 山田一郎、三浦菊佳、河合吉彦、住吉英樹、八木伸行、奥村学、徳永健伸,「大域的な文章構造の類似性を利用したクローズドキャプション中の定型的な文章区間の抽出」、電子情報通信学会論文誌D,Vol.J90-D,No.9、2007年、p.2624−2633Ichiro Yamada, Kikuka Miura, Yoshihiko Kawai, Hideki Sumiyoshi, Nobuyuki Yagi, Manabu Okumura, Kennobu Tokunaga, “Extraction of typical sentence sections in closed captions using similarity in global sentence structure”, electronic information communication Academic Journal D, Vol. J90-D, No. 9, 2007, p. 2624-2633

サッカー中継の場合、イベントが発生している区間のアナウンスコメントは類似した傾向を持つ。しかし、ニュース番組の場合、中継区間のコメントに使われる語彙の種類数などが多く、全てが類似している訳ではない。そのため、番組中で特徴的な表現が使われる区間を抽出する従来手法を適用しても、ニュース番組など様々なトピックを伝える番組から中継区間を抽出することは難しい。   In the case of soccer broadcast, the announcement comments in the section where the event occurs have a similar tendency. However, in the case of news programs, the number of vocabulary types used for comments in the relay section is large, and not all are similar. Therefore, it is difficult to extract a relay section from a program that conveys various topics, such as a news program, even if a conventional method for extracting a section in which a characteristic expression is used in the program is applied.

本発明は、このような事情を考慮してなされたもので、番組に含まれる中継区間を抽出することができる中継区間抽出装置、及びプログラムを提供する。   The present invention has been made in consideration of such circumstances, and provides a relay section extraction apparatus and program that can extract a relay section included in a program.

[1] 本発明の一態様は、番組の映像データと対応付けられたテキストデータにより示される各文から場所に関する語句を抽出し、抽出した前記語句から場所を特定する場所特定部と、前記テキストデータにより示される各文が中継に関する表現を使用したコメントであるか否かを判定する文分類部と、前記文分類部により中継に関する表現を使用したコメントであると判定された異なる2つの文それぞれの前記コメントの種類と、前記異なる2つの文それぞれについて前記場所特定部が特定した場所が相違するか否かとに基づいて、前記異なる2つの文に対応した前記映像データの区間を中継区間として抽出する中継区間抽出部と、を備えることを特徴とする中継区間抽出装置である。
この発明によれば、中継区間抽出装置は、番組の映像データと対応付けられたテキストデータにより示される各文について場所を特定するとともに、中継に関する表現を使用したコメントであるか否かを判定する。中継区間抽出装置は、中継に関する表現を使用したコメントであると判定された2つの文それぞれのコメントの種類と、それらの文について特定された場所が相違するか否かとに基づいて、映像データの中継区間を抽出する。
これにより、中継区間抽出装置は、ニュース番組の字幕放送などを利用して、ニュース番組の映像中に含まれる中継区間のシーンを抽出することができる。
[1] According to one aspect of the present invention, a place specifying unit that extracts a phrase related to a place from each sentence indicated by text data associated with video data of a program and specifies the place from the extracted phrase, the text A sentence classification unit that determines whether each sentence indicated by the data is a comment that uses an expression related to relay, and two different sentences that are determined to be comments that use an expression related to relay by the sentence classification part The section of the video data corresponding to the two different sentences is extracted as a relay section based on the type of the comment and whether the place specified by the place specifying unit is different for each of the two different sentences. And a relay section extraction unit.
According to this invention, the relay section extraction device specifies a location for each sentence indicated by the text data associated with the video data of the program, and determines whether or not the comment is a comment using an expression related to relay. . The relay section extraction device determines whether the video data is based on the type of comment for each of the two sentences determined to be comments using expressions related to the relay and whether or not the locations specified for the sentences are different. Extract relay section.
Thereby, the relay section extraction device can extract the scene of the relay section included in the video of the news program by using the caption broadcast of the news program.

[2] 本発明の一態様は、上述する中継区間抽出装置であって、前記文分類部は、前記テキストデータにより示される各文が中継の入りコメントであるか否か、中継の振りコメントであるか否か、及び、中継の締めコメントであるか否かを判定し、前記中継区間抽出部は、中継の締めコメントであると判定された文について前記場所特定部が特定した場所と、前記テキストデータにおいて当該文より前に出現し、かつ、中継の振りコメントであると判定された他の文について前記場所特定部が特定した場所とに相違がない場合、あるいは、前記テキストデータにおいて中継の締めコメントであると判定された文より前に中継の入りコメントであると判定された文が出現する場合、中継の振りコメントまたは中継の入りコメントであると判定された前記他の文から中継の締めコメントであると判定された前記文までに対応した前記映像データの区間を現地のレポーターによる中継区間としてする、ことを特徴とする。
この発明によれば、中継区間抽出装置は、中継の締めコメントと判定された文について特定された場所と、当該文より前に出現し、中継の振りコメントと判定された他の文について特定された場所とに相違がない場合、これらの文に対応した映像データの区間を現地のレポーターによる中継区間として抽出する。また、中継区間抽出装置は、中継の締めコメントであると判定された文より前に中継の入りコメントであると判定された文が出現する場合、これらの文に対応した映像データの区間を現地のレポーターによる中継区間として抽出する。
これにより、中継区間抽出装置は、ニュース番組の字幕放送データなどを利用して、ニュース番組中の現地のレポーターによる中継区間を抽出することができる。
[2] One aspect of the present invention is the above-described relay section extraction device, wherein the sentence classification unit determines whether each sentence indicated by the text data is a relay entry comment or not. It is determined whether or not there is a relay closing comment, the relay section extraction unit, the location specified by the location specifying unit for the sentence determined to be a relay closing comment, and If there is no difference in the location specified by the location specifying unit for other sentences that appear before the sentence in the text data and are determined to be relay comments, or in the text data If a sentence determined to be a relayed comment appears before a sentence determined to be a closing comment, it is determined to be a relayed comment or a relayed comment. The section of the video data corresponding to the sentence determined to be a relay closing comment from the other sentence is used as a relay section by a local reporter.
According to the present invention, the relay section extraction device is specified for the location specified for the sentence determined as the relay closing comment, and the other sentence that appears before the sentence and is determined as the relay comment. If there is no difference in location, video data sections corresponding to these sentences are extracted as relay sections by local reporters. In addition, when a sentence that is determined to be a relay comment appears before a sentence that is determined to be a relay closing comment, the relay section extraction device sets a section of video data corresponding to these sentences to the local This is extracted as a relay section by the reporter.
Thereby, the relay section extraction device can extract the relay section by the local reporter in the news program using the subtitle broadcast data of the news program.

[3] 本発明の一態様は、上述する中継区間抽出装置であって、前記文分類部は、前記テキストデータにより示される各文が中継の場所を伝えるコメントであるか否かをさらに判定し、前記中継区間抽出部は、中継の振りコメントであると判定された文について前記場所特定部が特定した場所と、前記テキストデータにおいて当該文より後に出現し、かつ、場所を伝えるコメントであると判定された他の文について前記場所特定部が特定した場所とに相違がない場合、中継の振りコメントであると判定された前記文から場所を伝えるコメントであると判定された前記他の文までに対応した前記映像データの区間を現地のレポーターによる中継区間として抽出する、ことを特徴とする。
この発明によれば、中継区間抽出装置は、中継の振りコメントと判定された文について特定された場所と、当該文より後に出現し、場所を伝えるコメントと判定された他の文について特定された場所とに相違がない場合、これらの文に対応した映像データの区間を現地のレポーターによる中継区間として抽出する。
これにより、中継区間抽出装置は、ニュース番組の字幕放送データなどを利用して、中継の締めコメントがない場合にも、ニュース番組中の現地のレポーターによる中継区間を抽出することができる。
[3] One aspect of the present invention is the relay section extraction device described above, wherein the sentence classification unit further determines whether each sentence indicated by the text data is a comment that conveys a relay location. The relay section extraction unit is a comment that tells the place that the place specifying unit has specified for the sentence determined to be a relay swing comment, and that appears after the sentence in the text data and that tells the place If there is no difference between the place specified by the place specifying unit for the other sentence determined, from the sentence determined to be a relay swing comment to the other sentence determined to be a comment conveying the place The section of the video data corresponding to is extracted as a relay section by a local reporter.
According to this invention, the relay section extraction device is specified for a place specified for a sentence determined as a relay swing comment, and for another sentence that appears after the sentence and is determined as a comment that conveys the place. If there is no difference in location, video data sections corresponding to these sentences are extracted as relay sections by local reporters.
Thereby, the relay section extraction device can extract the relay section by the local reporter in the news program even when there is no relay closing comment using the caption broadcast data of the news program.

[4] 本発明の一態様は、上述する中継区間抽出装置であって、前記文分類部は、前記テキストデータにより示される各文が中継の場所を伝えるコメントであるか否か、及び、中継の映像を説明するコメントであるか否かを判定し、前記中継区間抽出部は、中継の場所を伝えるコメントであると判定された文について前記場所特定部が特定した場所と、前記テキストデータにおいて当該文より後に出現し、かつ、中継の場所を伝えるコメントあるいは中継の映像を説明するコメントであると判定された他の文について前記場所特定部が特定した場所とに相違がない場合、場所を伝えるコメントであると判定された前記文と、中継の場所を伝えるコメントあるいは中継の映像を説明するコメントであると判定された前記他の文までに対応した前記映像データの区間をレポーターが現地に不在の中継区間として抽出する、ことを特徴とする。
この発明によれば、中継区間抽出装置は、中継の場所を伝えるコメントであると判定された文について特定された場所と、当該文より後に出現し、中継の場所を伝えるコメントあるいは中継の映像を説明するコメントと判定された他の文について特定された場所とに相違がない場合、これらの文に対応した映像データの区間をレポーターが現地に不在の中継区間として抽出する。
これにより、中継区間抽出装置は、ニュース番組の字幕放送データなどを利用して、ニュース番組中のレポーターが現地に不在の中継区間を抽出することができる。
[4] One aspect of the present invention is the relay section extraction device described above, wherein the sentence classification unit determines whether each sentence indicated by the text data is a comment that conveys a relay location, and relays. Whether or not the comment is a comment explaining the video, and the relay section extraction unit includes the location specified by the location specifying unit for the sentence determined to be a comment conveying the location of the relay, and the text data If there is no difference between the place specified by the place specifying unit with respect to another sentence that appears after the sentence and is determined to be a comment that conveys the location of the relay or a comment that describes the video of the relay, Before the sentence determined to be a comment to be communicated, and the other sentence determined to be a comment that conveys the location of the relay or a comment that describes the video of the relay A section of the video data is extracted as a relay section where the reporter is absent from the site.
According to the present invention, the relay section extracting device displays a place specified for a sentence that is determined to be a comment that tells a relay location, and a comment or a relay video that appears after the sentence and tells the relay location. If there is no difference between the comment to be explained and the locations specified for the other sentences determined to be, the reporter extracts sections of the video data corresponding to these sentences as relay sections that are not present in the field.
Thereby, the relay section extraction device can extract the relay section where the reporter in the news program is absent from the site by using the caption broadcast data of the news program.

[5] 本発明の一態様は、上述する中継区間抽出装置であって、前記中継区間抽出部は、中継の映像を説明するコメントであると判定された異なる2つの文のそれぞれについて前記場所特定部が特定した場所に相違がない場合、前記異なる2つの文に対応した前記映像データの区間をレポーターが現地に不在の中継区間として抽出する、ことを特徴とする。
この発明によれば、中継区間抽出装置は、中継の映像を説明するコメントと判定された2つの文それぞれについて特定された場所に相違がない場合、これらの文に対応した映像データの区間をレポーターが現地に不在の中継区間として抽出する。
これにより、中継区間抽出装置は、ニュース番組の字幕放送データなどを利用して、場所を特定するコメントがない場合にも、ニュース番組中のレポーターが現地に不在の中継区間を抽出することができる。
[5] One aspect of the present invention is the above-described relay section extraction device, wherein the relay section extraction unit specifies the location for each of two different sentences that are determined to be comments describing a video of relay. If there is no difference in the location specified by the section, the section of the video data corresponding to the two different sentences is extracted as a relay section that is absent from the site.
According to the present invention, when there is no difference in the location specified for each of two sentences determined to be comments explaining the video of the relay, the relay section extraction device selects the section of the video data corresponding to these sentences as the reporter. Is extracted as a relay section that is absent from the site.
As a result, the relay section extraction device can extract the relay section where the reporter in the news program is absent from the site even when there is no comment specifying the location, using the caption broadcast data of the news program. .

[6] 本発明の一態様は、上述する中継区間抽出装置であって、前記中継区間抽出部により抽出された前記中継区間に対応した前記テキストデータにおける文に空撮を表す語句が含まれている場合、前記中継区間を空撮による中継区間であると判定する空撮中継区間抽出部をさらに備える、ことを特徴とする。
この発明によれば、中継区間抽出装置は、中継区間抽出部により抽出された中継区間のテキストデータが示す文に基づいて、当該中継区間が空撮による中継区間であるかを判定する。
これにより、中継区間抽出装置は、番組中の現地レポーターによる中継区間やレポーターが現地に不在の中継区間の中から空撮による中継区間を抽出することができる。
[6] One aspect of the present invention is the above-described relay section extraction device, wherein a sentence in the text data corresponding to the relay section extracted by the relay section extraction unit includes a phrase representing aerial photography. A relay section extracting unit that determines that the relay section is a relay section by aerial photography.
According to this invention, the relay section extraction device determines whether the relay section is a relay section by aerial photography based on the sentence indicated by the text data of the relay section extracted by the relay section extraction unit.
Thereby, the relay section extraction device can extract the relay section by the aerial shooting from the relay section by the local reporter in the program and the relay section by which the reporter is absent from the site.

[7] 本発明の一態様は、中継区間抽出装置として用いられるコンピュータを、番組の映像データと対応付けられたテキストデータにより示される各文から場所に関する語句を抽出し、抽出した前記語句から場所を特定する場所特定部、前記テキストデータにより示される各文が中継に関する表現を使用したコメントであるか否かを判定する文分類部、前記文分類部により中継に関する表現を使用したコメントであると判定された異なる2つの文それぞれの前記コメントの種類と、前記異なる2つの文それぞれについて前記場所特定部が特定した場所が相違するか否かとに基づいて、前記異なる2つの文に対応した前記映像データの区間を中継区間として抽出する中継区間抽出部、として機能させるためのプログラムである。 [7] According to one aspect of the present invention, a computer used as a relay section extracting device extracts a phrase related to a place from each sentence indicated by text data associated with video data of a program, and a place from the extracted phrase A location identifying unit that identifies a sentence, a sentence classification unit that determines whether each sentence indicated by the text data is a comment that uses an expression related to relay, and a comment that uses an expression related to relay by the sentence classification unit The video corresponding to the two different sentences based on the type of the comment for each of the two different sentences determined and whether the location specified by the place specifying unit is different for each of the two different sentences. This is a program for causing a data section to function as a relay section extracting unit that extracts a section as a relay section.

本発明によれば、番組に含まれる中継区間を抽出することができる。   According to the present invention, a relay section included in a program can be extracted.

本発明の一実施形態における中継区間抽出装置の構成を示す機能ブロック図である。It is a functional block diagram which shows the structure of the relay area extraction apparatus in one Embodiment of this invention. 同実施形態のニューステキストの例を示す図である。It is a figure which shows the example of the news text of the embodiment. 同実施形態の文解析データの例を示す図である。It is a figure which shows the example of the sentence analysis data of the embodiment. 同実施形態の中継区間データの例を示す図である。It is a figure which shows the example of the relay area data of the embodiment. 同実施形態の中継区間抽出装置による中継区間抽出処理のフローチャートを示す図である。It is a figure which shows the flowchart of the relay area extraction process by the relay area extraction apparatus of the embodiment. 同実施形態の場所特定部による場所特定処理のフローチャートを示す図である。It is a figure which shows the flowchart of the place specific process by the place specific part of the embodiment. 同実施形態の第一文分類部による第一文分類処理のフローチャートを示す図である。It is a figure which shows the flowchart of the 1st sentence classification | category process by the 1st sentence classification | category part of the embodiment. 同実施形態の第二文分類部による第二文分類処理のフローチャートを示す図である。It is a figure which shows the flowchart of the 2nd sentence classification | category process by the 2nd sentence classification | category part of the embodiment. 同実施形態の現地レポーター中継区間抽出部による現地レポーター中継区間抽出処理のフローチャートを示す図である。It is a figure which shows the flowchart of the local reporter relay area extraction process by the local reporter relay area extraction part of the embodiment. 同実施形態のレポーター不在中継区間抽出部によるレポーター不在中継区間抽出処理のフローチャートを示す図である。It is a figure which shows the flowchart of the reporter absence relay area extraction process by the reporter absence relay area extraction part of the embodiment.

以下、図面を参照しながら本発明の実施形態を詳細に説明する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

[概要]
テレビ等で放送されるニュース番組には、スタジオでアナウンサーが説明するシーン以外に、レポーターが中継現場である現地から説明する中継、レポーターが現地に不在の中継、ヘリコプター等からの空撮による中継などのシーンが含まれる。レポーターが現地に不在の中継には、人がカメラで撮影する中継のほか、ロボットカメラにより撮影する中継などがある。本実施形態では、ニュース番組に付随する字幕放送などのテキストデータを利用して、ニュース番組の中からこれらの中継のシーンの抽出及び分類を行う。これにより、ニュース番組がどの場所からどのような形態で報道されたかという情報を取得することができる。
[Overview]
For news programs broadcast on TV, etc., in addition to the scene explained by the announcer in the studio, the reporter explains from the site where it is relayed, the reporter is absent from the site, the relay by aerial photography from a helicopter, etc. Scenes are included. There are relays where the reporter is absent from the site, such as relays where people take pictures with a camera, as well as relays where they take pictures with a robot camera. In the present embodiment, the relay scenes are extracted and classified from the news program by using text data such as caption broadcasting accompanying the news program. As a result, it is possible to acquire information as to which news program was reported from which location and in what form.

[中継区間抽出装置の構成]
図1は、本発明の一実施形態による中継区間抽出装置1の構成を示す機能ブロック図である。中継区間抽出装置1は、例えば、1台または複数台のコンピュータ装置により実現され、同図に示すように、記憶部10、場所特定部11、文分類部12、中継区間抽出部15、及びノイズ除去部19を備えて構成される。中継区間抽出装置1には、ニューステキストが入力される。ニューステキストとは、ニュース番組の映像(動画)データに対応付けられたテキストデータであり、ニュース番組に付随する字幕放送でもよく、ニュース番組の音声を音声認識した結果であってもよい。なお、ニュース番組には1つのトピック(ニュース項目)のみが含まれていてもよく、複数のトピックが含まれていてもよい。
[Configuration of Relay Section Extraction Device]
FIG. 1 is a functional block diagram showing a configuration of a relay section extraction device 1 according to an embodiment of the present invention. The relay section extraction device 1 is realized by, for example, one or a plurality of computer devices. As shown in the figure, the storage section 10, the location identification section 11, the sentence classification section 12, the relay section extraction section 15, and noise A removal unit 19 is provided. News text is input to the relay section extraction device 1. The news text is text data associated with the video (moving image) data of the news program, and may be subtitle broadcast accompanying the news program or may be a result of voice recognition of the news program. Note that the news program may include only one topic (news item) or may include a plurality of topics.

記憶部10は、ニューステキスト、文解析データ、中継区間データなどの各種データを記憶する。文解析データは、ニューステキストにより示される各文の文解析結果を示す。中継区間データは、中継の形態、番組における中継区間の開始位置及び終了位置、中継の場所を示す。中継の形態には、現地からレポーターが説明する中継(以下、「現地レポーター中継」と記載する。)、レポーターが現地に不在の中継(以下、「レポーター不在中継」と記載する。)、空撮による中継(以下、「空撮中継」と記載する。)がある。   The storage unit 10 stores various data such as news text, sentence analysis data, and relay section data. The sentence analysis data indicates the sentence analysis result of each sentence indicated by the news text. The relay section data indicates the form of relay, the start position and end position of the relay section in the program, and the relay location. As for the form of the relay, the relay explained by the reporter from the field (hereinafter referred to as “local reporter relay”), the relay where the reporter is not present in the field (hereinafter referred to as “reporter absent relay”), aerial photography (Hereinafter referred to as “aerial shooting relay”).

場所特定部11は、ニューステキストにより示される各文から場所に関する語句を抽出し、抽出した語句から場所を特定する。本実施形態では、場所特定部11は、場所に関する語句である地名やランドマーク名から、場所を特定する情報として市区町村名などの場所名を取得する。なお、場所を特定する情報として、市区町村を特定するコードなどを用いてもよい。場所特定部11は、各文について得られた場所名を示す文解析データを記憶部10に書き込む。   The location specifying unit 11 extracts a phrase related to the location from each sentence indicated by the news text, and specifies the location from the extracted phrase. In the present embodiment, the place specifying unit 11 acquires a place name such as a city name as information specifying the place from a place name or a landmark name that is a word related to the place. In addition, you may use the code | cord | chord etc. which specify a municipality as information which specifies a place. The place identifying unit 11 writes sentence analysis data indicating the place name obtained for each sentence in the storage unit 10.

文分類部12は、第一文分類部13及び第二文分類部14を備え、ニューステキストにより示される各文が中継に関する表現を使用したコメントであるか否かを判定し、判別結果を記憶部10が記憶する文解析データに書き込む。第一文分類部13は、ニューステキストにより示される各文が、場所を特定する表現を使用したコメントであるか否か、映像を説明する表現を使用したコメントであるか否かを判定する。第二文分類部14は、ニューステキストにより示される各文が、現地からの中継の振りコメントであるか否か、現地からの中継の入りコメントであるか否か、現地からの中継の締めコメントであるか否かを判定する。   The sentence classification unit 12 includes a first sentence classification unit 13 and a second sentence classification unit 14, determines whether each sentence indicated by the news text is a comment using an expression related to relay, and stores the determination result Write to the sentence analysis data stored in the unit 10. The first sentence classification unit 13 determines whether each sentence indicated by the news text is a comment using an expression for specifying a place, or a comment using an expression for explaining a video. The second sentence classifying unit 14 determines whether each sentence indicated by the news text is a relay comment from a local relay, whether it is a comment from a relay from the local, It is determined whether or not.

中継区間抽出部15は、中継に関する表現を使用したコメントであると判定された2つの文それぞれのコメントの種類と、それらの2つの文それぞれについて特定された場所が相違するか否かとに基づいて、中継区間を抽出する。中継区間抽出部15は、抽出した中継区間の中継の形態、開始位置及び終了位置、ならびに中継の場所を設定した中継区間データを記憶部10に書き込む。中継区間抽出部15は、現地レポーター中継区間抽出部16、レポーター不在中継区間抽出部17、及び空撮中継区間抽出部18を備える。現地レポーター中継区間抽出部16は、第一文分類部13及び第二文分類部14による判別結果と、場所特定部11により特定された場所とに基づいて、現地レポーター中継区間と中継の場所を抽出する。レポーター不在中継区間抽出部17は、現地レポーター中継区間抽出部16による抽出結果と、第一文分類部13による判別結果と、場所特定部11により特定された場所とに基づいて、レポーター不在中継区間と中継の場所を抽出する。空撮中継区間抽出部18は、現地レポーター中継区間抽出部16により抽出された現地レポーター中継区間と、レポーター不在中継区間抽出部17により抽出されたレポーター不在中継区間とから、空撮中継区間を抽出する。ノイズ除去部19は、現地レポーター中継区間抽出部16が抽出した現地レポーター中継区間、レポーター不在中継区間抽出部17が抽出したレポーター不在中継区間、空撮中継区間抽出部18が抽出した空撮中継区間の中から、実際は中継区間ではないノイズを除外する。   The relay section extraction unit 15 is based on the type of comment for each of the two sentences determined to be comments using expressions related to the relay, and whether or not the location specified for each of the two sentences is different. Then, the relay section is extracted. The relay section extraction unit 15 writes the relay section data in which the relay form, start position and end position, and relay location of the extracted relay section are set in the storage unit 10. The relay section extraction unit 15 includes a local reporter relay section extraction unit 16, a reporter absent relay section extraction unit 17, and an aerial shooting relay section extraction unit 18. The local reporter relay section extraction unit 16 determines the local reporter relay section and the relay location based on the determination result by the first sentence classification unit 13 and the second sentence classification unit 14 and the place specified by the place specifying unit 11. Extract. The reporter absent relay section extraction unit 17 is based on the extraction result by the local reporter relay section extraction unit 16, the determination result by the first sentence classification unit 13, and the location specified by the place specifying unit 11. And the location of the relay. The aerial shooting relay section extraction unit 18 extracts the aerial shooting relay section from the local reporter relay section extracted by the local reporter relay section extraction unit 16 and the reporter absence relay section extracted by the reporter absence relay section extraction unit 17. To do. The noise removal unit 19 includes a local reporter relay segment extracted by the local reporter relay segment extraction unit 16, a reporter absent relay segment extracted by the reporter absent relay segment extraction unit 17, and an aerial relay segment extracted by the aerial broadcast segment extraction unit 18. The noise that is not actually a relay section is excluded from the list.

図2は、ニューステキストの例を示す図である。同図に示すように、ニューステキストは、ニュース番組の映像データに対応した文を示すテキストデータであり、映像データとの対応付けを示す同期データが付加される。同期データは、例えば、映像データの先頭からの再生時刻により示される。   FIG. 2 is a diagram illustrating an example of news text. As shown in the figure, news text is text data indicating a sentence corresponding to video data of a news program, and synchronization data indicating association with video data is added. The synchronization data is indicated by, for example, the reproduction time from the beginning of the video data.

図3は、記憶部10に記憶される文解析データを示す図である。同図に示すように、文解析データを構成する各レコードは、文番号と、この文番号の文から特定された場所、及び、この文番号の文の種類を示す。文番号iは、ニューステキストにi番目に出現する文であることを示す。場所には、市区町村名が設定される。文の種類は、関数Kind1S(i)、及び関数Kind2S(i)の値によって表される。Kind1S(i)には、第一文分類部13による判別結果が設定され、Kind2S(i)には、第二文分類部14による判別結果が設定される。   FIG. 3 is a diagram showing sentence analysis data stored in the storage unit 10. As shown in the figure, each record constituting the sentence analysis data indicates a sentence number, a location specified from the sentence having the sentence number, and a kind of sentence having the sentence number. The sentence number i indicates the i-th sentence that appears in the news text. The city name is set in the place. The type of sentence is represented by the values of the function Kind1S (i) and the function Kind2S (i). The determination result by the first sentence classification unit 13 is set in Kind1S (i), and the determination result by the second sentence classification unit 14 is set in Kind2S (i).

図4は、記憶部10に記憶される中継区間データを示す図である。同図に示すように中継区間データを構成する各レコードは、中継の形態、中継区間の開始位置及び終了位置、ならびに、中継の場所を示す。中継の形態は、現地レポーター中継、レポーター不在中継、あるいは、空撮中継である。中継区間の開始位置及び終了位置は文番号により示され、開始位置の文番号に対応した同期データが示す再生時刻から終了位置の文番号に対応した同期データが示す再生時刻までが映像データにおける中継区間である。なお、中継区間の開始位置及び終了位置として、開始位置の文及び終了位置の文に対応した同期データが示す再生時刻を設定してもよい。   FIG. 4 is a diagram illustrating relay section data stored in the storage unit 10. As shown in the figure, each record constituting the relay section data indicates the form of relay, the start position and end position of the relay section, and the relay location. The form of the relay is a local reporter relay, a reporter absent relay, or an aerial shooting relay. The start position and end position of the relay section are indicated by sentence numbers, and the video data is relayed from the reproduction time indicated by the synchronization data corresponding to the sentence number at the start position to the reproduction time indicated by the synchronization data corresponding to the sentence number at the end position. It is a section. Note that the reproduction time indicated by the synchronization data corresponding to the sentence at the start position and the sentence at the end position may be set as the start position and end position of the relay section.

[中継区間抽出装置の動作]
続いて、中継区間抽出装置1の動作を説明する。
図5は、図1に示す中継区間抽出装置1による中継区間抽出処理の処理手順を示すフローチャートである。まず、中継区間抽出装置1に、ニュース番組に付随する字幕放送がニューステキストとして入力される。ニューステキストはn個(nは1以上の整数)の文を示し、ニューステキストが示すi番目(iは1以上n以下の整数)の文を文S(i)と記載する。記憶部10は、入力されたニューステキストを記憶する。
[Operation of relay section extractor]
Subsequently, the operation of the relay section extraction device 1 will be described.
FIG. 5 is a flowchart showing a processing procedure of relay section extraction processing by the relay section extraction apparatus 1 shown in FIG. First, a subtitle broadcast accompanying a news program is input to the relay section extracting device 1 as news text. The news text indicates n sentences (n is an integer of 1 or more), and the i-th sentence (i is an integer of 1 to n) indicated by the news text is referred to as a sentence S (i). The storage unit 10 stores the input news text.

<ステップS1−1:場所特定処理>
場所特定部11は、入力されたニューステキストにより示される各文から地名やランドマーク名を抽出し、市区町村名を特定する。この詳細な処理を、図6を用いて説明する。
<Step S1-1: Location Identification Process>
The place specifying unit 11 extracts a place name and a landmark name from each sentence indicated by the input news text, and specifies a city name. This detailed process will be described with reference to FIG.

図6は、場所特定部11による場所特定処理の処理手順を示すフローチャートであり、図5のステップS1−1の詳細な処理手順を示す。
まず場所特定部11は、処理対象の文を文頭とするため、iに1を代入する(ステップS2−1)。次に、場所特定部11は、処理対象となっているi番目の文S(i)から、地名とランドマーク名(ランドマークの名称や呼称)を抽出する(ステップS2−2)。この抽出処理には、例えば、既存の固有名抽出器(「http://code.google.com/p/cabocha/」に示すcabochaなど)を利用することができる。
FIG. 6 is a flowchart showing the processing procedure of the location specifying process by the location specifying unit 11, and shows the detailed processing procedure of step S1-1 in FIG.
First, the place identifying unit 11 substitutes 1 for i in order to set the sentence to be processed as a sentence head (step S2-1). Next, the place identifying unit 11 extracts a place name and a landmark name (landmark name or name) from the i-th sentence S (i) to be processed (step S2-2). For this extraction process, for example, an existing unique name extractor (such as cabocha shown in “http://code.google.com/p/cabocha/”) can be used.

続いて、場所特定部11は、ステップS2−2において抽出した地名やランドマーク名から市区町村を特定する(ステップS2−3)。市区町村を特定するために、例えば、記憶部10に予め、全国の地名やランドマーク名と対応付けて市区町村名を記憶させておく。場所特定部11は、ステップS2−2において抽出した地名やランドマーク名に対応付けられた市区町村名を記憶部10から読み出す。これにより、例えば、場所特定部11は、ステップS2−2において「気仙沼」という地名を抽出した場合、ステップS2−3において「気仙沼」は「宮城県気仙沼市」であると特定する。   Subsequently, the place specifying unit 11 specifies a municipality from the place name and landmark name extracted in step S2-2 (step S2-3). In order to specify the municipality, for example, the name of the municipality is stored in advance in the storage unit 10 in association with the place name or landmark name of the whole country. The location specifying unit 11 reads out the city name associated with the place name or landmark name extracted in step S2-2 from the storage unit 10. Thereby, for example, when the place identifying unit 11 extracts the place name “Kesennuma” in Step S2-2, “Kesennuma” is identified as “Kesennuma City, Miyagi Prefecture” in Step S2-3.

なお、ステップS2−2において抽出した地名やランドマーク名に対応した市区町村が複数存在する場合がある。この場合、場所特定部11は、それらを市区町村の候補としておく。場所特定部11は、文内の共起数を基準とした従来手法などを利用し、候補の中から市区町村を特定する。例えば、ステップS2−2において、「大船渡」という地名が抽出された場合、「岐阜県下呂市金山町大船渡」、「岩手県大船渡市大船渡町」、「新潟県燕市大船渡」の3つの市区町村が候補となる。場所特定部11は、現在の処理対象の文S(i)に地名が含まれている場合、3つの市区町村の候補の中からその地名との包含関係や共起頻度に応じて市区町村を特定する。例えば、場所特定部11は、現在の処理対象の文S(i)に「岩手県」という地名の単語があった場合、候補の中から「岩手県」が含まれる「岩手県大船渡市大船渡町」を市区町村として特定する。あるいは、例えば、場所特定部11は、現在の処理対象の文S(i)に「東北」という地名の単語があった場合、候補の中から「東北」との共起頻度が高い「岩手県」が含まれる「岩手県大船渡市大船渡町」を市区町村として特定する。このように、場所特定部11は、同じ文内に出現する地名を手掛かりとして、候補の中から一つの市区町村を特定する。なお、出現順が近い文同士は関連が高いことから、同じ文内に地名が含まれていない場合には、処理対象の文から所定範囲の前後の文に出現する地名を用いて、候補の中から市区町村を特定する。このとき、地名が出現する文のうち処理対象の文に最も近い文に出現する地名を利用して候補の中から市区町村を特定してもよく、所定範囲の前後の文に出現する地名のうち共起数が多い地名を利用して、候補の中から市区町村を特定してもよい。   Note that there may be a plurality of municipalities corresponding to the place names and landmark names extracted in step S2-2. In this case, the place specifying unit 11 sets them as candidates for municipalities. The location identifying unit 11 identifies a municipality from among candidates using a conventional method based on the number of co-occurrence in a sentence. For example, when the place name “Ofunato” is extracted in step S2-2, the three city areas of “Ofunato, Kanayama-cho, Gero-shi, Gifu”, “Ofunato-cho, Ofunato-shi, Iwate” and “Ofunato-cho, Sakai-shi, Niigata” Towns and villages are candidates. When the place name is included in the current sentence S (i) to be processed, the place specifying unit 11 selects a municipality according to the inclusion relation with the place name and the co-occurrence frequency from among the candidates for the three municipalities. Identify the town and village. For example, if the current processing target sentence S (i) has a word with a place name of “Iwate Prefecture”, the place identification unit 11 includes “Iwate Prefecture” from among the candidates. As a city. Or, for example, if the current processing target sentence S (i) has a word with a place name of “Tohoku”, the location identification unit 11 “Iwate Prefecture” has a high co-occurrence frequency with “Tohoku” among the candidates. "Ofunato-cho, Ofunato-shi, Iwate" is specified as a municipality. In this way, the place specifying unit 11 specifies one city from among the candidates using the place name appearing in the same sentence as a clue. Since sentences with similar appearance order are highly related, if the place name is not included in the same sentence, use the place names that appear in the sentences before and after the predetermined range from the sentence to be processed. Identify the city from the inside. At this time, a place name that appears in a sentence before and after a predetermined range may be identified from candidates using the place name that appears in the sentence closest to the sentence to be processed among the sentences in which the place name appears. Of these candidates, the city may be identified from the candidates using the place names with the largest number of co-occurrence.

また、ステップS2−2においてランドマーク名が抽出された場合、場所特定部11は、既存の地図検索サービスを利用して市区町村を特定するようにしてもよい。例えば、「お台場」などは住所では無く呼称である。場所特定部11は、ウェブ上で提供されている地図検索サービス(例えば、Google map APIなど)を使うことにより、抽出されたランドマーク名「お台場」の緯度経度情報を取得し、取得した緯度経度情報から市区町村が「東京都港区」であると特定する。緯度経度情報からの市区町村の特定には、再度、既存の地図検索サービス(例えば、Google map APIなど)を使って緯度経度情報から市区町村名を取得する方法や、記憶部10に予め登録しておいた全国の市区町村の緯度経度情報を検索する方法などを用いることができる。   Moreover, when the landmark name is extracted in step S2-2, the place specifying unit 11 may specify a city / town using an existing map search service. For example, “Odaiba” is a name rather than an address. The location specifying unit 11 acquires latitude / longitude information of the extracted landmark name “Odaiba” by using a map search service (for example, Google map API) provided on the web, and the acquired latitude The municipality is identified as “Minato-ku, Tokyo” from the longitude information. In order to identify the city from the latitude / longitude information, a method for acquiring the city / town name from the latitude / longitude information again using an existing map search service (for example, Google map API) or the storage unit 10 in advance. For example, a method of retrieving latitude and longitude information of registered municipalities in the whole country can be used.

場所特定部11は、文解析データがまだ生成されていない場合は、新たに文解析データを生成して記憶部10に登録する。場所特定部11は、文解析データに文番号iのレコードを追加し、場所の情報として市区町村名を書き込む。ただし、市区町村が特定されなかった場合、場所特定部11は、場所の情報をNULLのままとする。   If the sentence analysis data has not yet been generated, the location specifying unit 11 newly generates the sentence analysis data and registers it in the storage unit 10. The place specifying unit 11 adds a record of sentence number i to the sentence analysis data, and writes the city name as place information. However, when the municipality is not specified, the place specifying unit 11 keeps the place information as NULL.

場所特定部11は、iがnより小さいか否かを判定することにより、ニューステキストに含まれる全ての文が処理されたかを判別する(ステップS2−4)。場所特定部11は、iがnより小さく、まだ処理されていない文があると判定した場合(ステップS2−4:YES)、iに1を加算して処理対象の文を後ろに一つずらし(ステップS2−5)、ステップS2−2からの処理を繰り返す。そして、場所特定部11は、iがnに達し、ニューステキストが示す全ての文について処理を終了したと判定した場合(ステップS2−4:NO)、図5のステップS1−1の処理を終了する。   The location specifying unit 11 determines whether all sentences included in the news text have been processed by determining whether i is smaller than n (step S2-4). If the location identifying unit 11 determines that i is smaller than n and there is an unprocessed sentence (step S2-4: YES), 1 is added to i and the sentence to be processed is shifted backward by one. (Step S2-5), the processing from Step S2-2 is repeated. And the place specific | specification part 11 complete | finishes the process of step S1-1 of FIG. 5, when it determines with i having reached n and having completed the process about all the sentences which a news text shows (step S2-4: NO). To do.

<ステップS1−2:第一文分類処理>
図5のステップS1−2において、第一文分類部13は、ニューステキストにより示される各文が、場所を特定するコメントである否か、映像を説明するコメントである否かを判定する。この詳細な処理を、図7を用いて説明する。
<Step S1-2: First sentence classification process>
In step S1-2 of FIG. 5, the first sentence classification unit 13 determines whether each sentence indicated by the news text is a comment specifying a place or a comment explaining a video. This detailed process will be described with reference to FIG.

図7は、第一文分類部13による第一文分類処理の処理手順を示すフローチャートであり、図5のステップS1−2の詳細な処理手順を示す。
まず、第一文分類部13は、処理対象の文を文頭とするため、iに1を代入する(ステップS3−1)。次に、第一文分類部13は、処理対象となっているi番目の文S(i)が、場所を特定するコメントであるか否かを判定する(ステップS3−2)。場所を特定するコメントとは、映像について直接場所の情報を伝えるようなコメントであり、例えば、「現在の気仙沼の様子です。」、「県庁の映像です。」などである。そこで、場所を特定するコメントと場所を特定しないコメントとを学習データとして用意し、SVM(サポートベクターマシン)などの機械学習により、場所を特定するコメントの特徴を予め学習しておく。第一文分類部13は、この学習結果を利用して、文S(i)が、場所を特定するコメントであるか否かを判定する。特徴としては、文に出現する単語や、その係り受けなどの情報を利用することができる。例えば、「現在の気仙沼の様子です。」であれば、「現在」、「気仙沼」、「の」、「様子」、「です」などの単語や、「気仙沼」の「様子」などの係り受けに基づいて、場所を特定するコメントであると判定される。
FIG. 7 is a flowchart showing a processing procedure of the first sentence classification processing by the first sentence classification unit 13, and shows a detailed processing procedure of step S1-2 in FIG.
First, the first sentence classification unit 13 substitutes 1 for i in order to set a sentence to be processed as a sentence head (step S3-1). Next, the first sentence classification unit 13 determines whether or not the i-th sentence S (i) to be processed is a comment specifying a place (step S3-2). The comment specifying the location is a comment that directly conveys the location information about the video, such as “current Kesennuma” or “prefectural office video”. Therefore, a comment specifying the location and a comment not specifying the location are prepared as learning data, and the features of the comment specifying the location are learned in advance by machine learning such as SVM (support vector machine). The first sentence classification unit 13 uses this learning result to determine whether or not the sentence S (i) is a comment specifying a place. As features, information such as words appearing in sentences and their dependencies can be used. For example, if it is “current Kesennuma state”, it depends on words such as “present”, “Kesenuma”, “no”, “situation”, “is”, and “situation” of “Kesenuma”. Is determined to be a comment specifying a place.

第一文分類部13は、文S(i)が場所を特定するコメントであると判定した場合(ステップS3−2:YES)、文S(i)の種類を表す関数Kind1(S(i))に、「場所特定コメント」であることを示す値を設定する(ステップS3−3)。つまり、第一文分類部13は、文解析データの文番号iのレコードに含まれるKind1(S(i))に、「場所特定コメント」であることを示す値を書き込む。第一文分類部13は、Kind1(S(i))の値を設定した後、ステップS3−6の処理に進む。   When the first sentence classification unit 13 determines that the sentence S (i) is a comment specifying a place (step S3-2: YES), the function Kind1 (S (i)) indicating the type of the sentence S (i) ) Is set to a value indicating “location specific comment” (step S3-3). That is, the first sentence classification unit 13 writes a value indicating “location specific comment” in Kind1 (S (i)) included in the record of sentence number i of the sentence analysis data. The first sentence classification unit 13 sets the value of Kind1 (S (i)), and then proceeds to the process of step S3-6.

一方、文S(i)が場所を特定するコメントではないと判定した場合(ステップS3−2:NO)、第一文分類部13は、ステップS3−4の処理を行う。すなわち、第一文分類部13は、i番目の文S(i)が、映像を説明するコメントであるか否かを判定する(ステップS3−4)。映像を説明するコメントとは、映像中で発生している事象などについてのコメントであり、例えば、「今、岸壁の上には車が走っている様子も見えます。」、「画面の右隅にはプールが見えます。」などである。そこで、映像を説明するコメントと映像を説明しないコメントとを学習データとして用意し、SVMなどの機械学習により、映像を説明するコメントの特徴を予め学習しておく。第一文分類部13は、この学習結果を利用して、文S(i)が、映像を説明するコメントであるか否かを判定する。特徴としては、文に出現する単語や、その係り受けなどの情報を利用することができる。   On the other hand, when it is determined that the sentence S (i) is not a comment specifying the place (step S3-2: NO), the first sentence classification unit 13 performs the process of step S3-4. That is, the first sentence classification unit 13 determines whether or not the i-th sentence S (i) is a comment explaining the video (step S3-4). The comment explaining the image is a comment about the phenomenon that has occurred in the image. For example, “You can see the car running on the quay now.”, “The right corner of the screen Can see the pool. " Therefore, a comment explaining the video and a comment not explaining the video are prepared as learning data, and features of the comment explaining the video are learned in advance by machine learning such as SVM. The first sentence classification unit 13 uses this learning result to determine whether or not the sentence S (i) is a comment explaining the video. As features, information such as words appearing in sentences and their dependencies can be used.

第一文分類部13は、文S(i)が映像を説明するコメントであると判定した場合(ステップS3−4:YES)、文解析データの文番号iのレコードに含まれるKind1(S(i))に、「映像コメント」であることを示す値を設定する(ステップS3−5)。第一文分類部13は、Kind1(S(i))の値を設定した後、ステップS3−6に進む。
また、第一文分類部13は、文S(i)が映像を説明するコメントではないと判定した場合(ステップS3−4:NO)、ステップS3−6に進む。
When the first sentence classification unit 13 determines that the sentence S (i) is a comment explaining the video (step S3-4: YES), Kind1 (S ( In i)), a value indicating “video comment” is set (step S3-5). The first sentence classification unit 13 sets the value of Kind1 (S (i)), and then proceeds to step S3-6.
If the first sentence classification unit 13 determines that the sentence S (i) is not a comment explaining the video (step S3-4: NO), the first sentence classification unit 13 proceeds to step S3-6.

ステップS3−3またはステップS3−5の処理の後、あるいは、ステップS3−4の処理でNOと判定した場合、第一文分類部13は、iがnより小さいか否かを判定することにより、ニューステキストに含まれる全ての文が処理されたかを判別する(ステップS3−6)。第一文分類部13は、iがnより小さく、まだ処理されていない文があると判定した場合(ステップS3−6:YES)、iに1を加算して処理対象の文を後ろに一つずらし(ステップS3−7)、ステップS3−2からの処理を繰り返す。そして、第一文分類部13は、iがnに達し、ニューステキストが示す全ての文について処理を終了したと判定した場合(ステップS3−6:NO)、図5のステップS1−2の処理を終了する。   After the process of step S3-3 or step S3-5, or when it is determined NO in the process of step S3-4, the first sentence classification unit 13 determines whether i is smaller than n. Then, it is determined whether all sentences included in the news text have been processed (step S3-6). If the first sentence classification unit 13 determines that i is smaller than n and there is an unprocessed sentence (step S3-6: YES), 1 is added to i and the sentence to be processed is moved backward. Shift (step S3-7) and repeat the process from step S3-2. When the first sentence classification unit 13 determines that i has reached n and all the sentences indicated by the news text have been processed (step S3-6: NO), the process of step S1-2 in FIG. Exit.

<ステップS1−3:第二文分類処理>
図5のステップS1−3において、第二文分類部14は、ニューステキストにより示される各文が、現場中継の振りコメントであるか否か、現場中継の入りコメントであるか否か、現場中継の締めコメントであるか否かを判定する。この詳細な処理を、図8を用いて説明する。
<Step S1-3: Second sentence classification process>
In step S1-3 of FIG. 5, the second sentence classification unit 14 determines whether each sentence indicated by the news text is an on-the-job relay comment, whether it is an on-site relay comment, It is determined whether it is a closing comment. This detailed processing will be described with reference to FIG.

図8は、第二文分類部14による第二文分類処理の処理手順を示すフローチャートであり、図5のステップS1−3の詳細な処理を示す。
まず、第二文分類部14は、処理対象の文を文頭とするため、iに1を代入する(ステップS4−1)。次に、第二文分類部14は、処理対象となっているi番目の文S(i)が、現場からの中継の振りコメントであるか否かを判定する(ステップS4−2)。現場からの中継の振りコメントとは、ニュース番組で中継に入る際にスタジオのアナウンサーが発するコメントであり、例えば、「それではここで、岩手県の大船渡の避難所から中継でお伝えします。」、「それでは東京の新宿駅の南口から中継でお伝えします。」などである。そこで、現場からの中継の振りコメントとそうではないコメントとを学習データとして用意し、SVMなどの機械学習により、現場からの中継の振りコメントの特徴を予め学習しておく。第二文分類部14は、この学習結果を利用して、文S(i)が、現場からの中継の振りコメントであるか否かを判定する。特徴としては、文に出現する単語や、その係り受けなどの情報を利用することができる。
FIG. 8 is a flowchart showing the processing procedure of the second sentence classification process by the second sentence classification unit 14 and shows the detailed process of step S1-3 in FIG.
First, the second sentence classification unit 14 substitutes 1 for i in order to set the sentence to be processed as a sentence head (step S4-1). Next, the second sentence classification unit 14 determines whether or not the i-th sentence S (i) to be processed is a relay swing comment from the site (step S4-2). The comment on the broadcast from the site is a comment issued by the announcer of the studio when entering the broadcast on a news program, for example, “Now, I will relay it from the Ofunato refuge in Iwate Prefecture”, “Now, I will relay you from the south exit of Shinjuku Station in Tokyo.” Therefore, the relay comment from the site and the comment that is not so are prepared as learning data, and the features of the relay comment from the site are learned in advance by machine learning such as SVM. The second sentence classification unit 14 uses this learning result to determine whether the sentence S (i) is a relay swing comment from the site. As features, information such as words appearing in sentences and their dependencies can be used.

第二文分類部14は、文S(i)が現場からの中継の振りコメントであると判定した場合(ステップS4−2:YES)、文S(i)の種類を表す関数Kind2(S(i))に、「中継振りコメント」であることを示す値を設定する(ステップS4−3)。つまり、第二文分類部14は、文解析データの文番号iのレコードに含まれるKind2(S(i))に、「中継振りコメント」であることを示す値を書き込む。第二文分類部14は、Kind2(S(i))の値を設定した後、ステップS4−8に進む。   If the second sentence classification unit 14 determines that the sentence S (i) is a relay comment from the field (step S4-2: YES), the function Kind2 (S ( In i)), a value indicating “relaying comment” is set (step S4-3). That is, the second sentence classification unit 14 writes a value indicating “relaying comment” in Kind2 (S (i)) included in the record of sentence number i of the sentence analysis data. The second sentence classification unit 14 sets the value of Kind2 (S (i)), and then proceeds to step S4-8.

一方、第二文分類部14は、文S(i)が現場からの中継の振りコメントではないと判定した場合(ステップS4−2:NO)、処理対象となっているi番目の文S(i)が現場からの中継の入りコメントであるか否かを判定する(ステップS4−4)。現場からの中継の入りコメントとは、ニュース番組で中継に入る際に現地のアナウンサーや記者が最初に発するコメントであり、例えば、「岩手県沿岸高台にある大船渡第一病院です。」、「仙台駅です。」などである。そこで、予め現場からの中継の入りコメントとそうではないコメントとを学習データとして用意し、SVMなどの機械学習により、現場からの中継の入りコメントの特徴を学習しておく。第二文分類部14は、この学習結果を利用して、文S(i)が、現場からの中継の入りコメントであるか否かを判定する。特徴としては、文に出現する単語や、その係り受けなどの情報を利用することができる。   On the other hand, if the second sentence classification unit 14 determines that the sentence S (i) is not a relay comment from the field (step S4-2: NO), the i-th sentence S (the process target) ( It is determined whether i) is a relay comment from the field (step S4-4). The comment from the on-site broadcast is the first comment from a local announcer or reporter when entering a news program, for example, “Ofunato Daiichi Hospital on the coastal plateau in Iwate Prefecture”, “Sendai It ’s a station. ” In view of this, a comment that is relayed from the field and a comment that is not so are prepared as learning data in advance, and the features of the comment that is relayed from the field are learned by machine learning such as SVM. The second sentence classification unit 14 uses this learning result to determine whether or not the sentence S (i) is an incoming comment from the field. As features, information such as words appearing in sentences and their dependencies can be used.

第二文分類部14は、文S(i)が現場からの中継の入りコメントであると判定した場合(ステップS4−4:YES)、文解析データの文番号iのレコードに含まれるKind2(S(i))に、「中継入りコメント」であることを示す値を設定する(ステップS4−5)。第二文分類部14は、Kind2(S(i))の値を設定した後、ステップS4−8に進む。   When the second sentence classification unit 14 determines that the sentence S (i) is a comment included in the relay from the field (step S4-4: YES), Kind2 (included in the record of the sentence number i of the sentence analysis data) In S (i)), a value indicating “comment with relay” is set (step S4-5). The second sentence classification unit 14 sets the value of Kind2 (S (i)), and then proceeds to step S4-8.

一方、第二文分類部14は、文S(i)が現場からの中継の入りコメントではないと判定した場合(ステップS4−4:NO)、処理対象となっているi番目の文S(i)が現場からの中継の締めコメントであるか否かを判定する(ステップS4−6)。現場からの中継の締めコメントとは、ニュース番組における中継の際に現地のアナウンサーや記者が最後に発するコメントであり、例えば、「以上、岩手県の大船渡第一病院でした。」、「新宿駅南口からお伝えしました。」などである。そこで、現場からの中継の締めコメントとそうではないコメントとを学習データとして用意し、SVMなどの機械学習により、現場からの中継の締めコメントの特徴を予め学習しておく。第二文分類部14は、この学習結果を利用して、文S(i)が、現場からの中継の締めコメントであるか否かを判定する。特徴としては、文に出現する単語や、その係り受けなどの情報を利用することができる。   On the other hand, if the second sentence classification unit 14 determines that the sentence S (i) is not a relayed comment from the field (step S4-4: NO), the i-th sentence S (the process target) ( It is determined whether i) is a relay closing comment from the site (step S4-6). The final comment on the broadcast from the site is the last comment issued by a local announcer or reporter during the broadcast in a news program. For example, “This is Ofunato Daiichi Hospital in Iwate Prefecture.”, “Shinjuku Station” I told you from the South Exit. " In view of this, a comment for closing the relay from the site and a comment that is not so are prepared as learning data, and the features of the closing comment for the relay from the site are learned in advance by machine learning such as SVM. Using the learning result, the second sentence classification unit 14 determines whether the sentence S (i) is a relay closing comment from the site. As features, information such as words appearing in sentences and their dependencies can be used.

第二文分類部14は、文S(i)が現場からの中継の締めコメントであると判定した場合(ステップS4−6:YES)、文解析データの文番号iのレコードに含まれるKind2(S(i))に、「中継締めコメント」であることを示す値を設定する(ステップS4−7)。第二文分類部14は、Kind2(S(i))の値を設定した後、ステップS4−8に進む。
また、第二文分類部14は、文S(i)が現場からの中継の締めコメントではないと判定した場合(ステップS4−6:NO)、ステップS4−8に進む。
When the second sentence classification unit 14 determines that the sentence S (i) is a closing comment from the field (step S4-6: YES), Kind2 (included in the record of the sentence number i in the sentence analysis data) In S (i)), a value indicating a “relay closing comment” is set (step S4-7). The second sentence classification unit 14 sets the value of Kind2 (S (i)), and then proceeds to step S4-8.
On the other hand, if the second sentence classification unit 14 determines that the sentence S (i) is not a closing comment for relay from the site (step S4-6: NO), the process proceeds to step S4-8.

ステップS4−3、ステップS4−5、または、ステップS4−7の処理の後、あるいは、ステップS4−6の処理でNOと判定した場合、第二文分類部14は、iがnより小さいか否かを判定することにより、ニューステキストに含まれる全ての文が処理されたかを判別する(ステップS4−8)。第二文分類部14は、iがnより小さく、まだ処理されていない文があると判定した場合(ステップS4−8:YES)、iに1を加算して処理対象の文を後ろに一つずらし(ステップS4−9)、ステップS4−2からの処理を繰り返す。そして、第二文分類部14は、iがnに達し、ニューステキストが示す全ての文について処理を終了したと判定した場合(ステップS4−8:NO)、図5のステップS1−3の処理を終了する。   After the process of step S4-3, step S4-5, or step S4-7, or when it is determined NO in the process of step S4-6, the second sentence classification unit 14 determines whether i is smaller than n. By determining whether or not, it is determined whether all sentences included in the news text have been processed (step S4-8). If the second sentence classification unit 14 determines that i is smaller than n and there is an unprocessed sentence (step S4-8: YES), 1 is added to i and the sentence to be processed is moved backward. Shift (step S4-9) and repeat the process from step S4-2. When the second sentence classification unit 14 determines that i has reached n and all the sentences indicated by the news text have been processed (step S4-8: NO), the process of step S1-3 in FIG. Exit.

[ステップS1−4:現地レポーター中継区間抽出処理]
図5のステップS1−4において、現地レポーター中継区間抽出部16は、場所特定処理(ステップS1−1)の処理結果と、第一文分類処理の処理結果(ステップS1−2)と、第二文分類処理の処理結果(ステップS1−3)とに基づいて、現地レポーター中継区間と中継の場所を抽出する。この詳細な処理を、図9を用いて説明する。
[Step S1-4: Local Reporter Relay Section Extraction Processing]
In step S1-4 of FIG. 5, the local reporter relay section extraction unit 16 performs the processing result of the location specifying process (step S1-1), the processing result of the first sentence classification process (step S1-2), and the second Based on the processing result of the sentence classification processing (step S1-3), the local reporter relay section and the relay location are extracted. This detailed process will be described with reference to FIG.

図9は、現地レポーター中継区間抽出部16による現地レポーター中継区間抽出処理の処理手順を示すフローチャートであり、図5のステップS1−4の詳細な処理手順を示す。
まず、現地レポーター中継区間抽出部16は、処理対象の文を文末とするため、iにnを代入する(ステップS5−1)。次に、現地レポーター中継区間抽出部16は、処理対象となっているi番目の文S(i)が「中継締めコメント」であるか否かを、文解析データに設定されているKind2(S(i))が「中継締めコメント」を示す値であるか否かにより判定する(ステップS5−2)。現地レポーター中継区間抽出部16は、文S(i)が「中継締めコメント」であると判定した場合(ステップS5−2:YES)、中継区間特定処理を行う(ステップS5−3)。
FIG. 9 is a flowchart showing the processing procedure of the local reporter relay section extraction processing by the local reporter relay section extraction unit 16, and shows the detailed processing procedure of step S1-4 in FIG.
First, the local reporter relay section extraction unit 16 substitutes n for i in order to set the sentence to be processed to the end of the sentence (step S5-1). Next, the local reporter relay section extraction unit 16 determines whether or not the i-th sentence S (i) to be processed is a “relay closing comment”, and the Kind2 (S It is determined by whether (i)) is a value indicating “relay closing comment” (step S5-2). When it is determined that the sentence S (i) is a “relay closing comment” (step S5-2: YES), the local reporter relay section extraction unit 16 performs a relay section specifying process (step S5-3).

ステップS5−3ではまず、現地レポーター中継区間抽出部16は、「中継締めコメント」である文S(i)より前の文を、1文ずつm文まで遡り(例えば、m=50)、「中継振りコメント」の文を探索する。つまり、現地レポーター中継区間抽出部16は、文解析データを参照し、kを1からmまで1ずつ増やしながら、Kind2(S(i−k))が「中継振りコメント」を示す値である文S(i−k)を探索する。「中継振りコメント」の文S(i−k)が見つかり、かつ、文S(i)について特定された市区町村名と文S(i−k)について特定された市区町村名とに相違が無い場合、現地レポーター中継区間抽出部16は、「中継振りコメント」の文S(i−k)から「中継締めコメント」の文S(i)までを「現地レポーター中継区間」と判定する。文S(i)について特定された市区町村名、文S(i−k)について特定された市区町村名はそれぞれ、文解析データの文番号iのレコード、文番号(i−k)のレコードから読み出される。なお、現地レポーター中継区間抽出部16は、文S(i)または文S(i−k)の少なくとも一方について市区町村名が特定されていない場合や、「岩手県大船渡市大船渡町」と「岩手県」のように、市区町村名に包含関係がある場合も、市区町村名に相違がないと判断する。これは、以下の処理において、市区町村名や地名に相違がないと判断する場合も同様である。現地レポーター中継区間抽出部16は、中継の場所を、文S(i)または文S(i−k)について特定された市区町村名の場所であると判断する。現地レポーター中継区間抽出部16は、中継区間データがまだ生成されていない場合は、新たに中継区間データを生成して記憶部10に登録する。現地レポーター中継区間抽出部16は、中継区間データにレコードを追加し、「現地レポーター中継」を示す中継の形態と、文番号(i−k)を示す開始位置と、文番号kを示す終了位置と、中継の場所とを書き込む。   In step S5-3, first, the local reporter relay section extraction unit 16 goes back to the m sentence (for example, m = 50) by one sentence before the sentence S (i) that is the “relay closing comment”. Search for “Relaying Swing Comment”. That is, the local reporter relay section extraction unit 16 refers to the sentence analysis data, and increases k by 1 from 1 to m, while Kind2 (S (i−k)) is a value indicating “relay swing comment”. Search for S (ik). The sentence S (ik) of the “relaying comment” is found, and the municipality name specified for the sentence S (ik) is different from the municipality name specified for the sentence S (ik). If there is not, the local reporter relay section extraction unit 16 determines the sentence S (i-k) of “relay swing comment” to the sentence S (i) of “relay closing comment” as the “local reporter relay section”. The municipality name specified for the sentence S (i) and the municipality name specified for the sentence S (ik) are respectively the record of the sentence number i of the sentence analysis data and the sentence number (ik). Read from the record. In addition, the local reporter relay section extraction unit 16 determines that the municipality name is not specified for at least one of the sentence S (i) or the sentence S (ik), or “Ofunato-cho, Ofunato-shi, Iwate” and “ Even if there is an inclusive relationship in the city name, such as “Iwate Prefecture”, it is determined that there is no difference in the city name. The same applies to the case where it is determined in the following processing that there is no difference in city name or place name. The local reporter relay section extraction unit 16 determines that the relay location is the location of the municipality specified for the sentence S (i) or the sentence S (ik). The local reporter relay section extraction unit 16 newly generates relay section data and registers it in the storage unit 10 when the relay section data has not been generated yet. The local reporter relay section extraction unit 16 adds a record to the relay section data, forms the relay indicating “local reporter relay”, the start position indicating the sentence number (ik), and the end position indicating the sentence number k. And the location of the relay.

m文まで遡っても「中継振りコメント」の文が見つからなかった場合、現地レポーター中継区間抽出部16は、「中継締めコメント」である文S(i)より前の文を、1文ずつm文まで遡り(例えば、m=50)、「中継入りコメント」の文を探索する。つまり、現地レポーター中継区間抽出部16は、文解析データを参照し、kを1からmまで1ずつ増やしながら、Kind2(S(i−k))が「中継入りコメント」を示す値である文S(i−k)を探索する。「中継入りコメント」の文S(i−k)が見つかった場合、現地レポーター中継区間抽出部16は、「中継入りコメント」の文S(i−k)から「中継締めコメント」の文S(i)までを「現地レポーター中継区間」と判定する。また、現地レポーター中継区間抽出部16は、この中継の場所を、文S(i)または文S(i−k)について特定された市区町村名の場所であると判断する。現地レポーター中継区間抽出部16は、中継区間データにレコードを追加し、「現地レポーター中継」を示す中継の形態と、文番号(i−k)を示す開始位置と、文番号kを示す終了位置と、中継の場所とを書き込む。   If the “relay swing comment” sentence is not found even after going back to m sentences, the local reporter relay section extracting unit 16 reads m sentences one sentence before the sentence S (i) that is “relay closing comment” one sentence at a time. Go back to the sentence (for example, m = 50) and search for the sentence “Comment with relay”. That is, the local reporter relay section extraction unit 16 refers to the sentence analysis data, and increases k by 1 from 1 to m, while Kind2 (S (i−k)) is a value indicating “relayed comment”. Search for S (ik). When the sentence S (i-k) of “Comment with relay” is found, the local reporter relay section extraction unit 16 converts the sentence S (i-k) of “Comment with relay” to the sentence S ( It is determined that “i) is the“ local reporter relay section ”. Further, the local reporter relay section extraction unit 16 determines that the relay location is the location of the city name specified for the sentence S (i) or the sentence S (ik). The local reporter relay section extraction unit 16 adds a record to the relay section data, forms the relay indicating “local reporter relay”, the start position indicating the sentence number (ik), and the end position indicating the sentence number k. And the location of the relay.

m文まで遡っても「中継振りコメント」の文も「中継入りコメント」の文もともに見つからない場合、現地レポーター中継区間抽出部16は、ニューステキストを参照し、文S(i)より前の文を1文ずつm文まで遡り(例えば、m=50)、「“地名”です。」という文末表現の文S(i−k)を探索する(kは1以上m以下の整数)。「“地名”です。」という文末表現の文S(i−k)が見つかり、かつ、その文に含まれる地名が、文S(i)について特定された市区町村名と相違が無い場合、現地レポーター中継区間抽出部16は、文S(i−k)から「中継締めコメント」の文S(i)までを現地レポーター中継区間と判定する。現地レポーター中継区間抽出部16は、中継の場所を、文S(i)について特定された市区町村名の場所、あるいは、文S(i−k)に含まれる地名(または、その地名から特定される市区町村名)の場所であると判断する。現地レポーター中継区間抽出部16は、中継区間データにレコードを追加し、「現地レポーター中継」を示す中継の形態と、文番号(i−k)を示す開始位置と、文番号kを示す終了位置と、中継の場所とを書き込む。   If neither the “relaying comment” sentence nor the “relayed comment” sentence is found even after going back to m sentences, the local reporter relay section extraction unit 16 refers to the news text and precedes the sentence S (i). The sentence is traced back to m sentences one sentence at a time (for example, m = 50), and a sentence S (ik) having a sentence end expression “is a place name” is searched (k is an integer from 1 to m). When a sentence S (ik) with the sentence end expression “is a place name” is found, and the place name included in the sentence is not different from the city name specified for the sentence S (i), The local reporter relay section extraction unit 16 determines that the sentence from the sentence S (ik) to the sentence S (i) of “relay closing comment” is the local reporter relay section. The local reporter relay section extraction unit 16 specifies the location of the relay from the location of the municipality specified for the sentence S (i) or the place name included in the sentence S (ik) (or from the place name) It is determined that this is the location of the city. The local reporter relay section extraction unit 16 adds a record to the relay section data, forms the relay indicating “local reporter relay”, the start position indicating the sentence number (ik), and the end position indicating the sentence number k. And the location of the relay.

ステップS5−3の処理の後、あるいは、ステップS5−2において文S(i)が「中継締めコメント」ではないと判定した場合(ステップS5−2:NO)、現地レポーター中継区間抽出部16は、ステップS5−4の処理を行う。すなわち、現地レポーター中継区間抽出部16は、iが1より大きいか否かを判定することにより、ニューステキストに含まれる全ての文が処理されたかを判別する(ステップS5−4)。現地レポーター中継区間抽出部16は、iが1より大きく、まだ処理されていない文があると判定した場合(ステップS5−4:YES)、iから1を減算して処理対象の文を前に一つずらし(ステップS5−5)、ステップS5−2からの処理を繰り返す。そして、現地レポーター中継区間抽出部16は、iが1に達し、ニューステキストが示す全ての文について処理を終了したと判定した場合(ステップS5−4:NO)、ステップS5−6の処理に進む。   After the process of step S5-3, or when it is determined in step S5-2 that the sentence S (i) is not a “relay closing comment” (step S5-2: NO), the local reporter relay section extraction unit 16 Then, the process of step S5-4 is performed. That is, the local reporter relay section extraction unit 16 determines whether or not all sentences included in the news text have been processed by determining whether i is greater than 1 (step S5-4). If the local reporter relay section extraction unit 16 determines that i is greater than 1 and there is an unprocessed sentence (step S5-4: YES), 1 is subtracted from i and the sentence to be processed is moved forward. Shift by one (step S5-5) and repeat the processing from step S5-2. If the local reporter relay section extraction unit 16 determines that i has reached 1 and all the sentences indicated by the news text have been processed (step S5-4: NO), the process proceeds to step S5-6. .

現地レポーター中継区間抽出部16は、処理対象となっているi番目の文S(i)が「中継振りコメント」であるか否かを、文解析データに設定されているKind2(S(i))が「中継振りコメント」を示す値であるか否かにより判定する(ステップS5−6)。現地レポーター中継区間抽出部16は、文S(i)が「中継振りコメント」であると判定した場合(ステップS5−6:YES)、中継区間特定処理を行う(ステップS5−7)。   The local reporter relay section extraction unit 16 determines whether or not the i-th sentence S (i) to be processed is a “relay swing comment”, Kind2 (S (i) set in the sentence analysis data ) Is a value indicating “relaying comment” (step S5-6). If the local reporter relay section extraction unit 16 determines that the sentence S (i) is a “relay swing comment” (step S5-6: YES), the local reporter relay section extraction unit 16 performs a relay section specifying process (step S5-7).

ステップS5−7において、現地レポーター中継区間抽出部16は、「中継振りコメント」である文S(i)より後ろの文を、1文ずつm文まで進め(例えば、m=50)、「場所特定コメント」またはニュース番組の句切れ目を指すようなコメントの文S(i+k)を探索する(kは1以上m以下の整数)。「場所特定コメント」であるか否かは、文解析データに設定されているKind1(S(i+k))が「場所特定コメント」を示す値であるか否かによって判定される。また、ニュース番組の句切れ目を指すようなコメントは、例えば、「中継でした。」、「引き続きお伝えします。」などのコメントである。「場所特定コメント」またはニュース番組の句切れ目を指すようなコメントの文S(i+k)が見つかった場合、現地レポーター中継区間抽出部16は、「中継振りコメント」の文S(i)から、文S(i+k)の直前の文S(i+k−1)までを、現地レポーター中継区間と判定する。現地レポーター中継区間抽出部16は、中継の場所を文S(i)について特定された市区町村名の場所、あるいは、「場所特定コメント」の文S(i+k−1)について特定された市区町村名の場所であると判断する。現地レポーター中継区間抽出部16は、中継区間データにレコードを追加し、「現地レポーター中継」を示す中継の形態と、文番号iを示す開始位置と、文番号(i+k−1)を示す終了位置と、中継の場所とを書き込む。   In step S5-7, the local reporter relay section extraction unit 16 advances the sentence after the sentence S (i), which is the “relaying comment”, to one sentence at a time (for example, m = 50). A comment sentence S (i + k) pointing to a “special comment” or a break in a news program is searched (k is an integer of 1 to m). Whether or not it is a “location specific comment” is determined by whether or not Kind1 (S (i + k)) set in the sentence analysis data is a value indicating “location specific comment”. In addition, comments that indicate breaks in news programs are, for example, comments such as “It was a relay” or “I will continue to tell you”. When a comment S (i + k) that indicates a “location specific comment” or a break in a news program is found, the local reporter relay section extractor 16 reads the sentence S (i) from the “relay swing comment” from the sentence S (i). Up to the sentence S (i + k−1) immediately before S (i + k) is determined as the local reporter relay section. The local reporter relay section extraction unit 16 identifies the location of the municipality specified for the sentence S (i) as the location of the relay, or the municipality specified for the sentence S (i + k−1) of the “location specific comment”. Judged to be the location of the town / village name. The local reporter relay section extraction unit 16 adds a record to the relay section data, forms the relay indicating “local reporter relay”, the start position indicating the sentence number i, and the end position indicating the sentence number (i + k−1). And the location of the relay.

ステップS5−7の処理の後、あるいは、ステップS5−6において文S(i)が「中継振りコメント」ではないと判定した場合(ステップS5−6:NO)、現地レポーター中継区間抽出部16は、ステップS5−8の処理を行う。すなわち、現地レポーター中継区間抽出部16は、iがnより小さいか否かを判定することにより、ニューステキストに含まれる全ての文が処理されたかを判別する(ステップS5−8)。現地レポーター中継区間抽出部16は、iがnより小さく、まだ処理されていない文があると判定した場合(ステップS5−8:YES)、iに1を加算して処理対象の文を後ろに一つずらし(ステップS5−9)、ステップS5−6からの処理を繰り返す。そして、現地レポーター中継区間抽出部16は、iがnに達し、ニューステキストが示す全ての文について処理を終了したと判定した場合(ステップS5−8:NO)、図5のステップS1−4の処理を終了する。   After the process of step S5-7, or when it is determined in step S5-6 that the sentence S (i) is not a “relaying comment” (step S5-6: NO), the local reporter relay section extracting unit 16 Step S5-8 is performed. That is, the local reporter relay section extraction unit 16 determines whether all sentences included in the news text have been processed by determining whether i is smaller than n (step S5-8). When the local reporter relay section extraction unit 16 determines that i is smaller than n and there is an unprocessed sentence (step S5-8: YES), 1 is added to i and the sentence to be processed is moved backward. Shift by one (step S5-9) and repeat the processing from step S5-6. When the local reporter relay section extraction unit 16 determines that i has reached n and all the sentences indicated by the news text have been processed (step S5-8: NO), step S1-4 in FIG. End the process.

上記のように、現地レポーター中継区間抽出部16は、まずは、検出の精度が高い中継締めコメントを利用して現地レポーター中継区間を抽出し、中継締めコメントが検出されない現地レポーター中継区間については、次に検出の精度が高い中継振りコメントを利用して抽出する。   As described above, the local reporter relay section extraction unit 16 first extracts a local reporter relay section using a relay closing comment with high detection accuracy, and for the local reporter relay section where the relay closing comment is not detected, In addition, it is extracted by using a relay comment with high detection accuracy.

[ステップS1−5:レポーター不在中継区間抽出処理]
図5のステップS1−5において、レポーター不在中継区間抽出部17は、場所特定処理(ステップS1−1)の処理結果と、第一文分類処理(ステップS1−2)の処理結果と、現地レポーター中継区間抽出処理(ステップS1−4)の処理結果とに基づいて、レポーター不在中継区間と中継の場所を抽出する。この詳細な処理を、図10を用いて説明する。
[Step S1-5: Reporter Absent Relay Section Extraction Process]
In step S1-5 of FIG. 5, the reporter absent relay section extraction unit 17 performs the processing result of the location specifying process (step S1-1), the processing result of the first sentence classification process (step S1-2), and the local reporter. Based on the processing result of the relay section extraction process (step S1-4), the reporter absent relay section and the relay location are extracted. This detailed processing will be described with reference to FIG.

図10は、レポーター不在中継区間抽出部17によるレポーター不在中継区間抽出処理の処理手順を示すフローチャートであり、図5のステップS1−5の詳細な処理手順を示す。
まず、レポーター不在中継区間抽出部17は、処理対象の文を文頭とするため、iに1を代入する(ステップS6−1)。次に、レポーター不在中継区間抽出部17は、処理対象となっているi番目の文S(i)が現地レポーター中継区間に含まれているか否かを、中継区間データに中継の形態「現地レポーター中継」と対応付けて設定されている開始位置から終了位置までに文番号iが含まれているか否かにより判定する(ステップS6−2)。レポーター不在中継区間抽出部17は、文S(i)が現地レポーター中継区間に含まれていないと判定した場合(ステップS6−2:NO)、文S(i)が「場所特定コメント」であるか否かを、文解析データに設定されているKind1(S(i))が「場所特定コメント」を示す値であるか否かにより判定する(ステップS6−3)。レポーター不在中継区間抽出部17は、文S(i)が「場所特定コメント」であると判定した場合(ステップS6−3:YES)、中継区間特定処理を行う(ステップS6−4)。
FIG. 10 is a flowchart showing the processing procedure of the reporter absent relay section extraction process by the reporter absent relay section extraction unit 17, and shows the detailed processing procedure of step S1-5 in FIG.
First, the reporter absent relay section extraction unit 17 substitutes 1 for i in order to set a sentence to be processed as a sentence head (step S6-1). Next, the reporter absent relay section extraction unit 17 determines whether or not the local reporter relay section includes the i-th sentence S (i) to be processed in the relay section data as “relay reporter local reporter”. It is determined based on whether or not the sentence number i is included from the start position to the end position set in association with “relay” (step S6-2). When the reporter absent relay section extraction unit 17 determines that the sentence S (i) is not included in the local reporter relay section (step S6-2: NO), the sentence S (i) is “location specific comment”. Whether or not Kind1 (S (i)) set in the sentence analysis data is a value indicating “location specifying comment” (step S6-3). When the reporter absent relay section extraction unit 17 determines that the sentence S (i) is a “location specifying comment” (step S6-3: YES), the reporter absent relay section extraction unit 17 performs a relay section specifying process (step S6-4).

ステップS6−4ではまず、レポーター不在中継区間抽出部17は、「場所特定コメント」である文S(i)より後ろの文を、1文ずつm文まで進め(例えば、m=50)、「場所特定コメント」の文を探索する。つまり、レポーター不在中継区間抽出部17は、文解析データを参照し、kを1からmまで1ずつ増やしながら、Kind1(S(i+k))が「場所特定コメント」を示す値である文S(i+k)を探索する。「場所特定コメント」の文S(i+k)が見つかり、かつ、文S(i)について特定された市区町村名と文S(i+k)について特定された市区町村名とに相違が無い場合、レポーター不在中継区間抽出部17は、「場所特定コメント」の文S(i)から文S(i+k)までを、「レポーター不在中継区間」と判定する。文S(i)について特定された市区町村名、文S(i+k)について特定された市区町村名のそれぞれは、文解析データの文番号iのレコード、文番号(i+k)のレコードから読み出される。レポーター不在中継区間抽出部17は、中継の場所を、文S(i)または文S(i+k)について特定された市区町村名の場所であると判断する。レポーター不在中継区間抽出部17は、中継区間データにレコードを追加し、「レポーター不在中継」を示す中継の形態と、文番号(i)を示す開始位置と、文番号(i+k)を示す終了位置と、中継の場所とを書き込む。   In step S6-4, first, the reporter absent relay section extraction unit 17 advances the sentence after the sentence S (i) which is the “location specifying comment” to m sentences one sentence at a time (for example, m = 50). Search for the sentence “Location Specific Comment”. That is, the reporter absent relay section extraction unit 17 refers to the sentence analysis data, and increases the k from 1 to m by 1 while the Kind 1 (S (i + k)) is a value indicating the “location specifying comment”. Search for i + k). When the sentence S (i + k) of the “location specific comment” is found and there is no difference between the municipality name specified for the sentence S (i) and the municipality name specified for the sentence S (i + k), The reporter absent relay section extraction unit 17 determines that the sentence “location specific comment” from the sentence S (i) to the sentence S (i + k) is a “reporter absent relay section”. The municipality name specified for sentence S (i) and the municipality name specified for sentence S (i + k) are read from the sentence number i record and sentence number (i + k) record of sentence analysis data, respectively. It is. The reporter absent relay section extraction unit 17 determines that the relay location is the location of the city name specified for the sentence S (i) or the sentence S (i + k). The reporter absent relay section extraction unit 17 adds a record to the relay section data, forms the relay indicating “reporter absent relay”, the start position indicating the sentence number (i), and the end position indicating the sentence number (i + k). And the location of the relay.

m文先まで探索しても「場所特定コメント」の文が見つからなかった場合、レポーター不在中継区間抽出部17は、「場所特定コメント」である文S(i)より後ろの文を、1文ずつm文まで進め(例えば、m=50)、「映像コメント」の文を探索する。つまり、レポーター不在中継区間抽出部17は、文解析データを参照し、kを1からmまで1ずつ増やしながら、Kind1(S(i+k))が「映像コメント」を示す値である文S(i+k)を探索する。「映像コメント」の文S(i+k)が見つかり、かつ、文S(i)について特定された市区町村名と文S(i+k)について特定された市区町村名とに相違が無い場合、レポーター不在中継区間抽出部17は、「場所特定コメント」の文S(i)から文S(i+k)までを、「レポーター不在中継区間」と判定する。また、レポーター不在中継区間抽出部17は、中継の場所を、文S(i)または文S(i+k)について特定された市区町村名の場所であると判断する。レポーター不在中継区間抽出部17は、中継区間データにレコードを追加し、「レポーター不在中継」を示す中継の形態と、文番号iを示す開始位置と、文番号(i+k)を示す終了位置と、中継の場所とを書き込む。   If a sentence “location specific comment” is not found even after searching up to m sentences, the reporter absent relay section extraction unit 17 selects one sentence after the sentence S (i) that is “location specific comment”. Step up to m sentences (for example, m = 50), and search for a sentence of “video comment”. In other words, the reporter absent relay section extracting unit 17 refers to the sentence analysis data, and increases k by 1 from 1 to m, while Kind1 (S (i + k)) is a value indicating “video comment”. ). If the sentence “S (i + k)” of the “video comment” is found and there is no difference between the municipality name specified for the sentence S (i) and the municipality name specified for the sentence S (i + k) The absent relay section extraction unit 17 determines that the sentence “location specific comment” from the sentence S (i) to the sentence S (i + k) is a “reporter absent relay section”. Further, the reporter absent relay section extraction unit 17 determines that the relay location is the location of the city name specified for the sentence S (i) or the sentence S (i + k). The reporter absent relay section extraction unit 17 adds a record to the relay section data, forms a relay indicating “reporter absent relay”, a start position indicating a sentence number i, an end position indicating a sentence number (i + k), Write the location of the relay.

ステップS6−2において文S(i)が現地レポーター中継区間に含まれると判定した場合(ステップS6−2:YES)、ステップS6−3において文S(i)が「場所特定コメント」ではないと判定した場合(ステップS6−3:NO)、あるいは、ステップS6−4の処理の後、レポーター不在中継区間抽出部17は、ステップS6−5の処理を行う。すなわち、レポーター不在中継区間抽出部17は、iがnより小さいか否かを判定することにより、ニューステキストに含まれる全ての文が処理されたかを判別する(ステップS6−5)。レポーター不在中継区間抽出部17は、iがnより小さく、まだ処理されていない文があると判定した場合(ステップS6−5:YES)、iに1を加算して処理対象の文を後ろに一つずらし(ステップS6−6)、ステップS6−2からの処理を繰り返す。そして、レポーター不在中継区間抽出部17は、iがnに達し、ニューステキストが示す全ての文について処理を終了したと判定した場合(ステップS6−5:NO)、ステップS6−7の処理に進む。   When it is determined in step S6-2 that the sentence S (i) is included in the local reporter relay section (step S6-2: YES), in step S6-3, the sentence S (i) is not a “location specific comment”. When it determines (step S6-3: NO), or after the process of step S6-4, the reporter absent relay area extraction part 17 performs the process of step S6-5. That is, the reporter absent relay section extraction unit 17 determines whether or not all sentences included in the news text have been processed by determining whether i is smaller than n (step S6-5). When the reporter absent relay section extraction unit 17 determines that i is smaller than n and there is an unprocessed sentence (step S6-5: YES), 1 is added to i and the sentence to be processed is moved backward. Shift by one (step S6-6) and repeat the processing from step S6-2. When the reporter absent relay section extracting unit 17 determines that i has reached n and all the sentences indicated by the news text have been processed (step S6-5: NO), the process proceeds to step S6-7. .

レポーター不在中継区間抽出部17は、処理対象の文を文頭とするため、iに1を代入する(ステップS6−7)。次に、レポーター不在中継区間抽出部17は、ステップS6−2と同様に、処理対象となっているi番目の文S(i)が現地レポーター中継区間に含まれているか否かを判定する(ステップS6−8)。レポーター不在中継区間抽出部17は、文S(i)が現地レポーター中継区間に含まれていないと判定した場合(ステップS6−8:NO)、文S(i)が「映像コメント」であるか否かを、文解析データに設定されているKind1(S(i))が「映像コメント」を示す値であるか否かにより判定する(ステップS6−9)。レポーター不在中継区間抽出部17は、文S(i)が「映像コメント」であると判定した場合(ステップS6−9:YES)、中継区間特定処理を行う(ステップS6−10)。   The reporter absent relay section extraction unit 17 substitutes 1 for i in order to set the sentence to be processed as a sentence head (step S6-7). Next, the reporter absent relay section extraction unit 17 determines whether or not the i-th sentence S (i) to be processed is included in the local reporter relay section as in step S6-2 ( Step S6-8). When the reporter absent relay section extraction unit 17 determines that the sentence S (i) is not included in the local reporter relay section (step S6-8: NO), is the sentence S (i) a “video comment”? Whether or not Kind1 (S (i)) set in the sentence analysis data is a value indicating “video comment” is determined (step S6-9). When the reporter absent relay section extraction unit 17 determines that the sentence S (i) is a “video comment” (step S6-9: YES), the reporter absent relay section extraction unit 17 performs a relay section specifying process (step S6-10).

ステップS6−10において、レポーター不在中継区間抽出部17は、「映像コメント」である文S(i)より後ろの文を、1文ずつm文まで進め(例えば、m=10)、「映像コメント」の文を探索する。つまり、レポーター不在中継区間抽出部17は、文解析データを参照し、kを1からmまで1ずつ増やしながら、Kind1(S(i+k))が「映像コメント」を示す値である文S(i+k)を探索する。「映像コメント」の文S(i+k)が見つかり、かつ、文S(i)から特定された市区町村名と文S(i+k)から特定された市区町村名とに相違が無い場合、レポーター不在中継区間抽出部17は、「映像コメント」の文S(i)から文S(i+k)までを、「レポーター不在中継区間」と判定する。レポーター不在中継区間抽出部17は、中継の場所を、文S(i)または文S(i+k)から特定された市区町村名の場所であると判断する。レポーター不在中継区間抽出部17は、中継区間データにレコードを追加し、「レポーター不在中継」を示す中継の形態と、文番号iを示す開始位置と、文番号(i+k)を示す終了位置と、中継の場所とを書き込む。   In step S6-10, the reporter absent relay section extraction unit 17 advances the sentence after the sentence S (i), which is “video comment”, up to m sentences one sentence at a time (for example, m = 10). "Is searched. In other words, the reporter absent relay section extracting unit 17 refers to the sentence analysis data, and increases k by 1 from 1 to m, while Kind1 (S (i + k)) is a value indicating “video comment”. ). If the sentence “S (i + k)” of the “video comment” is found and there is no difference between the municipality name identified from the sentence S (i) and the municipality name identified from the sentence S (i + k) The absent relay section extraction unit 17 determines that the sentence “(video comment)” from the sentence S (i) to the sentence S (i + k) is a “reporter absent relay section”. The reporter absent relay section extraction unit 17 determines that the relay location is the location of the municipality specified from the sentence S (i) or the sentence S (i + k). The reporter absent relay section extraction unit 17 adds a record to the relay section data, forms a relay indicating “reporter absent relay”, a start position indicating a sentence number i, an end position indicating a sentence number (i + k), Write the location of the relay.

S6−8において文S(i)が現地レポーター中継区間に含まれると判定した場合(ステップS6−8:YES)、ステップS6−9において文S(i)が「映像コメント」ではないと判定した場合(ステップS6−9:NO)、あるいは、ステップS6−10の処理の後、レポーター不在中継区間抽出部17は、ステップS6−11の処理を行う。すなわち、レポーター不在中継区間抽出部17は、iがnより小さいか否かを判定することにより、ニューステキストに含まれる全ての文が処理されたかを判別する(ステップS6−11)。レポーター不在中継区間抽出部17は、iがnより小さく、まだ処理されていない文があると判定した場合(ステップS6−11:YES)、iに1を加算して処理対象の文を後ろに一つずらし(ステップS6−12)、ステップS6−8からの処理を繰り返す。そして、レポーター不在中継区間抽出部17は、iがnに達し、ニューステキストが示す全ての文について処理を終了したと判定した場合(ステップS6−11:NO)、図5のステップS1−5の処理を終了する。   When it is determined in S6-8 that the sentence S (i) is included in the local reporter relay section (step S6-8: YES), it is determined in step S6-9 that the sentence S (i) is not a “video comment”. In the case (step S6-9: NO) or after the process of step S6-10, the reporter absent relay section extracting unit 17 performs the process of step S6-11. That is, the reporter absent relay section extraction unit 17 determines whether all sentences included in the news text have been processed by determining whether i is smaller than n (step S6-11). When the reporter absent relay section extraction unit 17 determines that i is smaller than n and there is an unprocessed sentence (step S6-11: YES), 1 is added to i and the sentence to be processed is moved backward. Shift by one (step S6-12) and repeat the processing from step S6-8. When the reporter absent relay section extraction unit 17 determines that i has reached n and all the sentences indicated by the news text have been processed (step S6-11: NO), step S1-5 in FIG. End the process.

上記のように、レポーター不在中継区間抽出部17は、まずは、検出の精度が高い場所特定コメントを利用してレポーター不在中継区間を抽出し、場所特定コメントが検出されないレポーター不在中継区間については、映像コメントを利用して抽出する。また、レポーター不在中継区間抽出部17が抽出したレポーター不在中継区間として抽出した区間がすでに現地レポーター中継区間として抽出されていた場合、現地レポーター中継区間を優先する。   As described above, the reporter absent relay section extraction unit 17 first extracts a reporter absent relay section using a location specific comment with high detection accuracy, and a video for a reporter absent relay section in which no location specific comment is detected. Extract using comments. Moreover, when the section extracted as the reporter absent relay section extracted by the reporter absent relay section extraction unit 17 has already been extracted as the local reporter relay section, the local reporter relay section is prioritized.

[ステップS1−6:空撮中継区間抽出処理]
図5のステップS1−6において、空撮中継区間抽出部18は、現地レポーター中継区間抽出処理(ステップS1−4)とレポーター不在中継区間抽出処理(ステップS1−5)の結果抽出された中継区間から、空撮中継区間を抽出する。そこで、記憶部10に、「上空から」、「ヘリからの映像」、「ヘリコプターで撮影」といった空撮特有のコメントに用いられる語句をあらかじめ登録しておく。空撮中継区間抽出部18は、ステップS1−4において抽出された現地レポーター中継区間に対応したニューステキスト、及び、ステップS1−5において抽出されたレポーター不在中継区間に対応したニューステキストと、空撮特有のコメントの語句とを比較する。具体的には、空撮中継区間抽出部18は、記憶部10に記憶されている中継区間データの各レコード毎に、中継区間の開始位置及び終了位置を読み出し、読み出した開始位置及び終了位置までの区間に対応したニューステキストが示す文に、空撮特有のコメントの語句が含まれるか否かを判定する。空撮中継区間抽出部18は、空撮特有のコメントの語句が含まれていると判定した場合、そのレコードの中継の形態を、「現地レポーター中継」あるいは「レポーター不在中継」から、「空撮中継区間」に修正する。
[Step S1-6: Aerial Shooting Section Extraction Processing]
In step S1-6 of FIG. 5, the aerial shooting relay section extraction unit 18 extracts the relay section extracted as a result of the local reporter relay section extraction process (step S1-4) and the reporter absent relay section extraction process (step S1-5). To extract the aerial shooting section. Therefore, words and phrases used for comments specific to aerial photography, such as “from the sky”, “video from a helicopter”, and “photographed by a helicopter” are registered in the storage unit 10 in advance. The aerial shooting section extraction unit 18 includes news text corresponding to the local reporter relay section extracted in step S1-4, news text corresponding to the reporter absent relay section extracted in step S1-5, and aerial shooting. Compare with specific comment words. Specifically, the aerial shooting relay section extraction unit 18 reads the start position and end position of the relay section for each record of the relay section data stored in the storage unit 10 until the read start position and end position. It is determined whether or not the sentence indicated by the news text corresponding to this section includes a comment phrase unique to aerial photography. When the aerial shooting section extraction unit 18 determines that a commentary phrase unique to aerial shooting is included, the relay form of the record is changed from “local reporter relay” or “reporter absent relay” to “aerial shooting”. Modify to “Relay section”.

[ステップS1−7:ノイズ除去処理]
ステップS1−7において、ノイズ除去部19は、現地レポーター中継区間抽出処理(ステップS1−4)、レポーター不在中継区間抽出処理(ステップS1−5)、及び空撮中継区間抽出処理(ステップS1−6)の結果抽出された中継区間から、中継区間の時間の長さに基づいてノイズを除外する。具体的には、ノイズ除去部19は、記憶部10に記憶されている中継区間データの各レコードから、中継区間(現地レポーター中継区間、レポーター不在中継区間、または、空撮中継区間)の開始位置及び終了位置を読み出す。ノイズ除去部19は、記憶部10が記憶しているニューステキストに付加されている同期データから、開始位置が示す文に対応した同期データと、終了位置の文に対応した同期データを取得する。ノイズ除去部19は、終了位置の文に対応した同期データが示す再生時刻から、開始位置の文に対応した同期データが示す再生時刻を減算して、各中継区間の時間の長さを算出し、算出した時間の長さが一定以下(例えば10秒以下)の中継区間はノイズと判定する。ノイズ除去部19は、ノイズと判定された現地レポーター中継区間、レポーター不在中継区間、空撮中継区間のレコードを中継区間データから削除する。
[Step S1-7: Noise removal processing]
In step S1-7, the noise removing unit 19 performs local reporter relay section extraction processing (step S1-4), reporter absent relay section extraction processing (step S1-5), and aerial shooting relay section extraction processing (step S1-6). The noise is excluded from the relay section extracted as a result of (2) based on the length of time of the relay section. Specifically, the noise removal unit 19 starts the relay section (local reporter relay section, reporter absent relay section, or aerial shooting relay section) from each record of the relay section data stored in the storage unit 10. And the end position is read. The noise removal unit 19 acquires synchronization data corresponding to the sentence indicated by the start position and synchronization data corresponding to the sentence at the end position from the synchronization data added to the news text stored in the storage unit 10. The noise removal unit 19 subtracts the reproduction time indicated by the synchronization data corresponding to the sentence at the start position from the reproduction time indicated by the synchronization data corresponding to the sentence at the end position, and calculates the length of time of each relay section. A relay section in which the calculated time length is equal to or less than a certain value (for example, 10 seconds or less) is determined as noise. The noise removing unit 19 deletes the records of the local reporter relay section, the reporter absent relay section, and the aerial photography relay section determined as noise from the relay section data.

なお、ノイズ除去部19は、ノイズを判定する前に、連続する中継区間を1つの中継区間とする処理を行ってもよい。例えば、中継区間データの異なるレコードR1、R2において中継の形態が同じであり、かつ、レコードR1の終了位置と、レコードR2の開始位置とが連続している場合、レコードR1の終了位置をレコードR2の終了位置に書き換え、レコードR2を削除する。   In addition, the noise removal part 19 may perform the process which makes a continuous relay area the one relay area, before determining noise. For example, when records R1 and R2 having different relay section data have the same form of relay and the end position of record R1 and the start position of record R2 are continuous, the end position of record R1 is set to record R2. The record R2 is deleted at the end position.

なお、映像データが複数のトピックを含んだニュース番組である場合、中継区間抽出装置1は、同一のトピックの映像データの区間内において中継区間を抽出するようにしてもよい。この場合、中継区間抽出装置1は、従来のアンカーショット検出手法により映像データからアンカーショットを抽出し、アンカーショットが抽出された部分が各トピックの先頭となるように映像データを分割する。   When the video data is a news program including a plurality of topics, the relay section extraction device 1 may extract a relay section in the section of video data of the same topic. In this case, the relay section extraction device 1 extracts the anchor shot from the video data by the conventional anchor shot detection method, and divides the video data so that the portion from which the anchor shot is extracted becomes the head of each topic.

上述した実施形態によれば、中継区間抽出装置は、ニュース番組の映像に付随したテキストデータにより示される各文から地名やランドマーク名など場所に関する語句を抽出し、場所を特定する。さらに中継区間抽出装置は、テキストデータにより示される各文が中継の場所を特定するコメント、あるいは中継の映像を説明するコメントであるかの判別と、中継入りコメント、中継振りコメント、あるいは中継締めコメントであるかの判別を行う。中継区間抽出装置は、各文から特定した場所と、各文の文分類処理の結果とに基づいて、テレビ等で放送されるニュース番組から、レポーターが現地から説明する中継、レポーターが現地に不在の中継、ヘリコプター等からの空撮による中継などのシーンの区間と、中継の場所を抽出する。これにより、ニュース番組がどの場所からどのような形態で報道されたかという情報を取得することができる。この取得した結果を地図上にマッピングすることにより、これらの中継が、どこから、どの程度の時間放送されたかを視覚的に把握することが可能となり、報道機関における情報整理に繋がる。   According to the above-described embodiment, the relay section extraction device extracts a phrase related to a place such as a place name or a landmark name from each sentence indicated by text data attached to a video of a news program, and specifies the place. Further, the relay section extraction device determines whether each sentence indicated by the text data is a comment specifying the location of the relay, or a comment explaining the video of the relay, and a comment with relay, a relay swing comment, or a relay closing comment. Is determined. The relay section extractor is based on the location specified from each sentence and the result of sentence classification processing for each sentence. Sections of scenes, such as relays from aerial photography from helicopters, etc., and relay locations are extracted. As a result, it is possible to acquire information as to which news program was reported from which location and in what form. By mapping the obtained results on a map, it is possible to visually grasp where and how long these relays have been broadcast, leading to information organization in the news media.

なお、上述の中継区間抽出装置1は、内部にコンピュータシステムを有している。そして、中継区間抽出装置1の各部の動作の過程は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムをコンピュータシステムが読み出して実行することによって、上記処理が行われる。ここでいうコンピュータシステムとは、CPU及び各種メモリやOS、周辺機器等のハードウェアを含むものである。   Note that the relay section extraction device 1 described above has a computer system therein. The operation process of each unit of the relay section extraction device 1 is stored in a computer-readable recording medium in the form of a program, and the above-described processing is performed by the computer system reading and executing this program. The computer system here includes a CPU, various memories, an OS, and hardware such as peripheral devices.

また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
Further, the “computer system” includes a homepage providing environment (or display environment) if a WWW system is used.
The “computer-readable recording medium” refers to a storage device such as a flexible medium, a magneto-optical disk, a portable medium such as a ROM and a CD-ROM, and a hard disk incorporated in a computer system. Furthermore, the “computer-readable recording medium” dynamically holds a program for a short time like a communication line when transmitting a program via a network such as the Internet or a communication line such as a telephone line. In this case, a volatile memory in a computer system serving as a server or a client in that case, and a program that holds a program for a certain period of time are also included. The program may be a program for realizing a part of the functions described above, and may be a program capable of realizing the functions described above in combination with a program already recorded in a computer system.

1 中継区間抽出装置
10 記憶部
11 場所特定部
12 文分類部
13 第一文分類部
14 第二文分類部
15 中継区間抽出部
16 現地レポーター中継区間抽出部
17 レポーター不在中継区間抽出部
18 空撮中継区間抽出部
19 ノイズ除去部
DESCRIPTION OF SYMBOLS 1 Relay area extraction apparatus 10 Memory | storage part 11 Location identification part 12 Sentence classification part 13 First sentence classification part 14 Second sentence classification part 15 Relay area extraction part 16 Local reporter relay area extraction part 17 Reporter absence relay area extraction part 18 Aerial photography Relay section extraction unit 19 Noise removal unit

Claims (7)

番組の映像データと対応付けられたテキストデータにより示される各文から場所に関する語句を抽出し、抽出した前記語句から場所を特定する場所特定部と、
前記テキストデータにより示される各文が中継に関する表現を使用したコメントであるか否かを判定する文分類部と、
前記文分類部により中継に関する表現を使用したコメントであると判定された異なる2つの文それぞれの前記コメントの種類と、前記異なる2つの文それぞれについて前記場所特定部が特定した場所が相違するか否かとに基づいて、前記異なる2つの文に対応した前記映像データの区間を中継区間として抽出する中継区間抽出部と、
を備えることを特徴とする中継区間抽出装置。
A place specifying unit that extracts a phrase related to a place from each sentence indicated by text data associated with video data of a program, and specifies a place from the extracted phrase;
A sentence classification unit for determining whether each sentence indicated by the text data is a comment using an expression related to relay;
The type of the comment for each of the two different sentences determined to be comments using the relay-related expression by the sentence classification unit and the location specified by the place specifying unit for each of the two different sentences is different. Based on the heel, a relay section extraction unit that extracts the section of the video data corresponding to the two different sentences as a relay section;
A relay section extraction device comprising:
前記文分類部は、前記テキストデータにより示される各文が中継の入りコメントであるか否か、中継の振りコメントであるか否か、及び、中継の締めコメントであるか否かを判定し、
前記中継区間抽出部は、中継の締めコメントであると判定された文について前記場所特定部が特定した場所と、前記テキストデータにおいて当該文より前に出現し、かつ、中継の振りコメントであると判定された他の文について前記場所特定部が特定した場所とに相違がない場合、あるいは、前記テキストデータにおいて中継の締めコメントであると判定された文より前に中継の入りコメントであると判定された文が出現する場合、中継の振りコメントまたは中継の入りコメントであると判定された前記他の文から中継の締めコメントであると判定された前記文までに対応した前記映像データの区間を現地のレポーターによる中継区間として抽出する、
ことを特徴とする請求項1に記載の中継区間抽出装置。
The sentence classification unit determines whether each sentence indicated by the text data is a relay entry comment, a relay swing comment, and a relay closing comment.
The relay section extraction unit is a location identified by the location identification unit for a sentence determined to be a relay closing comment, appears before the sentence in the text data, and is a relay swing comment It is determined that there is no difference between the determined location of the other sentence and the location specified by the location specifying unit, or that the comment is a relayed comment before the sentence determined to be a relay closing comment in the text data. When the recorded sentence appears, the video data section corresponding to the sentence determined to be the relay closing comment from the other sentence determined to be the relay comment or the relayed comment Extract as a relay section by a local reporter,
The relay section extracting device according to claim 1, wherein
前記文分類部は、前記テキストデータにより示される各文が中継の場所を伝えるコメントであるか否かをさらに判定し、
前記中継区間抽出部は、中継の振りコメントであると判定された文について前記場所特定部が特定した場所と、前記テキストデータにおいて当該文より後に出現し、かつ、場所を伝えるコメントであると判定された他の文について前記場所特定部が特定した場所とに相違がない場合、中継の振りコメントであると判定された前記文から場所を伝えるコメントであると判定された前記他の文までに対応した前記映像データの区間を現地のレポーターによる中継区間として抽出する、
ことを特徴とする請求項2に記載の中継区間抽出装置。
The sentence classification unit further determines whether or not each sentence indicated by the text data is a comment that tells the location of the relay,
The relay section extraction unit determines that the sentence is determined to be a relay comment, the place specified by the place specifying unit, and a comment that appears after the sentence in the text data and conveys the place If there is no difference between the place specified by the place specifying unit and the other sentence that has been determined, it is determined that the comment is a comment that conveys the place from the sentence that is determined to be a relay comment. The corresponding video data section is extracted as a relay section by a local reporter.
The relay section extraction device according to claim 2, wherein
前記文分類部は、前記テキストデータにより示される各文が中継の場所を伝えるコメントであるか否か、及び、中継の映像を説明するコメントであるか否かを判定し、
前記中継区間抽出部は、中継の場所を伝えるコメントであると判定された文について前記場所特定部が特定した場所と、前記テキストデータにおいて当該文より後に出現し、かつ、中継の場所を伝えるコメントあるいは中継の映像を説明するコメントであると判定された他の文について前記場所特定部が特定した場所とに相違がない場合、場所を伝えるコメントであると判定された前記文と、中継の場所を伝えるコメントあるいは中継の映像を説明するコメントであると判定された前記他の文までに対応した前記映像データの区間をレポーターが現地に不在の中継区間として抽出する、
ことを特徴とする請求項1から請求項3のいずれか1項に記載の中継区間抽出装置。
The sentence classification unit determines whether or not each sentence indicated by the text data is a comment that tells a relay location, and whether or not it is a comment explaining a relay video,
The relay section extraction unit identifies a location identified by the location identification unit for a sentence determined to be a comment that conveys a relay location, and a comment that appears after the sentence in the text data and conveys the relay location Alternatively, if there is no difference between the place specified by the place specifying unit for other sentences determined to be comments explaining the video of the relay, the sentence determined to be a comment that conveys the place and the location of the relay The reporter extracts the section of the video data corresponding to the other sentence determined to be a comment explaining the video or the video of the relay as a relay section that is absent from the site,
The relay section extraction device according to any one of claims 1 to 3, wherein
前記中継区間抽出部は、中継の映像を説明するコメントであると判定された異なる2つの文のそれぞれについて前記場所特定部が特定した場所に相違がない場合、前記異なる2つの文に対応した前記映像データの区間をレポーターが現地に不在の中継区間として抽出する、
ことを特徴とする請求項4に記載の中継区間抽出装置。
When there is no difference in the location specified by the location specifying unit for each of two different sentences determined to be comments explaining the video of the relay, the relay section extraction unit corresponds to the two different sentences. The section of the video data is extracted as a relay section where the reporter is not present locally.
The relay section extracting device according to claim 4, wherein
前記中継区間抽出部により抽出された前記中継区間に対応した前記テキストデータにおける文に空撮を表す語句が含まれている場合、前記中継区間を空撮による中継区間であると判定する空撮中継区間抽出部をさらに備える、
ことを特徴とする請求項1から請求項5のいずれか1項に記載の中継区間抽出装置。
Aerial relay for determining that the relay section is a relay section by aerial photography when the sentence in the text data corresponding to the relay section extracted by the relay section extraction unit includes a word representing aerial photography Further comprising a section extraction unit,
The relay section extraction device according to any one of claims 1 to 5, wherein
中継区間抽出装置として用いられるコンピュータを、
番組の映像データと対応付けられたテキストデータにより示される各文から場所に関する語句を抽出し、抽出した前記語句から場所を特定する場所特定部、
前記テキストデータにより示される各文が中継に関する表現を使用したコメントであるか否かを判定する文分類部、
前記文分類部により中継に関する表現を使用したコメントであると判定された異なる2つの文それぞれの前記コメントの種類と、前記異なる2つの文それぞれについて前記場所特定部が特定した場所が相違するか否かとに基づいて、前記異なる2つの文に対応した前記映像データの区間を中継区間として抽出する中継区間抽出部、
として機能させるためのプログラム。
A computer used as a relay section extraction device,
A location specifying unit for extracting a phrase related to a location from each sentence indicated by text data associated with video data of a program, and specifying the location from the extracted phrase;
A sentence classification unit for determining whether or not each sentence indicated by the text data is a comment using an expression related to relay;
The type of the comment for each of the two different sentences determined to be comments using the relay-related expression by the sentence classification unit and the location specified by the place specifying unit for each of the two different sentences is different. Based on the heel, a relay section extraction unit that extracts the section of the video data corresponding to the two different sentences as a relay section,
Program to function as.
JP2013081206A 2013-04-09 2013-04-09 Relay section extraction device and program Active JP6069077B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013081206A JP6069077B2 (en) 2013-04-09 2013-04-09 Relay section extraction device and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013081206A JP6069077B2 (en) 2013-04-09 2013-04-09 Relay section extraction device and program

Publications (2)

Publication Number Publication Date
JP2014203383A true JP2014203383A (en) 2014-10-27
JP6069077B2 JP6069077B2 (en) 2017-01-25

Family

ID=52353741

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013081206A Active JP6069077B2 (en) 2013-04-09 2013-04-09 Relay section extraction device and program

Country Status (1)

Country Link
JP (1) JP6069077B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021067979A (en) * 2019-10-17 2021-04-30 日本放送協会 Summarizing device and program

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007241739A (en) * 2006-03-09 2007-09-20 Nippon Hoso Kyokai <Nhk> Sentence section extracting device and program
JP2009065680A (en) * 2000-12-21 2009-03-26 Koninkl Philips Electronics Nv System and method for providing multimedia summary of video program

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009065680A (en) * 2000-12-21 2009-03-26 Koninkl Philips Electronics Nv System and method for providing multimedia summary of video program
JP2007241739A (en) * 2006-03-09 2007-09-20 Nippon Hoso Kyokai <Nhk> Sentence section extracting device and program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021067979A (en) * 2019-10-17 2021-04-30 日本放送協会 Summarizing device and program
JP7365849B2 (en) 2019-10-17 2023-10-20 日本放送協会 Summarization devices and programs

Also Published As

Publication number Publication date
JP6069077B2 (en) 2017-01-25

Similar Documents

Publication Publication Date Title
CN109688463B (en) Clip video generation method and device, terminal equipment and storage medium
CN113709561B (en) Video editing method, device, equipment and storage medium
US8768070B2 (en) Method, apparatus and computer program product for providing image modification
KR20190137359A (en) Method for providing vedio service and service server using the same
US20090106016A1 (en) Virtual universal translator
CN108197198B (en) Interest point searching method, device, equipment and medium
CN108182211B (en) Video public opinion acquisition method and device, computer equipment and storage medium
CN111107422B (en) Image processing method and device, electronic equipment and computer readable storage medium
KR20160061349A (en) Actionable content displayed on a touch screen
KR20190129266A (en) Content providing server, content providing terminal and content providing method
CN111445902A (en) Data collection method and device, storage medium and electronic equipment
CN112995749A (en) Method, device and equipment for processing video subtitles and storage medium
CN113886612A (en) Multimedia browsing method, device, equipment and medium
CN109889921B (en) Audio and video creating and playing method and device with interaction function
JP6506427B1 (en) INFORMATION PROCESSING APPARATUS, MOVIE SEARCH METHOD, GENERATION METHOD, AND PROGRAM
JP6069077B2 (en) Relay section extraction device and program
CN113705300A (en) Method, device and equipment for acquiring phonetic-to-text training corpus and storage medium
JP2005107931A (en) Image search apparatus
CN108255917B (en) Image management method and device and electronic device
US20140297285A1 (en) Automatic page content reading-aloud method and device thereof
JP4270118B2 (en) Semantic label assigning method, apparatus and program for video scene
US10970910B2 (en) Animation of concepts in printed materials
CN112905838A (en) Information retrieval method and device, storage medium and electronic equipment
CN111259181B (en) Method and device for displaying information and providing information
CN111898595A (en) Information display method and device, electronic equipment and storage medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160229

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161118

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161129

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161226

R150 Certificate of patent or registration of utility model

Ref document number: 6069077

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250