JP2023180357A - Specific control device, distribution system, specific control method, and specific control program - Google Patents

Specific control device, distribution system, specific control method, and specific control program Download PDF

Info

Publication number
JP2023180357A
JP2023180357A JP2022093590A JP2022093590A JP2023180357A JP 2023180357 A JP2023180357 A JP 2023180357A JP 2022093590 A JP2022093590 A JP 2022093590A JP 2022093590 A JP2022093590 A JP 2022093590A JP 2023180357 A JP2023180357 A JP 2023180357A
Authority
JP
Japan
Prior art keywords
video
information
partial
person
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022093590A
Other languages
Japanese (ja)
Inventor
進吾 鈴木
Shingo Suzuki
誠宏 木村
Masahiro Kimura
悠紀子 杉本
Yukiko Sugimoto
圭里 眞榮城
Keiri Maeshiro
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2022093590A priority Critical patent/JP2023180357A/en
Publication of JP2023180357A publication Critical patent/JP2023180357A/en
Pending legal-status Critical Current

Links

Images

Abstract

To identify a portion where a specific person appears and provide the portion where the specific person appears to a viewer even in scenes where a specific person's face is not captured or in video where a specific person's face is not captured.SOLUTION: A specific control device receives person information, obtains video related to a person indicated by person information from a video storage device that stores video, identifies partial video that is a portion that includes the video of the person from the acquired video, identifies partial video position information, which is information indicating where the partial video is included in the video, identifies partial audio that is a portion including audio of the person, identifies partial audio position information, which is information indicating where the partial audio is included in the video, and causes appearance partial information storage means to store appearance partial information indicating the position in the video where the appearance portion, which corresponds to at least one of partial video and partial audio is included, including the partial video position information and the partial audio position information.SELECTED DRAWING: Figure 1

Description

本発明は、特定制御装置等に関する。 The present invention relates to a specific control device and the like.

特定の人物が登場している動画を視聴したい場合、一般的には、視聴者は、まず、特定の人物が登場している動画の名称などを、情報検索サイトなどで検索する。そして、視聴者は、動画配信サイトなどを利用して、特定の人物が登場している動画を視聴する。動画配信サイトは、映画や放送番組などの動画を配信する。 When a viewer wants to watch a video in which a specific person appears, the viewer typically first searches for the name of the video in which the specific person appears on an information search site or the like. Then, the viewer uses a video distribution site or the like to watch a video in which a specific person appears. Video distribution sites distribute videos such as movies and broadcast programs.

特定の人物が登場している部分だけを視聴したい場合、まず、視聴者は、視聴する動画を始点から再生する。そして、視聴者は、特定の人物が登場していないシーンを、早送り再生する。視聴者は、特定の人物が登場しているシーンを発見すると、通常再生を行う。しかし、早送り再生の際、特定の人物が登場していることに気づかず、視聴者が登場シーンを早送り再生してしまう可能性がある。 If the viewer wants to view only the portion in which a specific person appears, the viewer first plays back the video to be viewed from the starting point. The viewer then fast-forwards and plays back scenes in which a specific person does not appear. When a viewer discovers a scene in which a specific person appears, the viewer performs normal playback. However, during fast-forward playback, there is a possibility that the viewer will not notice that a specific person appears and will fast-forward playback the scene in which the character appears.

そのため、特定の人物が登場していない部分をスキップして、特定の人物が登場している部分を視聴できることが望まれている。この機能は、動画提供元(放送局など)にとっても、多くの動画が視聴されることにつながり、収入増につながる可能性がある。 Therefore, it is desired to be able to skip the parts where a specific person does not appear and watch the part where the specific person appears. For video providers (broadcasting stations, etc.), this feature may also lead to more videos being viewed, leading to increased revenue.

これに関連する技術として、特許文献1から特許文献3に記載された技術がある。これらの技術では、動画の中から、検出対象の人物が撮像されている場面を検出し、検出された場面の再生を行う。 Techniques related to this include those described in Patent Documents 1 to 3. In these techniques, a scene in which a person to be detected is imaged is detected from a video, and the detected scene is played back.

特開2013-098997号公報Japanese Patent Application Publication No. 2013-098997 特開2010-257450号公報Japanese Patent Application Publication No. 2010-257450 特開2009-181216号公報Japanese Patent Application Publication No. 2009-181216

特許文献1から特許文献3に記載されている技術では、検出対象の人物の顔画像に基づいて、人物が撮像されている場面が検出される。そのため、その人物の顔が撮像されていない場面や動画、たとえば、その人物の声だけが登場している場面、その人物が後ろ向きで話している場面、アニメ作品などは、検出されない。 In the techniques described in Patent Documents 1 to 3, a scene in which a person is imaged is detected based on a face image of the person to be detected. Therefore, scenes and videos in which the person's face is not captured, such as scenes in which only the person's voice appears, scenes in which the person is backwards talking, and animation works are not detected.

本発明の目的は、上記課題を鑑み、特定の人物の顔が撮像されていない場面や特定の人物の顔が撮像されていない動画についても、特定の人物の登場部分を視聴者に提供することを可能にする特定制御装置等を提供することにある。 In view of the above-mentioned problems, an object of the present invention is to provide viewers with the portion where a specific person appears even in scenes where the specific person's face is not captured or videos in which the specific person's face is not captured. The objective is to provide a specific control device etc. that makes it possible.

本発明の一態様において、特定制御装置は、人物を示す情報である人物情報を受信する受信部と、映像情報と音声情報とを含む動画を記憶している動画記憶装置から、前記人物情報が示す前記人物に関連する前記動画を取得する動画取得部と、取得された前記動画から、前記人物の映像を含む部分である部分映像を特定し、前記動画のどの位置に前記部分映像が含まれているかを示す情報である部分映像位置情報を特定する映像特定部と、取得された前記動画から、前記人物の音声を含む部分である部分音声を特定し、前記動画のどの位置に前記部分音声が含まれていかを示す情報である部分音声位置情報を特定する音声特定部と、取得された前記動画について、前記部分映像および前記部分音声の少なくともいずれかに該当する部分である登場部分が前記動画のどの位置に含まれているかを示す登場部分情報を、前記人物情報と、前記動画に関する情報である動画情報とに対応付けるとともに、前記部分映像位置情報と前記部分音声位置情報とを前記登場部分情報に含めて、前記登場部分情報を記憶する登場部分情報記憶手段に記憶させる制御部とを備える。 In one aspect of the present invention, the specific control device receives the personal information from a receiving unit that receives personal information that is information indicating a person, and a video storage device that stores a video including video information and audio information. a video acquisition unit that acquires the video related to the person shown in the video, and a video acquisition unit that specifies a partial video that is a portion including the video of the person from the acquired video, and in which position of the video the partial video is included. a video specifying unit that specifies partial video position information, which is information indicating whether the person an audio specifying unit that specifies partial audio position information, which is information indicating whether the partial audio is included; Appearance part information indicating which position in the video is included is associated with the person information and video information that is information related to the video, and the partial video position information and the partial audio position information are associated with the appearance part. and a control unit that causes the appearance part information to be stored in the appearance part information storage means for storing the appearance part information in the information.

また、本発明の他の態様において、特定制御方法は、人物を示す情報である人物情報を受信し、映像情報と音声情報とを含む動画を記憶している動画記憶装置から、前記人物情報が示す前記人物に関連する前記動画を取得し、取得された前記動画から、前記人物の映像を含む部分である部分映像を特定し、前記動画のどの位置に前記部分映像が含まれているかを示す情報である部分映像位置情報を特定し、取得された前記動画から、前記人物の音声を含む部分である部分音声を特定し、前記動画のどの位置に前記部分音声が含まれていかを示す情報である部分音声位置情報を特定し、取得された前記動画について、前記部分映像および前記部分音声の少なくともいずれかに該当する部分である登場部分が前記動画のどの位置に含まれているかを示す登場部分情報を、前記人物情報と、前記動画に関する情報である動画情報とに対応付けるとともに、前記部分映像位置情報と前記部分音声位置情報とを前記登場部分情報に含めて、前記登場部分情報を記憶する登場部分情報記憶手段に記憶させる。 In another aspect of the present invention, the identification control method includes receiving person information that is information indicating a person, and selecting the person information from a video storage device that stores a video including video information and audio information. acquiring the video related to the person shown, identifying a partial video that is a portion including the video of the person from the acquired video, and indicating at which position in the video the partial video is included. identifying partial video position information, which is information, identifying partial audio, which is a portion including the voice of the person, from the acquired video, and information indicating at which position in the video the partial audio is included; , and indicates, with respect to the acquired video, in which position of the video the appearance portion that corresponds to at least either the partial video or the partial audio is included. The partial information is associated with the person information and video information that is information related to the video, and the partial video position information and the partial audio position information are included in the appearance partial information and the appearance partial information is stored. The information is stored in the appearance portion information storage means.

また、本発明の他の態様において、特定制御プログラムは、コンピュータに、人物を示す情報である人物情報を受信する受信機能と、映像情報と音声情報とを含む動画を記憶している動画記憶装置から、前記人物情報が示す前記人物に関連する前記動画を取得する動画取得機能と、取得された前記動画から、前記人物の映像を含む部分である部分映像を特定し、前記動画のどの位置に前記部分映像が含まれているかを示す情報である部分映像位置情報を特定する映像特定機能と、取得された前記動画から、前記人物の音声を含む部分である部分音声を特定し、前記動画のどの位置に前記部分音声が含まれていかを示す情報である部分音声位置情報を特定する音声特定機能と、取得された前記動画について、前記部分映像および前記部分音声の少なくともいずれかに該当する部分である登場部分が前記動画のどの位置に含まれているかを示す登場部分情報を、前記人物情報と、前記動画に関する情報である動画情報とに対応付けるとともに、前記部分映像位置情報と前記部分音声位置情報とを前記登場部分情報に含めて、前記登場部分情報を記憶する登場部分情報記憶手段に記憶させる制御機能とを実現させる。 In another aspect of the present invention, the specific control program includes a receiving function for receiving person information, which is information indicating a person, in the computer, and a video storage device storing a video including video information and audio information. A video acquisition function that acquires the video related to the person indicated by the person information, and a video acquisition function that identifies a partial video that is a portion that includes the video of the person from the acquired video, and determines where in the video it is located. A video identification function that identifies partial video position information that is information indicating whether the partial video is included; and a video identification function that identifies partial audio that is a portion that includes the voice of the person from the acquired video; an audio identification function that specifies partial audio position information that is information indicating where the partial audio is included; and a portion of the acquired video that corresponds to at least one of the partial video and the partial audio. Appearance part information indicating where in the video the appearance part is included is associated with the person information and video information that is information related to the video, and the partial video position information and the partial audio position are information is included in the appearance part information and stored in the appearance part information storage means for storing the appearance part information.

本発明によれば、特定の人物の顔が撮像されていない場面や特定の人物の顔が撮像されていない動画についても、特定の人物の登場部分を視聴者に提供することが可能になる。 According to the present invention, it is possible to provide a viewer with a portion in which a specific person appears even in a scene where a specific person's face is not captured or a video in which a specific person's face is not captured.

本発明の第一の実施形態の特定制御装置の構成例を示す図である。1 is a diagram illustrating a configuration example of a specific control device according to a first embodiment of the present invention. 本発明の第一の実施形態の特定制御装置の動作フローの例を示す図である。It is a figure showing an example of an operation flow of a specific control device of a first embodiment of the present invention. 本発明の第二の実施形態の特定制御装置を含むシステムの構成例を示す図である。It is a diagram showing an example of the configuration of a system including a specific control device according to a second embodiment of the present invention. 本発明の第二の実施形態の特定制御装置の構成例を示す図である。It is a figure showing an example of composition of a specific control device of a second embodiment of the present invention. 本発明の第二の実施形態の登場部分情報の例を示す図である。It is a figure which shows the example of the appearance part information of 2nd embodiment of this invention. 本発明の第二の実施形態の動画一覧画像の例を示す図である。FIG. 7 is a diagram showing an example of a video list image according to the second embodiment of the present invention. 本発明の第二の実施形態のオプション画像の例を示す図である。FIG. 7 is a diagram showing an example of an option image according to the second embodiment of the present invention. 本発明の第二の実施形態の操作パネル画像の例を示す図である。It is a figure which shows the example of the operation panel image of 2nd embodiment of this invention. 本発明の第二の実施形態の設定メニュー画像の例を示す図である。It is a figure which shows the example of the setting menu image of 2nd embodiment of this invention. 本発明の第二の実施形態の特定制御装置の動作フローの例を示す図である。It is a figure showing an example of an operation flow of a specific control device of a second embodiment of the present invention. 本発明の第二の実施形態の特定制御装置の動作フローの例を示す図である。It is a figure showing an example of an operation flow of a specific control device of a second embodiment of the present invention. 本発明の第二の実施形態の特定制御装置の動作フローの例を示す図である。It is a figure showing an example of an operation flow of a specific control device of a second embodiment of the present invention. 本発明の第二の実施形態の特定制御装置の動作フローの例を示す図である。It is a figure showing an example of an operation flow of a specific control device of a second embodiment of the present invention. 本発明の第二の実施形態の表示制御装置の動作フローの例を示す図である。It is a figure showing an example of an operation flow of a display control device of a second embodiment of the present invention. 本発明の各実施形態のハードウェア構成例を示す図である。1 is a diagram showing an example of a hardware configuration of each embodiment of the present invention. FIG.

[第一の実施形態]
本発明の第一の実施形態について説明する。第一の実施形態における特定制御装置10の具体的な一例が、後述する第二の実施形態における特定制御装置20である。
[First embodiment]
A first embodiment of the present invention will be described. A specific example of the specific control device 10 in the first embodiment is the specific control device 20 in the second embodiment described later.

図1に本実施形態の特定制御装置10の構成例を示す。本実施形態の特定制御装置10は、受信部11と動画取得部12と映像特定部13と音声特定部14と制御部15とを含む。 FIG. 1 shows a configuration example of a specific control device 10 of this embodiment. The specific control device 10 of this embodiment includes a receiving section 11 , a moving image obtaining section 12 , a video specifying section 13 , an audio specifying section 14 , and a control section 15 .

受信部11は、人物情報を受信する。人物情報は、人物を示す情報である。 The receiving unit 11 receives person information. Person information is information indicating a person.

動画取得部12は、動画記憶装置から、人物情報が示す人物に関連する動画を取得する。動画記憶装置は、動画を記憶している。動画は、映像情報と音声情報とを含む。 The video acquisition unit 12 acquires a video related to the person indicated by the person information from the video storage device. The video storage device stores videos. A video includes video information and audio information.

映像特定部13は、取得された動画から、部分映像を特定する。部分映像は、人物情報が示す人物の映像を含む部分である。また、映像特定部13は、部分映像位置情報を特定する。部分映像位置情報は、動画のどの位置に部分映像が含まれているかを示す情報である。 The video identifying unit 13 identifies a partial video from the acquired video. The partial video is a portion that includes a video of the person indicated by the person information. Further, the video specifying unit 13 specifies partial video position information. Partial video position information is information indicating at which position in a moving image a partial video is included.

音声特定部14は、取得された動画から、部分音声を特定する。部分音声は、人物情報が示す人物の音声を含む部分である。また、音声特定部14は、部分音声位置情報を特定する。部分音声位置情報は、動画のどの位置に部分音声が含まれているかを示す情報である。 The audio identifying unit 14 identifies partial audio from the acquired video. The partial audio is a portion that includes the audio of the person indicated by the personal information. Furthermore, the audio specifying unit 14 specifies partial audio position information. The partial audio position information is information indicating at which position in the video the partial audio is included.

制御部15は、取得された動画について、登場部分情報を登場部分情報記憶手段に記憶させる。登場部分情報は、登場部分が動画のどの位置に含まれているかを示す情報である。登場部分は、部分映像および部分音声の少なくともいずれかに該当する部分である。登場部分情報記憶手段は、登場部分情報を記憶する。このとき、制御部15は、人物情報と動画情報とに対応付けて、登場部分情報を登場部分情報記憶手段に記憶させる。動画情報は、動画に関する情報である。また、制御部15は、登場部分情報に、部分映像位置情報と部分音声位置情報とを含めて、登場部分情報記憶手段に記憶させる。 The control unit 15 causes the appearance part information storage means to store appearance part information regarding the acquired moving image. Appearance part information is information indicating where in the video the appearance part is included. The appearing portion is a portion corresponding to at least one of partial video and partial audio. The appearance part information storage means stores appearance part information. At this time, the control unit 15 causes the appearance part information to be stored in the appearance part information storage means in association with the person information and the video information. The video information is information related to videos. Further, the control unit 15 causes the appearance portion information to include partial video position information and partial audio position information, and stores the appearance portion information in the appearance portion information storage means.

次に、図2に本実施形態の特定制御装置10の動作フローの例を示す。 Next, FIG. 2 shows an example of the operation flow of the specific control device 10 of this embodiment.

受信部11は、人物情報を受信する(ステップS101)。 The receiving unit 11 receives person information (step S101).

動画取得部12は、動画記憶装置から、人物情報が示す人物に関連する動画を取得する(ステップS102)。 The video acquisition unit 12 acquires a video related to the person indicated by the person information from the video storage device (step S102).

映像特定部13は、取得された動画から、部分映像を特定する。また、映像特定部13は、部分映像位置情報を特定する(ステップS103)。 The video identifying unit 13 identifies a partial video from the acquired video. Further, the video specifying unit 13 specifies partial video position information (step S103).

音声特定部14は、取得された動画から、部分音声を特定する。また、音声特定部14は、部分音声位置情報を特定する(ステップS104)。 The audio identifying unit 14 identifies partial audio from the acquired video. Furthermore, the audio specifying unit 14 specifies partial audio position information (step S104).

制御部15は、取得された動画について、登場部分情報を登場部分情報記憶手段に記憶させる(ステップS105)。このとき、制御部15は、登場部分情報に、部分映像位置情報と部分音声位置情報とを含めて、登場部分情報記憶手段に記憶させる。 The control unit 15 causes the appearance portion information storage unit to store appearance portion information regarding the acquired video (step S105). At this time, the control unit 15 causes the appearance part information to include partial video position information and partial audio position information, and stores it in the appearance part information storage means.

以上で説明したように、本発明の第一の実施形態では、特定制御装置10は、受信部11と動画取得部12と映像特定部13と音声特定部14と制御部15とを含む。受信部11は、人物情報を受信する。人物情報は、人物を示す情報である。動画取得部12は、動画記憶装置から、人物情報が示す人物に関連する動画を取得する。動画記憶装置は、動画を記憶している。動画は、映像情報と音声情報とを含む。映像特定部13は、取得された動画から、部分映像を特定する。部分映像は、人物情報が示す人物の映像を含む部分である。また、映像特定部13は、部分映像位置情報を特定する。部分映像位置情報は、動画のどの位置に部分映像が含まれているかを示す情報である。音声特定部14は、取得された動画から、部分音声を特定する。部分音声は、人物情報が示す人物の音声を含む部分である。また、音声特定部14は、部分音声位置情報を特定する。部分音声位置情報は、動画のどの位置に部分音声が含まれているかを示す情報である。制御部15は、取得された動画について、登場部分情報を登場部分情報記憶手段に記憶させる。登場部分情報は、動画のどの位置に登場部分が含まれているかを示す情報である。登場部分は、部分映像および部分音声の少なくともいずれかに該当する部分である。登場部分情報記憶手段は、登場部分情報を記憶する。このとき、制御部15は、人物情報と動画情報とに対応付けて、登場部分情報を登場部分情報記憶手段に記憶させる。動画情報は、動画に関する情報である。また、制御部15は、登場部分情報に、部分映像位置情報と部分音声位置情報とを含めて、登場部分情報記憶手段に記憶させる。 As described above, in the first embodiment of the present invention, the specific control device 10 includes a receiving section 11 , a moving image obtaining section 12 , a video specifying section 13 , an audio specifying section 14 , and a control section 15 . The receiving unit 11 receives person information. Person information is information indicating a person. The video acquisition unit 12 acquires a video related to the person indicated by the person information from the video storage device. The video storage device stores videos. A video includes video information and audio information. The video identifying unit 13 identifies a partial video from the acquired video. The partial video is a portion that includes a video of the person indicated by the person information. Further, the video specifying unit 13 specifies partial video position information. Partial video position information is information indicating at which position in a moving image a partial video is included. The audio identifying unit 14 identifies partial audio from the acquired video. The partial audio is a portion that includes the audio of the person indicated by the personal information. Furthermore, the audio specifying unit 14 specifies partial audio position information. The partial audio position information is information indicating at which position in the video the partial audio is included. The control unit 15 causes the appearance part information storage means to store appearance part information regarding the acquired moving image. The appearance part information is information indicating at which position in the video the appearance part is included. The appearing portion is a portion corresponding to at least one of partial video and partial audio. The appearance part information storage means stores appearance part information. At this time, the control unit 15 causes the appearance part information to be stored in the appearance part information storage means in association with the person information and the video information. The video information is information related to videos. Further, the control unit 15 causes the appearance portion information to include partial video position information and partial audio position information, and stores the appearance portion information in the appearance portion information storage means.

このように、特定制御装置10は、部分映像位置情報と部分音声位置情報とを特定し、部分映像位置情報と部分音声位置情報とを登場部分情報に含めて、登場部分情報記憶手段に記憶させる。これにより、表示制御装置は、登場部分情報記憶手段に記憶されている登場部分情報を参照して、登場部分情報に関する情報を視聴者端末に表示させることが可能になる。また、表示制御装置は、登場部分情報を参照して、登場部分を視聴者に提供することができる。そのため、特定の人物の顔が撮像されていない場面や特定の人物の顔が撮像されていない動画についても、特定の人物の登場部分を視聴者に提供することが可能になる。 In this way, the identification control device 10 identifies the partial video position information and the partial audio position information, includes the partial video position information and the partial audio position information in the appearance part information, and stores the partial video position information and the partial audio position information in the appearance part information storage means. . This makes it possible for the display control device to refer to the appearance part information stored in the appearance part information storage means and display information related to the appearance part information on the viewer terminal. Further, the display control device can refer to the appearance portion information and provide the appearance portion to the viewer. Therefore, even in scenes where the face of a specific person is not captured or videos in which the face of a specific person is not captured, it is possible to provide the viewer with the portion in which the specific person appears.

[第二の実施形態]
次に、本発明の第二の実施形態における特定制御装置20について説明する。第一の実施形態における特定制御装置10の具体的な一例が、第二の実施形態における特定制御装置20である。
[Second embodiment]
Next, a specific control device 20 according to a second embodiment of the present invention will be described. A specific example of the specific control device 10 in the first embodiment is the specific control device 20 in the second embodiment.

まず、図3に、本実施形態の特定制御装置20を含む配信システム80の構成例を示す。配信システム80は、特定制御装置20、抽出エンジン30、登場部分情報記憶手段40および表示制御装置50を含む。特定制御装置20は、抽出エンジン30と登場部分情報記憶手段40とに接続される。また、特定制御装置20は、動画記憶装置60-i(iは1以上N以下の整数)に接続される。表示制御装置50は、登場部分情報記憶手段40に接続される。また、表示制御装置50は、動画記憶装置60-iに接続される。視聴者端末70は、表示制御装置50に接続されることができる。 First, FIG. 3 shows a configuration example of a distribution system 80 including the specific control device 20 of this embodiment. The distribution system 80 includes a specific control device 20, an extraction engine 30, an appearance portion information storage means 40, and a display control device 50. The specific control device 20 is connected to the extraction engine 30 and the appearance portion information storage means 40. Further, the specific control device 20 is connected to a video storage device 60-i (i is an integer from 1 to N, inclusive). The display control device 50 is connected to the appearance portion information storage means 40. Furthermore, the display control device 50 is connected to a video storage device 60-i. The viewer terminal 70 can be connected to the display control device 50.

動画記憶装置60-iは、動画を蓄積している。動画は、映像情報と音声情報とを含む。動画は、たとえば、映画や放送番組などであるが、これらに限られない。また、動画記憶装置60-iは、特定制御装置20から要求された動画を、特定制御装置20へ送信する。また、動画記憶装置60-iは、表示制御装置50から要求された動画を、表示制御装置50へ送信する。動画記憶装置60-iは、たとえば、放送局や映画配信事業者などによって提供される。動画記憶装置60-iを提供する事業者を、配信事業者とよぶことがある。 The video storage device 60-i stores videos. A video includes video information and audio information. Videos include, for example, movies and broadcast programs, but are not limited to these. Further, the video storage device 60-i transmits the video requested by the specific control device 20 to the specific control device 20. Further, the video storage device 60-i transmits the video requested by the display control device 50 to the display control device 50. The video storage device 60-i is provided by, for example, a broadcasting station or a movie distributor. A business that provides the video storage device 60-i is sometimes referred to as a distribution business.

視聴者端末70は、動画を視聴したい視聴者によって利用される端末である。視聴者端末70は、たとえば、スマートフォン、携帯電話機、パーソナルコンピュータ等の通信装置である。視聴者端末70は、視聴者によって視聴が希望されている動画の情報、たとえば、視聴が希望されている人物の情報を、表示制御装置50に入力することができる。また、視聴者端末70は、再生開始、再生停止といった、動画の再生操作に関する指示を、表示制御装置50に入力することができる。動画は、表示制御装置50経由で、動画記憶装置60-iから視聴者端末70に提供される。 The viewer terminal 70 is a terminal used by a viewer who wants to view a video. The viewer terminal 70 is, for example, a communication device such as a smartphone, a mobile phone, or a personal computer. The viewer terminal 70 can input information about a video that the viewer desires to view, for example, information about a person who the viewer desires to view, to the display control device 50. Furthermore, the viewer terminal 70 can input instructions related to video playback operations, such as starting playback and stopping playback, to the display control device 50. The video is provided from the video storage device 60-i to the viewer terminal 70 via the display control device 50.

特定制御装置20および抽出エンジン30については、後述する。 The specific control device 20 and extraction engine 30 will be described later.

登場部分情報記憶手段40は、登場部分情報を記憶する。登場部分情報は、人物情報と動画情報とに対応付けられている。人物情報は、人物を示す情報である。動画情報は、動画に関する情報である。登場部分情報は、動画のどの位置に登場部分が含まれているかを示す情報である。登場部分は、部分映像および部分音声の少なくともいずれかに該当する部分である。部分映像位置情報は、動画のどの位置に部分映像が含まれているかを示す情報である。部分音声位置情報は、動画のどの位置に部分音声が含まれているかを示す情報である。部分映像は、動画のうち、人物情報が示す人物の映像を含む部分である。部分映像は、動画のうち、人物情報が示す人物の音声を含む部分である。 The appearance part information storage means 40 stores appearance part information. Appearance information is associated with person information and video information. Person information is information indicating a person. The video information is information related to videos. The appearance part information is information indicating at which position in the video the appearance part is included. The appearing portion is a portion corresponding to at least one of partial video and partial audio. Partial video position information is information indicating at which position in a moving image a partial video is included. The partial audio position information is information indicating at which position in the video the partial audio is included. The partial video is a portion of the video that includes the video of the person indicated by the person information. The partial video is a portion of the video that includes the voice of the person indicated by the person information.

表示制御装置50は、視聴者端末70から人物情報が入力された場合に、入力された人物情報に対応付けられている登場部分情報を、登場部分情報記憶手段40から取得する。そして、登場部分情報に関する情報を、視聴者端末70に提供する。また、表示制御装置50は、動画を動画記憶装置60-iから取得して視聴者端末70に再生させる。表示制御装置50の詳細については後述する。 When character information is input from the viewer terminal 70, the display control device 50 acquires appearance part information associated with the input character information from the appearance part information storage means 40. Then, information regarding the appearance portion information is provided to the viewer terminal 70. Furthermore, the display control device 50 obtains a video from the video storage device 60-i and causes the viewer terminal 70 to reproduce the video. Details of the display control device 50 will be described later.

次に、図4に、本実施形態の特定制御装置20の構成例を示す。特定制御装置20は、受信部21、動画取得部22、映像特定部23、音声特定部24および制御部25を含む。 Next, FIG. 4 shows a configuration example of the specific control device 20 of this embodiment. The specific control device 20 includes a receiving section 21 , a moving image obtaining section 22 , a video specifying section 23 , an audio specifying section 24 , and a control section 25 .

受信部21は、人物情報を受信する。人物情報は、人物を示す情報である。特定制御装置20の記憶部(不図示)には、あらかじめ、登場部分情報の作成対象の人物の人物情報のリストが記憶されている。このリストを、以降、抽出人物リストとよぶ。抽出人物リストは、たとえば、有名な俳優、政治家、タレント等の人物情報である。受信部21は、抽出人物リストから人物情報を読み込むことで、人物情報を受信する。 The receiving unit 21 receives person information. Person information is information indicating a person. A storage unit (not shown) of the specific control device 20 stores in advance a list of person information of persons for whom appearance portion information is to be created. This list is hereinafter referred to as an extraction person list. The extracted person list is, for example, information on people such as famous actors, politicians, and entertainers. The receiving unit 21 receives person information by reading the person information from the extracted person list.

動画取得部22は、動画記憶装置60-iから、人物情報が示す人物に関連する動画を取得する。ここでの人物情報は、受信部21が受信した人物情報である。人物情報が示す人物に関連する動画を取得することを、以降、動画取得とよぶことがある。動画取得部22は、人物情報が示す一人の人物について、関連する動画を取得する。一人の人物について、動画取得部22が動画取得を行い、後述の映像特定部23、音声特定部24および制御部25の処理が行われると、受信部21が新たに別の人物の人物情報を受信する。そして、新たな人物について、動画取得部22、映像特定部23、音声特定部24および制御部25の処理が行われる。 The video acquisition unit 22 acquires a video related to the person indicated by the person information from the video storage device 60-i. The personal information here is the personal information received by the receiving unit 21. Obtaining a video related to the person indicated by the personal information may hereinafter be referred to as video acquisition. The video acquisition unit 22 acquires a video related to one person indicated by the person information. When the video acquisition section 22 acquires a video for one person and the processing of the video identification section 23, audio identification section 24, and control section 25 described later is performed, the reception section 21 newly acquires the person information of another person. Receive. Then, processing by the moving image acquisition section 22, the video specifying section 23, the audio specifying section 24, and the control section 25 is performed on the new person.

動画記憶装置60-iは、動画を記憶している。動画は、映像情報と音声情報とを含む。また、動画記憶装置60-iは、動画と対応付けて、メタデータを記憶している。メタデータは、出演者情報などのテキストデータである。また、動画記憶装置60-iは、動画と対応付けて、動画の作品名、話数、制作年などのデータも記憶している。 The moving image storage device 60-i stores moving images. A video includes video information and audio information. Further, the video storage device 60-i stores metadata in association with the video. Metadata is text data such as performer information. The video storage device 60-i also stores data such as the title of the video, the number of episodes, and the year of production in association with the video.

動画取得部22は、たとえば、以下のように、動画取得を行う。動画取得部22は、人物情報として、たとえば、人物名を動画記憶装置60-iに送信する。そして、動画記憶装置60-iから、メタデータに当該人物名が含まれる動画が、動画取得部22に送信される。動画取得部22は、動画記憶装置60-iから送信された動画を受信する。 The video acquisition unit 22 acquires a video as follows, for example. The video acquisition unit 22 transmits, for example, a person's name to the video storage device 60-i as the person information. Then, the video whose metadata includes the person's name is transmitted from the video storage device 60-i to the video acquisition unit 22. The video acquisition unit 22 receives the video transmitted from the video storage device 60-i.

なお、古い動画の場合、メタデータが存在しない場合がある。そのため、特定制御装置20は、さらに、メタデータ抽出部(不図示)を備えていてもよい。メタデータ抽出部は、動画記憶装置60-iの各々から、メタデータがない動画を受信する。そして、メタデータ抽出部は、動画の最後部などに存在するテロップを文字認識し、認識した文字データをメタデータとして動画記憶装置60-iに記憶させてもよい。なお、メタデータ抽出部は、動画取得部22が動画取得を行うより前に、メタデータの抽出を行うとよい。 Note that in the case of old videos, metadata may not exist. Therefore, the specific control device 20 may further include a metadata extraction section (not shown). The metadata extraction unit receives a video without metadata from each video storage device 60-i. Then, the metadata extraction unit may perform character recognition on a subtitle present at the end of the video, and store the recognized character data in the video storage device 60-i as metadata. Note that the metadata extraction unit preferably extracts metadata before the video acquisition unit 22 acquires the video.

動画記憶装置60-iには、膨大な数の動画が記憶されている可能性がある。この場合に、動画記憶装置60-iに記憶されているすべての動画から動画取得を行うと、動画取得や、映像特定部23における部分映像の特定や、音声特定部24における部分音声の特定に時間がかかる可能性がある。そのため、動画取得部22は、人物名に加えて制作年を動画記憶装置60-iに対して指定し、指定した制作年に該当する動画の中から動画取得を行ってもよい。たとえば、動画取得部22は、初めて動画取得を行う場合には、過去10年分の動画を取得し、次に、さらに10年分ずつさかのぼって動画を取得するようにしてもよい。また、動画取得部22は、制作年とは異なる基準で取得する動画の範囲を指定してもよい。たとえば、動画取得部22は、視聴された回数が多い順や、放送番組の場合には放送した際の視聴率が高い順などで、動画を取得してもよい。この場合、動画記憶装置60-iは。各々の動画に対応付けて、視聴された回数や視聴率の情報を記憶している。 There is a possibility that a huge number of videos are stored in the video storage device 60-i. In this case, if video acquisition is performed from all videos stored in the video storage device 60-i, video acquisition, partial video identification in the video identification unit 23, and partial audio identification in the audio identification unit 24 will be difficult. It may take some time. Therefore, the video acquisition unit 22 may specify the year of production in addition to the person's name to the video storage device 60-i, and acquire the video from among the videos that correspond to the specified year of production. For example, when acquiring a video for the first time, the video acquisition unit 22 may acquire videos for the past 10 years, and then go back 10 years to acquire videos. Further, the video acquisition unit 22 may specify the range of the video to be acquired based on a criterion different from the year of production. For example, the video acquisition unit 22 may acquire videos in order of the number of times they have been viewed, or in the case of a broadcast program, in order of the viewership rating when broadcast. In this case, the video storage device 60-i. It stores information on the number of times it has been viewed and viewership rating in association with each video.

また、動画記憶装置60-iに記憶されているすべての動画を対象とした動画取得が完了しても、その後、新たな動画が動画記憶装置60-iに追加される可能性がある。そのため、動画取得部22は、所定時間おき(1日1回や1週間に1回など)に、動画取得を再度行ってもよい。この場合、動画取得部22は、すでに取得されて、人物情報に対応する登場部分情報が登場部分情報記憶手段40に記憶されている動画については、取得の対象外とするとよい。 Further, even if video acquisition for all videos stored in the video storage device 60-i is completed, a new video may be added to the video storage device 60-i after that. Therefore, the video acquisition unit 22 may acquire the video again at predetermined intervals (such as once a day or once a week). In this case, the video acquisition unit 22 may exclude a video that has already been acquired and whose appearance part information corresponding to the person information is stored in the appearance part information storage means 40 from being acquired.

映像特定部23は、動画取得部22によって取得された動画について、部分映像を特定する。部分映像は、人物情報が示す人物の映像を含む部分である。また、映像特定部23は、部分映像位置情報を特定する。部分映像位置情報は、動画のどの位置に部分映像が含まれているかを示す情報である。 The video identifying unit 23 identifies partial videos of the video acquired by the video acquiring unit 22. The partial video is a portion that includes a video of the person indicated by the person information. Further, the video specifying unit 23 specifies partial video position information. Partial video position information is information indicating at which position in a moving image a partial video is included.

より具体的には、映像特定部23は、動画取得部22によって取得された動画を、抽出エンジン30に入力する。抽出エンジン30は、入力された動画に基づいて、部分映像を特定し、部分映像位置情報を特定する。 More specifically, the video specifying unit 23 inputs the video acquired by the video acquiring unit 22 to the extraction engine 30. The extraction engine 30 identifies partial videos and identifies partial video position information based on the input video.

抽出エンジン30は、たとえば、人物情報が示す人物の顔画像に基づいて部分映像を特定することができる。この場合、たとえば、映像特定部23は、顔画像と動画とを抽出エンジン30に入力してもよい。また、この場合、特定制御装置20の記憶部(不図示)には、抽出人物リストの人物情報と対応付けて、人物情報が示す人物の顔画像が記憶されていてもよい。 For example, the extraction engine 30 can identify the partial video based on the face image of the person indicated by the person information. In this case, for example, the video specifying unit 23 may input the face image and the video to the extraction engine 30. Further, in this case, the storage unit (not shown) of the specific control device 20 may store a face image of a person indicated by the person information in association with the person information in the extraction person list.

また、抽出エンジン30は、たとえば、顔画像の入力を必要としない方法で、部分映像を特定してもよい。この場合、映像特定部23は、動画取得部22によって取得された複数の動画を抽出エンジン30へ入力する。抽出エンジン30は、たとえば、入力された複数の動画のうち、より多くの動画に登場している人物を部分映像の特定対象の人物として、部分映像を特定してもよい。 Furthermore, the extraction engine 30 may identify the partial video by a method that does not require input of a facial image, for example. In this case, the video specifying unit 23 inputs the plurality of videos acquired by the video acquiring unit 22 to the extraction engine 30. For example, the extraction engine 30 may specify a partial video by setting a person who appears in more videos out of a plurality of input videos as a person to be identified in the partial video.

部分映像位置情報は、たとえば、動画の始点からの再生時間によって、部分映像の位置を示すものであってもよい。なお、動画の始点からの再生時間を、以降、タイムコードとよぶことがある。部分映像位置情報は、たとえば、部分映像の開始位置のタイムコードと、部分映像の終了位置のタイムコードとを含む。 The partial video position information may indicate the position of the partial video, for example, based on the playback time from the starting point of the video. Note that the playback time from the starting point of a video may be referred to as a time code hereinafter. The partial video position information includes, for example, a time code of the start position of the partial video and a time code of the end position of the partial video.

抽出エンジン30が部分映像位置情報を特定すると、映像特定部23は、部分映像位置情報を抽出エンジン30から受信する。 When the extraction engine 30 specifies partial video position information, the video specifying unit 23 receives the partial video position information from the extraction engine 30.

制御部25は、映像特定部23が部分映像位置情報を抽出エンジン30から受信すると、受信した部分映像位置情報を登場部分情報に含める。そして、制御部25は、登場部分情報を、人物情報および動画情報に対応付けて、登場部分情報記憶手段40に記憶させる。動画情報は、動画に関する情報である。動画情報は、たとえば、動画の提供元の動画記憶装置名、作品名、話数、制作年などを含む。 When the video specifying unit 23 receives the partial video position information from the extraction engine 30, the control unit 25 includes the received partial video position information in the appearance portion information. Then, the control unit 25 causes the appearance part information to be stored in the appearance part information storage means 40 in association with the person information and the video information. The video information is information related to videos. The video information includes, for example, the name of the video storage device that provides the video, the title of the work, the number of episodes, the year of production, and the like.

図5に、登場部分情報記憶手段40に記憶される登場部分情報の例を示す。図5の例では、人物情報として人物名「俳優A」が記憶されている。また、動画記憶装置名、作品名、制作年が、動画情報として記憶されている。また、登場部分情報として、タイムコードが記憶されている。登場部分情報は、タイムコードとともに、映像部分であるか、音声部分であるか、映像部分かつ音声部分であるかを示す情報を含んでいてもよい。 FIG. 5 shows an example of the appearance part information stored in the appearance part information storage means 40. In the example of FIG. 5, a person name "actor A" is stored as the person information. Further, the name of the video storage device, the name of the work, and the year of production are stored as video information. Additionally, a time code is stored as the appearance portion information. The appearance part information may include information indicating whether the part is a video part, an audio part, or a video part and an audio part, along with a time code.

また、映像特定部23は、部分映像から、サムネイル画像を生成してもよい。映像特定部23は、部分映像の始点における映像、始点から所定時間後の映像、部分映像のうち動きが小さい部分の映像などから、サムネイル画像を生成することができる。また、制御部25は、登場部分情報と対応付けて、サムネイル画像を登場部分情報記憶手段40に記憶させてもよい。 Further, the video specifying unit 23 may generate a thumbnail image from the partial video. The video specifying unit 23 can generate a thumbnail image from the video at the starting point of the partial video, the video after a predetermined time from the starting point, the video of a portion of the partial video with small movement, and the like. Further, the control unit 25 may cause the appearance part information storage means 40 to store the thumbnail image in association with the appearance part information.

音声特定部24は、動画取得部22によって取得された動画から、部分音声を特定する。部分音声は、人物情報が示す人物の音声を含む部分である。また、音声特定部24は、部分音声位置情報を特定する。部分音声位置情報は、動画のどの部分に部分音声が含まれているかを示す情報である。 The audio identification unit 24 identifies partial audio from the video acquired by the video acquisition unit 22. The partial audio is a portion that includes the audio of the person indicated by the personal information. Furthermore, the audio specifying unit 24 specifies partial audio position information. The partial audio position information is information indicating in which part of the video the partial audio is included.

たとえば、音声特定部24は、映像特定部23で特定された部分映像が存在する場合には、当該部分映像を用いて、人物情報が示す人物の音声特徴情報を取得する。音声特徴情報は、声紋パターンなど、人物の音声を識別可能な情報である。なお、音声特徴情報の取得は、抽出エンジン30によって実施されてもよい。 For example, if the partial video identified by the video identifying unit 23 exists, the audio specifying unit 24 uses the partial video to acquire audio characteristic information of the person indicated by the person information. The voice feature information is information such as a voiceprint pattern that can identify a person's voice. Note that the acquisition of the audio feature information may be performed by the extraction engine 30.

より具体的には、音声特定部24は、映像特定部23で特定された部分映像の中から、撮像されている人物が一人である部分を抽出する。そして、抽出された部分の音声に基づいて、音声特徴情報を取得する。抽出エンジン30が、部分映像の各々について、撮像されている人物の人数の情報を付与できることも考えられる。その場合には、音声特定部24は、当該情報に基づいて、撮像されている人物が一人である部分を抽出してもよい。また、音声特定部24は、抽出した音声特徴情報を、人物情報に対応付けて、記憶部に記憶させてもよい。 More specifically, the audio specifying unit 24 extracts a portion in which only one person is being imaged from the partial video specified by the video specifying unit 23 . Then, voice feature information is acquired based on the extracted portion of the voice. It is also conceivable that the extraction engine 30 can add information about the number of people being imaged to each partial video. In that case, the audio identifying unit 24 may extract a portion where only one person is being imaged based on the information. Further, the voice specifying unit 24 may cause the storage unit to store the extracted voice feature information in association with the person information.

そして、音声特定部24は、取得した音声特徴情報と動画とを抽出エンジン30に入力する。抽出エンジン30は、部分音声を特定し、また、部分音声位置情報を特定する。 Then, the audio specifying unit 24 inputs the acquired audio feature information and the video to the extraction engine 30. The extraction engine 30 identifies partial audio and also identifies partial audio position information.

部分音声位置情報は、たとえば、動画の始点からの再生時間によって、部分音声の位置を示すものであってもよい。部分音声位置情報は、たとえば、部分音声の開始位置のタイムコードと、部分音声の終了位置のタイムコードとを含む。 The partial audio position information may indicate the position of the partial audio, for example, based on the playback time from the starting point of the video. The partial audio position information includes, for example, the time code of the starting position of the partial audio and the time code of the ending position of the partial audio.

声優など、部分映像が抽出されない可能性がある人物については、あらかじめ、特定制御装置20の記憶部に、抽出人物リストの人物情報と対応付けて、人物情報が示す人物の音声特徴情報が記憶されていてもよい。または、音声特定部24は、一または複数の動画について、音声特徴情報を取得する箇所を指定する情報を受信し、当該情報で指定された箇所の音声から音声特徴情報を取得してもよい。この場合、動画取得部22は、音声特徴情報を取得する箇所を管理者が指定するための画像を、管理者用端末(不図示)に表示させてもよい。 For people such as voice actors whose partial images may not be extracted, the voice characteristic information of the person indicated by the person information is stored in advance in the storage unit of the specific control device 20 in association with the person information in the extraction person list. You can leave it there. Alternatively, the audio specifying unit 24 may receive information specifying a location from which audio feature information is to be obtained for one or more videos, and may obtain audio feature information from the audio at the location specified by the information. In this case, the video acquisition unit 22 may display an image on the administrator terminal (not shown) for the administrator to specify the location where the audio feature information is to be acquired.

制御部25は、音声特定部24が部分音声位置情報を抽出エンジン30から受信すると、受信した部分音声位置情報を登場部分情報に含めて、登場部分情報記憶手段40に記憶させる。同じ人物情報および同じ動画情報に対応付けられている登場部分情報が登場部分情報記憶手段40にすでに記憶されている場合には、制御部25は、部分音声位置情報を登場部分情報に追加する。人物情報に対応付けられている登場部分情報が登場部分情報記憶手段40に記憶されていない場合には、制御部25は、人物情報と動画情報とに対応付けて、部分音声位置情報を登場部分情報に含めて、登場部分情報記憶手段40に記憶させる。また、制御部25は、動画情報に対応付けられている登場部分情報が登場部分情報記憶手段40に記憶されていない場合にも、人物情報と動画情報とに対応付けて、部分音声位置情報を登場部分情報に含めて、登場部分情報記憶手段40に記憶させる。 When the voice specifying unit 24 receives the partial voice position information from the extraction engine 30, the control unit 25 includes the received partial voice position information in the appearance part information and stores it in the appearance part information storage means 40. If the appearance part information associated with the same person information and the same video information is already stored in the appearance part information storage means 40, the control unit 25 adds the partial audio position information to the appearance part information. If the appearance part information associated with the person information is not stored in the appearance part information storage means 40, the control unit 25 associates the partial audio position information with the person information and the video information, and stores the appearance part information in association with the person information and video information. It is included in the information and stored in the appearance portion information storage means 40. Furthermore, even when the appearance part information associated with the video information is not stored in the appearance part information storage means 40, the control unit 25 stores the partial audio position information in association with the person information and the video information. It is included in the appearance part information and stored in the appearance part information storage means 40.

また、音声特定部24は、さらに、部分音声を文字情報に変換してもよい。なお、文字情報への変換は、文字起こしともよばれる。この場合、抽出エンジン30は、さらに、文字起こしの機能を備えていてもよい。また、抽出エンジン30は、部分音声の特定に続き、または、部分音声の特定と並行して、文字起こしを行ってもよい。抽出エンジン30は、部分音声の特定と並行して文字起こしを行う場合、まず、部分音声以外の部分についても文字起こしを行い、部分音声として特定された部分の文字情報を、部分音声の文字情報として出力する。また、音声特定部24または抽出エンジン30は、音声特徴情報に基づいて、人物情報が示す人物の音声のみの文字起こしを行ってもよい。 Furthermore, the voice specifying unit 24 may further convert the partial voice into text information. Note that conversion into character information is also called transcription. In this case, the extraction engine 30 may further include a transcription function. Furthermore, the extraction engine 30 may perform transcription following or in parallel with identifying the partial audio. When performing transcription in parallel with identifying partial audio, the extraction engine 30 first transcribes parts other than the partial audio, and converts the character information of the part identified as partial audio into the character information of the partial audio. Output as . Furthermore, the voice specifying unit 24 or the extraction engine 30 may transcribe only the voice of the person indicated by the person information based on the voice feature information.

制御部25は、登場部分情報と対応付けて、部分音声の文字情報を登場部分情報記憶手段40に記憶させる。 The control unit 25 causes the character information of the partial voice to be stored in the appearance portion information storage means 40 in association with the appearance portion information.

次に、本実施形態の表示制御装置50について説明する。 Next, the display control device 50 of this embodiment will be explained.

表示制御装置50は、視聴者端末70からの要求に応じて、動画記憶装置60-iから動画を取得し、視聴者端末70に表示させる。表示制御装置50には、視聴者が動画を視聴したい人物の人物情報が入力される。なお、視聴者が動画を視聴したい人物は、視聴対象人物と呼ばれることがある。また、視聴対象人物の人物情報を、視聴対象人物情報と呼ぶことがある。表示制御装置50は、視聴対象人物情報に対応付けられている登場部分情報を登場部分情報記憶手段40から取得し、登場部分情報に関する画像を、視聴者端末70に表示させる。 The display control device 50 obtains a video from the video storage device 60-i in response to a request from the viewer terminal 70, and causes the viewer terminal 70 to display the video. Personal information of a person whose video the viewer wants to view is input to the display control device 50. Note that a person whose video the viewer wants to watch may be called a viewing target person. Further, the personal information of the viewing target person may be referred to as viewing target person information. The display control device 50 acquires the appearance part information associated with the viewing target person information from the appearance part information storage means 40, and causes the viewer terminal 70 to display an image related to the appearance part information.

図6に、表示制御装置50が視聴者端末70に表示させる動画一覧画像の例を示す。動画一覧画像は、視聴対象人物に関する動画の一覧を含む。動画一覧画像は、図6の例では、視聴対象人物が登場する部分のタイムコードを含む。タイムコードの欄には、登場部分のタイムコードが示される。また、図6の例のように、動画一覧画像は、サムネイル画像を含んでいてもよい。 FIG. 6 shows an example of a video list image displayed on the viewer terminal 70 by the display control device 50. The video list image includes a list of videos related to the viewing target person. In the example of FIG. 6, the video list image includes the time code of the portion where the person to be viewed appears. The time code column shows the time code of the appearing part. Furthermore, as in the example of FIG. 6, the video list image may include thumbnail images.

また、図6の例のように、動画一覧画像は、視聴者がどこまで動画を視聴したかの情報を含んでいてもよい。この場合、表示制御装置50は、どこまで動画を視聴したかの情報を、視聴者に関する情報である視聴者情報として、登場部分情報記憶手段40または表示制御装置50の記憶部(不図示)に記憶させておく。そして、表示制御装置50は、視聴済みの動画の情報として、視聴済みであることを示す。また、表示制御装置50は、登場部分の各々について、視聴済みか否かを示してもよい。 Further, as in the example of FIG. 6, the video list image may include information on how far the viewer has viewed the video. In this case, the display control device 50 stores information on how far the video has been viewed as viewer information, which is information related to the viewer, in the appearance portion information storage means 40 or a storage section (not shown) of the display control device 50. I'll let you. Then, the display control device 50 indicates that the video has been viewed as information about the video that has been viewed. Furthermore, the display control device 50 may indicate whether or not each appearing portion has been viewed.

また、動画一覧画像は、図6の例のように、登場部分の合計時間の情報を含んでいてもよい。また、動画一覧画像は、視聴済みの時間の情報や、合計時間から視聴済みの時間を引いた残り時間の情報を含んでいてもよい。 Furthermore, the video list image may include information on the total time of the appearing portions, as in the example of FIG. Further, the video list image may include information on the viewing time and information on the remaining time obtained by subtracting the viewing time from the total time.

また、表示制御装置50は、図6の例のように、共有された回数や「いいね」の回数を、動画一覧画像に表示させてもよい。なお、「いいね」は、視聴者が動画に好感を持った場合に視聴者端末70から表示制御装置50に入力される。この場合、表示制御装置50は、記憶部に記憶されている共有回数や「いいね」の回数を、動画一覧画像に表示させる。共有や「いいね」の方法については、後述する。 Further, the display control device 50 may display the number of times the video has been shared and the number of "likes" on the video list image, as in the example of FIG. 6 . Note that "like" is input from the viewer terminal 70 to the display control device 50 when the viewer has a favorable impression of the video. In this case, the display control device 50 causes the number of shares and the number of "likes" stored in the storage unit to be displayed on the video list image. How to share and "like" will be explained later.

なお、動画一覧画像は、たとえば、作品名の順、制作年や注目度によって、動画の情報をソートしたものであってもよい。注目度は、たとえば、共有回数や「いいね」の回数であってもよい。 Note that the video list image may be one in which video information is sorted, for example, by title of work, year of production, or degree of attention. The degree of attention may be, for example, the number of shares or the number of "likes".

また、動画一覧画像は、図6の例のように、新たに見つかった動画があることを示す表示を含んでいてもよい。 Further, the video list image may include a display indicating that there is a newly found video, as in the example of FIG.

表示制御装置50は、登場部分情報記憶手段40から、視聴者端末70によって指定された視聴対象人物の人物情報に対応する登場部分情報を登場部分情報記憶手段40から取得して、登場部分情報に関する情報を動画一覧画像として視聴者端末70に表示させる。このとき、表示制御装置50は、視聴者ごとに、視聴者情報を記憶部に記憶させる。視聴者情報は、登場部分情報記憶手段40から取得した登場部分情報と、動画がどこまで視聴されたかの情報を含む。視聴者情報に含まれる登場部分情報は、人物情報ごとに記憶される。表示制御装置50は、登場部分情報を登場部分情報記憶手段40から取得すると、まず、記憶部に記憶されている視聴者情報に含まれている登場部分情報と比較する。記憶部に記憶されている登場部分情報は、前回登場部分情報を取得したときの情報である。そして、今回取得した登場部分情報に、前回取得した登場部分情報にはない動画が含まれている場合、表示制御装置50は、新たに見つかった動画があることを示す表示を、動画一覧画像に表示させる。また、表示制御装置50は、視聴者情報を最新に更新する。 The display control device 50 acquires the appearance part information corresponding to the person information of the person to be viewed designated by the viewer terminal 70 from the appearance part information storage means 40, and obtains the appearance part information corresponding to the appearance part information from the appearance part information storage means 40. The information is displayed on the viewer terminal 70 as a video list image. At this time, the display control device 50 causes the storage unit to store viewer information for each viewer. The viewer information includes the appearance part information acquired from the appearance part information storage means 40 and information on how far the video has been viewed. The appearance part information included in the viewer information is stored for each person information. When the display control device 50 acquires the appearance part information from the appearance part information storage means 40, it first compares it with the appearance part information included in the viewer information stored in the storage unit. The appearance part information stored in the storage unit is the information when the appearance part information was acquired last time. Then, if the appearance part information acquired this time includes a video that is not in the appearance part information acquired last time, the display control device 50 displays a display indicating that there is a newly found video in the video list image. Display. The display control device 50 also updates the viewer information to the latest version.

表示制御装置50は、動画一覧画像に動画情報が含まれる動画を動画記憶装置60-iから取得して、視聴者端末70に再生させる。動画単位での購入またはレンタルの場合には、表示制御装置50は、登場部分でない部分をスキップしながら、登場部分を視聴者端末70に再生させる。登場部分単位での購入またはレンタルの場合には、表示制御装置50は、登場部分の動画を動画記憶装置60-iから取得して、視聴者端末70に再生させる。 The display control device 50 acquires a video whose video information is included in the video list image from the video storage device 60-i, and causes the viewer terminal 70 to play the video. In the case of purchasing or renting video units, the display control device 50 causes the viewer terminal 70 to play back the appearing portions while skipping the portions that are not appearing. In the case of purchasing or renting the appearing portion, the display control device 50 obtains the moving image of the appearing portion from the moving image storage device 60-i, and causes the viewer terminal 70 to reproduce it.

また、表示制御装置50は、視聴者端末70からの要求に応じて、オプション画像を視聴者端末70に表示させてもよい。図7にオプション画像の例を示す。オプション画像は、動画再生や動画検索に関する設定のための画像である。表示制御装置50は、オプション画像の設定に従って動作する。オプション画像は、たとえば、どこから動画を再生するかの設定を含んでいてもよい。 Further, the display control device 50 may display an optional image on the viewer terminal 70 in response to a request from the viewer terminal 70. FIG. 7 shows an example of an option image. The option image is an image for settings related to video playback and video search. The display control device 50 operates according to the settings of the option image. The option image may include, for example, settings for where to play the video.

また、オプション画像は、CM(Commercial Message)として、視聴対象人物が登場する映像を使用するか否かの設定を含んでいてもよい。視聴対象人物が登場する映像を使用することが設定されている場合、表示制御装置50は、CM配信装置(不図示)から、視聴対象人物が登場しているCMを取得して、視聴者端末70に表示させる。なお、CMの表示のタイミングは、任意であり、あらかじめ表示制御装置50に設定されている。 Further, the option image may include a setting as to whether or not to use a video in which a person to be viewed appears as a CM (Commercial Message). When it is set to use a video in which the person to be viewed appears, the display control device 50 obtains the commercial in which the person to be viewed appears from the CM distribution device (not shown), and transmits the commercial to the viewer terminal. 70. Note that the timing of displaying the CM is arbitrary and is set in advance in the display control device 50.

また、オプション画像は、後ろ姿やアニメなど、視聴対象人物が声だけで登場している部分(部分音声に該当するが、部分映像には該当しない部分)を飛ばして再生するか否かの設定を含んでいてもよい。また、オプション画像は、通常どおり動画を再生するか、または、文字情報だけ見るかの設定を含んでいてもよい。 In addition, the option image can be used to set whether or not to skip portions where the person to be viewed appears only with voice, such as from the back or in animation (parts that fall under partial audio but do not fall under partial video). May contain. Furthermore, the option image may include settings for whether to play the video normally or to view only text information.

また、表示制御装置50は、視聴者端末70からの要求に応じて、操作パネル画像を視聴者端末70に表示させてもよい。操作パネル画像は、動画の再生に関する操作のための画像である。表示制御装置50は、操作パネル画像に対する操作に従って動画を再生する。 Further, the display control device 50 may display an operation panel image on the viewer terminal 70 in response to a request from the viewer terminal 70. The operation panel image is an image for operations related to video playback. The display control device 50 reproduces a moving image according to the operation on the operation panel image.

図8に、操作パネル画像の例を示す。「シーン」と表示されている操作アイテムは、登場部分単位で再生操作を行うための操作アイテムである。また「作品」と表示されている操作アイテムは、作品(動画)単位で再生操作を行うための操作アイテムである。 FIG. 8 shows an example of an operation panel image. The operation item displayed as "scene" is an operation item for performing a playback operation for each appearing part. Further, the operation item displayed as "work" is an operation item for performing a playback operation on a work (video) basis.

表示制御装置50は、操作パネル画像に基づいて入力される操作指示に応じて、動画を動画記憶装置60-iから取得し、再生する。また、登場部分情報記憶手段40は、動画がどこまで視聴されたかの情報を、記憶部に記憶させる。 The display control device 50 acquires a moving image from the moving image storage device 60-i and plays it back in response to an operation instruction input based on the operation panel image. Furthermore, the appearance portion information storage means 40 causes the storage unit to store information on how far the video has been viewed.

また、操作パネル画像は、共有のための操作アイテムを含んでいてもよい。共有のための操作アイテムに対する操作が行われたことに応じて、共有の指示が入力されると、表示制御装置50は、再生中の動画の情報を、共有先へ共有する。共有先は、たとえば、SNS(Social Networking Service)である。表示制御装置50は、共有先として指定された共有先へ、作品名や、タイムコードの情報を送信する。また、記憶部に記憶されている、共有回数の情報を更新する。なお、共有回数は、動画ごとまたは登場部分ごとに記憶される。 Further, the operation panel image may include operation items for sharing. When a sharing instruction is input in response to an operation performed on an operation item for sharing, the display control device 50 shares information about the video being played back to the sharing destination. The sharing destination is, for example, SNS (Social Networking Service). The display control device 50 transmits the work name and time code information to the designated sharing destination. Additionally, information on the number of times of sharing stored in the storage unit is updated. Note that the number of times of sharing is stored for each video or for each appearing part.

また、操作パネル画像は、「いいね」のための操作アイテムを含んでいてもよい。「いいね」のための操作アイテムに対する操作が行われたことに応じて、「いいね」の指示が入力されると、表示制御装置50は、再生中の動画について、記憶部に記憶されている「いいね」の回数の情報を更新する。 Further, the operation panel image may include an operation item for "like". When a “like” instruction is input in response to an operation performed on an operation item for “like”, the display control device 50 stores information about the video being played in the storage unit. Update information on the number of likes received.

また、表示制御装置50は、視聴者端末70からの要求に応じて、設定メニュー画像を視聴者端末70に表示させてもよい。図9に設定メニュー画像の例を示す。設定メニュー画像は、動画配信に関する設定のための画像である。 Further, the display control device 50 may display a setting menu image on the viewer terminal 70 in response to a request from the viewer terminal 70. FIG. 9 shows an example of a settings menu image. The settings menu image is an image for settings related to video distribution.

設定メニュー画像は、契約されていない配信事業者によって提供される動画の視聴に関する設定を含んでいてもよい。この設定は、視聴対象人物の登場部分情報に、契約されていない配信事業者が提供する動画記憶装置の動画が含まれる場合の、契約処理に関する設定である。「自動で契約」が設定されている場合、表示制御装置50は、あらかじめ設定されている契約情報を配信事業者に送信し、契約を行う。「確認してくれ」が設定されている場合、表示制御装置50は、契約するか否かを視聴者に問い合わせる画像を視聴者端末70に表示させる。「見ない」が設定されている場合、表示制御装置50は、契約されていない動画記憶装置の動画については、動画記憶装置から取得しない。なお、この場合、記憶部が記憶する視聴者情報は、さらに、契約に関する情報を含む。 The settings menu image may include settings related to viewing videos provided by a distribution company with which the user does not have a contract. This setting is a setting related to contract processing when the appearance portion information of the person to be viewed includes a video stored in a video storage device provided by a distribution company with which the viewer is not contracted. If "contract automatically" is set, the display control device 50 transmits contract information set in advance to the distribution provider and concludes the contract. If "Please confirm" is set, the display control device 50 causes the viewer terminal 70 to display an image inquiring the viewer whether or not to enter into a contract. If "Do not watch" is set, the display control device 50 does not acquire videos from the video storage device for which the contract is not made. Note that in this case, the viewer information stored in the storage unit further includes information regarding the contract.

また、設定メニュー画像は、配信事業者と視聴者の間の契約の解除に関する設定を含んでいてもよい。この設定は、たとえば、n日以上視聴していない動画記憶装置の契約期限が到来する場合の解約に関する設定である。表示制御装置50は、「自動で解約」が設定されている場合、解約する旨の情報を配信事業者に送信する。また、「期限切れそうな時、通知してくれ」が設定されている場合、表示制御装置50は、解約するか否かを視聴者に問い合わせる画像を視聴者端末70に表示させる。また、「契約したままでいい」が設定されている場合、表示制御装置50は、契約を継続する旨の情報を配信事業者に送信する。なお、解約されるまで契約が自動で更新される場合には、表示制御装置50は、契約を継続する旨の情報を配信事業者に送信しなくてもよい。 Further, the settings menu image may include settings regarding cancellation of the contract between the distribution provider and the viewer. This setting is, for example, a setting for canceling a contract when a contract for a video storage device that has not been viewed for n days or more comes to an end. If "automatically cancel" is set, the display control device 50 transmits information to the effect that the subscription is to be canceled to the distribution provider. Furthermore, if "Notify me when the subscription is about to expire" is set, the display control device 50 causes the viewer terminal 70 to display an image asking the viewer whether or not to cancel the subscription. Further, if "you can keep the contract" is set, the display control device 50 transmits information to the distributor that the contract is to be continued. Note that if the contract is automatically updated until it is canceled, the display control device 50 does not need to send information to the distributor that the contract is to be continued.

また、設定メニュー画像は、現在加入している配信事業者の情報を含んでいてもよい。この場合、設定メニュー画像は、さらに、動画の視聴に関する料金の情報、たとえば、契約月額の情報を含んでいてもよい。 Further, the setting menu image may include information about the distribution company to which the user is currently subscribed. In this case, the setting menu image may further include information on charges related to viewing the video, for example, information on the monthly contract amount.

また、設定メニュー画像は、契約の際に使用される情報、たとえば、契約の際に登録するクレジットカードの情報を含んでいてもよい。 Further, the setting menu image may include information used when making a contract, such as credit card information to be registered when making a contract.

次に、図10から図13に、本実施形態の特定制御装置20に関する動作フローの例を示す。図10は、特定制御装置20の動作の概要を示す。図11は、部分映像位置情報の特定に関する動作フローである。図12は、部分音声位置情報の特定に関する動作フローである。図13は、文字起こしに関する動作フローである。図11から図13は、図10のステップS203の、より具体的な動作フローである。 Next, FIGS. 10 to 13 show examples of operational flows regarding the specific control device 20 of this embodiment. FIG. 10 shows an overview of the operation of the specific control device 20. FIG. 11 is an operational flow related to specifying partial video position information. FIG. 12 is an operational flow related to specifying partial audio position information. FIG. 13 is an operational flow related to transcription. 11 to 13 are more specific operational flows of step S203 in FIG. 10.

まず、図10を用いて、本実施形態の特定制御装置20の動作の概要について説明する。 First, an overview of the operation of the specific control device 20 of this embodiment will be described using FIG. 10.

特定制御装置20の動画取得部22は、まず、取得範囲を指定する(図10のステップS201)。取得範囲については後述する。 The moving image acquisition unit 22 of the specific control device 20 first specifies an acquisition range (step S201 in FIG. 10). The acquisition range will be described later.

次に、受信部21は、人物情報を受信する(ステップS202)。受信部21は、抽出人物リストから一人分の人物情報を読み込むことで、人物情報を受信する。 Next, the receiving unit 21 receives person information (step S202). The receiving unit 21 receives person information by reading person information for one person from the extraction person list.

また、人物情報が示す人物について、動画取得部22が動画を取得し、映像特定部23が部分映像を特定し、音声特定部24が部分音声を特定する(ステップS203)。ステップS203で行われる動作については後述する。 Further, regarding the person indicated by the person information, the video acquisition unit 22 acquires a video, the video identification unit 23 identifies a partial video, and the audio identification unit 24 identifies partial audio (step S203). The operation performed in step S203 will be described later.

そして、抽出人物リストに登録されているすべての人物情報が示す人物についてステップS203が行われると(ステップS204でYES)、動画取得部22は、ステップS201を実施する。 Then, when step S203 is performed for the people indicated by all the person information registered in the extraction person list (YES in step S204), the video acquisition unit 22 executes step S201.

ステップS201における取得範囲は、動画取得部22によって動画記憶装置60-iから取得される動画の範囲である。たとえば、初めてステップS202からステップS204を実施する場合、動画取得部22は、過去10年分の動画を、取得範囲とする。また、ステップS202からステップS204を二回目以降に実施する場合には、動画取得部22は、さらに、10年分ずつさかのぼって、取得範囲とする。また、新たな動画が動画記憶装置60-iに追加される可能性がある。そのため、過去方向のすべての年が取得範囲として指定された後も、動画取得部22は、所定時間おき(1日1回、1週間に1回など)に、ステップS201からステップS204を実施するとよい。この場合、動画取得部22は、すでに取得されて、部分映像や部分音声の特定がされている動画については、取得の対象外とするとよい。部分映像や部分音声がされているかどうかは、動画取得部22は、登場部分情報記憶手段40に記憶されている登場部分情報により把握することができる。 The acquisition range in step S201 is the range of the video acquired by the video acquisition unit 22 from the video storage device 60-i. For example, when performing steps S202 to S204 for the first time, the video acquisition unit 22 sets the acquisition range to videos from the past 10 years. Furthermore, when performing steps S202 to S204 for the second time or later, the video acquisition unit 22 further goes back by 10 years and sets the acquisition range. Additionally, there is a possibility that a new video will be added to the video storage device 60-i. Therefore, even after all years in the past direction are specified as the acquisition range, the video acquisition unit 22 performs steps S201 to S204 at predetermined intervals (once a day, once a week, etc.). good. In this case, the video acquisition unit 22 may exclude from acquisition a video that has already been acquired and for which partial video or partial audio has been specified. The video acquisition unit 22 can determine whether a partial video or audio is being played based on the appearance portion information stored in the appearance portion information storage means 40.

次に、図11を用いて、本実施形態の特定制御装置20の、部分映像位置情報の特定に関する動作フローについて説明する。 Next, with reference to FIG. 11, an operation flow related to specifying partial video position information by the specifying control device 20 of this embodiment will be described.

動画取得部22は、動画記憶装置60-i(iは1からNの整数)から、人物情報が示す人物に関連する動画を取得する。ここでの人物情報は、受信部21が受信した人物情報である。より具体的には、動画取得部22は、人物情報が示す人物の人物名と、ステップS201で指定された取得範囲とを、動画記憶装置60-iに送信する(ステップS301)。そして、動画記憶装置60-iから、取得範囲に含まれる動画のうち、メタデータに当該人物名が含まれる動画が、動画取得部22に送信される。動画取得部22は、動画記憶装置60-iから送信された動画を受信する(ステップS302)。なお、取得範囲に含まれる動画とは、取得範囲が制作年による範囲である場合、取得範囲が示す年に制作された動画である。また、動画取得部22は、当該人物についてすでに取得したことがある動画については、取得しない。 The video acquisition unit 22 acquires a video related to the person indicated by the person information from the video storage device 60-i (i is an integer from 1 to N). The personal information here is the personal information received by the receiving unit 21. More specifically, the video acquisition unit 22 transmits the name of the person indicated by the personal information and the acquisition range specified in step S201 to the video storage device 60-i (step S301). Then, among the videos included in the acquisition range, videos whose metadata includes the person's name are transmitted from the video storage device 60-i to the video acquisition unit 22. The video acquisition unit 22 receives the video transmitted from the video storage device 60-i (step S302). Note that, when the acquisition range is based on the year of production, the videos included in the acquisition range are videos that were produced in the year indicated by the acquisition range. Furthermore, the video acquisition unit 22 does not acquire videos that have already been acquired for the person.

映像特定部23は、動画取得部22によって取得された動画について、部分映像を特定する。また、映像特定部23は、部分映像位置情報を特定する。 The video identifying unit 23 identifies partial videos of the video acquired by the video acquiring unit 22. Further, the video specifying unit 23 specifies partial video position information.

より具体的には、映像特定部23は、動画取得部22によって取得された動画を、抽出エンジン30に入力する(ステップS303)。抽出エンジン30は、入力された動画に基づいて、部分映像を特定し、部分映像位置情報を特定する(ステップS304)。 More specifically, the video specifying unit 23 inputs the video acquired by the video acquiring unit 22 to the extraction engine 30 (step S303). The extraction engine 30 identifies a partial video and identifies partial video position information based on the input video (step S304).

抽出エンジン30が部分映像位置情報を特定すると、映像特定部23は、部分映像位置情報を抽出エンジン30から受信する(ステップS305)。 When the extraction engine 30 specifies the partial video position information, the video specifying unit 23 receives the partial video position information from the extraction engine 30 (step S305).

制御部25は、登場部分情報を、人物情報および動画情報に対応付ける。また、制御部25は、人物情報および動画情報が対応付けられた登場部分情報を、登場部分情報記憶手段40に記憶させる。このとき、制御部25は、受信した部分映像位置情報を登場部分情報に含め、登場部分情報を登場部分情報記憶手段40に記憶させる(ステップS306、ステップS307)。 The control unit 25 associates the appearance part information with the person information and the video information. Further, the control unit 25 causes the appearance portion information storage unit 40 to store appearance portion information in which person information and video information are associated. At this time, the control unit 25 includes the received partial video position information in the appearing part information and stores the appearing part information in the appearing part information storage means 40 (steps S306 and S307).

次に、図12を用いて、本実施形態の特定制御装置20の、部分音声位置情報の特定に関する動作フローについて説明する。 Next, an operation flow related to specifying partial audio position information by the specifying control device 20 of this embodiment will be described using FIG. 12.

音声特定部24は、人物情報が示す人物について、映像特定部23で特定された部分映像が存在する場合には、当該部分映像を用いて、当該人物の音声特徴情報を取得する(ステップS308)。音声特定部24は、一または複数の動画について、音声特徴情報を取得する箇所を指定する情報を受信し、当該情報で指定された箇所の音声から音声特徴情報を取得してもよい。 If there is a partial video identified by the video identifying unit 23 for the person indicated by the person information, the audio specifying unit 24 uses the partial video to acquire audio feature information of the person (step S308). . The audio specifying unit 24 may receive information specifying a location from which audio feature information is to be obtained for one or more videos, and may obtain audio feature information from the audio at the location specified by the information.

そして、音声特定部24は、ステップS308で取得された音声特徴情報と、動画取得部22によって取得された動画とを、抽出エンジン30に入力する(ステップS309、ステップS310)。音声特定部24は、人物情報と音声特徴情報とがあらかじめ記憶部に記憶されている場合には、記憶部に記憶されている音声特徴情報を、抽出エンジン30に入力してもよい。 Then, the audio identifying unit 24 inputs the audio feature information acquired in step S308 and the video acquired by the video acquiring unit 22 to the extraction engine 30 (step S309, step S310). If the person information and the voice feature information are stored in the storage unit in advance, the voice specifying unit 24 may input the voice feature information stored in the storage unit to the extraction engine 30.

抽出エンジン30は、部分音声を特定し、また、部分音声位置情報を特定する(ステップS311)。 The extraction engine 30 identifies the partial audio and also identifies the partial audio position information (step S311).

制御部25は、音声特定部24が部分音声位置情報を抽出エンジン30から受信すると(ステップS312)、受信した部分音声位置情報を、登場部分情報記憶手段40に記憶されている登場部分情報に追加する(ステップS313、ステップ314)。人物情報に対応付けられている登場部分情報が登場部分情報記憶手段40に記憶されていない場合には、制御部25は、人物情報と動画情報とに対応付けて、部分音声位置情報を登場部分情報に含めて、登場部分情報記憶手段40に記憶させる。また、制御部25は、動画情報に対応付けられている登場部分情報が登場部分情報記憶手段40に記憶されていない場合にも、人物情報と動画情報とに対応付けて、部分音声位置情報を登場部分情報に含めて、登場部分情報記憶手段40に登場部分情報を記憶させる。 When the voice identifying unit 24 receives the partial voice position information from the extraction engine 30 (step S312), the control unit 25 adds the received partial voice position information to the appearance part information stored in the appearance part information storage means 40. (Step S313, Step 314). If the appearance part information associated with the person information is not stored in the appearance part information storage means 40, the control unit 25 associates the partial audio position information with the person information and the video information, and stores the appearance part information in association with the person information and video information. It is included in the information and stored in the appearance portion information storage means 40. Furthermore, even when the appearance part information associated with the video information is not stored in the appearance part information storage means 40, the control unit 25 stores the partial audio position information in association with the person information and the video information. The appearance part information is stored in the appearance part information storage means 40, including it in the appearance part information.

また、音声特定部24は、さらに、部分音声の文字起こしを行ってもよい。図13を用いて、文字起こしにおける特定制御装置20の動作フローについて説明する。 Furthermore, the audio identification unit 24 may further transcribe the partial audio. The operation flow of the specific control device 20 in transcription will be described using FIG. 13.

まず、特定制御装置20は、動画取得部22によって取得された動画を抽出エンジン30に入力する(ステップS315)。なお、抽出エンジン30が、ステップS310で入力された動画を用いて文字起こしを行うことができる場合には、ステップS315は省略されてもよい。抽出エンジン30は、部分音声についての文字起こしを行う(ステップS316)。そして、抽出エンジン30は、部分音声の文字情報を特定制御装置20に送信する(ステップS317)。 First, the specific control device 20 inputs the video acquired by the video acquisition unit 22 to the extraction engine 30 (step S315). Note that if the extraction engine 30 can perform transcription using the video input in step S310, step S315 may be omitted. The extraction engine 30 transcribes the partial audio (step S316). Then, the extraction engine 30 transmits the character information of the partial voice to the specific control device 20 (step S317).

制御部25は、登場部分情報と対応付けて、部分音声の文字情報を登場部分情報記憶手段40に記憶させる(ステップS318、ステップS319)。 The control unit 25 causes the character information of the partial voice to be stored in the appearance portion information storage means 40 in association with the appearance portion information (step S318, step S319).

次に、図14に、本実施形態の表示制御装置50の動作フローを示す。 Next, FIG. 14 shows an operation flow of the display control device 50 of this embodiment.

表示制御装置50は、視聴者端末70からの要求に応じて、動画記憶装置60-iから動画を取得し、視聴者端末70に表示させる。表示制御装置50には、視聴者が動画を視聴したい人物の人物情報が入力される(ステップS401)。表示制御装置50は、入力された人物情報に対応付けられている登場部分情報を登場部分情報記憶手段40から取得し(ステップS402、ステップS403)、登場部分情報に関する動画一覧画像を、視聴者端末70に表示させる(ステップS404)。 The display control device 50 obtains a video from the video storage device 60-i in response to a request from the viewer terminal 70, and causes the viewer terminal 70 to display the video. Personal information of a person whose video the viewer wants to view is input to the display control device 50 (step S401). The display control device 50 acquires the appearance part information associated with the input person information from the appearance part information storage means 40 (step S402, step S403), and displays the video list image related to the appearance part information on the viewer terminal. 70 (step S404).

また、表示制御装置50は、視聴者端末70からの再生要求に応じて(ステップS405)、動画記憶装置60-iへ再生要求を行い(ステップS406)、動画記憶装置60-iから動画を取得する(ステップS407)。視聴者端末70から表示制御装置50への再生要求は、動画一覧画像に対する視聴者の操作や、操作パネル画像に対する視聴者の操作によって行われる。また、表示制御装置50から動画記憶装置60-iへの再生要求は、動画一覧画像の動画が自動的に順に再生される場合は、次の動画が再生する際にも行われる。 Furthermore, in response to a playback request from the viewer terminal 70 (step S405), the display control device 50 makes a playback request to the video storage device 60-i (step S406), and acquires the video from the video storage device 60-i. (Step S407). A reproduction request from the viewer terminal 70 to the display control device 50 is made by the viewer's operation on the video list image or the viewer's operation on the operation panel image. Furthermore, if the videos in the video list images are automatically played in sequence, the display control device 50 requests the video storage device 60-i to play back the next video.

そして、表示制御装置50は視聴者端末70に動画を再生させる(ステップS408、ステップS409)。なお、表示制御装置50は、動画がどこまで視聴されたかを示す情報を、表示制御装置50の記憶部または登場部分情報記憶手段40に記憶させる。 Then, the display control device 50 causes the viewer terminal 70 to play the video (step S408, step S409). Note that the display control device 50 causes the storage unit of the display control device 50 or the appearance portion information storage means 40 to store information indicating how far the video has been viewed.

以上で説明したように、本発明の第二の実施形態では、特定制御装置20は、受信部21と動画取得部22と映像特定部23と音声特定部24と制御部25とを含む。受信部21は、人物情報を受信する。人物情報は、人物を示す情報である。動画取得部22は、動画記憶装置から、人物情報が示す人物に関連する動画を取得する。動画記憶装置は、動画を記憶している。動画は、映像情報と音声情報とを含む。映像特定部23は、取得された動画から、部分映像を特定する。部分映像は、人物情報が示す人物の映像を含む部分である。また、映像特定部23は、部分映像位置情報を特定する。部分映像位置情報は、動画のどの位置に部分映像が含まれているかを示す情報である。音声特定部24は、取得された動画から、部分音声を特定する。部分音声は、人物情報が示す人物の音声を含む部分である。また、音声特定部24は、部分音声位置情報を特定する。部分音声位置情報は、動画のどの部分に部分音声が含まれているかを示す情報である。制御部25は、取得された動画について、登場部分情報を登場部分情報記憶手段に記憶させる。登場部分情報は、動画のどの位置に登場部分が含まれているかを示す情報である。登場部分は、部分映像および部分音声の少なくともいずれかに該当する部分である。登場部分情報記憶手段は、登場部分情報を記憶する。このとき、制御部25は、人物情報と動画情報とに対応付けて、登場部分情報を登場部分情報記憶手段に記憶させる。動画情報は、動画に関する情報である。また、制御部25は、登場部分情報に、部分映像位置情報と部分音声位置情報とを含めて、登場部分情報記憶手段に記憶させる。 As described above, in the second embodiment of the present invention, the specific control device 20 includes a receiving section 21 , a moving image obtaining section 22 , a video specifying section 23 , an audio specifying section 24 , and a control section 25 . The receiving unit 21 receives person information. Person information is information indicating a person. The video acquisition unit 22 acquires a video related to the person indicated by the person information from the video storage device. The video storage device stores videos. A video includes video information and audio information. The video identifying unit 23 identifies a partial video from the acquired video. The partial video is a portion that includes a video of the person indicated by the person information. Further, the video specifying unit 23 specifies partial video position information. Partial video position information is information indicating at which position in a moving image a partial video is included. The audio identification unit 24 identifies partial audio from the acquired video. The partial audio is a portion that includes the audio of the person indicated by the personal information. Furthermore, the audio specifying unit 24 specifies partial audio position information. The partial audio position information is information indicating in which part of the video the partial audio is included. The control unit 25 causes the appearance portion information storage unit to store appearance portion information regarding the acquired moving image. The appearance part information is information indicating at which position in the video the appearance part is included. The appearing portion is a portion corresponding to at least one of partial video and partial audio. The appearance part information storage means stores appearance part information. At this time, the control unit 25 causes the appearance part information to be stored in the appearance part information storage means in association with the person information and the video information. The video information is information related to videos. Further, the control unit 25 causes the appearance portion information to include partial video position information and partial audio position information, and stores the appearance portion information in the appearance portion information storage means.

このように、特定制御装置20は、部分映像位置情報と部分音声位置情報とを特定し、部分映像位置情報と部分音声位置情報とを登場部分情報に含めて、登場部分情報記憶手段に記憶させる。これにより、表示制御装置は、登場部分情報記憶手段に記憶されている登場部分情報を参照して、登場部分情報に関する情報を視聴者端末に表示させることが可能になる。また、表示制御装置は、登場部分情報を参照して、登場部分を視聴者に提供することができる。そのため、特定の人物の顔が撮像されていない場面や特定の人物の顔が撮像されていない動画についても、特定の人物の登場部分を特定して、登場部分を視聴者に提供することが可能になる。 In this way, the identification control device 20 identifies the partial video position information and the partial audio position information, includes the partial video position information and the partial audio position information in the appearance part information, and stores the partial video position information and the partial audio position information in the appearance part information storage means. . Thereby, the display control device can refer to the appearance part information stored in the appearance part information storage means and display information related to the appearance part information on the viewer terminal. Further, the display control device can refer to the appearance portion information and provide the appearance portion to the viewer. Therefore, even in scenes where a specific person's face is not captured or in a video where a specific person's face is not captured, it is possible to identify the portion where a specific person appears and provide that portion to the viewer. become.

また、音声特定部24は、部分映像を用いて、人物の音声を識別可能な情報である音声特徴情報を取得し、音声特徴情報を用いて、部分音声を特定する。これにより、音声特定部24は、音声特徴情報があらかじめ特定制御装置20に登録されていなくても、部分音声を特定することが可能になる。 Furthermore, the audio identifying unit 24 uses the partial video to acquire audio feature information that is information that can identify the person's audio, and uses the audio feature information to identify the partial audio. This makes it possible for the voice identification unit 24 to identify the partial voice even if the voice feature information is not registered in the identification control device 20 in advance.

また、音声特定部24は、部分映像の中から、撮像されている人物が一人である部分を抽出し、抽出された部分の音声に基づいて、音声特徴情報を取得する。これにより、音声特徴情報の取得をより精度よく実現することができる。 Furthermore, the audio identifying unit 24 extracts a portion where only one person is imaged from the partial video, and acquires audio feature information based on the audio of the extracted portion. Thereby, acquisition of voice feature information can be realized with higher accuracy.

また、音声特定部24は、一または複数の動画について、音声特徴情報を取得する箇所を指定する情報を受信し、音声特徴情報を取得する箇所を指定する情報で指定された箇所の音声から音声特徴情報を取得する。ここで、音声特徴情報は、人物の音声を識別可能な情報である。これにより、特定された部分映像がない人物についても、音声特徴情報を取得することができる。 The audio specifying unit 24 also receives information specifying a location from which audio feature information is to be obtained for one or more videos, and selects the audio from the location specified by the information specifying the location from which audio feature information is to be obtained. Get feature information. Here, the voice feature information is information that can identify a person's voice. Thereby, it is possible to obtain audio feature information even for a person for whom there is no identified partial video.

また、音声特定部24は、さらに、部分音声を文字情報に変換し、部分音声の文字情報を、登場部分情報と対応付けて、登場部分情報記憶手段に記憶させる。これにより、部分音声の文字情報を、表示制御装置50から視聴者端末70に表示させることが可能になる。 Furthermore, the voice specifying unit 24 further converts the partial voice into text information, associates the text information of the partial voice with the appearance part information, and stores it in the appearance part information storage means. This makes it possible for the display control device 50 to display the text information of the partial audio on the viewer terminal 70.

また、配信システムは、特定制御装置20と、登場部分情報記憶手段40と、表示制御装置50とを備える。また、表示制御装置50は、視聴者端末70によって指定された人物である視聴対象人物の人物情報に対応する登場部分情報を登場部分情報記憶手段40から取得する。また、表示制御装置50は、取得した登場部分情報に関する情報を、動画一覧画像として、視聴者端末70に表示させる。これにより、表示制御装置50は、視聴対象人物が登場している登場部分の一覧を視聴者端末70に表示させることができる。 The distribution system also includes a specific control device 20, an appearance portion information storage means 40, and a display control device 50. The display control device 50 also acquires appearance portion information corresponding to the person information of the person to be viewed, who is the person specified by the viewer terminal 70, from the appearance portion information storage means 40. Furthermore, the display control device 50 causes the viewer terminal 70 to display the acquired information regarding the appearance portion information as a video list image. Thereby, the display control device 50 can cause the viewer terminal 70 to display a list of the parts in which the viewing target person appears.

また、表示制御装置50は、動画を動画記憶装置から取得して、登場部分でない部分をスキップしながら、登場部分の動画を視聴者端末70に再生させる。また、表示制御装置50は、登場部分の動画を動画記憶装置から取得して、登場部分の動画を視聴者端末に再生させてもよい。これにより、視聴対象人物の登場部分だけを視聴したいという視聴者の要望を実現することができる。 The display control device 50 also acquires the video from the video storage device and causes the viewer terminal 70 to play back the video of the appearing portion while skipping the portion that does not appear. Furthermore, the display control device 50 may acquire the video of the appearance portion from the video storage device and cause the viewer terminal to reproduce the video of the appearance portion. This makes it possible to realize the viewer's desire to view only the portion in which the person to be viewed appears.

[ハードウェア構成例]
上述した本発明の各実施形態における特定制御装置(10、20)を、一つの情報処理装置(コンピュータ)を用いて実現するハードウェア資源の構成例について説明する。なお、特定制御装置は、物理的または機能的に少なくとも二つの情報処理装置を用いて実現してもよい。また、特定制御装置は、専用の装置として実現してもよい。また、特定制御装置の一部の機能のみを情報処理装置を用いて実現してもよい。
[Hardware configuration example]
An example of the configuration of hardware resources that implements the specific control device (10, 20) in each embodiment of the present invention described above using one information processing device (computer) will be described. Note that the specific control device may be physically or functionally realized using at least two information processing devices. Further, the specific control device may be realized as a dedicated device. Further, only some functions of the specific control device may be realized using an information processing device.

図15は、本発明の各実施形態の特定制御装置を実現可能な情報処理装置のハードウェア構成例を概略的に示す図である。情報処理装置90は、通信インタフェース91、入出力インタフェース92、演算装置93、記憶装置94、不揮発性記憶装置95およびドライブ装置96を含む。 FIG. 15 is a diagram schematically showing an example of the hardware configuration of an information processing device that can implement the specific control device of each embodiment of the present invention. Information processing device 90 includes a communication interface 91, an input/output interface 92, an arithmetic device 93, a storage device 94, a nonvolatile storage device 95, and a drive device 96.

たとえば、図1の動画取得部12および制御部15は、通信インタフェース91および演算装置93で実現することが可能である。また、受信部11、映像特定部13、音声特定部14は、演算装置93で実現することが可能である。 For example, the moving image acquisition section 12 and the control section 15 in FIG. 1 can be realized by the communication interface 91 and the arithmetic device 93. Further, the receiving section 11, the video specifying section 13, and the audio specifying section 14 can be realized by the arithmetic device 93.

通信インタフェース91は、各実施形態の特定制御装置が、有線あるいは/および無線で外部装置と通信するための通信手段である。なお、特定制御装置を、少なくとも二つの情報処理装置を用いて実現する場合、それらの装置の間を通信インタフェース91経由で相互に通信可能なように接続してもよい。 The communication interface 91 is a communication means for the specific control device of each embodiment to communicate with an external device by wire and/or wirelessly. Note that when the specific control device is implemented using at least two information processing devices, these devices may be connected to each other via the communication interface 91 so that they can communicate with each other.

入出力インタフェース92は、入力デバイスの一例であるキーボードや、出力デバイスとしてのディスプレイ等のマンマシンインタフェースである。 The input/output interface 92 is a man-machine interface such as a keyboard as an example of an input device and a display as an output device.

演算装置93は、汎用のCPU(Central Processing Unit)やマイクロプロセッサ等の演算処理装置や複数の電気回路によって実現される。演算装置93は、たとえば、不揮発性記憶装置95に記憶された各種プログラムを記憶装置94に読み出し、読み出したプログラムに従って処理を実行することが可能である。 The arithmetic unit 93 is realized by an arithmetic processing unit such as a general-purpose CPU (Central Processing Unit) or a microprocessor, and a plurality of electric circuits. The arithmetic device 93 can, for example, read various programs stored in the nonvolatile storage device 95 into the storage device 94 and execute processing according to the read programs.

記憶装置94は、演算装置93から参照可能な、RAM(Random Access Memory)等のメモリ装置であり、プログラムや各種データ等を記憶する。記憶装置94は、揮発性のメモリ装置であってもよい。 The storage device 94 is a memory device such as a RAM (Random Access Memory) that can be referenced by the arithmetic device 93, and stores programs, various data, and the like. Storage device 94 may be a volatile memory device.

不揮発性記憶装置95は、たとえば、ROM(Read Only Memory)、フラッシュメモリ、等の、不揮発性の記憶装置であり、各種プログラムやデータ等を記憶することが可能である。 The nonvolatile storage device 95 is a nonvolatile storage device such as a ROM (Read Only Memory) or a flash memory, and is capable of storing various programs, data, and the like.

ドライブ装置96は、たとえば、後述する記録媒体97に対するデータの読み込みや書き込みを処理する装置である。 The drive device 96 is, for example, a device that processes reading and writing of data to and from a recording medium 97, which will be described later.

記録媒体97は、たとえば、光ディスク、光磁気ディスク、半導体フラッシュメモリ等、データを記録可能な任意の記録媒体である。 The recording medium 97 is any recording medium capable of recording data, such as an optical disk, a magneto-optical disk, or a semiconductor flash memory.

本発明の各実施形態は、たとえば、図15に例示した情報処理装置90により特定制御装置を構成し、この特定制御装置に対して、上記各実施形態において説明した機能を実現可能なプログラムを供給することにより実現してもよい。 In each embodiment of the present invention, for example, a specific control device is configured by the information processing device 90 illustrated in FIG. This may be achieved by doing so.

この場合、特定制御装置に対して供給したプログラムを、演算装置93が実行することによって、実施形態を実現することが可能である。また、特定制御装置のすべてではなく、一部の機能を情報処理装置90で構成することも可能である。 In this case, the embodiment can be realized by the arithmetic device 93 executing the program supplied to the specific control device. Further, it is also possible to configure not all but some functions of the specific control device with the information processing device 90.

さらに、上記プログラムを記録媒体97に記録しておき、特定制御装置の出荷段階、あるいは運用段階等において、適宜上記プログラムが不揮発性記憶装置95に格納されるよう構成してもよい。なお、この場合、上記プログラムの供給方法は、出荷前の製造段階、あるいは運用段階等において、適当な治具を利用して特定制御装置内にインストールする方法を採用してもよい。また、上記プログラムの供給方法は、インターネット等の通信回線を介して外部からダウンロードする方法等の一般的な手順を採用してもよい。 Further, the program may be recorded on the recording medium 97 and stored in the non-volatile storage device 95 as appropriate during the shipping stage or operation stage of the specific control device. In this case, the above-mentioned program may be supplied by installing it into the specific control device using an appropriate jig at the manufacturing stage before shipment, or at the operational stage. Further, as the method for supplying the program, a general procedure such as a method of downloading the program from an external source via a communication line such as the Internet may be adopted.

上記の実施形態の一部または全部は、以下の付記のようにも記載されうるが、以下には限られない。 Part or all of the above embodiments may be described as in the following additional notes, but are not limited to the following.

(付記1)
人物を示す情報である人物情報を受信する受信部と、
映像情報と音声情報とを含む動画を記憶している動画記憶装置から、前記人物情報が示す前記人物に関連する前記動画を取得する動画取得部と、
取得された前記動画から、前記人物の映像を含む部分である部分映像を特定し、前記動画のどの位置に前記部分映像が含まれているかを示す情報である部分映像位置情報を特定する映像特定部と、
取得された前記動画から、前記人物の音声を含む部分である部分音声を特定し、前記動画のどの位置に前記部分音声が含まれていかを示す情報である部分音声位置情報を特定する音声特定部と、
取得された前記動画について、前記部分映像および前記部分音声の少なくともいずれかに該当する部分である登場部分が前記動画のどの位置に含まれているかを示す登場部分情報を、前記人物情報と、前記動画に関する情報である動画情報とに対応付けるとともに、前記部分映像位置情報と前記部分音声位置情報とを前記登場部分情報に含めて、前記登場部分情報を記憶する登場部分情報記憶手段に記憶させる制御部と
を備える特定制御装置。
(Additional note 1)
a receiving unit that receives person information that is information indicating a person;
a video acquisition unit that acquires the video related to the person indicated by the person information from a video storage device that stores a video including video information and audio information;
Identifying a partial video, which is a portion including an image of the person, from the acquired video, and identifying partial video position information, which is information indicating in which position of the video the partial video is included. Department and
Audio identification that identifies a partial audio that is a portion that includes the voice of the person from the acquired video, and identifies partial audio position information that is information indicating where in the video the partial audio is included. Department and
Regarding the acquired video, appearance part information indicating where in the video the appearance part, which corresponds to at least one of the partial video and the partial audio, is included is included in the video, and the person information and the a control unit that associates the partial video position information and the partial audio position information with the video information that is information related to the video, includes the partial video position information and the partial audio position information in the appearance portion information, and causes the appearance portion information storage means to store the appearance portion information; A specific control device comprising and.

(付記2)
前記音声特定部は、前記部分映像を用いて、前記人物の音声を識別可能な情報である音声特徴情報を取得し、前記音声特徴情報を用いて、前記部分音声を特定する、
付記1に記載の特定制御装置。
(Additional note 2)
The audio identifying unit uses the partial video to acquire audio feature information that is information that can identify the person's audio, and uses the audio feature information to identify the partial audio.
The specific control device described in Supplementary Note 1.

(付記3)
前記音声特定部は、前記部分映像の中から、撮像されている人物が一人である部分を抽出し、抽出された部分の音声に基づいて、前記音声特徴情報を取得する、
付記2に記載の特定制御装置。
(Additional note 3)
The audio identifying unit extracts a portion where only one person is imaged from the partial video, and acquires the audio feature information based on the audio of the extracted portion.
The specific control device described in Supplementary Note 2.

(付記4)
前記音声特定部は、一または複数の前記動画について、前記人物の音声を識別可能な情報である音声特徴情報を取得する箇所を指定する情報を受信し、前記音声特徴情報を取得する箇所を指定する情報で指定された箇所の音声から前記音声特徴情報を取得する、
付記1に記載の特定制御装置。
(Additional note 4)
The audio specifying unit receives information specifying a location from which audio feature information, which is information that can identify the voice of the person, is to be obtained, for one or more of the videos, and specifies the location from which the audio feature information is to be obtained. obtaining the audio feature information from the audio at the location specified by the information to be used;
The specific control device described in Supplementary Note 1.

(付記5)
前記音声特定部は、さらに、前記部分音声を文字情報に変換し、前記部分音声の文字情報を、前記登場部分情報と対応付けて、前記登場部分情報記憶手段に記憶させる、
付記1に記載の特定制御装置。
(Appendix 5)
The voice specifying unit further converts the partial voice into text information, associates the text information of the partial voice with the appearance part information, and stores it in the appearance part information storage means.
The specific control device described in Supplementary Note 1.

(付記6)
付記1から付記5のいずれかに記載の特定制御装置と、
前記登場部分情報記憶手段と、
表示制御装置と
を備え、
前記表示制御装置は、視聴者端末によって指定された人物である視聴対象人物の前記人物情報に対応する前記登場部分情報を前記登場部分情報記憶手段から取得して、取得した前記登場部分情報に関する情報を、動画一覧画像として、前記視聴者端末に表示させる、
配信システム。
(Appendix 6)
A specific control device according to any one of Supplementary notes 1 to 5,
the appearance partial information storage means;
Equipped with a display control device and
The display control device acquires the appearance part information corresponding to the person information of the person to be viewed, who is a person specified by the viewer terminal, from the appearance part information storage means, and generates information regarding the acquired appearance part information. is displayed on the viewer terminal as a video list image;
delivery system.

(付記7)
前記表示制御装置は、前記動画を前記動画記憶装置から取得して、前記登場部分でない部分をスキップしながら、前記登場部分の前記動画を前記視聴者端末に再生させる、
付記6に記載の配信システム。
(Appendix 7)
The display control device acquires the video from the video storage device and causes the viewer terminal to play back the video of the appearing portion while skipping the portion that does not appear.
Distribution system described in Appendix 6.

(付記8)
前記表示制御装置は、前記登場部分の前記動画を前記動画記憶装置から取得して、前記登場部分の前記動画を前記視聴者端末に再生させる、
付記6に記載の配信システム。
(Appendix 8)
The display control device acquires the video of the appearance portion from the video storage device and causes the viewer terminal to play the video of the appearance portion.
Distribution system described in Appendix 6.

(付記9)
人物を示す情報である人物情報を受信し、
映像情報と音声情報とを含む動画を記憶している動画記憶装置から、前記人物情報が示す前記人物に関連する前記動画を取得し、
取得された前記動画から、前記人物の映像を含む部分である部分映像を特定し、前記動画のどの位置に前記部分映像が含まれているかを示す情報である部分映像位置情報を特定し、
取得された前記動画から、前記人物の音声を含む部分である部分音声を特定し、前記動画のどの位置に前記部分音声が含まれていかを示す情報である部分音声位置情報を特定し、
取得された前記動画について、前記部分映像および前記部分音声の少なくともいずれかに該当する部分である登場部分が前記動画のどの位置に含まれているかを示す登場部分情報を、前記人物情報と、前記動画に関する情報である動画情報とに対応付けるとともに、前記部分映像位置情報と前記部分音声位置情報とを前記登場部分情報に含めて、前記登場部分情報を記憶する登場部分情報記憶手段に記憶させる、
特定制御方法。
(Appendix 9)
Receive person information that is information indicating a person,
acquiring the video related to the person indicated by the person information from a video storage device that stores a video including video information and audio information;
From the acquired video, identify a partial video that is a portion that includes an image of the person, and identify partial video position information that is information indicating at which position in the video the partial video is included;
From the acquired video, identify a partial audio that is a portion that includes the voice of the person, identify partial audio position information that is information indicating where in the video the partial audio is included,
Regarding the acquired video, appearance part information indicating where in the video the appearance part, which corresponds to at least one of the partial video and the partial audio, is included is included in the video, and the person information and the Associating the partial video position information and the partial audio position information with video information that is information related to the video, including the partial video position information and the partial audio position information in the appearing part information, and storing the partial video position information in the appearing part information storage means that stores the appearing part information.
Specific control method.

(付記10)
コンピュータに、
人物を示す情報である人物情報を受信する受信機能と、
映像情報と音声情報とを含む動画を記憶している動画記憶装置から、前記人物情報が示す前記人物に関連する前記動画を取得する動画取得機能と、
取得された前記動画から、前記人物の映像を含む部分である部分映像を特定し、前記動画のどの位置に前記部分映像が含まれているかを示す情報である部分映像位置情報を特定する映像特定機能と、
取得された前記動画から、前記人物の音声を含む部分である部分音声を特定し、前記動画のどの位置に前記部分音声が含まれていかを示す情報である部分音声位置情報を特定する音声特定機能と、
取得された前記動画について、前記部分映像および前記部分音声の少なくともいずれかに該当する部分である登場部分が前記動画のどの位置に含まれているかを示す登場部分情報を、前記人物情報と、前記動画に関する情報である動画情報とに対応付けるとともに、前記部分映像位置情報と前記部分音声位置情報とを前記登場部分情報に含めて、前記登場部分情報を記憶する登場部分情報記憶手段に記憶させる制御機能と
を実現させる特定制御プログラム。
(Appendix 10)
to the computer,
a reception function that receives person information that is information indicating a person;
a video acquisition function that acquires the video related to the person indicated by the person information from a video storage device that stores a video including video information and audio information;
Identifying a partial video, which is a portion including an image of the person, from the acquired video, and identifying partial video position information, which is information indicating in which position of the video the partial video is included. function and
Audio identification that identifies a partial audio that is a portion that includes the voice of the person from the acquired video, and identifies partial audio position information that is information indicating where in the video the partial audio is included. function and
Regarding the acquired video, appearance part information indicating where in the video the appearance part, which corresponds to at least one of the partial video and the partial audio, is included is included in the video, and the person information and the A control function that associates the partial video position information and the partial audio position information with the video information that is information related to the video, and stores the partial video position information and the partial audio position information in the appearance part information that stores the appearance part information. A specific control program that realizes and.

以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。 Although the present invention has been described above with reference to the embodiments, the present invention is not limited to the above embodiments. The configuration and details of the present invention can be modified in various ways that can be understood by those skilled in the art within the scope of the present invention.

10、20 特定制御装置
11、21 受信部
12、22 動画取得部
13、23 映像特定部
14、24 音声特定部
15、25 制御部
30 抽出エンジン
40 登場部分情報記憶手段
50 表示制御装置
60-i 動画記憶装置
70 視聴者端末
90 情報処理装置
91 通信インタフェース
92 入出力インタフェース
93 演算装置
94 記憶装置
95 不揮発性記憶装置
96 ドライブ装置
97 記録媒体
10, 20 Specific control device 11, 21 Receiving section 12, 22 Video acquisition section 13, 23 Video specifying section 14, 24 Audio specifying section 15, 25 Control section 30 Extraction engine 40 Appearance part information storage means 50 Display control device 60-i Video storage device 70 Viewer terminal 90 Information processing device 91 Communication interface 92 Input/output interface 93 Arithmetic device 94 Storage device 95 Non-volatile storage device 96 Drive device 97 Recording medium

Claims (10)

人物を示す情報である人物情報を受信する受信部と、
映像情報と音声情報とを含む動画を記憶している動画記憶装置から、前記人物情報が示す前記人物に関連する前記動画を取得する動画取得部と、
取得された前記動画から、前記人物の映像を含む部分である部分映像を特定し、前記動画のどの位置に前記部分映像が含まれているかを示す情報である部分映像位置情報を特定する映像特定部と、
取得された前記動画から、前記人物の音声を含む部分である部分音声を特定し、前記動画のどの位置に前記部分音声が含まれていかを示す情報である部分音声位置情報を特定する音声特定部と、
取得された前記動画について、前記部分映像および前記部分音声の少なくともいずれかに該当する部分である登場部分が前記動画のどの位置に含まれているかを示す登場部分情報を、前記人物情報と、前記動画に関する情報である動画情報とに対応付けるとともに、前記部分映像位置情報と前記部分音声位置情報とを前記登場部分情報に含めて、前記登場部分情報を記憶する登場部分情報記憶手段に記憶させる制御部と
を備える特定制御装置。
a receiving unit that receives person information that is information indicating a person;
a video acquisition unit that acquires the video related to the person indicated by the person information from a video storage device that stores a video including video information and audio information;
Identifying a partial video, which is a portion including an image of the person, from the acquired video, and identifying partial video position information, which is information indicating in which position of the video the partial video is included. Department and
Audio identification that identifies a partial audio that is a portion that includes the voice of the person from the acquired video, and identifies partial audio position information that is information indicating where in the video the partial audio is included. Department and
Regarding the acquired video, appearance part information indicating where in the video the appearance part, which corresponds to at least one of the partial video and the partial audio, is included is included in the video, and the person information and the a control unit that associates the partial video position information and the partial audio position information with the video information that is information related to the video, includes the partial video position information and the partial audio position information in the appearance portion information, and causes the appearance portion information storage means to store the appearance portion information; A specific control device comprising and.
前記音声特定部は、前記部分映像を用いて、前記人物の音声を識別可能な情報である音声特徴情報を取得し、前記音声特徴情報を用いて、前記部分音声を特定する、
請求項1に記載の特定制御装置。
The audio identifying unit uses the partial video to acquire audio feature information that is information that can identify the person's audio, and uses the audio feature information to identify the partial audio.
The specific control device according to claim 1.
前記音声特定部は、前記部分映像の中から、撮像されている人物が一人である部分を抽出し、抽出された部分の音声に基づいて、前記音声特徴情報を取得する、
請求項2に記載の特定制御装置。
The audio identifying unit extracts a portion where only one person is imaged from the partial video, and acquires the audio feature information based on the audio of the extracted portion.
The specific control device according to claim 2.
前記音声特定部は、一または複数の前記動画について、前記人物の音声を識別可能な情報である音声特徴情報を取得する箇所を指定する情報を受信し、前記音声特徴情報を取得する箇所を指定する情報で指定された箇所の音声から前記音声特徴情報を取得する、
請求項1に記載の特定制御装置。
The audio specifying unit receives information specifying a location from which audio feature information, which is information that can identify the voice of the person, is to be obtained, for one or more of the videos, and specifies the location from which the audio feature information is to be obtained. obtaining the audio feature information from the audio at the location specified by the information to be used;
The specific control device according to claim 1.
前記音声特定部は、さらに、前記部分音声を文字情報に変換し、前記部分音声の文字情報を、前記登場部分情報と対応付けて、前記登場部分情報記憶手段に記憶させる、
請求項1に記載の特定制御装置。
The voice specifying unit further converts the partial voice into text information, associates the text information of the partial voice with the appearance part information, and stores it in the appearance part information storage means.
The specific control device according to claim 1.
請求項1から請求項5のいずれかに記載の特定制御装置と、
前記登場部分情報記憶手段と、
表示制御装置と
を備え、
前記表示制御装置は、視聴者端末によって指定された人物である視聴対象人物の前記人物情報に対応する前記登場部分情報を前記登場部分情報記憶手段から取得して、取得した前記登場部分情報に関する情報を、動画一覧画像として、前記視聴者端末に表示させる、
配信システム。
The specific control device according to any one of claims 1 to 5,
the appearance partial information storage means;
Equipped with a display control device and
The display control device acquires the appearance part information corresponding to the person information of the person to be viewed, who is a person specified by the viewer terminal, from the appearance part information storage means, and generates information regarding the acquired appearance part information. is displayed on the viewer terminal as a video list image;
delivery system.
前記表示制御装置は、前記動画を前記動画記憶装置から取得して、前記登場部分でない部分をスキップしながら、前記登場部分の前記動画を前記視聴者端末に再生させる、
請求項6に記載の配信システム。
The display control device acquires the video from the video storage device and causes the viewer terminal to play back the video of the appearing portion while skipping the portion that does not appear.
The distribution system according to claim 6.
前記表示制御装置は、前記登場部分の前記動画を前記動画記憶装置から取得して、前記登場部分の前記動画を前記視聴者端末に再生させる、
請求項6に記載の配信システム。
The display control device acquires the video of the appearance portion from the video storage device and causes the viewer terminal to play the video of the appearance portion.
The distribution system according to claim 6.
人物を示す情報である人物情報を受信し、
映像情報と音声情報とを含む動画を記憶している動画記憶装置から、前記人物情報が示す前記人物に関連する前記動画を取得し、
取得された前記動画から、前記人物の映像を含む部分である部分映像を特定し、前記動画のどの位置に前記部分映像が含まれているかを示す情報である部分映像位置情報を特定し、
取得された前記動画から、前記人物の音声を含む部分である部分音声を特定し、前記動画のどの位置に前記部分音声が含まれていかを示す情報である部分音声位置情報を特定し、
取得された前記動画について、前記部分映像および前記部分音声の少なくともいずれかに該当する部分である登場部分が前記動画のどの位置に含まれているかを示す登場部分情報を、前記人物情報と、前記動画に関する情報である動画情報とに対応付けるとともに、前記部分映像位置情報と前記部分音声位置情報とを前記登場部分情報に含めて、前記登場部分情報を記憶する登場部分情報記憶手段に記憶させる、
特定制御方法。
Receive person information that is information indicating a person,
acquiring the video related to the person indicated by the person information from a video storage device that stores a video including video information and audio information;
From the acquired video, identify a partial video that is a portion that includes an image of the person, and identify partial video position information that is information indicating at which position in the video the partial video is included;
From the acquired video, identify a partial audio that is a portion that includes the voice of the person, identify partial audio position information that is information indicating where in the video the partial audio is included,
Regarding the acquired video, appearance part information indicating where in the video the appearance part, which corresponds to at least one of the partial video and the partial audio, is included is included in the video, and the person information and the Associating the partial video position information and the partial audio position information with video information that is information related to the video, including the partial video position information and the partial audio position information in the appearing part information, and storing the partial video position information in the appearing part information storage means that stores the appearing part information.
Specific control method.
コンピュータに、
人物を示す情報である人物情報を受信する受信機能と、
映像情報と音声情報とを含む動画を記憶している動画記憶装置から、前記人物情報が示す前記人物に関連する前記動画を取得する動画取得機能と、
取得された前記動画から、前記人物の映像を含む部分である部分映像を特定し、前記動画のどの位置に前記部分映像が含まれているかを示す情報である部分映像位置情報を特定する映像特定機能と、
取得された前記動画から、前記人物の音声を含む部分である部分音声を特定し、前記動画のどの位置に前記部分音声が含まれていかを示す情報である部分音声位置情報を特定する音声特定機能と、
取得された前記動画について、前記部分映像および前記部分音声の少なくともいずれかに該当する部分である登場部分が前記動画のどの位置に含まれているかを示す登場部分情報を、前記人物情報と、前記動画に関する情報である動画情報とに対応付けるとともに、前記部分映像位置情報と前記部分音声位置情報とを前記登場部分情報に含めて、前記登場部分情報を記憶する登場部分情報記憶手段に記憶させる制御機能と
を実現させる特定制御プログラム。
to the computer,
a reception function that receives person information that is information indicating a person;
a video acquisition function that acquires the video related to the person indicated by the person information from a video storage device that stores a video including video information and audio information;
Identifying a partial video, which is a portion including an image of the person, from the acquired video, and identifying partial video position information, which is information indicating in which position of the video the partial video is included. function and
Audio identification that identifies a partial audio that is a portion that includes the voice of the person from the acquired video, and identifies partial audio position information that is information indicating where in the video the partial audio is included. function and
Regarding the acquired video, appearance part information indicating where in the video the appearance part, which corresponds to at least one of the partial video and the partial audio, is included is included in the video, and the person information and the A control function that associates the partial video position information and the partial audio position information with the video information that is information related to the video, and stores the partial video position information and the partial audio position information in the appearance part information that stores the appearance part information. A specific control program that realizes and.
JP2022093590A 2022-06-09 2022-06-09 Specific control device, distribution system, specific control method, and specific control program Pending JP2023180357A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022093590A JP2023180357A (en) 2022-06-09 2022-06-09 Specific control device, distribution system, specific control method, and specific control program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022093590A JP2023180357A (en) 2022-06-09 2022-06-09 Specific control device, distribution system, specific control method, and specific control program

Publications (1)

Publication Number Publication Date
JP2023180357A true JP2023180357A (en) 2023-12-21

Family

ID=89307211

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022093590A Pending JP2023180357A (en) 2022-06-09 2022-06-09 Specific control device, distribution system, specific control method, and specific control program

Country Status (1)

Country Link
JP (1) JP2023180357A (en)

Similar Documents

Publication Publication Date Title
US11743514B2 (en) Apparatus, systems and methods for a content commentary community
US11546667B2 (en) Synchronizing video content with extrinsic data
US20160173738A1 (en) Teleprompter on wireless communication device (wcd) for producing media content for website
US8245253B2 (en) Displaying music information associated with a television program
CN101923882B (en) Information processing device, and information processing method
US20190259423A1 (en) Dynamic media recording
CN110168541B (en) System and method for eliminating word ambiguity based on static and time knowledge graph
JP2012508486A (en) Content linkage method and system using portable device
US20080229207A1 (en) Content Presentation System
JP2016527763A (en) Movie episode selection method, movie episode selection device, program, and recording medium
JP2009044454A (en) Information providing system, video reproducing apparatus, information providing apparatus, information providing method and program
US20220232291A1 (en) Apparatus, systems and methods for media content event quick access queue
CN109997366A (en) The replacement of the media content of record
US20130163965A1 (en) Information playback apparatus and control method thereof
CN110800307A (en) Event source content and remote content synchronization
JP2023180357A (en) Specific control device, distribution system, specific control method, and specific control program
US9652598B2 (en) Information processing device, control method, and storage medium
KR20140134100A (en) Method for generating user video and Apparatus therefor
US20160165313A1 (en) Electronic programming guide generation
JP4679232B2 (en) Recording device
US20130177289A1 (en) Information processing apparatus and information processing method
KR100671147B1 (en) Apparatus for experiencing famous scene and Method thereof
JP2013243704A (en) Information processing terminal
JP2013229650A (en) Electronic apparatus control method, electronic apparatus, and electronic apparatus control program
JP2015118713A (en) Management server and program information processing system