WO2014196009A1 - 動画再生システム、及び動画データのサムネイル画像の表示方法 - Google Patents

動画再生システム、及び動画データのサムネイル画像の表示方法 Download PDF

Info

Publication number
WO2014196009A1
WO2014196009A1 PCT/JP2013/065396 JP2013065396W WO2014196009A1 WO 2014196009 A1 WO2014196009 A1 WO 2014196009A1 JP 2013065396 W JP2013065396 W JP 2013065396W WO 2014196009 A1 WO2014196009 A1 WO 2014196009A1
Authority
WO
WIPO (PCT)
Prior art keywords
moving image
time
terminal
thumbnail
video
Prior art date
Application number
PCT/JP2013/065396
Other languages
English (en)
French (fr)
Inventor
力 宮地
Original Assignee
Miyaji Chikara
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Miyaji Chikara filed Critical Miyaji Chikara
Priority to JP2014538945A priority Critical patent/JP5954756B2/ja
Priority to PCT/JP2013/065396 priority patent/WO2014196009A1/ja
Publication of WO2014196009A1 publication Critical patent/WO2014196009A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8146Monomedia components thereof involving graphical data, e.g. 3D object, 2D graphics
    • H04N21/8153Monomedia components thereof involving graphical data, e.g. 3D object, 2D graphics comprising still images, e.g. texture, background image
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/8549Creating video summaries, e.g. movie trailer

Definitions

  • the present invention relates to a moving image reproduction system having a terminal capable of reproducing moving image data of moving image data.
  • thumbnail images still images
  • Patent Documents 1 and 2 the user is forced to search for a desired scene from the entire moving image data while performing normal reproduction, fast forward reproduction, or frame advance reproduction of the moving image data. It is difficult to perform the search efficiently.
  • thumbnail images still images
  • a desired scene or a video portion in the vicinity thereof is quickly searched using the thumbnail images. It is possible.
  • the time interval between temporally adjacent thumbnail images Is preferably as short as possible.
  • the thumbnail image that is transmitted from the moving image server to the terminal and displayed is a still image for every predetermined time interval of the entire image of the moving image data. For this reason, if the time interval between thumbnail images that are temporally adjacent to each other is sufficiently short, the amount of data that needs to be transmitted from the video server to the terminal device becomes enormous. The communication load is likely to be excessive. Eventually, the processing capability of the video server and terminal will be reduced.
  • the present invention has been made in view of such a background, and uses a thumbnail image of moving image data to quickly search for a video portion of a desired scene and to confirm in detail the instantaneous instantaneous video change of the video portion. It is an object of the present invention to provide a system and method capable of realizing the above.
  • a moving image playback system of the present invention includes a terminal having a function of reproducing moving image data, and a moving image server that transmits the moving image data to the terminal through communication with the terminal.
  • the moving image server receives a plurality of thumbnail images indicating still images of the moving image data corresponding to a plurality of sampling times on the time axis of the moving image data in response to a request from the terminal. Configured to transmit, When a predetermined operation for displaying the thumbnail image transmitted from the moving image server is performed, the terminal displays a thumbnail image corresponding to the sampling time indicated by the predetermined operation on the terminal.
  • the plurality of thumbnail images transmitted from the moving image server to the terminal have the moving image data when a time interval between adjacent sampling times among the plurality of sampling times corresponding to the thumbnail images is defined as a time between thumbnail images.
  • the time between thumbnail images in a specific partial time zone set as a time zone including the scene of interest in the entire video image is shorter than the time between thumbnail images in other time zones. (1st invention).
  • the time axis of the moving image data means a time axis indicating the elapsed time when the moving image of the moving image data is reproduced from the first image to the last image.
  • the terminal when the user of the terminal wants to search for a desired scene (target scene) in the entire moving image of the moving image data, for example, the plurality of thumbnail images are respectively displayed.
  • the terminal is operated so as to display in time series in the order of the sampling time.
  • the time between thumbnail images in the specific partial time zone as the time zone including the scene of interest is shorter than the other time zones. For this reason, thumbnail images at short time intervals (dense time intervals) are displayed on the terminal in the specific partial time zone, and at longer time intervals (sparse time intervals) in other time zones. Thumbnail images are displayed on the terminal. Therefore, the time-series change form of the thumbnail image displayed on the terminal is different between the specific partial time zone and another time zone.
  • the scene of interest can be quickly searched without having to look at many thumbnail images of scenes that are not of interest in the other time zones.
  • the user can see thumbnail images at short time intervals in a specific partial time zone including the scene of interest, the user can observe changes in the instantaneous video data in detail.
  • the first invention it is possible to quickly search for the video portion of the scene to be viewed using the thumbnail image of the moving image data and to confirm in detail the instantaneous video change of the video portion. . Also, in other time zones other than the specific time zone, the time between thumbnail images can be set to a longer time, so the total number of thumbnail images of video data transmitted from the video server to the terminal is excessive. Can be prevented.
  • the specific partial time zone can be set in the following manner, for example.
  • metadata tag information, cue points, etc.
  • the specific partial time zone is set based on the metadata so as to include the time indicated by the metadata (second invention).
  • the specific partial time zone including the target scene can be easily set.
  • the specific partial time zone is the volume of the audio data or a temporal change in the volume. (3rd invention).
  • the loudness level of cheers from the audience or the amount of change per unit time is characteristically large at the time near the scene of interest. Often becomes. Therefore, the specific partial time zone including the scene of interest can be set based on the volume of the audio data added to the moving image data or the temporal change of the volume.
  • the specific partial time zone may be set in the following manner. That is, the moving image server is a reproduction pause time that is data indicating the time on the time axis of the moving image data at which the reproduction is paused each time the moving image of the moving image data is reproduced on the terminal.
  • the specific partial time zone is a time zone in which the time indicated by the playback pause time data is included at a higher frequency than other time zones. (Fourth invention).
  • a user who reproduces the moving image of the moving image data on the terminal often performs the reproduction of the moving image while the image of the scene of interest is displayed. Therefore, by setting the specific partial time zone so that the time indicated by the playback pause time data is included in a time zone that is included more frequently than other time zones, the time including the scene of interest A specific partial time zone as a zone can be set appropriately.
  • a plurality of thumbnail images equal to or less than the total number of the plurality of thumbnail images are transferred from the still image of the moving image data.
  • the terminal is configured to perform the predetermined operation.
  • the arrangement portion of the thumbnail image in the composite image including the thumbnail image is enlarged and displayed (fourth). invention).
  • all of the plurality of thumbnail images respectively corresponding to the plurality of sampling times may be arranged in one composite image.
  • the fifth aspect by transmitting the one or more composite images from the moving image server to the terminal, a plurality of thumbnail images included in each composite image are transmitted to the terminal collectively. Become. In this case, since the resolution of each thumbnail image arranged in the composite image is set to be lower than that of the still image of the moving image data, the file size of each composite image can be suppressed so as not to be excessive.
  • the transmission of the plurality of thumbnail images from the moving image server to the terminal can be smoothly performed in a short time while reducing the communication load between the moving image server and the terminal.
  • the thumbnail image is displayed on the terminal as an appropriately sized display image that is not too small by enlarging and displaying the arrangement portion of the thumbnail image in the composite image. Can.
  • the video server is created with a higher resolution than the low-resolution image of interest that is the thumbnail image when the same thumbnail image is displayed on the terminal for a predetermined time.
  • a high-resolution focused image that is a thumbnail image is configured to be transmitted to the terminal.
  • the terminal converts a thumbnail image to be displayed on the terminal from the low-resolution focused image to the transmitted high-resolution focused image. It is preferable to be configured to switch (the sixth invention).
  • a situation in which the same thumbnail image is displayed on the terminal for a predetermined time is likely to be a situation where the user is paying attention to the thumbnail image.
  • the high resolution focused image is transmitted from the moving image server to the terminal, and the thumbnail image to be displayed on the terminal is switched from the low resolution focused image to the high resolution focused image.
  • the user can see the thumbnail image of interest on the terminal in detail as a high-resolution image of interest.
  • the moving image server since the moving image server transmits only the high-resolution image of interest corresponding to the thumbnail image that the user is interested in to the terminal, it can be smoothly transmitted in a short time. As a result, it is possible to quickly switch from the low-resolution focused image to the high-resolution focused image in the terminal.
  • the method for displaying thumbnail images of moving image data includes a plurality of still images corresponding to each of a plurality of sampling times on the time axis of the moving image data in a terminal having a function of reproducing the moving image data.
  • a method for displaying thumbnail images of When the time interval between adjacent sampling times among the plurality of sampling times corresponding to each of the plurality of thumbnail images is defined as the time between thumbnail images, the target object of the entire moving image of the moving image data
  • the plurality of thumbnail images created so that the time between thumbnail images in a specific partial time zone set as a time zone including a scene is shorter than the time between thumbnail images in another time zone.
  • the plurality of thumbnail images are displayed in the order of sampling times corresponding to each of the thumbnail images when the terminal is loaded and a predetermined operation of the terminal is performed (seventh invention).
  • thumbnail images are displayed on the terminal at shorter time intervals (dense time intervals) in the specific partial time zone, and longer time intervals are displayed in other time zones. Thumbnail images for each (sparse time interval) are displayed on the terminal.
  • the scene of interest can be quickly searched without having to look at many thumbnail images of scenes that are not of interest in the other time zones.
  • the user can see thumbnail images at short time intervals in a specific partial time zone including the scene of interest, the user can observe changes in the instantaneous video data in detail.
  • the seventh aspect it is possible to quickly search for the video portion of the scene to be viewed using the thumbnail image of the moving image data and to confirm in detail the instantaneous instantaneous video change of the video portion. .
  • the moving image playback system of the present embodiment includes a moving image server 1 and a terminal 2 that can communicate with the moving image server 1 via a communication network 3 such as the Internet.
  • the moving image server 1 is a server device composed of a computer and peripheral devices attached thereto (input / output devices, storage devices, etc.).
  • Each terminal 2 is a terminal configured by a personal computer having a display capable of displaying a moving image and a tablet terminal.
  • the moving image server 1 includes a database 11 that stores and holds a plurality of moving image data V that can be reproduced by each terminal 2.
  • Each moving image data V is moving image data such as a sports image obtained by photographing and recording a situation of competition or practice in various sports, for example.
  • the moving image data V may be other types of moving image data other than sports images.
  • a plurality of pieces of image data created in advance as image data indicating still images of the moving image data corresponding to a plurality of sampling times on the time axis of the moving image data V are shown.
  • Thumbnail images S (Sa and Sb in FIG. 1) are stored and held.
  • the plurality of sampling times are times set for each moving image data V as described later.
  • the time axis of each video data V is the normal playback speed of the video data of the video data V from the top video to the end video (the playback speed at which the time lapse in the video video matches the actual time lapse). It means a time axis indicating the elapsed time when played back.
  • the thumbnail image S created corresponding to each sampling time of the video data V is a thumbnail image created as a still image having the same resolution as the instantaneous video of the video data V at the sampling time.
  • thumbnail images Sa and a thumbnail image Sb created as a still image with a resolution lower than that of the thumbnail image Sa are two types of thumbnail images, Sa and a thumbnail image Sb created as a still image with a resolution lower than that of the thumbnail image Sa.
  • the thumbnail image Sa may be referred to as a high-resolution thumbnail image Sa
  • the thumbnail image Sb may be referred to as a low-resolution thumbnail image Sb.
  • a plurality of high-resolution thumbnail images Sa of each moving image data V are stored and held in the database 11 as separate image data.
  • the plurality of thumbnail images Sa on the low resolution side of each moving image data V are converted into image data of one composite image Sbx obtained by combining the plurality of thumbnail images Sb in a regularly arranged form. ing.
  • the composite image Sbx is stored and held in the database 11 as image data that collectively includes a plurality of low-resolution thumbnail images Sb.
  • the composite image Sbx is a composite image in a form in which a plurality of low-resolution thumbnail images Sb are arranged in a matrix in the order of sampling times corresponding to each, as illustrated in FIG. Therefore, each thumbnail image Sb is a partial image of the composite image Sbx.
  • each thumbnail image Sb included in the composite image Sbx is a low-resolution image
  • the file size of the composite image Sbx is prevented from becoming excessive.
  • the file size of the composite image Sbx can be stored in a size of about 1 to 2 MB, for example.
  • the number of thumbnail images Sb included in a single composite image Sbx is limited to a predetermined upper limit number or less so that the resolution of the thumbnail images Sb included in the single composite image Sbx does not become too low.
  • the total number of images Sb exceeds the upper limit number, the total number of thumbnail images Sb may be distributed to two or more composite images Sbx.
  • the upper limit number of thumbnail images Sb is included in the first composite image Sbx, and the remaining ⁇ thumbnail images Sb are included in the first number. It may be included in the second composite image Sbx.
  • the plurality of sampling times on the time axis of each moving image data V is the time interval between the thumbnail images ⁇ T, which is the time interval between the thumbnail images Sa and Sa (or Sb and Sb) corresponding to the adjacent sampling times. It is set for each moving image data V so as to change according to the time zone of the V time axis.
  • each moving image data V is necessary to see in detail the change in movement of a certain object in the image (for example, a player in a sports image) or A video part of a specific partial time zone (hereinafter referred to as a target time zone) including a target scene as a highly demanded scene and a video portion of another time zone (hereinafter referred to as a non-target time zone) Is done.
  • a target time zone a specific partial time zone
  • a target time zone including a target scene as a highly demanded scene and a video portion of another time zone
  • the total number of thumbnail images Sa and Sb is excessive. You can avoid becoming too many. As a result, even when all the thumbnail images Sb on the low resolution side are combined into a single composite image Sbx, the file size of the composite image Sbx is suppressed and the resolution of the thumbnail image Sb is prevented from becoming too low. Can do.
  • the values of the time between thumbnail images ⁇ Ta and ⁇ Tb may be fixed values determined in advance, for example, but depending on the type of content of the moving image of the moving image data V or the entire time of the moving image data V, the moving image data V It may be set every time.
  • the target time zone is, for example, the time position of the video of an arbitrary target scene of each moving image data V in the entire moving image of the moving image data V. As information to be shown, it is determined based on metadata (tag, cue point, etc.) attached to the moving image data V by a person concerned (creator or the like) of the moving image data V.
  • a partial time zone near the time including the time indicated by the metadata is determined as the target time zone.
  • the video data V is video data of a judo sports video
  • a scene near the time when the player's skill is determined is set as one scene of interest, and indicates the time near the scene.
  • Metadata is attached to the moving image data V.
  • a time zone before and after the time indicated by the metadata (for example, a time zone having a predetermined time width before and after the time) is set as the target time zone.
  • the moving image data V is, for example, moving image data of a soccer sports video
  • the scene immediately before the time at which the shot was taken is set as the target scene, and the meta that indicates the time at which the shot was taken.
  • Data is attached to the moving image data V.
  • a time zone immediately before the time indicated by the metadata (for example, a time zone from the time to a predetermined time before) is set as the target time zone.
  • the processing for setting the target time zone as described above and the processing for determining the plurality of sampling times according to the setting and creating the thumbnail images Sa and Sb are, for example, appropriate applications in the video server 1. It is done by operating. In this case, the target time zone is automatically set from the type of content of the video data and the metadata attached to the video data, and further, the setting of a plurality of sampling times and the thumbnail image Sa at each sampling time are set. , Sb can be created.
  • the target time zone may be finally determined.
  • the target time zone can be set based on the audio data.
  • the cheering of the audience is increased in the vicinity of a target scene (a scene in which a player's skill is determined in a judo game, a scene in which a shot is determined in a soccer game, etc.). Therefore, for example, a time zone in the vicinity of the time including the time when the volume of the audio data or the increase amount of the volume per unit time becomes a predetermined amount or more may be set as the target time zone.
  • the moving image data V and the thumbnail images S (Sa, Sb) are stored and held as described above.
  • the moving image server 1 sends the moving image data V selected by each terminal 2 to the terminal 2 in a streaming manner when it is requested by the terminal 2 to reproduce the moving image data V. Configured to transmit.
  • the moving image server 1 communicates with the terminal device 2 to display the thumbnail image S on the terminal device 2 in accordance with a predetermined operation of the terminal device 2 (operation of a slide bar 31 described later). S is transmitted to the terminal 2.
  • each terminal 2 will be described.
  • a video viewer application is mounted on each terminal 2. Then, the user of the terminal 2 activates the moving image viewer and operates the moving image viewer, so that the moving image of the desired moving image data V can be viewed on the terminal 2.
  • a video viewer screen as shown in FIG. 3 is displayed on the display of the terminal 2.
  • a video display unit 21 which is an area for displaying the video image of the video data V and the thumbnail image S is displayed, and a menu bar 22 for selecting video data to be browsed, a video image, etc.
  • a pause button 23 for temporarily stopping playback, a slow reverse playback button 24 for reproducing a moving image in a reverse direction at a low reproduction speed, and a reverse reproduction button for reproducing a moving image in a reverse direction at a normal reproduction speed. 25.
  • a normal playback button 26 for playing a moving picture forward at a normal playback speed, a slow playback button 27 for playing a moving picture forward at a slow playback speed, and a frame-by-frame playback of the moving picture.
  • a frame return button 28 for moving the image, a frame advance button 29 for moving the moving image forward in the forward direction, and a moving image displayed on the image display unit 21 (or A slide bar that slides according to the time position of the moving image displayed on the reproduction position display unit 30 and the video display unit 21 indicating at which time position of the entire moving image the thumbnail image) 31 etc. are provided.
  • the slide bar 31 automatically slides (displaces in the horizontal direction in the illustrated example) as the playback time elapses when a moving image is played back, and the user performs a slide operation with the mouse or finger of the terminal 2. Is also possible.
  • the thumbnail image S is displayed on the video display unit 21.
  • a user who wants to view a moving image or the like starts the moving image viewer of the terminal 2 and accesses the moving image server 1.
  • the terminal 2 requests the moving image server 1 to transmit (download) the thumbnail image Sb on the low resolution side.
  • the moving image server 1 transmits the image data of the combined image Sbx formed by combining the plurality of thumbnail images Sb corresponding to the selected moving image data V to the terminal 2.
  • the composite image Sbx is quickly downloaded to the terminal device 2.
  • the composite image Sbx is stored in a storage unit such as a memory or a hard disk of the terminal 2.
  • the user wants to reproduce and view the moving image of the selected moving image data V on the display of the terminal 2, the user operates the normal reproduction button 26 on the moving image viewer screen.
  • a request for reproducing the moving image data V on the terminal 2 is transmitted from the terminal 2 to the moving image server 1.
  • the moving image server 1 transmits the moving image data V to the terminal 2 in a streaming manner.
  • the video viewer causes the video display unit 21 on the video viewer screen to play the video video of the video data V in a streaming manner.
  • the video is stopped at the time of the operation, and the video displayed on the video display unit 21 on the video viewer screen is stationary. It becomes an image.
  • the playback mode slow playback, reverse rotation indicated by each operation button is operated.
  • Video of the reproduction or the like is transmitted from the video server 1 to the terminal device 2 in a streaming manner, and the moving image is displayed on the video display unit 21 of the terminal device 2.
  • the user searches for the video of the target scene in the entire video of the selected video data V, or observes in detail the movement of the target in the video in the time zone near the scene.
  • the user selects the slide bar 31 on the moving image viewer screen with a mouse operation or a finger, and slides the slide bar 31 appropriately.
  • the moving image viewer displays a thumbnail at the sampling time that matches or is closest to the time indicated by the slide position of the slide bar 31 from the composite image Sbx downloaded to the terminal 2.
  • the area of the image Sb is extracted, and the thumbnail image Sb of the area is displayed on the video display unit 21.
  • the moving image viewer enlarges the extracted thumbnail image Sb and displays it on the video display unit 21.
  • the user slides the slide bar 31 while viewing the thumbnail image Sb displayed on the video display unit 21.
  • the thumbnail image Sb displayed on the video display unit 21 by the moving image viewer is switched according to the displacement of the slide position of the slide bar 31.
  • the slide position of the slide bar 31 is a position corresponding to the time of the target time zone of the moving image data V
  • the thumbnails switched by the video display unit 21 per unit displacement amount of the slide position are larger than when the slide position is a position corresponding to the time of the non-target time zone of the video data V.
  • the user can easily find the thumbnail image Sb of the scene of interest or a scene in the vicinity thereof by sliding the slide bar 31 while viewing the thumbnail image Sb displayed on the video display unit 21. it can.
  • the user observes the instantaneous instantaneous image and its change in detail in a state where the slide position of the slide bar 31 is slid to the position corresponding to the time of the target time zone including the target scene.
  • the slide position of the slide bar 31 is intermittently moved so that any one thumbnail image Sb in the target time zone is displayed on the video display unit 21 intermittently.
  • the video viewer of the terminal 2 displays the same thumbnail image Sb.
  • the thumbnail image Sb (this corresponds to the low-resolution image of interest in the present invention) on the high resolution side at the same sampling time.
  • the moving image server 1 is requested to transmit image data of the thumbnail image Sa (this corresponds to the high-resolution image of interest in the present invention).
  • the moving image server 1 transmits the image data of the thumbnail image Sa on the high resolution side at the sampling time of the thumbnail image Sb being displayed on the terminal 2 to the terminal 2.
  • the thumbnail image Sa transmitted from the moving image server 1 to the terminal 2 is a single image, it is quickly downloaded to the terminal 2.
  • the moving image viewer of the terminal 2 switches the thumbnail image to be displayed on the video display unit 21 from the low-resolution thumbnail image Sb to the downloaded high-resolution thumbnail image Sa.
  • the user can view the video (still image) at the sampling time corresponding to the slide position of the slide bar 31 as a clear image by the thumbnail image Sa on the high resolution side.
  • FIG. 3 schematically shows an example of the thumbnail image Sa (or Sb) displayed on the video display unit 21 as described above in accordance with the operation of the slide bar 31.
  • the moving image data V in the illustrated example is moving image data indicating an image when, for example, a gymnastic floor exercise, a player as an object sequentially performs a run, a flip, and a landing.
  • the time zone of the scene where the player flips over is the target time zone
  • the other time zone time zone of the run-up and landing scene
  • the time between thumbnail images in the time zone of the scene where the player flips over is set to a time interval shorter than the time between thumbnail images in other time zones.
  • the slide bar 31 is operated to the slide position in the time zone of the player's somersault scene.
  • the thumbnail image Sa on the high resolution side is displayed on the video display unit 21.
  • the slide bar 31 is intermittently slid by a small amount, and the thumbnail images Sa to be displayed on the video display unit 21 are sequentially and intermittently switched. Etc. can also be observed in detail.
  • the user can observe the thumbnail image Sa on the high resolution side for each short time interval in the target time zone of the moving image data V. For this reason, it is possible to observe in detail a change in the movement of the object in the video image in the vicinity of the scene of interest. As a result, the moving image data V and the thumbnail images Sa and Sb can be used effectively.
  • the moving image data V is sports image moving image data
  • the target time zone is set based on the metadata (or audio data) attached to the moving image data V.
  • the moving image server 1 learns the time zone of the scene estimated as the user's target scene out of the entire moving image of the moving image data V, and according to the learning result. Set the target time zone.
  • the user selects the moving image data in the state in which the moving image viewer of the terminal 2 is activated, and the moving image video of the moving image data is displayed on the moving image viewer screen 21 as in the first embodiment. Play with.
  • the user generally operates the pause button 23 of the video viewer to pause the playback of the video image while the video of the scene of interest is displayed on the video display unit 21. Often done. Therefore, there is a high possibility that the scene when the reproduction of the moving image is paused is the target scene of the user.
  • the operation viewer acquires data indicating the time (time on the time axis of the moving image data V) when the operation of the pause button 23 is performed during the reproduction of the moving image. , Referred to as “playback pause time data”) from the terminal 2 to the video server 1.
  • the reproduction pause time data transmitted to the moving image server 1 is stored in the moving image server 1 for each moving image data. Then, for each moving picture data V, the moving picture server 1 determines the object of interest based on the frequency of the time indicated by the reproduction pause time data when the saved reproduction pause time data exceeds a predetermined number. Set the time zone.
  • the entire moving image data V is divided into a plurality of time zones in advance. Then, the video server 1 sets, as the target time zone, a time zone that includes the time indicated by the reproduction pause time data at a frequency of a predetermined number or more among the plurality of time zones.
  • a time zone in which the reproduction of the video data V is frequently paused is set by the learning process as a time zone including a scene that the user actually pays attention to.
  • the terminal 2 that transmits the reproduction pause time data collected by the moving image server 1 to the moving image server 1 may be limited to a terminal 2 that is used by a specialized user such as a sports trainer. .
  • This embodiment is the same as the first embodiment except for the processing for setting the target time zone described above.
  • the entire moving image data V is classified into two types, the target time zone and the non-target time zone, but the target time zone is further classified. Also good.
  • the target time zone is classified into a plurality of stages according to the level of focus, and the time between thumbnail images is varied according to the level of focus for each target time zone (the higher the focus level, The time between thumbnail images may be shortened).
  • Video server 1 ... Video server, 2 ... Terminal.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Graphics (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

 動画データのサムネイル画像を用いて、見たいシーンの映像部分を素早く探索することと、該映像部分の瞬時瞬時の映像の変化を詳しく確認することとを実現する。 端末機2は、動画データの複数のサンプリング時刻にそれぞれ対応する複数のサムネイル画像(静止画像)を所定の操作により表示する。互いに隣り合うサンプリング時刻の時刻間隔をサムネイル画像間時間と定義したとき、動画データの動画映像の全体のうちの着目対象のシーンを含む着目対象時間帯でのサムネイル画像間時間が、他の時間帯でのサムネイル画像間時間よりも短い時間間隔に設定されている。

Description

動画再生システム、及び動画データのサムネイル画像の表示方法
 本発明は、動画データの動画映像を再生し得る端末機を有する動画再生システムに関する。
 従来、動画データを動画サーバからストリーミング方式でクライアントの端末機に伝送し、該端末機で動画データの動画映像を再生するシステムが知られている(例えば特許文献1、2を参照)。
 また、例えばインターネットの動画データの提供サイトでは、端末機で再生させる動画データの映像の一定時間間隔毎の複数のサムネイル画像(静止画像)を、端末機の表示画面中のスライドバーの操作に応じて時系列的に表示させるものが知られている。
特開2001-125260号公報 特開2013-46276号公報
 動画サーバから伝送される動画データの動画映像を端末機で再生して見る場合、該動画データの全体のうちの一部の映像だけを重点的に見ることが必要となる場合が多々ある。
 例えば、スポーツトレーナ等が、スポーツの競技もしくは練習を撮影してなる動画映像を見ることで、選手の動きの確認及び分析等を行う場合、該動画映像の全体のうちの一部の特定のシーンの映像(例えば柔道の選手が技をかける近辺の時間帯のシーンの映像等)を詳細に見ることの必要性が高い。
 このような場合、動画データの全体から、見たいシーンの映像部分を素早く探索することと、該映像部分の瞬時瞬時の映像の変化を詳しく確認することとが要求される。
 しかしながら、前記特許文献1,2のものでは、利用者は、動画データの通常再生、早送り再生、あるいは、コマ送り再生を行いながら、動画データの全体から見たいシーンを探索せざるを得ず、その探索を効率よく行うことは困難である。
 一方、動画データの映像の一定時間間隔毎の複数のサムネイル画像(静止画像)を端末機に表示させるようにしたシステムでは、該サムネイル画像によって、見たいシーンもしくはその近辺の映像部分を素早く探索することが可能である。
 ここで、利用者が見たいシーンもしくはその近辺の映像部分を探索した後に、該映像部分の瞬時瞬時の映像の変化を詳細に確認する上では、時間的に隣り合うサムネイル画像の間の時間間隔はできるだけ短いことが好ましいと考えられる。
 しかるに、従来のシステムでは、動画サーバから端末機に伝送して表示させるサムネイル画像は、動画データの全体の映像の一定時間間隔毎の静止画像である。このため、時間的に隣り合うサムネイル画像の間の時間間隔を十分に短くすると、動画サーバから端末機に伝送することが必要となるデータ量が膨大になって、動画サーバと端末機との間の通信負荷が過大なものとなりやすい。ひいては、動画サーバや端末機の処理能力が低下してしまう。
 このため、従来のシステムでは、時間的に隣り合うサムネイル画像の間の時間間隔を十分に短い時間にすることは困難である。ひいては、従来のシステムでは、端末機に表示されるサムネイル画像によって、利用者が見たいシーンもしくはその近辺の映像部分の瞬時瞬時の映像の変化を詳細に確認することは困難であった。
 本発明はかかる背景に鑑みてなされたものであり、動画データのサムネイル画像を用いて、見たいシーンの映像部分を素早く探索することと、該映像部分の瞬時瞬時の映像の変化を詳しく確認することとを実現できるシステム及び方法を提供することを目的とする。
 本発明の動画再生システムは、上記の目的を達成するために、動画データを再生する機能を有する端末機と、前記動画データを前記端末機との通信によって該端末機に伝送する動画サーバとを備える動画再生システムにおいて、
 前記動画サーバは、前記動画データの時間軸上での複数のサンプリング時刻のそれぞれに対応する該動画データの静止画像を示す複数のサムネイル画像を、前記端末機からの要求に応じて該端末機に伝送するように構成されており、
 前記端末機は、前記動画サーバから伝送された前記サムネイル画像を表示させるための所定の操作が行われた場合に、該所定の操作により指示されたサンプリング時刻に対応するサムネイル画像を該端末機で表示するように構成されており、
 前記動画サーバが前記端末機に伝送する前記複数のサムネイル画像は、それぞれに対応する前記複数のサンプリング時刻のうちの互いに隣り合うサンプリング時刻の時刻間隔をサムネイル画像間時間と定義したとき、前記動画データの動画映像の全体のうちの着目対象のシーンを含む時間帯として設定された特定の部分時間帯でのサムネイル画像間時間が、他の時間帯でのサムネイル画像間時間よりも短い時間間隔となるように作成されていることを特徴とする(第1発明)。
 なお、前記動画データの時間軸は、該動画データの動画映像を先頭の映像から終端の映像まで再生させた場合の経過時間を示す時間軸を意味する。
 かかる第1発明において、前記端末機の利用者が、前記動画データの動画映像の全体のうちの所望のシーン(着目対象のシーン)を探索しようとする場合、例えば前記複数のサムネイル画像をそれぞれのサンプリング時刻の順に時系列的に表示させるように該端末機を操作する。
 この場合、前記着目対象のシーンを含む時間帯としての前記特定の部分時間帯におけるサムネイル画像間時間は、他の時間帯よりも短い。このため、前記特定の部分時間帯では、短めの時間間隔(密な時間間隔)毎のサムネイル画像が端末機で表示され、他の時間帯では、長めの時間間隔(疎な時間間隔)毎のサムネイル画像が端末機で表示される。従って、特定の部分時間帯と他の時間帯とでは、端末機で表示されるサムネイル画像の時系列的な変化の形態が相違するものとなる。
 このため、上記他の時間帯での着目対象外のシーンのサムネイル画像を多数、見ることを必要とせずに、着目対象のシーンを速やかに探索することができる。
 さらに、利用者は、着目対象のシーンを含む特定の部分時間帯では、短い時間間隔のサムネイル画像を見ることができるので、瞬時瞬時の動画データの映像の変化を細かく観察することができる。
 よって、第1発明によれば、動画データのサムネイル画像を用いて、見たいシーンの映像部分を素早く探索することと、該映像部分の瞬時瞬時の映像の変化を詳しく確認することとを実現できる。また、前記特定の時間帯以外の他の時間帯では、サムネイル画像間時間を長めの時間に設定しておくことができるので、動画サーバから端末機に伝送する動画データのサムネイル画像の総数が過大になるのを防止できる。
 かかる第1発明では、前記特定の部分時間帯は、例えば次のような態様で設定することができる。
 すなわち、前記動画データには、該動画データにおける前記着目対象のシーンの時刻を示すメタデータ(タグ情報、キューポイント等)が付されている場合がある。この場合には、記特定の部分時間帯は、該メタデータにより示される時刻を含むように該メタデータに基づいて設定されていることが好ましい(第2発明)。
 この第2発明によれば、着目対象のシーンを含む前記特定の部分時間帯を容易に設定することができる。
 あるいは、前記動画データに、該動画データの動画映像に対応する音声データが付加されている場合には、前記特定の部分時間帯は、該音声データの音量の大きさ又は該音量の時間的変化に基づいて設定されていてもよい(第3発明)。
 すなわち、例えば、スポーツの競技を撮影してなるスポーツ映像では、着目対象のシーンの近辺の時刻で、観客等の歓声の音量の大きさ、あるいは、その単位時間当たりの変化量が特徴的に大きくなることが多い。従って、動画データに付加されている音声データの音量の大きさ又は該音量の時間的変化に基づいて、着目対象のシーンを含む前記特定の部分時間帯を設定することもできる。
 あるいは、次のような態様で前記特定の部分時間帯を設定してもよい。すなわち、前記動画サーバは、前記端末機での前記動画データの動画映像の再生の都度、該再生の一時停止が行われた該動画データの時間軸上の時刻を示すデータである再生一時停止時刻データを前記端末機との通信によって取得するように構成されており、前記特定の部分時間帯は、前記再生一時停止時刻データにより示される時刻が他の時間帯よりも高い頻度で含まれる時間帯となるように設定されている(第4発明)。
 ここで、前記動画データの動画映像を端末機で再生させて見る利用者は、着目対象のシーンの映像が表示されている状態で、動画映像の再生を一時停止させることをしばしば行う。従って、前記特定の部分時間帯を、前記再生一時停止時刻データにより示される時刻が他の時間帯よりも高い頻度で含まれる時間帯となるように設定することで、着目対象のシーンを含む時間帯としての特定の部分時間帯を適切に設定することができる。
 前記第1~第4発明では、前記動画サーバは、前記複数のサムネイル画像を前記端末機に送信するとき、該複数のサムネイル画像の総数以下の複数のサムネイル画像を、前記動画データの静止画像よりも低い解像度の画像として規則的に配列させた形態で各々包含するように作成された1つ又は複数の合成画像を前記端末機に送信するように構成され、前記端末機は、前記所定の操作により指示された時刻に対応するサムネイル画像を表示するとき、該サムネイル画像を含む前記合成画像のうちの該サムネイル画像の配置部分を拡大して表示するように構成されていることが好ましい(第4発明)。
 なお、第5発明では、前記複数のサンプリング時刻にそれぞれ対応する複数のサムネイル画像の全てを1つの合成画像に配列してもよい。
 上記第5発明によれば、前記1つ又は複数の合成画像を前記動画サーバから端末機に伝送することで、各合成画像に含まれる複数のサムネイル画像がひとまとめに端末機に伝送されることとなる。そして、この場合、合成画像に配列されている各サムネイル画像の解像度は、前記動画データの静止画像よりも低い解像度とされているので、各合成画像のファイルサイズを過大とならないように抑制できる。
 従って、動画サーバから端末機への前記複数のサムネイル画像の伝送を、該動画サーバと端末機との間の通信負荷を軽減しつつ、短時間で円滑に行うようにすることができる。
 そして、端末機では、前記合成画像のうちの該サムネイル画像の配置部分を拡大して表示することで、該サムネイル画像を、小さ過ぎることのない適度な大きさの表示画像として端末機で表示されることができる。
 かかる第5発明では、前記動画サーバは、前記端末機において同一のサムネイル画像を表示させている時間が所定時間継続した場合に、該サムネイル画像である低解像度着目画像よりも高い解像度で作成されたサムネイル画像である高解像度着目画像を前記端末機に伝送するように構成され、前記端末機は、該端末機で表示させるサムネイル画像を、前記低解像度着目画像から前記伝送された高解像度着目画像に切替えるように構成されていることが好ましい(第6発明)。
 ここで、前記端末機において同一のサムネイル画像を表示させている時間が所定時間継続したような状況は、利用者が、該サムネイル画像に注目している状況である可能性が高い。
 そこで、第6発明では、前記高解像度着目画像を動画サーバから端末機に伝送し、端末機で表示させるサムネイル画像を、低解像度着目画像から高解像度着目画像に切替える。
 これにより、利用者は、注目しているサムネイル画像を、高解像度着目画像として端末機で詳細に見ることができる。また、この場合、動画サーバは、利用者が注目しているサムネイル画像に対応する高解像度着目画像だけを端末機に伝送するので、その伝送を短時間で円滑に行うことができる。ひいては、端末機における低解像度着目画像から高解像度着目画像への切替えを速やかに行うことができる。
 また、本発明の動画データのサムネイル画像の表示方法は、動画データを再生する機能を有する端末機において、該動画データの時間軸上での複数のサンプリング時刻のそれぞれに対応する静止画像を示す複数のサムネイル画像を表示させる方法であって、
 前記複数のサムネイル画像のそれぞれに対応する前記複数のサンプリング時刻のうちの互いに隣り合うサンプリング時刻の時刻間隔をサムネイル画像間時間と定義したとき、前記動画データの動画映像の全体のうちの着目対象のシーンを含む時間帯として設定された特定の部分時間帯でのサムネイル画像間時間が、他の時間帯でのサムネイル画像間時間よりも短い時間間隔となるように作成された前記複数のサムネイル画像を前記端末機に取り込み、該端末機の所定の操作が行われた場合に、前記複数のサムネイル画像をそれぞれに対応するサンプリング時刻の時刻順に表示させることを特徴とする(第7発明)。
 かかる第7発明によれば、前記端末機の利用者が、前記動画データの動画映像の全体のうちの所望のシーン(着目対象のシーン)を探索するために前記所定の操作を行った場合、第1発明に関して説明した場合と同様に、前記特定の部分時間帯では、短めの時間間隔(密な時間間隔)毎のサムネイル画像が端末機で表示され、他の時間帯では、長めの時間間隔(疎な時間間隔)毎のサムネイル画像が端末機で表示される。
 このため、上記他の時間帯での着目対象外のシーンのサムネイル画像を多数、見ることを必要とせずに、着目対象のシーンを速やかに探索することができる。
 さらに、利用者は、着目対象のシーンを含む特定の部分時間帯では、短い時間間隔のサムネイル画像を見ることができるので、瞬時瞬時の動画データの映像の変化を細かく観察することができる。
 よって、第7発明によれば、動画データのサムネイル画像を用いて、見たいシーンの映像部分を素早く探索することと、該映像部分の瞬時瞬時の映像の変化を詳しく確認することとを実現できる。
本発明の一実施形態の動画再生システムの構成を示す図。 サムネイル画像間時間の設定形態を説明するための図。 端末機の表示画面の例を示す図。
 本発明の一実施形態を図1~図3を参照して以下に説明する。図1を参照して、本実施形態の動画再生システムは、動画サーバ1と、インターネット等の通信ネットワーク3を介して動画サーバ1とそれぞれ通信可能な端末機2とを備える。
 動画サーバ1は、コンピュータ及びそれに付帯する周辺機器(入出力機器、記憶装置等)により構成されたサーバ装置である。また、各端末機2は、動画映像を表示可能なディスプレイを有するパーソナルコンピュータ、タブレット端末機等により構成された端末機である。
 動画サーバ1は、各端末機2で再生可能な複数の動画データVを記憶保持したデータベース11を備える。各動画データVは、例えば、各種のスポーツにおける競技あるいは練習の状況を撮影して記録してなるスポーツ映像等の動画データである。ただし、動画データVは、スポーツ映像以外の種類の動画データであってもよい。
 動画サーバ1のデータベース11には、各動画データV毎に、動画データVの時間軸上の複数のサンプリング時刻にそれぞれ対応する該動画データの映像の静止画像を示す画像データとしてあらかじめ作成された複数のサムネイル画像S(図1中のSa,Sb)が記憶保持されている。上記複数のサンプリング時刻は、動画データV毎に後述するように設定された時刻である。
 なお、各動画データVの時間軸は、該動画データVの動画映像を先頭の映像から終端の映像まで通常の再生速度(動画映像での時間経過が実際の時間経過と一致する再生速度)で再生させた場合の経過時間を示す時間軸を意味する。
 ここで、本実施形態では、動画データVの各サンプリング時刻に対応して作成されたサムネイル画像Sは、該サンプリング時刻における動画データVの瞬間映像と同等の解像度の静止画像として作成されたサムネイル画像Saと、該サムネイル画像Saよりも低い解像度の静止画像として作成されたサムネイル画像Sbとの2種類のサムネイル画像である。以降、サムネイル画像Saを、高解像度側のサムネイル画像Sa、サムネイル画像Sbを低解像度側のサムネイル画像Sbということがある。
 そして、各動画データVの複数の高解像度側のサムネイル画像Saは、それぞれ各別の画像データとしてデータベース11に記憶保持されている。
 一方、各動画データVの複数の低解像度側のサムネイル画像Saは、該複数のサムネイル画像Sbを規則的に配列させた形態でひとまとめに合成してなる1つの合成画像Sbxの画像データに変換されている。そして、この合成画像Sbxが、複数の低解像度のサムネイル画像Sbをひとまとめに包含する画像データとしてデータベース11に記憶保持されている。
 上記合成画像Sbxは、図1に例示するように、複数の低解像度側のサムネイル画像Sbを、それぞれに対応するサンプリング時刻の順番でマトリクス状に配列させた形態の合成画像である。従って、各サムネイル画像Sbは、合成画像Sbxの部分的な画像とされている。
 この場合、合成画像Sbxに含まれる各サムネイル画像Sbは低解像度の画像であるので、該合成画像Sbxのファイルサイズが過大になるのが防止される。例えば、サムネイル画像Sbの総数(=サンプリング時刻の総数)が100~200個程度である場合、合成画像Sbxのファイルサイズを、例えば1~2MB程度のサイズに収めることができる。
 補足すると、合成画像Sbxのファイルサイズを抑制しようとすると、合成画像Sbxに包含する低解像度側のサムネイル画像Sbの個数を多くした場合に、低解像度のサムネイル画像Sbの解像度が低くなり過ぎる。
 従って、単一の合成画像Sbxに包含するサムネイル画像Sbの解像度が低くなり過ぎないように、単一の合成画像Sbxに包含させるサムネイル画像Sb個数を所定の上限数以下に制限しておき、サムネイル画像Sbの総数が該上限数を超える場合には、サムネイル画像Sbの総数を2つ以上の合成画像Sbxに分配するようにしてもよい。
 例えば、サムネイル画像Sbの総数が上限数+α(α≦上限数)であるとした場合、上限数のサムネイル画像Sbを第1の合成画像Sbxに包含させ、残りのα個のサムネイル画像Sbを第2の合成画像Sbxに包含させるようにしてもよい。
 あるいは、各動画データV毎のサムネイル画像Sbの総数(=サンプリング時刻の総数)を上記上限数以下に制限しておくことで、該総数のサムネイル画像Sbが1つの合成画像Sbxに収まるようにしてもよい。
 各動画データVの時間軸上の上記複数のサンプリング時刻は、互いに隣り合うサンプリング時刻に対応するサムネイル画像Sa,Sa(又はSb,Sb)の時刻間隔であるサムネイル画像間時間ΔTが、該動画データVの時間軸の時間帯に応じて変化するように動画データV毎に設定される。
 より詳しくは、本実施形態では、各動画データVの全体の動画映像は、該映像中のある対象物(例えばスポーツ映像中の競技者等)の動きの変化を詳細に見ることの必要性もしくは要求が高いシーンとしての着目対象のシーンを含む特定の部分時間帯(以降、着目対象時間帯という)の映像部分と、他の時間帯(以降、着目対象外時間帯という)の映像部分と区分される。
 そして、図2に示すように、着目対象時間帯におけるサムネイル画像間時間ΔT(=ΔTa)は、着目対象外時間帯におけるサムネイル画像間時間ΔT(=ΔTb)よりも短い時間とされている。換言すれば、着目対象時間帯では、サンプリング時刻の時間間隔(=ΔTa)が短めの時間間隔(密な時間間隔)に設定され、着目対象外時間帯では、サンプリング時刻の時間間隔(=ΔTb)がΔTaよりも長い長めの時間間隔(疎な時間間隔)に設定されている。
 この場合、着目対象時間帯でのサムネイル画像間時間ΔTaと、着目対象外時間帯でのサムネイル画像間時間ΔTbとを適切に設定しておくことで、サムネイル画像Sa,Sbの総数が、過剰に多くならないようにすることができる。ひいては、全ての低解像度側のサムネイル画像Sbを単一の合成画像Sbxにひとまとめにしても、該合成画像Sbxのファイルサイズを抑制しつつ、サムネイル画像Sbの解像度が低くなり過ぎないようにすることができる。
 なお、サムネイル画像間時間ΔTa,ΔTbの値は、例えば、あらかじめ定めた固定値でもよいが、動画データVの動画映像の内容の種別もしくは動画データVの全体の時間等に応じて、動画データV毎に設定してもよい。
 上記着目対象時間帯は、本実施形態では、例えば、各動画データVの任意の着目対象のシーンの映像が、該動画データVの全体の動画映像のうちのどの時刻の位置にあるか等を示す情報として、該動画データVの関係者(作成者等)により該動画データVに付されているメタデータ(タグ、キューポイント等)に基づいて決定されている。
 すなわち、上記メタデータにより示される時刻を含む該時刻近辺の部分時間帯が、着目対象時間帯として決定される。
 例えば、動画データVが柔道のスポーツ映像の動画データである場合、多くの場合、競技者の技が決まった時刻近辺のシーンが1つの着目対象のシーンとされ、そのシーンの近辺の時刻を示すメタデータが動画データVに付されている。そして、この場合、該メタデータにより示される時刻の前後の時間帯(例えば該時刻の前後に所定の時間幅を有する時間帯)が着目対象時間帯として設定される。
 また、動画データVが、例えばサッカーのスポーツ映像の動画データである場合、多くの場合、シュートが行われた時刻の直前のシーンが着目対象のシーンとされ、シュートが行われた時刻を示すメタデータが動画データVに付されている。そして、この場合、例えば、該メタデータにより示される時刻の直前の時間帯(例えば該時刻から所定時間前までの時間帯)が着目対象時間帯として設定される。
 なお、上記のように着目対象時間帯を設定する処理と、その設定に応じて複数のサンプリング時刻を決定してサムネイル画像Sa,Sbを作成する処理とは、例えば、動画サーバ1で適宜のアプリケーションを作動させることで行われる。この場合、動画データの内容の種別と該動画データに付されているメタデータとから自動的に着目対象時間帯の設定し、さらには、複数のサンプリング時刻の設定及び各サンプリング時刻のサムネイル画像Sa,Sbの作成を行うようにすることも可能である。
 また、この場合、メタデータを用いて上記の如く仮決定した着目対象時間帯のシーンの映像が所望の着目対象のシーンであるか否かを、適宜の映像分析用のアプリケーションにより自動的に確認した上で、着目対象時間帯を最終的に決定するようにしてもよい。
 補足すると、動画データVが、動画映像に加えて音声データを含む場合には、該音声データに基づいて、着目対象時間帯を設定することもできる。例えば、各種スポーツの試合では、一般に、着目対象のシーン(柔道の試合で競技者の技が決まったシーン、サッカーの試合でシュートが決まったシーン等)の近辺で、観客の歓声が大きくなる。そこで、例えば、音声データの音量又はその音量の単位時間当たりの増加量が所定量以上となる時刻と含む該時刻近辺の時間帯を着目対象時間帯として設定してもよい。
 動画サーバ1のデータベース11には、上記の如く動画データVと及びサムネイル画像S(Sa,Sb)が記憶保持されている。
 そして、動画サーバ1は、各端末機2で選択される動画データVを該端末機2で再生させることが該端末機2との通信によって要求された場合に、ストリーミング方式で該端末機2に伝送するように構成されている。
 さらに、動画サーバ1は、端末機2の所定の操作(後述するスライドバー31の操作)に応じてサムネイル画像Sを該端末機2で表示させるために、端末機2との通信によって該サムネイル画像Sを該端末機2に伝送するように構成されている。
 次に、各端末機2について説明する。各端末機2には、動画ビュワーのアプリケーションが実装されている。そして、端末機2の利用者が、動画ビュワーを起動して、該動画ビュワーの操作を行うことで、端末機2で所望の動画データVの動画映像等を閲覧することが可能となる。
 端末機2で動画ビュワーを起動すると、該端末機2のディスプレイに、図3に示す如き動画ビュワー画面が表示される。
 この動画ビュワー画面には、動画データVの動画映像やサムメイル画像Sを表示する領域である映像表示部21が表示されると共に、閲覧する動画データの選択等を行うためのメニューバー22、動画映像の再生を一時停止させる一時停止ボタン23、動画映像を低速の再生速度で逆転方向に再生するための低速逆転再生ボタン24、動画映像を通常の再生速度で逆転方向に再生するための逆転再生ボタン25、動画映像を通常の再生速度で順方向に再生するための通常再生ボタン26、動画映像を低速の再生速度で順方向に再生するための低速再生ボタン27、動画映像を逆転方向にコマ送りするためのコマ戻しボタン28、動画映像を順方向にコマ送りするためのコマ送りボタン29と、映像表示部21に表示されている動画映像(又はサムネイル画像)が、動画映像の全体のうちのどの時刻の位置の画像であるかを示す再生位置表示部30、映像表示部21に表示されている動画映像の時刻位置に応じてスライドするスライドバー31等を備えている。
 スライドバー31は、動画映像の再生時にその再生時間の経過に応じて自動的にスライド(図示例では、横方向に変位)するほか、利用者が端末機2のマウスあるいは指によりスライド操作することも可能となっている。そして、そのスライド操作時には、映像表示部21にサムネイル画像Sが表示されるようになっている。
 次に、動画サーバ1のデータベース11に記憶保持された動画データVの動画映像もしくはサムネイル画像Sを各端末機2で閲覧する場合の作動を説明する。
 動画映像等を閲覧しようとする利用者は、端末機2の動画ビュワーを起動し、動画サーバ1にアクセスする。
 そして、利用者が動画ビュワー画面のメニューバー22を操作することで、所望の動画データVがそのタイトル等に基づき選択される。この選択に応じて端末機2から動画サーバ1に、低解像度側のサムネイル画像Sbの伝送(ダウンロード)が要求される。
 この時、動画サーバ1は、選択された動画データVに対応する複数のサムネイル画像Sbを合成してなる合成画像Sbxの画像データを端末機2に伝送する。この場合、合成画像Sbxのファイルサイズは、さほど大きいものではないので、該合成画像Sbxが速やかに端末機2にダウンロードされる。そして、該合成画像Sbxは、端末機2のメモリ、ハードディスク等の記憶部に保存される。
 次に、利用者が、選択した動画データVの動画映像を、端末機2のディスプレイで再生して閲覧しようとする場合には、動画ビュワー画面の通常再生ボタン26を操作する。このとき、端末機2から動画サーバ1に、動画データVを端末機2で再生する旨の要求が送信される。これに応じて、動画サーバ1は、動画データVをストリーミング方式で端末機2に伝送する。
 そして、端末機2では、動画ビュワーが、動画ビュワー画面の映像表示部21に、動画データVの動画映像をストリーミング方式で再生させる。
 なお、動画映像の再生途中に、利用者が動画ビュワー画面の一時停止ボタン23を操作すると、その操作時点で動画映像が停止して、動画ビュワー画面の映像表示部21に表示される映像が静止画像となる。
 また、通常再生ボタン26以外の再生ボタン24,25,27、あるいは、コマ送りボタン29もしくはコマ戻しボタン28が操作された場合には、それぞれの操作ボタンにより指示された再生形態(スロー再生、逆転再生等)の動画映像が動画サーバ1から端末機2にストリーミング方式で伝送され、該動画映像が、端末機2の映像表示部21で表示される。
 利用者が、選択した動画データVの動画映像の全体のうちの着目対象のシーンの映像を探索したり、そのシーンの近辺の時間帯での映像中の対象物の動き等を詳細に観察しようとする場合には、利用者は、動画ビュワー画面のスライドバー31をマウス操作や指により選択して、該スライドバー31を適宜、スライドさせる。
 この場合、スライドバー31が選択されると、動画ビュワーは、端末機2にダウンロードされた合成画像Sbxから、スライドバー31のスライド位置により示される時刻に一致もしくは該時刻に最も近いサンプリング時刻におけるサムネイル画像Sbの領域を抽出し、その領域のサムネイル画像Sbを映像表示部21に表示させる。この場合、合成画像Sbx中の各サムネイル画像Sbは小さいので、動画ビュワーは、抽出したサムネイル画像Sbを拡大して映像表示部21に表示させる。
 そして、利用者は、その映像表示部21に表示されるサムネイル画像Sbを見ながら、スライドバー31をスライドさせる。このとき、動画ビュワーが映像表示部21に表示させるサムネイル画像Sbは、スライドバー31のスライド位置の変位に応じて切替わっていくこととなる。
 また、このとき、スライドバー31のスライド位置が、動画データVの着目対象時間帯の時刻に対応する位置である場合には、該スライド位置の単位変位量当たりに映像表示部21で切替わるサムネイル画像Sbの個数は、スライド位置が動画データVの着目対象外時間帯の時刻に対応する位置である場合よりも多くなる。
 このため、利用者は、映像表示部21に表示されるサムネイル画像Sbを見ながら、スライドバー31をスライドさせることで、着目対象のシーンもしくはその近辺のシーンのサムネイル画像Sbを容易に見つけ出すことができる。
 次に、利用者は、スライドバー31のスライド位置を、着目対象のシーンを含む着目対象時間帯の時刻に対応する位置にスライドさせた状態で、瞬時瞬時の映像及びその変化を詳しく観察するために、着目対象時間帯の任意の1つのサムネイル画像Sbを映像表示部21に表示させることを間欠的に行うように、スライドバー31のスライド位置を間欠的に動かす。
 このとき、端末機2の動画ビュワーは、スライドバー31のスライド位置が所定時間(例えば1秒程度の時間)以上、継続的に一定に保持された場合、換言すれば、同一のサムネイル画像Sbを映像表示部21に表示させている状態が所定時間以上、継続された場合には、該サムネイル画像Sb(これは本発明における低解像度着目画像に相当する)と同じサンプリング時刻での高解像度側のサムネイル画像Sa(これは本発明における高解像度着目画像に相当する)の画像データの送信を動画サーバ1に要求する。
 動画サーバ1は、この要求に応じて、端末機2で表示中のサムネイル画像Sbのサンプリング時刻の高解像度側のサムネイル画像Saの画像データを端末機2に伝送する。この場合、動画サーバ1が端末機2に伝送するサムネイル画像Saは、単一の画像であるので、端末機2に素早くダウンロードされる。そして、端末機2の動画ビュワーは、映像表示部21に表示させるサムネイル画像を、低解像度側のサムネイル画像Sbから、ダウンロードした高解像度側のサムネイル画像Saに切替える。
 これにより、利用者は、スライドバー31のスライド位置に対応するサンプリング時刻での映像(静止画像)を高解像度側のサムネイル画像Saによって鮮明な画像として見ることができる。
 図3は、スライドバー31の操作に応じて上記の如く映像表示部21に表示されるサムネイル画像Sa(又はSb)の例を模式的に示している。図示例での動画データVは、例えば体操の床運動で、対象物としての選手が、助走、宙返り、着地を順次行った場合の映像を示す動画データである。
 この場合、例えば選手が宙返りを行ったシーンの時間帯が着目対象時間帯、それ以外の時間帯(助走及び着地のシーンの時間帯)は、着目対象外時間帯とされている。従って、選手が宙返りを行ったシーンの時間帯でのサムネイル画像間時間が、他の時間帯のサムネイル画像間時間よりも短い時間間隔とされている。
 そして、図3では、スライドバー31が、選手の宙返りのシーンの時間帯のスライド位置に操作されている。この状態では、宙返りの途中の低解像度側のサムネイル画像Sbが映像表示部21に一時的に表示された後に、高解像度側のサムネイル画像Saが映像表示部21に表示される。このサムネイル画像Saにより、利用者は、宙返り途中における選手の瞬時的な姿勢等を詳細に観察することができる。
 また、スライドバー31を微小量ずつ、間欠的にスライドさせて、映像表示部21に表示させるサムネイル画像Saを順次、間欠的に切り替えていくことで、宙返り途中における微小時間毎の選手の姿勢変化等を詳細に観察することもできる。
 以上の如く、利用者は、動画データVの着目対象時間帯において、短い時間間隔毎の高解像度側のサムネイル画像Saを観察することができる。このため、着目対象のシーンの近辺での動画映像中の対象物の動きの変化等を詳細に観察することできる。ひいては、動画データV及びサムネイル画像Sa,Sbを有効に活用することができる。
 例えば、動画データVがスポーツ映像の動画データである場合、着目対象時間帯における個々のサムネイル画像Sa中の選手の動作状態及びその動作状態の変化の確認、分析等を詳細に行うことができる。ひいては、選手の動きの改善や指導の適切な指針を構築することができる。
 [第2実施形態]
 次に本発明の第2実施形態を説明する。なお、本実施形態では、動画データVの着目対象時間帯の設定の仕方だけが第1実施形態と相違するものである。そこで、本実施形態の説明は、第1実施形態と相違する事項を中心に行い、第1実施形態と同一の事項については説明を省略する。
 第1実施形態では、着目対象時間帯を動画データVに付されたメタデータ(あるいは、音声データ)に基づいて、設定するようにした。
 これに対して、本実施形態では、動画データVの動画映像の全体のうち、利用者の着目対象のシーンと推定されるシーンの時間帯を動画サーバ1で学習し、その学習結果に応じて着目対象時間帯を設定する。
 以下、説明すると、利用者は、端末機2の動画ビュワーを起動した状態で、第1実施形態と同様に、動画データを選択し、該動画データの動画映像を動画ビュワー画面の映像表示部21で再生させる。
 この場合、利用者は、一般に、映像表示部21に着目対象のシーンの映像が表示されている状態で、動画ビュワーの一時停止ボタン23を操作して、動画映像の再生を一時停止させることをしばしば行う。従って、動画映像の再生を一時停止させた時のシーンは、利用者の着目対象のシーンである可能性が高い。
 そこで、動作ビュワーは、動画映像の再生中に一時停止ボタン23の操作が行われた場合に、その時刻(動画データVの時間軸上での時刻)を示すデータを取得し、そのデータ(以降、再生一時停止時刻データという)を端末機2から動画サーバ1に送信する。
 動画サーバ1に送信された再生一時停止時刻データは、各動画データ毎に該動画サーバ1で保存される。そして、動画サーバ1は、各動画データV毎に、保存した再生一時停止時刻データが既定の所定数以上になった場合に、再生一時停止時刻データにより示される時刻の頻度に基づいて、着目対象時間帯を設定する。
 より具体的には、例えば、各動画データVの全体は複数の時間帯にあらかじめ区分される。そして、動画サーバ1は、その複数の時間帯のうち、再生一時停止時刻データにより示される時刻を所定数以上の頻度で含む時間帯を、着目対象時間帯として設定する。
 これにより、動画データVの再生が一時停止される頻度の高い時間帯が、利用者が実際に着目するシーンを含む時間帯として、学習処理によって設定される。
 なお、前記動画サーバ1で収集する前記再生一時停止時刻データを該動画サーバ1に送信する端末機2は、スポーツトレーナ等、専門的な利用者が使用する端末機2に制限されていてもよい。
 本実施形態は、以上説明した着目対象時間帯の設定処理以外は、第1実施形態と同じである。
 かかる本実施形態では、利用者が動画データの動画映像の再生時に実際に注目するシーンを含む部分時間帯を着目対象時間帯として設定することができる。
 なお、以上説明した第1及び第2実施形態では、各動画データVの全体を着目対象時間帯と着目対象外時間帯との2種類に分類したが、着目対象時間帯をより細かく分類してもよい。すなわち、着目対象時間帯を着目度合の高低に応じて複数段階に分類し、各着目対象時間帯毎に、その着目度合の程度に応じてサムネイル画像間時間を異ならせる(着目度合が高いほど、サムネイル画像間時間をより短くする)ようにしてもよい。
 1…動画サーバ、2…端末機。

Claims (7)

  1.  動画データを再生する機能を有する端末機と、前記動画データを前記端末機との通信によって該端末機に伝送する動画サーバとを備える動画再生システムにおいて、
     前記動画サーバは、前記動画データの時間軸上での複数のサンプリング時刻のそれぞれに対応する該動画データの静止画像を示す複数のサムネイル画像を、前記端末機からの要求に応じて該端末機に伝送するように構成されており、
     前記端末機は、前記動画サーバから伝送された前記サムネイル画像を表示させるための所定の操作が行われた場合に、該所定の操作により指示されたサンプリング時刻に対応するサムネイル画像を該端末機で表示するように構成されており、
     前記動画サーバが前記端末機に伝送する前記複数のサムネイル画像は、それぞれに対応する前記複数のサンプリング時刻のうちの互いに隣り合うサンプリング時刻の時刻間隔をサムネイル画像間時間と定義したとき、前記動画データの動画映像の全体のうちの着目対象のシーンを含む時間帯として設定された特定の部分時間帯でのサムネイル画像間時間が、他の時間帯でのサムネイル画像間時間よりも短い時間間隔となるように作成されていることを特徴とする動画再生システム。
  2.  請求項1記載の動画再生システムにおいて、
     前記動画データには、該動画データにおける前記着目対象のシーンの時刻を示すメタデータが付されており、前記特定の部分時間帯は、該メタデータにより示される時刻を含むように該メタデータに基づいて設定されていることを特徴とする動画再生システム。
  3.  請求項1記載の動画再生システムにおいて、
     前記動画データには、該動画データの動画映像に対応する音声データが付加されており、前記特定の部分時間帯は、該音声データの音量の大きさ又は該音量の時間的変化に基づいて設定されていることを特徴とする動画再生システム。
  4.  請求項1記載の動画再生システムにおいて、
     前記動画サーバは、前記端末機での前記動画データの動画映像の再生の都度、該再生の一時停止が行われた該動画データの時間軸上の時刻を示すデータである再生一時停止時刻データを前記端末機との通信によって取得するように構成されており、前記特定の部分時間帯は、前記再生一時停止時刻データにより示される時刻が他の時間帯よりも高い頻度で含まれる時間帯となるように設定されていることを特徴とする動画再生システム。
  5.  請求項1記載の動画再生システムにおいて、
     前記動画サーバは、前記複数のサムネイル画像を前記端末機に送信するとき、該複数のサムネイル画像の総数以下の複数のサムネイル画像を、前記動画データの静止画像よりも低い解像度の画像として規則的に配列させた形態で各々包含するように作成された1つ又は複数の合成画像を前記端末機に送信するように構成され、
     前記端末機は、前記所定の操作により指示された時刻に対応するサムネイル画像を表示するとき、該サムネイル画像を含む前記合成画像のうちの該サムネイル画像の配置部分を拡大して表示するように構成されていることを特徴とする動画再生システム。
  6.  請求項5記載の動画再生システムにおいて、
     前記動画サーバは、前記端末機において同一のサムネイル画像を表示させている時間が所定時間継続した場合に、該サムネイル画像である低解像度着目画像よりも高い解像度で作成されたサムネイル画像である高解像度着目画像を前記端末機に伝送するように構成され、
     前記端末機は、該端末機で表示させるサムネイル画像を、前記低解像度着目画像から前記伝送された高解像度着目画像に切替えるように構成されていることを特徴とする動画再生システム。
  7.  動画データを再生する機能を有する端末機において、該動画データの時間軸上での複数のサンプリング時刻のそれぞれに対応する静止画像を示す複数のサムネイル画像を表示させる方法であって、
     前記複数のサムネイル画像のそれぞれに対応する前記複数のサンプリング時刻のうちの互いに隣り合うサンプリング時刻の時刻間隔をサムネイル画像間時間と定義したとき、前記動画データの動画映像の全体のうちの着目対象のシーンを含む時間帯として設定された特定の部分時間帯でのサムネイル画像間時間が、他の時間帯でのサムネイル画像間時間よりも短い時間間隔となるように作成された前記複数のサムネイル画像を前記端末機に取り込み、該端末機の所定の操作が行われた場合に、前記複数のサムネイル画像をそれぞれに対応するサンプリング時刻の時刻順に表示させることを特徴とする動画データのサムネイル画像の表示方法。
PCT/JP2013/065396 2013-06-03 2013-06-03 動画再生システム、及び動画データのサムネイル画像の表示方法 WO2014196009A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014538945A JP5954756B2 (ja) 2013-06-03 2013-06-03 動画再生システム
PCT/JP2013/065396 WO2014196009A1 (ja) 2013-06-03 2013-06-03 動画再生システム、及び動画データのサムネイル画像の表示方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2013/065396 WO2014196009A1 (ja) 2013-06-03 2013-06-03 動画再生システム、及び動画データのサムネイル画像の表示方法

Publications (1)

Publication Number Publication Date
WO2014196009A1 true WO2014196009A1 (ja) 2014-12-11

Family

ID=52007685

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2013/065396 WO2014196009A1 (ja) 2013-06-03 2013-06-03 動画再生システム、及び動画データのサムネイル画像の表示方法

Country Status (2)

Country Link
JP (1) JP5954756B2 (ja)
WO (1) WO2014196009A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111385601A (zh) * 2018-12-29 2020-07-07 华为技术有限公司 一种视频审核的方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008263481A (ja) * 2007-04-13 2008-10-30 Matsushita Electric Ind Co Ltd 映像信号区間抽出装置
JP2008311847A (ja) * 2007-06-13 2008-12-25 Sony Corp 表示制御装置、表示制御方法、プログラム
JP2011250095A (ja) * 2010-05-26 2011-12-08 Sony Corp 電子機器、映像編集方法及びプログラム
JP2012175170A (ja) * 2011-02-17 2012-09-10 Nikon Corp カメラ

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008263481A (ja) * 2007-04-13 2008-10-30 Matsushita Electric Ind Co Ltd 映像信号区間抽出装置
JP2008311847A (ja) * 2007-06-13 2008-12-25 Sony Corp 表示制御装置、表示制御方法、プログラム
JP2011250095A (ja) * 2010-05-26 2011-12-08 Sony Corp 電子機器、映像編集方法及びプログラム
JP2012175170A (ja) * 2011-02-17 2012-09-10 Nikon Corp カメラ

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
BIN YU. ET AL.: "Video Summarization Based on User Log Enhanced Link Analysis", PROCEEDINGS OF THE LLTH ACM INTERNATIONAL CONFERENCE ON MULTIMEDIA(MULTIMEDIA '03, 2003, pages 382 - 391, XP058170121, ISBN: 1-58113-722-2, Retrieved from the Internet <URL:ftp://131.107.65.22/pub/TR/TR-2003-5l.pdf> [retrieved on 20130725], doi:10.1145/957013.957095 *
FUMITAKA HONDA ET AL.: "Prototype of a Moving Picture Retrieval System Using Video Browser", PROCEEDINGS OF THE 56TH NATIONAL CONVENTION OF INFORMATION PROCESSING SOCIETY OF JAPAN (3, 1998, pages 187 - 188 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111385601A (zh) * 2018-12-29 2020-07-07 华为技术有限公司 一种视频审核的方法及系统

Also Published As

Publication number Publication date
JPWO2014196009A1 (ja) 2017-02-23
JP5954756B2 (ja) 2016-07-20

Similar Documents

Publication Publication Date Title
Schoeffmann et al. Video interaction tools: A survey of recent work
JP5499331B2 (ja) ストリーミングメディアのトリックプレー
JP5222058B2 (ja) 時間ベースのメタデータを用いた動的なメディアのインタラクション
US8239359B2 (en) System and method for visual search in a video media player
US10123081B2 (en) Method of providing service for recommending game video
KR101826704B1 (ko) 비디오 프로덕션 공유 장치 및 방법
WO2015049810A1 (ja) 多視点動画配置システム
JP2006174309A (ja) 動画再生装置、プログラム、及び記録媒体
JP2009537047A (ja) ビデオ閲覧ユーザインタフェース
US10631060B2 (en) Video image reproduction device, video image distribution server, method of reproducing video image and method of distributing video image
KR20070090751A (ko) 화상 표시방법 및 동영상 재생장치
US20100289959A1 (en) Method of generating a video summary
KR20160122253A (ko) 세그먼트 리스트를 통한 비디오 브라우징
JP6705625B2 (ja) 動画再生プログラム、装置、及び方法
JP2009177431A (ja) 動画像再生システム、サーバ装置、端末装置及び動画像生成方法等
JP5376442B2 (ja) 動画配信サービスのクライアント端末及びコンピュータプログラム
US11606617B2 (en) Method, apparatus and computer program product for presenting a sporting event
KR101580944B1 (ko) 이벤트 영상 및 비-이벤트 영상을 포함하는 탐색 바를 구비한 영상 재생 장치 및 그 동작 방법
JP5954756B2 (ja) 動画再生システム
JP5683756B1 (ja) 多視点動画配置システム
CN113132778B (zh) 播放视频的方法、装置、电子设备和可读存储介质
KR20160114481A (ko) 객체 상태 저장 방식 게임 동영상 녹화 및 재생 방법
US20170368458A1 (en) Method of recording and replaying game video by object state recording
CN115150657B (zh) 多媒体播放方法、装置、终端及存储介质
KR20180053221A (ko) 전자 장치 및 그의 제어 방법

Legal Events

Date Code Title Description
ENP Entry into the national phase

Ref document number: 2014538945

Country of ref document: JP

Kind code of ref document: A

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 13886580

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 13886580

Country of ref document: EP

Kind code of ref document: A1