WO2009157402A1 - コンテンツ再生制御システムと、その方法及びプログラム - Google Patents

コンテンツ再生制御システムと、その方法及びプログラム Download PDF

Info

Publication number
WO2009157402A1
WO2009157402A1 PCT/JP2009/061306 JP2009061306W WO2009157402A1 WO 2009157402 A1 WO2009157402 A1 WO 2009157402A1 JP 2009061306 W JP2009061306 W JP 2009061306W WO 2009157402 A1 WO2009157402 A1 WO 2009157402A1
Authority
WO
WIPO (PCT)
Prior art keywords
content
common section
reproduction
group
quality
Prior art date
Application number
PCT/JP2009/061306
Other languages
English (en)
French (fr)
Inventor
岩元 浩太
亮磨 大網
裕三 仙田
木本 崇博
貴美 佐藤
康史 平川
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Priority to CN2009801237223A priority Critical patent/CN102067229B/zh
Priority to US13/001,398 priority patent/US8913873B2/en
Priority to JP2010517999A priority patent/JP5648801B2/ja
Priority to EP09770112.2A priority patent/EP2306719B1/en
Publication of WO2009157402A1 publication Critical patent/WO2009157402A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • G11B27/32Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on separate auxiliary tracks of the same or an auxiliary record carrier
    • G11B27/327Table of contents
    • G11B27/329Table of contents on a disc [VTOC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/432Content retrieval operation from a local storage medium, e.g. hard-disk
    • H04N21/4325Content retrieval operation from a local storage medium, e.g. hard-disk by playing back content from the storage medium
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording

Definitions

  • the present invention relates to a content reproduction control system, a method thereof, and a program.
  • the present invention is directed to a system and apparatus for reproducing and browsing content for a large amount of content.
  • the content includes CGM (Consumer Generated Media) content, video content composed of video and audio signals such as home videos, TV programs, and movies, and acoustic content composed of audio signals such as music. It is content that has a time axis.
  • CGM Consumer Generated Media
  • a video sharing service (video posting site) on the Internet.
  • a video sharing service is a site where a general user uploads video content to a server, and video content uploaded by many users can be reproduced and viewed.
  • a service that can search across video contents of a plurality of different video sharing services (video posting sites) and reproduce and view those video contents.
  • video search service video search site
  • video search site can search and play back video content for any video content on the Internet.
  • the user can reproduce and browse the moving image content without being aware of the physical location of the moving image content (even if actually distributed to a plurality of different servers).
  • Such content sharing services are not limited to video content, but are also intended for music content (acoustic content).
  • content sharing services content posting sites
  • P2P peer-to-peer
  • content with poor playback quality is content with poor quality of the reproduced signal such as image quality / sound quality, content that has a delay in playback (slow start of playback (delay), playback is interrupted, etc.), etc. is there.
  • These contents with poor reproduction quality are contents that are difficult for the user to view.
  • content with a small data size or content with a low bit rate is content with poor signal quality such as image quality or sound quality (for example, content with severe block distortion).
  • content using a compression method with poor encoding efficiency is content with poor signal quality such as image quality and sound quality.
  • video sharing services video posting sites
  • content with poor signal quality such as image quality and sound quality inevitably increases.
  • signal quality such as image quality and sound quality at the stage of recording (capture)
  • signal quality such as image quality and sound quality
  • signal quality may be greatly reduced by only a part of the content.
  • video sharing services video posting sites
  • the network quality network quality
  • the network bandwidth Playback is delayed (such as it takes a long time to start playback, playback is interrupted), or there is a processing drop (frame dropout, etc.) when the traffic is narrow or the network traffic is heavy.
  • the content will be of poor quality.
  • video sharing service video posting site
  • the server accumulates a large amount of video content, and access is often concentrated, so problems such as reproduction delay and processing loss often occur.
  • the content is content with poor playback quality (that is, the signal quality of the content itself is poor or the network quality from the location of the content to the user's playback environment)
  • the user views content with poor reproduction quality, and the user has to be content with viewing content with poor reproduction quality.
  • the present invention has been invented in view of the above problems, and its purpose is to provide a content reproduction control system that realizes reproduction (high reproduction quality) while ensuring reproduction quality of content when reproducing and browsing the content. And providing a method and program thereof.
  • the present invention for solving the above-described problems is characterized in that a content group storage unit that stores at least one content and a signal feature associated with a position on the time axis of the content for each content stored in the content group storage unit
  • a signal feature quantity sequence extracting means for extracting a signal feature quantity series which is a quantity series, and a group of common sections, which are sections in which signal features are similar between different contents, from the signal feature quantity series for each content.
  • Common section group detecting means for detecting as a common section group
  • content playback quality information acquiring means for acquiring content playback quality information representing the playback quality of the content to which each common section of the common section group belongs, for each common section group
  • content to be played back is set so that the playback quality of the content is high based on the content playback quality information of the content to which each common section of the common section group belongs.
  • a content reproduction control system comprising content reproduction control means for performing switching and reproduction.
  • the present invention that solves the above-described problem is a series of signal feature amounts associated with positions on the time axis of content for each content stored in a content group storage unit that stores at least one content.
  • a group of common sections which are sections in which signal feature quantities are different between different contents, from a signal feature quantity series extracting unit that extracts a signal feature quantity series and the signal feature quantity series for each content,
  • a common section group detecting means for detecting content reproduction quality information indicating the reproduction quality of the content to which each common section of the common section group belongs, for each common section group, and the content When playing back the content contained in the group storage unit, For the sections included in the common section group, the content to be reproduced is switched so that the reproduction quality of the content is high based on the content reproduction quality information of the content to which each common section of the common section group belongs,
  • a content reproduction control apparatus comprising content reproduction control means for performing reproduction.
  • the present invention that solves the above-described problems is a signal that is a series of signal feature amounts associated with a position on the time axis of content for each content stored in a content group storage unit that stores at least one content.
  • a group of common sections which are sections in which signal features are similar to each other between different contents, is detected as a common section group from the signal feature quantity series extracting step for extracting the feature quantity series and the signal feature quantity series for each content.
  • a common section group detection step a content playback quality information acquisition step for acquiring content playback quality information representing the playback quality of the content to which each common section of the common section group belongs, and the content group accumulation for each common section group
  • the content included in the content is played back, For the sections included in the inter-group, the content to be reproduced is switched and reproduced so that the reproduction quality of the content is high based on the content reproduction quality information of the content to which each common section of the common section group belongs.
  • a content reproduction control step for performing a content reproduction control method.
  • the present invention that solves the above-described problems is a signal that is a series of signal feature amounts associated with a position on the time axis of content for each content stored in a content group storage unit that stores at least one content.
  • a common section group which is a section in which signal features are similar to each other between different contents, is detected as a common section group from a signal feature series extraction process for extracting a feature series and a signal feature series for each content.
  • Common segment group detection processing content reproduction quality information acquisition processing for acquiring content reproduction quality information indicating the reproduction quality of the content to which each common segment of the common segment group belongs, for each common segment group, and the content group accumulation When the content included in the content is played back, For the sections included in the inter-group, the content to be reproduced is switched and reproduced so that the reproduction quality of the content is high based on the content reproduction quality information of the content to which each common section of the common section group belongs.
  • a content reproduction control program for causing an information processing apparatus to execute a content reproduction control process for performing the above.
  • the present invention can realize reproduction (high reproduction quality) while ensuring reproduction quality of content when reproducing and browsing the content.
  • FIG. 1 is a block diagram showing the configuration of the present embodiment.
  • FIG. 2 is a diagram illustrating an example of a common section group.
  • FIG. 3 is a flowchart showing the operation of the present embodiment.
  • FIG. 1 is a block diagram showing a configuration of a content reproduction control system according to the present embodiment.
  • an embodiment of the present invention is a content group storage unit 1, a signal feature amount series extraction unit 2, a common section group detection unit 3, a content playback quality information acquisition unit 4, and content playback control. And means 5.
  • the content group storage unit 1 stores a plurality of contents.
  • the content is a media having a time axis composed of a video signal or an audio signal, or both of a video signal and an audio signal.
  • CGM Computer Generated Media
  • home video TV program
  • TV program TV program
  • it is a movie, a music content, etc., it is not limited to these.
  • the content group accumulating unit 1 accumulates the content of the population that is the target of content reproduction control according to the present invention.
  • the content group storage unit 1 is written as if content is stored in one place for convenience, but of course, the content may be distributed and stored in a plurality of storages.
  • the content group storage unit 1 is, for example, a storage in which a video sharing service (video posting site) on the Internet stores video content. At this time, the storage of the video sharing service (video posting site) may be distributed in plural. Further, the content group storage unit 1 may be a storage of a plurality of video sharing services (video posting sites) on the Internet, for example. Further, the content group storage unit 1 may be, for example, any storage that stores all content scattered on the Internet.
  • the signal feature amount series extracting means 2 is a signal feature that is a sequence of signal feature amounts associated with a position on the time axis of the content (for example, media time) for each content included in the content group storage unit 1. Extract quantity series. The extracted signal feature quantity series for each content is supplied to the common section group detection means 3.
  • the signal feature amount is a feature amount representing a video signal included in the content, a feature amount representing an acoustic signal included in the content, or a feature amount combining them.
  • an image feature amount (visual feature amount) can be extracted from an image of each frame of the content.
  • the frame number associated with the frame and the media time of the frame calculated based on the frame number are associated with the position on the time axis of the content.
  • the image feature amount include a feature amount representing luminance information, a feature amount representing color information, a feature amount representing edge information, a feature amount representing texture information, a feature amount representing shape information, or a feature amount representing motion information.
  • Dominant Color, Color Layout, Scalable Color, Color Structure, EdgeHistogram, HomogeneousTexture, TextileStrain, TextureHourSure, TextureHex Motion Activity or the like may be used.
  • the image feature amount may be extracted only from the frame selected at an arbitrary sampling interval.
  • an image feature amount may be extracted from only the selected frame by applying a process of selecting a specific frame such as cut detection (process of detecting video switching).
  • the content can be divided into sections of an arbitrary time length, and from each section, the image feature amounts of a plurality of frames included in the section can be used. Examples of a method for aggregating image feature amounts include a method of obtaining an average value, obtaining a median value, obtaining a most frequent value, or obtaining a histogram.
  • the image feature amount may be extracted only from the position on the specific time axis of the content defined in advance.
  • the frame number associated with the frame or section and the media time calculated based on the frame number are associated with the position on the time axis of the content.
  • a signal feature quantity series representing an acoustic signal for example, it is assumed that a digital acoustic signal (acoustic waveform) is extracted by performing an analysis process for an arbitrary sample interval (hereinafter referred to as an acoustic frame). Can do. For example, a spectrum is extracted by performing frequency transformation such as Fourier transform on an acoustic frame, and the average power, average power for each frequency band, spectrum flatness, spectrum flatness for each frequency band, etc. It can be extracted as a signal feature amount series representing a signal. In this case, the number of the sample point of each acoustic frame and the media time calculated based on the sample point number are associated with the position on the time axis of the content. Further, for example, a signal feature amount series representing an acoustic signal may be extracted only from a predetermined position on a specific time axis of content.
  • the signal feature amount extracted by the signal feature amount series extraction unit 1 is not limited to the signal feature amount described above, but is a feature amount representing a video signal included in the content, or a feature amount representing an acoustic signal included in the content, Alternatively, any signal feature amount may be used as long as the feature amount is a combination thereof.
  • the common section group detection unit 3 uses a common section group, which is a section in which signal feature amounts are similar between different contents, from a signal feature amount sequence for each content supplied from the signal feature amount series extraction unit 2. Detect as interval group. Information on the detected common section group, that is, information specifying the content to which each common section of the common section group belongs and the position on the time axis is used as the common section group information, and the content playback quality information acquisition unit 4 and the content playback control It supplies to the means 5.
  • Reference 1 Japanese Patent Publication No. 2006-515721
  • Reference 3 Japanese Patent Publication No. 2006-515721
  • Document 1 describes a method for detecting sections in which signal feature amounts are similar to each other from a signal feature amount sequence of a video signal.
  • a short time length section is extracted from the signal feature quantity sequence as a query section (reference section).
  • the sections having the same time length as the query section are sequentially extracted while moving on the time axis.
  • the similarity is calculated.
  • an average value of the similarity of image feature amounts between frames corresponding to the section is used.
  • the section for calculating similarity in the negative direction and the positive direction of the time axis is extended, and the starting point of the sections with similar signal features And confirm the end point.
  • the next query section is extracted and the same process is repeated. In this way, it is possible to detect sections in which signal feature amounts are similar to each other.
  • the method described in Literature 1 can be applied not only to the signal feature quantity sequence of the video signal but also to the signal feature quantity sequence of the audio signal. It should be noted that when detecting sections in which signal feature quantities are similar to each other, it is possible to arbitrarily determine how much the signal feature quantities are similar to be detected as similar sections. Therefore, for example, when local processing is applied to an image such as telop superimposition, even if noise such as background sound is mixed, it can be regarded as similar.
  • FIG. 2 shows an example of detection of a common section group (in FIG. 2, arrows indicate that they are included in the same common section group).
  • FIG. 2 shows an example in which two common section groups, that is, a common section group A and a common section group B, are detected for four contents of content 1 to content 4.
  • the common section group A is composed of three common sections, a section 1 for content 1, a section c for content 2, and a section d for content 3.
  • the common section group information for the common section group A is information specifying three common sections, that is, the section a of the content 1, the section c of the content 2, and the section d of the content 3, for example, the start point and end point of each section Information such as media time and frame number may be used.
  • the common section group B is composed of three common sections, a section b of the content 1, a section e of the content 3, and a section f of the content 4.
  • the common section group information for the common section group B is information specifying three common sections, that is, the section b of the content 1, the section e of the content 3, and the section f of the content 4, for example, the start point and end point of each section Information such as media time and frame number may be used.
  • the content reproduction quality information acquisition unit 4 acquires content reproduction quality information indicating the reproduction quality of the content to which each common section of the common section group belongs based on the common section group information supplied from the common section group detection unit 3. .
  • the acquired content reproduction quality information is supplied to the content reproduction control means 5.
  • the method by which the content reproduction quality information acquisition unit 4 acquires the content reproduction quality information is arbitrary. You may acquire from the content itself contained in the content group storage part 1, and may acquire from external information.
  • the content reproduction quality information acquisition unit 4 acquires the content reproduction quality information of the content to which each common section included in the common section group A and the common section group B belongs.
  • the common section group A the content reproduction quality information of the content 1 to which the section a included, the content 2 to which the section c belongs, and the content 3 to which the section d belongs is acquired.
  • the common section group B the content reproduction quality information of the content 1 to which the section b included, the content 3 to which the section e belongs, and the content 4 to which the section f belongs is acquired.
  • the content reproduction quality information acquisition means 4 may acquire information representing the reproduction quality of each common section, not information representing the reproduction quality of the entire content to which each common section of the common section group belongs. In the example of FIG. 2, it is not information indicating the reproduction quality of the entire content of content 1, content 2, content 3, and content 4, but is a common section, section a, section b, section c, section e, Information representing the reproduction quality of the section f may be acquired.
  • the content reproduction quality information indicating the content reproduction quality is, for example, information indicating the signal quality such as the image quality and the sound quality of the content.
  • the information indicating the signal quality such as the image quality and sound quality of the content is information such as the bit rate (bit rate with respect to the encoding method), resolution, frame rate, and encoding method of the content.
  • bit rate bit rate with respect to the encoding method
  • resolution bit rate with respect to the encoding method
  • frame rate bit rate with respect to the encoding method
  • encoding efficiency the higher the signal quality such as image quality and sound quality.
  • These pieces of information can be acquired from the content itself (from content header information or the like).
  • the content reproduction quality information acquisition unit 4 acquires information such as a bit rate and an encoding method from the content itself stored in the content group storage unit 1.
  • information such as the bit rate, resolution, frame rate, and encoding method of the content is acquired from the metadata information associated with these contents without acquiring from the content itself stored in the content group storage unit 1. May be.
  • the content itself may be analyzed to extract information indicating signal quality such as image quality and sound quality of the content.
  • the content reproduction quality information acquisition unit 4 analyzes the content itself stored in the content group storage unit 1 and extracts information representing signal quality such as image quality and sound quality of the content.
  • the amount of encoding distortion may be calculated by analyzing the image quality of an image obtained by decoding the content, and may be used as information representing the image quality of the content. In this case, it can be determined that the smaller the encoding distortion, the higher the image quality.
  • encoding distortion can be quantified by using the method described in Document 4 (Japanese Patent Laid-Open No. 2005-159419, “Image processing apparatus and method, computer program and computer-readable storage medium”).
  • Document 4 Japanese Patent Laid-Open No. 2005-159419, “Image processing apparatus and method, computer program and computer-readable storage medium”.
  • the method for measuring the coding distortion is not limited to this, and any method can be used as long as the image quality can be determined using the image quality obtained by decoding the content. The same applies to sound quality as well as image quality.
  • the content reproduction quality information indicating the signal quality such as image quality and sound quality can also be acquired for each common section included in the common section group.
  • the quality evaluation value may be calculated by combining the above-described methods for obtaining the signal quality such as the image quality and sound quality of the content, and the content reproduction quality information indicating the signal quality such as the image quality and sound quality of the content may be obtained.
  • the content reproduction quality information indicating the content reproduction quality is, for example, the quality of the network (network quality) interposed between the content location and the user reproduction environment.
  • the network quality is different for each content.
  • the network quality is, for example, a communication band, a communication delay, a packet loss rate, a traffic amount, and the like of a network interposed between a content location (storage) and a user reproduction environment (user viewing terminal).
  • a communication bandwidth the smaller the communication delay, the lower the packet loss rate, the smaller the traffic volume, the content playback delay (it takes time to start playback, playback is interrupted, etc.) and processing Since dropping (frame dropping etc.) hardly occurs, it can be determined that the reproduction quality of the content is high.
  • the access amount to the server in which the content is stored may be acquired as the content reproduction quality information. These pieces of information can be obtained, for example, by accessing a server in which contents are stored and measuring these data.
  • the content reproduction quality information acquisition unit 4 may access the content group storage unit 1 and measure and obtain these data, for example.
  • Information such as a communication band, a communication delay, a packet loss rate, a traffic amount, and an access amount may be acquired as information input from the outside. For example, you may acquire from external information, such as a statistic calculated from the data measured in the past.
  • the content reproduction quality information acquisition unit 4 may acquire, for example, statistical data such as a content reproduction delay rate and a content reproduction delay time as the content reproduction quality information. Such information can be calculated from, for example, the occurrence rate of reproduction delay measured in the past and the reproduction delay time.
  • the content playback quality information listed here is an example, and is not limited thereto. Any information can be used as long as it is information that can be used to determine any reproduction quality of the content (quality that the user feels when viewing the content).
  • the content reproduction control unit 5 uses the common segment group information supplied from the common segment group detection unit 3 and the content reproduction quality information supplied from the content reproduction quality information acquisition unit 4 to use the content included in the content group storage unit 1.
  • the playback quality of the content is high based on the content playback quality information of the content to which each common section of the common section group belongs for the section included in the common section group in the playback target content As described above, the content to be played back is switched and played back.
  • the content reproduction control means 5 switches the content to be reproduced so that the reproduction quality of the content is high and performs reproduction, for example, based on the content reproduction quality information of the content to which each common section of the common section group belongs. Thus, the content with the highest content reproduction quality may be selected and switched to the selected content for reproduction.
  • the content to be reproduced is content 1.
  • the sections included in the common empty section group in the content 1 are the section a included in the common section group A and the section b included in the common section group B.
  • the content 3 including the section d is among the contents to which each common section of the common section group B belongs.
  • the content playback control means 5 first selects the section a when playing back the content 1 that is the playback target content. When playing back, playback is performed by switching to the section d of the content 3 instead.
  • the content 1 is played as it is.
  • the reproduction is performed by switching to the section f of the content 4 instead.
  • the content 1 that is the content to be reproduced among the contents to which each common section of the common section group belongs is the content with the highest content reproduction quality, without switching the content in particular. What is necessary is just to reproduce
  • the content reproduction quality information is information representing signal quality such as image quality and sound quality of the content
  • the content with the highest signal quality of the content is selected for each common section group, and the content is switched to the selected content.
  • Playback may be performed. For example, select the content with the highest bit rate, the content with the highest resolution, the content with the highest frame rate, the content encoded with the encoding method with the best encoding efficiency, and the content with the least encoding distortion, Playback may be performed by switching to the selected content.
  • the content reproduction quality information is information representing the network quality (network quality) interposed between the content location and the user reproduction environment
  • the highest network quality is obtained for each common section group. May be selected and switched to the selected content for playback.
  • the network intervening between the content location and the user's playback environment is different, so the network quality is different for each content.
  • the network between the location of the content and the user's playback environment is the widest communication band
  • the content with the smallest communication delay, the content with the lowest packet loss rate, and the least traffic volume Content may be selected, and playback may be performed by switching to the selected content.
  • the content with the least amount of access to the server in which the content exists may be selected, and playback may be performed by switching to the selected content.
  • the content with the lowest occurrence rate of playback delay and the content with the shortest playback delay time may be selected, and playback may be performed by switching to the selected content.
  • the content reproduction control means 5 evaluates the reproduction quality of the content by combining a plurality of pieces of information such as content reproduction quality information representing the signal quality and content reproduction quality information representing the network quality. It is also possible to select content that is evaluated as being high, and switch to the selected content for playback. For example, the content may be selected on the basis of selecting the content that does not always cause a reproduction delay as the top priority and then selecting the content with the next highest image quality and sound quality. Further, for example, content having the highest image quality and sound quality may be selected from the minimum network quality that does not cause reproduction delay.
  • the content with the highest content playback quality is not selected for each section, but the plurality of sections are selected.
  • content that gives the highest reproduction quality of the content may be selected collectively (as a whole). Accordingly, the content can be selected so that the reproduction quality of the content is the highest as the entire content. For example, referring to FIG. 2, when the content to be played is content 1, the content with the highest content playback quality is individually obtained for the sections a and b included in the common section group. Instead of selecting the content, the content with the highest content reproduction quality may be selected for the sections a and b.
  • FIG. 3 is a flowchart showing the operation of the content reproduction order determination system in the present embodiment.
  • the signal feature amount series extraction means 2 is a sequence of signal feature amounts associated with a position on the time axis of content (for example, media time) for each content included in the content group storage unit 1.
  • the signal feature quantity series is extracted, and the extracted signal feature quantity series for each content is supplied to the common section group detection means 3 (step A01).
  • the common section group detection means 3 is a group of common sections that are sections in which the signal feature values are similar between different contents from the signal feature value sequence for each content supplied from the signal feature value sequence extraction means 2. Are detected as a common section group.
  • Information on the detected common section group that is, information specifying the content to which each common section of the common section group belongs and the position on the time axis is used as the common section group information, and the content playback quality information acquisition unit 4 and the content playback control It supplies to the means 5 (step A02).
  • the content reproduction quality information acquisition unit 4 generates content reproduction quality information indicating the reproduction quality of the content to which each common section of the common section group belongs based on the common section group information supplied from the common section group detection unit 3. get.
  • the acquired content reproduction quality information is supplied to the content reproduction control means 5 (step A03).
  • the content reproduction control means 5 uses the common interval group information supplied from the common interval group detection means 3 and the content reproduction quality information supplied from the content reproduction quality information acquisition means 4 to the content group storage unit 1.
  • the playback quality of the content based on the content playback quality information of the content to which each common section of the common section group belongs for the section included in the common section group in the content to be played back
  • the content to be played back is switched and played back (step A04).
  • the present embodiment in a system for reproducing and browsing a large amount of content such as a video sharing service (video posting site) on the Internet, it is possible to realize reproduction that ensures the reproduction quality of the content. is there. As a result, there is an effect that the user can enjoy viewing the content with high reproduction quality and is less likely to be content with viewing the content with poor reproduction quality.
  • a video sharing service video posting site
  • the reason for this is that when the content reproduction control means 5 reproduces the content based on the content reproduction quality information acquired by the content reproduction frequent information acquisition means 4, for a section where there is a common section with other content, This is because playback is performed by switching to content with high playback quality.
  • the subject of the present invention is not limited to a video sharing service (video posting site) on the Internet, but a video recording device (such as a hard disk recorder), a video viewing terminal (such as a set-top box), a portable video player, a portable music player, etc. Any system or apparatus that reproduces and browses content for a large amount of content is targeted.
  • each unit is configured by hardware, but may be configured by an information processing apparatus such as a CPU that operates by a program.
  • the program causes the CPU or the like to execute the above-described operation.
  • the first aspect of the present invention corresponds to the content group storage unit that stores at least one content and the position on the time axis of the content for each content stored in the content group storage unit.
  • a signal feature quantity sequence extracting unit that extracts a signal feature quantity series that is a sequence of attached signal feature quantities, and a section in which signal features are similar between different contents from the signal feature quantity series for each content.
  • a common section group detecting means for detecting a group of common sections as a common section group, and content for obtaining content playback quality information indicating the playback quality of the content to which each common section of the common section group belongs for each common section group
  • the content is reproduced so that the reproduction quality of the content is high based on the content reproduction quality information of the content to which each common section of the common section group belongs. It is a content reproduction control system having content reproduction control means for performing reproduction by switching content.
  • a second aspect of the present invention is a medium having a time axis, in the above aspect, wherein the content is composed of a video signal or an audio signal, or both a video signal and an audio signal.
  • the signal feature amount series includes at least one of a feature amount representing a video signal included in the content and a feature amount representing an acoustic signal included in the content.
  • the content reproduction quality information acquisition unit acquires information indicating the reproduction quality of each common section of the common section group as the content reproduction quality information.
  • a fifth aspect of the present invention is the above aspect, wherein when the content reproduction control unit reproduces the content stored in the content group storage unit, the content to be reproduced is included in the common section group. For the included section, based on the content playback quality information of the content to which each common section of the common section group belongs, the content with the highest content playback quality is selected and switched to the selected content. , Play.
  • the content reproduction quality information acquisition unit acquires information representing the image quality or sound quality of the content as content reproduction quality information
  • the content reproduction control unit includes at least Playback is performed by switching to a content having high image quality and / or sound quality of one or more common sections.
  • the information indicating the image quality or sound quality of the content is information indicating any of a bit rate, a resolution, a frame rate, an encoding method, and encoding distortion of the content. Or a combination thereof.
  • the content reproduction quality information acquisition unit may obtain information indicating the quality of the network interposed between the content location and the user's reproduction environment. Acquired as information, the content reproduction control means performs reproduction by switching to a high-quality content of the network interposed between the content location and the user reproduction environment.
  • a ninth aspect of the present invention is the network communication band, communication delay, and packet loss rate in which the information indicating the quality of the network is interposed between the content location and the user reproduction environment. , Information indicating any one of a traffic amount, a reproduction delay occurrence rate, a reproduction delay time, and an access amount to the server, or a combination thereof.
  • the tenth aspect of the present invention provides a signal feature amount associated with a position on the time axis of each content stored in a content group storage unit that stores at least one content.
  • a signal feature quantity sequence extracting means for extracting a signal feature quantity series that is a series, and a common section group that is a section in which signal feature quantities are similar between different contents from the signal feature quantity series for each content.
  • a common section group detecting means for detecting as a section group; and a content playback quality information acquiring means for acquiring, for each common section group, content playback quality information representing the playback quality of the content to which each common section of the common section group belongs;
  • the content to be played is switched so that the playback quality of the content is high based on the content playback quality information of the content to which each common section of the common section group belongs.
  • a content reproduction control apparatus comprising content reproduction control means for performing reproduction.
  • a signal feature associated with a position on the time axis of the content A signal feature quantity sequence extracting step for extracting a signal feature quantity series that is a series of quantities, and a group of common sections, which are sections in which signal features are similar between different contents, from the signal feature quantity series for each content.
  • the content reproduction control method includes a content reproduction control step of switching and reproducing.
  • a signal feature associated with a position on the time axis of the content A group of common sections, which are sections in which signal features are similar between different contents, from a signal feature series extraction process for extracting a signal feature quantity series that is a series of quantities and a signal feature quantity sequence for each content.
  • Common section group detection processing to detect as a common section group
  • content playback quality information acquisition processing to acquire content playback quality information representing the playback quality of the content to which each common section of the common section group belongs for each common section group
  • the content to be played back is set so that the playback quality of the content is high based on the content playback quality information of the content to which each common section of the common section group belongs.
  • This is a content reproduction control program that causes the information processing apparatus to execute content reproduction control processing for switching and performing reproduction.
  • reproduction for example, in a system for reproducing and browsing a large amount of content such as a video sharing service (video posting site) on the Internet, reproduction (high reproduction quality) with ensured reproduction quality of the content is performed. Can be provided to the user.
  • a video sharing service video posting site
  • reproduction high reproduction quality

Abstract

本発明は、少なくとも一以上のコンテンツを蓄積するコンテンツ群蓄積部に蓄積されているコンテンツごとに、コンテンツの時間軸上の位置と対応付けられた信号特徴量の系列である信号特徴量系列を抽出する信号特徴量系列抽出手段と、コンテンツごとの信号特徴量系列から、異なるコンテンツ間で信号特徴量が相互に類似する区間である共通区間のグループを、共通区間グループとして検出する共通区間グループ検出手段と、共通区間グループごとに、共通区間グループの各々の共通区間が属するコンテンツの再生品質を表すコンテンツ再生品質情報を取得するコンテンツ再生品質情報取得手段と、コンテンツ群蓄積部に含まれるコンテンツを再生する際に、該再生対象のコンテンツにおいて前記共通区間グループに含まれる区間に対しては、共通区間グループの各々の共通区間が属するコンテンツの前記コンテンツ再生品質情報に基づいてコンテンツの再生品質が高くなるように、再生するコンテンツを切り替えて、再生を行うコンテンツ再生制御手段とを備える。

Description

コンテンツ再生制御システムと、その方法及びプログラム
 本発明は、コンテンツ再生制御システムと、その方法及びプログラムに関する。
 本発明は、大量のコンテンツを対象に、コンテンツを再生閲覧するシステムや装置を対象とする。なお、ここでコンテンツとは、CGM(Consumer Generated Media)コンテンツ、ホームビデオ、テレビ番組、映画などの映像音響信号から構成される動画コンテンツや、音楽などの音響信号から構成される音響コンテンツなどを含む、時間軸を有するコンテンツのことである。
 大量のコンテンツを対象に、コンテンツを再生閲覧するシステムとして、例えば、インターネット上の動画共有サービス(動画投稿サイト)がある。動画共有サービス(動画投稿サイト)は、一般ユーザが動画コンテンツをサーバにアップロードし、多数のユーザがアップロードした動画コンテンツを、再生閲覧できるサイトである。
 また、複数の異なる動画共有サービス(動画投稿サイト)の動画コンテンツを横断検索し、それらの動画コンテンツを再生閲覧できるサービス(サイト)もある。また、インターネット上のあらゆる動画コンテンツを対象に、動画コンテンツを検索し、再生閲覧できる動画検索サービス(動画検索サイト)もある。これらのサービス(サイト)では、ユーザは動画コンテンツの物理的な存在場所を意識することなく(実際には複数の異なるサーバに分散している場合でも)、動画コンテンツを再生閲覧することができる。
 このようなインターネット上の動画共有サービス(動画投稿サイト)の特徴として、同一内容のコンテンツや、一部の区間が同一であるコンテンツが多数存在する。これは、話題性のある動画が異なるユーザによってアップロードされたり、異なる動画共有サービス(動画投稿サイト)にアップロードされたりするためである。この際に、同一内容のコンテンツであっても、異なった動画の形式やデータサイズ(ビットレート)に変換されるため異なった品質のものが存在する。また、一部の区間を抜き出して編集されたりするため一部の区間のみが同一のもが存在する。
 なお、このようなインターネット上のコンテンツ共有サービス(コンテンツ投稿サイト)は、動画コンテンツに限らず、音楽コンテンツ(音響コンテンツ)を対象にしたものもある。また、このようなサーバによるウェブサイトの形態のものの他に、P2P(ピア・ツー・ピア)通信による動画共有サービスもある。
 しかしながら、インターネット上の動画共有サービス(動画投稿サイト)などの、大量のコンテンツを対象にコンテンツを再生閲覧するシステムでは、再生品質の悪いコンテンツが多いため、ユーザは再生品質の悪いコンテンツを視聴することになる、という問題点がある。再生品質を確保できないため、ユーザは再生品質の悪いコンテンツの視聴に甘んじなければならない。
 ここで再生品質の悪いコンテンツとは、画質・音質などの再生された信号の品質が悪いコンテンツや、再生に遅延が生じる(再生の開始が遅い(ディレイ)、再生が途切れる、など)コンテンツなどである。これらの再生品質の悪いコンテンツは、ユーザにとって視聴しづらいコンテンツである。
 これらの要因としては、コンテンツ自体の起因するものと、コンテンツの存在場所からユーザの再生環境までの間に介在するネットワークの品質(ネットワーク品質)に起因するものがある。
 コンテンツ自体に起因するものとして、例えば、データサイズや小さいコンテンツや、ビットレートが低いコンテンツは、画質や音質などの信号品質が悪いコンテンツ(例えばブロック歪が激しいコンテンツ)となる。また符号化効率の悪い圧縮方式を用いたコンテンツも、画質や音質などの信号品質が悪いコンテンツとなる。インターネット上の動画共有サービス(動画投稿サイト)などでは、アップロードする動画コンテンツにデータサイズなどの制限がある場合が多いため、必然的に画質や音質などの信号品質が悪いコンテンツが多くなる。また、オリジナルコンテンツを録画(キャプチャ)などによって複製して生成されたコンテンツは、録画(キャプチャ)の段階で画質や音質などの信号品質が劣化し、結果として画質や音質(信号品質)が悪いコンテンツとなる。この場合、コンテンツの一部のみで、画質や音質などの信号品質が大きく低下する場合もある。インターネット上の動画共有サービス(動画投稿サイト)などでは、このような録画(キャプチャ)などによって複製して生成されたコンテンツが多い。
 コンテンツの存在場所からユーザの再生環境までの間に介在するネットワークの品質(ネットワーク品質)に起因するものとして、例えば、コンテンツが存在するサーバから、ユーザの端末までの間のネットワークにおいて、ネットワークの帯域が狭かったり、ネットワークのトラフィック量が多い場合に、再生に遅延が生じたり(再生の開始までの時間がかかる、再生が途切れる、など)、処理落ち(コマ落ちなど)が発生し、結果として再生品質の悪いコンテンツとなる。インターネット上の動画共有サービス(動画投稿サイト)などでは、そのサーバが大量の動画コンテンツを蓄積し、アクセスが集中することが多いため、再生遅延や処理落ちなどの問題が発生することが多い。
 ユーザから、あるコンテンツの再生指示があった場合に、そのコンテンツが再生品質の悪いコンテンツであった場合(すなわちコンテンツ自体の信号品質が悪かったり、コンテンツの存在場所からユーザの再生環境までのネットワーク品質が悪かったりした場合)、ユーザは再生品質の悪いコンテンツを視聴することになり、ユーザは再生品質の悪いコンテンツの視聴に甘んじなければならなかった。
 そこで、本発明は上記問題点に鑑みて発明されたものであって、その目的は、コンテンツを再生閲覧する場合、コンテンツの再生品質を確保した再生(高い再生品質)を実現するコンテンツ再生制御システムと、その方法及びプログラムを提供することである。
 上記課題を解決する本発明は、少なくとも一以上コンテンツを蓄積するコンテンツ群蓄積部と、前記コンテンツ群蓄積部に蓄積されているコンテンツごとに、コンテンツの時間軸上の位置と対応付けられた信号特徴量の系列である信号特徴量系列を抽出する信号特徴量系列抽出手段と、前記コンテンツごとの信号特徴量系列から、異なるコンテンツ間で信号特徴量が相互に類似する区間である共通区間のグループを、共通区間グループとして検出する共通区間グループ検出手段と、前記共通区間グループごとに、共通区間グループの各々の共通区間が属するコンテンツの再生品質を表すコンテンツ再生品質情報を取得するコンテンツ再生品質情報取得手段と、前記コンテンツ群蓄積部に含まれるコンテンツを再生する際に、該再生対象のコンテンツにおいて前記共通区間グループに含まれる区間に対しては、前記共通区間グループの各々の共通区間が属するコンテンツの前記コンテンツ再生品質情報に基づいてコンテンツの再生品質が高くなるように、再生するコンテンツを切り替えて、再生を行う、コンテンツ再生制御手段とを備えたことを特徴とするコンテンツ再生制御システムである。
 上記課題を解決する本発明は、少なくとも一以上のコンテンツを蓄積するコンテンツ群蓄積部に蓄積されている各々のコンテンツごとに、コンテンツの時間軸上の位置と対応付けられた信号特徴量の系列である信号特徴量系列を抽出する信号特徴量系列抽出手段と、前記コンテンツごとの信号特徴量系列から、異なるコンテンツ間で信号特徴量が相互に類似する区間である共通区間のグループを、共通区間グループとして検出する共通区間グループ検出手段と、前記共通区間グループごとに、共通区間グループの各々の共通区間が属するコンテンツの再生品質を表すコンテンツ再生品質情報を取得するコンテンツ再生品質情報取得手段と、前記コンテンツ群蓄積部に含まれるコンテンツを再生する際に、該再生対象のコンテンツにおいて前記共通区間グループに含まれる区間に対しては、前記共通区間グループの各々の共通区間が属するコンテンツの前記コンテンツ再生品質情報に基づいてコンテンツの再生品質が高くなるように、再生するコンテンツを切り替えて、再生を行うコンテンツ再生制御手段とを備えたことを特徴とするコンテンツ再生制御装置である。
 上記課題を解決する本発明は、少なくとも一以上のコンテンツを蓄積するコンテンツ群蓄積部に蓄積されているコンテンツごとに、コンテンツの時間軸上の位置と対応付けられた信号特徴量の系列である信号特徴量系列を抽出する信号特徴量系列抽出工程と、前記コンテンツごとの信号特徴量系列から、異なるコンテンツ間で信号特徴量が相互に類似する区間である共通区間のグループを、共通区間グループとして検出する共通区間グループ検出工程と、前記共通区間グループごとに、共通区間グループの各々の共通区間が属するコンテンツの再生品質を表すコンテンツ再生品質情報を取得するコンテンツ再生品質情報取得工程と、前記コンテンツ群蓄積部に含まれるコンテンツを再生する際に、該再生対象のコンテンツにおいて前記共通区間グループに含まれる区間に対しては、前記共通区間グループの各々の共通区間が属するコンテンツの前記コンテンツ再生品質情報に基づいてコンテンツの再生品質が高くなるように、再生するコンテンツを切り替えて、再生を行うコンテンツ再生制御工程とを有することを特徴とするコンテンツ再生制御方法である。
 上記課題を解決する本発明は、少なくとも一以上のコンテンツを蓄積するコンテンツ群蓄積部に蓄積されているコンテンツごとに、コンテンツの時間軸上の位置と対応付けられた信号特徴量の系列である信号特徴量系列を抽出する信号特徴量系列抽出処理と、前記コンテンツごとの信号特徴量系列から、異なるコンテンツ間で信号特徴量が相互に類似する区間である共通区間のグループを、共通区間グループとして検出する共通区間グループ検出処理と、前記共通区間グループごとに、共通区間グループの各々の共通区間が属するコンテンツの再生品質を表すコンテンツ再生品質情報を取得するコンテンツ再生品質情報取得処理と、前記コンテンツ群蓄積部に含まれるコンテンツを再生する際に、該再生対象のコンテンツにおいて前記共通区間グループに含まれる区間に対しては、前記共通区間グループの各々の共通区間が属するコンテンツの前記コンテンツ再生品質情報に基づいてコンテンツの再生品質が高くなるように、再生するコンテンツを切り替えて、再生を行うコンテンツ再生制御処理とを情報処理装置に実行させることを特徴とするコンテンツ再生制御プログラムである。
 本発明は、コンテンツを再生閲覧する場合、コンテンツの再生品質を確保した再生(高い再生品質)を実現することができる。
図1は本実施の形態の構成を示すブロック図である。 図2は共通区間グループの例を示す図である。 図3は本実施の形態の動作を示すフローチャートである。
1   コンテンツ群蓄積部
2   信号特徴量系列抽出手段
3   共通区間グループ検出手段
4   コンテンツ再生品質情報取得手段
5   コンテンツ再生制御手段
 次に、本発明の実施の形態について図面を参照して詳細に説明する。図1は、本実施の形態にかかるコンテンツ再生制御システムの構成を示したブロック図である。図1を参照すると、本発明の実施の形態は、コンテンツ群蓄積部1と、信号特徴量系列抽出手段2と、共通区間グループ検出手段3と、コンテンツ再生品質情報取得手段4と、コンテンツ再生制御手段5と、から構成されている。
 コンテンツ群蓄積部1は、複数のコンテンツを蓄積する。
 ここでコンテンツとは、映像信号もしくは音響信号、または映像信号及び音響信号の両方から構成されている、時間軸を有するメディアであり、例えば、CGM(Cosumer Generated Media)コンテンツ、ホームビデオ、テレビ番組、映画、音楽コンテンツなどであるが、これらに限定されない。
 コンテンツ群蓄積部1は、本発明によりコンテンツの再生制御を行う対象となる母集団のコンテンツを蓄積する。コンテンツ群蓄積部1は、便宜上、一箇所にコンテンツが蓄えられているように書いてあるが、勿論、複数のストレージに分散してコンテンツが蓄積されていてもよい。コンテンツ群蓄積部1は、例えば、インターネット上の動画共有サービス(動画投稿サイト)が動画コンテンツを蓄積しているストレージなどである。この際に、動画共有サービス(動画投稿サイト)のストレージが複数に分散されていてもよい。また、コンテンツ群蓄積部1は、例えば、インターネット上の複数の動画共有サービス(動画投稿サイト)のストレージであってもよい。また、コンテンツ群蓄積部1は、例えば、インターネット上に散在するあらゆるコンテンツを蓄積したあらゆるストレージであってもよい。
 信号特徴量系列抽出手段2は、コンテンツ群蓄積部1に含まれる各々のコンテンツごとに、コンテンツの時間軸上の位置(例えばメディア時刻など)と対応付けられた信号特徴量の系列である信号特徴量系列を抽出する。抽出したコンテンツごとの信号特徴量系列を、共通区間グループ検出手段3へ供給する。
 ここで、信号特徴量とは、コンテンツに含まれる映像信号を表す特徴量、もしくはコンテンツに含まれる音響信号を表す特徴量、またはそれらを組み合わせた特徴量である。
 ここで、映像信号を表す信号特徴量系列としては、例えばコンテンツの各フレームの画像から画像特徴量(視覚的特徴量)を抽出したものとすることができる。この場合、フレームに対応付けられたフレーム番号や、それに基づいて算出されるフレームのメディア時刻をもって、コンテンツの時間軸上の位置との対応付けがされる。画像特徴量としては、例えば輝度情報を表す特徴量、色情報を表す特徴量、エッジ情報を表す特徴量、テクスチャ情報を表す特徴量、形状情報を表す特徴量、または動き情報を表す特徴量などを使用することができる。また、例えば国際標準規格ISO/IEC 15938-3に規定されているDominant Color、Color Layout、Scalable Color、Color Structure、Edge Histogram、Homogeneous Texture、Texture Browsing、Region Shape、Contour Shape、Shape 3D、Parametric Motion、Motion Activityなどを使用してもよい。
 また、コンテンツの各フレームから画像特徴量を抽出せずに、例えば任意のサンプリング間隔で選択されたフレームのみから画像特徴量を抽出してもよい。さらに、例えばカット検出(映像の切り替わりを検出する処理)などの特定のフレームを選択する処理を適用して選ばれたフレームのみから画像特徴量を抽出してもよい。さらにまた、例えばコンテンツを任意の時間長の区間に分割し、各区間から、その区間に含まれる複数のフレームの画像特徴量を集約したものを使用することもできる。画像特徴量を集約する方法としては、例えば、平均値を求める、中央値を求める、最頻出値を求める、またはヒストグラムを求めるなどの方法が挙げられる。さらにまた、例えば、あらかじめ規定された、コンテンツの特定の時間軸上の位置のみから画像特徴量を抽出してもよい。これらの場合も、フレームや区間に対応付けられたフレーム番号や、それに基づいて算出されるメディア時刻をもって、コンテンツの時間軸上の位置との対応付けがされる。
 音響信号を表す信号特徴量系列としては、例えばディジタル音響信号(音響波形)の連続する任意のサンプル数の区間(以後、音響フレームという)に対して、解析処理を行って抽出したものとすることができる。例えば、音響フレームに対してフーリエ変換などの周波数変換を行ってスペクトルを抽出し、その平均パワー、周波数帯域ごとの平均パワー、スペクトルの平坦度、または周波数帯域ごとのスペクトルの平坦度などを、音響信号を表す信号特徴量系列として抽出することができる。この場合は、各音響フレームのサンプル点の番号や、それに基づいて算出されるメディア時刻をもって、コンテンツの時間軸上の位置との対応付けがされる。また、例えば、あらかじめ規定された、コンテンツの特定の時間軸上の位置のみから音響信号を表す信号特徴量系列を抽出してもよい。
 なお、信号特徴量系列抽出手段1が抽出する信号特徴量は、上記の信号特徴量に限定されず、コンテンツに含まれる映像信号を表す特徴量、もしくはコンテンツに含まれる音響信号を表す特徴量、またはそれらを組み合わせた特徴量であればどのような信号特徴量であってもよい。
 共通区間グループ検出手段3は、信号特徴量系列抽出手段2から供給されるコンテンツごとの信号特徴量系列から、異なるコンテンツ間で信号特徴量が相互に類似する区間である共通区間のグループを、共通区間グループとして検出する。検出した共通区間グループの情報、すなわち共通区間グループの各々の共通区間が属するコンテンツと時間軸上の位置を特定する情報を、共通区間グループ情報として、コンテンツ再生品質情報取得手段4と、コンテンツ再生制御手段5へ、供給する。
 コンテンツごとの信号特徴量系列から、信号特徴量が相互に類似する区間である共通区間のグループを検出する方法としては、例えば、文献1(Eiji Kasutani、Ryoma Oami、Akio Yamada、Takami Sato、Kyoji Hirata、“Video Material Archive System for Efficient Video Editing based on Media Identification”、 Proceedings on International Conference on Multimedia and Expo (ICME2004)、Vol.1、pp.727-730、June 2004.)、文献2(西村拓一、水野道尚、小木しのぶ、関本信博、岡隆一、“アクティブ探索法による時系列データ中の一致区間検出 -参照区間自由時系列アクティブ探索法-”、電子情報通信学会論文誌、D-II、Vol.J84-D-II、No.8、pp.1826-1837、2001年8月.)、及び文献3(特表2006-515721号公報)の方法を用いることができる。
 例えば、文献1には、映像信号の信号特徴量系列から、信号特徴量が相互に類似する区間を検出する方法が記載されている。文献1の方法は、まず、信号特徴量系列から短い時間長の区間をクエリ区間(参照区間)として抜き出す。信号特徴量系列の残りの区間に対して(今回の場合は、異なるコンテンツに対して)、クエリ区間と同じ時間長の区間を、時間軸上を移動しながら順次抜き出していき、クエリ区間との類似度を算出していく。類似度の算出は、区間の対応するフレーム間の画像特徴量の類似度の平均値が用いられる。クエリ区間との類似度が高い区間に対しては、時間軸の負の方向、及び正の方向に類似度を算出する区間を延長していき、信号特徴量が相互に類似する区間の開始点と終了点を確定する。あるクエリ区間に対してこの処理を終了すると、次のクエリ区間を抜き出し、同じ処理を繰返し行う。このようにして、信号特徴量が相互に類似する区間を検出できる。なお、文献1に記載の方法は、映像信号の信号特徴量系列だけに限らず、音響信号の信号特徴量系列に対しても同様に適用できる。なお、信号特徴量が相互に類似する区間を検出する際に、どの程度信号特徴量が類似した場合に類似区間として検出するかは、任意に決定することができる。従って、例えば、テロップ重畳などの画像への局所的な加工が施された場合は、背景音などの雑音が混入した場合であっても、類似とみなすようにすることも可能である。
 図2を参照して、共通区間グループの検出の例を示す(図2において矢印は、同一の共通区間グループに含まれることを表す)。図2では、コンテンツ1からコンテンツ4の4つコンテンツに対して、2つの共通区間グループ、すなわち共通区間グループAと共通区間グループBを検出した例を示す。共通区間グループAは、コンテンツ1の区間a、コンテンツ2の区間c、およびコンテンツ3の区間d、の3つの共通区間から構成されている。共通区間グループAに対する共通区間グループ情報は、コンテンツ1の区間a、コンテンツ2の区間c、およびコンテンツ3の区間d、の3つの共通区間を特定する情報、例えばそれぞれの区間の開始点と終了点のメディア時刻や、フレーム番号、などの情報であればよい。また共通区間グループBは、コンテンツ1の区間b、コンテンツ3の区間e、およびコンテンツ4の区間f、の3つの共通区間から構成されている。共通区間グループBに対する共通区間グループ情報は、コンテンツ1の区間b、コンテンツ3の区間e、およびコンテンツ4の区間f、の3つの共通区間を特定する情報、例えばそれぞれの区間の開始点と終了点のメディア時刻や、フレーム番号、などの情報であればよい。
 コンテンツ再生品質情報取得手段4は、共通区間グループ検出手段3から供給される共通区間グループ情報に基づいて、共通区間グループの各々の共通区間が属するコンテンツの再生品質を表すコンテンツ再生品質情報を取得する。取得したコンテンツ再生品質情報を、コンテンツ再生制御手段5へ供給する。
 なお、コンテンツ再生品質情報取得手段4がコンテンツ再生品質情報を取得する方法は任意である。コンテンツ群蓄積部1に含まれるコンテンツ自体から取得してもよいし、外部の情報から取得してもよい。
 図2を参照して説明すると、コンテンツ再生品質情報取得手段4は、共通区間グループAと共通区間グループBに対して、それに含まれる各々の共通区間が属するコンテンツのコンテンツ再生品質情報を取得する。共通区間グループAに対しては、それに含まれる区間aが属するコンテンツ1、区間cが属するコンテンツ2、区間dが属するコンテンツ3、のコンテンツ再生品質情報を取得する。共通区間グループBに対しては、それに含まれる区間bが属するコンテンツ1、区間eが属するコンテンツ3、区間fが属するコンテンツ4、のコンテンツ再生品質情報を取得する。
 また、コンテンツ再生品質情報取得手段4は、共通区間グループの各々の共通区間が属するコンテンツ全体の再生品質を表す情報ではなく、各々の共通区間の再生品質を表す情報を取得してもよい。図2の例でいうと、コンテンツ1、コンテンツ2、コンテンツ3、コンテンツ4、のコンテンツ全体の再生品質を表す情報ではなく、各々の共通区間である区間a、区間b、区間c、区間e、区間fの区間の再生品質を表す情報を取得してもよい。
 ここで、コンテンツの再生品質を表すコンテンツ再生品質情報とは、例えば、コンテンツの画質や音質などの信号品質を表す情報などである。
 コンテンツの画質や音質などの信号品質を表す情報は、例えばコンテンツのビットレート(符号化方式に対するビットレート)、解像度、フレームレート、また符号化方式などの情報である。一般的に、ビットレートが高いほど、解像度が高いほど、フレームレートが高いほど、符号化効率が良い符号化方式であるほど、画質や音質などの信号品質が高いと判定できる。これらの情報は、コンテンツ自体(コンテンツのヘッダ情報などから)から取得することができる。この場合、コンテンツ再生品質情報取得手段4は、コンテンツ群蓄積部1に蓄積されたコンテンツ自体から、ビットレート、符号化方式などの情報を取得する。また、コンテンツのビットレート、解像度、フレームレート、また符号化方式などの情報を、コンテンツ群蓄積部1に蓄積されたコンテンツ自体から取得せずに、これらのコンテンツと関連付けられメタデータ情報から取得してもよい。
 またコンテンツ自体を解析し、コンテンツの画質や音質などの信号品質を表す情報を抽出してもよい。この場合、コンテンツ再生品質情報取得手段4は、コンテンツ群蓄積部1に蓄積されたコンテンツ自体を解析し、コンテンツの画質や音質などの信号品質を表す情報を抽出する。例えば、コンテンツを復号してできる画像の画質を解析することにより符号化歪みの大きさを算出して、コンテンツの画質を表す情報としてもよい。この場合、符号化歪みが小さいほど、画質が高いと判定できる。
 例えば、文献4(特開2005-159419号公報 「画像処理装置及び方法、並びにコンピュータプログラム及びコンピュータ可読記憶媒体」)の方法を用いることにより、符号化歪みを定量化できる。勿論、符号化歪みを測定する方法はこれに限らず、コンテンツを復号してできる画質を用いて画質を判定できる方法であればよい。また画質に限らず、音質に関しても同様である。
 これらの、画質や音質などの信号品質を表すコンテンツ再生品質情報は、共通区間グループに含まれる各々の共通区間ごとに取得することもできる。
 また、以上に挙げたコンテンツの画質や音質などの信号品質を求める方法を複合して品質評価値を算出し、コンテンツの画質や音質などの信号品質を表すコンテンツ再生品質情報としてもよい。
 またここで、コンテンツの再生品質を表すコンテンツ再生品質情報とは、例えば、コンテンツの存在場所からユーザの再生環境までの間に介在するネットワークの品質(ネットワーク品質)などである。コンテンツの存在場所が異なる場合(例えば、コンテンツが蓄積されているストレージが異なる場合)、ユーザの再生環境までの間に介在するネットワークが異なるため、コンテンツごとにネットワーク品質が異なる。
 ネットワーク品質は、例えば、コンテンツの存在場所(ストレージ)から、ユーザの再生環境(ユーザの視聴端末)までの間に介在するネットワークの、通信帯域、通信遅延、パケットロス率、トラフィック量、などである。一般的に、通信帯域が広いほど、通信遅延が少ないほど、パケットロス率が低いほど、トラフィック量が少ないほど、コンテンツの再生遅延(再生開始までの時間がかかる、再生が途切れる、など)や処理落ちが(コマ落ちなど)が発生しにくくなるため、コンテンツの再生品質が高いと判定できる。その他、コンテンツが蓄積されたサーバへのアクセス量なども、コンテンツ再生品質情報として取得してもよい。これらの情報は、例えば、コンテンツが蓄積されたサーバにアクセスし、これらのデータを計測して求めることができる。この場合、コンテンツ再生品質情報取得手段4は、例えば、コンテンツ群蓄積部1にアクセスして、これらのデータを計測して求めてもよい。また、通信帯域、通信遅延、パケットロス率、トラフィック量、アクセス量などの情報を、外部から入力される情報として取得してもよい。例えば、過去に計測されたデータから算出された統計量などの外部情報から、取得してもよい。
 またコンテンツ再生品質情報取得手段4は、例えば、コンテンツの再生遅延の発生率や、コンテンツ再生遅延時間などの統計データを、コンテンツ再生品質情報として取得してもよい。これらの情報は、例えば、過去に計測された再生遅延の発生率や、再生遅延時間から算出することができる。
 ここで、ネットワーク品質を取得する方法としては、ネットワーク品質を評価する、一般に知られた様々な方法を利用してもよい。
 ここに挙げたコンテンツ再生品質情報は、一例であり、これらに限られない。コンテンツのあらゆる再生品質(ユーザがコンテンツを視聴した際に感じる品質)を判断できる情報であれば、どのような情報であってもかまわない。
 コンテンツ再生制御手段5は、共通区間グループ検出手段3から供給される共通区間グループ情報と、コンテンツ再生品質情報取得手段4から供給されるコンテンツ再生品質情報を用い、コンテンツ群蓄積部1に含まれるコンテンツを再生する際に、該再生対象のコンテンツにおいて共通区間グループに含まれる区間に対しては、共通区間グループの各々の共通区間が属するコンテンツのコンテンツ再生品質情報に基づいてコンテンツの再生品質が高くなるように、再生するコンテンツを切り替えて、再生を行う。
 コンテンツ再生制御手段5は、コンテンツの再生品質が高くなるように、再生するコンテンツを切り替えて、再生を行う方法として、例えば、共通区間グループの各々の共通区間が属するコンテンツのコンテンツ再生品質情報に基づいて、最もコンテンツの再生品質が高くなるコンテンツを選定し、選定されたコンテンツに切り替えて、再生を行ってもよい。
 図2を参照して説明する。ここで、再生対象のコンテンツをコンテンツ1とする。コンテンツ1において共通空区間グループに含まれる区間は、共通区間グループAに含まれる区間aと、共通区間グループBに含まれる区間bである。ここで、例えば、コンテンツ再生品質情報に基づいて、共通区間グループAの各々の共通区間が属するコンテンツのうち、区間dを含むコンテンツ3が、共通区間グループBの各々の共通区間が属するコンテンツのうち、区間fを含むコンテンツ4が、それぞれ最もコンテンツの再生品質が高くなるコンテンツであるとする場合、コンテンツ再生制御手段5は、再生対象コンテンツであるコンテンツ1を再生する際に、まず、区間aを再生する際は、代わりにコンテンツ3の区間dに切り替えて再生を行い、次に、共通区間グループに含まれない区間(区間aと区間bの間)を再生する際は、コンテンツ1をそのまま再生し、最後に区間bを再生する際は、代わりにコンテンツ4の区間fに切り替えて再生を行う。勿論、例えば共通区間グループの各々共通区間が属するコンテンツのうち、再生対象コンテンツであるコンテンツ1が、最もコンテンツの再生品質が高くなるコンテンツであるとする場合は、特にコンテンツの切り替えを行うことなく、コンテンツ1をそのまま再生すればよい。
 ここで例えば、コンテンツ再生品質情報がコンテンツの画質や音質などの信号品質を表す情報の場合、共通区間グループごとに、最もコンテンツの信号品質が高くなるコンテンツを選定し、選定されたコンテンツに切り替えて、再生を行ってもよい。例えば、最もビットレートが高いコンテンツ、最も解像度が高いコンテンツ、最もフレームレートが高いコンテンツ、最も符号化効率が良い符号化方式で符号化されたコンテンツ、最も符号化歪みの少ないコンテンツ、を選定し、選定されたコンテンツに切り替えて、再生を行ってもよい。
 ここで例えば、コンテンツ再生品質情報が、コンテンツの存在場所から、ユーザの再生環境までの間に介在するネットワークの品質(ネットワーク品質)を表す情報の場合、共通区間グループごとに、最もネットワーク品質が高くなるコンテンツを選定し、選定されたコンテンツに切り替えて、再生を行ってもよい。コンテンツの存在場所が複数のストレージに散在する場合は、それぞれのコンテンツの存在場所とユーザの再生環境までの間に介在するネットワークが異なるため、ネットワーク品質は、コンテンツごとに異なることになる。例えば、コンテンツの存在場所から、ユーザの再生環境までの間に介在するネットワークが、最も通信帯域が広いコンテンツほど、最も通信遅延が少ないコンテンツ、最もパケットロス率が低くいコンテンツ、最もトラフィック量が少ないコンテンツ、を選定し、選定されたコンテンツに切り替えて、再生を行ってもよい。また例えば、コンテンツが存在するサーバへのアクセス量が最も少ないコンテンツを選定し、選定されたコンテンツに切り替えて、再生を行ってもよい。また例えば、最も再生遅延の発生率が低いコンテンツ、最も再生遅延時間が短いコンテンツを選定して、選定されたコンテンツに切り替えて、再生を行ってもよい。
 また、コンテンツ再生制御手段5は、これらの信号品質を表すコンテンツ再生品質情報や、ネットワーク品質を表すコンテンツ再生品質情報などの複数の情報を複合して、コンテンツの再生品質を評価し、最も再生品質が高いと評価されたコンテンツを選定し、選定されたコンテンツに切り替えて、再生を行ってもよい。例えば、常に再生遅延が発生しないようなコンテンツを選定することを最優先とし、その次に画質や音質が高いコンテンツを選定する、という基準で、コンテンツを選定してもよい。また例えば、再生遅延が発生しない最低限のネットワーク品質の中で、画質や音質が最も高いコンテンツを選定するようにしてもよい。
 また、例えば、再生対象のコンテンツにおいて共通区間グループに含まれる区間が複数ある場合に、その区間に対して個別に、最もコンテンツの再生品質が高くなるコンテンツを選定するのではなく、複数の区間に対して、まとめて(総合として)最もコンテンツの再生品質が高くなるコンテンツを選定してもよい。これにより、コンテンツ全体として、最もコンテンツの再生品質が高くなるように、コンテンツを選定することができる。例えば、図2を例に説明すると、再生対象のコンテンツがコンテンツ1である場合に、共通区間グループに含まれる区間aと区間bに対して、個別に、最もコンテンツの再生品質が高くなるコンテンツを選定するのではなく、区間aと区間bに対して、まとめて最もコンテンツの再生品質が高くなるコンテンツを選定してもよい。
 次に、図3のフローチャートを利用して、本実施の形態の動作を説明する。図3は、本実施の形態におけるコンテンツ再生順序決定システムの動作を示すフローチャートである。
 まず、信号特徴量系列抽出手段2は、コンテンツ群蓄積部1に含まれる各々のコンテンツごとに、コンテンツの時間軸上の位置(例えばメディア時刻など)と対応付けられた信号特徴量の系列である信号特徴量系列を抽出し、抽出したコンテンツごとの信号特徴量系列を、共通区間グループ検出手段3へ供給する(ステップA01)。
 次に、共通区間グループ検出手段3は、信号特徴量系列抽出手段2から供給されるコンテンツごとの信号特徴量系列から、異なるコンテンツ間で信号特徴量が相互に類似する区間である共通区間のグループを、共通区間グループとして検出する。検出した共通区間グループの情報、すなわち共通区間グループの各々の共通区間が属するコンテンツと時間軸上の位置を特定する情報を、共通区間グループ情報として、コンテンツ再生品質情報取得手段4と、コンテンツ再生制御手段5へ、供給する(ステップA02)。
 そして、コンテンツ再生品質情報取得手段4は、共通区間グループ検出手段3から供給される共通区間グループ情報に基づいて、共通区間グループの各々の共通区間が属するコンテンツの再生品質を表すコンテンツ再生品質情報を取得する。取得したコンテンツ再生品質情報を、コンテンツ再生制御手段5へ供給する(ステップA03)。
 最後に、コンテンツ再生制御手段5は、共通区間グループ検出手段3から供給される共通区間グループ情報と、コンテンツ再生品質情報取得手段4から供給されるコンテンツ再生品質情報を用い、コンテンツ群蓄積部1に含まれるコンテンツを再生する際に、該再生対象のコンテンツにおいて共通区間グループに含まれる区間に対しては、共通区間グループの各々の共通区間が属するコンテンツのコンテンツ再生品質情報に基づいてコンテンツの再生品質が高くなるように、再生するコンテンツを切り替えて、再生を行う(ステップA04)。
 本実施の形態の効果について説明する。
 本実施の形態によれば、インターネット上の動画共有サービス(動画投稿サイト)などの大量のコンテンツを対象にコンテンツを再生閲覧するシステムにおいて、コンテンツの再生品質を確保した再生を実現できる、という効果がある。これにより、ユーザが高い再生品質のコンテンツ視聴を享受でき、再生品質の悪いコンテンツの視聴に甘んじることが少なくなる、という効果がある。
 その理由は、コンテンツ再生頻出情報取得手段4が取得したコンテンツ再生品質情報に基づき、コンテンツ再生制御手段5がコンテンツを再生する際に、他のコンテンツとの共通区間が存在する区間に対しては、再生品質の高いコンテンツに切り替えて再生を実行するからである。
 インターネット上の動画共有サービス(動画投稿サイト)などでは、様々な再生品質を有する同一のコンテンツあるいは、一部の区間のみが同一のコンテンツが多数存在するため、特に、本実施の形態の効果が大きくなる。
 なお、本発明の対象はインターネット上の動画共有サービス(動画投稿サイト)に限らず、例えば動画録画装置(ハードディスクレコーダなど)、動画視聴端末(セットトップボックスなど)、携帯動画プレイヤー、携帯音楽プレイヤーなど、大量のコンテンツを対象に、コンテンツを再生閲覧するシステムや装置であれば、対象となる。
 また、上記実施の形態では各部をハードウェアで構成したが、プログラムで動作するCPU等の情報処理装置で構成しても良い。この場合、プログラムは、上述した動作をCPU等に実行させる。
 以上の如く、本発明の第1の態様は、少なくとも一以上のコンテンツを蓄積するコンテンツ群蓄積部と、前記コンテンツ群蓄積部に蓄積されているコンテンツごとに、コンテンツの時間軸上の位置と対応付けられた信号特徴量の系列である信号特徴量系列を抽出する信号特徴量系列抽出手段と、前記コンテンツごとの信号特徴量系列から、異なるコンテンツ間で信号特徴量が相互に類似する区間である共通区間のグループを、共通区間グループとして検出する共通区間グループ検出手段と、前記共通区間グループごとに、共通区間グループの各々の共通区間が属するコンテンツの再生品質を表すコンテンツ再生品質情報を取得するコンテンツ再生品質情報取得手段と、前記コンテンツ群蓄積部に含まれるコンテンツを再生する際に、該再生対象のコンテンツにおいて前記共通区間グループに含まれる区間に対しては、前記共通区間グループの各々の共通区間が属するコンテンツの前記コンテンツ再生品質情報に基づいてコンテンツの再生品質が高くなるように、再生するコンテンツを切り替えて、再生を行うコンテンツ再生制御手段とを有するコンテンツ再生制御システムである。
 また、本発明の第2の態様は、上記態様において、前記コンテンツが、映像信号もしくは音響信号、または、映像信号及び音響信号の両方から構成されている、時間軸を有するメディアである。
 また、本発明の第3の態様は、上記態様において、前記信号特徴量系列が、コンテンツに含まれる映像信号を表す特徴量、コンテンツに含まれる音響信号を表す特徴量、の少なくともひとつを含む。
 また、本発明の第4の態様は、上記態様において、前記コンテンツ再生品質情報取得手段が、共通区間グループの各々の共通区間の再生品質を表す情報を、コンテンツ再生品質情報として取得する。
 また、本発明の第5の態様は、上記態様において、前記コンテンツ再生制御手段が、前記コンテンツ群蓄積部に蓄積されているコンテンツを再生する際に、該再生対象のコンテンツにおいて前記共通区間グループに含まれる区間に対しては、前記共通区間グループの各々の共通区間が属するコンテンツの前記コンテンツ再生品質情報に基づいて、最もコンテンツの再生品質が高くなるコンテンツを選択し、選択されたコンテンツに切り替えて、再生を行う。
 また、本発明の第6の態様は、上記態様において、前記コンテンツ再生品質情報取得手段は、コンテンツの画質又は音質を表す情報を、コンテンツ再生品質情報として取得し、前記コンテンツ再生制御手段は、少なくとも一以上の共通区間の画質又は音質のいずれか、またはその両方が高いコンテンツに切り替えて再生を行う。
 また、本発明の第7の態様は、上記態様において、前記コンテンツの画質又は音質を表す情報が、コンテンツのビットレート、解像度、フレームレート、符号化方式、符号化歪み、のいずれかを表す情報、またはその組み合わせである。
 また、本発明の第8の態様は、上記態様において、前記コンテンツ再生品質情報取得手段は、コンテンツの存在場所からユーザの再生環境までの間に介在するネットワークの品質を表す情報を、コンテンツ再生品質情報として取得し、前記コンテンツ再生制御手段は、コンテンツの存在場所からユーザの再生環境までの間に介在するネットワークの品質が高いコンテンツに切り替えて再生を行う。
 また、本発明の第9の態様は、上記態様において、前記ネットワークの品質を表す情報が、コンテンツの存在場所からユーザの再生環境までの間に介在するネットワークの通信帯域、通信遅延、パケットロス率、トラフィック量、再生遅延の発生率、再生遅延時間、サーバへのアクセス量、のいずれかを表す情報、又はその組み合わせである。
 また、本発明の第10の態様は、少なくとも一以上のコンテンツを蓄積するコンテンツ群蓄積部に蓄積されている各々のコンテンツごとに、コンテンツの時間軸上の位置と対応付けられた信号特徴量の系列である信号特徴量系列を抽出する信号特徴量系列抽出手段と、前記コンテンツごとの信号特徴量系列から、異なるコンテンツ間で信号特徴量が相互に類似する区間である共通区間のグループを、共通区間グループとして検出する共通区間グループ検出手段と、前記共通区間グループごとに、共通区間グループの各々の共通区間が属するコンテンツの再生品質を表すコンテンツ再生品質情報を取得するコンテンツ再生品質情報取得手段と、前記コンテンツ群蓄積部に含まれるコンテンツを再生する際に、該再生対象のコンテンツにおいて前記共通区間グループに含まれる区間に対しては、前記共通区間グループの各々の共通区間が属するコンテンツの前記コンテンツ再生品質情報に基づいてコンテンツの再生品質が高くなるように、再生するコンテンツを切り替えて、再生を行うコンテンツ再生制御手段とを備えたことを特徴とするコンテンツ再生制御装置である。
 また、本発明の第11の態様は、上記態様において、少なくとも一以上のコンテンツを蓄積するコンテンツ群蓄積部に蓄積されているコンテンツごとに、コンテンツの時間軸上の位置と対応付けられた信号特徴量の系列である信号特徴量系列を抽出する信号特徴量系列抽出工程と、前記コンテンツごとの信号特徴量系列から、異なるコンテンツ間で信号特徴量が相互に類似する区間である共通区間のグループを、共通区間グループとして検出する共通区間グループ検出工程と、前記共通区間グループごとに、共通区間グループの各々の共通区間が属するコンテンツの再生品質を表すコンテンツ再生品質情報を取得するコンテンツ再生品質情報取得工程と、前記コンテンツ群蓄積部に含まれるコンテンツを再生する際に、該再生対象のコンテンツにおいて前記共通区間グループに含まれる区間に対しては、前記共通区間グループの各々の共通区間が属するコンテンツの前記コンテンツ再生品質情報に基づいてコンテンツの再生品質が高くなるように、再生するコンテンツを切り替えて、再生を行うコンテンツ再生制御工程とを有するコンテンツ再生制御方法である。
 また、本発明の第12の態様は、上記態様において、少なくとも一以上のコンテンツを蓄積するコンテンツ群蓄積部に蓄積されているコンテンツごとに、コンテンツの時間軸上の位置と対応付けられた信号特徴量の系列である信号特徴量系列を抽出する信号特徴量系列抽出処理と、前記コンテンツごとの信号特徴量系列から、異なるコンテンツ間で信号特徴量が相互に類似する区間である共通区間のグループを、共通区間グループとして検出する共通区間グループ検出処理と、前記共通区間グループごとに、共通区間グループの各々の共通区間が属するコンテンツの再生品質を表すコンテンツ再生品質情報を取得するコンテンツ再生品質情報取得処理と、前記コンテンツ群蓄積部に含まれるコンテンツを再生する際に、該再生対象のコンテンツにおいて前記共通区間グループに含まれる区間に対しては、前記共通区間グループの各々の共通区間が属するコンテンツの前記コンテンツ再生品質情報に基づいてコンテンツの再生品質が高くなるように、再生するコンテンツを切り替えて、再生を行うコンテンツ再生制御処理とを情報処理装置に実行させるコンテンツ再生制御プログラムである。
 以上好ましい実施の形態、及び態様をあげて本発明を説明したが、本発明は必ずしも上記実施の形態及び態様に限定されるものではなく、その技術的思想の範囲内において様々に変形し実施することが出来る。
 本出願は、2008年6月26日に出願された日本出願特願2008-167342号を基礎とする優先権を主張し、その開示の全てをここに取り込む。
 本発明の活用例として、例えば、インターネット上の動画共有サービス(動画投稿サイト)などの大量のコンテンツを対象にコンテンツを再生閲覧するシステムにおいて、コンテンツの再生品質を確保した再生(高い再生品質)をユーザに提供することができる。

Claims (12)

  1.  少なくとも一以上のコンテンツを蓄積するコンテンツ群蓄積部と、
     前記コンテンツ群蓄積部に蓄積されているコンテンツごとに、コンテンツの時間軸上の位置と対応付けられた信号特徴量の系列である信号特徴量系列を抽出する信号特徴量系列抽出手段と、
     前記コンテンツごとの信号特徴量系列から、異なるコンテンツ間で信号特徴量が相互に類似する区間である共通区間のグループを、共通区間グループとして検出する共通区間グループ検出手段と、
     前記共通区間グループごとに、共通区間グループの各々の共通区間が属するコンテンツの再生品質を表すコンテンツ再生品質情報を取得するコンテンツ再生品質情報取得手段と、
     前記コンテンツ群蓄積部に含まれるコンテンツを再生する際に、該再生対象のコンテンツにおいて前記共通区間グループに含まれる区間に対しては、前記共通区間グループの各々の共通区間が属するコンテンツの前記コンテンツ再生品質情報に基づいてコンテンツの再生品質が高くなるように、再生するコンテンツを切り替えて、再生を行うコンテンツ再生制御手段と
    を有するコンテンツ再生制御システム。
  2.  前記コンテンツが、映像信号もしくは音響信号、または、映像信号及び音響信号の両方から構成されている、時間軸を有するメディアである請求項1に記載のコンテンツ再生制御システム。
  3.  前記信号特徴量系列が、コンテンツに含まれる映像信号を表す特徴量、コンテンツに含まれる音響信号を表す特徴量、の少なくともひとつを含む請求項1または請求項2に記載のコンテンツ再生制御システム。
  4.  前記コンテンツ再生品質情報取得手段が、共通区間グループの各々の共通区間の再生品質を表す情報を、コンテンツ再生品質情報として取得する請求項1から請求項3のいずれかに記載のコンテンツ再生制御システム。
  5.  前記コンテンツ再生制御手段が、前記コンテンツ群蓄積部に蓄積されているコンテンツを再生する際に、該再生対象のコンテンツにおいて前記共通区間グループに含まれる区間に対しては、前記共通区間グループの各々の共通区間が属するコンテンツの前記コンテンツ再生品質情報に基づいて、最もコンテンツの再生品質が高くなるコンテンツを選択し、選択されたコンテンツに切り替えて、再生を行う請求項1から請求項4のいずれかに記載のコンテンツ再生制御システム。
  6.  前記コンテンツ再生品質情報取得手段は、コンテンツの画質又は音質を表す情報を、コンテンツ再生品質情報として取得し、
     前記コンテンツ再生制御手段は、少なくとも一以上の共通区間の画質又は音質のいずれか、またはその両方が高いコンテンツに切り替えて再生を行う
    請求項1から請求項5のいずれかに記載のコンテンツ再生制御システム。
  7.  前記コンテンツの画質又は音質を表す情報が、コンテンツのビットレート、解像度、フレームレート、符号化方式、符号化歪み、のいずれかを表す情報、またはその組み合わせである請求項6に記載のコンテンツ再生制御システム。
  8.  前記コンテンツ再生品質情報取得手段は、コンテンツの存在場所からユーザの再生環境までの間に介在するネットワークの品質を表す情報を、コンテンツ再生品質情報として取得し、
     前記コンテンツ再生制御手段は、コンテンツの存在場所からユーザの再生環境までの間に介在するネットワークの品質が高いコンテンツに切り替えて再生を行う
    請求項1から請求項7のいずれかに記載のコンテンツ再生制御システム。
  9.  前記ネットワークの品質を表す情報が、コンテンツの存在場所からユーザの再生環境までの間に介在するネットワークの通信帯域、通信遅延、パケットロス率、トラフィック量、再生遅延の発生率、再生遅延時間、サーバへのアクセス量、のいずれかを表す情報、又はその組み合わせである請求項8に記載のコンテンツ再生制御システム。
  10.  少なくとも一以上のコンテンツを蓄積するコンテンツ群蓄積部に蓄積されている各々のコンテンツごとに、コンテンツの時間軸上の位置と対応付けられた信号特徴量の系列である信号特徴量系列を抽出する信号特徴量系列抽出手段と、
     前記コンテンツごとの信号特徴量系列から、異なるコンテンツ間で信号特徴量が相互に類似する区間である共通区間のグループを、共通区間グループとして検出する共通区間グループ検出手段と、
     前記共通区間グループごとに、共通区間グループの各々の共通区間が属するコンテンツの再生品質を表すコンテンツ再生品質情報を取得するコンテンツ再生品質情報取得手段と、
     前記コンテンツ群蓄積部に含まれるコンテンツを再生する際に、該再生対象のコンテンツにおいて前記共通区間グループに含まれる区間に対しては、前記共通区間グループの各々の共通区間が属するコンテンツの前記コンテンツ再生品質情報に基づいてコンテンツの再生品質が高くなるように、再生するコンテンツを切り替えて、再生を行うコンテンツ再生制御手段と
    を有するコンテンツ再生制御装置。
  11.  少なくとも一以上のコンテンツを蓄積するコンテンツ群蓄積部に蓄積されているコンテンツごとに、コンテンツの時間軸上の位置と対応付けられた信号特徴量の系列である信号特徴量系列を抽出する信号特徴量系列抽出工程と、
     前記コンテンツごとの信号特徴量系列から、異なるコンテンツ間で信号特徴量が相互に類似する区間である共通区間のグループを、共通区間グループとして検出する共通区間グループ検出工程と、
     前記共通区間グループごとに、共通区間グループの各々の共通区間が属するコンテンツの再生品質を表すコンテンツ再生品質情報を取得するコンテンツ再生品質情報取得工程と、
     前記コンテンツ群蓄積部に含まれるコンテンツを再生する際に、該再生対象のコンテンツにおいて前記共通区間グループに含まれる区間に対しては、前記共通区間グループの各々の共通区間が属するコンテンツの前記コンテンツ再生品質情報に基づいてコンテンツの再生品質が高くなるように、再生するコンテンツを切り替えて、再生を行うコンテンツ再生制御工程と
    を有するコンテンツ再生制御方法。
  12.  少なくとも一以上のコンテンツを蓄積するコンテンツ群蓄積部に蓄積されているコンテンツごとに、コンテンツの時間軸上の位置と対応付けられた信号特徴量の系列である信号特徴量系列を抽出する信号特徴量系列抽出処理と、
     前記コンテンツごとの信号特徴量系列から、異なるコンテンツ間で信号特徴量が相互に類似する区間である共通区間のグループを、共通区間グループとして検出する共通区間グループ検出処理と、
     前記共通区間グループごとに、共通区間グループの各々の共通区間が属するコンテンツの再生品質を表すコンテンツ再生品質情報を取得するコンテンツ再生品質情報取得処理と、
     前記コンテンツ群蓄積部に含まれるコンテンツを再生する際に、該再生対象のコンテンツにおいて前記共通区間グループに含まれる区間に対しては、前記共通区間グループの各々の共通区間が属するコンテンツの前記コンテンツ再生品質情報に基づいてコンテンツの再生品質が高くなるように、再生するコンテンツを切り替えて、再生を行うコンテンツ再生制御処理と
    を情報処理装置に実行させるコンテンツ再生制御プログラム。
     
PCT/JP2009/061306 2008-06-26 2009-06-22 コンテンツ再生制御システムと、その方法及びプログラム WO2009157402A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN2009801237223A CN102067229B (zh) 2008-06-26 2009-06-22 内容再现控制系统及其方法和程序
US13/001,398 US8913873B2 (en) 2008-06-26 2009-06-22 Content reproduction control system and method and program thereof
JP2010517999A JP5648801B2 (ja) 2008-06-26 2009-06-22 コンテンツ再生制御システムと、その方法及びプログラム
EP09770112.2A EP2306719B1 (en) 2008-06-26 2009-06-22 Content reproduction control system and method and program thereof

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2008-167342 2008-06-26
JP2008167342 2008-06-26

Publications (1)

Publication Number Publication Date
WO2009157402A1 true WO2009157402A1 (ja) 2009-12-30

Family

ID=41444468

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2009/061306 WO2009157402A1 (ja) 2008-06-26 2009-06-22 コンテンツ再生制御システムと、その方法及びプログラム

Country Status (5)

Country Link
US (1) US8913873B2 (ja)
EP (1) EP2306719B1 (ja)
JP (1) JP5648801B2 (ja)
CN (1) CN102067229B (ja)
WO (1) WO2009157402A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014232979A (ja) * 2013-05-29 2014-12-11 三菱電機株式会社 映像データ削減装置および再生装置
JP2016225995A (ja) * 2010-09-24 2016-12-28 アマゾン テクノロジーズ インコーポレイテッド 権利および機能包括のコンテンツ選択および配信
WO2018011870A1 (ja) * 2016-07-11 2018-01-18 三菱電機株式会社 動画像処理装置、動画像処理方法及び動画像処理プログラム
US10387626B2 (en) 2010-09-24 2019-08-20 Amazon Technologies, Inc. Rights and capability-inclusive content selection and delivery

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102714626B (zh) * 2010-06-28 2016-04-06 松下知识产权经营株式会社 通信终端、通信方法以及集成电路

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000259832A (ja) * 1999-01-06 2000-09-22 Nec Corp 画像特徴量生成装置、画像検索装置、並びにその生成方法及び検索方法
JP2000339474A (ja) * 1999-05-27 2000-12-08 Nec Corp 動画像類似度算出装置および方法
JP2003333484A (ja) * 2002-05-15 2003-11-21 Nec Corp 番組録画再生システム、番組録画再生方法および番組録画再生プログラム
JP2005159419A (ja) 2003-11-20 2005-06-16 Canon Inc 画像処理装置及び方法、並びにコンピュータプログラム及びコンピュータ可読記憶媒体
JP2006515721A (ja) 2002-07-01 2006-06-01 マイクロソフト コーポレーション ストリームに繰り返し埋め込まれたメディアオブジェクトを識別し、セグメント化するためのシステムおよび方法
JP2007295038A (ja) * 2006-04-20 2007-11-08 Canon Inc 動画再生装置及び方法
JP2008167342A (ja) 2006-12-30 2008-07-17 Ideasync Co Ltd 広告等の情報付加装置、広告等の情報付加方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030093790A1 (en) * 2000-03-28 2003-05-15 Logan James D. Audio and video program recording, editing and playback systems using metadata
US20030185455A1 (en) * 1999-02-04 2003-10-02 Goertzen Kenbe D. Digital image processor
JP2003199128A (ja) * 2001-12-25 2003-07-11 Ando Electric Co Ltd 動画配信試験装置
WO2004004351A1 (en) * 2002-07-01 2004-01-08 Microsoft Corporation A system and method for providing user control over repeating objects embedded in a stream
WO2006059436A1 (ja) * 2004-12-03 2006-06-08 Nec Corporation 映像コンテンツ再生支援方法、映像コンテンツ再生支援システム、及び情報配信プログラム
US20070024706A1 (en) * 2005-08-01 2007-02-01 Brannon Robert H Jr Systems and methods for providing high-resolution regions-of-interest

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000259832A (ja) * 1999-01-06 2000-09-22 Nec Corp 画像特徴量生成装置、画像検索装置、並びにその生成方法及び検索方法
JP2000339474A (ja) * 1999-05-27 2000-12-08 Nec Corp 動画像類似度算出装置および方法
JP2003333484A (ja) * 2002-05-15 2003-11-21 Nec Corp 番組録画再生システム、番組録画再生方法および番組録画再生プログラム
JP2006515721A (ja) 2002-07-01 2006-06-01 マイクロソフト コーポレーション ストリームに繰り返し埋め込まれたメディアオブジェクトを識別し、セグメント化するためのシステムおよび方法
JP2005159419A (ja) 2003-11-20 2005-06-16 Canon Inc 画像処理装置及び方法、並びにコンピュータプログラム及びコンピュータ可読記憶媒体
JP2007295038A (ja) * 2006-04-20 2007-11-08 Canon Inc 動画再生装置及び方法
JP2008167342A (ja) 2006-12-30 2008-07-17 Ideasync Co Ltd 広告等の情報付加装置、広告等の情報付加方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
EIJI KASUTANI; RYOMA OAMI; AKIO YAMADA; TAKAMI SATO; KYOJI HIRATA: "Video Material Archive System for Efficient Video Editing based on Media Identification", PROCEEDINGS ON INTEMATIONAL CONFERENCE ON MULTIMEDIA AND EXPO (ICME 2004), vol. 1, June 2004 (2004-06-01), pages 727 - 730
NISHIMURA TAKUICHI; MIZUNO MICHINAO; OGI SHINOBU; SEKIMOTO NOBUHIRO; OKA RYUICHI: "Same Interval Retrieval from Time-Sequence Data Based on Active Search: Reference Interval-Free Time: Series Active Search (RIFAS)", THE TRANSACTIONS OF THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS, D-II, vol. J84-D-II, no. 8, August 2001 (2001-08-01), pages 1826 - 1837
See also references of EP2306719A4

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016225995A (ja) * 2010-09-24 2016-12-28 アマゾン テクノロジーズ インコーポレイテッド 権利および機能包括のコンテンツ選択および配信
US10387626B2 (en) 2010-09-24 2019-08-20 Amazon Technologies, Inc. Rights and capability-inclusive content selection and delivery
JP2014232979A (ja) * 2013-05-29 2014-12-11 三菱電機株式会社 映像データ削減装置および再生装置
WO2018011870A1 (ja) * 2016-07-11 2018-01-18 三菱電機株式会社 動画像処理装置、動画像処理方法及び動画像処理プログラム
JPWO2018011870A1 (ja) * 2016-07-11 2018-10-25 三菱電機株式会社 動画像処理装置、動画像処理方法及び動画像処理プログラム

Also Published As

Publication number Publication date
CN102067229A (zh) 2011-05-18
CN102067229B (zh) 2013-03-20
US20110123171A1 (en) 2011-05-26
JP5648801B2 (ja) 2015-01-07
EP2306719A4 (en) 2011-07-27
US8913873B2 (en) 2014-12-16
JPWO2009157402A1 (ja) 2011-12-15
EP2306719A1 (en) 2011-04-06
EP2306719B1 (en) 2013-11-20

Similar Documents

Publication Publication Date Title
US9646007B2 (en) Distributed and tiered architecture for content search and content monitoring
EP2901372B1 (en) Using digital fingerprints to associate data with a work
US8788544B2 (en) Method and apparatus for managing data
US8655146B2 (en) Collection and concurrent integration of supplemental information related to currently playing media
US8798169B2 (en) Data summarization system and method for summarizing a data stream
US20190259423A1 (en) Dynamic media recording
JP2004526372A (ja) ストリーミング映像ブックマーク
JP5648801B2 (ja) コンテンツ再生制御システムと、その方法及びプログラム
JP2010226630A (ja) コメント処理機能を有した映像処理装置及びそのコメント処理方法
US20060210246A1 (en) Data processing apparatus
JP2005323333A (ja) コンピュータシステムに用いられるビデオ編集システム及びその方法
JP4702577B2 (ja) コンテンツ再生順序決定システムと、その方法及びプログラム
JP2008263502A (ja) 記録再生装置及び記録再生システム
KR20140007893A (ko) 비디오 스트림을 최적화하기 위한 방법
KR101632689B1 (ko) 멀티미디어 조각파일의 복구방법
Li et al. Light weight content fingerprinting for video playback verification in mpeg dash
US20200186852A1 (en) Methods and Systems for Switching Between Summary, Time-shifted, or Live Content
WO2007055445A1 (en) A pre-viewing method of multiple movies or movie-clips in multimedia apparatus
Pirozhenko et al. Video stream processing and compression with codec choice ability
JP2008262000A (ja) オーディオ信号特徴検出装置及び特徴検出方法
KR20040102962A (ko) Pvr에서의 하이라이트 스트림 생성 장치 및 그 방법
KR20100035535A (ko) 썸네일 생성 방법
JP2010177783A (ja) 映像音声記録装置
JP2013077871A (ja) 映像配信装置
JP2006128848A (ja) ホームネットワーク装置

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 200980123722.3

Country of ref document: CN

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 09770112

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2010517999

Country of ref document: JP

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 2009770112

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 13001398

Country of ref document: US