WO2009010002A1 - Procédé et dispositif pour tester la cohérence de contenus numériques - Google Patents

Procédé et dispositif pour tester la cohérence de contenus numériques Download PDF

Info

Publication number
WO2009010002A1
WO2009010002A1 PCT/CN2008/071627 CN2008071627W WO2009010002A1 WO 2009010002 A1 WO2009010002 A1 WO 2009010002A1 CN 2008071627 W CN2008071627 W CN 2008071627W WO 2009010002 A1 WO2009010002 A1 WO 2009010002A1
Authority
WO
WIPO (PCT)
Prior art keywords
digital content
detected
feature value
original digital
original
Prior art date
Application number
PCT/CN2008/071627
Other languages
English (en)
French (fr)
Inventor
Qingliang Li
Original Assignee
Huawei Technologies Co., Ltd.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co., Ltd. filed Critical Huawei Technologies Co., Ltd.
Priority to EP08773178.2A priority Critical patent/EP2109248B1/en
Publication of WO2009010002A1 publication Critical patent/WO2009010002A1/zh
Priority to US12/550,906 priority patent/US20090316894A1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/10Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L2463/00Additional details relating to network architectures or network communication protocols for network security covered by H04L63/00
    • H04L2463/101Additional details relating to network architectures or network communication protocols for network security covered by H04L63/00 applying security measures for digital rights management
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/10Network architectures or network communication protocols for network security for controlling access to devices or network resources
    • H04L63/101Access control lists [ACL]

Definitions

  • the present invention relates to the field of digital rights management technologies, and in particular, to a method and apparatus for detecting consistency of digital content. Background technique
  • Digital Rights Management protects the legitimate rights and interests of content owners by controlling the use of digital content through rights restrictions and content protection schemes.
  • the embodiment of the present invention provides a method and apparatus for detecting consistency of digital content, where
  • the embodiment of the invention provides a method for detecting consistency of digital content, the method comprising the steps of:
  • An embodiment of the present invention provides a device for detecting consistency of digital content, including:
  • a second extraction module configured to extract feature values from the digital content to be detected
  • a comparison module (72) configured to compare a feature value of the original digital content extracted by the first extraction module (70) with a feature value of the digital content to be detected extracted by the second extraction module (71);
  • the first determining module (73) is configured to determine, according to the comparison result of the comparing module (72), whether the digital content to be detected is consistent with the original digital content.
  • Embodiments of the present invention provide a computer readable storage medium storing a computer program, which may cause a processor to perform the following steps:
  • FIG. 2 is a schematic diagram of extracting digest feature values of digital content in an embodiment of the present invention.
  • FIG. 3 is a flowchart of a process for determining consistency of digital content by comparing summary feature values according to an embodiment of the present invention
  • FIG. 4 is a flowchart of a process for determining consistency of digital content by comparing summary feature values and content feature values according to an embodiment of the present invention
  • FIG. 5 is a schematic diagram of limiting and filtering illegal digital content distribution according to an embodiment of the present invention.
  • FIG. 6 is a flowchart of processing for controlling access to digital content in an embodiment of the present invention.
  • 7A, 7B, 7C, 7D, 7E, and 7F are schematic diagrams showing the structure of a digital content consistency detecting apparatus according to an embodiment of the present invention. detailed description
  • This technology requires terminal support during implementation. Therefore, it can only be used on certain terminals that can support the technology. It cannot be guaranteed to be used on all terminals, thus limiting the scope of users. In addition, if users have Several different terminals, and one of the terminals does not support the technology, which will result in the digital content that the user needs cannot be shared among different terminals, thereby affecting the user experience.
  • the security is relatively low, once the encrypted content packet is cracked by the attacker, the attacker can propagate the original digital content, and its propagation is not under any control.
  • the current digital watermarking technology forms a digital watermark according to specific information or feature values of the digital content, and embeds the digital watermark in the digital content.
  • the digital watermark can be detected to determine whether the digital content is legal. In order to control the spread of digital content.
  • the digital content after the digital content is embedded in the digital watermark, the digital content will be distorted, and the size of the digital content will become larger, thereby affecting the user experience.
  • the digital content to be detected when detecting whether the digital content is illegal content, extracting the feature value from the original digital content, extracting the feature value from the digital content to be detected, and setting the feature value of the original digital content and the feature value of the digital content to be detected. Comparing, determining whether the digital content to be detected is consistent with the original digital content according to the comparison result, and further determining whether the digital content to be detected is illegal content according to the user policy.
  • a consistency detection process for digital content is as shown in FIG. 1 , including:
  • Step 10 Extract feature values from the original digital content.
  • Step 11 Extract feature values from the digital content to be detected.
  • Step 12 Compare the feature value of the original digital content with the feature value of the digital content to be detected.
  • Step 13 Determine, according to the comparison result, whether the digital content to be detected is consistent with the original digital content.
  • the acquisition of the original digital content can be performed in various ways.
  • the user can submit the original digital content through a management station, and the management station can be operated by a website, a GUI (Graphical User Interface) client, a command line, and the like.
  • the management station can provide the user with a copyright management interface for digital content; for example, the user can set a database for storing the original digital content, and obtain the original number from the database when the original digital content needs to be extracted. content.
  • the digital content to be detected can also be obtained in a variety of ways, and the user can use the letter related to the original digital content.
  • Search for information and obtain digital content to be detected from a network or other storage and forwarding device.
  • the implementation can use the existing search engine to search, or use the existing technology to develop the digital content collection engine for retrieval. Since the retrieval is based on the information related to the original digital content, the operation of acquiring the digital content to be detected is itself a preliminary screening to check whether the digital content is consistent with the original digital content.
  • the information related to the original digital content may be the identification information of the original digital content, the user first obtains the identification information of the original digital content, and then acquires the digital content to be detected according to the identification information of the original digital content.
  • the original digital content and the digital content to be detected need to be described using text, so it is more suitable for retrieval and retrieval of documents.
  • the identification information of the original digital content may be the author of the original digital content, the actor, the director, the media type, the media size, and the like, or may be the description information of the original digital content episode, and the specific identification information may be pre-customized into one or more types. And can be combined according to certain logic.
  • the page that meets the condition may be retrieved according to the identification information of the original digital content, and the URI (Universal Resource Identifier) address of the digital content to be detected is stripped from the page, first according to the URI address.
  • URI Universal Resource Identifier
  • the process of obtaining digital content to be detected from a store-and-forward device is similar.
  • the digital content to be processed is obtained according to the identification information of the original digital content, it is not necessary to parse the original digital content, and only the original digital content and the digital content to be processed are described using text.
  • the identification information because of its large amount of information, it is often impossible to use the identification information for accurate description, the accuracy of the retrieval is low, and the retrieval result often contains a large amount of irrelevant content.
  • the specific content of the identification information is strictly restricted, the digital content to be detected that is actually needed is often missed.
  • the digital content of multimedia types on the Internet is generated in large quantities every day.
  • the feature value may be extracted from the original digital content, and the digital content to be detected is obtained according to the feature value of the original digital content, so as to enhance the real-time and accuracy of the retrieval.
  • the media type of the original digital content may be determined first, and then the feature values are extracted from the original digital content according to the media type of the original digital content.
  • the method for extracting the feature value from the digital content to be detected is similar to the method for extracting the feature value from the original digital content, and may first determine the media type of the digital content to be detected, and then from the digital content to be detected according to the media type of the digital content to be detected. Extract feature values.
  • the digest feature value of the complete digital content or part of the digital content may be extracted during implementation, and the subsequent comparison between the original digital content and the digest feature value of the digital content to be detected may be performed to determine whether the digital content to be detected is consistent with the original digital content.
  • the digital content is generally a media file, and can be divided into two parts: a file header and a file body.
  • the file header mainly includes text description information, and is easy to be modified. Generally, the modification does not affect the use of the file. Therefore, in the embodiment of the present invention, Some or all of the file bodies are extracted from the summary feature values, wherein the summary algorithm may select a summary algorithm that is disclosed by MD5, SHA-1, and the like. For different digital content, since the probability that the digest feature values are the same is low, once the digest feature values are the same, it can be considered that the digital content to be detected is consistent with the original digital content.
  • Each piece in the slice is extracted from the summary feature value.
  • the summary feature value can be stored, for example, stored in a feature value library. Referring to Table 1, a feature value storage schematic table is provided.
  • the CID represents the number of the digital content
  • 1... M represents the corresponding feature values obtained by extracting the digest feature values from the sequentially extracted M digital content segments.
  • the content retrieval methods used are not identical, depending on the type of media.
  • the content feature value extraction methods for different types of digital content are respectively provided below.
  • the image itself has a multifaceted visual feature that includes texture and sub-object space bits in addition to color and shape features. Set relationships, etc. Using these visual features, commonly used image content feature extraction methods are:
  • Color feature value extraction Colors are often closely related to objects and scenes in the image. The color features are less dependent on the size, orientation, and viewing angle of the image itself, and thus have higher robustness.
  • Texture feature is a visual feature that reflects the homogeneity phenomenon in the image without depending on color or brightness. It includes the structure of the image surface and the relationship between the surrounding environment. It is customary to have local irregularities and overall Regular characteristics are called textures. You can match suspicious digital content by submitting an image containing a texture to find other images with similar textures.
  • Shape feature is the main information to identify the object. The shape does not change with the change of displacement, rotation and shear. It is an important means for image feature extraction.
  • Image spatial feature eigenvalue extraction Colors, textures, and shapes reflect the overall characteristics of the image and do not reflect the objects and objects contained in the image. In fact, the spatial relationship between the location of the object in the image and the object is also a very important feature in image retrieval.
  • image content feature value extraction techniques are all mature technologies, and are not described in detail in the embodiments of the present invention.
  • one or more image content feature value extraction methods may be used to reduce the missed detection rate and improve the accuracy of matching.
  • Audio retrieval is a search for waveform sounds.
  • the audio here can be natural sounds such as car engine sounds, rain sounds, and bird sounds. It can also be voice and music. These audios are all retrieved using acoustic features.
  • the audio content feature value extraction can extract the content feature value of the entire audio, and can also extract the content feature value of the partial audio such as the background sound and the voice.
  • the audio is first segmented before the audio content feature value is extracted, and the audio is segmented by acoustic analysis of the signal and finding the transition point of the sound.
  • the climax portion may be manually extracted as the audio content feature value, or the computer may automatically extract the portion as the audio content feature value according to the configured policy.
  • the acoustic analysis of the signal and the search for the transition point are mature technologies, which are not described in the embodiment of the present invention.
  • the complete video consists of video tracks and audio tracks and subtitles.
  • the extraction of video content feature values can be converted into audio, image, and text content feature values.
  • the audio track is independent of audio, and the extraction method is the same as the extraction of the audio content feature values.
  • the video signal is a continuous streaming media signal, which is composed of consecutive frames.
  • video key frames I frames
  • video content feature values are extracted in units of frames.
  • the content feature values can be extracted from some key frames without extracting the content feature values of all the key frames.
  • a fast time-based algorithm may be used when extracting the feature values, for example, the feature value may be performed according to the time period. Extract.
  • a video stream is IPVIPPVI..., taking a time length T from a continuous video stream, and including one frame (including I frame, ⁇ frame, V frame, etc.) in the time period , then it can be within the time period ⁇
  • the frame extracts the feature values.
  • feature value extraction can be performed at time intervals.
  • the feature value is extracted from the original digital content within a first duration
  • the media type of the digital content to be detected is a streaming media type
  • Extracting the feature value from the digital content to be detected every second time subsequently comparing the feature value extracted by the second time length of the digital content to be detected with all the feature values extracted by the original digital content in the first duration, according to the comparison result Determine whether the digital content to be detected is consistent with the original digital content.
  • the first duration is greater than the second duration. If the digital content to be detected does have the same feature value as the original digital content, at least the feature value extracted from the digital content to be detected is at least every second time when the comparison is performed. One is the same as the feature value extracted from the original digital content within the first duration.
  • the feature value extracted from the digital content of the streaming media type may be a summary feature value or a content feature value.
  • some frames of the original digital content such as video key frames, may be extracted, and the feature values are extracted and sequentially stored for each frame.
  • the retrieved frames in the data stream corresponding to the digital content to be detected are sequentially intercepted, and the extracted feature values are extracted, and compared with the stored feature values of the original digital content.
  • the video key frame may be extracted from the original digital content in the first time duration, and the feature value of the original digital content video key frame may be further extracted; the video key frame is extracted from the digital content to be detected every second time, And further extracting feature values of the key frame of the digital content video to be detected.
  • the content feature values may be also possible to extract the content feature values using the frame and the V frame.
  • the information contained in the I frame is large, it is recommended to use the I frame.
  • the feature values of all I frames within one or more consecutive T1 durations may be extracted from the original digital content (which may include summary feature values and content feature values).
  • the feature value is extracted from the digital content to be detected, one frame or several frames are extracted from the data stream corresponding to the digital content to be detected every time ⁇ 2, and the feature value is extracted.
  • ⁇ 2 ⁇ 1 if there is a segment in the digital content to be detected that is identical to the original digital content in the T1 time period, at least one of the frames extracted from ⁇ 2 falls within T1.
  • the first I frame may be extracted every time ⁇ 2, and the eigenvalue of the I frame is calculated, and compared with the eigenvalues of all the I frames in T1, if the number of identical I frame eigenvalues exceeds the threshold, the number to be detected may be considered.
  • the content is consistent with the original digital content.
  • the size of Tl, ⁇ 2 can be defined according to the actual performance of the system, and the size of ⁇ 2 can be dynamically adjusted to maintain the balance between system processing performance and detection rate.
  • timing playback/fast forward/fast reverse can be used, and each time the hop 2 time is extracted and the feature value of the first frame number is extracted and detected ( ⁇ 2 ⁇ 1), which ensures the detection. Efficiency and performance, without waiting, improves detection speed and reduces latency.
  • the extracted digest feature value of the original digital content may be stored, for example, stored in a feature value library, and after extracting the digest feature value from the digital content to be detected, The digest feature value of the digital content to be detected is compared with the digest feature value of the stored original digital content. Specifically, as shown in FIG. 3, in one embodiment, by comparing the original digital content and the digest feature value of the digital content to be detected, the process of determining whether the digital content to be detected is consistent with the original digital content is as follows:
  • Step 31 sequentially store the extracted feature value of the extracted original digital content.
  • Step 33 Compare the digest feature values of the stored original digital content one by one with the digest feature values of the digital content to be detected.
  • the extracted M-slice eigenvalues of the content to be detected are A [wide M]
  • the M-slice eigenvalues of the original content extracted by the first extraction module are respectively ⁇ [ ⁇ ]
  • the following manner: For each element a in the set ⁇ and for each element b in the set , a comparison method is adopted, and if a b occurs, the set counter performs an accumulation action.
  • Step 34 Determine, according to the comparison result, the number of the summary feature values of the digital content to be detected that is the same as the digest feature value of the original digital content.
  • Step 35 When the number of digest feature values of the digital content to be detected that is the same as the digest feature value of the original digital content exceeds a threshold, determine that the digital content to be detected is consistent with the original digital content.
  • the digital content to be detected may be determined The original digital content is consistent. If the extracted original digital content and the feature value of the digital content to be detected are multiple, the feature value of the original digital content may be compared with the feature value of the digital content to be detected one by one, and then determined and original according to the comparison result. The number of feature values of the digital content to be detected having the same feature value of the digital content, when the number exceeds the threshold, determining that the digital content to be detected is consistent with the original digital content.
  • the extracted feature value may be a summary feature value or a content feature value.
  • the comparison using the summary feature values is an exact comparison, and the digital content is easily converted, cut, and edited during the propagation process. Therefore, when the summary feature values are simply used for comparison, The rate of missed detection is large. At this time, other detection means need to be added to enhance the intensity of the detection.
  • the comparison fails according to the summary feature value, the content feature value is used for further comparison.
  • the digest feature values of the original digital content are compared with the digest feature values of the digital content to be detected one by one, and according to the comparison result, the number of digest feature values of the digital content to be detected that is the same as the digest feature value of the original digital content is determined, Determining that the digital content to be detected is consistent with the original digital content when the number of digest feature values of the digital content to be detected that is the same as the digest feature value of the original digital content exceeds a threshold; the number to be detected is the same as the digest feature value of the original digital content When the number of the summary feature values of the content does not exceed the threshold, the content feature values of the original digital content are further compared with the content feature values of the digital content to be detected one by one, and the content feature values of the original digital content are determined to be the same according to the comparison result.
  • the number of content feature values of the digital content to be detected is determined to be consistent with the original digital content when the number of content feature values of the digital content to be detected that is the same as the content feature value of the original digital
  • whether the digital content to be detected is illegal digital content may be determined according to a user policy. For example, a user can submit a URI address of a legitimate service provider in advance through a management station for copyright management of digital content. After obtaining the digital content to be detected, the URI address of the digital content to be detected is extracted, and compared with the legal URI address submitted by the user. If the information is the same, the digital content to be detected may be considered legal, and the subsequent feature value extraction and comparison are not necessary.
  • the operation if different, continues to perform the feature value extraction and comparison operation, and further determines that the digital content to be detected is illegal content when determining that the digital content to be detected is consistent with the original digital content.
  • the comparison of URI addresses can also be done after the comparison of the eigenvalues.
  • the process of determining whether the digital content to be detected is consistent with the original digital content is as follows:
  • Step 40 Acquire original digital content, extract feature values from the original digital content, and store, where the extracted summary feature value and the content feature value are extracted.
  • Step 41 Acquire a URI address of the digital content to be detected according to the identification information or the feature value of the original digital content.
  • Step 42 Compare the URI address of the digital content to be detected with the legal URI address submitted by the user in advance. If the same, perform step 410 to end the entire process. If not, perform step 43.
  • Step 43 Obtain the attribute and digital content of the digital content according to the URI address of the digital content to be detected, and determine the media type (image, audio, video, game, document or other) of the digital content to be detected according to the attribute.
  • the summary feature value is extracted according to the media type of the digital content to be detected.
  • Step 44 Compare the extracted digest feature value with the digest feature value of the original digital content stored in advance, and determine the number of the same digest feature value.
  • Step 45 Determine whether the number of the same eigenvalues exceeds a certain threshold. If the number of the same eigenvalues exceeds a certain threshold, go to step 46. Otherwise, go to step 47.
  • Step 46 Determine that the digital content to be detected is consistent with the original digital content, and further consider that the digital content to be detected is illegal digital content.
  • the original content to be detected and the corresponding URI address, and the original used when acquiring the digital content to be detected The identification information or feature values of the digital content are stored, for example, archived to a library of suspected digital content.
  • the consistency level of the digital content to be detected and the original digital content may be determined according to the number of feature values of the digital content to be detected that are the same as the feature value of the original digital content. For example, the consistency is graded according to the same scale size of the summary feature values. The higher the ratio, the higher the level, indicating that the digital content to be detected is closer to the original digital content, that is, the more suspicious the digital content to be detected.
  • Step 47 When the number of the same feature value does not exceed the ratio, the content feature value of the digital content to be detected is extracted.
  • Step 48 Compare the content feature value of the digital content to be detected with the content feature value of the stored original digital content, and determine the number of the same content feature value.
  • Step 49 Determine whether the number of the same content feature value exceeds a certain threshold. If the number of the same content feature value exceeds a certain threshold, proceed to step 46, and consider that the digital content to be detected is an illegal digital suspect content, and the number to be detected is The content and the corresponding URI address, the identification information or the feature value of the original digital content used to obtain the digital content to be detected are stored, and the consistency level of the digital content to be detected and the original digital content may be determined according to the same number of the summary feature values. . If the number of the same content feature value does not exceed the threshold, step 410 is performed to end the entire process, and the digital content to be detected is inconsistent with the original digital content, and the digital content to be detected is legal digital content.
  • the digital content stored in the suspicious digital content library can be manually identified, and the digital content with high suspiciousness can be preferentially identified according to the consistency level.
  • the digital content to be detected is stored in the suspicious digital content library, part of the digital content can be recorded without having to store all the digital content.
  • the digital content originating from the address may be determined to be consistent with the original digital content according to the address of the digital content to be detected; or, depending on the address of the digital content to be detected, the pair may be rejected. Access to this address.
  • the URI address where the illegal digital content is located may be transmitted to the content distribution system through the interface between the management station and the content distribution system, and the content distribution system limits and Filter the distribution of illegal digital content.
  • the illegal URI address can be passed to the WAP GW (Wireless Application Protocol, GateWay, gateway) or other WAP control device, and the WAP GW filters the illegal URI to restrict the user's access to the illegal URI. Thereby protecting the interests of legitimate content owners.
  • WAP GW Wireless Application Protocol, GateWay, gateway
  • the processing flow for controlling access to digital content is as shown in FIG. 6, and includes:
  • Step 60 Identify a URI link of the illegal digital content, and the specific identification process is as described in the foregoing embodiment method.
  • Step 61 Synchronize the URI link of the illegal digital content to the URI address library of the illegal digital content of the content distribution system.
  • Step 62 When the terminal accesses the URI link, check the URI link to confirm whether the URI link is in the URI address library of the illegal digital content. For example, in the mobile WAP, when the URI link is accessed through the WAP GW, the URI link is checked by the WAP GW.
  • Step 63 When checking that the URI is linked in the URI address library of the illegal digital content, the access to the URI link is denied to restrict the propagation of the illegal digital content.
  • the feature value of the original digital content may be further stored; after determining that the digital content to be detected is consistent with the original digital content, the stored feature value of the original digital content is further replaced with
  • the feature value of the digital content to be detected is used for consistency detection of subsequent digital content. For example, after the digital content is identified, if the digital content is found to be illegal/pirated content, and after certain editing/modification/cutting/editing, etc., the feature value of the "illegal/pirated content" can be replaced.
  • the feature value of the original digital content is used as a feature value for comparison by the subsequent system, so that a similar suspicious URI address can be found in the feature value extraction stage more quickly, and the detection rate is improved.
  • the method for detecting consistency of digital content extracts feature values from original digital content when detecting whether the digital content is illegal content, and extracts feature values from the digital content to be detected, and the original The feature value of the digital content is compared with the feature value of the digital content to be detected, and it is determined whether the digital content to be detected is consistent with the original digital content according to the comparison result, and then the digital content to be detected is determined to be illegal content according to the user policy, because Extracting feature values directly from the original digital content and the digital content to be detected for comparison without embedding other information in the digital content, without affecting the size of the digital content, without affecting the user experience; and, detecting the process and controlling the propagation process of the digital content Phase separation, independent of a specific network, does not require real-time detection; in addition, the detection process of extracting feature values for comparison is independent of the terminal, and does not require modification of the existing terminal, and the implementation cost is low; since no encryption/authorization technology is adopted, Avoided detection When an
  • an embodiment of the present invention further provides a digital content consistency detecting apparatus.
  • the apparatus includes: a first extraction module 70, a second extraction module 71, a comparison module 72, and a first determination.
  • the first extraction module 70 is configured to extract feature values from the original digital content;
  • the second extraction module 71 is configured to extract feature values from the digital content to be detected;
  • the comparison module 72 is configured to use the original digital content.
  • the feature value is compared with the feature value of the digital content to be detected.
  • the first determining module 73 is configured to determine, according to the comparison result, whether the digital content to be detected is consistent with the original digital content.
  • the apparatus shown in FIG. 7A may further include: a first obtaining module 74 for acquiring identification information of the original digital content; and a second obtaining module 75, configured to acquire the to-be-detected number according to the identification information of the original digital content. content.
  • the apparatus shown in FIG. 7A may further include: a third obtaining module 76, configured to acquire the digital content to be detected according to the feature value of the original digital content.
  • the first extraction module 70 may include: a first determining unit 701, configured to determine a media type of the original digital content; a first extracting unit 702, configured to use the original digital number according to the media type of the original digital content. Extracting the feature value from the content; the second extraction module 71 may include: a second determining unit 711, configured to determine the digital content to be detected The media type; the second extracting unit 712 is configured to extract feature values from the digital content to be detected according to the media type of the digital content to be detected.
  • the first determining unit 701 may be further configured to determine that the media type of the original digital content is a streaming media type; the first extracting unit 702 may be further configured to extract the feature value from the original digital content within the first duration; the second determining unit 711 The second extraction unit 712 may be further configured to extract a feature value from the digital content to be detected every second time period, where the media type of the digital content to be detected is a streaming media type; wherein, the first duration is greater than the first duration Two hours long.
  • the first extracting unit 702 may further include: a first extracting subunit 7021, configured to extract a video key frame from the original digital content in a first duration; and a second extracting subunit 7022, configured to extract the original digital content video
  • the second extraction unit 712 further includes: a third extraction subunit 7121, configured to extract a video key frame from the digital content to be detected every second time; the fourth extraction subunit 7122, configured to extract the to-be-detected Detecting feature values of digital content video keyframes.
  • the comparison module 72 can be further configured to compare the feature value extracted every second time period of the digital content to be detected with all feature values extracted by the original digital content within the first duration.
  • the comparison module 72 may be further configured to compare the feature values of the original digital content one by one with the feature values of the digital content to be detected;
  • the module 73 may include: a third determining unit 731, configured to determine, according to the comparison result, the number of feature values of the digital content to be detected that is the same as the feature value of the original digital content; the fourth determining unit 732, configured to When the number of feature values of the digital content to be detected with the same feature value of the original digital content exceeds a threshold, it is determined that the digital content to be detected is consistent with the original digital content.
  • the comparing module 72 may include: a first comparing unit 721, configured to compare the digest feature value of the original digital content one by one with the digest feature value of the digital content to be detected; The third determining unit 731 is further configured to determine, according to the comparison result, the number of digest feature values of the digital content to be detected that is the same as the digest feature value of the original digital content; the fourth determining unit 732 further uses the digest feature When the number of the values exceeds the threshold, the digital content to be detected is determined to be consistent with the original digital content.
  • the comparison module 72 may further include: a second comparing unit 722, configured to: when the number of the summary feature values does not exceed the threshold The content feature value of the original digital content is compared with the content feature value of the digital content to be detected one by one; at this time, the third determining unit 731 is further configured to determine, according to the comparison result, the same to be detected as the content feature value of the original digital content. The number of content feature values of the content; the fourth determining unit 732 is further configured to The number of said content feature value exceeds the threshold value, the detection of the digital content is determined to be identical to the original digital content.
  • the third determining unit 731 is further configured to determine a level of consistency of the digital content to be detected and the original digital content based on the number of feature values of the digital content to be detected that are the same as the feature value of the original digital content.
  • the apparatus shown in FIG. 7A may further include: a second determining module 77, configured to determine the number to be detected The address of the word content, determining that the digital content originating from the address is consistent with the original digital content.
  • the apparatus shown in FIG. 7A may further include: a processing module 78, for denying access to the address according to an address of the digital content to be detected.
  • the apparatus shown in FIG. 7A may further include: a storage module 79 for storing feature values of the original digital content; and a comparison module 72 for further using the feature values of the digital content to be detected and the stored original digital content.
  • the feature value is compared; the replacement module 710 is configured to replace the stored feature value of the original digital content with the feature value of the digital content to be detected after determining that the digital content to be detected is consistent with the original digital content.
  • the storage medium can include: ROM, RAM, Disk or disc, etc.
  • the embodiment of the present invention is different from the existing digital watermarking technology,
  • the feature values are directly extracted from the original digital content and the digital content to be detected during the detection, without embedding other information in the digital content, so the size of the digital content is not affected, and the user experience is not affected; and the detection process and the control number are The content propagation process is separated, and does not depend on a specific network, and no real-time detection is required.
  • the embodiment of the present invention is different from the existing encryption/authorization technology, and the detection process of extracting feature values for comparison is independent of the terminal, and does not need to be Existing terminal to change
  • the suspicious degree of the digital content to be detected may be determined in the detecting process, and the extraction and comparison of the digest feature values may be combined with the extraction and comparison of the content feature values to determine the consistency of the digital content. , improve the performance and accuracy of the test.
  • the fast algorithm used can further improve system performance.
  • the URI address where the illegal digital content is located may be transmitted to the content distribution system through the interface between the management station and the content distribution system, and the content distribution system limits and filters the illegal digital content. distribution.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Technology Law (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Storage Device Security (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

数字内容的一致性检测方法及装置 技术领域
本发明涉及数字版权管理技术领域, 尤其涉及数字内容的一致性检测方法及装置。 背景技术
数字版权管理 (Digital Rights说 Management , DRM) 主要通过权利限制和内容保护方案 控制数字内容的使用, 保护内容所有者的合法权益。
目前, 现有的数字版权管理提供了一种加密 /授权技术: 在服务器侧, 由数字内容的发行 者 (Content Issuer, CI ) 将数字内容加密、 打包,书并下发加密的数字内容数据包; 由许可 服务器 (Rights Issuer, RI ) 负责下发与数字内容相对应的许可证, 其中包括内容加密密钥 及对应的权限。 在客户端侧, 设备只有同时拥有内容数据包和许可证, 才能正常使用所购买 的数字内容。用户将加密的数字内容数据包及对应的许可证下载到 DRM终端(DRM Agent )后, 终端设备利用设备的私钥解密得到许可加密密钥, 进而得到许可证中的内容加密密钥以解密 数字内容, 并根据许可证中的权限信息控制用户对数字内容的具体使用。 发明内容
为了确定待检测数字内容是否为非法数字内容, 有效地控制数字内容的传播, 本发明实 施例提供一种数字内容的一致性检测方法及装置, 其中,
本发明实施例提供一种数字内容的一致性检测方法, 该方法包括步骤:
从原始数字内容中提取特征值;
从待检测数字内容中提取特征值;
将原始数字内容的特征值与待检测数字内容的特征值进行比较;
根据比较结果确定待检测数字内容与原始数字内容是否一致。
本发明实施例提供一种数字内容的一致性检测装置, 包括:
第一提取模块 (70), 用于从原始数字内容中提取特征值;
第二提取模块 (71 ), 用于从待检测数字内容中提取特征值;
比较模块(72), 用于将所述第一提取模块(70)提取的原始数字内容的特征值与所述第 二提取模块 (71 ) 提取的待检测数字内容的特征值进行比较; 第一确定模块(73), 用于根据所述比较模块(72 ) 的比较结果确定待检测数字内容与原 始数字内容是否一致。
本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储计算机程序, 该程序可使得处理器执行如下歩骤:
从原始数字内容中提取特征值;
从待检测数字内容中提取特征值;
将原始数字内容的特征值与待检测数字内容的特征值进行比较;
根据比较结果确定待检测数字内容与原始数字内容是否一致。
本发明实施例中, 在检测数字内容是否为非法内容时, 从原始数字内容中提取特征值, 从待检测数字内容中提取特征值, 将原始数字内容的特征值与待检测数字内容的特征值进行 比较, 根据比较结果确定待检测数字内容与原始数字内容是否一致, 进而可以根据用户策略 确定待检测数字内容是否为非法内容。 附图说明
图 1为本发明实施例中数字内容的一致性检测流程图;
图 2为本发明实施例中提取数字内容的摘要特征值的示意图;
图 3为本发明实施例中通过比较摘要特征值确定数字内容一致性的处理流程图; 图 4为本发明实施例中通过比较摘要特征值和内容特征值确定数字内容一致性的处理流 程图;
图 5为本发明实施例中限制和过滤非法数字内容分发的示意图;
图 6为本发明实施例中对数字内容的访问进行控制的处理流程图;
图 7A、 图 7B、 图 7C、 图 7D、 图 7E、 图 7F为本发明实施例中数字内容的一致性检测装 置的结构示意图。 具体实施方式
发明人经过分析, 发现该现有技术存在如下不足之处:
一、该技术在实施时需要终端支持, 因此只能在某些能够支持该技术的特定终端上使用, 无法保证在所有的终端上均可使用, 从而限制了用户的范围, 另外, 用户如果有几种不同的 终端, 而其中某个终端不支持该技术, 将导致用户需要的数字内容无法在不同的终端间共享, 进而影响用户体验。
二、 该技术在实施时与已有系统的耦合度较大, 需要对已有系统进行较大改造, 成本较 高。
三、 安全性相对较低, 一旦加密的内容数据包被攻击者所破解, 攻击者就可以传播原始 的数字内容, 并且其传播不受任何控制。
目前的数字水印技术: 根据数字内容的特定信息或特征值形成数字水印, 并将数字水印 嵌入数字内容中, 当数字内容通过运营商的网络传播时, 可以通过检测数字水印来判断数字 内容是否合法, 以此控制数字内容的传播。
发明人经过分析, 发现通过该技术无需终端进行特殊改造, 即可保证在所有的终端上均 可使用, 并且可在不同终端间共享数字内容, 但是, 仍然存在如下不足之处:
一、 由于数字水印技术对数字内容的传播过程进行控制, 即控制数字内容是否能够通过 运营商的网络进行传播, 因此检测过程必须依赖于特定的运营商网络, 才能够对数字内容的 传播起到控制作用。
二、 为了控制数字内容的传播, 对所有的数字内容都必须进行实时检测, 否则无法判断 数字内容中是否包含有数字水印, 并且, 由于检测在内容转发过程中进行, 因此对检测时延 要求严格, 对系统性能要求较高。
三、 数字内容嵌入数字水印后, 会引起数字内容失真、 数字内容的大小将会变大, 从而 影响用户体验。
本发明实施例中, 在检测数字内容是否为非法内容时, 从原始数字内容中提取特征值, 从待检测数字内容中提取特征值, 将原始数字内容的特征值与待检测数字内容的特征值进行 比较, 根据比较结果确定待检测数字内容与原始数字内容是否一致, 进而可以根据用户策略 确定待检测数字内容是否为非法内容。
本发明实施例中, 一种数字内容的一致性检测流程如图 1所示, 包括:
步骤 10、 从原始数字内容中提取特征值。
步骤 11、 从待检测数字内容中提取特征值。
步骤 12、 将原始数字内容的特征值与待检测数字内容的特征值进行比较。
步骤 13、 根据比较结果确定待检测数字内容与原始数字内容是否一致。
原始数字内容的获取可以采用多种方式, 例如, 用户可以通过一管理台提交原始数字内 容, 该管理台可以以网站、 GUI (Graphical User Interface, 图形用户界面) 客户端、 命令 行等方式运行, 当然, 该管理台可以为用户提供数字内容的版权管理界面; 又如, 用户可以 设置一数据库, 用于存储原始数字内容, 当需要对原始数字内容进行提取操作时, 从该数据 库中获取原始数字内容。
而待检测数字内容的获取也可以采用多种方式, 用户可以根据与原始数字内容相关的信 息进行检索, 从网络或其它存储转发设备获取待检测数字内容。 实施时可以利用现有的搜索 引擎进行检索, 也可以利用已有技术自行开发数字内容的采集引擎进行检索。 由于是根据与 原始数字内容相关的信息进行检索, 获取待检测数字内容的操作本身即是对待检测数字内容 与原始数字内容是否具有一致性的初步筛选。
与原始数字内容相关的信息可以是原始数字内容的标识信息, 用户先获取原始数字内容 的标识信息, 再根据原始数字内容的标识信息获取待检测数字内容。 实施时, 原始数字内容 和待检测数字内容需要使用文字进行描述, 因此较适合于文档的检索和获取。 原始数字内容 的标识信息可以是原始数字内容的作者、 演员、 导演、 媒体类型、 媒体大小等信息, 也可以 是原始数字内容情节的描述信息, 具体标识信息可以预先定制为一种或多种, 并且可以按照 一定的逻辑进行组合。
从网络获取待检测数字内容时, 可以根据原始数字内容的标识信息检索出符合条件的页 面, 从页面中剥离出待检测数字内容的 URI (Universal Resource Identifier, 统一资源标 识) 地址, 先根据 URI地址获取到待检测数字内容, 后续再进行提取特征值等操作; 对于流 媒体类型的数字内容, 由于数字内容一般是实时播放的,因此在剥离出待检测数字内容的 URI 地址后, 可以先将该 URI地址进行存储, 待后续需要从待检测数字内容中提取特征值时, 再 根据存储的 URI地址实时获取待检测数字内容以进行特征值的提取操作。 从存储转发设备获 取待检测数字内容的过程与此类似。
上述根据原始数字内容的标识信息获取待处理数字内容时, 无需解析原始数字内容, 只 需使用文字对原始数字内容和待处理数字内容进行描述。但是, 对于多媒体类型的数字内容, 由于其信息量大、 因此往往无法使用标识信息进行精确的描述, 检索的准确度较低, 检索结 果中往往包含大量不相关内容。 而如果严格限制标识信息的具体内容, 又往往漏检真正所需 的待检测数字内容。 当前 Internet上的多媒体类型的数字内容每天均以海量生成, 如果检索 的准确度不高, 检索到的不相关数字内容的数量会很大, 完全靠人工进一步辨别所需的工作 量大、 实时性差。 因此, 本发明实施例中, 也可以先从原始数字内容中提取特征值, 再根据 原始数字内容的特征值获取待检测数字内容, 以增强检索的实时性和准确率。
从原始数字内容中提取特征值时, 可以先确定原始数字内容的媒体类型, 再根据原始数 字内容的媒体类型从原始数字内容中提取特征值。 从待检测数字内容中提取特征值的方法与 从原始数字内容中提取特征值的方法类似, 可以先确定待检测数字内容的媒体类型, 再根据 待检测数字内容的媒体类型从待检测数字内容中提取特征值。
由于数字内容有图像、 声音、 视频多种媒体类型, 每种图像、 声音、 视频又有多种编码 格式和文件格式, 因此目前没有一种统一的特征值抽取方法, 能够适用于所有数字内容的特 征值抽取。 本发明实施例中, 针对各种格式, 在充分考虑实施时系统性能的基础上, 提供如 下特征值抽取方法:
一、 提取摘要特征值
实施时可以提取完整数字内容或者部分数字内容的摘要特征值, 后续可以通过比较原始 数字内容和待检测数字内容的摘要特征值, 确定待检测数字内容与原始数字内容是否一致。
数字内容一般为媒体文件, 可以分为文件头和文件体两部分, 文件头主要包含文本描述 信息, 且容易被修改, 修改后一般不影响文件的使用, 因此, 本发明实施例中, 考虑对部分 或全部文件体进行摘要特征值的提取, 其中, 摘要算法可以选择 MD5、 SHA-1等公开的摘要算 法。 对于不同的数字内容, 由于其摘要特征值相同的概率较低, 因此一旦摘要特征值相同, 即可认为是待检测数字内容与原始数字内容一致。
如图 2所示, 在提取数字内容的摘要特征值的示意图中, 提取时可以对数字内容体进行 分片, 分成 N片, 然后顺序抽取 M片 (步长 =N/M), 对 M片中的每片进行摘要特征值的提取, 提取后, 可以将摘要特征值进行存储, 如存储至一特征值库, 参见表 1, 提供了一种特征值 存储示意表。
表 1
Figure imgf000007_0001
如表 1所示, 该存储方式下, CID代表了数字内容的编号, 1…… M分别代表了对顺序抽 取的 M个数字内容分片进行提取摘要特征值后得到的对应的特征值。
二、 提取内容特征值
对于数字内容, 根据媒体类型的不同, 所采用的内容检索方法不完全相同。 下面分别提 供不同类型的数字内容的内容特征值提取方法。
1、 图像内容特征值提取
图像本身拥有多方面的视觉特征, 除了颜色、 形状特征外, 还包含纹理和子对象空间位 置关系等。 利用这些视觉特征, 常用的图像内容特征值提取方法有:
颜色特征值提取: 颜色往往和图像中的物体和场景有着紧密联系。 颜色特征对图像本身 的尺寸、 方向、 视角的依赖性较小, 从而具有较高的鲁棒性。
纹理特征值提取: 纹理特征是一种不依赖于颜色或亮度的反映图像中同质现象的视觉特 征, 它包含了图像表面的结构安排及周围环境的关系, 习惯上把局部不规则而整体有规律的 特性称之为纹理。 可以通过提交包含有某种纹理的图像来查找含有相似纹理的其他图像, 从 而匹配出可疑数字内容。
形状特征值提取: 形状特征是识别物体的主要信息, 形状不随位移、 旋转、 剪切的变化 而变化, 是用于图像特性提取的重要手段。
图像的空间关系特征值提取: 颜色、 纹理和形状反映的是图像的整体特征, 无法体现图 像中包含的对象和物体。 事实上, 图像中对象所在的位置和对象之间的空间关系同样是图像 检索中非常重要的特征。
上述图像内容特征值提取技术均为成熟的技术, 本发明实施例中不再赘述。 在实际使用 中, 可以使用一种或多种图像内容特征值提取方法, 降低漏检率、 提高匹配的准确性。
2、 音频内容特征值提取
音频检索是以波形声音为对象的检索, 这里的音频可以是汽车发动机声、 雨声、 鸟叫声 等自然界声音, 也可以是语音和音乐等, 这些音频都统一用声学特征来检索。 音频内容特征 值提取可以提取整个音频的内容特征值, 也可以提取背景音、语音等部分音频的内容特征值。
在音频内容特征值提取前首先对音频进行分割, 通过信号的声学分析并查找声音的转变 点就可以实现音频的分割。 对分割出的片段, 可以由人工抽取出高潮部分作为音频内容特征 值, 也可以根据配置的策略由计算机自动抽取部分作为音频内容特征值。
信号的声学分析和转变点的查找为成熟技术, 本发明实施例中不再赘述。
3、 视频内容特征值提取
完整的视频由视频轨和音轨、 字幕组成, 视频内容特征值的提取可以转换为音频、 图像、 文字内容特征值的提取。 音轨是独立的音频, 提取方法同音频内容特征值的提取。
视频信号为连续流媒体信号, 是由连续的帧组成的, 对于视频可以提取视频关键帧 (I 帧), 以帧为单位提取视频内容特征值。 当然, 由于视频信号信息量、 数据量大, 可以从部分 关键帧中抽取内容特征值, 而无需抽取所有关键帧的内容特征值。
对于流媒体类型的数字内容, 其信息量大, 完全获取到本地再进行特征值的提取需要海 量存储空间, 代价较大。本发明实施例中, 考虑到流媒体类型的数字内容在时间上是连续的, 因此在进行特征值的提取时可以采用基于时间的快速算法, 如, 可以按照时间段进行特征值 提取。 假设一段视频流为 I P V I P P V I……, 从连续的视频流中取时长 T, 在时间段 Τ内 包含 Ν个帧 (包括 I帧、 Ρ帧、 V帧等), 则可以对该时间段 Τ内的帧进行特征值的提取。 又 如, 可以按照时间间隔进行特征值提取。
一个实施例中, 当确定原始数字内容的媒体类型为流媒体类型时, 在第一时长范围内从 原始数字内容中提取特征值, 当确定待检测数字内容的媒体类型为流媒体类型时, 每隔第二 时长从待检测数字内容中提取特征值; 后续将待检测数字内容每隔第二时长提取的特征值与 原始数字内容在第一时长范围内提取的所有特征值进行比较, 根据比较结果确定待检测数字 内容与原始数字内容是否一致。 其中, 第一时长大于第二时长, 若待检测数字内容与原始数 字内容确实存在相同的特征值, 则在进行比较时, 每隔第二时长从待检测数字内容中提取的 特征值中至少有一个与在第一时长范围内从原始数字内容中提取的特征值相同。
对流媒体类型的数字内容提取的特征值可以是摘要特征值, 也可以是内容特征值。 在确 定原始数字内容和待检测数字内容均为流媒体数字内容后, 可以先抽取原始数字内容的某些 帧, 如视频关键帧, 对每帧进行特征值的提取并顺序存储。 进行特征值的比较时, 顺序截取 检索到的待检测数字内容对应的数据流中的帧, 对截取到的帧进行特征值的提取, 与存储的 原始数字内容的特征值顺序进行比较。 实施中, 可以先在第一时长范围内从原始数字内容中 提取视频关键帧, 并进一步提取原始数字内容视频关键帧的特征值; 每隔第二时长从待检测 数字内容中提取视频关键帧, 并进一步提取待检测数字内容视频关键帧的特征值。 当然, 也 可以使用 Ρ帧、 V帧进行内容特征值的提取, 但由于 I帧中包含的信息较多, 因此建议使用 I 帧。
例如, 从原始数字内容中提取一个或多个连续的 T1时长内的所有 I帧的特征值(可以包 括摘要特征值和内容特征值)。 在对待检测数字内容进行特征值的提取时, 每隔时长 Τ2从待 检测数字内容对应的数据流中抽取一帧或几帧, 提取特征值。 其中 Τ2〈Τ1, 如果待检测的数 字内容中存在与原始数字内容在 T1时间段中相同的片段, 那么从 Τ2提取的帧中至少有 1帧 落在 T1内。可以每隔时长 Τ2提取首个 I帧, 计算 I帧的特征值, 与 T1中的所有 I帧的特征 值相比较, 如果相同的 I帧特征值的个数超过阈值, 则可以认为待检测数字内容与原始数字 内容一致。
当然, 为了提升检测率和考虑到系统间的误差, 可以根据系统实际性能情况定义 Tl、 Τ2 的大小, 也可以动态调整 Τ2的大小, 保持系统处理的性能和检测率的平衡。
特别的, 对于点播音 /视频流媒体, 可以采用定时播放 /快进 /快退等手段, 每次跳到 Τ2 时间提取和检测首帧数的特征值 (Τ2〈Τ1 ), 既保证了检测的效率和性能, 又无需等待, 提升 了检测的速度、 减少了时延。 从原始数字内容中提取出摘要特征值后, 可以将提取出的原始数字内容的摘要特征值进 行存储, 如存储至一特征值库, 在从待检测数字内容中提取出摘要特征值后, 将待检测数字 内容的摘要特征值与存储的原始数字内容的摘要特征值进行比较。 特别的, 如图 3所示, 一 个实施例中, 通过比较原始数字内容和待检测数字内容的摘要特征值, 确定待检测数字内容 是否与原始数字内容一致的处理流程如下:
步骤 30、获取原始数字内容,将原始数字内容体分片,分成 N片,然后顺序抽取 M片(步 长=^¾0, 对 M片中的每片进行摘要特征值的提取。
步骤 31、 顺序存储提取出的原始数字内容的摘要特征值。
步骤 32、 根据原始数字内容的标识信息或特征值获取待处理数字内容, 将待处理数字内 容体分片, 分成 N片, 然后顺序抽取 M片 (步长 =N/M), 对 M片中的每片进行摘要特征值的提 取。
步骤 33、 将存储的原始数字内容的摘要特征值逐个与待检测数字内容的摘要特征值进行 比较。 例如: 对于 CID1 , 抽取的待检测内容的 M片摘要特征值分别为 A [广 M], 第一提取模块 事先抽取的原始内容的 M片摘要特征值分别为 Β [ ΓΜ], 逐个比较: 采用如下的方式: 对于集 合 Α中的每一个元素 a和对于集合 Β中的每一个元素 b,采用逐个比较的方式, 如果出现 a=b 的情况, 则设置的计数器进行累加动作。
步骤 34、 根据比较结果, 确定与原始数字内容的摘要特征值相同的待检测数字内容的摘 要特征值的个数。
步骤 35、 在与原始数字内容的摘要特征值相同的待检测数字内容的摘要特征值的个数超 过阈值时, 确定待检测数字内容与原始数字内容一致。
当然, 若提取出的原始数字内容和待检测数字内容的特征值均为一个, 则在比较结果为 原始数字内容的特征值与待检测数字内容的特征值相等时, 可以确定待检测数字内容与原始 数字内容一致。 若提取出的原始数字内容和待检测数字内容的特征值均为多个时, 可以先将 原始数字内容的特征值逐个与待检测数字内容的特征值进行比较, 再根据比较结果, 确定与 原始数字内容的特征值相同的待检测数字内容的特征值的个数, 在该个数超过阈值时, 确定 待检测数字内容与原始数字内容一致。
提取的特征值可以是摘要特征值, 也可以是内容特征值。 图 3所示流程中, 使用摘要特 征值进行比较是一种精确比较, 而数字内容在传播过程中, 容易被进行文件格式转换、剪切、 编辑, 因此, 单纯使用摘要特征值进行比较时, 漏检率较大。 此时需要增加其他检测手段, 增强检测的强度。 本发明实施例中, 在根据摘要特征值进行比较失败时, 采用内容特征值进 行进一步比较。 先将原始数字内容的摘要特征值逐个与待检测数字内容的摘要特征值进行比较, 根据比 较结果, 确定与原始数字内容的摘要特征值相同的待检测数字内容的摘要特征值的个数, 在 与原始数字内容的摘要特征值相同的待检测数字内容的摘要特征值的个数超过阈值时, 确定 待检测数字内容与原始数字内容一致; 在与原始数字内容的摘要特征值相同的待检测数字内 容的摘要特征值的个数未超过阈值时, 进一步将原始数字内容的内容特征值逐个与待检测数 字内容的内容特征值进行比较, 根据比较结果, 确定与原始数字内容的内容特征值相同的待 检测数字内容的内容特征值的个数, 在与原始数字内容的内容特征值相同的待检测数字内容 的内容特征值的个数超过阈值时, 确定待检测数字内容与原始数字内容一致。
一个实施例中, 在确定待检测数字内容与原始数字内容一致后, 可以根据用户策略确定 待检测数字内容是否为非法数字内容。 例如, 用户可以事先通过用于数字内容的版权管理的 一管理台提交合法的业务提供商的 URI地址。 后续获取到待检测数字内容后, 提取待检测数 字内容的 URI地址, 与用户提交的合法 URI地址相比较, 若相同, 则可以认为待检测数字内 容合法, 不必再进行后续特征值的提取和比较操作, 若不同, 继续进行特征值的提取和比较 操作, 进一步在确定待检测数字内容与原始数字内容一致时, 确定待检测数字内容为非法内 容。 当然, 对于 URI地址的比较也可以在特征值的比较之后进行。
如图 4所示, 一个实施例中, 通过比较原始数字内容和待检测数字内容的摘要特征值和 内容特征值, 确定待检测数字内容是否与原始数字内容一致的处理流程如下:
步骤 40、 获取原始数字内容, 从原始数字内容中提取特征值并存储, 其中, 包括提取摘 要特征值和内容特征值。
步骤 41、 根据原始数字内容的标识信息或特征值获取待检测数字内容的 URI地址。 步骤 42、 将待检测数字内容的 URI地址与用户预先提交的合法 URI地址进行比较, 若相 同, 则执行步骤 410, 结束整个流程, 若不同, 则执行步骤 43。
步骤 43、 根据待检测数字内容的 URI地址获取数字内容的属性和数字内容, 根据属性判 断待检测数字内容的媒体类型(图像、 音频、 视频、 游戏、 文档或其他)。 根据待检测数字内 容的媒体类型, 进行摘要特征值的提取。
步骤 44、 将提取的摘要特征值与事先存储的原始数字内容的摘要特征值进行比较, 确定 摘要特征值相同的个数。
步骤 45、 判断摘要特征值相同的个数是否超过一定的阈值, 若摘要特征值相同的个数超 过一定的阈值, 执行步骤 46, 否则执行步骤 47。
步骤 46、 确定待检测数字内容与原始数字内容一致, 进而可以认为待检测数字内容是非 法数字内容。 可以将待检测数字内容及对应的 URI地址、 获取待检测数字内容时所用的原始 数字内容的标识信息或特征值进行存储, 例如归档至可疑数字内容库。 归档时可以根据与原 始数字内容的特征值相同的待检测数字内容的特征值的个数, 确定待检测数字内容与原始数 字内容的一致性级别。 例如, 根据摘要特征值相同的比例大小进行一致性分级, 比例越大, 级别越高, 说明待检测数字内容越接近于原始数字内容, 也即待检测数字内容越可疑。
步骤 47、 摘要特征值相同的个数未超过比例时, 提取待检测数字内容的内容特征值。 步骤 48、将待检测数字内容的内容特征值与存储的原始数字内容的内容特征值进行比较, 确定内容特征值相同的个数。
步骤 49、 判断内容特征值相同的个数是否超过一定的阈值, 若内容特征值相同的个数超 过一定的阈值, 则执行步骤 46, 认为待检测数字内容为非法数字疑内容, 将待检测数字内容 及对应的 URI地址、 获取待检测数字内容时所用的原始数字内容的标识信息或特征值进行存 储,并且可以根据摘要特征值相同的个数确定待检测数字内容与原始数字内容的一致性级别。 若内容特征值相同的个数未超过阈值, 则执行步骤 410, 结束整个流程, 认为待检测数字内 容与原始数字内容不一致, 待检测数字内容为合法数字内容。
当然, 在确定待检测数字内容与原始数字内容的一致性级别后, 可以对可疑数字内容库 中存储的数字内容进行人工识别, 人工识别时可以根据一致性级别大小优先识别可疑度大的 数字内容。 当然, 将待检测数字内容存储入可疑数字内容库时, 可以录播数字内容的部分片 段, 不必存储全部数字内容。
在确定待检测数字内容与原始数字内容一致后, 可以根据待检测数字内容的地址, 确定 源自该地址的数字内容与原始数字内容一致; 另外, 也可以根据待检测数字内容的地址, 拒 绝对该地址的访问。 一个实施例中, 如图 5所示, 对于确认为非法的数字内容, 可以通过管 理台与内容分发系统的接口, 将非法数字内容所在的 URI地址传递给内容分发系统, 由内容 分发系统限制和过滤非法数字内容的分发。
在移动系统中, 可以将非法 URI地址传递给 WAP GW (Wireless Application Protocol , 无线应用协议; GateWay, 网关) 或其他 WAP控制设备, 由 WAP GW对非法 URI进行过滤, 限 制用户对非法 URI的访问, 从而保护合法内容所有者的利益。
一个实施例中, 对数字内容的访问进行控制的处理流程如图 6所示, 包括:
步骤 60、 识别出非法数字内容的 URI链接, 其具体识别过程见上述实施例方法。
步骤 61、将非法数字内容的 URI链接同步到内容分发系统的非法数字内容的 URI地址库。 步骤 62、 当终端访问 URI链接时, 对 URI链接进行检查, 以确认该 URI链接是否在非法 数字内容的 URI地址库中。 例如, 在移动 WAP中, 通过 WAP GW访问 URI链接时, 由 WAP GW 对 URI链接进行检查。 步骤 63、在检查到该 URI链接在非法数字内容的 URI地址库中时,拒绝访问该 URI链接, 以限制非法数字内容的传播。
一个实施例中, 从原始数字内容中提取特征值后, 可以进一步存储原始数字内容的特征 值; 在确定待检测数字内容与原始数字内容一致后, 进一步将存储的原始数字内容的特征值 替换为待检测数字内容的特征值, 以进行后续数字内容的一致性检测。 例如, 在对数字内容 进行识别后, 如果发现该数字内容是非法 /盗版内容, 且经过一定的编辑 /修改 /剪切 /剪辑等 变化, 则可以以此"非法 /盗版内容"的特征值替换原始数字内容的特征值, 作为后续系统进 行比较的特征值, 从而可以更快的在特征值提取阶段发现类似的可疑 URI地址, 提高检测率。
综上所述, 本发明实施例提供的数字内容的一致性检测方法, 在检测数字内容是否为非 法内容时, 从原始数字内容中提取特征值, 从待检测数字内容中提取特征值, 将原始数字内 容的特征值与待检测数字内容的特征值进行比较, 根据比较结果确定待检测数字内容与原始 数字内容是否一致, 进而可以根据用户策略确定待检测数字内容是否为非法内容, 由于在检 测时直接从原始数字内容和待检测数字内容中提取特征值进行比较, 而无需在数字内容中嵌 入其它信息, 不影响数字内容的大小, 不影响用户体验; 并且, 检测过程与控制数字内容的 传播过程相分离, 不依赖于特定网络, 无需进行实时检测; 另外, 提取特征值进行比较的检 测过程与终端无关,无需对现有终端进行改造,实施时成本较低; 由于未采用加密 /授权技术, 避免了检测时攻击者破译加密的内容数据包进行非法传播的情况, 安全性较高, 可以有效地 保护数字内容的版权所有者的利益。
基于同一发明构思,本发明实施例还提供一种数字内容的一致性检测装置,如图 7A所示, 该装置包括: 第一提取模块 70、 第二提取模块 71、 比较模块 72、 第一确定模块 73; 其中, 第一提取模块 70, 用于从原始数字内容中提取特征值; 第二提取模块 71, 用于从待检测数字 内容中提取特征值; 比较模块 72, 用于将原始数字内容的特征值与待检测数字内容的特征值 进行比较; 第一确定模块 73, 用于根据比较结果确定待检测数字内容与原始数字内容是否一 致。
如图 7B所示, 图 7A所示的装置可以进一步包括: 第一获取模块 74用于获取原始数字内 容的标识信息; 第二获取模块 75, 用于根据原始数字内容的标识信息获取待检测数字内容。 或者, 如图 7C所示, 图 7A所示的装置可以进一步包括: 第三获取模块 76, 用于根据原始数 字内容的特征值获取待检测数字内容。
图 7A所示的装置中, 第一提取模块 70可以包括: 第一确定单元 701, 用于确定原始数 字内容的媒体类型; 第一提取单元 702, 用于根据原始数字内容的媒体类型从原始数字内容 中提取特征值; 第二提取模块 71可以包括: 第二确定单元 711, 用于确定待检测数字内容的 媒体类型; 第二提取单元 712, 用于根据待检测数字内容的媒体类型从待检测数字内容中提 取特征值。 第一确定单元 701可以进一步用于确定原始数字内容的媒体类型为流媒体类型; 第一提取单元 702可以进一步用于在第一时长范围内从原始数字内容中提取特征值; 第二确 定单元 711可以进一步用于确定待检测数字内容的媒体类型为流媒体类型;第二提取单元 712 可以进一步用于每隔第二时长从待检测数字内容中提取特征值; 其中, 所述第一时长大于第 二时长。
其中, 第一提取单元 702可以进一步包括: 第一提取子单元 7021, 用于在第一时长范围 内从原始数字内容中提取视频关键帧; 第二提取子单元 7022, 用于提取原始数字内容视频关 键帧的特征值; 第二提取单元 712进一步包括: 第三提取子单元 7121, 用于每隔第二时长从 待检测数字内容中提取视频关键帧; 第四提取子单元 7122, 用于提取待检测数字内容视频关 键帧的特征值。
比较模块 72 可以进一步用于将待检测数字内容每隔第二时长提取的特征值与原始数字 内容在第一时长范围内提取的所有特征值进行比较。
在原始数字内容和待检测数字内容的特征值均为多个时,比较模块 72可以进一步用于将 原始数字内容的特征值逐个与待检测数字内容的特征值进行比较; 此时, 第一确定模块 73可 以包括: 第三确定单元 731, 用于根据比较结果, 确定与原始数字内容的特征值相同的待检 测数字内容的特征值的个数; 第四确定单元 732, 用于在所述与原始数字内容的特征值相同 的待检测数字内容的特征值的个数超过阈值时, 确定待检测数字内容与原始数字内容一致。
在特征值包括摘要特征值和内容特征值时, 比较模块 72可以包括: 第一比较单元 721, 用于将原始数字内容的摘要特征值逐个与待检测数字内容的摘要特征值进行比较; 此时, 第 三确定单元 731进一步用于根据比较结果, 确定与原始数字内容的摘要特征值相同的待检测 数字内容的摘要特征值的个数; 第四确定单元 732进一歩用于在所述摘要特征值的个数超过 阈值时, 确定待检测数字内容与原始数字内容一致; 比较模块 72还可以包括: 第二比较单元 722,用于在所述摘要特征值的个数未超过阈值时, 进一歩将原始数字内容的内容特征值逐个 与待检测数字内容的内容特征值进行比较; 此时, 第三确定单元 731进一步用于根据比较结 果, 确定与原始数字内容的内容特征值相同的待检测数字内容的内容特征值的个数; 第四确 定单元 732进一步用于在所述内容特征值的个数超过阈值时, 确定待检测数字内容与原始数 字内容一致。
第三确定单元 731还可以进一步用于根据与原始数字内容的特征值相同的待检测数字内 容的特征值的个数, 确定待检测数字内容与原始数字内容的一致性级别。
如图 7D所示, 图 7A所示的装置可以进一步包括: 第二确定模块 77, 用于根据待检测数 字内容的地址, 确定源自所述地址的数字内容与原始数字内容一致。
如图 7E所示, 图 7A所示的装置可以进一步包括: 处理模块 78, 用于根据待检测数字内 容的地址, 拒绝对该地址的访问。
如图 7F所示, 图 7A所示的装置可以进一步包括: 存储模块 79, 用于存储原始数字内容 的特征值;比较模块 72进一步用于将待检测数字内容的特征值与存储的原始数字内容的特征 值进行比较; 替换模块 710, 用于在确定待检测数字内容与原始数字内容一致后, 将存储的 原始数字内容的特征值替换为待检测数字内容的特征值。
本领域普通技术人员可以理解上述实施例方法中的全部或部分步骤是可以通过程序来指 令相关的硬件完成, 该程序可以存储于一计算机可读存储介质中, 存储介质可以包括: R0M、 RAM, 磁盘或光盘等。
本发明实施例中, 在检测数字内容是否为非法内容时, 从原始数字内容中提取特征值, 从待检测数字内容中提取特征值, 将原始数字内容的特征值与待检测数字内容的特征值进行 比较, 根据比较结果确定待检测数字内容与原始数字内容是否一致, 进而可以根据用户策略 确定待检测数字内容是否为非法内容; 一方面, 本发明实施例与现有的数字水印技术不同, 由于在检测时直接从原始数字内容和待检测数字内容中提取特征值进行比较, 而无需在数字 内容中嵌入其它信息, 因此不影响数字内容的大小, 不影响用户体验; 并且, 检测过程与控 制数字内容的传播过程相分离, 不依赖于特定网络, 无需进行实时检测; 另一方面, 本发明 实施例与现有的加密 /授权技术不同, 提取特征值进行比较的检测过程与终端无关,无需对现 有终端进行改造, 实施时成本较低, 也避免了检测时攻击者破译加密的内容数据包进行非法 传播的情况, 安全性较高, 可以有效地保护数字内容的版权所有者的利益。
另外, 本发明实施例中, 可以在检测过程中确定待检测数字内容的可疑程度, 可以将摘 要特征值的提取和比较, 与内容特征值的提取和比较相结合, 以确定数字内容的一致性, 提 升检测的性能和准确性。 在对流媒体类型的数字内容进行检测时, 采用的快速算法可以进一 步提升系统性能。 在确定待检测数字内容为非法内容后, 进一步的, 可以通过管理台与内容 分发系统的接口, 将非法数字内容所在的 URI地址传递给内容分发系统, 由内容分发系统限 制和过滤非法数字内容的分发。
显然, 本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范 围。 这样, 倘若对本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内, 则本发明也意图包含这些改动和变型在内。

Claims

权 利 要 求 书
1、 一种数字内容的一致性检测方法, 其特征在于, 该方法包括步骤:
从原始数字内容中提取特征值;
从待检测数字内容中提取特征值;
将原始数字内容的特征值与待检测数字内容的特征值进行比较;
根据比较结果确定待检测数字内容与原始数字内容是否一致。
2、 如权利要求 1所述的方法, 其特征在于, 该方法进一步包括: 获取原始数字内容的标 识信息, 根据所述标识信息获取待检测数字内容。
3、 如权利要求 1所述的方法, 其特征在于, 该方法进一步包括: 根据原始数字内容的特 征值获取待检测数字内容。
4、 如权利要求 1所述的方法, 其特征在于, 所述从原始数字内容中提取特征值的步骤, 包括: 确定原始数字内容的媒体类型; 根据原始数字内容的媒体类型从原始数字内容中提取 特征值;
所述从待检测数字内容中提取特征值的步骤, 包括: 确定待检测数字内容的媒体类型; 根据待检测数字内容的媒体类型从待检测数字内容中提取特征值。
5、 如权利要求 4所述的方法, 其特征在于, 所述根据原始数字内容的媒体类型从原始数 字内容中提取特征值的步骤, 包括:
当确定原始数字内容的媒体类型为流媒体类型时, 在第一时长范围内从原始数字内容中 提取特征值;
所述根据待检测数字内容的媒体类型从待检测数字内容中提取特征值的步骤, 包括: 当确定待检测数字内容的媒体类型为流媒体类型时, 每隔第二时长从待检测数字内容中 提取特征值; 所述第一时长大于第二时长。
6、 如权利要求 5所述的方法, 其特征在于, 所述在第一时长范围内从原始数字内容中提 取特征值的步骤, 包括: 在第一时长范围内从原始数字内容中提取视频关键帧, 并进一步提 取原始数字内容视频关键帧的特征值;
所述每隔第二时长从待检测数字内容中提取特征值的步骤, 包括: 每隔第二时长从待检 测数字内容中提取视频关键帧, 并进一步提取待检测数字内容视频关键帧的特征值。
7、 如权利要求 5所述的方法, 其特征在于, 将原始数字内容的特征值与待检测数字内容 的特征值进行比较包括: 将待检测数字内容每隔第二时长提取的特征值与原始数字内容在第 一时长范围内提取的所有特征值进行比较。
8、 如权利要求 1所述的方法, 其特征在于, 原始数字内容和待检测数字内容的特征值均 为多个时, 将原始数字内容的特征值逐个与待检测数字内容的特征值进行比较; 根据比较结 果, 确定与原始数字内容的特征值相同的待检测数字内容的特征值的个数, 在所述与原始数 字内容的特征值相同的待检测数字内容的特征值的个数超过阈值时, 确定待检测数字内容与 原始数字内容一致。
9、 如权利要求 1所述的方法, 其特征在于, 所述特征值包括摘要特征值和 /或内容特征 值。
10、 如权利要求 9所述的方法, 其特征在于, 所述特征值包括摘要特征值和内容特征值 时, 将原始数字内容的摘要特征值逐个与待检测数字内容的摘要特征值进行比较; 根据比较 结果, 确定与原始数字内容的摘要特征值相同的待检测数字内容的摘要特征值的个数; 在所 述摘要特征值的个数超过阈值时, 确定待检测数字内容与原始数字内容一致;
在所述摘要特征值的个数未超过阈值时, 进一步将原始数字内容的内容特征值逐个与待 检测数字内容的内容特征值进行比较; 根据比较结果, 确定与原始数字内容的内容特征值相 同的待检测数字内容的内容特征值的个数; 在所述内容特征值的个数超过阈值时, 确定待检 测数字内容与原始数字内容一致。
11、 如权利要求 8所述的方法, 其特征在于, 根据与原始数字内容的特征值相同的待检 测数字内容的特征值的个数, 确定待检测数字内容与原始数字内容的一致性级别。
12、 如权利要求 1所述的方法, 其特征在于, 该方法进一步包括: 根据待检测数字内容 的地址, 确定源自所述地址的数字内容与原始数字内容一致。
13、 如权利要求 1所述的方法, 其特征在于, 该方法进一步包括: 根据待检测数字内容 的地址, 拒绝对所述地址的访问。
14、 如权利要求 1所述的方法, 其特征在于, 从原始数字内容中提取特征值后, 进一步 存储原始数字内容的特征值; 确定待检测数字内容与原始数字内容一致后, 进一步将存储的 原始数字内容的特征值替换为待检测数字内容的特征值。
15、 一种数字内容的一致性检测装置, 其特征在于, 包括:
第一提取模块 (70), 用于从原始数字内容中提取特征值;
第二提取模块 (71 ), 用于从待检测数字内容中提取特征值;
比较模块(72), 用于将所述第一提取模块(70)提取的原始数字内容的特征值与所述第 二提取模块 (71 ) 提取的待检测数字内容的特征值进行比较;
第一确定模块(73), 用于根据所述比较模块(72 ) 的比较结果确定待检测数字内容与原 始数字内容是否一致。
16、 如权利要求 15所述的装置, 其特征在于, 所述装置进一步包括:
第一获取模块 (74), 用于获取原始数字内容的标识信息;
第二获取模块(75), 用于根据所述第一获取模块(74)获取的标识信息获取待检测数字 内容。
17、 如权利要求 15所述的装置, 其特征在于, 所述装置进一步包括:
第三获取模块(76), 用于根据所述第一提取模块(70 )提取的原始数字内容的特征值获 取待检测数字内容。
18、 如权利要求 15所述的装置, 其特征在于, 所述第一提取模块 (70 ) 包括: 第一确定单元 (701 ), 用于确定原始数字内容的媒体类型;
第一提取单元(702), 用于根据所述第一确定单元(701 )确定的原始数字内容的媒体类 型从原始数字内容中提取特征值;
所述第二提取模块 (71 ) 包括:
第二确定单元 (711 ), 用于确定待检测数字内容的媒体类型;
第二提取单元(712), 用于根据所述第二确定单元(711 )确定的待检测数字内容的媒体 类型从待检测数字内容中提取特征值。
19、 如权利要求 18所述的装置, 其特征在于, 所述第一确定单元 (701 ) 进一步用于确 定原始数字内容的媒体类型为流媒体类型; 所述第一提取单元(702 )进一步用于在第一时长 范围内从原始数字内容中提取特征值;
所述第二确定单元(711 )进一步用于确定待检测数字内容的媒体类型为流媒体类型; 所 述第二提取单元(712 )进一步用于每隔第二时长从待检测数字内容中提取特征值; 其中, 所 述第一时长大于第二时长。
20、 如权利要求 19所述的装置, 其特征在于, 所述第一提取单元 (702 ) 进一步包括: 第一提取子单元 (7021 ), 用于在第一时长范围内从原始数字内容中提取视频关键帧; 第二提取子单元(7022), 用于提取所述第一提取子单元(7021 )获取的原始数字内容视 频关键帧的特征值;
所述第二提取单元 (712 ) 进一步包括:
第三提取子单元 (7121 ), 用于每隔第二时长从待检测数字内容中提取视频关键帧; 第四提取子单元(7122), 用于提取所述第三提取子单元(7121 )获取的待检测数字内容 视频关键帧的特征值。
21、 如权利要求 19所述的装置, 其特征在于, 所述比较模块(72 )进一步用于将待检测 数字内容每隔第二时长提取的特征值与原始数字内容在第一时长范围内提取的所有特征值进 行比较。
22、 如权利要求 15所述的装置, 其特征在于, 原始数字内容和待检测数字内容的特征值 均为多个时, 所述比较模块 (72 ) 进一步用于将原始数字内容的特征值逐个与待检测数字内 容的特征值进行比较;
所述第一确定模块 (73 ) 包括:
第三确定单元 (731 ), 用于根据所述比较模块 (72 ) 的比较结果, 确定与原始数字内容 的特征值相同的待检测数字内容的特征值的个数;
第四确定单元 (732), 用于在所述与原始数字内容的特征值相同的待检测数字内容的特 征值的个数超过阈值时, 确定待检测数字内容与原始数字内容一致。
23、 如权利要求 22所述的装置, 其特征在于, 所述特征值包括摘要特征值和内容特征值 时, 所述比较模块 (72 ) 包括:
第一比较单元 (721 ), 用于将原始数字内容的摘要特征值逐个与待检测数字内容的摘要 特征值进行比较;
所述第三确定单元 (731 ) 进一步用于根据所述第一比较单元 (721 ) 的比较结果, 确定 与原始数字内容的摘要特征值相同的待检测数字内容的摘要特征值的个数;
所述第四确定单元(732 )进一步用于在所述摘要特征值的个数超过阈值时, 确定待检测 数字内容与原始数字内容一致;
所述比较模块 (72 ) 还包括:
第二比较单元 (722), 用于在所述摘要特征值的个数未超过阈值时, 进一步将原始数字 内容的内容特征值逐个与待检测数字内容的内容特征值进行比较;
所述第三确定单元 (731 ) 进一步用于根据所述第二比较单元 (722 ) 的比较结果, 确定 与原始数字内容的内容特征值相同的待检测数字内容的内容特征值的个数;
所述第四确定单元(732 )进一步用于在所述内容特征值的个数超过阈值时, 确定待检测 数字内容与原始数字内容一致。
24、 如权利要求 22所述的装置, 其特征在于, 所述第三确定单元 (731 ) 进一步用于根 据与原始数字内容的特征值相同的待检测数字内容的特征值的个数, 确定待检测数字内容与 原始数字内容的一致性级别。
25、 如权利要求 15所述的装置, 其特征在于, 所述装置还包括:
第二确定模块(77), 用于根据待检测数字内容的地址, 确定源自所述地址的数字内容与 原始数字内容一致。
26、 如权利要求 15所述的装置, 其特征在于, 所述装置还包括: 处理模块 (78), 用于根据待检测数字内容的地址, 拒绝对所述地址的访问。
27、 如权利要求 15所述的装置, 其特征在于, 所述装置还包括:
存储模块 (79), 用于存储原始数字内容的特征值;
所述比较模块 (72 ) 进一歩用于将待检测数字内容的特征值与所述存储模块 (79 ) 存储 的原始数字内容的特征值进行比较;
替换模块 (710), 用于在确定待检测数字内容与原始数字内容一致后, 将存储的原始数 字内容的特征值替换为待检测数字内容的特征值。
28、 一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储计算机程序, 该程序可使得处理器执行如下歩骤:
从原始数字内容中提取特征值;
从待检测数字内容中提取特征值;
将原始数字内容的特征值与待检测数字内容的特征值进行比较;
根据比较结果确定待检测数字内容与原始数字内容是否一致。
PCT/CN2008/071627 2007-07-17 2008-07-11 Procédé et dispositif pour tester la cohérence de contenus numériques WO2009010002A1 (fr)

Priority Applications (2)

Application Number Priority Date Filing Date Title
EP08773178.2A EP2109248B1 (en) 2007-07-17 2008-07-11 Method and device for testing consistency of numeric contents
US12/550,906 US20090316894A1 (en) 2007-07-17 2009-08-31 Method and apparatus for checking consistency between digital contents

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN200710130287.X 2007-07-17
CN200710130287.XA CN101350043B (zh) 2007-07-17 2007-07-17 数字内容的一致性检测方法及装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US12/550,906 Continuation US20090316894A1 (en) 2007-07-17 2009-08-31 Method and apparatus for checking consistency between digital contents

Publications (1)

Publication Number Publication Date
WO2009010002A1 true WO2009010002A1 (fr) 2009-01-22

Family

ID=40259316

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2008/071627 WO2009010002A1 (fr) 2007-07-17 2008-07-11 Procédé et dispositif pour tester la cohérence de contenus numériques

Country Status (4)

Country Link
US (1) US20090316894A1 (zh)
EP (1) EP2109248B1 (zh)
CN (1) CN101350043B (zh)
WO (1) WO2009010002A1 (zh)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101826101A (zh) * 2010-01-25 2010-09-08 王平 搜索引擎装置及其方法
CN102509041A (zh) * 2011-10-14 2012-06-20 中国科学院自动化研究所 用于数字内容作品著作权登记的内容备案存档系统及方法
CN102780911B (zh) * 2012-05-31 2017-08-04 新奥特(北京)视频技术有限公司 一种检测数据一致性的方法
US9195431B2 (en) 2012-06-18 2015-11-24 Google Inc. System and method for selective removal of audio content from a mixed audio recording
CN102740120A (zh) * 2012-06-20 2012-10-17 北京市博汇科技有限公司 数字电视直播节目播出完整性判断方法
CN102821136A (zh) * 2012-07-04 2012-12-12 北京小米科技有限责任公司 一种防止违规文件多次上传的方法及装置
CN103927606B (zh) * 2013-01-14 2017-09-29 上海核工程研究设计院 一种基于特征码的纸质和电子文件管理方法
US9277251B2 (en) * 2013-03-15 2016-03-01 Echostar Technologies L.L.C. Geographically independent determination of segment boundaries within a video stream
CN103747241A (zh) * 2013-12-23 2014-04-23 乐视致新电子科技(天津)有限公司 一种视频完整性的检测方法及装置
CN105099796B (zh) * 2014-04-22 2018-07-20 深圳市志友企业发展促进中心 一种多媒体内容更改检测方法、装置及资源传播系统
CN103974061B (zh) * 2014-05-27 2016-05-25 合一网络技术(北京)有限公司 一种播放测试方法及系统
CN104852914B (zh) * 2015-04-30 2018-07-13 中国人民解放军国防科学技术大学 一种基于数据包间隔的水印跳变通信方法
CN106454367B (zh) * 2016-10-09 2019-12-20 中国农业大学 一种多媒体文件的标识方法及系统
CN107318041A (zh) * 2017-06-29 2017-11-03 深圳市茁壮网络股份有限公司 一种视频安全播放的方法及系统
CN107704732B (zh) * 2017-08-30 2020-12-01 上海掌门科技有限公司 一种用于生成作品指纹的方法与设备
CN108171082B (zh) * 2017-12-06 2021-04-30 新华三信息安全技术有限公司 一种网页探测方法及装置
CN108989326A (zh) * 2018-08-06 2018-12-11 上海艾策通讯科技股份有限公司 一种对比网络传输ts流媒体一致性的方法
CN112449237B (zh) 2019-08-12 2023-05-05 中兴通讯股份有限公司 一种检测视频码流的方法、装置及系统
CN110674337A (zh) * 2019-10-15 2020-01-10 盛唐威讯数媒科技(北京)有限公司 一种音像图文识别系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1271279A2 (en) * 2001-06-27 2003-01-02 Microsoft Corporation Binding a digital license to a portable device or the like in a digital rights management (DRM) system and checking out/checking in the digital license to/from the portable device or the like
CN1427635A (zh) * 2001-12-21 2003-07-02 华为技术有限公司 一种基于移动国家码确定保密通信中加密算法的方法
CN1533121A (zh) * 2003-03-20 2004-09-29 日本电气株式会社 用于防止信息处理设备的未授权使用的装置和方法
CN1642077A (zh) * 2004-01-13 2005-07-20 国际商业机器公司 可信数字时间戳的生成和验证的方法及系统
US20060050964A1 (en) 2001-10-17 2006-03-09 Sudheer Sirivara Identifying image content
CN1770696A (zh) * 2004-11-03 2006-05-10 易载国际股份有限公司 应用于数字版权管理的文件存取控制管理方法及系统
CN1941712A (zh) * 2005-09-27 2007-04-04 三星电子株式会社 防止在移动终端中内容未经授权被使用的方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010053252A1 (en) * 2000-06-13 2001-12-20 Stuart Creque Method of knowledge management and information retrieval utilizing natural characteristics of published documents as an index method to a digital content store
JP4359085B2 (ja) * 2003-06-30 2009-11-04 日本放送協会 コンテンツ特徴量抽出装置
US20080027866A1 (en) * 2006-07-26 2008-01-31 Halcrow Michael A System and method for authenticating file content

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1271279A2 (en) * 2001-06-27 2003-01-02 Microsoft Corporation Binding a digital license to a portable device or the like in a digital rights management (DRM) system and checking out/checking in the digital license to/from the portable device or the like
US20060050964A1 (en) 2001-10-17 2006-03-09 Sudheer Sirivara Identifying image content
CN1427635A (zh) * 2001-12-21 2003-07-02 华为技术有限公司 一种基于移动国家码确定保密通信中加密算法的方法
CN1533121A (zh) * 2003-03-20 2004-09-29 日本电气株式会社 用于防止信息处理设备的未授权使用的装置和方法
CN1642077A (zh) * 2004-01-13 2005-07-20 国际商业机器公司 可信数字时间戳的生成和验证的方法及系统
CN1770696A (zh) * 2004-11-03 2006-05-10 易载国际股份有限公司 应用于数字版权管理的文件存取控制管理方法及系统
CN1941712A (zh) * 2005-09-27 2007-04-04 三星电子株式会社 防止在移动终端中内容未经授权被使用的方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CHUN-SHIEN LU ET AL.: "Multimedia Systems", vol. 11, SPRINGER, article "Geometric distortion-resilient image hashing scheme and its application on copy detection and authentication", pages: 159 - 173
See also references of EP2109248A4
XIN FAN ET AL.: "Phtoto-to-Search: Using Multimodal Queries to Search the Web from Mobile Devices", PROCEEDINGS OF THE 7TH ACM SIGMM INTERNATIONAL WORKSHOP ON MULTIMEDIA INFORMATION RETRIEVAL, 2005, pages 143 - 150

Also Published As

Publication number Publication date
EP2109248A4 (en) 2011-01-05
EP2109248A1 (en) 2009-10-14
US20090316894A1 (en) 2009-12-24
EP2109248B1 (en) 2013-06-19
CN101350043B (zh) 2011-05-11
CN101350043A (zh) 2009-01-21

Similar Documents

Publication Publication Date Title
WO2009010002A1 (fr) Procédé et dispositif pour tester la cohérence de contenus numériques
US8850214B2 (en) Methods and systems for encoding and protecting data using digital signature and watermarking techniques
WO2010012175A1 (zh) 一种文件检测方法和装置
US8959202B2 (en) Generating statistics of popular content
US8607354B2 (en) Deriving multiple fingerprints from audio or video content
WO2017071512A1 (zh) 一种多媒体数据的云存储、云下载方法及相关装置
US20070033408A1 (en) Preventing illegal distribution of copy protected content
US20050251486A1 (en) System and methods for protecting digital works using a watermark gateway
US20020099955A1 (en) Method for securing digital content
CN102867515B (zh) 通过数字水印对数字音频版权进行认证的方法
US20040243540A1 (en) Method and device for monitoring and analyzing signals
KR20130133243A (ko) 온라인 저장을 위한 장치 및 방법, 송신 장치 및 방법, 및 수신 장치 및 방법
JP4742264B2 (ja) コンテンツ検出装置、不正使用判定装置及び警報装置並びにコンテンツ配信ネットワークシステム
CN101739522B (zh) Drm文件完整性的保护方法及装置
EP2680623B1 (en) Mehthod, device and system for protecting multimedia data of a multimedia message
US20080235808A1 (en) Method and Apparatus for Protection of Content Using Biometric Watermarks
JP2008305371A (ja) 分散処理により膨大なコンテンツの検査を行う装置と方法、およびコンテンツの検査結果にもとづいて利用者間の自律的なコンテンツ流通とコンテンツ利用を制御するコンテンツ配信システム
CN108563396B (zh) 一种安全的云端对象存储方法
US11570192B2 (en) Methods, systems, and devices for detecting over-the-top piracy
CN109858207B (zh) 一种非授权分发的多媒体版权追踪的方法
US8806558B1 (en) Unique watermarking of content objects according to end user identity
JP2014175757A (ja) 分割要素の結合による電子透かしを生成する電子透かし処理システム、サーバ、プログラム及び方法
Petrovic et al. Watermark screening in networked environment
JP2002342292A (ja) コンテンツ配信サーバおよび検出装置
Nixon Watermarks: An In-Depth Discussion

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 08773178

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2008773178

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: DE