WO2004102528A1 - オーディオ電子透かし装置 - Google Patents

オーディオ電子透かし装置 Download PDF

Info

Publication number
WO2004102528A1
WO2004102528A1 PCT/JP2003/006114 JP0306114W WO2004102528A1 WO 2004102528 A1 WO2004102528 A1 WO 2004102528A1 JP 0306114 W JP0306114 W JP 0306114W WO 2004102528 A1 WO2004102528 A1 WO 2004102528A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
watermark
audio
generation
audio data
Prior art date
Application number
PCT/JP2003/006114
Other languages
English (en)
French (fr)
Inventor
Toshifumi Sakaguchi
Masahide Hayama
Yukihisa Inoue
Original Assignee
Ascii Solutions,Inc.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ascii Solutions,Inc. filed Critical Ascii Solutions,Inc.
Priority to JP2004571864A priority Critical patent/JPWO2004102528A1/ja
Priority to US10/542,277 priority patent/US20060052887A1/en
Priority to PCT/JP2003/006114 priority patent/WO2004102528A1/ja
Priority to AU2003231518A priority patent/AU2003231518A1/en
Publication of WO2004102528A1 publication Critical patent/WO2004102528A1/ja
Priority to FI20050021A priority patent/FI20050021A/fi

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal

Definitions

  • the present invention relates to a device for embedding copyright identification information or the like in audio data as watermark data, and a device for detecting and decoding watermark data from audio data in which the watermark data is embedded.
  • the watermark data can be embedded without deteriorating the sound quality of the original audio data, and the watermark data remains even after being deformed by irreversible compression or the like, and the watermark data can be easily converted.
  • the ideal digital watermarking technology that can be detected has not yet been established.
  • a first invention is an audio digital watermarking device for recording watermark data on an audio recording medium, wherein the audio data acquiring unit acquires audio data, the watermark data acquiring unit acquires watermark data, By superimposing the audio data acquired by the audio data acquiring unit and superimposing the audio data, the result of the predetermined sum of the superimposed audio data at predetermined intervals represents the watermark data acquired by the watermark data acquiring unit.
  • a watermark generation data generation unit that generates watermark generation data; audio data acquired by the audio data acquisition unit; and watermark generation data generated by the watermark generation data generation unit. And a superimposed audio data generating unit for generating the digital watermark.
  • the second invention relates to the audio digital watermarking device according to claim 1, wherein the watermark generation data generation unit generates low frequency watermark generation data that cannot be heard by human ears.
  • the watermark generation data generation section generates the watermark generation data in which the value and the slope at the boundary where the amplitude of the function represented by the watermark generation data generated thereby changes are always zero.
  • the watermark generation data generation unit is configured to represent the watermark generation data such that a result of the predetermined sum for each of the predetermined periods represents the watermark data acquired by the watermark data acquisition unit. 4.
  • An audio watermarking apparatus according to claim 1, wherein the amplitude of the function is adaptively changed every half cycle.
  • the result of the predetermined sum for each predetermined cycle is a sign of the sum of the superimposed audio data for each half cycle of the watermarking generation data. It relates to the audio watermarking device described.
  • the result of the predetermined sum for each predetermined cycle is a sign of a difference between the sum of the superimposed audio data corresponding to the first half cycle and the second half cycle of the watermarking generation data.
  • the present invention relates to the audio digital watermarking device according to any one of 1 to 4.
  • a seventh invention is a method for decoding watermark data recorded on an audio recording medium.
  • An audio digital watermark decoding device for obtaining a superimposed audio data, and a sum calculating a result of a predetermined sum of the superimposed audio data acquired by the superimposed audio data acquisition unit for each of the predetermined periods.
  • An audio digital watermark decoding device comprising: a calculating unit; and a watermark data decoding unit that decodes the watermark data based on a result of the predetermined sum calculated by the sum calculating unit.
  • the present invention relates to a digital watermark decoding device.
  • the total sum calculation unit includes a total sum of the superimposed audio data acquired by the superimposed audio data acquisition unit over a time period of a first half of one cycle of the watermark generation data and a time of a second half cycle.
  • the audio digital watermark decoding device according to claim 7, wherein a sign of a difference of the total sum over is calculated.
  • FIG. 1 is a functional block diagram of the first embodiment.
  • FIG. 2 is a diagram showing a waveform pattern of audio data acquired in the first embodiment.
  • FIG. 3 is a diagram showing a waveform pattern of a primitive function of the watermark generation data generated in the first embodiment.
  • FIG. 4 is a diagram showing a sampling pattern of a primitive function of the watermark generation data generated in the first embodiment.
  • FIG. 5 is a diagram showing a waveform pattern of the watermark generation data of the character “C” generated in the first embodiment. 3 006114
  • FIG. 6 is a diagram showing a digital watermark embedding process according to the first embodiment.
  • FIG. 7 is a diagram showing a flow of processing in the first embodiment.
  • FIG. 8 is a functional block diagram of the second embodiment.
  • FIG. 9 is a diagram showing a flow of processing of the second embodiment.
  • FIG. 10 is a functional block diagram of the third embodiment.
  • FIG. 11 is a diagram showing a waveform pattern of a primitive function of watermark generation data generated in the third embodiment.
  • FIG. 12 is a diagram showing a processing flow of the third embodiment.
  • FIG. 13 is a functional block diagram of the fourth embodiment.
  • FIG. 14 is a diagram showing a waveform pattern of a fundamental function of watermark generation data generated in the fourth embodiment.
  • FIG. 15 is a diagram showing a sampling pattern of a base function of watermark generation data generated in the fourth embodiment.
  • FIG. 16 is a diagram illustrating a waveform pattern of watermark generation data of the character “C” generated in the fourth embodiment.
  • FIG. 17 is a diagram showing the flow of the process of the fourth embodiment.
  • FIG. 18 is a functional block diagram of the fifth embodiment.
  • FIG. 19 is a diagram showing a digital watermark embedding process according to the fifth embodiment.
  • FIG. 20 is a diagram showing the flow of the process of the fifth embodiment.
  • FIG. 21 is a functional block diagram of the sixth embodiment.
  • FIG. 22 is a diagram showing a processing flow of the sixth embodiment.
  • FIG. 23 is a functional block diagram of the seventh embodiment.
  • FIG. 24 is a diagram showing a digital watermark detection process according to the seventh embodiment.
  • FIG. 25 is a diagram showing a processing flow in the seventh embodiment.
  • FIG. 26 is a functional block diagram of the eighth embodiment.
  • FIG. 27 is a diagram showing a digital watermark detection process according to the eighth embodiment.
  • FIG. 28 is a diagram showing a processing flow of the eighth embodiment.
  • FIG. 29 is a functional block diagram of the ninth embodiment.
  • FIG. 30 is a diagram showing a digital watermark detection process according to the ninth embodiment.
  • FIG. 31 is a diagram showing a processing flow of the ninth embodiment.
  • the relationship between the embodiment and the claims is roughly as follows.
  • the first embodiment mainly describes claims 1 and 10.
  • claims 2 and 11 are mainly described.
  • the third embodiment mainly describes claims 3 and 12.
  • claims 4 and 13 are mainly described.
  • claims 5 and 14 are mainly described.
  • the sixth embodiment mainly describes claims 6 and 15.
  • claims 7 and 16 are mainly described.
  • claims 8 and 17 are mainly described.
  • the ninth embodiment mainly describes claims 9 and 18.
  • the invention described in the first embodiment is obtained by acquiring copyright identification information or the like as watermark data, superimposing it on audio data to produce superimposed audio data, and using a result of a predetermined summation for each predetermined period.
  • the present invention relates to an audio digital watermarking device for embedding watermark data such as chopstick crop identification information.
  • the audio digital watermarking apparatus of the first embodiment Is composed of an audio data acquisition unit 0101, a watermark data acquisition unit 0102, a watermark generation data generation unit 0103, and a superimposed audio data generation unit 0104.
  • the audio data acquisition unit acquires audio data.
  • the watermark data acquisition unit acquires the watermark data.
  • watermark data corresponds to digital data such as codes and texts for copyright identification information and IDs used for content distribution and the like.
  • the watermark generation data generating unit superimposes the audio data obtained by the audio data obtaining unit on the audio data obtaining unit, and superimposes the audio data on the audio data obtaining unit. Generate watermark generation data.
  • the result of the predetermined sum in each predetermined cycle refers to the result of the predetermined sum of the watermark generation data of the superimposed audio data in each of the predetermined cycles.
  • the “predetermined cycle” includes half cycle, 1 cycle, 1.5 cycle, 2 cycle, 2.5 cycle, 3 cycle, and so on.
  • the “predetermined sum” corresponds to a sum for a half cycle, a sum for one cycle, and the like.
  • the “result of the predetermined sum” includes a half period, a sum over one period, a sign of the sum, and a sign of the difference of the sum.
  • the superimposed audio data generation unit generates superimposed audio data by superimposing the audio data acquired by the audio data acquisition unit and the watermark generation data generated by the watermark generation data generation unit. Description based on specific examples>
  • Embodiment 1 of the present invention will be described in detail using a specific example.
  • the audio data of the waveform pattern shown in Fig. 2 is acquired.
  • a digitized data such as a pulse code modulation (PCM) may be obtained, or an analog waveform may be obtained and sampled and quantized. May be converted to digital data.
  • PCM pulse code modulation
  • the compressed audio data may be decrypted and extracted as PCM data.
  • the watermark data can be anything as long as it is digital information.
  • a character string consisting of alphabets without compression convert the value to ASCII code and display the value in binary.
  • Watermark generation data is represented by a function obtained by multiplying the underlying function (hereinafter referred to as the base function) by the amplitude a.
  • the base function the underlying function
  • FIG. 1 shows an example of the fundamental function u (t), in which a sine wave with a period R / f is moved upward and adjusted so that the maximum and minimum values are 1 and 0, respectively. .
  • this function u (t) Since the value of this function u (t) is frequently used when embedding watermark data, one cycle is calculated in advance and the list of the function values is stored in memory.
  • u (0), u (1),..., U (R / f-1) are stored in the memory.
  • the value at the sampling point t in the i-th cycle can be obtained from the value for one cycle using the following relational expression.
  • u (t) u (t-(i-l)-R / f)
  • Superimposed audio data is generated by adding the watermark generation data and the original audio data. Assuming that the sample value of the original audio data is V (t), the superimposed audio data is as follows.
  • ⁇ w (t) ⁇ v (t) + a; ⁇ ⁇ u (t).
  • represents the sum of one cycle of the i-th cycle of the watermark generation data.
  • V i ⁇ V (t)
  • U ⁇ u (t) far.
  • V i generally changes every period i, but U is a constant. This constant U is also stored in the memory in advance.
  • the value of a is determined so that the absolute value of the sum of the superimposed audio data is constant and the sign represents the bit value of the watermark data. Assuming that the bit value is b (0 or 1) and the absolute value of the sum of the superimposed audio data is S,
  • the function representing the watermark generation data is obtained by multiplying the base function of the watermark generation data by this amplitude a;
  • FIG. 5 is a schematic diagram of the watermark generation data waveform pattern corresponding to the watermark data character "C".
  • the sign of amplitude a; and the sign of (1-1) b match, but depending on the size of It could be.
  • the sign of the bit value is not the sign of the amplitude of the watermark generation data, but the sign of the sum of the superimposed audio data.
  • w (t) V (t) + ⁇ (-1) b ⁇ S-V i ⁇ ⁇ u (t) / U
  • audio data for one cycle of watermark generation data enters A 01, where the sum of the above equations is calculated and output to A 03.
  • the watermark data enters A 02, where the code of (11) b in the above equation is output to A 03 every cycle of the watermark generation data according to the bit value. That is, when the bit value is 0, “positive” is output, and when the bit value is 1, “negative” is output.
  • AO 3 uses these two values to generate watermark generation data according to the above equation, and outputs the data of the watermark generation data to AO 4.
  • the AO 4 generates and outputs superimposed audio data containing watermark data by superimposing the data of the watermark generation data and the original audio data.
  • the process of embedding the watermark data is reversible, and if there is time series data of the amplitude of the watermark generation data used at the time of embedding the watermark data, it can be completely restored. Furthermore, even if one person embeds the watermark data and another person embeds another watermark data, if there is time-series data of the amplitude of the watermark generation data used in each process, Each watermark data can be extracted and restored to the original audio data. In this way, it is possible to embed any number of layers.For example, after the copyright holder embeds information about the copyright, while the copyright is protected, the content distribution company can make unauthorized secondary distribution. For example, it is possible to embed a unique ID for the purpose of preventing the problem.
  • the person who claims the copyright of the audio data takes his original, unwatermarked original audio data (which he claims) to where he controls the copyright, Using the time series data of the amplitude of the watermark generation data, it is combined with the original audio data brought in. If this matches the superimposed audio data containing the watermark data that is actually distributed, it can be determined that the data was created by that person.
  • the detection of the start point of the watermark data, the error processing, and the like have been omitted, but these can be easily implemented by conventional well-known techniques.
  • a specific bit pattern may be inserted before the watermark data in advance, and decoding may be started immediately after the pattern is found. Specifically, it skips the point where the amplitude is zero unconditionally, finds the point where it is synchronized with the start code while shifting the start position little by little, and then finds the watermark.
  • For error processing there is a method of embedding a check sum or the like as watermark data and checking it at the time of decoding.
  • FIG. 7 shows a processing flow of the first embodiment.
  • the audio data acquisition section acquires audio data (step S0701).
  • the watermark data acquisition unit acquires the watermark data (Step S 0 7 0 2) 0
  • the watermark generation data generation unit superimposes the audio data obtained in step S7071 on the basis of the watermark data obtained in step SO702 to form superimposed audio data.
  • Watermark generation data is generated in which the result of the predetermined summation for each predetermined period represents the watermark data acquired in step S7072 (step S7073).
  • the superimposed audio data generation unit generates superimposed audio data by superimposing the audio data obtained in step SO701 and the watermark generation data generated in step S7073 ( Step S0704).
  • copyright identification information and the like are obtained as watermark data, superimposed on audio data to be superimposed audio data, and the watermark information is expressed by a result of a predetermined summation in each predetermined cycle.
  • the watermark generation data since one bit is encoded in one wavelength of the watermark generation data, even though the watermark generation data has a long wavelength, many bits are efficiently transmitted.
  • the data can be embedded.
  • the invention according to the second embodiment relates to the audio digital watermarking device according to the first embodiment, which generates low-frequency watermark generation data that cannot be heard by human ears.
  • the audio watermarking device 0800 of the second embodiment includes an audio data acquisition unit 08001, a watermark data acquisition unit 0802, and a watermark generation data generation unit 0800. 8 0 3 and a superimposed audio data generation unit 0 8 0 4.
  • the watermark generation data generation unit generates low-frequency watermark generation data that cannot be heard by the human ear.
  • low frequency that cannot be heard by the human ear means a low frequency of about 20 Hz or less.
  • the configuration is the same as that of the first embodiment (configuration requirement: superimposed audio data generation unit), and a description thereof will be omitted.
  • Embodiment 2 of the present invention will be described in detail using a specific example.
  • the watermark generation data uses a low frequency that cannot be heard by human ears.
  • the sampling rate of audio data is 44.1 kHz
  • a function with a frequency of 10 Hz is used as watermark generation data.
  • the primitive function u (t) is a function of the period 4 4. I k Z l O.
  • FIG. 9 shows a processing flow of the second embodiment.
  • the audio data acquisition section acquires audio data (step S0901).
  • the watermark data acquisition unit acquires the watermark data (step S0902).
  • the watermark generation data generation unit superimposes the audio data obtained in step S9091 on the basis of the watermark data obtained in step S9092 to generate superimposed audio data.
  • step S0903 low-frequency watermark generation data that cannot be heard by the human ear is generated, and the result of the predetermined summation for each predetermined period represents the watermark data acquired in step S0902.
  • the superimposed audio data generation unit obtains the data in step SO901. W
  • the superimposed audio data is superimposed on the watermark generation data generated in step S 0903 to generate superimposed audio data (step S 0904).
  • the invention according to the third embodiment relates to the audio digital watermarking apparatus according to claim 1 or 2, wherein a function representing the data for watermark generation has a value and a slope at a boundary where the amplitude changes are always zero. .
  • an audio watermarking apparatus 1003 includes an audio data acquisition unit 1001, a watermark data acquisition unit 1002, and data generation for watermark generation. And a superimposed audio data generation unit 1004.
  • the watermark generation data generation unit generates the watermark generation data in which the value and the slope at the boundary where the amplitude of the function represented by the watermark generation data generated thereby changes are always zero.
  • the configuration is the same as that of the first or second embodiment (configuration requirement: watermark generation data generation unit), and thus the description is omitted.
  • Embodiment 3 of the present invention will be described in detail using a specific example.
  • a function in which the value and the slope at the boundary where the amplitude changes always become zero is used.
  • xn is the nth boundary point where the amplitude changes.
  • watermark generation data base function generation
  • Embodiment 3 except that the base function u (X) satisfies the condition of (watermark generation data: generation of base function), the same as (watermark generation data: summation calculation) of Embodiment 1 or 2. Therefore, the description is omitted.
  • Embodiment 3 except that the primitive function u (X) satisfies the condition of (watermark generation data: generation of primitive function), the description is the same as (superimposed audio data generation) of Embodiment 1 or 2. Omitted.
  • FIG. 12 shows the processing flow of the third embodiment.
  • the audio data acquisition section acquires audio data (step S1221).
  • the watermark data obtaining unit obtains the watermark data (step S122).
  • the watermark generation data generation section superimposes the audio data acquired in step S1221, based on the watermark data acquired in step S1222, as superimposed audio data.
  • the result of the predetermined summation for each predetermined period represents the watermark data obtained in step S122, and the watermark and the value at the boundary where the amplitude of the function represented by the watermark generation data changes are always zero.
  • the generation data is generated (step S1203).
  • the superimposed audio data generation unit superimposes the audio data acquired in step S1201 and the watermark generation data generated in step S1203 to superimpose the superimposed audio data. Generate (Step S1204).
  • the invention according to the fourth embodiment is characterized in that the amplitude of the watermark generation data is adaptively changed every half cycle so that the result of the predetermined summation of the superimposed audio data for each predetermined cycle represents the watermark data.
  • the present invention relates to the audio digital watermarking device according to any one of 1 to 3.
  • the audio digital watermarking device 1300 of the fourth embodiment includes an audio data acquisition unit 1301, a watermark data acquisition unit 1302, and a watermark generation data generation unit 1. 303, and a superimposed audio data generation unit 1304.
  • the watermark generation data generator adaptively adjusts the amplitude of the watermark generation data every half cycle so that the result of the predetermined sum at each predetermined cycle represents the watermark data acquired by the watermark data acquisition unit. To change.
  • Embodiment 4 of the present invention will be described in detail using a specific example. .
  • Watermark generation data is represented by a function obtained by multiplying the underlying function (hereinafter referred to as the base function) by the amplitude a.
  • the base function the underlying function
  • a the amplitude
  • u (0), u (1),..., u (R / f / 2-1) are stored in memory.
  • the values u (R / f / 2), u (R / f / 2 + 1),..., u (R / f-1) in the second half of the second half are inverted in the sign of the value in the first half of the period Things.
  • the value at the sampling point t in the i-th cycle can be obtained from the above list of function values using the following relational expression.
  • u (t) u (t-(i-l)-R / f)
  • sample value at the sample point t of the superimposed audio data containing the watermark generation data is w (t)
  • it can be expressed by the following equation. w (t) V + a (t) u (t) w (t) over half the i-th period of the watermark generation data Add up.
  • a (t) is set to a constant value in this half cycle. If this constant value is a;
  • ⁇ w (t) ⁇ v (t) + ⁇ u (where ⁇ represents the sum of half the i-th period of the watermark generation data.
  • represents the sum of half the i-th period of the watermark generation data.
  • the i-th period The first half cycle of:
  • V H ⁇ V (t)
  • the values of a Li and a 2i are determined so that the absolute value of the sum of the audio data superimposed every half cycle of the watermark generation data is constant and the code represents the bit value of the watermark data.
  • the sum of the audio data superimposed in the second half cycle of the watermark generation data is opposite in sign to the sum of the first half cycle.
  • a 2i ⁇ -(— 1) b ⁇ S — V 2i ⁇ / U.
  • one cycle represents one bit, so b generally differs for each i.
  • the function that represents the watermarking generation data is obtained by multiplying the base function u (t) of the watermark generation data by the amplitudes a Li and a 2i , that is, the first half of the i-th cycle: ⁇ (-1) s -V u ⁇ / UJ u (t
  • FIG. 16 is a schematic diagram of a waveform pattern of the generation data corresponding to the character “C” of the watermark data.
  • the sign of the watermark generation data corresponds to the bit value. However, in general, the sign may be inverted depending on the magnitudes of VH and V2i .
  • the sign of the bit value is not the sign of the watermark generation data, but the sign of the sum of the superimposed audio data. It is.
  • the audio data w (t) synthesized with the watermark generation data is as follows.
  • FIG. 17 shows the processing flow of the fourth embodiment.
  • the audio data obtaining unit obtains audio data (step S1701).
  • the watermark data obtaining unit obtains the watermark data (step S).
  • the watermark generation data generation unit sets the amplitude of the watermark generation data so that the result of the predetermined summation of the superimposed audio data for each predetermined period represents the watermark data acquired in step S1702. It is changed adaptively every half cycle (step S1703).
  • the superimposed audio data generation unit generates superimposed audio data by superimposing the audio data obtained in step S1701 and the watermark generation data generated in step S1703.
  • the invention according to the fifth embodiment is characterized in that the result of the predetermined summation of the superimposed audio data for each predetermined cycle is a sign of the sum of the superimposed audio data for each half cycle of the watermark generation data.
  • the present invention relates to an audio digital watermarking device described in item 1.
  • the audio watermarking device 1800 of the fifth embodiment includes an audio data acquisition unit 1801, a watermark data acquisition unit 1802, and a watermark generation data generation unit. It consists of 1803 and a superimposed audio data generation unit 1804.
  • the watermark generation data generation unit generates the watermark generation data so that the result of the predetermined summation of the superimposed audio data for each predetermined period represents the watermark data acquired by the watermark data acquisition unit.
  • the “result of the predetermined sum in each predetermined cycle” refers to the sign of the sum of the superimposed audio data in each half cycle of the watermark generation data.
  • the configuration is the same as that of the fourth embodiment (configuration requirement: superimposed audio data generation unit), and a description thereof is omitted.
  • Embodiment 5 of the present invention will be described in detail using a specific example.
  • audio data for a half cycle of the watermark generation data enters A 01, where the sum of the above equations is calculated and output to A 03.
  • the watermark data enters A 0 2, where the sign of (1 1) b or 1 (1 1) b in the above equation is output to A 0 3 every half cycle of the watermark generation data according to the bit value. Is done. That is, in the first half period, when the bit value is 0, “positive” is output, and when it is 1, “negative” is output. In the second half period, when the bit value is 0, “negative” is output. When it is 1, “positive” is output.
  • AO 3 uses these two values to generate watermark generation data according to the above equation, and outputs the watermark generation data to AO 4.
  • the AO 4 generates and outputs superimposed audio data containing the watermark data by superimposing the data of the watermark generation data and the original audio data.
  • FIG. 20 shows a processing flow of the fifth embodiment.
  • the audio data acquisition unit acquires audio data (step S201).
  • the watermark data obtaining unit obtains the watermark data (step S2002).
  • the watermark generation data generation unit generates the watermark so that the sign of the sum of the superimposed audio data for each half cycle of the watermark generation data represents the watermark data acquired in step S2002. Data is generated (step S2003).
  • the superimposed audio data generation unit superimposes the audio data obtained in step S2001 and the watermark generation data generated in step S2003 to convert the superimposed audio data. It is generated (step S2004).
  • the sign of the sum of the superimposed audio data over half the period of the watermark generation data represents 0Z1 of each bit of the watermark data
  • the watermark data can be easily detected and decoded.
  • the absolute value of the sum always has a constant value different from zero, a digital watermark that is durable against deformation of audio data can be realized.
  • the result of the predetermined sum for each predetermined cycle is a sign of a difference between the sum of the superimposed audio data of the first half cycle and the second half cycle of the watermarking generation data.
  • the present invention relates to the audio digital watermark device according to one of the above aspects.
  • the audio digital watermarking device 2100 of the sixth embodiment includes an audio data acquisition unit 2101, a watermark data acquisition unit 2102, and a watermark generation data generation unit 2. 103 and a superimposed audio data generation unit 210.
  • the configuration is the same as that of the fourth embodiment (component requirement: watermark data acquisition unit), and the description is omitted.
  • the watermark generation data generator adaptively adjusts the amplitude of the watermark generation data every half cycle so that the result of the predetermined summation of the superimposed audio data at each predetermined cycle represents the watermark data acquired by the watermark data acquisition unit. Change to.
  • the “result of the predetermined sum in each predetermined cycle” refers to the sign of the difference between the sum of the superimposed audio data in the first half cycle and the second half cycle of the watermark generation data.
  • the configuration is the same as that of the fourth embodiment (component requirement: watermark generation data generation unit), and a description thereof is omitted.
  • the configuration is the same as that of the fourth embodiment (configuration requirement: superimposed audio data generation unit), and a description thereof is omitted.
  • FIG. 22 shows the processing flow of the sixth embodiment.
  • the audio data acquisition section acquires audio data (step S2201).
  • the watermark data obtaining unit obtains the watermark data (step S2202).
  • the watermark generation data generation unit calculates the difference sign of the sum of the first half period and the second half period of the watermarking generation data of the superimposed audio data by using the watermark data acquired in step S222. As shown, data for watermark generation is generated (step S2203).
  • the superimposed audio data generation unit superimposes the audio data obtained in step S221 and the watermark generation data generated in step S223 to superimpose the superimposed audio data. Generate (Step S2204).
  • the 0--1 of each bit of the watermark data is expressed by the sign of the difference between the sum of the predetermined first half period and the second half period of the watermarked superimposed audio data.
  • Embodiment 7 is an audio digital watermark decoding that calculates a result of a predetermined sum of watermarking generation data of the acquired superimposed audio data for each predetermined period, and decodes watermark data based on the result.
  • the audio digital watermark decoding apparatus 230 of Embodiment 7 includes a superimposed audio data acquiring section 2301, a sum calculating section 2302, and a watermark data decoding section 23. 0 3 and
  • the superimposed audio data acquisition unit acquires superimposed audio data.
  • the total sum calculation unit calculates a result of a predetermined sum of the superimposed audio data acquired by the superimposed audio data acquisition unit at predetermined intervals.
  • the result of the predetermined sum in each predetermined cycle refers to the result of the predetermined sum of the superimposed audio data in each of the predetermined cycles of the watermark generation data.
  • the “predetermined cycle” includes half cycle, 1 cycle, 1.5 cycle, 2 cycle, 2.5 cycle, 3 cycle, and so on.
  • Predetermined sum is the sum of half cycle, 1 cycle And so on.
  • the “result of the predetermined sum” includes a half cycle, a sum over one cycle, a sign of the sum, and a sign of a difference of the sum.
  • the watermark data decoding unit decodes the watermark data based on the result of the predetermined sum calculated by the sum calculation unit.
  • Embodiment 7 of the present invention will be described in detail using a specific example.
  • the acquisition of the superimposed audio data of the seventh embodiment is assumed to acquire the superimposed audio data w (t) generated in the first embodiment.
  • the difference between each bit value of the watermark data is Since the difference appears in the sign of the sum of the data, it is possible to obtain the sum of one cycle, determine the 0Z1 of each bit of the watermark data using the code, and decode the data.
  • FIG. 24 A block diagram of this watermark data detection process is shown in Fig. 24.
  • each sample value of the superimposed audio data containing the watermark data is represented by B01 , The sum of one cycle is calculated, and the sign is output to B02.
  • B02 In B02, 0 or 1 is selected according to the code, and is output as watermark data.
  • FIG. 25 shows the processing flow of the seventh embodiment.
  • the superimposed audio data acquisition unit acquires superimposed audio data of the watermark generation data and the audio data (step S2501).
  • the sum calculation unit calculates a result of a predetermined sum of the superimposed audio data acquired in step S2501 for each predetermined cycle of the watermark generation data (step S2501) ).
  • the watermark data decoding unit determines and decodes the bit value of the watermark data based on the result of the predetermined sum calculated in step S2502 (step S2503).
  • the invention described in the seventh embodiment it is possible to determine 0-1 of each bit of the watermark data based on the result of the predetermined sum of the overlapped audio data for the predetermined period of the watermark generation data, so that the watermark data can be easily detected and decoded. It is. In addition, the result of the above-mentioned predetermined summation is not affected by the deformation of the audio data. Therefore, it is possible to realize a digital watermark that is simple to use.
  • the audio watermark decoding apparatus wherein the watermark data is decoded based on a sign of a value obtained by summing the superimposed audio data over a half period of the watermark generation data.
  • the audio digital watermark decoding device 260 of Embodiment 8 includes a superimposed audio data acquisition unit 2601, a sum calculation unit 2602, and a watermark data decoding unit 26. 0 3 and power.
  • the superimposed audio data acquisition unit acquires superimposed audio data.
  • the sum calculation unit calculates the sign of the sum of the values over a half period of the watermark generation data.
  • the watermark data decoding unit decodes the watermark data based on the sign of the sum calculated by the sum calculation unit.
  • Embodiment 8 of the present invention will be described in detail using a specific example.
  • the acquisition of the superimposed audio data according to the eighth embodiment is described as an example in the fifth embodiment. Assuming that the superimposed audio data w (t) generated by is obtained, the first half of the i-th cycle:
  • the sum of the superimposed audio data in the first half and the second half of the i-th cycle is equal to the first half of the i-th cycle, £ w (t) ⁇ ,, + u
  • the difference in each bit value of the watermark data appears as a difference in the sign of the sum of the superimposed audio data.
  • the code can determine 0/1 for each bit of the watermark data and decode it.
  • Fig. 27 shows a block diagram of this watermark data detection process.
  • each sample value of the superimposed audio data containing the watermark data is shown for each half cycle of the watermark generation data (the first half). It enters B 0 1 (per cycle or every second half cycle), where the sum of the half cycle is calculated and the sign is output to B 0 2.
  • B02 0 or 1 is selected according to the sign, and output as watermark data.
  • FIG. 28 shows a processing flow of the eighth embodiment.
  • the superimposed audio data acquisition unit acquires superimposed audio data of the watermark generation data and the audio data (step S2801).
  • the sum calculation unit calculates the sign of the value obtained by summing the superimposed audio data obtained in step S2801 over the half cycle of the watermark generation data (for each first half cycle or for each second half cycle). Is calculated (step S2802).
  • the watermark data decoding unit determines a bit value from the sign of the sum calculated in step S2802 and decodes the bit value (step S2803).
  • Embodiment 9 ⁇ Concept of Embodiment 9>
  • the invention according to the ninth embodiment wherein the watermark data is decoded based on the sign of the difference between the sum of the superimposed audio data over the first half period of the watermark generation data and the sum over the second half period of the watermark generation data.
  • the present invention relates to a digital watermark decoding device.
  • the audio watermark decoding apparatus 2900 of the ninth embodiment includes a superimposed audio data acquisition section 2901, a sum calculation section 2902, and a watermark data decoding section 2900. 90 3 and power.
  • the superimposed audio data acquisition unit acquires superimposed audio data.
  • the sum calculation unit calculates the sign of the difference between the sum of the superimposed audio data acquired by the superimposed audio data acquisition unit over the first half period of the watermark generation data and the second half of the watermark generation data.
  • the watermark data decoding unit decodes the watermark data based on the sign of the sum difference calculated by the sum calculation unit.
  • Embodiment 9 of the present invention will be described in detail using a specific example.
  • the difference in each bit value of the watermark data appears as a difference in the sign of the above equation.
  • Fig. 30 shows a block diagram of this watermark data detection process.
  • the superimposed audio data containing the watermark data enters B 0 1 for each half cycle of the watermark generation data.
  • the difference between the sum of the periods and the sum of the second half is calculated, and the sign is output to B02.
  • B02 0 or 1 is selected according to the code, and output as watermark data.
  • FIG. 31 shows a processing flow of the ninth embodiment.
  • the superimposed audio data acquisition unit acquires superimposed audio data of the watermark generation data and the audio data (step S3101).
  • the sum calculation unit calculates the sign of the difference between the sum of the superimposed audio data acquired in step S3101 over the time of the first half cycle of the watermark generation data and the time of the second half cycle (step S3102).
  • the watermark data decoding unit decodes the watermark data such that the sign of the value calculated in step S3102 represents the bit value of the watermark data (step S3103).
  • 0/1 of each bit of the watermark data is determined by the sign of the difference between the sum of the superimposed audio data over the first half cycle of the watermark generation data and the sum of the second half cycle.
  • DC offset cancels and is more resistant to distortion Digital watermarking can be realized.
  • the amplitude of the watermark generation data can be arbitrarily set without deteriorating the sound quality of the original audio data.
  • the size can be increased, and the watermark strength can be increased.
  • the watermark data can be detected / decoded.
  • the process of embedding the watermark data is reversible, and if there is time series data of the amplitude of the watermark generation data used at the time of embedding the watermark data, it can be completely restored. Furthermore, even if one person embeds the watermark data and another person embeds another watermark data, if there is time series data of the amplitude of the watermark generation data used in each process. Data can be extracted and restored to the original audio data. In this way, it is possible to embed any number of layers.For example, after a copyright owner embeds copyright information, a content distributor prevents unauthorized secondary distribution while protecting the copyright. It is also possible to embed a unique ID for the purpose.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

 オーディオデータに透かしデータを埋め込んでも雑音にならず、非可逆圧縮などによる変形に対して耐久性があり、透かしデータの埋め込み過程が可逆で、透かしデータの検出が容易であるオーディオデータ電子透かし装置を実現する。 人間の耳では聞き取れない低周波数の音を透かし生成用データとして用い、元のオーディオデータと重畳して重畳オーディオデータとすることで所定周期ごとの重畳オーディオデータの所定総和の値を制御し、符号化する。透かしデータ検出時にはその透かしの入った重畳オーディオデータの所定周期ごとの所定総和の結果から透かしデータの0/1を判定し、復号する。

Description

明細書 オーディオ電子透かし装置 技術分野
本発明は、 オーディオデータに著作識別情報などを透かしデータ と し て埋め込む'装置、 及ぴその透かしデータの埋め込まれたオーディオデー タから透かしデータを検出し、 復号する装置に関する。 背景技術
音楽等のオーディオデータに電子透かしを埋め込む技術は数多く ある 力 S、 一般に透かしデータを埋め込むこ と による音質の劣化と透かしデー タの耐久性とは ト レー ドオフの関係にあ り 、 両立させるこ とが難しかつ た。 例えば、 オーディオデータのサンプル値の下位の数ビッ トで透かし データを表現する と ノイズはあま り 目立たないが、 この情報は周波数変 換したと き高周波成分と して現れるため M P 3等の圧縮ソフ トで圧縮を かける と容易に消えてしま う。 また、 はじめから M P 3圧縮に特化した 電子透かし、 たと えば量子化された周波数成分の偶奇等を使って符号化 する といつた電子透かしもあるが、 圧縮率を変えて再圧縮する と消えて しま う場合が多い。 さ らに、 圧縮方式のシンタ ックスに着目 して音質を まったく 劣化させずに透かしデータを埋め込むとい う方法もあるが、 こ の場合、 一旦波形データに変換する と透かし情報は消えてしま う。 その 他にも、 たと えば統計的な偏り等を利用 した方法もあるが、 電子透かし の耐久性を高めるために 1 ビッ トを表現するのに必要なサンプルの数を 増やすとそれだけ埋め込むこ との出来るデータの量が少なく なり 、また、 偏り を大き く する とそれだけ透かしデータの強度は增すが、 元のオーデ ィォデータの音質の劣化の度合いも大き く なる とい う 問題がある。 この よ う に、 元のオーディオデータの音質を劣化させる こ となく透かしデー タを埋め込むこ とができ、 非可逆圧縮等による変形を与えても透かしデ ータが残り 、 且つ容易に透かしデータを検出できる という理想的な電子 透かしの技術はまだ確立されていないというのが現状であった。
(特許文献)
特開 2 0 0 2 — 3 0 4 1 8 4 発明の開示
近年デジタル化が進み、 元のオーディオデータ と寸分違わないコ ピー を誰でも簡単に作れるよ う になつてきた。 また、 これらのデータは M P 3 ( M P E Gオーディオレイヤー 3 ) 等の圧縮ソフ トで圧縮され、 イ ン ターネッ トを介して配布されるこ と も多く なつた。
このよ う な行為は、 そのオーディオデータを正規に購入したユーザが 個人的に利用する分には問題ないが、 違法コ ピーし、 不正に配布される 場面も多く 見られる よ う になった。 このよ う な状況下では著作権者は著 作料を徴収するこ とが困難になり 、 創作意欲も低下しかねない。
そこで、 このよ う な不正行為から著作権者の権利を守るため、 個々の オーディオデータにその作者の著作権に関する情報を電子透かしと して 埋め込む技術が模索されている。
第一の発明は、 音声記録媒体に透かしデータ を記録するためのオーデ ィォ電子透かし装置であって、 オーディオデータを取得するオーディオ データ取得部と、 透かしデータを取得する透かしデータ取得部と、 前記 オーディオデータ取得部で取得したオーディオデータ と重畳して重畳ォ 一ディォデータ とするこ とで所定周期ごとの重畳オーディ オデータの所 定総和の結果が前記透かしデータ取得部で取得した透かしデータを表す 透かし生成用データを生成する透かし生成用データ生成部と、 前記ォー ディォデータ取得部で取得したオーディオデータ と、 前記透かし生成用 データ生成部で生成した透かし生成用データ と を重畳して重畳オーディ ォデータを生成する重畳オーディ オデ一タ生成部と、 を有するオーディ ォ電子透かし装置に関する。
第二の発明は、 前記透かし生成用データ生成部は、 人間の耳で聞き と れない低周波の透かし生成用データを生成する請求項 1 に記載のオーデ ィォ電子透かし装置に関する。
第三の発明は、 前記透かし生成用データ生成部は、 それによつて生成 される透かし生成用データの表す関数の振幅の変化する境界における値 と傾きが常にゼロである前記透かし生成用データを生成する請求項 1 又 は 2 に記載のオーディオ電子透かし装置に関する。
第四の発明は、 前記透かし生成用データ生成部は、 前記所定周期ごと の前記所定総和の結果が前記透かしデータ取得部で取得した透かしデー タを表すよ う に、 前記透かし生成用データの表す関数の振幅を半周期ご とに適応的に変化させる請求項 1 から 3 のいずれか一に記載のオーディ ォ電子透かし装置に関する。
第五の発明は、 前記所定周期ごとの前記所定総和の結果は、 前記透か し生成用データの半周期ごとの前記重畳オーディオデータの総和の符号 である請求項 1 から 4 のいずれか一に記載のオーディ オ電子透かし装置 に関する。
第六の発明は、 前記所定周期ごとの前記所定総和の結果は、 前記透か し生成用データの前半周期と後半周期に対応する前記重畳オーディ オデ ータの総和の差分の符号である請求項 1 から 4 のいずれか一に記載のォ 一ディォ電子透かし装置に関する。
第七の発明は、 音声記録媒体に記録された透かしデータ を復号するた めのオーディオ電子透かし復号装置であって、 重畳オーディ オデータを 取得する重畳オーディォデータ取得部と、 重畳オーディ オデータ取得部 で取得した重畳オーディオデータ の前記所定周期ごとの所定総和の結果 を算出する総和算出部と、 前記総和算出部で算出された前記所定総和の 結果に基づいて前記透かしデータ を復号する透かしデータ復号部と、 を 有するオーディオ電子透かし復号装置に関する。
第八の発明は、 前記総和算出部は、 前記重畳オーディ オデータ取得部 で取得した重畳オーディオデータの、 前記透かし生成用データの半周期 の時間にわたる総和の符号を算出する請求項 7 に記載のオーディオ電子 透かし復号装置に関する。
第九の発明は、 前記総和算出部は、 前記重畳オーディオデータ取得部 で取得した重畳オーディオデータの、 前記透かし生成用データの 1周期 の前半の半周期の時間にわたる総和と後半の半周期の時間にわたる総和 の差の符号を算出する請求項 7 に記載のオーディオ電子透かし復号装置 に関する。 図面の簡単な説明
図 1 は実施形態 1 の機能ブロ ック図である。
図 2 は実施形態 1 で取得されるオーディオデータの波形パターンを示 す図である。
図 3 は実施形態 1 で生成される透かし生成用データの基関数の波形パ ターンを示す図である。
図 4は実施形態 1 で生成される透かし生成用データの基関数のサンプ リ ングパターンを示す図である。
図 5 は実施形態 1 で生成される文字 「 C」 の透かし生成用データの波 形パターンを示す図である。 3 006114
図 6 は実施形態 1 の電子透かし埋め込み過程を示す図である。
図 7 は実施形態 1 の処理の流れを示す図である。
図 8 は実施形態 2の機能プロ ック図である。
図 9 は実施形態 2の処理の流れを示す図である。
図 1 0 は実施形態 3 の機能ブロ ック図である。
図 1 1 は実施形態 3で生成される透かし生成用データの基関数の波形 パターンを示す図である。
図 1 2 は実施形態 3の処理の流れを示す図である。
図 1 3 は実施形態 4の機能プロ ック図である。
図 1 4は実施形態 4 で生成される透かし生成用データの基関数の波形 パターンを示す図である。
図 1 5 は実施形態 4で生成される透かし生成用データの基関数のサン プリ ングパターンを示す図である。
図 1 6 は実施形態 4で生成される文字 「 C」 の透かし生成用データの 波形パターンを示す図である。
図 1 7は実施形態 4の処理の流れを示す図である。
図 1 8は実施形態 5の機能プロ ック図である。
図 1 9 は実施形態 5 の電子透かし埋め込み過程を示す図である。
図 2 0は実施形態 5の処理の流れを示す図である。
図 2 1 は実施形態 6 の機能ブロ ック図である。
図 2 2は実施形態 6 の処理の流れを示す図である。
図 2 3は実施形態 7 の機能ブロ ック図である。
図 2 4は実施形態 7の電子透かし検出過程を示す図である。
図 2 5は実施形態 7に処理の流れを示す図である。
図 2 6は実施形態 8 の機能プロ ック図である。
図 2 7は実施形態 8 の電子透かし検出過程を示す図である。 図 2 8 は実施形態 8 の処理の流れを示す図である。
図 2 9 は実施形態 9 の機能プロ ック図である。
図 3 0 は実施形態 9 の電子透かし検出過程を示す図である。
図 3 1 は実施形態 9 の処理の流れを示す図である。 発明を実施するための最良の形態
以下に本件発明の実施形態を説明する。 実施形態と、 請求項との関係 はおおむね次のよ うなものである。 実施形態 1 は、 主に、請求項 1 、請求項 1 0 など ついて説明 している。 実施形態 2 は、 主に、請求項 2、請求項 1 1 など ついて説明 している。 実施形態 3 は、 主に、請求項 3、請求項 1 2 など こついて説明 している。 実施形態 4 は、 主に、請求項 4、請求項 1 3 など こついて説明 している。 実施形態 5 は、 主に、請求項 5、請求項 1 4 など こついて説明 している。 実施形態 6 は、 主に、請求項 6、請求項 1 5 など こついて説明 している。 実施形態 7 は、 主に、請求項 7、請求項 1 6 など こついて説明 している。 実施形態 8 は、 主に、請求項 8 、請求項 1 7 など こついて説明 している。 実施形態 9 は、 主に、請求項 9、請求項 1 8 など こついて説明 している。
< <実施形態 1 > >
<実施形態 1 の概念 >
実施形態 1 に記載の発明は、 著作識別情報などを透かしデータ と して 取得し、 オーディオデータ と重畳して重畳オーディオデータ と し、 その 所定周期ごと の所定総和の結果を用いるこ と によ り 、 その箸作識別情報 などの透かしデータを埋め込むオーディオ電子透かし装置に関する。
く構成要件の明示 >
図 1 に示すよ う に、 実施形態 1 のオーディオ電子透かし装置 0 1 0 0 は、 オーディオデータ取得部 0 1 0 1 と、 透かしデータ取得部 0 1 0 2 と、 透かし生成用データ生成部 0 1 0 3 と、 重畳オーディオデータ生成 部 0 1 0 4 と、 力 らなる。
く構成の説明 >
<基本機能ブロ ック図の導入 >
(構成要件 : オーディォデータ取得部)
オーディオデータ取得部は、 オーディオデータを取得する。
(構成要件 : 透かしデータ取得部)
透かしデータ取得部は、 透かしデータを取得する。
ここで 「透かしデータ」 には、 著作識別情報等のコー ドやテキス ト、 コンテンツ配信等に用いる I D等のデジタルデータが該当する。
(構成要件 : 透かし生成用データ生成部)
透かし生成用データ生成部は、 オーディオデータ取得部で取得したォ 一ディォデータ と重畳して重畳オーディオデータ とするこ とで所定周期 ごとの所定総和の結果が透かしデータ取得部で取得した透かしデータを 表す透かし生成用データを生成する。
ここで 「所定周期ごとの所定総和の結果」 と は、 重畳オーディオデー タの、透かし生成用データの所定周期ごとの所定総和の結果をいう。 「所 定周期」 には、 半周期、 1周期、 1 . 5周期、 2周期、 2 . 5周期、 3 周期、 · · · などが該当する。 「所定総和」 には、 半周期分の総和、 1周 期分の総和などが該当する。 「所定総和の結果」 には、 半周期、 1周期に わたる総和、 総和の符号、 総和の差の符号などが該当する。
(構成要件 : 重畳オーディオデータ生成部)
重畳オーディオデータ生成部は、 オーディオデータ取得部で取得した オーディオデータ と 、 透かし生成用データ生成部で生成した透かし生成 用データ と を重畳して重畳オーディオデータを生成する。 く具体例に基づく説明 >
以下、 本発明の実施形態 1 について、 具体的な例を使って詳細に説明 する。
(オーディォデータ取得)
図 2 に示すよ う な波形パターンのオーディオデータを取得する。
なお、 オーディオデータ と しては、 P CM ( P u l s e C o d e M o d u 1 a t i o n ) 等のすでにデジタル化されたものを取得してもよ いし、 アナロ グ波形を取得し、 それをサンプリ ング 量子化してデジタ ルデータに変換してもよい。 また、 圧縮されたオーディ オデータを復号 して P CMデータ と して取り 出したものでもよレ、。
(透かしデータ取得)
次に、 透かしデータについて述べる。 透かしデータはデジタル情報で あれば何でもよ く 、 一例と しては、 著作識別情報等を示すコー ドや文字 列があるが、 いずれの場合も 2進数で表しておく 。 例えば、 アルフ ァべ ッ トからなる文字列を非圧縮で埋め込む場合、 A S C I I コー ドに変換 してその値を 2進数表示しておく。
ここでは、 一例と して、 「 C o p y r i g h t 」 の 「 C」 とレヽ ぅ文字を 透かしデータ と して取得する場合を考える。 この文字に対する A S C I I コー ドは 2進数で表現すると 「 0 1 0 0 0 0 1 1」 となる。
(透かし生成用データ : 基関数生成)
次に、 透かし生成用データの生成方法について述べる。 透かし生成用 データは、 基になる関数 (以下基関数と呼ぶ) に振幅 a を掛けた関数で 表される。 一例と して、 オーディオデータのサンプリ ングレー トが Rへ ルツで、 透かし生成用データ と して周波数 f ヘルツの波を使う場合を考 える。 ここで、 f は RZ f が整数になるよ う に選ぶ。
この波をサンプリ ングレー ト Rでサンプリ ングしたものを基関数 u ( t ) とする。 (実際にサンプリ ングを実行するのではなく 、 そのよ う な 関数を数式を使って求める。) ここで、 t はサンプル点である。 図 3 に示 すのは基関数 u ( t ) の一例で、周期 R/ f の正弦波を上方に移動させ、 最大値と最小値がそれぞれ 1 と 0になるよ う に調整したものである。
この関数 u ( t ) の値は透かしデータの埋め込み時に頻繁に使われる ので、 あらかじめ 1 周期分を計算し、 その関数値のリ ス トをメモリ ーに 格納しておく。
すなわち、 u ( 0 ), u ( 1 ), …, u (R/ f — 1 ) をメモリーに格納しておく。
図 4 に示すよ う に、 第 i 周期のサンプル点 t における値はつぎの関係 式を用いて上記 1周期分の値から求めるこ とができる。 u ( t ) = u ( t - ( i - l ) - R/ f )
(透かし生成用データ : 総和算出)
上記透かし生成用データ と元のオーディオデータ と を足し合わせるこ と によ り 重畳オーディオデータを生成する。 元のオーディオデータのサ ンプル値を V ( t ) とする と、 重畳されたオーディオデータはつぎのよ う になる。
( 0 ) u ( 0 ) + V ( 0 ) a ( R / f - 1 ) · u ( R / f - 1 ) + V ( R / f - 1 ) ( R / f ) · u ( R / f ) + v ( R / f ) a ( 2 · R / f - 1 ) · u ( 2 · R / f — 1 ) + v ( 2 · R f 一 1 ) a ( 2 · R / f ) · u ( 2 · R / f ) + v ( 2 · R / f )
( 3 · R / f — 1 u ( 3 - R / f - 1 ) + v ( 3 R f - 1 )
透かし生成用データ と重畳されたオーディオデータのサンプル点 t に おけるサンプル値を w ( t ) とする と、 上記の例は次の式で表すこ とが できる。 w ( t ) = V ( t ) + a ( t ) · u ( t ) この w ( t ) を透かし生成用データの第 i 周期の 1周期にわたって足 し合わせる。 このと き、 a ( t ) は 1周期の中では一定の値をと るよ う にする。 この一定値を a i とすると、
∑ w ( t ) =∑ v ( t ) + a ; · ∑ u ( t ) となる。. こ こで、 ∑は透かし生成用データの第 i 周期の 1周期分の総和 を表す。 また、 以降の説明で
V i = ∑ V ( t )
U =∑ u ( t ) とおく。 V i は一般に周期 i ごと に変化するが、 Uは一定の定数である。 この定数 Uもメモリーにあらかじめ格納しておく。
(透かし生成用データ : 振幅生成)
次に、 この重畳されたオーディオデータの総和の絶対値が一定で符号が 透かしデータのビッ ト値を表すよ う に a ; の値を決める。 ビッ ト値を b ( 0または 1 ) と し、 重畳オーディ オデータの総和の絶対値を S とする と、
(- 1 ) S = V ; + a U したがって、 a i = {(- l ) b - S - V i } /U となる。 なお、 この例では 1周期で 1 ビッ トを表しているので、 一般に b は i ごとに異なる値をと る。
(透かし生成用データ生成)
透かし生成用データを表す関数は、 透かし生成用データの基関数にこ の振幅 a ; をかけたもの、 すなわち、
{(- 1 ) b · S — V i } · u ( t ) となる。 ' 図 5 に示すのは、 透かしデータの文字 「 C」 に対応する透かし生成用 データの波形パターンの概略図である。 なお、 この図では振幅 a ; の符 号と (一 1 ) bの符号は一致しているが、 の大き さによっては反転す るこ と もあ り 得る。 ビッ ト値を表しているのは透かし生成用データの振 幅の符号ではなく 、 重畳オーディオデータの総和の符号である。
(重畳オーディオデータ生成)
以上よ り 、 透かし生成用データ と重畳された重畳オーディオデータ w ( t ) は次式のよ う になる。 w ( t ) = V ( t ) + { ( - 1 ) b · S - V i } · u ( t ) / U
(電子透かしの埋め込み過程)
次に、 この式を用い、 オーディオデータに電子透かしを埋め込む過程 を、 図 6 を参照しながら説明する。 まず、 透かし生成用データの 1周期 分のオーディ オデータが A 0 1 に入り 、 そこで上式の総和が計算されて A 0 3 に出力される。 一方、 透かしデータは A 0 2 に入り 、 そこでビッ ト値に応じて透かし生成用データの 1周期ごと に上式の (一 1 ) bの符 号が A 0 3 に出力 される。 すなわち、 ビッ ト値が 0 のときは 「正」、 1 の と きは 「負」 が出力される。 A O 3ではこれら 2つの値を使って上式に 従って透かし生成用データを生成し、 その透かし生成用データのデータ を A O 4に出力する。 A O 4ではこの透かし生成用データのデータ と元 のオーディオデータ と を重畳するこ とによ り透かしデータの入った重畳 オーディオデータを生成し、 出力する。
(その他)
• この透かしデータの埋め込み過程は可逆であ り 、 透かしデータの埋め 込み時に使用 された透かし生成用データの振幅の時系列データがあれば 完全に元に戻すこ とができる。 さ らに、 ある人が透かしデータを埋め込 んだあと、 別の人が別の透かしデータを埋め込んでも、 それぞれの過程 で使用された透かし生成用データの振幅の時系列データがあれば、 それ ぞれの透かしデータ を取り 出し、 且つ、 元のオーディ オデータに戻すこ とができる。 このよ う に、 何重にでも埋め込むこ とができるので、 例え ば著作権者が著作権に関する情報を埋め込んだ後、 その著作権を保護し た状態で、 コンテンッ配信業者が不正な二次配信を防止する 目的で独自 の I Dを埋め込むといったよ う なこ と も可能と なる。
また、 逆に、 透かしデータを埋め込んだと きに使用 された透かし生成 用データの振幅の時系列データがないと元の状態に戻すこ とはできない (ビッ ト値は重畳オーディオデータの総和で表現されてお り 、 これをも とのオーディ オデータ と透かし生成データに分解するする仕方は一意に は定ま らない) ので、 このこ と を利用 して改ざんされにく い電子透かし システムを構築する こ と も可能である。 例えば、 透かしデータを埋め込 むと きにこの時系列のデータを出力 し、 著作権を管理している と ころに それを保管しておく 。 オーディオデータの著作権を主張する者は、 自分 の持っている透かしの入っていないオリ ジナルの (と主張する) 元のォ 一ディォデータをその著作権を管理している と ころに持っていき、 上記 透かし生成用データの振幅の時系列データを使ってその持ち込まれた元 のオーディオデータ と合成する。 これが実際に配布されている透かしデ ータの入った重畳オーディ オデータ と一致すれば間違いなく その者が作 成したものである と判断できる。
なお、 これまでの説明で、 透かしデータの開始点の検出やエラー処理 等については割愛したが、 これらは従来のよ く 知られた技術で容易に実 装できる。 たと えば、 透かしデータの開始点の検出については、 あらか じめ特定のビッ トパターンを透かしデータの前に挿入しておき、 そのパ ターンが見つかった直後から復号を開始すればよい。 具体的には、 振幅 がゼロのと ころを無条件でスキップし、 その後スター ト位置を少しずつ ずら しながらスター ト コ一ドと同期する と ころを見つけ、 その後透かし データの 1周期分ずつ進めてデコー ドする等の方法がある。 エラー処理 についてはチヱ ックサム等を透かしデータ と して埋め込み、 デコー ド時 にチェックする等の方法がある。
<処理の流れ >
図 7 に示すのは、 実施形態 1 の処理の流れである。
まず、 オーディオデータ取得部は、 オーディ オデータを取得する (ス テツプ S 0 7 0 1 )。
次に、 透かしデータ取得部は、 透かしデータを取得する (ステップ S 0 7 0 2 ) 0
次に、 透かし生成用データ生成部は、 ステップ S O 7 0 2で取得した 透かしデータに基づいて、 ステップ S 0 7 0 1 で取得したオーディ オデ ータ と重畳して重畳オーディオデータ とするこ とで所定周期ごとの所定 総和の結果がステップ S 0 7 0 2で取得した透かしデータを表す透かし 生成用データを生成する (ステップ S 0 7 0 3 )。
次に、 重畳オーディオデータ生成部は、 ステップ S O 7 0 1 で取得し たオーディオデータ と、 ステップ S 0 7 0 3 で生成した透かし生成用デ 一タ と を重畳して重畳オーディオデータを生成する (ステップ S 0 7 0 4 )。
<実施形態 1 の効果の簡単な説明〉
実施形態 1 に記載の発明では、 著作識別情報などを透かしデータ と し て取得し、 オーディオデータ と重畳して重畳オーディオデータ と し、 そ の所定周期ごとの所定総和の結果で透かし情報を表現する という手法を 用いる こ と によ り 、 透かしデータを埋め込むこ と による音質の劣化を防 止している。
また、 透かし生成用データの 1波長で 1 ビッ トが符号化されるので、 透かし生成用データが長波長であるにもかかわらず、 効率よ く 多く の透 かしデータを埋め込むこ とができる。
<く実施形態 2 > >
<実施形態 2の概念 >
実施形態 2 に記載の発明は、 人間の耳では聞き取れない低周波の透か し生成用データを生成する請求項 1 に記載のオーディオ電子透かし装置 に関する。
<構成要件の明示 >
図 8 に示すよ う に、 実施形態 2 のオーディ オ電子透かし装置 0 8 0 0 は、 オーディ オデータ取得部 0 8 0 1 と、 透かしデータ取得部 0 8 0 2 と、 透かし生成用データ生成部 0 8 0 3 と、 重畳オーディオデータ生成 部 0 8 0 4 と、 からなる。
く構成の説明 >
く基本機能プロ ック図の導入 >
(構成要件 : オーディオデータ取得部)
実施形態 1 の (構成要件 : オーディオデータ取得部) と同様なので説 明を省略する。
(構成要件 : 透かしデータ取得部)
実施形態 1 の (構成要件 : 透かしデータ取得部) と同様なので説明を 省略する。
(構成要件 : 透かし生成用データ生成部)
透かし生成用データ生成部は、 人間の耳では聞き取れない低周波の透 かし生成用データを生成する。
ここで 「人間の耳では聞き取れない低周波」 とは、 約 2 0 H z 以下の 低い周波数のこ とをいう。
それ以外は、 実施形態 1 の (構成要件 : 透かし生成用データ生成部) と同様なので説明を省略する。 (構成要件 : 重畳オーディオデータ生成部)
実施形態 1の (構成要件 : 重畳ォ一ディォデータ生成部) と同様なの で説明を省略する。
<具体例に基づく説明 >
以下、 本発明の実施形態 2について、 具体的な例を使って詳細に説明 する。
(オーディォデータ取得)
実施形態 1の(オーディ ォデータ取得)と同様なので説明を省略する。
(透かしデータ取得)
実施形態 1の (透かしデータ取得) と同様なので説明を省略する。
(透かし生成用データ : 基関数生成)
実施形態 2の場合、 透かし生成用データは人間の耳では聞き取れない 低周波を用いる。 一例と して、 オーディ オデータのサンプリ ングレー ト が 4 4. 1 kヘルツで、 透かし生成用データ と して周波数 1 0ヘルツの 関数を使う場合を考える。
基関数 u ( t ) は、 周期 4 4. I k Z l Oの関数である。
実施形態 2の場合、 実施形態 1の R = 4 4. l k、 f = 1 0 となる。 それ以外は、 実施形態 1 の (透かし生成用データ : 基関数生成) と同 様なので説明を省略する。
(透かし生成用データ : 総和算出)
実施形態 2の場合、 実施形態 1の R = 4 4. l k、 f = 1 0 となる こ と以外は、 実施形態 1の (透かし生成用データ : 総和算出) と同様なの で説明を省略する。
(透かし生成用データ : 振幅生成)
実施形態 2の場合、 実施形態 1の R = 4 4. l k、 f = 1 0 と なる こ と以外は、 実施形態 1の (透かし生成用データ : 振幅生成) と同様なの で説明を省略する。
(透かし生成用データ生成)
実施形態 2 の場合、 実施形態 1 の R = 4 4 . l k、 f = 1 0 となるこ と以外は、 実施形態 1 の (透かし生成用データ生成) と同様なので説明 を省略する。
(重畳オーディオデータ生成)
実施形態 1 の (重畳オーディオデータ生成) と同様なので説明を省略 する。
(電子透かしの埋め込み過程)
実施形態 1 の (電子透かしの埋め込み過程) と同様なので説明を省略す る。
(その他)
実施形態 1 の (その他) と同様なので説明を省略する。
<処理の流れ >
図 9 に示すのは、 実施形態 2の処理の流れである。
まず、 オーディオデータ取得部は、 オーディオデータを取得する (ス テツプ S 0 9 0 1 )。
次に、 透かしデータ取得部は、 透かしデータを取得する (ステップ S 0 9 0 2 )。
次に、 透かし生成用データ生成部は、 ステップ S 0 9 0 2 で取得した 透かしデータ に基づいて、 ステップ S 0 9 0 1 で取得したオーディオデ ータ と重畳して重畳オーディオデータ とするこ とで所定周期ごとの所定 総和の結果がステップ S 0 9 0 2で取得した透かしデータを表す、 人間 の耳では聞き取れない低周波の透かし生成用データを生成する (ステツ プ S 0 9 0 3 )。
次に、 重畳オーディオデータ生成部は、 ステップ S O 9 0 1 で取得し W
18
たオーディオデータ と、 ステップ S 0 9 0 3で生成した透かし生成用デ 一タ と を重畳して重畳オーディオデータを生成する (ステップ S 0 9 0 4 )。
<実施形態 2 の効果の簡単な説明 >
実施形態 2 に記載の発明では、 人間の耳では聞き取れない低周波のデ ータを透かし生成用データ と して用いているので、 透かし生成用データ の振幅を大き く しても元のオーディオデータの音質を劣化させるこ とが なく 、 ロバス トな電子透かしを実現できる。
また、 透かし生成用データの 1波長で 1 ビッ トが符号化されるので、 透かし生成用データが長波長であるにもかかわらず、 効率よ く 多く の透 かしデータを埋め込むこ とができる。
くく実施形態 3 > >
く実施形態 3 の概念 >
実施形態 3 に記載の発明は、 透かし生成用データを表す関数と して振 幅の変化する境界における値と傾きが常にゼロ となるものを用いる請求 項 1又は 2 に記載のオーディオ電子透かし装置に関する。
く構成要件の明示 >
図 1 0 に示すよ う に、 実施形態 3 のオーディ オ電子透かし装置 1 0 0 0 は、 オーディォデータ取得部 1 0 0 1 と、 透かしデータ取得部 1 0 0 2 と、 透かし生成用データ生成部 1 0 0 3 と、 重畳オーディオデータ生 成部 1 0 0 4 と、 からなる。
く構成の説明〉
く基本機能ブロ ック図の導入 >
(構成要件 : オーディオデータ取得部)
実施形態 1 又は 2 の (構成要件 : オーディオデータ取得部) と同様な ので説明を省略する。 (構成要件 : 透かしデータ取得部)
実施形態 1 又は 2 の (構成要件 : 透かしデータ取得部) と同様なので 説明を省略する。
(構成要件 : 透かし生成用データ生成部)
透かし生成用データ生成部は、 それによつて生成される透かし生成デ ータの表す関数の振幅の変化する境界における値と傾きが常にゼロであ る透かし生成用データを生成する。
それ以外は、 実施形態 1 又は 2 の (構成要件 : 透かし生成用データ生 成部) と同様なので説明を省略する。
(構成要件 : 重畳オーディオデータ生成部)
実施形態 1 又は 2の (構成要件 : 重畳オーディオデータ生成部) と同 様なので説明を省略する。
<具体例に基づく 説明 >
以下、 本発明の実施形態 3 について、 具体的な例を使って詳細に説明 する。
(オーディオデータ取得)
実施形態 1 又は 2の (オーディオデータ取得) と同様なので説明を省 略する。
(透かしデータ取得)
実施形態 1 又は 2の (透かしデータ取得) と同様なので説明を省略す る。
(透かし生成用データ : 基関数生成)
実施形態 3 の場合、 透かし生成用データの表す関数と して、 振幅の変 化する境界における値と傾きが常にゼロになるものを用いる。 そのため には、 透かし生成用データの基関数 u ( X ) と して上記の境界点で値と 傾きがゼロになるものを用いればよい。 すなわち、 u ( x n ) = u ' ( x n ) = 0 ここで、 x nは上記振幅の変化する n番目の境界点である。
図 1 1 に示すのは、 χ η = η · π ( ηは整数) の場合である。
それ以外は、 実施形態 1 又は 2 の (透かし生成用データ : 基関数生成) と同様なので説明を省略する。
(透かし生成用データ : 総和算出)
実施形態 3 の場合、 基関数 u ( X ) が (透かし生成用データ : 基関数 生成) の条件を満足するこ と以外は、 実施形態 1 又は 2 の (透かし生成 用データ : 総和算出) と同様なので説明を省略する。
(透かし生成用データ : 振幅生成)
実施形態 3 の場合、 基関数 u ( X ) が (透かし生成用データ : 基関数 生成) の条件を満足するこ と以外は、 実施形態 1又は 2 の (透かし生成 用データ : 振幅生成) と同様なので説明を省略する。
(透かし生成用データ生成)
実施形態 1 又は 2 の (透かし生成用データ生成) と 同様なので説明を 省略する。
(重畳オーディオデータ生成)
実施形態 3 の場合、 基関数 u ( X ) が (透かし生成用データ : 基関数 生成) の条件を満足するこ と以外は、 実施形態 1又は 2 の (重畳オーデ ィォデータ生成) と同様なので説明を省略する。
(電子透かしの埋め込み過程)
実施形態 1 又は 2 の (電子透かしの埋め込み過程) と 同様なので説明 を省略する。
(その他) 実施形態 1 の (その他) と同様なので説明を省略する。
<処理の流れ〉
図 1 2 に示すのは、 実施形態 3 の処理の流れである。
まず、 オーディオデータ取得部は、 オーディ オデータを取得する (ス テツプ S 1 2 0 1 )。
次に、 透かしデータ取得部は、 透かしデータを取得する (ステ ップ S 1 2 0 2 )。
次に、 透かし生成用データ生成部は、 ステップ S 1 2 0 2で取得した 透かしデータに基づいて、 ステップ S 1 2 0 1 で取得したオーディ オデ ータ と重畳して重畳オーディオデータ とするこ とで所定周期ごとの所定 総和の結果がステップ S 1 2 0 2 で取得した透かしデータを表し、 透か し生成用データの表す関数の振幅の変化する境界における値と傾きが常 にゼロである透かし生成用データを生成する (ステップ S 1 2 0 3 )。 次に、 重畳オーディオデータ生成部は、 ステ ップ S 1 2 0 1 で取得し たオーディオデータ と、 ステップ S 1 2 0 3 で生成した透かし生成用デ 一タ と を重畳して重畳オーディオデータを生成する (ステップ S 1 2 0 4 )。
<実施形態 3 の効果の簡単な説明 >
実施形態 3 に記載の発明では、 透かし生成用データの表す関数の振幅 の変化する境界における値と傾きが常にゼロなので、 振幅が変動しても 滑らかに繋が り 、 高周波ノイズの発生を防止するこ とができる。
また、 透かし生成用データの 1 波長で 1 ビッ トが符号化されるので、 透かし生成用データが長波長であるにもかかわらず、 効率よ く 多く の透 かしデータを埋め込むこ とができる。
くく実施形態 4 > >
ぐ実施形態 4 の概念〉 実施形態 4 に記載の発明は、 重畳オーディオデータの所定周期ごとの 所定総和の結果が透かしデータを表すよ う に、 透かし生成用データの振 幅を、 半周期ごと に適応的に変化させる請求項 1 から 3 のいずれか一に 記載のオーディオ電子透かし装置に関する。
<構成要件の明示 >
図 1 3 に示すよ う に、 実施形態 4のオーディオ電子透かし装置 1 3 0 0 は、 オーディオデータ取得部 1 3 0 1 と、 透かしデータ取得部 1 3 0 2 と、 透かし生成用データ生成部 1 3 0 3 と、 重畳オーディオデータ生 成部 1 3 0 4 と、 力 らなる。
く構成の説明 >
く基本機能プロ ック図の導入 >
(構成要件 : オーディオデータ取得部)
実施形態 1 から 3 のいずれか一の (構成要件 : オーディ オデータ取得 部) と同様なので説明を省略する。
(構成要件 : 透かしデータ取得部)
実施形態 1 から 3 のいずれか一の (構成要件 : 透かしデータ取得部) と同様なので説明を省略する。
(構成要件 : 透かし生成用データ生成部)
透かし生成用データ生成部は、 所定周期ごとの所定総和の結果が透か しデータ取得部で取得した透かしデータを表すよ う に、 透かし生成用デ ータの振幅を、 半周期ごとに適応的に変化させる。
それ以外は、 実施形態 1 から 3 のいずれか一の (構成要件 : 透かし生 成用データ生成部) と同様なので説明を省略する。
(構成要件 : 重畳オーディオデータ生成部)
実施形態 1 から 3 のいずれか一の (構成要件 : 重畳オーディオデータ 生成部) と同様なので説明を省略する。 く具体例に基づく説明〉
以下、 本発明の実施形態 4について、 具体的な例を使って詳細に説明 する。 .
(オーディオデ一タ取得)
実施形態 1 から 3 のいずれか一の (オーディ オデータ取得) と同様な ので説明を省略する。
(透かしデータ取得)
実施形態 1 から 3 のいずれか一の (透かしデータ取得) と同様なので 説明を省略する。
(透かし生成用データ : 基関数生成)
次に、 透かし生成用データの生成方法について述べる。 透かし生成用 データは、 基になる関数 (以下基関数と呼ぶ) に振幅 a を掛けた関数で 表される。 一例と してつぎのよ うな関数 u ( t ) を考える。 u ( t ) = s i n 3 ( 2 - f - t /R)
= ( 3 4 ) · 3 ί η ( 2 π · £ · ί /Κ)
- ( l / 4 ) - s i n ( 3 - 2 re - f - t /R 図 1 4 に示すよ う に、 この関数は半周期ごと に関数値と傾きがゼロにな る。 従って、 その半周期ごとに現れる関数値と傾きがゼロ になる点の前 後で振幅を変化させる と滑らかにつなが り 、 高周波ノイズの発生を防止 するこ とができる。 なお、 この関数には周波数が f / Rの波の他に 3 f ZRの波も含まれるが、 後者の振幅は前者の振幅の 1 / 3 なのでほとん ど問き取れない。
この関数 u ( t ) の値は透かしデータの埋め込み時に頻繁に使われる ので、 あらかじめ半周期分を計算し、 その関数値の リ ス ト をメモリ ーに 格納しておく。
一例と して、 u ( 0 ), u ( 1 ), …, u (R/ f / 2 — 1 ), をメモ リ 一に格納しておく。 後半の半周期における値 u (R/ f / 2 ) , u ( R / f / 2 + 1 ) , …, u ( R / f - 1 ) は、 前半の半周期における値の符号を反転させたものである。 また、 図 1 5 に示すよ う に、 第 i 周期のサンプル点 t における値はつ ぎの関係式を用いて上記の関数値の リ ス トから求めるこ とができる。 u ( t ) = u ( t - ( i - l ) - R/ f )
t = ( i - 1 ) · R / f , ( i - l ) - R/ f + l ,
( i - 1 ) · R + (R/ f / 2— 1 ), ( i - 1 ) · R + R / f / 2 i · R / f — 1 (透かし生成用データ : 総和算出)
透かし生成用データの入った重畳オーディオデータのサンプル点 t に おけるサンプル値を w ( t ) とする と、 次の式で表すこ とができる。 w ( t ) V + a ( t ) u ( t ) の w ( t ) を、 透かし生成用データの第 i 周期の半周期分にわたって 足し上げる。 このとき、 a ( t ) はこの半周期の中では一定の値を と る よ う にする。 この一定値を a ; とする と、
∑ w ( t ) = ∑ v ( t ) + ∑ u ( となる。 こ こで、 ∑は透かし生成用データの第 i周期の半周期分の総和 を表す。 また、 以降の説明で 第 i周期の前半の半周期 :
V H= ∑ V ( t )
U ∑ U ( t )
第 i周期の後半の半周期
V2i- ∑ ν ( t )
U2= ∑ u ( t )
a 2i ~ , とおく 。 vu、 V2iは一般に周期 i ごと に変化するが、 Uい u2は一定の 定数である。 (上記の例では U i - — U 2 となる。)
この定数 uい u2もメモリーにあら力、じめ格納しておく。
(透かし生成用データ : 振幅生成)
次に、 この透かし生成用データの半周期ごと の重畳されたオーディオ データの総和の絶対値が一定で符号が透かしデータのビッ ト値を表すよ う に a Li、 a 2i の値を決める。 このと き、 透かし生成用データの後半周 期の重畳されたオーディオデータの総和が前半周期の総和と符号が反対 になる よ う にする。 ビッ ト値を b ( 0 または 1 ) と し、 透かし生成用デ ータの半周期ごとの重畳オーディオデータの総和の絶対値を sとする と 第 i 周期の前半周期 : ∑ w ( t ) = (— 1 ) b · S = Vn+ a u · Ux 第 i 周期の後半周期 : ∑ w ( t ) =— (— 1 ) b · S = V2i+ a 2 i · U2 したがって、 第 i 周期の前半周期 : {(- 1 ) b - S - VH} /U,
第 i 周期の後半周期 : a 2i= { - (— 1 ) b · S — V2i} /U と なる。 なお、 この例では 1周期で 1 ビッ トを表しているので、 一般に b は i ごとに異なる。
(透かし生成用データ生成)
透か し生成用データ を表す関数は、 透かし生成用データの基関数 u ( t ) に振幅 a Li、 a 2iをかけたもの、 すなわち、 第 i 周期の前半周期 : {{(ー 1 ) s - Vu} /U J u ( t
第 i 周期の後半周期 : {{一 (一 s - V 2i u u ( t となる。
図 1 6 に示すのは、 透かしデータの文字 「 C」 に対応する生成用デー タの波形パターンの概略図である。 なお、 この図では透かし生成用デー タの符号はビッ ト値に対応しているが、 一般には V H、 V 2i の大き さに よって反転するこ と もあり得る。 ビッ ト値に対応しているのは透かし生 成用データの符号ではなく 、 重畳されたオーディオデータの総和の符号 である。
(重畳オーディオデータ生成)
以上よ り 、 透かし生成用データ と合成されたオーディオデータ w ( t ) は次式のよ う になる。 第 i 周期の前半周期 :
w ( t ) = V ( t ) + {{(— 1 ) b · S - Vn} /U · u ( t ) 第 i 周期の後半周期 :
w ( t ) = v ( t ) + {{ - (— 1 ) b - S - V2i} /U2} - u ( t ) (その他)
実施形態 1 の (その他) と同様なので説明を省略する。
<処理の流れ >
図 1 7 に示すのは、 実施形態 4の処理の流れである。
まず、 オーディオデータ取得部は、 オーディオデータを取得する (ス テツプ S 1 7 0 1 )。
次に、 透かしデータ取得部は、 透かしデータを取得する (ステップ S
1 7 0 2 )0
次に、 透かし生成用データ生成部は、 重畳オーディ オデータの所定周 期ごとの所定総和の結果がステップ S 1 7 0 2で取得した透かしデータ を表すよ う に、 透かし生成用データの振幅を、 半周期ごと に適応的に変 化させる (ステップ S 1 7 0 3 )。
次に、 重畳オーディ オデータ生成部は、 ステップ S 1 7 0 1 で取得し たオーディオデータ と、 ステップ S 1 7 0 3で生成した透かし生成用デ 一タ とを重畳して重畳オーディオデータを生成する (ステップ S 1 7 0 4 <実施形態 4の効果の簡単な説明 >
実施形態 4 に記載の発明では、 重畳ォ一ディ ォデータの所定周期ごと の総和の符号が毎回反転するので D Cオフセッ トが残るのを防止できる, < <実施形態 5 > >
<実施形態 5 の概念 >
実施形態 5 に記載の発明は、 重畳オーディオデータの所定周期ごとの 所定総和の結果が、 透かし生成用データの半周期ごと の前記重畳オーデ ィォデータの総和の符号である請求項 1 から 4 のいずれか一に記載のォ 一ディォ電子透かし装置に関する。
く構成要件の明示 >
図 1 8 に示すよ う に、 実施形態 5 のオーディ オ電子透かし装置 1 8 0 0は、 オーディ オデータ取得部 1 8 0 1 と、 透かしデータ取得部 1 8 0 2 と、 透かし生成用データ生成部 1 8 0 3 と、 重畳オーディオデータ生 成部 1 8 0 4 と、 からなる。
<構成の説明〉
く基本機能プロ ック図の導入 >
(構成要件 : オーディオデータ取得部)
実施形態 4 の (構成要件 : オーディオデータ取得部) と同様なので説 明を省略する。
(構成要件 : 透かしデータ取得部)
実施形態 4 の (構成要件 : 透かしデータ取得部) と 同様なので説明を 省略する。
(構成要件 : 透かし生成用データ生成部)
透かし生成用データ生成部は、 重畳オーディ オデータの所定周期ごと の所定総和の結果が透かしデータ取得部で取得した透かしデータを表す よ う に、 透かし生成用データを生成する。 ここで 「所定周期ごとの所定総和の結果」 と は、 透かし生成用データ の半周期ごとの重畳オーディオデータの総和の符号のこ と をいう。
それ以外は、 実施形態 4 の (構成要件 : 透かし生成用データ生成部) と同様なので説明を省略する。
(構成要件 : 重畳オーディオデータ生成部)
実施形態 4 の (構成要件 : 重畳オーディオデータ生成部) と同様なの で説明を省略する。
く具体例に基づく 説明 >
以下、 本発明の実施形態 5 について、 具体的な例を使って詳細に説明 する。
(オーディオデータ取得)
実施形態 4 の(オーディオデータ取得)と同様なので説明を省略する。
(透かしデータ取得)
実施形態 4の (透かしデータ取得) と同様なので説明を省略する。
(透かし生成用データ : 基関数生成)
実施形態 4 の (透かし生成用データ : 基関数生成) と同様なので説明 を省略する。
(透かし生成用データ : 総和算出)
実施形態 4 の (透かし生成用データ : 総和算出) と同様なので説明を 省略する。
(透かし生成用データ : 振幅生成)
実施形態 4の (透かし生成用データ : 振幅生成) の説明において、 第 i 周期の前半周期 : ∑ w ( t ) = (— 1 ) b - S
第 i 周期の後半周期 : 2 w ( t ) = — (一 1 ) b · S となっているので、 透かし生成用データの半周期おきに (前半周期ごと あるいは後半周期ごと に) 重畳オーディオデータの総和を求めれば、 そ の符号で透かしデータの各ビッ 1、の 0 / 1 を判定でき る。 したがって、 実施形態 4 に記載されているのと同様な方法で振幅を生成すればよい。
(透かし生成用データ生成)
実施形態 4 の (透かし生成用データ生成) と 同様なので説明を省略す る。
(重畳オーディオデータ生成)
実施形態 4 の (重畳オーディオデータ生成) と同様なので説明を省略 する。
(電子透かしの埋め込み過程)
次に、 オーディ オデータ に電子透かしを埋め込む過程を、 図 1 9 を参 照しながら説明する。 まず、 透かし生成用データの半周期分のオーディ ォデータが A 0 1 に入り 、 そこで上式の総和が計算されて A 0 3 に出力 される。 一方、 透かしデータは A 0 2 に入り 、 そこでビッ ト値に応じて 透かし生成用データの半周期ごとに上式の (一 1 ) bまたは一 (一 1 ) b の符号が A 0 3 に出力される。 つま り 、 前半の半周期ではビッ ト値が 0 のと きは 「正」、 1 のと きは 「負」 が出力され、 後半の半周期ではビッ ト 値が 0 のときは 「負」、 1 のときは 「正」 が出力される。 A O 3 ではこれ ら 2つの値を使って上式に従って透かし生成用データ を生成し、 その透 かし生成用データのデータ を A O 4 に出力する。 A O 4 ではこの透かし 生成用データのデータ と元のオーディ オデータ と を重畳するこ と によ り 透かしデータの入った重畳オーディオデータを生成し、 出力する。
(その他)
実施形態 1 の (その他) と 同様なので説明を省略する。
<処理の流れ > 図 2 0 に示すのは、 実施形態 5の処理の流れである。
まず、 オーディオデータ取得部は、 オーディオデータを取得する (ス テ ツプ S 2 0 0 1 )。
次に、 透かしデータ取得部は、 透かしデータを取得する (ステ ップ S 2 0 0 2 )。
次に、 透かし生成用データ生成部は、 重畳オーディ オデータの、 透か し生成用データ半周期ごと の総和の符号が、 ステップ S 2 0 0 2 で取得 した透かしデータを表すよ う に、 透かし生成用データを生成する (ステ ップ S 2 0 0 3 )。
次に、 重畳オーディオデータ生成部は、 ステ ップ S 2 0 0 1 で取得し たオーディオデータ と、 ステップ S 2 0 0 3 で生成した透かし生成用デ ータ と を重畳して重畳オーディオデータを生成する (ステップ S 2 0 0 4 )。
<実施形態 5 の効果の簡単な説明 >
実施形態 5 に記載の発明では、 透かし生成用データの半周期にわたる 重畳オーディ オデータの総和の符号が透かしデータの各ビッ トの 0 Z 1 を表すので、 透かしデータの検出 復号が容易である。 また、 その総和 の絶対値が常にゼロ と異なる一定の値を持つのでオーディ オデータの変 形に対して耐久性のある電子透かしを実現できる。
くく実施形態 6 >〉
<実施形態 6 の概念〉
実施形態 6 に記載の発明は、 所定周期ごとの所定総和の結果は、 透か し生成用データの前半周期と後半周期の重畳オーディ オデータの総和の 差分の符号である請求項 1 から 4のいずれか一に記載のオーディオ電子 透かし装置に関する。
<構成要件の明示 > 図 2 1 に示すよ う に、 実施形態 6 のオーディオ電子透かし装置 2 1 0 0は、 オーディ ォデータ取得部 2 1 0 1 と、 透かしデータ取得部 2 1 0 2 と、 透かし生成用データ生成部 2 1 0 3 と、 重畳オーディオデータ生 成部 2 1 0 4 と、 力 らなる。
く構成の説明 >
<基本機能プロ ック図の導入 >
(構成要件 : オーディォデータ取得部)
実施形態 4 の (構成要件 : オーディ オデータ取得部) と同様なので説 明を省略する。
(構成要件 : 透かしデータ取得部)
実施形態 4 の (構成要件 : 透かしデータ取得部) と同様なので説明を 省略する。
(構成要件 : 透かし生成用データ生成部)
透かし生成用データ生成部は、 重畳オーディオデータの所定周期ごと の所定総和の結果が透かしデータ取得部で取得した透かしデータを表す よ う に、 透かし生成用データを、 半周期ごとに振幅を適応的に変化させ る。
ここで 「所定周期ごとの所定総和の結果」 と は、 透かし生成用データ の前半周期と後半周期の重畳オーディ オデータの総和の差の符号のこ と をいう。
それ以外は、 実施形態 4の (構成要件 : 透かし生成用データ生成部) と同様なので説明を省略する。
(構成要件 : 重畳オーディオデータ生成部)
実施形態 4 の (構成要件 : 重畳オーディオデータ生成部) と同様なの で説明を省略する。
<具体例に基づく説明 > 以下、 本発明の実施形態 6 について、 具体的な例を使って詳細に説明 する。
(オーディォデータ取得)
実施形態 4 の(オーディオデータ取得)と同様なので説明を省略する。
(透かしデータ取得)
実施形態 4の (透かしデータ取得) と同様なので説明を省略する。
(透かし生成用データ : 基関数生成)
実施形態 4 の (透かし生成用データ : 基関数生成) と同様なので説明 を省略する。
(透かし生成用データ : 総和算出)
実施形態 4 の (透かし生成用データ : 総和算出) と 同様なので説明を 省略する。
(透かし生成用データ : 振幅生成)
実施形態 4の (透かし生成用データ : 振幅生成) の説明において、 第 i 周期の前半周期 : ∑ w ( t ) = (— 1 ) b , S
第 i 周期の後半周期 : ∑ w ( t ) =一 (一 1 ) b . S となっているので、 透かし生成用データの前半の半周期の時間にわたる 重畳オーディォデータの総和と後半の半周期の時間にわたる総和の差は
(一 1 ) b · 2 S となり 、 この符号で透かしデータの各ビッ トの 0 1 を判定できる。 し たがって、 実施形態 4 に記載されているのと同様な方法で振幅を生成す れよい。 (透かし生成用データ生成)
実施形態 4 の (透かし生成用データ生成) と同様なので説明を省略す る。
(重畳オーディオデータ生成)
実施形態 4 の (重畳オーディオデータ生成) と同様なので説明を省略 する。
(電子透かしの埋め込み過程)
実施形態 5 の (電子透かしの埋め込み過程) と同様なので説明を省略 する。
(その他)
実施形態 1 の (その他) と同様なので説明を省略する。
<処理の流れ〉
図 2 2 に示すのは、 実施形態 6 の処理の流れである。
まず、 オーディ オデータ取得部は、 オーディ オデータを取得する (ス テツプ S 2 2 0 1 )。
次に、 透かしデータ取得部は、 透かしデータ を取得する (ステップ S 2 2 0 2 )。
次に、 透かし生成用データ生成部は、 重畳オーディオデータの、 透か し生成用データ前半周期分と後半周期分の総和の差分の符号が、 ステツ プ S 2 2 0 2で取得した透かしデータを表すよ う に、 透かし生成用デ一 タを生成する (ステップ S 2 2 0 3 )。
次に、 重畳オーディ オデータ生成部は、 ステ ップ S 2 2 0 1 で取得し たオーディ オデータ と、 ステップ S 2 2 0 3で生成した透かし生成用デ 一タ と を重畳して重畳オーディオデータを生成する (ステップ S 2 2 0 4 )。
<実施形態 6 の効果の簡単な説明 > 実施形態 6 に記載の発明では、 透かしの入つた重畳オーディォデータ の所定の前半周期分と後半周期分の総和の差の符号で透かしデータの各 ビッ トの 0ノ 1 を表現しているので、 D Cオフセッ トがかかっても判定 に影響しない口バス トな電子透かしを実現できる。
<く実施形態 7 > >
く実施形態 7の概念 >
実施形態 7 に記載の発明は、 取得した重畳オーディ オデータの、 透か し生成用データの所定周期分ごとの所定総和の結果を算出 し、 その結果 に基づいて透かしデータを復号するオーディオ電子透かし復号装置に関 する。
く構成の説明 >
く構成要件の明示 >
図 2 3 に示すよ う に、 実施形態 7 のオーディオ電子透かし復号装置 2 3 0 0 は、 重畳オーディオデータ取得部 2 3 0 1 と、 総和算出部 2 3 0 2 と、 透かしデータ復号部 2 3 0 3 と、 からなる。
<構成の説明 >
く基本機能プロ ック図の導入 >
(構成要件 : 重畳オーディオデータ取得部)
重畳オーディオデータ取得部は、 重畳オーディオデータを取得する。
(構成要件 : 総和算出部)
総和算出部は、 重畳オーディオデータ取得部で取得した重畳オーディ ォデータの所定周期ごとの所定総和の結果を算出する。
こ こで 「所定周期ごとの所定総和の結果」 とは、 重畳オーディオデー タの、透かし生成用データの所定周期ごとの所定総和の結果をいう。 「所 定周期」 には、 半周期、 1 周期、 1 . 5周期、 2周期、 2 . 5周期、 3 周期、 · · · などが該当する。 「所定総和」 には、 半周期の総和、 1周期 の総和などが該当する。 「所定総和の結果」 には、 半周期、 1 周期にわた る総和、 総和の符号、 および総和の差の符号などが該当する。
(構成要件 : 透かしデータ復号部)
透かしデータ復号部は、 総和算出部で算出された所定総和の結果に基 づいて透かしデータを復号する。
く具体例に基づく説明 >
以下、 本発明の実施形態 7 について、 具体的な例を使って詳細に説明 する。
(重畳オーディオデータ取得)
実施形態 7 の重畳オーディオデータ取得は、 一例と して、 実施形態 1 で生成された重畳オーディオデータ w ( t ) を取得するものとする と、
W ( t V ( t ) + { ( S — V u ( t ) / U となる。 記号の意味は実施形態 1 と同様である とする (以下同じ)。
(総和算出)
実施形態 1 で説明 したよ う に、 第 i 周期の 1 周期分にわたる重畳ォー ディォデータの総和は、 ∑ w ( t ) = ( - 1 ) b - S
= + S ( b = 0 )
=一 S ( b = 1 )
となる。
(透かしデータ復号)
上式のよ う に透かしデータの各ビッ ト値の違いは重畳オーディオデー タの総和の符号の違いとなって現れているので、 1周期分の総.和を求め、 その符号で透かしデータの各ビッ トの 0 Z 1 を判定し、 復号するこ とが 出来る。
(透かしデータ検出過程)
この透かしデータ検出過程をブロ ッ ク図で表したものを図 2 4 に示す, 図中で透かしデータの入った重畳オーディオデータの各サンプル値が透 かし生成用データ 1 周期分ずつ B 0 1 に入り 、 そこで 1周期分の総和が 計算され、 その符号が B 0 2に出力される。 B 0 2ではその符号に応じ て 0または 1 が選択され、 透かしデータ と して出力される。
(その他)
実施形態 1 の (その他) と同様なので説明を省略する。
く処理の流れ >
図 2 5 に示すのは、 実施形態 7の処理の流れである。
まず、 重畳オーディオデータ取得部は、 透かし生成用データ とオーデ ィォデータの重畳オーディ オデータを取得する (ステップ S 2 5 0 1 )。 次に、 総和算出部は、 ステップ S 2 5 0 1 で取得した重畳オーディ オ データ の、 透かし生成用データの所定周期分ごとの所定総和の結果を算 出する (ステ ップ S 2 5 0 2 )。
次に、 透かしデータ復号部は、 ステップ S 2 5 0 2で算出された所定 総和の結果に基づいて透かしデータのビッ ト値を判定し、 復号する (ス テツプ S 2 5 0 3 )。
く実施形態 7 の効果の簡単な説明 >
実施形態 7 に記載の発明では、 透かし生成用データの所定周期分の重 畳オーディオデータの所定総和の結果で透かしデータの各ビッ トの 0ノ 1 を判定できるため、 透かしデータの検出 復号が容易である。 また、 上記所定総和の結果はオーディォデータの変形に対して影響を受けにく いので口パス トな電子透かしを実現できる。
く <実施形態 8 > >
<実施形態 8 の概念 >
実施形態 8 に記載の発明は、 透かし生成用データの半周期の時間にわ たって重畳オーディオデータを総和した値の符号に基づいて透かしデー タを復号する請求項 7 に記載のオーディオ電子透かし復号装置に関する , <構成の説明 >
<構成要件の明示 >
図 2 6 に示すよ う に、 実施形態 8 のオーディオ電子透かし復号装置 2 6 0 0は、 重畳オーディオデータ取得部 2 6 0 1 と、 総和算出部 2 6 0 2 と、 透かしデータ復号部 2 6 0 3 と、 力 らなる。
<構成の説明 >
く基本機能プロ ック図の導入 >
(構成要件 : 重畳オーディオデータ取得部)
重畳オーディオデータ取得部は、 重畳オーディオデータを取得する。
(構成要件 : 総和算出部)
総和算出部は、 透かし生成用データの半周期の時間にわたって総和し た値の符号を算出する。
(構成要件 : 透かしデータ復号部)
透かしデータ復号部は、 総和算出部で算出された総和の符号に基づい て透かしデータを復号する。
く具体例に基づく説明 >
以下、 本発明の実施形態 8 について、 具体的な例を使って詳細に説明 する。
(重畳オーディオデータ取得)
実施形態 8 の重畳オーディオデータ取得は、 一例と して、 実施形態 5 で生成された重畳オーディオデータ w ( t ) を取得するものとする と 第 i 周期の前半周期 :
w ( t ) = V ( t ) + S - Vu} /U · u ( t ) 第 i 周期の後半周期 :
w ( t ) = V ( t ) + {{ - (- 1 ) S - V2i} /U2} · u ( t ) となる。 記号の意味は実施形態 5 と同様である とする (以下同じ)。
(総和算出)
実施形態 5 で説明 したよ う に、 第 i 周期の前半周期、 後半周期にわた る重畳オーディオデータの総和は、 第 i 周期の前半周期 £ w ( t ) ν,,+ u
= + S ( b = 0 )
= - S ( b = 1 )
第 i 周期の後半周期 ∑ w ( t ) = V 2i + a 2i " U 2
=一 S ( b = 0 )
= + S ( b = 1 ) となる。
(透かしデータ復号)
上式のよ う に透かしデータの各ビッ ト値の違いは重畳オーディオデー タの総和の符号の違いとなって現れているので、 前半周期ごと、 あるい は後半周期ごとに総和を求め、 その符号で透かしデータの各ビッ トの 0 / 1 を判定し、 復号するこ とができる。
(透かしデータ検出過程) 06114
40
こ の透かしデータ検出過程をプロ ック図で表したものを図 2 7 に示す < 図中で透かしデータの入った重畳オーディオデータ の各サンプル値が透 かし生成用データ半周期分ずつ (前半周期ごと、 あるいは後半周期ごと に) B 0 1 に入り 、 そこで半周期分の総和が計算され、 その符号が B 0 2 に出力される。 B O 2ではその符号に応じて 0 または 1 が選択され、 透かしデータ と して出力される。
(その他)
実施形態 1 の (その他) と同様なので説明を省略する。
<処理の流れ〉
図 2 8 に示すのは、 実施形態 8の処理の流れである。
まず、 重畳オーディオデータ取得部は、 透かし生成用データ とオーデ ィォデータの重畳オーディオデータを取得する (ステップ S 2 8 0 1 )。 次に、 総和算出部は、 ステ ップ S 2 8 0 1 で取得した重畳オーディオ データを、 透かし生成用データの半周期の時間にわたって (前半周期ご と あるいは後半周期ごとに) 総和した値の符号を算出する (ステ ップ S 2 8 0 2 )。
次に、 透かしデータ復号部は、 ステップ S 2 8 0 2で算出された総和 の符号から ビッ ト値を判定し、 復号する (ステップ S 2 8 0 3 )。
く実施形態 8の効果の簡単な説明 >
実施形態 8 に記載の発明では、 透かし生成用データ の半周期の時間に わたる重畳オーディ オデータの総和の符号のみで透かしデータの各ビッ トの 0ノ 1 を判定できるため、透かしデータの検出 Z復号が容易である。 また、 上記所定総和の絶対値は常にゼロ と異なる一定の値をと るので、 オーディオデータの変形に対して耐久性のある頑丈電子透かしを実現で きる。
ぐ く実施形態 9 > > <実施形態 9 の概念 >
実施形態 9 に記載の発明は、 重畳オーディオデータの、 透かし生成用 データ前半周期の時間にわたる総和と後半周期の時間にわたる総和の差 の符号に基づいて透かしデータを復号する請求項 7 に記載のオーディオ 電子透かし復号装置に関する。
<構成の説明 >
く構成要件の明示 >
図 2 9 に示すよ う に、 実施形態 9 のオーディ オ電子透かし復号装置 2 9 0 0 は、 重畳オーディオデータ取得部 2 9 0 1 と、 総和算出部 2 9 0 2 と、 透かしデータ復号部 2 9 0 3 と、 力 らなる。
く構成の説明 >
<基本機能プロ ック図の導入〉
(構成要件 : 重畳オーディオデータ取得部)
重畳オーディオデータ取得部は、 重畳オーディオデータを取得する。
(構成要件 : 総和算出部)
総和算出部は、 重畳オーディオデータ取得部で取得した重畳オーディ ォデータの、 透かし生成用データ前半周期の時間にわたる総和と後半周 期の時間にわたる総和の差の符号を算出する。
(構成要件 : 透かしデータ復号部)
透かしデータ復号部は、 上記総和算出部で算出された総和の差の符号 に基づいて透かしデータを復号する。
<具体例に基づく説明 >
以下、 本発明の実施形態 9について、 具体的な例を使って詳細に説明 する。
(重畳オーディオデータ取得)
実施形態 9 の重畳オーディオデータ取得は、 一例と して、 実施形態 6 で生成された重畳オーディオデータ w ( t ) を取得するものとする と、 第 i 周期の前半周期 :
w ( t ) = V ( t ) + {{(— 1 ) b - S - Vu} /U · u ( t ) 第 i 周期の後半周期 :
w ( t ) = v ( t ) + {{ - (— 1 ) S - V2i} ZU2} · u ( t ) となる。 記号の意味は実施形態 6 と同様である とする (以下同じ)。
(総和算出)
実施形態 6 で説明 したよ う に、 第 i 周期の前半周期、 後半周期にわた る重畳オーディ オデータの総和は、 第 i 周期の前半周期 : ∑ w ( t ) = + S ( b = 0 )
=一 S ( b = 1 )
第 i 周期の後半周期 : ∑ w ( t ) =— S ( b = 0 )
= + S ( b = 1 ) となる。
(透かしデータ復号)
実施形態 8 で説明 したよ う に、 透かしデータの各ビッ ト値の違いは上 式の符号の違いとなって現れている。
前半周期分の総和から後半周期分の総和を引 く と
+ 2 S ( b = 0 )
— 2 S ( b = 1 ) となるので、 この符号でも ビッ ト値を判定でき る。 このよ う にする と D Cオフセッ トがキャンセルされる。 実施形態 9 ではこのよ う にして D C オフセッ 卜の影響を受けないよ う にしている。
(透かしデータ検出過程)
この透かしデータ検出過程をブロ ック図で表したものを図 3 0 に示す, 図中で透かしデータの入った重畳オーディオデータが透かし生成用デー タ半周期分ずつ B 0 1 に入り 、 そこで前半周期の総和と後半周期の総和 の差分が計算され、 その符号が B 0 2 に出力される。 B 0 2ではその符 号に応じて 0 または 1 が選択され、 透かしデータ と して出力される。
(その他)
実施形態 1 の (その他) と同様なので説明を省略する。
<処理の流れ >
図 3 1 に示すのは、 実施形態 9 の処理の流れである。
まず、 重畳オーディ オデータ取得部は、 透かし生成用データ とオーデ ィォデータの重畳オーディ オデータを取得する (ステップ S 3 1 0 1 )。 次に、 総和算出部は、 ステップ S 3 1 0 1 で取得した重畳オーディオ データの、 透かし生成用デ一タ前半周期の時間にわたる総和と後半周期 の時間にわたる総和の差の符号を算出する (ステップ S 3 1 0 2 )。
次に、 透かしデータ復号部は、 ステップ S 3 1 0 2 で算出された値の 符号が透かしデータ の ビッ ト値を表すよ う に透かしデータ を復号する (ステップ S 3 1 0 3 )。
く実施形態 9 の効果の簡単な説明 >
実施形態 9 に記載の発明では、 重畳オーディオデータの、 透かし生成 用データ前半周期の時間にわたる総和と後半周期の時間にわたる総和の 差の符号で透かしデータの各ビッ トの 0 / 1 を判定しているため、 D C オフセッ トがかかってもキャンセルされ、 歪に対してよ り 耐久性のある 電子透かしを実現でき る。 産業上の利用可能性
本発明による と、 人間の耳では聞き取れない低周波数の音を透かし生 成用データ と して用いているので、 元のオーディ オデータの音質を劣化 させるこ となく透かし生成用データの振幅を任意に大き く するこ とがで き、 透かし強度を上げるこ とができる。
また、 透かし生成用データの 1波長で 1 ビッ トが符号化されるので、 透かし生成用データが長波長であるにもかかわらず、 効率よ く 多く の透 かしデータを埋め込むこ とができる。
また、 透かし生成用データそのものではなく 、 それと元のオーディオ データ と重畳して出来る重畳オーディ オデータの所定周期ごとの所定総 和の結果の符号が透かしデータのビッ ト値に対応しているので、 容易に 透かしデータを検出/復号するこ とができる。
また、 この透かしデータの埋め込み過程は可逆であ り 、 透かしデータ の埋め込み時に使用された透かし生成用データの振幅の時系列データが あれば完全に元に戻すこ とができ る。 さ らに、 ある人が透かしデータを 埋め込んだあと、 別の人が別の透かしデータを埋め込んでも、 それぞれ の過程で使用された透かし生成用データの振幅の時系列データがあれば. それぞれの透かしデータを取り 出 し、 且つ、 元のオーディオデータに戻 すこ とができる。 このよ う に、 何重にでも埋め込むこ とができるので、 例えば著作権者が著作権情報を埋め込んだ後、 その著作権を保護した状 態でコンテンツ配信業者が不正な二次配信を防止する 目的で独自の I D を埋め込むといったよ うなこ と も可能となる。
また、 逆にその半周期ごとの透かしデータの振幅の時系列データがな いと元のオーディ オデータを復元するこ とは原理的に不可能なので、 最 初に透かしデータを埋め込んだと きの上記時系列データをもっている者 以外は元のオーディオデータを復元できず、 このこ と を利用 して改ざん に対し抑止力のあるシステムを構築するこ と も可能である。

Claims

請求の範囲
1 . 音声記録媒体に透かしデータを記録するためのオーディ オ電子透か し装置であって、
オーディオデータを取得するオーディオデータ取得部と、
透かしデータを取得する透かしデータ取得部と、
前記オーディォデータ取得部で取得したオーディ ォデータ と重畳して 重畳オーディ オデータ とするこ とで所定周期ごとの重畳オーディ オデー タの所定総和の結果が前記透かしデータ取得部で取得した透かしデータ を表す透かし生成用データを生成する透かし生成用データ生成部と、 前記オーディオデータ取得部で取得したオーディオデータ と、 前記透 かし生成用データ生成部で生成した透かし生成用データ と を重畳して重 畳オーディオデータを生成する重畳オーディオデータ生成部と、 を有するオーディオ電子透かし装置。
2 . 前記透かし生成用データ生成部は、 人間の耳で聞き とれない低周波 の透かし生成用データを生成する請求項 1 に記載のオーディ オ電子透か し装置。
3 . 前記透かし生成用データ生成部は、 それによつて生成される透かし 生成用データの表す関数の振幅の変化する境界における値と傾きが常に ゼロである前記透かし生成用データを生成する請求項 1 又は 2 に記載の オーディオ電子透かし装置。
4 . 前記透かし生成用データ生成部は、 前記所定周期ごとの前記所定総 和の結果が前記透かしデータ取得部で取得した透かしデータを表すよ う に、 前記透かし生成用データの表す関数の振幅を半周期ごと に適応的に 変化させる請求項 1 から 3 のいずれか一に記載のオーディオ電子透かし
5 . 前記所定周期ごとの前記所定総和の結果は、 前記透かし生成用デー タの半周期ごとの前記重畳オーディオデータの総和の符号である請求項 1 から 4 のいずれか一に記載のオーディオ電子透かし装置。
6 . 前記所定周期ごとの前記所定総和の結果は、 前記透かし生成用デー タの前半周期と後半周期に対応する前記重畳オーディ オデータの総和の 差分の符号である請求項 1 から 4 のいずれか一に記載のオーディオ電子 透かし装置。
7 . 音声記録媒体に記録された透かしデータを復号するためのオーディ ォ電子透かし復号装置であって、
重畳オーディオデータを取得する重畳オーディオデータ取得部と、 重畳オーディオデータ取得部で取得した重畳オーディオデータの前記 所定周期ごとの所定総和の結果を算出する総和算出部と、
前記総和算出部で算出された前記所定総和の結果に基づいて前記透か しデータを復号する透かしデータ復号部と、
を有するオーディオ電子透かし復号装置。
8 . 前記総和算出部は、 前記重畳オーディオデータ取得部で取得した重 畳オーディオデータの、 前記透かし生成用データの半周期の時間にわた る総和の符号を算出する請求項 7 に記載のオーディ オ電子透かし復号装
9 . 前記総和算出部は、 前記重畳オーディオデータ取得部で取得した重 畳オーディオデータの、 前記透かし生成用データの 1周期の前半の半周 期の時間にわたる総和と後半の半周期の時間にわたる総和の差の符号を 算出する請求項 7 に記載のオーディオ電子透かし復号装置。
1 0 . 音声記録媒体に透かしデータを記録するためのオーディオ電子透 かし記録方法であって、
オーディオデータを取得するオーディオデータ取得ステップと、 透かしデータを取得する透かしデータ取得ステップと、
前記オーディオデータ取得ステ ップで取得したオーディオデータ と重 畳して重畳オーディ オデータ とするこ とで所定周期ごとの重畳オーディ ォデータの所定総和の結果が前記透かしデータ取得ステ ップで取得した 透かしデータを表す透かし生成用データを生成する透かし生成用データ 生成ステップと、
前記オーディオデータ取得ステ ップで取得したオーディオデータ と、 前記透かし生成用データ生成ステ ップで生成した透かし生成用データ と を重畳して重畳オーディオデータを生成する重畳オーディオデータ生成 ステ ップと 、
を有するオーディオ電子透かし記録方法。
1 1 . 前記透かし生成用データ生成ステップは、 人間の耳で聞き とれな い低周波の透かし生成用データを生成する請求項 1 0 に記載のオーディ ォ電子透かし記録方法。
1 2 . 前記透かし生成用データ生成ステップは、 それによつて生成され る透かし生成用データの表す関数の振幅の変化する境界における値と傾 きが常にゼロである前記透かし生成用データ を生成する請求項 1 0又は 1 1 に記載のオーディオ電子透かし記録方法。
1 3 . 前記透かし生成用データ生成ステ ップは、 前記所定周期ごとの前 記所定総和の結果が前記透かしデータ取得ステ ップで取得した透かしデ ータを表すよ う に、 前記透かし生成用データの表す関数の振幅を半周期 ごと に適応的に変化させる請求項 1 0から 1 2 のいずれか一に記載のォ 一ディォ電子透かし記録方法。
1 4 . 前記所定周期ごとの前記所定総和の結果は、 前記透かし生成用デ ータの半周期ごとの前記重畳オーディオデータの総和の符号である請求 項 1 0から 1 3 のいずれか一に記載のオーディオ電子透かし記録方法。
1 5 . 前記所定周期ごとの前記所定総和の結果は、 前記透かし生成用デ ータの前半周期と後半周期に対応する前記重畳オーディ オデータの総和 の差分の符号である請求項 1 0 から 1 3 のいずれか一に記載のオーディ ォ電子透かし記録方法。
1 6 . 音声記録媒体に記録された透かしデータを復号するためのオーデ ィォ電子透かし復号方法であって、
重畳オーディオデータを取得する重畳オーディオデータ取得ステ ップ と、
重畳オーディオデータ取得ステップで取得した重畳オーディオデータ の前記所定周期ごとの所定総和の結果を算出する総和算出ステップと、 前記総和算出ステ ップで算出された所定総和の結果に基づいて前記透 かしデータを復号する透かしデ一タ復号ステップと、
を有するオーディオ電子透かし復号方法。
1 7 . 前記総和算出ステップは、 前記重畳オーディオデータ取得ステツ プで取得した重畳オーディ オデータの、 前記透かし生成用データの半周 期の時間にわたる総和の符号を算出する請求項 1 6 に記載のオーディオ 電子透かし復号方法。
1 8 . 前記総和算出ステップは、 前記重畳オーディ オデータ取得ステツ プで取得した重畳オーディ オデータの、 前記透かし生成用データの 1周 期の前半の半周期の時間にわたる総和と後半の半周期の時間にわたる総 和の差の符号を算出する請求項 1 6 に記載のオーディ オ電子透かし復号 方法。
PCT/JP2003/006114 2003-05-16 2003-05-16 オーディオ電子透かし装置 WO2004102528A1 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2004571864A JPWO2004102528A1 (ja) 2003-05-16 2003-05-16 オーディオ電子透かし装置
US10/542,277 US20060052887A1 (en) 2003-05-16 2003-05-16 Audio electronic watermarking device
PCT/JP2003/006114 WO2004102528A1 (ja) 2003-05-16 2003-05-16 オーディオ電子透かし装置
AU2003231518A AU2003231518A1 (en) 2003-05-16 2003-05-16 Audio electronic watermarking device
FI20050021A FI20050021A (fi) 2003-05-16 2005-01-10 Digitaaliseen äänivesileimaan liittyvä laite

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2003/006114 WO2004102528A1 (ja) 2003-05-16 2003-05-16 オーディオ電子透かし装置

Publications (1)

Publication Number Publication Date
WO2004102528A1 true WO2004102528A1 (ja) 2004-11-25

Family

ID=33446551

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2003/006114 WO2004102528A1 (ja) 2003-05-16 2003-05-16 オーディオ電子透かし装置

Country Status (5)

Country Link
US (1) US20060052887A1 (ja)
JP (1) JPWO2004102528A1 (ja)
AU (1) AU2003231518A1 (ja)
FI (1) FI20050021A (ja)
WO (1) WO2004102528A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2409956A (en) * 2004-09-01 2005-07-13 Ace Records Ltd Watermarking audio tracks by inverting a portion of the audio signal
JP2006227330A (ja) * 2005-02-18 2006-08-31 Dainippon Printing Co Ltd 音響信号に対する情報の埋め込み装置・方法、音響信号からの情報の抽出装置・方法
JP2006235359A (ja) * 2005-02-25 2006-09-07 Dainippon Printing Co Ltd 音響信号からの情報の抽出装置

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4197307B2 (ja) * 2004-03-30 2008-12-17 インターナショナル・ビジネス・マシーンズ・コーポレーション 電子透かし検出装置、その検出方法及びプログラム
CN103137134B (zh) * 2011-11-28 2015-03-11 鸿富锦精密工业(深圳)有限公司 音频设备及音频信号的水印信息加载方法
US11244692B2 (en) * 2018-10-04 2022-02-08 Digital Voice Systems, Inc. Audio watermarking via correlation modification using an amplitude and a magnitude modification based on watermark data and to reduce distortion
CN112153482B (zh) * 2020-09-16 2022-02-22 山东科技大学 一种音视频匹配零水印生成方法及音视频防篡改检测方法
DE102024001192A1 (de) 2024-04-13 2024-06-06 Mercedes-Benz Group AG Computerimplementiertes Verfahren zum Markieren von Daten mit einem digitalen Wasserzeichen, Computerprogrammprodukt und Recheneinheit

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001188549A (ja) * 1999-12-29 2001-07-10 Sony Corp 情報処理装置及びその方法並びにプログラム格納媒体
JP2003162288A (ja) * 2001-11-28 2003-06-06 M Ken Co Ltd 音声情報に透かし情報を埋め込む方法及び透かし情報を埋め込んだ音声情報から透かし情報を検出する方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001188549A (ja) * 1999-12-29 2001-07-10 Sony Corp 情報処理装置及びその方法並びにプログラム格納媒体
JP2003162288A (ja) * 2001-11-28 2003-06-06 M Ken Co Ltd 音声情報に透かし情報を埋め込む方法及び透かし情報を埋め込んだ音声情報から透かし情報を検出する方法

Non-Patent Citations (13)

* Cited by examiner, † Cited by third party
Title
BASSIA P. ET AL.: "Robust audio watermarking in the time domain", IEEE TRANSACTIONS ON MULTIMEDIA, vol. 3, no. 2, June 2001 (2001-06-01), pages 232 - 241, XP002982757 *
HUANG J. ET AL.: "A blind audio watermarking algorithm with self-synchronization", PROC. OF 2002 IEEE INTERNATIONAL SYMPOSIUM ON CIRCUITS AND SYSTEMS, vol. 3, May 2002 (2002-05-01), pages 627 - 630, XP002982759 *
IKEDA M. ET AL.: "Taiiki seigen sareta ransu keiretsu o mochiita gaukon eno joho umekomi", DENSI JOHO TSUSHIN GAKKAI KENKYU HOKOKU UONSEI], vol. 98, no. 264, 11 September 1998 (1998-09-11), pages 63 - 68, XP002982761 *
INOUE A.: "Denshi sukashi multi media jidai no ango system", KABUSHIKI KAISHA KOBOSHA, 20 November 1997 (1997-11-20), pages 23 - 53, XP002982768 *
ISHII M. ET AL.: "Iso joho o riro shita onkyo joho ni taisuru denshi sukashi", 2001 NEN ANGO TO JOHO SECURITY SYMPOSIUM YOKOSHU, vol. 2, 23 January 2001 (2001-01-23), pages 909 - 913, XP002982765 *
IWAKARI M., MATSUI K.: "Taiiki bunkatsu to spectrum kakusan o mochiita digital ongaku eno denshi sukashi", 2001 NEN ANGO TO JOHO SECURITY SYMPOSIUM YOKOSHU, vol. 2, 23 January 2001 (2001-01-23), pages 921 - 926, XP002982767 *
IWAKIRI M. ET AL.: "Gaukon fugo eno denshi sukashi ni kansuru ichiteian", 2001 NEN ANGO TO JOHO SECURITY SYMPOSIUM YOKOSHU, vol. 2, 23 January 2001 (2001-01-23), pages 915 - 920, XP002982766 *
IWAKIRI M., MATSUI K.: "Digital ongaku eno denshi sukashi ni kansuru ichiteian", COMPUTER SECURITY SYMPOSIUM 2000, 26 October 2000 (2000-10-26), pages 91 - 96, XP002982763 *
IWAKIRI M., MATSUI K.: "Kacho taiiki o koryo shita ongaku soft eno kahengata denshi sukashi", TRANSACTIONS OF INFORMATION PROCESSING SOCIETY OF JAPAN, vol. 42, no. 5, 15 May 2001 (2001-05-15), pages 1254 - 1262, XP002982758 *
KOIZUMI S., NISHI T.: "Onkyo shingo eno data umekomi.kenshutsu shuho no ichikento", DENSHI JOHO TSUSHIN GAKKAI KENKYU HOKOKU UOYO ONKYO], vol. 98, no. 679, 19 March 1999 (1999-03-19), pages 21 - 26, XP002982762 *
MATSUI K.: "Denshi sukashi no kiso", MORIKITA SHUPPAN CO. LTD., 21 August 1998 (1998-08-21), pages 146 - 194, XP002982769 *
NAKAYAMA A. ET AL.: "Jikan.shuhasu masking in motozuku audio shingo eno denshi sukashi", DENSHI JOHO TSUSHIN GAKKAI KENKYU HOKOKUUONSEI], vol. 98, no. 264, 11 September 1998 (1998-09-11), pages 57 - 62, XP002982760 *
NAKAYAMA A. ET AL.: "Shinri onkyo model ni motozuita audio shingo no denshi sukashi", THE TRANSACTIONS OF THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS D-II, vol. J83-D-II, no. 11, 25 November 2000 (2000-11-25), pages 2255 - 2263, XP002982764 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2409956A (en) * 2004-09-01 2005-07-13 Ace Records Ltd Watermarking audio tracks by inverting a portion of the audio signal
GB2409956B (en) * 2004-09-01 2005-12-07 Ace Records Ltd Audio watermarking
JP2006227330A (ja) * 2005-02-18 2006-08-31 Dainippon Printing Co Ltd 音響信号に対する情報の埋め込み装置・方法、音響信号からの情報の抽出装置・方法
JP2006235359A (ja) * 2005-02-25 2006-09-07 Dainippon Printing Co Ltd 音響信号からの情報の抽出装置
JP4713180B2 (ja) * 2005-02-25 2011-06-29 大日本印刷株式会社 音響信号からの情報の抽出装置

Also Published As

Publication number Publication date
FI20050021A (fi) 2005-01-10
US20060052887A1 (en) 2006-03-09
AU2003231518A1 (en) 2004-12-03
JPWO2004102528A1 (ja) 2006-07-13

Similar Documents

Publication Publication Date Title
EP1684265B1 (en) Method of embedding a digital watermark in a useful signal
EP1256086B1 (en) Methods and apparatus for multi-layer data hiding
Wu et al. Robust and efficient digital audio watermarking using audio content analysis
Yeo et al. Modified patchwork algorithm: A novel audio watermarking scheme
US7664958B2 (en) Optimization methods for the insertion, protection and detection of digital watermarks in digital data
US5889868A (en) Optimization methods for the insertion, protection, and detection of digital watermarks in digitized data
US20040059581A1 (en) Audio watermarking with dual watermarks
JP2008529046A5 (ja)
WO2001005075A1 (en) Improved audio watermarking with covert channel and permutations
Dhar et al. A new DCT-based watermarking method for copyright protection of digital audio
Dhar et al. Digital watermarking scheme based on fast Fourier transformation for audio copyright protection
KR20020022131A (ko) 디지털 권리들 관리를 위한 신호 프로세싱 방법들,디바이스들 및 응용들
WO2004102528A1 (ja) オーディオ電子透かし装置
US7114071B1 (en) Method and apparatus for embedding digital watermarking into compressed multimedia signals
Singh et al. Enhancement of LSB based steganography for hiding image in audio
JP2003044067A (ja) 位相の周期偏移によるディジタルデータの埋めこみ・検出装置
Loytynoja et al. Audio protection with removable watermarking
Kaabneh et al. Muteness-based audio watermarking technique
Jenkins et al. Steganography in audio
Hatada et al. Digital watermarking based on process of speech production
Aboelezz Watermarking audio files with copyrights
JP5486839B2 (ja) 小型検出窓を利用した電子透かし埋め込み検出方法
Steinebach et al. Evaluation of robustness and transparency of multiple audio watermark embedding
WO2001043422A1 (fr) Procede de traitement d&#39;information et support enregistre
De Li et al. Research on Copyright Protection Technology Based on MIDI Music Structural Features

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NI NO NZ OM PH PL PT RO RU SC SD SE SG SK SL TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): GH GM KE LS MW MZ SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IT LU MC NL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

WWE Wipo information: entry into national phase

Ref document number: 20050021

Country of ref document: FI

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 2004571864

Country of ref document: JP

ENP Entry into the national phase

Ref document number: 2006052887

Country of ref document: US

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 10542277

Country of ref document: US

WWP Wipo information: published in national office

Ref document number: 10542277

Country of ref document: US

122 Ep: pct application non-entry in european phase