JP2000330579A - Method and device for inserting watermark into music information and its program recording medium - Google Patents

Method and device for inserting watermark into music information and its program recording medium

Info

Publication number
JP2000330579A
JP2000330579A JP11144274A JP14427499A JP2000330579A JP 2000330579 A JP2000330579 A JP 2000330579A JP 11144274 A JP11144274 A JP 11144274A JP 14427499 A JP14427499 A JP 14427499A JP 2000330579 A JP2000330579 A JP 2000330579A
Authority
JP
Japan
Prior art keywords
information
watermark
insertion position
music
relative signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11144274A
Other languages
Japanese (ja)
Inventor
Yumiko Matsuura
由美子 松浦
Kenichi Minami
憲一 南
Atsuki Tomioka
淳樹 富岡
Kazuhiro Sugiyama
和弘 杉山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP11144274A priority Critical patent/JP2000330579A/en
Publication of JP2000330579A publication Critical patent/JP2000330579A/en
Pending legal-status Critical Current

Links

Landscapes

  • Storage Device Security (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

PROBLEM TO BE SOLVED: To make noise caused by inserting a watermark less conspicuous. SOLUTION: In the watermark insertion method, a watermark inserting position is randomly determined with respect to musical sound signals. If one of the binary watermark information is '1', the musical sounds from an insertion position Pn to Xmsec are duplicated and made into as insertion signals. If the information is '0', the musical sounds from Pn+X to Xmsec are duplicated and inserted to an insertion position Pn as insertion signals. Note that before inserting the signals, the musical sounds from the position Pn to Xmsec are duplicated, the sound pressure is increased for 5 dB to produce relative signals, the signals are delayed for Ymsec, that is an allowable delay for the perception characteristic, and the signals are inserted into the musical sounds. Thus, the insertion signals are suppressed hearingwise by the relative signals.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】この発明は、広域電子計算機
網(インターネット)等の通信網を介し、音楽情報の配
信を行うシステムにおいて、例えば音楽情報の著作権を
保護するための情報、いわゆる電子透かしを音楽情報に
重畳する方法、装置及びプログラム記録媒体に関するも
のである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a system for distributing music information via a communication network such as a wide area computer network (Internet), for example, information for protecting the copyright of music information, a so-called digital watermark. And an apparatus for superimposing music information on music information.

【0002】[0002]

【従来の技術】従来はインターネット等の通信網を介し
て音楽情報を配信するシステムにおいて、音楽情報を無
断で容易に複製されてしまうという問題があり、数々の
セキュリティ情報の埋め込み手法が考え出されている。
符号化された音楽情報に関しては、セキュリティデータ
をデジタルデータとして付加しておくことによってセキ
ュリティデータの読み込みを行い、複製を防止するなど
の手法が取られていた。しかし、符号化された音楽情報
から音声波形データに復号化されてしまうと、付加され
ていた情報が消滅し、セキュリティデータのない情報の
複製が可能になってしまう。そこで、復号化されてもセ
キュリティデータを失わないよう、音声波形データに関
してはS/N比を劣化させることなくセキュリティデー
タを埋め込む手法について検討されてきた。
2. Description of the Related Art Conventionally, in a system for distributing music information via a communication network such as the Internet, there is a problem that music information is easily copied without permission, and various security information embedding methods have been devised. ing.
With respect to encoded music information, security data has been added as digital data to read the security data to prevent duplication and the like. However, if the encoded music information is decoded into audio waveform data, the added information disappears, and information without security data can be copied. Therefore, a method of embedding security data in audio waveform data without deteriorating the S / N ratio has been studied so that the security data is not lost even if the data is decoded.

【0003】[0003]

【発明が解決しようとする課題】音声波形データに多く
の情報を含めたセキュリティデータを埋め込もうとする
際、雑音を少なくするために人間の耳で聴取することの
できない周波数領域にデータを埋め込むという手法が取
られている。しかし、ほとんどの符号化では、人間の耳
で聴取できない部分を削ることによってデータ量を削減
するという手法をとっているため、埋め込みデータが消
えてしまうということが生じる。
When embedding security data including a great deal of information in audio waveform data, the data is embedded in a frequency region that cannot be heard by human ears in order to reduce noise. That technique is taken. However, in most encodings, a method of reducing the amount of data by removing portions that cannot be heard by the human ear is employed, and thus embedded data may disappear.

【0004】[0004]

【課題を解決するための手段】そこで、この発明では埋
め込む情報は雑音として埋め込んでしまい、その雑音を
音として抑圧する信号を挿入することによって、埋め込
みデータの存在を知覚不可能にし、複製を防止するため
音楽情報に変更を行うと雑音を残すことを可能にし、さ
らに左右のチャネルに埋め込みデータを分散させること
によって、データ埋め込み位置の相関の解読が困難であ
るようにデータを埋め込む。
Therefore, according to the present invention, information to be embedded is embedded as noise, and a signal for suppressing the noise as sound is inserted to make the presence of the embedded data inaudible and prevent duplication. Therefore, when the music information is changed, it is possible to leave noise when the data is changed, and furthermore, by embedding the data into the left and right channels, the data is embedded so that it is difficult to decipher the correlation between the data embedding positions.

【0005】[0005]

【発明の実施の形態】この発明の多チャネル楽音への透
かし挿入法とその装置の構成は以下のようになってい
る。図1に示すように挿入情報生成部1で、デジタルデ
ータに変換された楽音データとその楽音データの属性を
入力とし、その楽音データに挿入する情報を2値の信号
として生成する。透かし情報挿入部2では、その楽音デ
ータ内の挿入情報を埋め込む位置を決定し、前記2値信
号の挿入情報を透かしとして挿入する。相対信号挿入部
3ではその挿入された信号により生じる雑音を音として
抑圧する信号を生成して楽音データに挿入する。透かし
情報解読部4で挿入信号を読み取り、その読み取った信
号を属性情報再生部5で属性情報に復元する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS The method of inserting a watermark into a multi-channel tone according to the present invention and the configuration of the apparatus are as follows. As shown in FIG. 1, the insertion information generation unit 1 receives as input the tone data converted into digital data and the attributes of the tone data, and generates information to be inserted into the tone data as a binary signal. The watermark information insertion unit 2 determines a position where the insertion information in the musical sound data is to be embedded, and inserts the insertion information of the binary signal as a watermark. The relative signal insertion unit 3 generates a signal that suppresses noise generated by the inserted signal as a sound, and inserts the signal into the musical sound data. The insertion signal is read by the watermark information decoding unit 4, and the read signal is restored to the attribute information by the attribute information reproducing unit 5.

【0006】さらに具体的に述べると、挿入情報生成部
1内の属性情報生成部11では、入力された属性情報か
ら、例えば権利情報等の変化することがまれで、重要度
が高く改ざんを最大限に防ぐ必要のある作曲者、著作権
者など楽音データに固有で普遍な情報Ieと、例えば配
信元、利用者の利用状況、配信経路等の更新頻度が高く
高速な読み出し処理が必要とされる配信者、利用者など
の利用状況によって変動する情報Imとを生成する。
More specifically, the attribute information generation unit 11 in the insertion information generation unit 1 rarely changes, for example, the right information, etc. from the input attribute information. The information Ie that is unique to music data, such as a composer and a copyright holder, that needs to be prevented as much as possible, and a high-speed readout process that requires a high update frequency, such as a distribution source, a user's usage status, and a distribution route, are required. And information Im that fluctuates depending on the use situation of the distributor, the user, and the like.

【0007】挿入コード生成部12では、属性情報生成
部11で生成されたこれら挿入情報を、楽音データに挿
入可能な2値へ変換する。普遍な情報Ieは情報生成に
時間を要しても解読が困難な形にする必要があるため、
例えば固有の2値化辞書を用いる、固有の符号化方法を
用いるなどして2値化を行う。一方、変動する情報Im
については、経路(どのような経路で複製がなされたか
を示す経路)を追加していくこと、経路を迅速に特定す
ることを考量し、情報量を少なく、かつ高速に読み出し
可能である必要があるため、例えばHuffman符号化など
広く一般的で高圧縮率、処理が少ないものを用い2値を
行う。
The insert code generator 12 converts the insert information generated by the attribute information generator 11 into binary data that can be inserted into musical tone data. Since the universal information Ie needs to be in a form that is difficult to decipher even if it takes time to generate information,
For example, binarization is performed using a unique binarization dictionary, a unique encoding method, or the like. On the other hand, the changing information Im
As for (2), it is necessary to reduce the amount of information and to be able to read data at high speed in consideration of adding a path (a path indicating the type of duplication performed) and quickly specifying the path. For this reason, for example, binarization is performed using a widely-common, high-compression rate, and low-processing amount such as Huffman coding.

【0008】透かし情報挿入部2は図2に示すように、
情報の挿入位置に規則性があると情報の取り出し、解読
が容易になるため、その困難性を求めるために、挿入位
置を分散させる必要があり、その元となる乱数を乱数発
生部21で発生させる。乱数はこの楽音データに対して
は一意性を保つ必要があり、さらに解読の困難性をも保
つため、乱数の発生元となるシード値や幅、乱数発生ア
ルゴリズムを、情報提供者、情報利用者両者が共有す
る。
[0008] As shown in FIG.
If the information insertion position has regularity, it is easy to extract and decode the information. Therefore, in order to find the difficulty, it is necessary to disperse the insertion position. Let it. Random numbers must maintain uniqueness with respect to this musical tone data, and in order to maintain the difficulty of decoding, the seed value and width from which random numbers are generated, the random number generation algorithm, and the information provider and information user Both share.

【0009】時系列位置決定部22では、乱数発生部2
1で発生した乱数の第1番目の値から、該当乱数を昇順
に並べるか降順に並べるかを決定する。挿入する時系列
点を決定するためには、第2番目の以後の発生乱数を、
挿入データの総ビット数分使用し、その乱数を第1番目
の値から決定された順に並べたリストを生成する。各値
はその音楽データを秒単位で表した各時系列点を表して
おり、該当時間に情報が挿入されることになる。
The time-series position determining unit 22 includes a random number generating unit 2
From the first value of the random numbers generated in step 1, it is determined whether the random numbers are arranged in ascending or descending order. To determine the time series point to insert, the second and subsequent generated random numbers are
A list is generated by using the total number of bits of the insertion data and arranging the random numbers in the order determined from the first value. Each value represents each time-series point representing the music data in units of seconds, and information is inserted at the corresponding time.

【0010】挿入チャネル決定部23では、乱数発生部
21で発生した乱数の第1番目の値が偶数か奇数かによ
り、左(右)のチャネルに偶数、奇数のどちらを割り当
てるかを決定する。挿入するチャネルを決定する第2番
目以後の乱数は、挿入データの総ビット数分について、
発生順にその値の偶数、奇数を判別し、挿入するチャネ
ルを決定する。
The insertion channel determining unit 23 determines whether to assign an even number or an odd number to the left (right) channel depending on whether the first value of the random number generated by the random number generating unit 21 is an even number or an odd number. The second and subsequent random numbers for determining the channel to be inserted are as follows for the total number of bits of the insertion data.
The even and odd numbers of the values are determined in the order of occurrence, and the channel to be inserted is determined.

【0011】挿入周波数決定部24では、符号化により
削除されないと予測される部分で、かつ知覚的に判別が
困難な場所を選択する。一例として、符号化により削除
されない部分としては、聴覚心理モデルのマスクに入ら
ない部分が考えられることから、マスキングを受けない
部分を選択する。さらに、継続的に音が持続している部
分では多少の変化も知覚してしまうため、持続の短い周
波数を選択する、雑音を打ち消した後の少々の残響音が
残っても知覚しにくいよう近い周波数に音が集中してい
るところを選択するなどの処理を行い、これら3つの条
件を満たす周波数帯を情報挿入周波数と決定する。
The insertion frequency determination unit 24 selects a part which is predicted not to be deleted by encoding and which is difficult to perceptually determine. As an example, a part that does not enter the mask of the psychoacoustic model is considered as a part that is not deleted by encoding, and therefore a part that is not subjected to masking is selected. Furthermore, since a slight change is perceived in the part where the sound is continuously sustained, a frequency with a short duration is selected, and even if a small amount of reverberation remains after canceling noise, it is hard to perceive Processing such as selecting a portion where sound is concentrated on the frequency is performed, and a frequency band satisfying these three conditions is determined as the information insertion frequency.

【0012】挿入信号生成部25では、例えばジャンル
による違いなど全く種類の異なる信号を透かしとして挿
入してしまうと、十分に抑圧することが困難になるた
め、挿入信号ISnとして時系列位置決定部22と挿入
チャネル決定部23で決定された挿入位置Pn付近の楽
音信号MS(n)の複製を用いる。挿入コード生成部1
2で2値化された挿入情報Inの片方の値、例えば1と
0に2値化している場合は、その挿入位置に1を挿入す
る場合は、図4に示すように挿入位置Pnから打ち消し
難いクリック音にならないような十分な長さX(単位ms
ec)前の楽音信号を複製する。クリック音として知覚さ
れない最低限の複製長Xは、挿入位置Pnから初期値と
して与えられる参考信号長S(単位msec)前までの楽音
信号MS(Pn−S),…,MS(Pn)の平均周波数
Sp を算出し(251,図3)、以下の式(1)で近似
する。
In the insertion signal generation unit 25, if completely different types of signals such as genres are inserted as watermarks, it is difficult to sufficiently suppress the signals. Therefore, the time series position determination unit 22 is used as the insertion signal ISn. And a copy of the tone signal MS (n) near the insertion position Pn determined by the insertion channel determination unit 23. Insertion code generator 1
When one value of the insertion information In binarized by 2 is binarized to, for example, 1 and 0, and 1 is inserted at the insertion position, the insertion is canceled from the insertion position Pn as shown in FIG. A length X (unit: ms) that does not cause a difficult click sound
ec) Duplicate the previous tone signal. The minimum copy length X that is not perceived as a click sound is the average of the tone signals MS (Pn-S),..., MS (Pn) from the insertion position Pn to the reference signal length S (unit: msec) given as an initial value. The frequency Sp is calculated (251, FIG. 3) and approximated by the following equation (1).

【0013】 つまり、参考信号長Sは楽音信号の周波数を分析できる
に必要な長さであり、例えば200msecとし、その分析
周波数の平均周波数Sp が0以上1KHz以下であるか、
否かを判定(252),0Sp 1KHzであればX=
1875/Sp+10msecとし(253),Sp が1KH
zを超えていればX=12msecとする(254)。この
挿入位置Pnに挿入する挿入情報Inが1であるか否か
を調べ(255)、この挿入位置Pnに0を挿入する場
合は、図4に示すように挿入位置Pnから挿入信号が埋
め込まれる時間X分をあけ、その位置Pn+Xからその
先の位置Pn+2Xまでの時間Xの分の信号ISn=M
S(Pn+X),…,MS(Pn+2X)を複製する
(256,図3参照)。
[0013] In other words, the reference signal length S is a length necessary for analyzing the frequency of the musical tone signal. For example, the reference signal length S is set to 200 msec.
(252), if 0 < Sp < 1 KHz, X =
1875 / Sp + 10 msec (253), where Sp is 1 KH
If it exceeds z, X = 12 msec (254). It is checked whether or not the insertion information In to be inserted into the insertion position Pn is 1 (255). When 0 is inserted into the insertion position Pn, an insertion signal is embedded from the insertion position Pn as shown in FIG. After a time X, the signal ISn = M for the time X from the position Pn + X to the position Pn + 2X after that.
S (Pn + X),..., MS (Pn + 2X) are duplicated (256, see FIG. 3).

【0014】挿入情報Inが1の場合は図4に示すよう
に挿入位置Pnに対し、時間X前の位置Pn−Xから時
間Xの分の信号ISn=MS(Pn−X),…,MS
(Pn)を複製する(257)。なお、前記式(1)
は、例えば1KHz以上では一方の耳に12ミリ秒早く音
が到達すると、それより遅延してきた音はその耳に聞き
とれないという公知の聴覚特性により数値が選ばれたも
のである。
When the insertion information In is 1, as shown in FIG. 4, the signal ISn = MS (Pn-X),..., MS for the time X from the position Pn-X before the time X with respect to the insertion position Pn.
(Pn) is copied (257). Note that the above equation (1)
Is a numerical value selected according to the well-known auditory characteristic that, for example, at 1 kHz or more, when a sound arrives at one ear earlier by 12 milliseconds, the sound delayed later cannot be heard by the ear.

【0015】このように挿入信号の1,0に対応した複
製信号を得て、これを後述するように楽音信号の挿入位
置Pnに透かし情報として挿入するが、その挿入部分は
楽音信号と透かし情報との合成信号となり、つまり雑音
となる。この雑音を抑圧するため、以下に述べるように
相対信号を作成して楽音信号に挿入する。左、右チャネ
ルの片方のチャネルからの音が1〜30msecほど先行す
ると、後続の対応している他方のチャネルの音を知覚す
ることができず、後続する他方のチャネルの音圧を5dB
程度大きくすることにより知覚可能になり、同位相に聞
こえるという人間の左右の耳の知覚特性を用い、相対信
号挿入部では挿入信号が挿入されたチャネルの挿入位置
の楽音を、同じチャネルの後続データに音圧を上げ合成
したものから知覚するように変更するという手法で打ち
消しを行う。つまり、図5Aに示すように、“1”を挿
入する場合は挿入位置Pnから直前のXmsecの楽音を複
製して矢印のように挿入位置PnからXmsecの部分に
挿入するが、その挿入前のPnからXmsecの部分の楽音
を複製し(矢印のように取り出し)、これの音圧を上
げて矢印のようにPn+YからXmsecの部分に挿入し
て、前記の挿入にもとづく雑音(合成)を抑圧する。
同様に図5Bに示すように、“0”を挿入する場合は、
Pn+XからPn+2Xの楽音の複製を矢印のように
PnからXmsecの部分に挿入し、その挿入前のPnから
Xmsecの部分を矢印のように取り出し、音圧を上げて
矢印のようにPn+YからXmsecの部分に挿入する。
As described above, a duplicate signal corresponding to the inserted signal 1, 0 is obtained, and this is inserted as watermark information into the insertion position Pn of the tone signal as described later. , Ie, noise. In order to suppress this noise, a relative signal is created and inserted into a tone signal as described below. If the sound from one of the left and right channels precedes by about 1 to 30 msec, the sound of the other corresponding subsequent channel cannot be perceived, and the sound pressure of the other following channel becomes 5 dB.
The relative signal insertion unit uses the perceptual characteristics of the left and right ears of the human to hear the same phase, and the tone at the insertion position of the channel in which the insertion signal is inserted is converted to the subsequent data of the same channel. The noise is canceled by a method in which the sound pressure is increased and the synthesized sound is changed so as to be perceived. That is, as shown in FIG. 5A, when "1" is inserted, the musical tone of Xmsec immediately before the insertion position Pn is copied and inserted into the portion of Xmsec from the insertion position Pn as indicated by an arrow, but before the insertion. Duplicate the tone from Pn to Xmsec (taken out as indicated by the arrow), increase the sound pressure and insert it into the portion from Pn + Y to Xmsec as indicated by the arrow to suppress noise (synthesis) based on the insertion. I do.
Similarly, as shown in FIG. 5B, when inserting “0”,
A copy of the musical tone from Pn + X to Pn + 2X is inserted into the part from Pn to Xmsec as shown by the arrow, the part from Pn to Xmsec before the insertion is taken out as shown by the arrow, and the sound pressure is increased to increase the sound pressure from Pn + Y to Xmsec as shown by the arrow. Insert into the part.

【0016】逆位相位置決定部31では、図6に示すよ
うに透かし情報挿入部2で決定された挿入位置の時系列
位置を取得し、挿入チャネルのリストを生成し、各その
挿入位置から知覚特性により許容される遅延時間Y(単
位 msec)後ろへずらした位置Ynを、挿入された複製情
報にもとづく雑音を抑圧するための相対信号を挿入する
位置に決定する。この時、楽音信号が様々な周波数を持
つ多彩な音源を用いている場合と、音源数が少ない場合
とでは、後者の方をより遅延時間を短くして知覚困難に
する必要があるため、遅延時間Yを以下の式で求める。
あらかじめ周波数帯域を入力値H個のサブバンドSbnに
分けておき、挿入位置Pnから初期値として与えられる
参考信号長Sまでの楽音信号MS(Pn),…,MS
(Pn+S)に対し、次数Nのフーリエ変換を行い(3
1−1)、その結果をサブバンドSBnに対応させたと
き、対応する値の存在しているサブバンド数をHsとす
る。つまり、i=1,2,…N(N次数)を0に、また
スペクトルが存在するサブバンドの個数Hsを0にそれ
ぞれ初期化し(31−2),i<Nかを判定し(31−
3),i<Nであれば、iのスペクトルFn(i)がサ
ブバンドの何れかにあるかを判定し(31−4)であれ
ばHsを+1し(31−5),さらにiを+1してステ
ップ31−3に戻り、ステップ31−4でサブバンドに
なければステップ31−6に移り、ステップ31−3で
iがNと等しくなれば、Hs/Hが1/10以下である
かの判定を行う(31−7)。
The antiphase position determining section 31 acquires the time-series positions of the insertion positions determined by the watermark information inserting section 2 as shown in FIG. 6, generates a list of insertion channels, and perceives from the insertion positions. The position Yn shifted backward by the delay time Y (unit: msec) allowed by the characteristic is determined as a position where a relative signal for suppressing noise based on the inserted copy information is inserted. At this time, when the sound signal uses various sound sources having various frequencies and when the number of sound sources is small, the latter needs to have a shorter delay time to make it difficult to perceive. The time Y is obtained by the following equation.
The frequency band is divided in advance into H sub-bands Sbn having input values, and tone signals MS (Pn),..., MS from the insertion position Pn to the reference signal length S given as an initial value.
Fourier transform of order N is performed on (Pn + S) (3
1-1), when the result is made to correspond to the sub-band SBn, the number of sub-bands having the corresponding value is set to Hs. That is, i = 1, 2,..., N (Nth order) is initialized to 0, and the number Hs of subbands in which the spectrum exists is initialized to 0 (31-2), and it is determined whether i <N (31-
3) If i <N, it is determined whether the spectrum Fn (i) of i is in any of the subbands. If (31-4), Hs is incremented by 1 (31-5), and i is further increased. The value returns to step 31-3, and if it is not in the sub-band in step 31-4, the process proceeds to step 31-6. If i is equal to N in step 31-3, Hs / H is 1/10 or less. Is determined (31-7).

【0017】最小遅延Lmin を1≦Lmin ,例えば2ms
ec,最大許容遅延Lmax をLmax ≦30かつLmin <L
max ,例えば30msecで初期値として設定しておき、H
s/Hが1/10以下ならY=Lmin とし(31−
8),Hs/Hが1/10以下でなければY=Lmax ×
(Hs/H)とする(31−9)。Pn+YをYnとす
る(31−10)。つまり、 となる。
The minimum delay Lmin is 1 ≦ Lmin, for example, 2 ms
ec, the maximum allowable delay Lmax is Lmax ≦ 30 and Lmin <L
max, for example, set as an initial value at 30 msec.
If s / H is 1/10 or less, Y = Lmin (31−
8) If Hs / H is not less than 1/10, Y = Lmax ×
(Hs / H) (31-9). Let Pn + Y be Yn (31-10). That is, Becomes

【0018】相対信号生成部32では、まず時系列位置
決定部22と挿入チャネル決定部23で決定された位置
の楽音信号を情報が挿入される長さXの分MS(P
n),…,MS(Pn+X)を複製する。さらに、遅延
信号が先行信号と同じ位相に知覚されるに十分な音圧α
(単位dB)を決定し、複製した信号の音圧をα上げてお
く。知覚特性から、音圧レベルαは遅延時間Yと相関を
持っているが、この実施例では、遅延時間Yは前式
(2)より30msec以下になるため、αは定数5とな
る。このようにして相対信号DS′が生成される。
The relative signal generator 32 first converts the tone signal at the position determined by the time-sequence position determiner 22 and the insertion channel determiner 23 into an MS (P
n),..., MS (Pn + X). Furthermore, sound pressure α sufficient for the delayed signal to be perceived in the same phase as the preceding signal
(Unit: dB), and increase the sound pressure of the duplicated signal by α. From the perceptual characteristics, the sound pressure level α has a correlation with the delay time Y, but in this embodiment, the delay time Y is 30 msec or less from the equation (2), so α is a constant 5. Thus, the relative signal DS 'is generated.

【0019】挿入信号挿入部33では、挿入信号生成部
25で生成された信号ISnを、時系列位置決定部22
と挿入チャネル決定部23で決定された位置の楽音信号
MS(Pn),…,MS(Pn+X)に合成する。相対
信号挿入部34では、相対信号生成部32で生成された
相対信号DS′を逆位相位置決定部31で決定された位
置Ynの楽音信号MS(Yn),…,MS(Yn+X)
に合成する。
The insertion signal insertion unit 33 converts the signal ISn generated by the insertion signal generation unit 25 into the time series position determination unit 22.
, And MS (Pn + X) at the positions determined by the insertion channel determination unit 23. The relative signal insertion unit 34 converts the relative signal DS ′ generated by the relative signal generation unit 32 into the tone signals MS (Yn),..., MS (Yn + X) at the position Yn determined by the antiphase position determination unit 31.
To be synthesized.

【0020】透かし情報解読部4は図7に示すように、
乱数発生部41で、透かし情報挿入時に乱数を発生した
乱数発生部21と同じ手法を用いて乱数の発生を行う。
時系列読出位置検出部42,読出チャネル検出部43,
読出周波数検出部44については、それぞれ同様に透か
し情報挿入時の時系列位置決定部22,挿入チャネル決
定部23,挿入周波数決定部24と同じ処理を行い、情
報の挿入位置を特定する。情報読出部45では、読出周
波数検出部44までの処理により特定された情報の挿入
位置から挿入情報の読み出しを行う。読み出された挿入
情報は2値情報再生部46で2値情報に変換される。例
えば、前記特定された情報の挿入位置Pnに対し、前記
例では情報“1”の場合にPn−X〜Pnの間の楽音信
号が複製されて挿入されたから、このPn−X〜Pnの
楽音信号と、前記読み出された挿入情報との相関をとる
と、情報“1”の場合には、大きな相関値が得られ、情
報“0”の場合は、小さな相関値となる。このことを利
用して読み出した挿入情報を2値情報に変換する。
As shown in FIG. 7, the watermark information decrypting section 4
The random number generation unit 41 generates a random number using the same method as the random number generation unit 21 that generates a random number when inserting watermark information.
A time-series read position detector 42, a read channel detector 43,
The read frequency detector 44 similarly performs the same processing as the time series position determiner 22, the insertion channel determiner 23, and the insert frequency determiner 24 when watermark information is inserted, and specifies the information insertion position. The information reading unit 45 reads the insertion information from the insertion position of the information specified by the processing up to the reading frequency detection unit 44. The read insertion information is converted by the binary information reproducing unit 46 into binary information. For example, in the above example, when the information is "1", the tone signal between Pn-X and Pn is duplicated and inserted into the specified information insertion position Pn. When a correlation between the signal and the read insertion information is obtained, a large correlation value is obtained when the information is "1", and a small correlation value is obtained when the information is "0". Using this, the read insertion information is converted into binary information.

【0021】属性情報再生部5は図8に示すように、要
求情報選択部51では普遍情報Ieと、変動情報Im,
どちらの情報の要求がされているのかを判別し、属性情
報復号部52に再生指示を出す。属性情報復号部52で
は、要求情報選択部51から要求された情報の復号化を
行う。普遍情報Ieが要求されると固有の辞書を用いて
符号化をした場合は、復号辞書により復号化する。固有
の符号化を用いた場合は、該符号化に対する復号化を行
い属性情報の再生を行う。
As shown in FIG. 8, the attribute information reproducing unit 5 uses the universal information Ie and the variation information Im,
It determines which information is requested, and issues a reproduction instruction to the attribute information decoding unit 52. The attribute information decoding unit 52 decodes the information requested by the request information selection unit 51. When the universal information Ie is requested and the encoding is performed using the unique dictionary, the encoding is performed using the decoding dictionary. When the unique encoding is used, the encoding is decoded and the attribute information is reproduced.

【0022】上述では、この発明をステレオの楽音信号
に透かし情報を挿入する場合に適用したが、モノラルの
音楽信号に透かし情報を挿入する場合にも適用でき、同
様に3チャネル以上の楽音信号に挿入する場合にも適用
できる。要はこの発明は透かし情報の挿入にもとづく雑
音を、相対信号を挿入することにより音として抑圧され
たものとなるようにすることにある。
In the above description, the present invention is applied to a case where watermark information is inserted into a stereo tone signal. However, the present invention can also be applied to a case where watermark information is inserted into a monaural music signal. Similarly, the present invention is applied to a tone signal having three or more channels. It is also applicable when inserting. In short, the present invention is to make noise based on the insertion of watermark information suppressed as sound by inserting a relative signal.

【0023】上述した各部の機能はコンピュータにプロ
グラムを解読実行させて作用させることもできる。
The functions of the respective parts described above can also be applied by causing a computer to decode and execute a program.

【0024】[0024]

【発明の効果】この発明により、例えば不法な複製など
を防ぐための権利情報などを音楽情報に埋め込むことが
可能で、埋め込み情報による雑音を抑圧する相対信号を
挿入することにより、音楽情報の劣化を防ぐことがで
き、音楽情報に変更を加えると抑圧するために挿入した
相対信号により雑音が生じることから複製を防ぐこと、
複製しても埋め込みデータを残すことが可能になるた
め、音楽情報の配信に安全性を確保することができる。
According to the present invention, for example, it is possible to embed right information for preventing illegal duplication or the like into music information, and to insert a relative signal for suppressing noise due to the embedded information, thereby deteriorating music information. To prevent duplication due to noise caused by the relative signal inserted to suppress when music information is changed,
Since the embedded data can be left even after the copy, the security of the distribution of the music information can be ensured.

【0025】さらに、データを埋め込むことにより情報
量に変化が生じないこと、改ざんし難いことから、同じ
ダウンロード時間での様々な情報の埋め込み配信が可能
で、利用者に付加情報を提供することが可能となる。
Furthermore, since the amount of information does not change by embedding data and it is difficult to falsify, it is possible to embed and distribute various information at the same download time, and to provide additional information to the user. It becomes possible.

【図面の簡単な説明】[Brief description of the drawings]

【図1】Aはこの発明の楽音情報への透かし挿入法の全
体の構成を表すブロック図、Bはその挿入情報生成部1
の流れを示す図である。
FIG. 1A is a block diagram showing the overall configuration of a method for inserting a watermark into musical sound information according to the present invention, and FIG.
It is a figure showing the flow of.

【図2】図1Aの透かし情報挿入部2の処理の流れを示
す図。
FIG. 2 is a diagram showing a flow of processing of a watermark information insertion unit 2 of FIG. 1A.

【図3】図2中の挿入信号生成部25の処理の流れを示
す図。
FIG. 3 is a view showing a flow of processing of an insertion signal generation unit 25 in FIG. 2;

【図4】挿入信号の生成の様子を示す図。FIG. 4 is a diagram showing how an insertion signal is generated.

【図5】挿入信号と相対信号の各挿入の様子を示す図。FIG. 5 is a diagram showing a state of each insertion of an insertion signal and a relative signal.

【図6】図1A中の相対信号挿入部3の処理の流れを示
す図。
FIG. 6 is a diagram showing a flow of processing of a relative signal insertion unit 3 in FIG. 1A.

【図7】図1A中の透かし情報解読部4の処理の流れを
示す図。
FIG. 7 is a diagram showing a flow of processing of a watermark information decryption unit 4 in FIG. 1A.

【図8】図1A中の属性情報再生部5の処理の流れを示
す図。
FIG. 8 is a diagram showing a flow of processing of an attribute information reproducing unit 5 in FIG. 1A.

フロントページの続き (72)発明者 富岡 淳樹 東京都新宿区西新宿三丁目19番2号 日本 電信電話株式会社内 (72)発明者 杉山 和弘 東京都新宿区西新宿三丁目19番2号 日本 電信電話株式会社内 Fターム(参考) 5B017 AA06 BA07 BB03 CA16 5B082 GA01 GA02 GC05 5D044 AB05 BC01 BC04 CC04 DE50 GK17 5J064 AA01 CA01 CC07 Continuing on the front page (72) Inventor Junki Tomioka 3-19-2 Nishishinjuku, Shinjuku-ku, Tokyo Japan Telegraph and Telephone Corporation (72) Inventor Kazuhiro Sugiyama 3-192-2 Nishishinjuku, Shinjuku-ku, Tokyo Japan F-term in Telegraph and Telephone Corporation (reference) 5B017 AA06 BA07 BB03 CA16 5B082 GA01 GA02 GC05 5D044 AB05 BC01 BC04 CC04 DE50 GK17 5J064 AA01 CA01 CC07

Claims (15)

【特許請求の範囲】[Claims] 【請求項1】 挿入されるべき情報から透かし情報を生
成する過程と、 音楽情報に対し、透かし情報挿入位置を決定する過程
と、 上記透かし情報挿入位置に上記透かし情報を挿入する過
程と、 上記透かし情報の挿入にもとづき上記音楽情報に生じる
雑音を音として抑圧する相対信号を生成する過程と、 上記音楽情報に対し上記相対信号を挿入する相対信号挿
入位置を決定する過程と、 上記相対信号挿入位置に上記相対信号を挿入する過程と
を有する音楽情報への透かし挿入方法。
A step of generating watermark information from information to be inserted; a step of determining a watermark information insertion position for music information; a step of inserting the watermark information at the watermark information insertion position; Generating a relative signal that suppresses noise generated in the music information as sound based on the insertion of the watermark information; determining a relative signal insertion position at which the relative signal is inserted into the music information; Inserting the relative signal into a position.
【請求項2】 上記相対信号の生成過程は、上記透かし
情報挿入位置における上記音楽情報を抽出する過程と、 上記抽出された音楽情報の音圧レベルを大として上記相
対信号を得る過程とよりなり、 上記相対信号挿入位置の決定過程は、上記透かし情報挿
入位置に対し、知覚特性により許容される遅延時間遅れ
た位置を求めて上記相対信号挿入位置とする過程である
ことを特徴とする請求項1記載の音楽情報への透かし挿
入方法。
2. The step of generating the relative signal includes the step of extracting the music information at the watermark information insertion position, and the step of obtaining the relative signal by increasing the sound pressure level of the extracted music information. The method of determining the relative signal insertion position is a process of finding a position delayed by a delay time allowed by perceptual characteristics with respect to the watermark information insertion position and setting the position as the relative signal insertion position. 1. A method for inserting a watermark into the music information described in 1.
【請求項3】 上記遅延時間遅れた位置を求める過程
は、 上記透かし情報挿入位置の上記音楽情報を周波数分析す
る過程と、 上記分析された結果存在する周波数の、音楽情報の全周
波数帯域に対する割合に応じて上記遅延時間を決定する
過程とよりなることを特徴とする請求項2記載の音楽情
報への透かし挿入方法。
3. The step of obtaining the position delayed by the delay time includes the step of frequency-analyzing the music information at the watermark information insertion position, and the ratio of the frequency present as a result of the analysis to the entire frequency band of the music information. 3. A method for inserting a watermark into music information according to claim 2, comprising the step of determining the delay time according to the following.
【請求項4】 上記透かし情報の生成過程は、上記挿入
されるべき情報を2値情報に変換する過程と、 上記2値情報の2値の一方として、上記透かし情報挿入
位置の直前の上記音楽情報を抽出し、上記2値情報の他
方として上記透かし情報挿入位置のわずか後の上記音楽
情報を抽出して上記透かし情報とする過程とよりなるこ
とを特徴とする請求項1乃至3の何れかに記載の音楽情
報への透かし挿入方法。
4. The step of generating the watermark information includes the step of converting the information to be inserted into binary information, and the step of converting the music immediately before the watermark information insertion position into one of the binary information. 4. The method according to claim 1, further comprising extracting information, extracting the music information slightly after the watermark information insertion position as the other of the binary information, and using the music information as the watermark information. Watermark insertion method to music information described in.
【請求項5】 上記音楽情報は複数のチャネルからな
り、上記透かし情報挿入位置決定過程は、透かし情報挿
入位置を上記複数のチャネルにランダムに分散させて決
定する過程であることを特徴とする請求項1乃至4の何
れかに記載の音楽情報への透かし挿入方法。
5. The music information includes a plurality of channels, and the watermark information insertion position determining step is a step of determining a watermark information insertion position by randomly distributing the watermark information insertion positions to the plurality of channels. Item 6. A method for inserting a watermark into music information according to any one of Items 1 to 4.
【請求項6】 挿入されるべき情報から透かし情報を生
成する手段と、 音楽情報に対し、透かし情報挿入位置を決定する手段
と、 上記透かし情報挿入位置に上記透かし情報を挿入する手
段と、 上記透かし情報の挿入にもとづき上記音楽情報に生じる
雑音を音として抑圧する相対信号を生成する手段と、 上記音楽情報に対し、上記相対信号を挿入する相対信号
挿入位置を決定する手段と、 上記相対信号挿入位置に上記相対信号を挿入する手段と
を有する音楽情報への透かし挿入装置。
6. A means for generating watermark information from information to be inserted, a means for determining a watermark information insertion position for music information, a means for inserting the watermark information at the watermark information insertion position, Means for generating a relative signal for suppressing noise generated in the music information as sound based on the insertion of the watermark information; means for determining a relative signal insertion position for inserting the relative signal with respect to the music information; Means for inserting the relative signal at the insertion position.
【請求項7】 上記相対信号の生成手段は、上記透かし
情報挿入位置における上記音楽情報を抽出する手段と、 上記抽出された音楽情報の音圧レベルを大として上記相
対信号を得る手段とよりなり、 上記相対信号挿入位置の決定手段は、上記透かし情報挿
入位置に対し、知覚特性により許容される遅延時間遅れ
た位置を求めて上記相対信号挿入位置とする手段である
ことを特徴とする請求項6記載の音楽情報への透かし挿
入装置。
7. The means for generating the relative signal comprises means for extracting the music information at the watermark information insertion position, and means for obtaining the relative signal by increasing the sound pressure level of the extracted music information. The relative signal insertion position determining means is a means for obtaining a position delayed by a delay time allowed by perceptual characteristics with respect to the watermark information insertion position and setting the position as the relative signal insertion position. 6. A watermark insertion device for music information described in 6.
【請求項8】 上記遅延時間遅れた位置を求める手段
は、 上記透かし情報挿入位置の上記音楽情報を周波数分析す
る手段と、 上記分析された結果存在する周波数の、音楽情報の全周
波数帯域に対する割合に応じて上記遅延時間を決定する
手段とよりなることを特徴とする請求項7記載の音楽情
報への透かし挿入装置。
8. The means for obtaining the position delayed by the delay time comprises: means for frequency-analyzing the music information at the watermark information insertion position; and the ratio of the frequency present as a result of the analysis to the entire frequency band of the music information. 8. The apparatus for inserting a watermark into music information according to claim 7, further comprising means for determining the delay time according to the following.
【請求項9】 上記透かし情報の生成手段は、上記挿入
されるべき情報を2値情報に変換する手段と、 上記2値情報の2値の一方として、上記透かし情報挿入
位置の直前の上記音楽情報を抽出し、上記2値情報の他
方として上記透かし情報挿入位置のわずか後の上記音楽
情報を抽出して上記透かし情報とする手段とよりなるこ
とを特徴とする請求項6乃至8の何れかに記載の音楽情
報への透かし挿入装置。
9. The watermark information generating means includes means for converting the information to be inserted into binary information, and as one of the binary information, the music information immediately before the watermark information insertion position. 9. A means for extracting information and extracting the music information slightly after the watermark information insertion position as the other of the binary information and using the extracted music information as the watermark information. A watermark insertion device for music information described in 1.
【請求項10】 上記音楽情報は複数のチャネルからな
り、上記透かし情報挿入位置決定手段は、透かし情報挿
入位置を上記複数のチャネルにランダムに分散させて決
定する手段であることを特徴とする請求項6乃至9の何
れかに記載の音楽情報への透かし挿入装置。
10. The music information comprises a plurality of channels, and the watermark information insertion position determining means is means for randomly determining the watermark information insertion position among the plurality of channels. Item 10. An apparatus for inserting a watermark into music information according to any one of Items 6 to 9.
【請求項11】 挿入されるべき情報から透かし情報を
生成する処理と、 音楽情報に対し、透かし情報挿入位置を決定する処理
と、 上記透かし情報挿入位置に上記透かし情報を挿入する処
理と、 上記透かし情報の挿入にもとづき上記音楽情報に生じる
雑音を音として抑圧する相対信号を生成する処理と、 上記音楽情報に対し上記相対信号を挿入する相対信号挿
入位置を決定する処理と、 上記相対信号挿入位置に上記相対信号を挿入する処理
と、 を音楽情報への透かし挿入装置のコンピュータに実行さ
せるプログラムを記録した記録媒体。
11. A process for generating watermark information from information to be inserted, a process for determining a watermark information insertion position for music information, a process for inserting the watermark information at the watermark information insertion position, A process of generating a relative signal for suppressing noise generated in the music information as a sound based on the insertion of the watermark information, a process of determining a relative signal insertion position at which the relative signal is inserted into the music information, and a process of inserting the relative signal A recording medium recording a program for causing a computer of a device for inserting a watermark into music information to perform a process of inserting the relative signal into a position.
【請求項12】 上記相対信号の生成処理は、上記透か
し情報挿入位置における上記音楽情報を抽出する処理
と、 上記抽出された音楽情報を所定量大として上記相対信号
を得る処理とよりなり、 上記相対信号挿入位置の決定処理は、上記透かし情報挿
入位置に対し、知覚特性により許容される遅延時間遅れ
た位置を求めて上記相対信号挿入位置とする処理である
ことを特徴とする請求項11記載の記録媒体。
12. The relative signal generation process includes a process of extracting the music information at the watermark information insertion position, and a process of obtaining the relative signal by increasing the extracted music information by a predetermined amount. 12. The relative signal insertion position determining process is a process of obtaining a position delayed by a delay time allowed by perceptual characteristics with respect to the watermark information insertion position and setting the position as the relative signal insertion position. Recording medium.
【請求項13】 上記遅延時間遅れた位置を求める処理
は、 上記透かし情報挿入位置の上記音楽情報を周波数分析す
る処理と、 上記分析された結果存在する周波数の、音楽情報の全周
波数帯域に対する割合に応じて上記遅延時間を決定する
処理とよりなることを特徴とする請求項12記載の記録
媒体。
13. A process for obtaining the position delayed by the delay time includes a process for frequency-analyzing the music information at the watermark information insertion position, and a ratio of a frequency present as a result of the analysis to the entire frequency band of the music information. 13. The recording medium according to claim 12, further comprising a process of determining the delay time according to the following.
【請求項14】 上記透かし情報の生成処理は、上記挿
入されるべき情報を2値情報に変換する処理と、 上記2値情報の2値の一方として、上記透かし情報挿入
位置の直前の上記音楽情報を抽出し、上記2値情報の他
方として上記透かし情報挿入位置のわずか後の上記音楽
情報を抽出して上記透かし情報とする処理とよりなるこ
とを特徴とする請求項11乃至13の何れかに記載の記
録媒体。
14. A process for generating the watermark information, the process of converting the information to be inserted into binary information, and the process of converting the music immediately before the watermark information insertion position into one of the binary information. 14. A process according to claim 11, further comprising extracting information, extracting the music information just after the watermark information insertion position as the other of the binary information, and setting the music information as the watermark information. A recording medium according to claim 1.
【請求項15】 上記音楽情報は複数のチャネルからな
り、上記透かし情報挿入位置決定処理は、透かし情報挿
入位置を上記複数のチャネルにランダムに分散させて決
定する処理であることを特徴とする請求項11乃至14
の何れかに記載の記録媒体。
15. The music information includes a plurality of channels, and the watermark information insertion position determination process is a process of randomly distributing and determining the watermark information insertion position among the plurality of channels. Items 11 to 14
The recording medium according to any one of the above.
JP11144274A 1999-05-25 1999-05-25 Method and device for inserting watermark into music information and its program recording medium Pending JP2000330579A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11144274A JP2000330579A (en) 1999-05-25 1999-05-25 Method and device for inserting watermark into music information and its program recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11144274A JP2000330579A (en) 1999-05-25 1999-05-25 Method and device for inserting watermark into music information and its program recording medium

Publications (1)

Publication Number Publication Date
JP2000330579A true JP2000330579A (en) 2000-11-30

Family

ID=15358287

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11144274A Pending JP2000330579A (en) 1999-05-25 1999-05-25 Method and device for inserting watermark into music information and its program recording medium

Country Status (1)

Country Link
JP (1) JP2000330579A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006268401A (en) * 2005-03-24 2006-10-05 Brother Ind Ltd Associated information writing program, associated information writing apparatus and associated information writing method

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006268401A (en) * 2005-03-24 2006-10-05 Brother Ind Ltd Associated information writing program, associated information writing apparatus and associated information writing method
JP4665575B2 (en) * 2005-03-24 2011-04-06 ブラザー工業株式会社 Incidental information writing program, incidental information writing apparatus, and incidental information writing method

Similar Documents

Publication Publication Date Title
US6175627B1 (en) Apparatus and method for embedding and extracting information in analog signals using distributed signal features
JP4251378B2 (en) Apparatus and method for embedding and extracting information in analog signals using distributed signal features
US7660991B2 (en) Embedding, processing and detection of digital content, information and data
AU774862B2 (en) Scalable coding method for high quality audio
US8937537B2 (en) Method and system for utilizing spread spectrum techniques for in car applications
US7372375B2 (en) Signal reproducing method and device, signal recording method and device, and code sequence generating method and device
US20020009000A1 (en) Adding imperceptible noise to audio and other types of signals to cause significant degradation when compressed and decompressed
Qiao et al. Noninvertible watermarking methods for mpeg-encoded audio
JP2002062888A (en) Electronic music processor, electronic music reproducer, and electronic music distribution system
JP2006507536A (en) Method and system for encoding and detecting multiple messages in voice data
WO1997037448A2 (en) Apparatus and method for encoding and decoding supplementary data in analog signals
JP2002519916A (en) Apparatus and method for embedding information into analog signal using duplicate modulation
US7272718B1 (en) Device, method and storage medium for superimposing first and second watermarking information on an audio signal based on psychological auditory sense analysis
US5864813A (en) Method, system and product for harmonic enhancement of encoded audio signals
He Watermarking in audio: key techniques and technologies
JP2004318126A (en) Digital audio processing
JP2000330579A (en) Method and device for inserting watermark into music information and its program recording medium
JP4193100B2 (en) Information processing method, information processing apparatus, recording medium, and program
US20040083258A1 (en) Information processing method and apparatus, recording medium, and program
US6463405B1 (en) Audiophile encoding of digital audio data using 2-bit polarity/magnitude indicator and 8-bit scale factor for each subband
JP2007011242A (en) Digital watermark information-embedded music information distribution system
WO2001088915A1 (en) Adding imperceptible noise to audio and other types of signals to cause significant degradation when compressed and decompressed
Trivedi et al. Audio masking for watermark embedding under time domain audio signals
Xu et al. Digital Audio Watermarking
Arnold et al. Fast audio watermarking: Concepts and realizations