JP6003107B2 - Second sound signal embedding device for acoustic signal and interfering sound embedding device for acoustic signal - Google Patents

Second sound signal embedding device for acoustic signal and interfering sound embedding device for acoustic signal Download PDF

Info

Publication number
JP6003107B2
JP6003107B2 JP2012050552A JP2012050552A JP6003107B2 JP 6003107 B2 JP6003107 B2 JP 6003107B2 JP 2012050552 A JP2012050552 A JP 2012050552A JP 2012050552 A JP2012050552 A JP 2012050552A JP 6003107 B2 JP6003107 B2 JP 6003107B2
Authority
JP
Japan
Prior art keywords
frequency
signal
acoustic
sound
component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012050552A
Other languages
Japanese (ja)
Other versions
JP2013186253A (en
Inventor
茂出木 敏雄
敏雄 茂出木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dai Nippon Printing Co Ltd
Original Assignee
Dai Nippon Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dai Nippon Printing Co Ltd filed Critical Dai Nippon Printing Co Ltd
Priority to JP2012050552A priority Critical patent/JP6003107B2/en
Publication of JP2013186253A publication Critical patent/JP2013186253A/en
Application granted granted Critical
Publication of JP6003107B2 publication Critical patent/JP6003107B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、CD・DVD・BD等を用いた民生・業務用途における鑑賞用のパッケージ音楽分野、および音楽コンテンツプロバイダー等が商業目的で配信するネットワーク音楽配信分野に関し、特に、音楽コンテンツのコピーを防止する技術に関する。   The present invention relates to the field of packaged music for viewing in consumer and business applications using CDs, DVDs, BDs, and the like, and the network music distribution field distributed by music content providers for commercial purposes, and in particular, prevents copying of music content. Related to technology.

従来、音楽コンテンツの複製防止のため、様々な技術が開発されている。例えば、DRM(特許文献1参照)という方式では、デジタルの音楽コンテンツに暗号化を施すことにより音楽コンテンツの複製を防止している。具体的には、商用DVDやBDメディアから別のDVD−R等の記録メディアにデジタルケーブル接続でレコーダ機器で録画したり、パソコンのドライブに挿入してパソコン上で動画ファイルとしてリッピングすることを不可能にしている。ただし、音楽CDに対しては諸般の事情により現状ではDRMが解除されているため、特にレンタルCDからリッピングして作成されたデジタル的な違法コピー音楽ファイルがサイトにアップされ流通してしまう被害が問題になっている。このDRM方式では、デジタルコンテンツのコピーを防止することは可能であるが、アナログコンテンツのコピーを防止することはできない。すなわち、再生中のディスプレイ画面をビデオカメラで撮影したり、再生信号をスピーカ出力よりラインまたはマイクロフォンで録音することにより複製可能となる。現状、最も大きな問題は、映画館やホールなどに小型ビデオカメラを持ち込み、スクリーンに映し出された映像とともに、スピーカから流れるサウンドトラックが収録され、無尽蔵にDVDが作成され商品(海賊版)として出荷されたり、違法コピー動画ファイルが動画サイトやP2Pを介して流通している例がある。近年の民生用ビデオカメラはHDTV対応になっておりBD並みの画質で記録が可能であるため、それをマスターにして複製されるDVDは商用品質を確保することが容易である。   Conventionally, various techniques have been developed to prevent duplication of music content. For example, in a method called DRM (see Patent Document 1), duplication of music content is prevented by encrypting digital music content. Specifically, recording from a commercial DVD or BD media to another DVD-R or other recording media with a digital cable connection with a recorder device or inserting into a personal computer drive and ripping as a video file on a personal computer is not possible. It is possible. However, DRM has been released for music CDs due to various circumstances, so that digital pirated music files created by ripping from rental CDs can be uploaded to the site and distributed. It is a problem. In this DRM method, copying of digital content can be prevented, but copying of analog content cannot be prevented. In other words, the reproduction can be performed by photographing the display screen being reproduced with a video camera or recording the reproduction signal with a line or a microphone from the speaker output. At present, the biggest problem is that a small video camera is brought into a movie theater or hall, and the soundtrack flowing from the speaker is recorded along with the image projected on the screen, and the DVD is created inexhaustibly and shipped as a product (pirated version). There are examples in which illegally copied video files are distributed via video sites and P2P. Since consumer video cameras in recent years are HDTV compatible and can be recorded with an image quality comparable to that of a BD, it is easy to ensure commercial quality for a DVD that is duplicated using it as a master.

幸い、日本国内では、2007年より施行された「映画の盗撮の防止に関する法律」の効果により、スクリーン盗撮事件は2009年の愛知県での現行犯逮捕を最後に終焉したが、新たな問題が浮上している。海外では盗撮が相変わらず行われているため、盗撮洋画がネットを介して日本に上陸しているが、そのままでは日本で売れない。即ち、日本国内で流通させるためには、その盗撮洋画に字幕スーパーを入れるか、日本語に吹き替える必要があるが、後者の方が圧倒的に需要が大きい。そこで、海外から移入された海賊版洋画の日本語吹き替え版が上映されている映画館で音声だけ隠し録りされ、海外盗撮映像にアフレコされ出荷されている。邦画に対しても、海外に輸出され違法コピーされた外国語版邦画の違法コピー品を逆移入し、日本国内で音声だけ隠し撮りし、海外盗撮邦画にアフレコして国内で出荷されている例も見つかった。盗音はスクリーン盗撮のように三脚などを必要とせず、ポケットにレコーダを隠して行えるため、暗い映画館の中で犯行を見つけることは不可能に近い。即ち、映像に対する盗撮は法整備により撲滅できたが、音響に対する盗音に対しては刃が立たず、前述のレンタル音楽CDの違法リッピング問題を含め、現状では、音響コンテンツ保護に対する需要は映像コンテンツ保護に比べ格段に大きい。   Fortunately, in Japan, due to the effect of the “Act on the Prevention of Camera Voyeurism” enforced since 2007, the screen voyeurism incident ended the arrest of current offenders in Aichi Prefecture in 2009, but a new problem emerged doing. Since voyeurism continues to take place overseas, voyeur movies have landed in Japan via the Internet, but cannot be sold in Japan as they are. In other words, in order to distribute it in Japan, it is necessary to put a caption supervision into the voyeur movie or to dubb it in Japanese, but the latter is overwhelmingly in demand. Therefore, only the sound is recorded in a movie theater where a Japanese dubbed version of a pirated Western movie imported from overseas is screened, and it is dubbed into an overseas voyeur video and shipped. An example of a foreign film that was exported overseas and illegally copied from a foreign language version of a Japanese film was illegally transferred to a Japanese film, and only the voice was hidden in Japan. Also found. It is almost impossible to find a crime in a dark movie theater because it does not require a tripod like a screen voyeur and can be hidden in a pocket. In other words, voyeurism for video has been eradicated by legal development, but there is no edge for acoustic voyeurism. At present, the demand for audio content protection, including the illegal ripping problem of rental music CDs, is video content. It is much larger than protection.

特表2003−517767号公報Special table 2003-517767 gazette WO2011/002059WO2011 / 002059 WO2011/105164WO2011 / 105164 US2007/0192091US2007 / 0192091 US2004/025261US2004 / 025261

アナログコンテンツの複製を防止する手法として、主として前述の海賊版DVD製造への対抗策としては、映像信号に不可視のコピー妨害信号を付加する技術が提案されている(特許文献2参照)。特許文献2に開示の手法では、コピー妨害信号として赤外線を用いているため、人間には不可視だが、ビデオカメラには映り込み、違法コピーを牽制することができる。しかし、コピー妨害信号はコンテンツ自体には埋め込むことができず、コピー妨害信号を発射する特殊なモジュールを装着したスクリーンやディスプレイでないと機能せず、業務用ビデオカメラや赤外カットフィルタを装着したカメラを用いるとコピー妨害信号の映り込みを回避できるという問題がある。また、映像のサウンドトラックの違法コピーに対しては全く無防備である。   As a technique for preventing duplication of analog contents, a technique for adding an invisible copy disturbing signal to a video signal has been proposed as a countermeasure against the aforementioned pirated DVD manufacturing (see Patent Document 2). In the method disclosed in Patent Document 2, since infrared rays are used as a copy interference signal, it is invisible to humans, but is reflected in a video camera, and illegal copying can be suppressed. However, copy disturbing signals cannot be embedded in the content itself, and only work with screens and displays equipped with special modules that emit copy disturbing signals. Professional video cameras and cameras equipped with infrared cut filters When using, there is a problem that reflection of a copy disturbing signal can be avoided. Also, they are completely vulnerable to illegal copying of video soundtracks.

一方、デジタル状態での複製を防止する方法としては、空間(映像・画像)または時間(音響)サンプリング時におけるエイリアシング(折り返し歪み)を活用する方法も提案されている(特許文献3参照)。これは旧来のアナログ形態の映像信号または音響信号には無限大の周波数成分を記録することができていたが、デジタル形態に変換する過程で、シャノン・ナイキストの情報理論に基づきサンプリング周波数の1/2の周波数(ナイキスト周波数)を超える信号成分が記録できないという制約があり、かつナイキスト周波数を超える高帯域の信号成分はナイキスト周波数を中心に低域に折り返され、低帯域の信号成分として誤った周波数帯域に重畳されてしまう現象(エイリアシング)に着目したものである。特許文献3では保護対象の動画像の各フレームの高帯域にコピー牽制用の二値画像を重畳させている。通常再生では、画像のエッジ部にわずかなノイズが認識される程度であるが、同動画像に対してサンプリング周波数が1/2以下になるように縮小操作を施すと、重畳された二値画像の信号成分が低帯域に折り返され同動画像の上に重畳して二値画像が可視化される。本方法では、二値画像の信号成分が埋め込まれている周波数帯域が不可視ではないため、通常の動画再生時において若干の品質劣化が避けられないことと、画像サイズを変更させずにサンプリング周波数の変更を伴わないように複製されてしまえば、あるいは一度アナログ系に変換されて再サンプリングされてしまえば、重畳された二値画像は可視化されないという問題がある。   On the other hand, as a method of preventing duplication in the digital state, a method of utilizing aliasing (folding distortion) at the time of sampling space (video / image) or time (sound) has been proposed (see Patent Document 3). In the past, an infinite frequency component could be recorded in a video signal or audio signal in an analog form, but in the process of converting to a digital form, 1/1 of the sampling frequency based on Shannon-Nyquist information theory. There is a restriction that a signal component exceeding the frequency of 2 (Nyquist frequency) cannot be recorded, and a high-band signal component exceeding the Nyquist frequency is folded back to a low frequency centering on the Nyquist frequency, and an erroneous frequency as a low-band signal component. It focuses on the phenomenon (aliasing) that is superimposed on the band. In Patent Document 3, a binary image for copy check is superimposed on a high band of each frame of a moving image to be protected. In normal playback, slight noise is recognized at the edge of the image. However, if a reduction operation is performed on the moving image so that the sampling frequency is ½ or less, the superimposed binary image is displayed. The signal component is folded back to a low band and superimposed on the moving image to visualize the binary image. In this method, since the frequency band in which the signal component of the binary image is embedded is not invisible, a slight quality degradation cannot be avoided during normal video playback, and the sampling frequency can be changed without changing the image size. There is a problem in that a superimposed binary image cannot be visualized if it is copied so as not to be changed, or once converted to an analog system and resampled.

特許文献2に類似した音響分野の先行技術として、特許文献4がある。特許文献2において不可視の赤外線による妨害雑音を映像に重畳するのと類似して、後者は通常の音響用スピーカと一緒に超音波スピーカを配置し、超音波による妨害雑音を加えるようにしたものである。この妨害雑音は非可聴であるが、マイクロフォンを介してサンプリングを行うと、特許文献3で活用しているエイリアシングにより可聴帯域内にシフトし、可聴化される特性を利用したものである。特許文献4ではハードウェアに超音波出力用のアンプ・スピーカを付加する必要があるという問題と、特許文献4に基づいて追試を行ったところ、通常のレコーダ用マイクロフォンでは超音波帯の感度が殆ど無く、本特許に記載のように、妨害雑音をエイリアシングにより可聴帯域内にシフトさせることは困難であった。
また、特許文献4と同目的で音響信号のアナログ的なコピーを抑止する手法として、特許文献5では、保護対象の音響信号の高域部に妨害雑音を非可聴に埋め込み、アナログ的なコピーによりスペクトルにテープレコーダに基づく非線形歪みを発生させ、埋め込まれた妨害雑音の倍音や相互変調成分を低域側に発生させることにより、妨害雑音を可聴化させるようにしている。特許文献5に基づいて追試を行ったところ、最近のレコーダでは特許文献5に記載のような非線形歪みが発生せず、妨害雑音を可聴化させることは困難であった。
As a prior art in the acoustic field similar to Patent Document 2, there is Patent Document 4. Similar to superimposing interference noise due to invisible infrared rays on the image in Patent Document 2, the latter is an ultrasonic speaker arranged together with a normal acoustic speaker to add interference noise due to ultrasound. is there. This interference noise is inaudible. However, when sampling is performed through a microphone, the noise is shifted to the audible band by aliasing utilized in Patent Document 3, and the characteristic that is made audible is used. In Patent Document 4, there is a problem that it is necessary to add an amplifier / speaker for ultrasonic output to the hardware, and when an additional test is performed based on Patent Document 4, the sensitivity of the ultrasonic band is almost the case with a normal recorder microphone. However, as described in this patent, it has been difficult to shift the interference noise into the audible band by aliasing.
Also, as a technique for suppressing analog copying of an acoustic signal for the same purpose as in Patent Document 4, in Patent Document 5, interference noise is embedded inaudibly in the high frequency part of the acoustic signal to be protected, and analog copying is performed. Non-linear distortion based on the tape recorder is generated in the spectrum, and the overtone and intermodulation components of the embedded interference noise are generated on the low frequency side, thereby making the interference noise audible. When a follow-up test was conducted based on Patent Document 5, nonlinear distortion as described in Patent Document 5 did not occur in a recent recorder, and it was difficult to make the interference noise audible.

そこで、本発明は、サンプリング時におけるエイリアシング特性を活用し、音響信号を所定のサンプリング周波数以下でサンプリングして複製を行い、複製後のデジタル化された音響信号を再生した場合に、原音響信号に非可聴に埋め込まれた妨害音が再生されることにより、本来の状態での複製を防止することが可能な音響信号に対する第2の音響信号の埋め込み装置および音響信号に対する妨害音の埋め込み装置を提供することを課題とする。   Therefore, the present invention makes use of aliasing characteristics at the time of sampling, samples an audio signal at a predetermined sampling frequency or less, performs duplication, and reproduces the digitized audio signal after duplication. Provided is a second acoustic signal embedding device for an acoustic signal and an interfering sound embedding device for an acoustic signal that can prevent duplication in the original state by reproducing an inaudible interfering sound. The task is to do.

上記課題を解決するため、本発明第1の態様では、
時系列のサンプル列で構成されるサンプリング周波数Fsの原音響信号に対して、時系列のサンプル列で構成される第2の音響信号を聴取不能な状態で埋め込む装置であって、
前記原音響信号から所定数のサンプルで構成される第1音響フレームを読み込むとともに、前記第2の音響信号から所定数のサンプルで構成される第2音響フレームを読み込む音響フレーム読込手段と、
前記第1音響フレームに対して周波数変換を行い、複素周波数成分である第1スペクトルを得るとともに、前記第2音響フレームに対して周波数変換を行い、複素周波数成分である第2スペクトルを得る周波数変換手段と、
前記第1スペクトルの信号成分の中で、周波数Ft以上の信号成分を除去するとともに、前記周波数Ftを中心に前記周波数Ft以下の信号成分を高域の周波数方向に折り返し、折り返された周波数Ftから周波数2Ftの範囲の第1スペクトルの信号成分に対して正負符号を反転しかつ所定の係数値を乗算しながら、前記第1スペクトルの対応する周波数の信号成分に加算することにより、前記第1スペクトルの周波数成分を改変する第1の周波数成分改変手段と、
前記第2スペクトルの信号成分の中で、周波数Ft以上の信号成分を除去するとともに、前記周波数Ftを中心に前記周波数Ft以下の信号成分を高域の周波数方向に折り返し、折り返された周波数Ftから周波数2Ftの範囲の第2スペクトルの信号成分に対して所定の係数値を乗算しながら、前記改変された第1スペクトルの対応する周波数の信号成分に加算することにより、前記第1スペクトルの周波数成分を改変する第2の周波数成分改変手段と、
前記周波数成分が改変された第1スペクトルに対して周波数逆変換を行って、改変音響フレームを生成する周波数逆変換手段と、
前記生成された改変音響フレームを順次出力する改変音響フレーム出力手段を有する音響信号に対する第2の音響信号の埋込み装置を提供する。
In order to solve the above problems, in the first aspect of the present invention,
A device for embedding a second acoustic signal composed of a time-series sample sequence in an inaudible state with respect to an original acoustic signal of a sampling frequency Fs composed of a time-series sample sequence,
An acoustic frame reading means for reading a first acoustic frame composed of a predetermined number of samples from the original acoustic signal and for reading a second acoustic frame composed of a predetermined number of samples from the second acoustic signal;
Frequency conversion is performed on the first sound frame to obtain a first spectrum that is a complex frequency component, and frequency conversion is performed on the second sound frame to obtain a second spectrum that is a complex frequency component. Means,
Among the signal components of the first spectrum, the signal components of the frequency Ft or higher are removed, the signal components of the frequency Ft or lower are folded back in the high frequency direction around the frequency Ft, and the folded frequency Ft is used. while multiplying the inverting and predetermined coefficient value the sign for the first spectral signal component of the range of frequencies 2 Ft, by adding the signal component of the corresponding frequency before Symbol first spectrum, said first First frequency component modifying means for modifying the frequency component of the spectrum;
Among the signal components of the second spectrum, the signal components of the frequency Ft or higher are removed, the signal components of the frequency Ft or lower are folded around the frequency Ft in the high frequency direction, and the folded frequency Ft is used. By multiplying the signal component of the second spectrum in the range of frequency 2Ft by a predetermined coefficient value and adding to the signal component of the corresponding frequency of the modified first spectrum, the frequency component of the first spectrum A second frequency component modifying means for modifying
Frequency inverse transforming means for performing frequency inverse transform on the first spectrum in which the frequency component is modified to generate a modified acoustic frame;
There is provided a second acoustic signal embedding device for an acoustic signal having modified acoustic frame output means for sequentially outputting the generated modified acoustic frames.

本発明第1の態様によれば、原音響信号の第1スペクトルの信号成分の中で、所定の周波数Ft以上の信号成分を0にするとともに、周波数Ftを中心に周波数Ft以下の信号成分を高域の周波数方向に折り返し、折り返された周波数Ftから周波数2Ft(Ftの2倍)の範囲の第1スペクトルの信号成分に対して正負符号を反転しかつ所定の係数値を乗算しながら、第1スペクトルの対応する周波数の信号成分に加算することにより、第1スペクトルの周波数成分を改変した後、第2スペクトルの信号成分の中で、周波数Ft以上の信号成分を除去するとともに、周波数Ftを中心に周波数Ft以下の信号成分を高域の周波数方向に折り返し、折り返された周波数Ftから周波数2Ftの範囲の第2スペクトルの信号成分に対して所定の係数値を乗算しながら、改変後の第1スペクトルの対応する周波数の信号成分に加算するようにしたので、通常再生では、原音響信号の高域に埋め込まれた位相反転された原音響信号の低域成分や第2の音響信号成分は不可聴であるが、通常再生した音をサンプリング周波数2Ftで再サンプリングされ複製された音響信号を再生した場合には、周波数Ftから周波数2Ftの範囲の第1スペクトルの位相反転された信号成分が、逆に周波数Ftを中心に周波数Fk以下の低域の周波数方向に折り返され、原音響信号の周波数Ft以下の信号成分に重畳(減算)されるため、原音響信号に基づく音が所定の係数値の割合だけ打ち消されるとともに、周波数Ftから周波数2Ftの範囲の第2スペクトルの信号成分が、逆に周波数Ftを中心に周波数Fk以下の低域の周波数方向に折り返され、原音響信号の周波数Ft以下の信号成分に重畳され、第2の音響信号に基づく音が抑圧された原音響信号に基づく音の代わりに再生されるようになり、本来の原音響信号に基づく音のみの再生を防ぐことを可能とする。また、複製する際のサンプリング周波数は2Ft丁度である必要はなく、2Ft前後以下(3Ft以下)であれば設定されたサンプリング周波数の1/2の周波数を中心に折り返しが発生し、折り返される対象の信号成分や折り返される低域の周波数帯は所望の位置からずれて、原音響信号が中途半端に打ち消され、代わりに再生される第2の音響信号に歪みが加わり雑音化されるものの、少なくとも本来の原音響信号に基づく音のみの再生を防ぐという目的は達成可能となる。   According to the first aspect of the present invention, among the signal components of the first spectrum of the original sound signal, the signal component of the predetermined frequency Ft or more is set to 0, and the signal component of the frequency Ft or less is centered on the frequency Ft. The first spectrum signal component in the range from the folded frequency Ft to the frequency 2Ft (twice Ft) is inverted with the sign of the first spectrum and multiplied by a predetermined coefficient value. After modifying the frequency component of the first spectrum by adding to the signal component of the corresponding frequency of one spectrum, the signal component having the frequency Ft or higher is removed from the signal component of the second spectrum, and the frequency Ft is changed to A signal component having a frequency less than or equal to the frequency Ft is folded at the center in the high frequency direction, and a predetermined spectrum signal component in the range of the folded frequency Ft to the frequency 2Ft is determined. Since it is added to the signal component of the corresponding frequency of the modified first spectrum while multiplying by a numerical value, in normal reproduction, the phase-inverted original sound signal embedded in the high frequency range of the original sound signal is reduced. The band component and the second acoustic signal component are inaudible, but when the reproduced sound signal is reproduced by re-sampling the normally reproduced sound at the sampling frequency 2Ft, the first in the range of the frequency Ft to the frequency 2Ft is used. On the contrary, the signal component having the inverted phase of the spectrum is folded back in the low frequency direction below the frequency Fk around the frequency Ft and superimposed (subtracted) on the signal component below the frequency Ft of the original acoustic signal. The sound based on the acoustic signal is canceled by a ratio of a predetermined coefficient value, and the signal component of the second spectrum in the range from the frequency Ft to the frequency 2Ft is conversely centered on the frequency Ft. It is folded in the direction of the low frequency below the wave number Fk, superimposed on the signal component below the frequency Ft of the original sound signal, and the sound based on the second sound signal is reproduced instead of the sound based on the suppressed original sound signal. Thus, it is possible to prevent reproduction of only sound based on the original original sound signal. In addition, the sampling frequency at the time of duplication need not be exactly 2Ft, and if it is less than or equal to 2Ft (3Ft or less), folding will occur centering around a half of the set sampling frequency, Although the signal component and the low frequency band to be folded are shifted from the desired position, the original sound signal is canceled halfway, and the second sound signal to be reproduced is distorted by adding distortion, but at least originally The purpose of preventing only reproduction of sound based on the original sound signal can be achieved.

本発明第2の態様では、
時系列のサンプル列で構成されるサンプリング周波数Fsの原音響信号に対して、妨害音を聴取不能な状態で埋め込む装置であって、
前記原音響信号から所定数のサンプルで構成される第1音響フレームを読み込む音響フレーム読込手段と、
前記第1音響フレームに対して周波数変換を行い、複素周波数成分である第1スペクトルを得る周波数変換手段と、
前記第1スペクトルの信号成分の中で、周波数Ft以上の信号成分を除去するとともに、前記周波数Ftを中心に前記周波数Ft以下の信号成分を高域の周波数方向に折り返し、折り返された周波数Ftから周波数2Ftの範囲の第1スペクトルの信号成分に対して正負符号を反転しかつ所定の係数値を乗算しながら、前記第1スペクトルの対応する周波数の信号成分に加算することにより、前記第1スペクトルの周波数成分を改変する第1の周波数成分改変手段と、
前記第1スペクトルの信号成分の中で、周波数Ft以上、周波数Ft以下の信号成分に対して、信号の絶対値が所定値だけ増加するように、前記第1スペクトルの周波数成分を改変する第2の周波数成分改変手段と、
前記周波数成分が改変された第1スペクトルに対して周波数逆変換を行って、改変音響フレームを生成する周波数逆変換手段と、
前記生成された改変音響フレームを順次出力する改変音響フレーム出力手段を有する音響信号に対する妨害音の埋込み装置を提供する。
In the second aspect of the present invention,
An apparatus that embeds an interfering sound in an inaudible state with respect to an original sound signal having a sampling frequency Fs composed of a time-series sample sequence,
Sound frame reading means for reading a first sound frame composed of a predetermined number of samples from the original sound signal;
Frequency conversion means for performing frequency conversion on the first acoustic frame to obtain a first spectrum which is a complex frequency component;
Among the signal components of the first spectrum, the signal components of the frequency Ft or higher are removed, the signal components of the frequency Ft or lower are folded back in the high frequency direction around the frequency Ft, and the folded frequency Ft is used. while multiplying the inverting and predetermined coefficient value the sign for the first spectral signal component of the range of frequencies 2 Ft, by adding the signal component of the corresponding frequency before Symbol first spectrum, said first First frequency component modifying means for modifying the frequency component of the spectrum;
The frequency component of the first spectrum is modified so that the absolute value of the signal increases by a predetermined value with respect to the signal component of the frequency Ft or more and the frequency 2 Ft or less among the signal components of the first spectrum. Two frequency component modification means;
Frequency inverse transforming means for performing frequency inverse transform on the first spectrum in which the frequency component is modified to generate a modified acoustic frame;
There is provided a device for embedding a disturbing sound in an acoustic signal having modified acoustic frame output means for sequentially outputting the generated modified acoustic frames.

本発明第2の態様によれば、原音響信号の第1スペクトルの信号成分の中で、所定の周波数Ft以上の信号成分を0にするとともに、周波数Ftを中心に周波数Ft以下の信号成分を高域の周波数方向に折り返し、折り返された周波数Ftから周波数2Ftの範囲の第1スペクトルの信号成分に対して正負符号を反転しかつ所定の係数値を乗算しながら、第1スペクトルの対応する周波数の信号成分に加算することにより、第1スペクトルの周波数成分を改変した後、第1スペクトルの信号成分の中で、周波数Ft以上、周波数Ft以下の信号成分に対して、信号の絶対値が所定値だけ増加するように、前記第1スペクトルの周波数成分を改変するようにしたので、通常再生では、原音響信号の高域に埋め込まれた位相反転された原音響信号の低域成分や白色雑音成分は不可聴であるが、通常再生した音をサンプリング周波数2Ftで再サンプリングされ複製された音響信号を再生した場合には、周波数Ftから周波数2Ftの範囲の第1スペクトルの位相反転された信号成分が、逆に周波数Ftを中心に周波数Ft以下の低域の周波数方向に折り返され、原音響信号の周波数Ft以下の信号成分に重畳(減算)されるため、原音響信号に基づく音が所定の係数値の割合だけ打ち消されるとともに、Ftから周波数2Ftの範囲の白色雑音に対応する成分が、逆に周波数Ftを中心に周波数Ft以下の低域の周波数方向に折り返され、原音響信号の周波数Ft以下の信号成分に重畳され、白色雑音が抑圧された原音響信号に基づく音の代わりに再生され、本来の原音響信号に基づく音のみの再生を防ぐことを可能とする。また、複製する際のサンプリング周波数は2Ft丁度である必要はなく、2Ft前後以下(3Ft以下)であれば設定されたサンプリング周波数の1/2の周波数を中心に折り返しが発生し、折り返される対象の信号成分や折り返される低域の周波数帯は所望の位置からずれて、原音響信号が中途半端に打ち消され、代わりに再生される白色雑音の周波数特性が変化するものの、少なくとも本来の原音響信号に基づく音のみの再生を防ぐという目的は達成可能となる。 According to the second aspect of the present invention, among the signal components of the first spectrum of the original sound signal, the signal component of the predetermined frequency Ft or more is set to 0, and the signal component of the frequency Ft or less is centered on the frequency Ft. The corresponding frequency of the first spectrum is folded in the high-frequency direction, while inverting the sign and multiplying the signal component of the first spectrum in the range of the folded frequency Ft to the frequency 2Ft by a predetermined coefficient value. After the frequency component of the first spectrum is altered by adding to the signal component of the first spectrum, the absolute value of the signal is greater than the signal component of the first spectrum with respect to the signal component having the frequency of Ft or higher and the frequency of 2 Ft or lower. Since the frequency component of the first spectrum is modified so as to increase by a predetermined value, in normal reproduction, the phase-inverted original acoustic signal embedded in the high frequency range of the original acoustic signal is used. The low frequency component and white noise component of the signal are inaudible, but when the reproduced sound signal is reproduced by re-sampling the normally reproduced sound at the sampling frequency 2Ft, the first in the range from the frequency Ft to the frequency 2Ft Conversely, the signal component of which the phase of the spectrum is inverted is folded back in the low frequency direction below the frequency Ft around the frequency Ft and superimposed (subtracted) on the signal component below the frequency Ft of the original acoustic signal. The sound based on the acoustic signal is canceled by a ratio of a predetermined coefficient value, and the component corresponding to the white noise in the range of Ft to frequency 2Ft is reversed in the frequency direction of the low band below the frequency Ft centering on the frequency Ft. Is reproduced instead of the sound based on the original sound signal with the white noise suppressed, superimposed on the signal component of the original sound signal having the frequency Ft or less, and based on the original original sound signal. It makes it possible to prevent the playback of sound only. In addition, the sampling frequency at the time of duplication need not be exactly 2Ft, and if it is less than or equal to 2Ft (3Ft or less), folding will occur centering around a half of the set sampling frequency, The signal component and the low frequency band that is folded back deviate from the desired position, the original acoustic signal is canceled halfway, and the frequency characteristics of the white noise that is reproduced instead change, but at least the original original acoustic signal The objective of preventing only the sound based on it can be achieved.

本発明第3の態様では、本発明第2の態様の音響信号に対する妨害音の埋込み装置において、前記第1の周波数成分改変手段および第2の周波数成分改変手段は、前記音響フレーム読込手段により読み込まれた音響フレームのうち、所定間隔ごとの音響フレームに対して、処理を行うものであることを特徴とする。   According to a third aspect of the present invention, in the apparatus for embedding interference sound in the acoustic signal according to the second aspect of the present invention, the first frequency component modifying means and the second frequency component modifying means are read by the acoustic frame reading means. Among the acoustic frames, the processing is performed on the acoustic frames at predetermined intervals.

本発明第3の態様によれば、所定間隔ごとの音響フレームに対して奇数番目の音響フレームと偶数番目の音響フレームのうち、いずれか一方のみに対して改変を行うようにしたので、原音響信号の改変のための演算処理量を減らすことができるとともに、雑音再生音を明瞭にすることができる。特に、所定間隔として2音響フレームごと、すなわち奇数番目の音響フレームか偶数番目の音響フレームのどちらかに対してのみ改変を行うようにすれば、演算処理量に対する妨害音の埋め込みの効率が良い。   According to the third aspect of the present invention, only one of the odd-numbered sound frames and the even-numbered sound frames is modified with respect to the sound frames at predetermined intervals. The amount of calculation processing for signal modification can be reduced, and the noise reproduction sound can be clarified. In particular, if the modification is performed only for every two acoustic frames, that is, only the odd-numbered acoustic frame or the even-numbered acoustic frame as the predetermined interval, the efficiency of embedding the interference sound with respect to the calculation processing amount is good.

本発明第4の態様では、本発明第1から第3のいずれかの態様の音響信号に対する第2の音響信号の埋込み装置または音響信号に対する妨害音の埋込み装置において、前記原音響信号に対して、サンプリング周波数Fs´(Fs´>Fs)でアップサンプリングを行い、広帯域の原音響信号を作成するアップサンプリング手段をさらに有し、前記Ft=Fs/2であり、前記音響フレーム読込手段、前記周波数変換手段、前記第1の周波数成分改変手段、前記第2の周波数成分改変手段、前記周波数逆変換手段、前記改変音響フレーム出力手段は、前記アップサンプリング後の原音響信号に対して処理を行うものであることを特徴とする。
According to a fourth aspect of the present invention, in the second acoustic signal embedding device or the disturbing sound embedding device for the acoustic signal according to any one of the first to third aspects of the present invention, , Further comprising upsampling means for performing upsampling at a sampling frequency Fs ′ (Fs ′> Fs) to create a wideband original sound signal, wherein Ft = Fs / 2, the sound frame reading means, and the frequency conversion means, said first frequency component changing means, the second frequency component changing means, said inverse frequency transform means, said modified acoustic frame output unit performs processing on the original acoustic signal after the upsampling It is characterized by being.

本発明第4の態様によれば、原音響信号の信号成分除去の下限であり、折り返しの中心である周波数Ftを、原音響信号のサンプリング周波数Fsの1/2とし、改変音響信号のサンプル数を原音響信号のサンプル数より大きくなるように改変するようにしたので、埋め込まれた位相反転された原音響信号の低域成分や第2の音響信号または妨害音の成分の下限がFs/2となり、周波数Fs/2を人間の可聴域の上限付近に設定しておくことにより、位相反転された原音響信号の低域成分や第2の音響信号または妨害音の信号成分は完全に非可聴域に入り、これらの信号成分は全く聴取されない。ところが、改変音響信号がアナログ系に変換されるかデジタルの状態で、サンプリング周波数Fsで再度サンプリングされ複製された場合に、複製された音響信号を再生すると、エイリアシングが発生して周波数Fs/2以上の妨害音の信号成分が周波数Fs/2を中心に周波数Fs/2以下の可聴帯域に折り返され、原音信号に基づく音が抑圧され、代わりに第2の音響信号に基づく音または妨害音が可聴な状態で出力される。このため、原音響信号のサンプリング周波数と同一のサンプリング周波数で、原音響信号に記録された音のみを複製されることを防ぐことが可能となる。また、複製する際のサンプリング周波数はFs丁度である必要はなく、Fs前後以下(3Fs/2(Fsを3/2倍したもの)以下)であれば設定されたサンプリング周波数の1/2の周波数を中心に折り返しが発生し、折り返される対象の信号成分や折り返される低域の周波数帯は所望の位置からずれて、原音響信号が中途半端に打ち消され、代わりに再生される第2の音響信号に歪みが加わり雑音化されるか、妨害音の周波数特性が変化するものの、少なくとも本来の原音響信号に基づく音のみの再生を防ぐという目的は達成可能となる。   According to the fourth aspect of the present invention, the frequency Ft that is the lower limit of the signal component removal of the original sound signal and is the center of folding is set to ½ of the sampling frequency Fs of the original sound signal, and the number of samples of the modified sound signal Is modified so as to be larger than the number of samples of the original sound signal, the lower limit of the low-frequency component of the embedded phase-inverted original sound signal, the second sound signal, or the component of the disturbing sound is Fs / 2. By setting the frequency Fs / 2 near the upper limit of the human audible range, the low frequency component of the original acoustic signal whose phase has been inverted, the second acoustic signal, or the signal component of the interfering sound is completely inaudible. The signal components are not heard at all. However, when the modified acoustic signal is converted into an analog system or digitally sampled and duplicated again at the sampling frequency Fs, when the reproduced acoustic signal is reproduced, aliasing occurs and the frequency Fs / 2 or higher is generated. The signal component of the disturbing sound is folded back to an audible band of frequency Fs / 2 or less around the frequency Fs / 2, the sound based on the original sound signal is suppressed, and the sound based on the second acoustic signal or the disturbing sound is audible instead. Is output in the correct state. For this reason, it is possible to prevent only the sound recorded in the original sound signal from being duplicated at the same sampling frequency as that of the original sound signal. In addition, the sampling frequency at the time of duplication need not be exactly Fs, and if it is less than or equal to Fs (3Fs / 2 (Fs multiplied by 3/2) or less), it is 1/2 of the set sampling frequency. The second acoustic signal is generated in which the signal component to be folded or the low frequency band to be folded is shifted from a desired position, the original acoustic signal is canceled halfway, and reproduced instead. Although the noise is added to the noise and the frequency characteristics of the disturbing sound are changed, at least the purpose of preventing the reproduction of only the sound based on the original original sound signal can be achieved.

本発明第5の態様では、本発明第1から第3のいずれかの態様の音響信号に対する第2の音響信号の埋込み装置または音響信号に対する妨害音の埋込み装置において、前記Ft=Fs/4であることを特徴とする。   According to a fifth aspect of the present invention, in the second acoustic signal embedding device for an acoustic signal according to any one of the first to third aspects of the present invention or an interference sound embedding device for an acoustic signal, Ft = Fs / 4 It is characterized by being.

本発明第5の態様によれば、折り返しの中心である周波数Ftを、原音響信号のサンプリング周波数Fsの1/4としたので、位相反転された原音響信号の低域成分および第2の音響信号または妨害音の信号成分の上限がFs/2となり、原音響信号の周波数Fs/4からFs/2までの信号成分に位相反転された原音響信号の低域成分および第2の音響信号または妨害音の信号成分が重畳されており、サンプリング周波数Fs/2で複製された場合に、複製された音響信号を再生すると、エイリアシングが発生して、周波数Fs/4からFs/2までの位相反転された原音響信号の低域成分および第2の音響信号または妨害音の信号成分が周波数Fs/4を中心に周波数Fs/4以下に折り返され、原音響信号に基づく音が抑圧され、代わりに第2の音響信号に基づく音または妨害音が可聴な状態で出力される。このため、原音響信号のサンプリング周波数の1/2のサンプリング周波数で、原音響信号に記録された音のみを複製されることを防ぐことが可能となる。また、複製する際のサンプリング周波数はFs/2丁度である必要はなく、Fs/2前後以下(3Fs/4(Fsを3/4倍したもの)以下)であれば設定されたサンプリング周波数の1/2の周波数を中心に折り返しが発生し、折り返される対象の信号成分や折り返される低域の周波数帯は所望の位置からずれて、原音響信号が中途半端に打ち消され、代わりに再生される第2の音響信号に歪みが加わり雑音化されるか、妨害音の周波数特性が変化するものの、少なくとも本来の原音響信号に基づく音のみの再生を防ぐという目的は達成可能となる。   According to the fifth aspect of the present invention, since the frequency Ft that is the center of the folding is set to ¼ of the sampling frequency Fs of the original sound signal, the low frequency component of the phase-inverted original sound signal and the second sound The upper limit of the signal component of the signal or the interference sound is Fs / 2, and the low-frequency component of the original sound signal and the second sound signal or When the signal component of the interfering sound is superimposed and replicated at the sampling frequency Fs / 2, when the reproduced acoustic signal is reproduced, aliasing occurs and the phase inversion from the frequency Fs / 4 to Fs / 2 occurs. The low-frequency component of the original sound signal and the signal component of the second sound signal or the disturbing sound are folded back to the frequency Fs / 4 or less around the frequency Fs / 4, and the sound based on the original sound signal is suppressed, Sound or interference sound based on the second audio signal is output at audible state. For this reason, it is possible to prevent only the sound recorded in the original sound signal from being duplicated at a sampling frequency that is half the sampling frequency of the original sound signal. Further, the sampling frequency at the time of duplication need not be exactly Fs / 2, and if it is around Fs / 2 or less (3Fs / 4 (Fs multiplied by 3/4) or less), 1 of the set sampling frequency. / 2 occurs, the signal component to be folded and the low frequency band to be folded are shifted from the desired position, and the original sound signal is canceled halfway and is reproduced instead. Although the second acoustic signal is distorted by adding distortion or the frequency characteristics of the disturbing sound are changed, at least the object of preventing the reproduction of only the sound based on the original original acoustic signal can be achieved.

本発明第6の態様では、本発明第1から第5のいずれかの態様の音響信号に対する第2の音響信号の埋込み装置または音響信号に対する妨害音の埋込み装置において、前記改変音響フレームの奇数番目と偶数番目のサンプル値のうち一方のサンプル値を、当該サンプル値の直前のサンプル値に1以下の実数値である重みG(Gl、Gr)を乗算した値と、当該サンプル値に(1−G)を乗算した値との和に変換することにより前記改変音響フレームを補正する改変音響フレーム補正手段をさらに有し、前記改変音響フレーム出力手段は、前記補正された改変音響フレームを順次出力するものであることを特徴とする。   According to a sixth aspect of the present invention, in the second acoustic signal embedding device for an acoustic signal or the disturbing sound embedding device for an acoustic signal according to any one of the first to fifth aspects of the present invention, And one of the even-numbered sample values, a value obtained by multiplying the sample value immediately before the sample value by a weight G (Gl, Gr) that is a real value of 1 or less, and the sample value (1- G) further includes a modified acoustic frame correcting unit that corrects the modified acoustic frame by converting the sum into a sum of the multiplied value and the modified acoustic frame output unit sequentially outputs the modified modified acoustic frame. It is characterized by being.

本発明第6の態様によれば、改変音響フレームの奇数番目と偶数番目のサンプル値のうち一つ置きのサンプル値を、所定の重みを乗じて変換するようにしたので、部分的にサンプリング周波数の1/2の周波数で再サンプリングを行ったのと同様な効果が起こり、サンプリング周波数の1/2以上の高域に埋め込まれている位相反転された原音響信号の低域成分および第2の音響信号または妨害音の信号成分が所定の重みGに基づく割合だけ事前に僅かに折り返された状態になる。ただし、元の音響信号の低周波成分に基づく聴覚マスキングの作用により、低域に折り返される位相反転された原音響信号の低域成分および第2の音響信号または妨害音の信号成分が聴取不能なレベルに重みGが調整されているので、通常再生時には元の原音響信号しか聴取されない。ところが、所定のサンプリング周波数Ftで再サンプリングし複製を行うと、周波数Ft/2以上の高域信号成分を減衰させるLPF(Low Pass Filter, 低域通過フィルタ)回路を介して再サンプリングされることが一般的で、そのように複製された場合、位相反転された原音響信号の低域成分および第2の音響信号または妨害音に基づく信号成分が大幅に減衰されながら折り返されることになるが、あらかじめ所定の重みGに基づく割合だけ同一の信号成分が折り返されているため、これらの信号成分は強めあう。そうすると、原音響信号の抑圧が働き、代わりに再生される第2の音響信号または妨害音のレベルが原音響信号による聴覚マスキングの範囲から逸脱し聴取可能になる。   According to the sixth aspect of the present invention, every other sample value among the odd-numbered and even-numbered sample values of the modified acoustic frame is converted by multiplying by a predetermined weight, so that the sampling frequency is partially The same effect as when re-sampling is performed at a frequency of 1/2 of the low frequency component of the phase-inverted original sound signal embedded in the high frequency of 1/2 or more of the sampling frequency and the second The sound signal or the signal component of the interference sound is slightly folded in advance by a ratio based on the predetermined weight G. However, due to the effect of auditory masking based on the low-frequency component of the original acoustic signal, the low-frequency component of the original acoustic signal whose phase has been inverted and the second acoustic signal or the signal component of the disturbing sound cannot be heard. Since the weight G is adjusted to the level, only the original original sound signal is heard during normal reproduction. However, if re-sampling is performed at a predetermined sampling frequency Ft and duplication is performed, the signal may be re-sampled via an LPF (Low Pass Filter) circuit that attenuates a high-frequency signal component having a frequency Ft / 2 or higher. In general, when copied in such a manner, the low-frequency component of the phase-reversed original sound signal and the signal component based on the second sound signal or the disturbing sound are folded while being greatly attenuated. Since the same signal components are folded by a ratio based on the predetermined weight G, these signal components are strengthened. Then, the suppression of the original sound signal works, and the level of the second sound signal or the disturbing sound reproduced instead deviates from the range of the auditory masking by the original sound signal and can be heard.

本発明第7の態様では、本発明第6の態様の音響信号に対する第2の音響信号の埋込み装置または音響信号に対する妨害音の埋込み装置において、前記改変音響フレーム補正手段は、前記改変音響フレームに含まれるサンプルの平均値に基づいて前記重みGを算出するものであることを特徴とする。   According to a seventh aspect of the present invention, in the second acoustic signal embedding device for the acoustic signal or the disturbing sound embedding device for the acoustic signal according to the sixth aspect of the present invention, the modified acoustic frame correcting means includes the modified acoustic frame in the modified acoustic frame. The weight G is calculated based on an average value of included samples.

本発明第7の態様によれば、低周波成分を付加するためにサンプル値に乗じる重みGを、各改変音響フレームのサンプルの平均値としたので、時系列に変化する各改変音響フレームに応じた改変を行うことが可能となる。   According to the seventh aspect of the present invention, the weight G by which the sample value is multiplied in order to add the low frequency component is the average value of the samples of each modified acoustic frame, so that it corresponds to each modified acoustic frame changing in time series. Can be modified.

本発明第8の態様では、本発明第1から第7のいずれか1つの態様の音響信号に対する第2の音響信号の埋込み装置または音響信号に対する妨害音の埋込み装置において、前記周波数変換手段は、窓幅Nサンプルとして、サンプル位置i(0≦i≦N−1)における重みW(i)(0≦W(i)≦1)が、W(i)=0.5−0.5cos(2πi/N)で定義されるハニング窓関数を用いて周波数変換を行うものであることを特徴とする。   According to an eighth aspect of the present invention, in the second acoustic signal embedding device or the disturbing sound embedding device for the acoustic signal according to any one of the first to seventh aspects of the present invention, the frequency converting means comprises: As the window width N samples, the weight W (i) (0 ≦ W (i) ≦ 1) at the sample position i (0 ≦ i ≦ N−1) is W (i) = 0.5−0.5 cos (2πi). The frequency conversion is performed using a Hanning window function defined by / N).

本発明第8の態様によれば、周波数解析を行う際に、ハニング窓関数を用いるようにしたので、擬似高調波成分を発生させることなく、原音響信号に与える歪みを低減させながら周波数変換を行うことが可能になる。   According to the eighth aspect of the present invention, since the Hanning window function is used when performing the frequency analysis, the frequency conversion is performed while reducing the distortion applied to the original acoustic signal without generating a pseudo-harmonic component. It becomes possible to do.

本発明によれば、音響信号を所定のサンプリング周波数以下でサンプリングして複製を行い、複製後のデジタル化された音響信号を再生した場合に、原音響信号に基づく音が抑圧され代わりに非可聴に埋め込まれた第2の音響信号に基づく音または妨害音が再生されることにより、本来の原音響信号のみが記録された状態での複製を防止することが可能となる。   According to the present invention, when a sound signal is sampled at a predetermined sampling frequency or less and copied, and the reproduced digital sound signal is reproduced, the sound based on the original sound signal is suppressed and instead inaudible. By reproducing the sound or the disturbing sound based on the second acoustic signal embedded in the recording medium, it is possible to prevent duplication in a state where only the original original acoustic signal is recorded.

エイリアシングの原理を示す図である。It is a figure which shows the principle of aliasing. 本発明の基本原理を示す図である。It is a figure which shows the basic principle of this invention. 本発明に係る音響信号に対する第2の音響信号または妨害音の埋め込み装置のハードウェア構成図である。It is a hardware block diagram of the embedding apparatus of the 2nd acoustic signal with respect to the acoustic signal which concerns on this invention, or disturbance sound. 本発明に係る音響信号に対する第2の音響信号または妨害音の埋め込み装置の構成を示す機能ブロック図である。It is a functional block diagram which shows the structure of the embedding apparatus of the 2nd acoustic signal with respect to the acoustic signal which concerns on this invention, or disturbance sound. 第1(第3)の実施形態に係る音響信号に対する第2の音響信号の埋め込み装置の処理動作を示すフローチャートである。It is a flowchart which shows the processing operation of the 2nd acoustic signal embedding apparatus with respect to the acoustic signal which concerns on 1st (3rd) embodiment. ステップS8までの処理により得られた改変音響信号が、LPF回路を備えた現実的な装置で複製される場合の概念を示す図である。It is a figure which shows the concept in case the modified acoustic signal obtained by the process to step S8 is replicated with the realistic apparatus provided with the LPF circuit. 第1の実施形態におけるステップS9、ステップS10の低周波成分補正処理を示す図である。It is a figure which shows the low frequency component correction process of step S9 and step S10 in 1st Embodiment. ステップS10までの処理により得られた改変音響信号が、LPF回路を備えた現実的な装置で複製される場合の概念を示す図である。It is a figure which shows the concept in case the modified acoustic signal obtained by the process to step S10 is replicated with the realistic apparatus provided with the LPF circuit. 第2(第4)の実施形態に係る音響信号に対する妨害音の埋め込み装置の処理動作を示すフローチャートである。It is a flowchart which shows the processing operation of the embedding device of the disturbance sound with respect to the acoustic signal which concerns on 2nd (4th) embodiment. 第3の実施形態における第2の音響信号の埋め込み処理の概念を示す図である。It is a figure which shows the concept of the embedding process of the 2nd acoustic signal in 3rd Embodiment. 第3の実施形態におけるステップS9、ステップS10の低周波成分補正処理を示す図である。It is a figure which shows the low frequency component correction process of step S9 and step S10 in 3rd Embodiment. 第3の実施形態のステップS10までの処理により得られた改変音響信号が、LPF回路を備えた現実的な装置で複製される場合の概念を示す図である。It is a figure which shows the concept in case the modified acoustic signal obtained by the process to step S10 of 3rd Embodiment is replicated with the realistic apparatus provided with the LPF circuit.

以下、本発明の実施形態について図面を参照して詳細に説明する。
(1.本発明の基本概念)
最初に、本発明の基本概念について説明しておく。本発明では、エイリアシングと呼ばれる折り返し歪みを利用して、複製を防止したい原音響信号に対して、原音響信号のレベルを抑圧するための原音響信号の位相反転した信号成分と新たに警告メッセージなど第2の音響信号や白色雑音等の妨害音を埋め込む改変を行い、改変音響信号を得る処理を行う。埋め込まれた位相反転された原音響信号の信号成分および第2の音響信号または妨害音の信号成分は、改変音響信号の通常再生時には聴き取ることができないが、再生された改変音響信号を録音して再サンプリングされ複製された複製音響信号(複製方法はデジタルコピーであるか、アナログコピーであるかは問わないが、原音響信号と同一のサンプリング周波数による複製を防止する場合にはアナログコピーに限定される)を再生すると、原音響信号が抑圧され、代わりに警告メッセージなどの第2の音響信号や白色雑音等の妨害音が可聴な状態で再生される。しかし、エイリアシングという現象は当業界において周知事項であるため、録音時に高周波雑音が混入しないように、録音装置またはサンプラーにアンチエイリアシング処理、具体的にはサンプラーの前にLPF回路が設置されているのが一般的である。これにより、エイリアシングにより折り返される高域成分がLPF回路により減衰されてしまうため、実質的には折り返しが殆ど発生しないのと等価となり、上記目的は実現できない。本発明では、これに対する解決策も提案するものである。具体的には、聴覚マスキングの範囲内に収まるレベルに、事前にわずかながらエイリアシングが発生した状態を形成しておく。LPF回路を通して再サンプリングが行われると、LPFにより減衰された折り返し信号成分が事前にわずかながら折り返されている信号成分に加算され強め合い、聴覚マスキングの範囲を逸脱し、折り返し信号成分が聴取可能なレベルにすることができ、上記目的を実現できる。
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
(1. Basic concept of the present invention)
First, the basic concept of the present invention will be described. In the present invention, by utilizing aliasing distortion called aliasing, the signal component obtained by inverting the phase of the original sound signal for suppressing the level of the original sound signal and a new warning message for the original sound signal to be prevented from being duplicated. A modification for embedding a second sound signal or a disturbing sound such as white noise is performed, and processing for obtaining a modified sound signal is performed. The signal component of the embedded original phase-inverted signal and the signal component of the second or interfering sound cannot be heard during normal reproduction of the modified acoustic signal, but the reproduced modified acoustic signal is recorded. Duplicated audio signal resampled and duplicated (regardless of whether the copy method is digital copy or analog copy, it is limited to analog copy in order to prevent duplication with the same sampling frequency as the original sound signal) ) Is suppressed, the second acoustic signal such as a warning message and a disturbing sound such as white noise are reproduced in an audible state instead. However, since the phenomenon of aliasing is a well-known matter in the industry, anti-aliasing processing is installed in the recording device or sampler, specifically, an LPF circuit is installed in front of the sampler so that high-frequency noise is not mixed during recording. Is common. As a result, the high frequency component folded back by aliasing is attenuated by the LPF circuit, so that it is substantially equivalent to almost no folding, and the above-mentioned object cannot be realized. The present invention also proposes a solution for this. Specifically, a state in which aliasing slightly occurs in advance is set to a level that falls within the range of auditory masking. When resampling is performed through the LPF circuit, the folded signal component attenuated by the LPF is added to the slightly folded signal component in advance, strengthening it, deviating from the range of auditory masking, and the folded signal component can be heard. The above-mentioned purpose can be realized.

図1は、エイリアシングの原理を示す図である。このうち、図1(a)は、原音響信号の信号スペクトル、図1(b)は図1(a)の原音響信号をサンプリング周波数Fsでサンプリングしたサンプリングデータの信号スペクトルを示している。原音響信号に対して、サンプリング周波数Fsでサンプリングを行うと、ナイキスト周波数Fs/2を超える高周波の信号成分が、Fs/2を中心に低域側に折り返され、Fs/2以下の低域信号成分として誤解析され重畳されてしまう。これが、エイリアシングである。図1の例では、サンプリング周波数Fsでサンプリングを行うことにより、周波数Fs/2〜Fsの信号成分は周波数方向に反転して重畳され、周波数Fs〜3Fs/2の信号成分は周波数方向に2回反転して元の向きで重畳される。図1(b)の例では、3種のスペクトル成分を重ねて表示しているが、実際には複素ベクトルで加算される。   FIG. 1 is a diagram illustrating the principle of aliasing. 1A shows the signal spectrum of the original acoustic signal, and FIG. 1B shows the signal spectrum of the sampling data obtained by sampling the original acoustic signal of FIG. 1A at the sampling frequency Fs. When the original sound signal is sampled at the sampling frequency Fs, a high-frequency signal component exceeding the Nyquist frequency Fs / 2 is folded back to the low frequency side centering on Fs / 2, and the low frequency signal of Fs / 2 or less. It is misanalyzed as a component and superimposed. This is aliasing. In the example of FIG. 1, by sampling at the sampling frequency Fs, the signal components of the frequencies Fs / 2 to Fs are inverted and superimposed in the frequency direction, and the signal components of the frequencies Fs to 3Fs / 2 are twice in the frequency direction. Inverted and superimposed in the original orientation. In the example of FIG. 1B, three types of spectral components are displayed in an overlapping manner, but in reality they are added as complex vectors.

図2は、本発明の基本原理を示す図である。図2において、図2(a)は、サンプリング周波数Fsでサンプリングされた原音響信号の信号スペクトル、図2(b)は、サンプリング周波数Fsでサンプリングされた第2の音響信号である第2音響信号の信号スペクトル、図2(c)は、本発明による埋め込み処理の結果得られた改変音響信号の信号スペクトル、図2(d)は、改変音響信号を何らかの複製手段で再サンプリングして得られた複製音響信号の信号スペクトルである。   FIG. 2 is a diagram showing the basic principle of the present invention. 2A is a signal spectrum of an original acoustic signal sampled at the sampling frequency Fs, and FIG. 2B is a second acoustic signal that is a second acoustic signal sampled at the sampling frequency Fs. 2 (c) is a signal spectrum of the modified acoustic signal obtained as a result of the embedding process according to the present invention, and FIG. 2 (d) is obtained by re-sampling the modified acoustic signal by some replication means. It is a signal spectrum of a duplication acoustic signal.

図2(a)に示した原音響信号、図2(b)に示した第2音響信号は、ともにサンプリング前にハイカットフィルタ処理によりサンプリング周波数Fs/2より高域の成分を削除し、エイリアシングが生じていないものを用いる。ここでは、図1(a)に示した原音響信号に対してあらかじめ同サンプリング周波数を2Fs(Fsの2倍)に拡大して、図2(b)に示した異なる音響信号を周波数Fs/2を中心に高域側へ折り返したものをサンプリング周波数が拡大された原音響信号に合成し、図2(c)に示す改変音響信号を得る。この際、本発明では、原音響信号のFs/2以下の成分を振幅反転しながら、Fs/2を中心に周波数方向に折り返し、合成する処理を行う。   Both the original acoustic signal shown in FIG. 2 (a) and the second acoustic signal shown in FIG. 2 (b) are subjected to high-cut filter processing before sampling to remove components in the higher frequency range than the sampling frequency Fs / 2. Use something that has not occurred. Here, the same sampling frequency is expanded to 2 Fs (twice Fs) in advance with respect to the original sound signal shown in FIG. 1A, and the different sound signal shown in FIG. 2 is synthesized with the original acoustic signal whose sampling frequency is expanded, and the modified acoustic signal shown in FIG. 2C is obtained. At this time, in the present invention, the component of Fs / 2 or less of the original sound signal is folded in the frequency direction around Fs / 2 while being amplitude-inverted and synthesized.

このようにして得られた図2(c)に示す改変音響信号を再生した場合、Fs/2を人間の可聴域より高い値(例えば、22.05kHz)に設定しておくことにより、Fs/2より高い異なる音響信号に由来する信号成分に基づく音は、人間にはほとんど聴こえない。図2(c)に示す改変音響信号を、複製してサンプリング周波数Fsで再サンプリングすると、図2(d)に示す複製音響信号が得られる。図2(d)に示す複製音響信号は、エイリアシングが発生し、原音響信号成分が振幅反転して人間の可聴域であるFs/2以下の原音響信号に折り返されて原音響信号は打ち消され、代わりに第2音響信号に由来する信号成分が、人間の可聴域であるFs/2以下に折り返される。この結果、複製音響信号には、第2音響信号に由来する信号成分が主に記録されるため、第2音響信号として記録された警告メッセージ等の第2音響信号のみが人間に聴こえることになる。このため、原音響信号の複製を防止することができる。   When the modified acoustic signal shown in FIG. 2C obtained in this way is reproduced, by setting Fs / 2 to a value higher than the human audible range (for example, 22.05 kHz), Fs / Sounds based on signal components derived from different acoustic signals higher than 2 are hardly audible to humans. When the modified acoustic signal shown in FIG. 2C is duplicated and resampled at the sampling frequency Fs, the duplicate acoustic signal shown in FIG. 2D is obtained. The duplicated sound signal shown in FIG. 2 (d) is aliased, and the original sound signal component is inverted in amplitude and turned back to an original sound signal of Fs / 2 or less, which is the human audible range, and the original sound signal is canceled out. Instead, the signal component derived from the second acoustic signal is folded back below Fs / 2, which is the human audible range. As a result, since the signal component derived from the second sound signal is mainly recorded in the duplicate sound signal, only the second sound signal such as a warning message recorded as the second sound signal can be heard by humans. . For this reason, duplication of the original acoustic signal can be prevented.

(2.1.埋め込み装置の構成)
次に、本発明に係る音響信号に対する第2の音響信号または妨害音の埋め込み装置について説明する。図3は、本発明に係る音響信号に対する第2の音響信号または妨害音の埋め込み装置のハードウェア構成図である。音響信号に対する第2の音響信号または妨害音の埋め込み装置は、汎用のコンピュータで実現することができ、図3に示すように、CPU1(CPU: Central Processing Unit)と、コンピュータのメインメモリであるRAM2(RAM: Random Access Memory)と、CPU1が実行するプログラムやデータを記憶するための大容量の記憶装置3(例えば、ハードディスク、フラッシュメモリ等)と、キーボード、マウス等のキー入力I/F(インターフェース)4と、外部装置(データ記憶媒体等)とデータ通信するためのデータ入出力I/F(インターフェース)5と、表示装置(ディスプレイ)に情報を送出するための表示出力I/F(インターフェース)6と、を備え、互いにバスを介して接続されている。
(2.1. Configuration of embedded device)
Next, a second acoustic signal or disturbance sound embedding device for an acoustic signal according to the present invention will be described. FIG. 3 is a hardware configuration diagram of the second acoustic signal or disturbance sound embedding device for the acoustic signal according to the present invention. The device for embedding the second sound signal or the disturbing sound with respect to the sound signal can be realized by a general-purpose computer. As shown in FIG. 3, a CPU 1 (CPU: Central Processing Unit) and a RAM 2 which is a main memory of the computer. (RAM: Random Access Memory), a large-capacity storage device 3 (for example, a hard disk, a flash memory, etc.) for storing programs and data executed by the CPU 1, and a key input I / F (interface) such as a keyboard and a mouse ) 4, a data input / output I / F (interface) 5 for data communication with an external device (such as a data storage medium), and a display output I / F (interface) for sending information to a display device (display) 6 are connected to each other via a bus.

図4は、本発明に係る音響信号に対する第2の音響信号または妨害音の埋め込み装置の構成を示す機能ブロック図である。図4において、8はアップサンプリング手段、10は音響フレーム読込手段、20は周波数変換手段、30は周波数成分改変手段、40は周波数逆変換手段、45は改変音響フレーム補正手段、50は改変音響フレーム出力手段、60は記憶手段、61は音響信号記憶部、62は改変音響信号記憶部である。なお、図4に示す装置は、ステレオ音響信号、モノラル音響信号あるいは3チャンネル以上のサラウンド音響信号のいずれにも対応可能であるが、本実施形態では、2チャンネルのステレオ音響信号に対して処理を行う場合について説明していく。   FIG. 4 is a functional block diagram showing the configuration of the second acoustic signal or disturbance sound embedding device for the acoustic signal according to the present invention. In FIG. 4, 8 is an upsampling means, 10 is an acoustic frame reading means, 20 is a frequency converting means, 30 is a frequency component modifying means, 40 is a frequency inverse transforming means, 45 is a modified acoustic frame correcting means, and 50 is a modified acoustic frame. An output means, 60 is a storage means, 61 is an acoustic signal storage section, and 62 is a modified acoustic signal storage section. Note that the apparatus shown in FIG. 4 can handle any of a stereo sound signal, a monaural sound signal, or a surround sound signal of three or more channels, but in the present embodiment, processing is performed on a stereo sound signal of two channels. The case of performing will be described.

アップサンプリング手段8は、音響信号記憶部61に記憶された原音響信号である第1音響信号に対して、第1音響信号のサンプリング周波数よりも周波数を上げてサンプリングを行い、広帯域音響信号を得る機能を有している。音響フレーム読込手段10は、広帯域音響信号の各チャンネルから所定数のサンプルを1音響フレームとして読み込む機能を有している。第2音響信号を埋め込む場合は、音響フレーム読込手段10は、第2音響信号の各チャンネルからも所定数のサンプルを1音響フレームとして読み込む機能も有している。周波数変換手段20は、音響フレーム読込手段10が広帯域音響信号から読み込んだ音響フレーム(以下、第1音響フレームという。)をフーリエ変換等により周波数変換して周波数次元の複素数のスペクトルを生成する機能を有している。第2音響信号を埋め込む場合は、周波数変換手段20は、音響フレーム読込手段10が第2音響信号から読み込んだ音響フレーム(以下、第2音響フレームという。)もフーリエ変換等により周波数変換して周波数次元の複素数のスペクトルを生成する機能も有している。周波数成分改変手段30は、第1音響フレームから得られたスペクトルを改変する機能を有している。第2音響信号を埋め込む場合は、周波数成分改変手段30は、第2音響フレームから得られたスペクトルを参照しながら、第1音響フレームから得られたスペクトルを改変する機能を有している。周波数逆変換手段40は、改変されたスペクトル集合を含む複数の複素数のスペクトルに対して周波数逆変換を行うことにより、時間次元の改変音響フレームを生成する機能を有している。改変音響フレーム補正手段45は、周波数逆変換手段40により得られた改変音響フレームを補正する機能を有している。改変音響フレーム出力手段50は、生成された改変音響フレームを順次出力する機能を有している。   The up-sampling means 8 samples the first acoustic signal, which is the original acoustic signal stored in the acoustic signal storage unit 61, at a frequency higher than the sampling frequency of the first acoustic signal to obtain a broadband acoustic signal. It has a function. The acoustic frame reading means 10 has a function of reading a predetermined number of samples as one acoustic frame from each channel of the broadband acoustic signal. When embedding the second acoustic signal, the acoustic frame reading means 10 also has a function of reading a predetermined number of samples as one acoustic frame from each channel of the second acoustic signal. The frequency conversion unit 20 has a function of generating a frequency-dimensional complex number spectrum by frequency-converting an acoustic frame (hereinafter referred to as a first acoustic frame) read from the wideband acoustic signal by the acoustic frame reading unit 10 by Fourier transformation or the like. Have. When embedding the second acoustic signal, the frequency converting means 20 converts the frequency of the acoustic frame read from the second acoustic signal by the acoustic frame reading means 10 (hereinafter referred to as the second acoustic frame) by Fourier transformation or the like. It also has the function of generating a dimensional complex spectrum. The frequency component modifying means 30 has a function of modifying the spectrum obtained from the first acoustic frame. When embedding the second acoustic signal, the frequency component modifying means 30 has a function of modifying the spectrum obtained from the first acoustic frame while referring to the spectrum obtained from the second acoustic frame. The frequency inverse transform means 40 has a function of generating a time-order modified acoustic frame by performing frequency inverse transform on a plurality of complex spectra including the modified spectrum set. The modified acoustic frame correcting unit 45 has a function of correcting the modified acoustic frame obtained by the frequency inverse converting unit 40. The modified sound frame output means 50 has a function of sequentially outputting the generated modified sound frames.

記憶手段60は、第2音響信号を埋め込む場合は第2音響信号を含めて第1音響信号を記憶した音響信号記憶部61と、改変音響信号を記憶する改変音響信号記憶部62を有しており、その他処理に必要な各種情報を記憶するものである。   The storage unit 60 includes an acoustic signal storage unit 61 that stores the first acoustic signal including the second acoustic signal when the second acoustic signal is embedded, and a modified acoustic signal storage unit 62 that stores the modified acoustic signal. In addition, various other information necessary for processing is stored.

図4に示した各構成手段は、現実には図3に示したように、コンピュータおよびその周辺機器等のハードウェアに専用のプログラムを搭載することにより実現される。すなわち、コンピュータが、専用のプログラムに従って各手段の内容を実行することになる。   Each component shown in FIG. 4 is actually realized by installing a dedicated program in hardware such as a computer and its peripheral devices as shown in FIG. That is, the computer executes the contents of each means according to a dedicated program.

図3の記憶装置3には、CPU1を動作させ、コンピュータを、音響信号に対する異なる音響信号の埋め込み装置として機能させるための専用のプログラムが実装されている。この専用のプログラムを実行することにより、CPU1は、アップサンプリング手段8、音響フレーム読込手段10、周波数変換手段20、周波数成分改変手段30、周波数逆変換手段40、改変音響フレーム補正手段45、改変音響フレーム出力手段50としての機能を実現することになる。また、記憶装置3は、記憶手段60としての機能を実現する他、処理に必要な様々なデータを記憶する。   In the storage device 3 of FIG. 3, a dedicated program for operating the CPU 1 and causing the computer to function as a device for embedding different acoustic signals with respect to the acoustic signals is installed. By executing this dedicated program, the CPU 1 performs upsampling means 8, acoustic frame reading means 10, frequency conversion means 20, frequency component modification means 30, frequency inverse conversion means 40, modified sound frame correction means 45, modified sound. The function as the frame output means 50 is realized. In addition to realizing the function as the storage unit 60, the storage device 3 stores various data necessary for processing.

(2.2.埋め込み装置の処理動作)
(2.2.1.第1の実施形態)
以下、本発明に係る音響信号に対する第2の音響信号の埋め込み装置および妨害音の埋め込み装置の処理動作について説明する。図5は、本発明第1の実施形態に係る音響信号に対する第2の音響信号の埋め込み装置の処理動作を示すフローチャートである。第1音響信号、第2音響信号としては、サンプリング周波数Fsとして96kHz、48kHz(映画など映像・放送業務用)または44.1kHz(CDなど民生用)でサンプリングしたものを用いることができるが、本実施形態では、48kHzでサンプリングしたものを用いる。また、本実施形態では、折り返しの中心となる周波数Ft=Fs/2とする。
(2.2. Processing operation of embedded device)
(2.2.1. First embodiment)
The processing operation of the second acoustic signal embedding device and the disturbing sound embedding device for the acoustic signal according to the present invention will be described below. FIG. 5 is a flowchart showing the processing operation of the second acoustic signal embedding device for the acoustic signal according to the first embodiment of the present invention. As the first acoustic signal and the second acoustic signal, those sampled at 96 kHz, 48 kHz (for video / broadcasting business such as movies) or 44.1 kHz (for consumer use such as CD) as the sampling frequency Fs can be used. In the embodiment, one sampled at 48 kHz is used. In the present embodiment, the frequency Ft = Fs / 2, which is the center of folding, is used.

まず、アップサンプリング手段8が、音響信号記憶部61に記憶されたステレオの第1音響信号の左右の各チャンネルに対して、元のサンプリング周波数よりもサンプリング周波数を上げてサンプリングを行う処理、すなわち、アップサンプリングを行う(ステップS1)。どの程度サンプリング周波数を上げるかについては、適宜設定しておくことが可能であるが、本実施形態では、元の第1音響信号のサンプリング周波数48kHzを、サンプリング周波数96kHzにアップサンプリングする。具体的には、アップサンプリング手段8は、音響信号記憶部61に記憶された各チャンネルの総サンプル数S個の第1音響信号xl、xrに対して、以下の〔数式1〕に従った処理を実行する。   First, the upsampling means 8 performs sampling by raising the sampling frequency higher than the original sampling frequency for the left and right channels of the stereo first acoustic signal stored in the acoustic signal storage unit 61, that is, Upsampling is performed (step S1). Although how much the sampling frequency is increased can be set as appropriate, in the present embodiment, the sampling frequency of 48 kHz of the original first acoustic signal is up-sampled to the sampling frequency of 96 kHz. Specifically, the up-sampling means 8 performs processing according to the following [Formula 1] on the first acoustic signals xl and xr of the total number of samples S of each channel stored in the acoustic signal storage unit 61. Execute.

〔数式1〕
xl´(s)=xl(s・48/96)
xr´(s)=xr(s・48/96)
[Formula 1]
xl ′ (s) = xl (s · 48/96)
xr ′ (s) = xr (s · 48/96)

上記〔数式1〕において、s=0,・・・,S´−1であり、S´=S・96/48である。上記〔数式1〕に従った処理を実行した結果、各チャンネルのサンプル数S個の音響信号が、各チャンネルのサンプル数S´個の広帯域音響信号にアップサンプリングされる。元の音響信号xl、xrに存在しないサンプルについては、近傍のサンプルの値を用いて補間する。   In the above [Expression 1], s = 0,..., S′−1, and S ′ = S · 96/48. As a result of executing the processing according to the above [Equation 1], the acoustic signal with the number of samples S for each channel is up-sampled into a broadband acoustic signal with the number of samples S 'for each channel. For samples that do not exist in the original acoustic signals xl and xr, interpolation is performed using the values of neighboring samples.

音響フレーム読込手段10は、アップサンプリングされたステレオの広帯域音響信号の左右の各チャンネルから、それぞれ所定数Nのサンプルを1つの音響フレームとして読み込む(ステップS2)。同様に、音響フレーム読込手段10は、音響信号記憶部61に記憶されたステレオの第2音響信号の左右の各チャンネルから、それぞれ所定数Mのサンプルを1つの第2音響フレームとして読み込む(ステップS3)。   The acoustic frame reading means 10 reads a predetermined number N of samples as one acoustic frame from each of the left and right channels of the upsampled stereo broadband acoustic signal (step S2). Similarly, the acoustic frame reading means 10 reads a predetermined number M of samples as one second acoustic frame from the left and right channels of the stereo second acoustic signal stored in the acoustic signal storage unit 61 (step S3). ).

音響フレーム読込手段10が読み込む1つの第1音響フレームのサンプル数N、第2音響フレームのサンプル数Mは、適宜設定することができるが、本実施形態では、以下、N=8192、M=4096の場合について説明する。したがって、音響フレーム読込手段10は、広帯域音響信号から左チャンネル、右チャンネルについてそれぞれ8192サンプルずつ、順次第1音響フレームとして読み込み、第2音響信号から左チャンネル、右チャンネルについてそれぞれ4096サンプルずつ、順次第2音響フレームとして読み込んでいくことになる。   The number of samples N of one first sound frame and the number of samples M of a second sound frame read by the sound frame reading means 10 can be set as appropriate, but in this embodiment, hereinafter, N = 8192, M = 4096. The case will be described. Therefore, the sound frame reading means 10 sequentially reads 8192 samples for each of the left channel and the right channel from the wideband sound signal as the first sound frame, and sequentially stores 4096 samples for the left channel and the right channel from the second sound signal. It will be read as 2 sound frames.

本実施形態では、第1音響フレーム、第2音響フレームともに、奇数番目の音響フレーム、偶数番目の音響フレームは、互いに所定数(本実施形態ではN/2=4096、M/2=2048)のサンプルを重複して設定される。したがって、第2音響フレームの場合、奇数番目の音響フレームを先頭からA1、A2、A3…とし、偶数番目の音響フレームを先頭からB1、B2、B3…とすると、A1はサンプル1〜4096、A2はサンプル4097〜8192、A3はサンプル8193〜12288、B1はサンプル2049〜6144、B2はサンプル6145〜10240、B3はサンプル10241〜14336となる。なお、重複させるサンプル数は適宜設定することが可能である。   In the present embodiment, both the first and second sound frames have a predetermined number of odd-numbered sound frames and even-numbered sound frames (N / 2 = 4096 and M / 2 = 2048 in the present embodiment). Duplicate samples are set. Therefore, in the case of the second sound frame, if the odd-numbered sound frames are A1, A2, A3... From the top, and the even-numbered sound frames are B1, B2, B3. Are samples 4097 to 8192, A3 is samples 8193 to 12288, B1 is samples 2049 to 6144, B2 is samples 6145 to 10240, and B3 is samples 10241 to 14336. Note that the number of samples to be overlapped can be set as appropriate.

次に、周波数変換手段20が、第1音響フレームに対して周波数変換を行って、その第1音響フレームの複素数のスペクトルを得る(ステップS4)。同様に、周波数変換手段20が、第2音響フレームに対して周波数変換を行って、その第2音響フレームの複素数のスペクトルを得る(ステップS5)。ステップS4、S5では、具体的には、窓関数を利用して周波数変換を行う。周波数変換としては、フーリエ変換、ウェーブレット変換その他公知の種々の手法を用いることができるが、複素数のスペクトルを得られる手法である必要がある。本実施形態では、フーリエ変換を用いた場合を例にとって説明する。   Next, the frequency conversion means 20 performs frequency conversion on the first sound frame to obtain a complex spectrum of the first sound frame (step S4). Similarly, the frequency conversion means 20 performs frequency conversion on the second sound frame to obtain a complex spectrum of the second sound frame (step S5). In steps S4 and S5, specifically, frequency conversion is performed using a window function. As the frequency transform, various known methods such as Fourier transform, wavelet transform and the like can be used, but it is necessary to be a method capable of obtaining a complex spectrum. In the present embodiment, a case where Fourier transform is used will be described as an example.

一般に、所定の信号に対してフーリエ変換を行う場合、信号を所定の長さに区切って行う必要があるが、この場合、区切った信号に対してそのまま矩形窓でフーリエ変換を行うと、区切った境界部に基づく擬似高調波成分が発生する。そこで、一般にフーリエ変換を行う場合には、ハニング窓と呼ばれる窓関数を用いて、窓境界部の値を減衰変化させた後、変化後の値に対してフーリエ変換を実行する。   In general, when Fourier transform is performed on a predetermined signal, it is necessary to divide the signal into predetermined lengths. In this case, if Fourier transform is performed on the divided signal as it is in a rectangular window, the division is performed. A pseudo-harmonic component based on the boundary is generated. Therefore, in general, when Fourier transform is performed, the value of the window boundary is attenuated and changed using a window function called a Hanning window, and then the Fourier transform is performed on the changed value.

本実施形態においても、ハニング窓関数W(i)、W2(i)を利用している。ハニング窓関数W(i)、W2(i)は、中央の所定のサンプル番号iの位置において最大値1をとり、両端付近のサンプル番号iの位置において最小値0をとるように設定されている。本実施形態では、各第1音響フレームについてのフーリエ変換は、以下の〔数式2〕で定義されるハニング窓関数W(i)を乗じたものに対して行われることになる。また、各第2音響フレームについてのフーリエ変換は、以下の〔数式3〕で定義されるハニング窓関数W2(i)を乗じたものに対して行われることになる。   Also in this embodiment, Hanning window functions W (i) and W2 (i) are used. The Hanning window functions W (i) and W2 (i) are set to take a maximum value 1 at the position of the predetermined sample number i in the center and take a minimum value 0 at the positions of the sample numbers i near both ends. . In this embodiment, the Fourier transform for each first acoustic frame is performed on the product multiplied by the Hanning window function W (i) defined by the following [Equation 2]. Further, the Fourier transform for each second acoustic frame is performed on a product multiplied by the Hanning window function W2 (i) defined by the following [Equation 3].

〔数式2〕
W(i)=0.5−0.5cos(2πi/N)
[Formula 2]
W (i) = 0.5−0.5 cos (2πi / N)

〔数式3〕
W2(i)=0.5−0.5cos(2πi/M)
[Formula 3]
W2 (i) = 0.5−0.5 cos (2πi / M)

本実施形態においては、第1音響フレーム、第2音響フレームいずれについても、奇数番目の音響フレームと偶数番目の音響フレームを、所定サンプルずつ重複して読み込む。したがって、周波数成分の改変を行った後、音響信号の状態に復元する際、窓関数を乗じた奇数番目の音響フレームと、窓関数を乗じた偶数番目の音響フレームの重複サンプルを加算した場合に、ほぼ元の値に戻るようにしなければならない。このため、奇数番目の音響フレームと偶数番目の音響フレームの重複部分において、窓関数W(i)、W2(i)を加算すると、全区間固定値1になるように定義される必要がある。   In the present embodiment, the odd-numbered sound frame and the even-numbered sound frame are read in duplicate by predetermined samples for both the first sound frame and the second sound frame. Therefore, when the frequency component is modified and then restored to the state of the acoustic signal, when an odd-numbered acoustic frame multiplied by the window function and an overlapping sample of the even-numbered acoustic frame multiplied by the window function are added Should return to almost the original value. For this reason, when the window functions W (i) and W2 (i) are added in the overlapping portion between the odd-numbered acoustic frames and the even-numbered acoustic frames, it is necessary to define the whole section fixed value 1.

周波数変換手段20が、第1音響フレームに対してフーリエ変換を行う場合は、左チャンネル信号Xl(i)、右チャンネル信号Xr(i)(i=0,…,N−1)に対して、窓関数W(i)を用いて、以下の〔数式4〕に従った処理を行い、左チャンネルに対応する変換データの実部Al(j)、虚部Bl(j)、右チャンネルに対応する変換データの実部Ar(j)、虚部Br(j)を得る。   When the frequency conversion unit 20 performs Fourier transform on the first sound frame, for the left channel signal Xl (i) and the right channel signal Xr (i) (i = 0,..., N−1), The window function W (i) is used to perform processing according to the following [Equation 4] and correspond to the real part Al (j), the imaginary part Bl (j), and the right channel of the conversion data corresponding to the left channel. Real part Ar (j) and imaginary part Br (j) of the conversion data are obtained.

〔数式4〕
Al(j)=Σi=0,…,N-1W(i)・Xl(i)・cos(2πij/N)
Bl(j)=Σi=0,…,N-1W(i)・Xl(i)・sin(2πij/N)
Ar(j)=Σi=0,…,N-1W(i)・Xr(i)・cos(2πij/N)
Br(j)=Σi=0,…,N-1W(i)・Xr(i)・sin(2πij/N)
[Formula 4]
Al (j) = Σ i = 0,..., N-1 W (i) · Xl (i) · cos (2πij / N)
Bl (j) = Σi = 0,..., N-1 W (i) · Xl (i) · sin (2πij / N)
Ar (j) = Σi = 0,..., N-1 W (i) · Xr (i) · cos (2πij / N)
Br (j) = Σi = 0,..., N-1 W (i) · Xr (i) · sin (2πij / N)

上記〔数式4〕において、iは、各音響フレーム内のN個のサンプルに付した通し番号であり、i=0,1,2,…N−1の整数値をとる。また、jは周波数の値について、値の小さなものから順に付した通し番号であり、iと同様にj=0,1,2,…N/2−1の整数値をとる。サンプリング周波数が96kHz、N=8192の場合、jの値が1つ異なると、周波数が約11.7Hz異なることになる。   In the above [Expression 4], i is a serial number assigned to N samples in each acoustic frame, and takes an integer value of i = 0, 1, 2,... N−1. Further, j is a serial number assigned in order from the smallest value of the frequency value, and takes an integer value of j = 0, 1, 2,... N / 2-1 like i. When the sampling frequency is 96 kHz and N = 8192, if the value of j is different by one, the frequency will be different by about 11.7 Hz.

周波数変換手段20が、第2音響フレームに対してフーリエ変換を行う場合は、左チャンネル信号X2l(i)、右チャンネル信号X2r(i)(i=0,…,M−1)に対して、窓関数W(i)を用いて、以下の〔数式5〕に従った処理を行い、左チャンネルに対応する変換データの実部A2l(j)、虚部Bl(j)、右チャンネルに対応する変換データの実部A2r(j)、虚部Br(j)を得る。   When the frequency conversion means 20 performs the Fourier transform on the second sound frame, for the left channel signal X2l (i) and the right channel signal X2r (i) (i = 0,..., M−1) The window function W (i) is used to perform processing according to the following [Formula 5], and corresponding to the real part A2l (j), imaginary part Bl (j), and right channel of the conversion data corresponding to the left channel. Real part A2r (j) and imaginary part Br (j) of the conversion data are obtained.

〔数式5〕
A2l(j)=Σi=0,…,N-1W(i)・X2l(i)・cos(2πij/M)
B2l(j)=Σi=0,…,N-1W(i)・X2l(i)・sin(2πij/M)
A2r(j)=Σi=0,…,N-1W(i)・X2r(i)・cos(2πij/M)
B2r(j)=Σi=0,…,N-1W(i)・X2r(i)・sin(2πij/M)
[Formula 5]
A2l (j) = Σi = 0,..., N-1 W (i) .X2l (i) .cos (2πij / M)
B2l (j) = Σi = 0,..., N-1 W (i) .X2l (i) .sin (2πij / M)
A2r (j) = Σi = 0,..., N-1 W (i) .X2r (i) .cos (2πij / M)
B2r (j) = Σi = 0,..., N-1 W (i) .X2r (i) .sin (2πij / M)

上記〔数式4〕〔数式5〕において、iは、各音響フレーム内のM個のサンプルに付した通し番号であり、i=0,1,2,…M−1の整数値をとる。また、jは周波数の値について、値の小さなものから順に付した通し番号であり、iと同様にj=0,1,2,…M/2−1の整数値をとる。サンプリング周波数が48kHz、M=4096の場合、jの値が1つ異なると、周波数が約11.7Hz異なることになる。   In the above [Expression 4] and [Expression 5], i is a serial number assigned to M samples in each acoustic frame, and takes an integer value of i = 0, 1, 2,... M−1. Further, j is a serial number assigned to the frequency values in ascending order, and takes an integer value of j = 0, 1, 2,... M / 2-1 as with i. When the sampling frequency is 48 kHz and M = 4096, if the value of j is different by one, the frequency will be different by about 11.7 Hz.

ステップS4、S5においてそれぞれ上記〔数式4〕〔数式5〕に従った処理を実行することにより、各第1音響フレーム、第2音響フレームに対応する複素数のスペクトルが得られる。続いて、周波数成分改変手段30が、ステップS6、S7において周波数成分の改変を行う。周波数成分改変手段30は、第1の周波数成分改変手段、第2の周波数成分改変手段として区分することができ、第1の周波数成分改変手段がステップS6の処理、第2の周波数成分改変手段がステップS7の処理を行う。まず、周波数成分改変手段30は、第1音響フレームから得られた第1スペクトルを用いて、高域に低域打消し成分を追加する処理を行う(ステップS6)。具体的には、第1スペクトルの成分を正負反転させ、周波数Fs/2を中心に折り返す処理を行う。   In steps S4 and S5, the processes according to the above [Equation 4] and [Equation 5] are executed, whereby complex spectra corresponding to the first and second acoustic frames are obtained. Subsequently, the frequency component modifying means 30 modifies the frequency component in steps S6 and S7. The frequency component modification unit 30 can be classified as a first frequency component modification unit and a second frequency component modification unit. The first frequency component modification unit performs the process of step S6, and the second frequency component modification unit includes the second frequency component modification unit. The process of step S7 is performed. First, the frequency component modification means 30 performs a process of adding a low frequency cancellation component to a high frequency using the first spectrum obtained from the first acoustic frame (step S6). Specifically, the first spectrum component is inverted between positive and negative, and a process of turning around the frequency Fs / 2 is performed.

ステップS6における低域打消し成分の追加処理を行ったら、次に、周波数成分改変手段30は、低域打消し成分の追加処理後の第1スペクトルと第2スペクトルの合成を行う(ステップS7)。第2スペクトルについては、周波数Fs/2を中心に折り返しながら加算する。この結果、第1スペクトル(合成スペクトル)は、図2(c)に示すような状態となる。合成後の第1スペクトル(改変音響信号のスペクトル)においては、周波数Fs/2より大きい範囲において、元の第1スペクトルに存在した信号成分を振幅反転したものと、第2スペクトルの信号成分が、折り返された状態で存在することになる。   Once the low frequency cancellation component addition processing in step S6 has been performed, the frequency component modification means 30 then combines the first spectrum and the second spectrum after the low frequency cancellation component addition processing (step S7). . The second spectrum is added while folding around the frequency Fs / 2. As a result, the first spectrum (synthetic spectrum) is in a state as shown in FIG. In the first spectrum after synthesis (the spectrum of the modified acoustic signal), a signal component obtained by inverting the amplitude of the signal component existing in the original first spectrum and a signal component of the second spectrum in a range larger than the frequency Fs / 2, It exists in a folded state.

図2(c)の例では、周波数Fs/2〜Fsにおいて、2種のスペクトル成分を重ねて表示しているが、実際には複素ベクトルで加算される。図2(c)に示すように、合成後のスペクトルでは、周波数Fs/2〜Fsにおいて、第1音響信号の振幅反転成分(低域打消し成分)および第2音響信号に由来する成分は双方とも雑音化されて、エネルギーが高い第1音響信号の低域成分にマスキングされるため、改変後の音響信号を再生したとしても、第1音響信号の振幅反転成分および第2音響信号の成分は、人間には聴取されない。   In the example of FIG. 2C, two types of spectral components are superimposed and displayed at frequencies Fs / 2 to Fs, but in reality, they are added as complex vectors. As shown in FIG.2 (c), in the spectrum after a synthesis | combination, in frequency Fs / 2-Fs, the amplitude inversion component (low frequency cancellation component) of a 1st acoustic signal and the component derived from a 2nd acoustic signal are both. Since both are made noise and masked by the low frequency component of the first acoustic signal having high energy, even if the modified acoustic signal is reproduced, the amplitude inversion component of the first acoustic signal and the component of the second acoustic signal are , Not heard by humans.

周波数成分改変手段30が上記ステップS6、S7で行った処理は以下の〔数式6〕としてまとめることができる。   The processing performed by the frequency component modifying means 30 in steps S6 and S7 can be summarized as the following [Equation 6].

〔数式6〕
Al´(j)← −Al(N/2−j)・α+A2l(M−j)・β
Bl´(j)← −Bl(N/2−j)・α+B2l(M−j)・β
Ar´(j)← −Ar(N/2−j)・α+A2r(M−j)・β
Br´(j)← −Br(N/2−j)・α+B2r(M−j)・β
[Formula 6]
Al ′ (j) ← −Al (N / 2−j) · α + A2l (M−j) · β
Bl ′ (j) ← −Bl (N / 2−j) · α + B2l (M−j) · β
Ar ′ (j) ← −Ar (N / 2−j) · α + A2r (M−j) · β
Br ′ (j) ← −Br (N / 2−j) · α + B2r (M−j) · β

周波数成分改変手段30は、周波数成分Al(j)、Bl(j)、A2l(j)、B2l(j)に対して、上記〔数式6〕に従った処理を、j=N/4+1,・・・,N/2−1の各jについて実行する。1音響フレームのサンプル数N=8192、サンプリング周波数Fus=96kHz(=2Fs)の場合、j=N/4は、周波数Fs/2(Fus/4)に対応し、j=N/2は、周波数Fs(Fus/2)に対応する。したがって、〔数式6〕においては、j=2049,・・・,4096が処理対象となり、約24.0kHz(略人間の可聴域上限)〜約47.9kHzの周波数成分が変更される。   The frequency component modifying means 30 performs the processing according to the above [Equation 6] on the frequency components Al (j), Bl (j), A2l (j), B2l (j), j = N / 4 + 1,. .., for each j of N / 2-1. In the case where the number of samples of one acoustic frame N = 8192 and the sampling frequency Fus = 96 kHz (= 2Fs), j = N / 4 corresponds to the frequency Fs / 2 (Fus / 4), and j = N / 2 is the frequency Corresponds to Fs (Fus / 2). Therefore, in [Formula 6], j = 2049,..., 4096 is a processing target, and the frequency component of about 24.0 kHz (approximately the upper limit of the human audible range) to about 47.9 kHz is changed.

上記〔数式6〕において、α、βは、0.0<α、β≦1.0の範囲で設定されるスケーリング実数値である。本実施形態ではα=β=1.0に設定されている。上記〔数式6〕に示した各式右辺の第1項(−Al(N/2−j)・α等)は第1スペクトルの低域打消し成分であり、各式右辺の第2項(A2l(M−j)・β等)は、第2スペクトルを周波数方向に折り返した成分である。   In the above [Expression 6], α and β are real scaling values set in the range of 0.0 <α and β ≦ 1.0. In the present embodiment, α = β = 1.0 is set. The first term (−Al (N / 2−j) · α, etc.) on the right side of each equation shown in [Formula 6] is a low-frequency canceling component of the first spectrum, and the second term ( A2l (M−j) · β, etc.) is a component obtained by folding the second spectrum in the frequency direction.

図5のフローチャートと上記〔数式6〕の対応関係を示すと、ステップS6における高域に低域打消し成分を追加する処理が、上記〔数式6〕の右辺第1項を加算する処理に対応し、ステップS7における第1スペクトルと第2スペクトルの合成処理が、上記〔数式6〕の右辺第2項を加算する処理に対応することになる。   When the correspondence between the flowchart of FIG. 5 and the above [Equation 6] is shown, the process of adding the low frequency cancellation component to the high frequency in Step S6 corresponds to the process of adding the first term on the right side of the above [Equation 6]. Then, the synthesis process of the first spectrum and the second spectrum in step S7 corresponds to the process of adding the second term on the right side of the above [Equation 6].

周波数成分改変手段30が、ステップS7における合成処理を終えたら、次に、周波数逆変換手段40が、改変後の第1スペクトルを周波数逆変換して改変音響フレームを得る処理を行う(ステップS8)。この周波数逆変換は、当然のことながら、周波数変換手段20が実行した手法に対応していることが必要となる。本実施形態では、周波数変換手段20において、フーリエ変換を施しているため、周波数逆変換手段40は、フーリエ逆変換を実行することになる。   After the frequency component modifying unit 30 finishes the synthesis process in step S7, the frequency inverse transform unit 40 performs a process of performing frequency inverse transform on the modified first spectrum to obtain a modified acoustic frame (step S8). . Naturally, the inverse frequency conversion needs to correspond to the method executed by the frequency conversion means 20. In the present embodiment, since the frequency transform unit 20 performs the Fourier transform, the frequency inverse transform unit 40 executes the Fourier inverse transform.

具体的には、周波数逆変換手段40は、周波数成分改変手段30により得られた第1スペクトルの左チャンネルの実部Al´(j)、虚部Bl´(j)、右チャンネルの実部Ar´(j)、虚部Br´(j)を用いて、以下の〔数式7〕に従った処理を行い、Xl´(i)、Xr´(i)を算出する。なお、周波数成分改変手段30において改変されていない周波数成分については、Al´(j)、Bl´(j)、Ar´(j)、Br´(j)として、それぞれ元の周波数成分であるAl(j)、Bl(j)、Ar(j)、Br(j)を用いる。   Specifically, the frequency inverse transforming means 40 has a real part Al ′ (j), an imaginary part Bl ′ (j) of the left channel of the first spectrum obtained by the frequency component modifying means 30, and a real part Ar of the right channel. Using ′ (j) and imaginary part Br ′ (j), processing according to the following [Equation 7] is performed to calculate Xl ′ (i) and Xr ′ (i). The frequency components that have not been modified by the frequency component modifying means 30 are Al ′ (j), Bl ′ (j), Ar ′ (j), and Br ′ (j), which are the original frequency components, Al. (J), Bl (j), Ar (j), and Br (j) are used.

〔数式7〕
Xl´(i)=1/N・{ΣjAl´(j)・cos(2πij/N)−ΣjBl´(j)・sin(2πij/N)}+Xlp(i+N/2)
Xr´(i)=1/N・{ΣjAr´(j)・cos(2πij/N)−ΣjBr´(j)・sin(2πij/N)}+Xrp(i+N/2)
[Formula 7]
Xl' (i) = 1 / N · {Σ j Al' (j) · cos (2πij / N) -Σ j Bl' (j) · sin (2πij / N)} + Xlp (i + N / 2)
Xr' (i) = 1 / N · {Σ j Ar' (j) · cos (2πij / N) -Σ j Br' (j) · sin (2πij / N)} + Xrp (i + N / 2)

上記〔数式7〕においては、式が繁雑になるのを防ぐため、Σj=0,…,N-1をΣjとして示している。上記〔数式7〕における第1式の“+Xlp(i+N/2)”、第2式の“+Xrp(i+N/2)”の項は、直前に改変された改変音響フレームのデータXlp(i)、Xrp(i)が存在する場合に、時間軸上N/2サンプル分重複することを考慮して加算するためのものである。上記〔数式7〕により改変音響フレームの左チャンネルの各サンプルXl´(i)、右チャンネルの各サンプルXr´(i)、が得られることになる。 In the above [Expression 7], Σ j = 0,..., N−1 is shown as Σ j in order to prevent the expression from becoming complicated. The terms “+ Xlp (i + N / 2)” in the first expression and “+ Xrp (i + N / 2)” in the second expression in the above [Expression 7] are the data Xlp (i) of the modified acoustic frame modified immediately before, When Xrp (i) exists, the addition is performed in consideration of the overlap of N / 2 samples on the time axis. By the above [Equation 7], each sample Xl ′ (i) of the left channel and each sample Xr ′ (i) of the right channel of the modified acoustic frame are obtained.

ステップS8における周波数逆変換の後、得られた改変音響フレームを順次出力して改変音響信号を得ることができる。ステップS8までの処理であっても、実験上は、図2を用いて説明したように、デジタル的に再サンプリングすることにより複製された際に、原音響信号が抑圧され、代わりに第2音響信号の成分が可聴化されることを確認できる。しかし、一般に普及している音響信号加工ツールを用いてデジタル的に再サンプリングを行ったり、複製の際に一般的に利用されるA/D変換器やサンプラーを用いて複製を行うと、前述の所望の効果は殆ど実現できない。その理由は、商用の音響信号加工ツールやサンプラー・録音機器等においては、アンチエイリアシング処理を行うLPF回路が前置されていることが普通で、サンプリング時に指定されたサンプリング周波数の1/2より高域の周波数成分を減衰させてからサンプリングを行うようにし、高域折り返し信号成分による品質劣化を防ぐように対策されているためである。そのため、ステップ8までの処理で埋め込んだ原音響信号を打ち消すための信号成分および第2音響信号を発生させる信号成分が削除されてしまうのが通常である。   After the frequency inversion in step S8, the modified acoustic frames obtained can be sequentially output to obtain the modified acoustic signal. Even in the processing up to step S8, in the experiment, as described with reference to FIG. 2, when the digital sound is duplicated by re-sampling, the original sound signal is suppressed, and the second sound is used instead. It can be confirmed that the component of the signal is audible. However, if digitally re-sampling is performed using a widely used acoustic signal processing tool, or if replication is performed using an A / D converter or sampler generally used for replication, the above-mentioned The desired effect can hardly be realized. The reason for this is that commercial acoustic signal processing tools, samplers, recording devices, etc. usually have an anti-aliasing LPF circuit in front, which is higher than half the sampling frequency specified at the time of sampling. This is because sampling is performed after the frequency component of the frequency band is attenuated, and measures are taken to prevent quality degradation due to the high frequency aliasing signal component. Therefore, the signal component for canceling the original sound signal embedded in the processing up to step 8 and the signal component for generating the second sound signal are usually deleted.

図6は、ステップS8までの処理により得られた改変音響信号が、LPF回路を備えた現実的な装置で複製される場合の概念を示す図である。図6において、図6(a)は図2(c)と同一であり、ステップS8までの処理の結果得られた改変音響信号の信号スペクトルを示す。図6(b)は、LPF(Low Pass Filter)処理によるフィルタゲインを示す。図6(c)は、改変音響信号に対してLPF処理を行った信号の信号スペクトルを示す。図6(d)は、改変音響信号をLPF処理後に再サンプリングして得られた複製音響信号の信号スペクトルを示す。   FIG. 6 is a diagram showing a concept in a case where the modified acoustic signal obtained by the processing up to step S8 is duplicated by a realistic device including an LPF circuit. In FIG. 6, FIG. 6 (a) is the same as FIG. 2 (c), and shows the signal spectrum of the modified acoustic signal obtained as a result of the processing up to step S8. FIG. 6B shows a filter gain obtained by LPF (Low Pass Filter) processing. FIG. 6C shows a signal spectrum of a signal obtained by performing LPF processing on the modified acoustic signal. FIG. 6D shows a signal spectrum of a duplicated sound signal obtained by re-sampling the modified sound signal after LPF processing.

図6(b)に示すように、LPF処理によるフィルタゲインは、周波数Fs/2までは減衰値0[dB]で一定であり、周波数Fs/2前後で急激に下がり、ある程度まで下がったところで最大減衰値に値(−30dBなど)で一定になる。アナログ的な複製処理を行う場合は無論のこと、デジタル的な複製処理を行う場合でもサンプリング周波数の変更を伴う場合には、サンプリングの前処理として通常LPF処理が行われるため、図6(a)に示した改変音響信号は、図6(b)に示したような特性のLPF処理が行われることになる。改変音響信号に対してLPF処理を行った信号は、図6(c)に示したようなものになる。図6(a)と図6(c)を比較するとわかるように、周波数Fs/2以下の元の音響信号に対応する部分はそのまま残り、周波数Fs/2を超える打消し成分、妨害音に対応する成分については、LPFの影響で減衰する。   As shown in FIG. 6B, the filter gain by the LPF processing is constant at an attenuation value of 0 [dB] up to the frequency Fs / 2, decreases sharply around the frequency Fs / 2, and reaches a maximum when it decreases to some extent. The attenuation value is constant at a value (such as −30 dB). Of course, when analog duplication processing is performed, even when digital duplication processing is performed, if the sampling frequency is changed, normal LPF processing is performed as sampling preprocessing. The modified acoustic signal shown in Fig. 6 is subjected to LPF processing having the characteristics shown in Fig. 6B. A signal obtained by performing the LPF process on the modified acoustic signal is as shown in FIG. As can be seen by comparing FIG. 6 (a) and FIG. 6 (c), the part corresponding to the original acoustic signal having the frequency Fs / 2 or less remains as it is, and it corresponds to the cancellation component and the interfering sound exceeding the frequency Fs / 2. The component to be attenuated is affected by the LPF.

さらに、図6(c)に示す信号を、サンプリング周波数Fsで再サンプリングすると、図6(d)に示す複製音響信号が得られる。複製音響信号では、エイリアシングが発生し、減衰した打消し成分、妨害音に対応する成分が、人間の可聴域である周波数Fs/2以下に折り返される。これにより、図6(d)に示すように、複製音響信号の周波数Fs/2以下の範囲には、減衰した打消し成分の影響により、僅かながら減衰した元の音響信号の成分に、減衰した第2音響信号に対応する成分が重畳されることになる。減衰した第2音響信号は、僅かながら減衰したものの残っている元の音響信号の成分によりマスキングされ、ほとんど人間に聴こえなくなり、複製防止効果がなくなる。本実施形態では、複製時にLPF処理が行われた場合にも第2音響信号を聴取可能にするため、以下のステップS9、ステップS10の処理を行う。   Furthermore, when the signal shown in FIG. 6C is resampled at the sampling frequency Fs, the duplicate acoustic signal shown in FIG. 6D is obtained. In the duplicated sound signal, aliasing occurs, and the attenuated canceling component and the component corresponding to the interfering sound are folded back to the frequency Fs / 2 or less which is a human audible range. As a result, as shown in FIG. 6D, in the range of the frequency Fs / 2 or less of the duplicated acoustic signal, the original acoustic signal component attenuated slightly due to the influence of the attenuated cancellation component. A component corresponding to the second acoustic signal is superimposed. The attenuated second acoustic signal is masked by the remaining original acoustic signal component that has been slightly attenuated, but is almost inaudible to humans, and the anti-duplication effect is lost. In the present embodiment, the following steps S9 and S10 are performed so that the second acoustic signal can be heard even when the LPF process is performed at the time of replication.

図7は、ステップS9、ステップS10の処理を示す図である。図7において、図7(a)は図2(c)、図6(a)と同一であり、ステップS8までの処理の結果得られた改変音響信号の信号スペクトルを示す。図7(b)は、図7(a)の改変音響信号を間引き処理した信号の信号スペクトルを示す。図7(c)は、図7(b)を再度アップサンプリングしてサンプリング周波数を元に戻し所定の割合だけ減衰させた信号の信号スペクトルを示す。図7(d)は、図7(a)の改変音響信号に、図7(c)の信号を合成して得られる補正改変音響信号の信号スペクトルを示す。   FIG. 7 is a diagram illustrating the processes in steps S9 and S10. 7A is the same as FIG. 2C and FIG. 6A, and shows the signal spectrum of the modified acoustic signal obtained as a result of the processing up to step S8. FIG. 7B shows a signal spectrum of a signal obtained by thinning out the modified acoustic signal of FIG. FIG. 7C shows a signal spectrum of a signal obtained by up-sampling FIG. 7B again to restore the sampling frequency and attenuate it by a predetermined ratio. FIG. 7D shows the signal spectrum of the corrected modified acoustic signal obtained by synthesizing the signal of FIG. 7C with the modified acoustic signal of FIG.

ステップS8までの処理により得られた図7(a)に示す改変音響信号に対して、間引き・拡大処理を行う(ステップS9)。具体的には、まず、間引き処理として、サンプリング周波数2Fsの改変音響信号を、サンプリング周波数Fsでダウンサンプリングする。サンプリング周波数Fsでダウンサンプリングした信号のスペクトルのイメージは図7(b)に示したようなものとなる。ダウンサンプリング手法としては、サンプルを単純に1つ置きに間引く方法をとり、平均値をとるようなダウンサプリング手法(LPF作用が働くため)を用いない。   Thinning / enlarging processing is performed on the modified acoustic signal shown in FIG. 7A obtained by the processing up to step S8 (step S9). Specifically, first, as a thinning process, a modified acoustic signal having a sampling frequency of 2Fs is down-sampled at the sampling frequency Fs. An image of the spectrum of the signal down-sampled at the sampling frequency Fs is as shown in FIG. As the down-sampling method, a method of simply thinning out every other sample is taken, and a down-sampling method (because the LPF action works) that takes an average value is not used.

さらに、間引き処理した信号の周波数方向への拡大処理を行う。具体的には、間引き処理したサンプリング周波数Fsの信号を、サンプリング周波数2Fsでアップサンプリングする。アップサンプリング手法としては、隣接サンプルをそのまま用いて補間する方法をとり、隣接サンプル間の平均値で補間するようなアップサプリング手法(LPF作用が働くため)を用いない。サンプリング周波数2Fsでアップサンプリングした後、周波数Fs/2を超える成分を除去した信号のスペクトルのイメージは図7(c)に示したようなものとなる。   Further, an expansion process in the frequency direction of the thinned signal is performed. Specifically, the sampling frequency Fs signal subjected to the thinning process is up-sampled at the sampling frequency 2Fs. As an up-sampling method, an interpolation method using adjacent samples as they are is taken, and an up-sampling method (because of the LPF action) that interpolates with an average value between adjacent samples is not used. After up-sampling at the sampling frequency 2Fs, the image of the spectrum of the signal from which components exceeding the frequency Fs / 2 are removed is as shown in FIG.

続いて、間引き・拡大処理後の信号に重み付けを行って改変音響信号に合成する処理を行う(ステップS10)。すなわち、図7(a)に示した改変音響信号に、図7(c)に示したように所定の割合だけ減衰させた信号を加算する。この結果、図7(d)に示すような補正された改変音響信号が得られる。具体的には、改変音響信号の周波数Fs/2以下の成分に、間引き・拡大処理・振幅減衰処理後の信号成分が加算されることになる。   Subsequently, the signal after the thinning / enlarging process is weighted and synthesized with the modified acoustic signal (step S10). That is, a signal attenuated by a predetermined ratio as shown in FIG. 7C is added to the modified acoustic signal shown in FIG. As a result, a corrected modified acoustic signal as shown in FIG. 7D is obtained. Specifically, the signal component after the thinning / enlargement process / amplitude attenuation process is added to the component of the modified acoustic signal having a frequency of Fs / 2 or less.

改変音響信号補正手段55が上記ステップS9、S10で行った処理は以下の〔数式8〕として、まとめることができる。   The processing performed by the modified acoustic signal correcting means 55 in steps S9 and S10 can be summarized as the following [Equation 8].

〔数式8〕
Xl´(k・2+1)← Xl´(k・2)・Gl+Xl´(k・2+1)・(1−Gl)
Xr´(k・2+1)← Xr´(k・2)・Gr+Xr´(k・2+1)・(1−Gr)
[Formula 8]
Xl ′ (k · 2 + 1) ← Xl ′ (k · 2) · Gl + Xl ′ (k · 2 + 1) · (1-Gl)
Xr ′ (k · 2 + 1) ← Xr ′ (k · 2) · Gr + Xr ′ (k · 2 + 1) · (1-Gr)

上記〔数式8〕は、改変音響信号の奇数番号のサンプル値のみを直前の偶数番号のサンプル値を所定の割合だけ僅かに加算するような補正を施している。具体的には、左辺は改変音響信号の補正対象の奇数番号のサンプル値であり、右辺第1項は、改変音響信号の補正対象の直前の偶数番号のサンプル値に重みGlまたはGrを乗じたもの、右辺第2項は、改変音響信号の補正対象の奇数番号のサンプル値に重み(1−Gl)または(1−Gr)を乗じたものである。重みGl、Grは、以下の〔数式9〕に従った処理により算出される。   In the above [Equation 8], only the odd-numbered sample values of the modified acoustic signal are corrected to slightly add the previous even-numbered sample values by a predetermined ratio. Specifically, the left side is the odd-numbered sample value to be corrected for the modified acoustic signal, and the first term on the right side is the weighted G1 or Gr multiplied by the even-numbered sample value immediately before the modified acoustic signal to be corrected. The second term on the right-hand side is obtained by multiplying the odd-numbered sample value to be corrected by the modified acoustic signal by the weight (1-Gl) or (1-Gr). The weights Gl and Gr are calculated by processing according to the following [Equation 9].

〔数式9〕
Gl=0.2・Σi=0,…,N-1|Xl´(i)|/N/32768
Gr=0.2・Σi=0,…,N-1|Xr´(i)|/N/32768
[Formula 9]
Gl = 0.2 · Σi = 0,..., N−1 | Xl ′ (i) | / N / 32768
Gr = 0.2 · Σ i = 0,..., N−1 | Xr ′ (i) | / N / 32768

上記〔数式9〕において、0.2を乗じているのは、平均的にそのサンプルの80%を残し、20%を隣接するサンプルから得るためであり、適宜変更可能な値であるが、0.2程度が望ましい。ただし、このような改変を施しても聴覚マスキング効果を用いて聴取されないようにするため、改変音響信号の平均的レベルにより、重みGl、Grを0.2を中心に増減させている。上記〔数式9〕の最後において、32768を除しているのは、Gl、Grを0〜1の範囲に正規化するためのものである。   In the above [Equation 9], the multiplication by 0.2 is to leave 80% of the sample on average and to obtain 20% from the adjacent sample, which is a value that can be changed as appropriate. About 2 is desirable. However, in order to prevent hearing using the auditory masking effect even if such modification is applied, the weights Gl and Gr are increased or decreased around 0.2 based on the average level of the modified acoustic signal. The reason why 32768 is divided at the end of [Formula 9] is to normalize Gl and Gr to the range of 0-1.

改変音響フレーム出力手段50は、改変音響信号補正手段55の処理により得られた補正後の改変音響フレームを順次出力ファイルに出力する。上記図5のフローチャートに示した処理は、広帯域音響信号の全ての第1音響フレームに対して実行される。第1音響フレームの数が、第2音響フレームの数より多い場合は、先頭の第2音響フレームに戻って繰り返し処理を行う。このようにして全ての第1音響フレームに対して処理を行った結果、改変音響フレームの集合である改変音響信号が、改変音響信号記憶部62に記憶される。本実施形態では、第1音響信号の先頭から最後まで第2音響信号を埋め込むようにしたが、埋め込む位置を設定して、その範囲にだけ埋め込むようにすることも可能である。   The modified sound frame output unit 50 sequentially outputs the modified sound frames after correction obtained by the processing of the modified sound signal correction unit 55 to the output file. The process shown in the flowchart of FIG. 5 is executed for all the first sound frames of the wideband sound signal. When the number of the first sound frames is larger than the number of the second sound frames, the process returns to the first second sound frame and is repeated. As a result of performing processing on all the first sound frames in this way, a modified sound signal that is a set of modified sound frames is stored in the modified sound signal storage unit 62. In the present embodiment, the second acoustic signal is embedded from the beginning to the end of the first acoustic signal. However, it is also possible to set an embedding position and embed only in that range.

図8は、ステップS10までの処理により得られた改変音響信号が、LPF回路を備えた現実的な装置で複製される場合の概念を示す図である。図8において、図8(a)は、ステップS10までの処理の結果得られた補正後の改変音響信号の信号スペクトルを示す。図8(b)は、図6(b)と同一であり、LPF(Low Pass Filter)処理によるフィルタゲインを示す。図8(c)は、改変音響信号に対してLPF処理を行った信号の信号スペクトルを示す。図8(d)は、改変音響信号をLPF処理後に再サンプリングして得られた複製音響信号の信号スペクトルを示す。   FIG. 8 is a diagram showing a concept in a case where the modified acoustic signal obtained by the processing up to step S10 is duplicated by a realistic device including an LPF circuit. In FIG. 8, FIG. 8A shows a signal spectrum of the modified acoustic signal after correction obtained as a result of the processing up to step S10. FIG. 8B is the same as FIG. 6B and shows the filter gain by LPF (Low Pass Filter) processing. FIG.8 (c) shows the signal spectrum of the signal which performed the LPF process with respect to the modified acoustic signal. FIG. 8D shows a signal spectrum of a duplicated acoustic signal obtained by resampling the modified acoustic signal after LPF processing.

改変音響信号に対してLPF処理を行った信号は、図8(c)に示したようなものになる。図8(a)と図8(c)を比較するとわかるように、周波数Fs/2以下の元の音響信号に対応する部分、間引き・拡大処理した成分はそのまま残り、周波数Fs/2を超える原音響信号の打消し成分、第2音響信号に対応する成分については、LPFの影響で減衰する。   A signal obtained by performing the LPF process on the modified acoustic signal is as shown in FIG. As can be seen by comparing FIG. 8 (a) and FIG. 8 (c), the portion corresponding to the original acoustic signal having a frequency of Fs / 2 or lower, and the thinned / enlarged component remain as they are, and the original exceeding the frequency Fs / 2 remains. The canceling component of the acoustic signal and the component corresponding to the second acoustic signal are attenuated by the influence of the LPF.

さらに、図8(c)に示す信号を、サンプリング周波数Fsで再サンプリングすると、図8(d)に示す複製音響信号が得られる。複製音響信号では、エイリアシングが発生し、減衰した原音響信号の打消し成分、第2音響信号に対応する成分が、人間の可聴域である周波数Fs/2以下に折り返される。これにより、図8(d)に示すように、複製音響信号の周波数Fs/2以下の範囲には、間引き・拡大処理した成分に減衰した原音響信号の打消し成分と第2音響信号に対応する成分が重畳され、これらは互いに同相であるため強め合い、結果的に減衰した原音響信号の打消し成分と第2音響信号に対応する成分が増強される。即ち、マスカーである原音響信号の抑圧効果が高まるとともに、マスキーである第2音響信号のレベルが高まり、聴覚マスキング効果は働かなくなり、第2音響信号が人間に聴こえる。警告メッセージ等の第2音響信号が音楽に重ねて聴こえると、客観的に違法コピーであることが判明するとともに、本来の状態で音楽を鑑賞することができず、商品化することができない。このため、複製に対する抑止力が働くことになる。   Further, when the signal shown in FIG. 8C is resampled at the sampling frequency Fs, a duplicate acoustic signal shown in FIG. 8D is obtained. In the duplicate sound signal, aliasing occurs, and the canceling component of the attenuated original sound signal and the component corresponding to the second sound signal are folded back to a frequency Fs / 2 or less that is a human audible range. As a result, as shown in FIG. 8 (d), in the range below the frequency Fs / 2 of the duplicate acoustic signal, the cancellation component of the original acoustic signal attenuated to the thinned and enlarged component and the second acoustic signal are supported. Since these components are in phase with each other, they are strengthened, and as a result, the component that corresponds to the cancellation component of the attenuated original sound signal and the second sound signal is enhanced. That is, the suppression effect of the original acoustic signal that is a masker increases, the level of the second acoustic signal that is a masky increases, the auditory masking effect does not work, and the second acoustic signal can be heard by humans. If the second acoustic signal such as a warning message is heard over the music, it is objectively found to be an illegal copy, and the music cannot be appreciated in its original state and cannot be commercialized. For this reason, deterrence against replication works.

また、改変音響信号に対して複製する際のサンプリング周波数がFsより若干小さくFs/2より大きいFs´の場合でも、同様にエイリアシングが発生し、周波数Fs´/2〜Fs´の信号成分は反転してFs´/2以下の周波数帯に重畳される。即ち、図8(a)の右半分より左端が左側にずれて、図8(a)の右半分より帯域幅が狭い信号成分が図8(c)の左半分より右端が左側にずれた位置に折り返される。この複製音響信号を再生すると、原音響信号は中途半端な打ち消しがなされ、第2音響信号に記録された音と同等の音が発せられることは期待できないが、歪みやかなりの雑音を伴って原音響信号の打ち消し成分や第2音響信号に基づく音が人間の耳に明瞭に聴取されることになる。この場合でも、鑑賞に堪える再生音を得ることができなくなるという目的は達成できるため、複製を抑止することが可能となる。更に、改変音響信号に対して複製する際のサンプリング周波数がFs/2より小さい場合には、顕著なエイリアシングが発生して原音響信号自身の主要信号成分が破壊され鑑賞に堪える再生音を得ることができなくなる。逆に、改変音響信号に対して複製する際のサンプリング周波数がFsより若干大きく3Fs/2より小さいFs´の場合でも、同様にエイリアシングが発生し、周波数Fs´/2〜Fs´の信号成分は反転してFs´/2以下の周波数帯に重畳される。   Further, even when the sampling frequency when replicating the modified acoustic signal is Fs ′ slightly smaller than Fs and larger than Fs / 2, aliasing similarly occurs, and the signal components of the frequencies Fs ′ / 2 to Fs ′ are inverted. And superimposed on a frequency band of Fs ′ / 2 or less. That is, the left end of the right half of FIG. 8A is shifted to the left, and the signal component having a narrower bandwidth than the right half of FIG. 8A is shifted to the left of the right end of the left half of FIG. Wrapped to When this duplicated sound signal is reproduced, the original sound signal is canceled halfway, and it cannot be expected that a sound equivalent to the sound recorded in the second sound signal will be emitted, but the original sound signal is accompanied by distortion and considerable noise. The sound based on the canceling component of the acoustic signal or the second acoustic signal is clearly heard by the human ear. Even in this case, the purpose of not being able to obtain reproduced sound that can be enjoyed for viewing can be achieved, so that duplication can be suppressed. Furthermore, when the sampling frequency when replicating the modified sound signal is smaller than Fs / 2, significant aliasing occurs, and the main signal component of the original sound signal itself is destroyed to obtain a reproduced sound that can be appreciated. Can not be. Conversely, even when the sampling frequency when replicating the modified acoustic signal is Fs ′ slightly larger than Fs and smaller than 3 Fs / 2, aliasing similarly occurs, and the signal components of the frequencies Fs ′ / 2 to Fs ′ are Inverted and superimposed on the frequency band below Fs ′ / 2.

即ち、図8(a)の右半分より右端が右側にずれて、図8(a)の右半分より帯域幅が広い信号成分が図8(c)の左半分より右端が右側にずれた位置に折り返される。この複製音響信号を再生すると、原音響信号は中途半端な打ち消しがなされ、第2音響信号に記録された音と同等の音が発せられることは期待できないが、歪みやかなりの雑音を伴って原音響信号の打ち消し成分や第2音響信号に基づく音が人間の耳に明瞭に聴取されることになる。この場合でも、鑑賞に堪える再生音を得ることができなくなるという目的は達成できるため、複製を抑止することが可能となる。しかし、3Fs/2より大きい場合には、エイリアシングが殆ど発生せず、原音響信号および第2音響信号の品質は維持され、第2音響信号は可聴化されず複製を抑止することはできない。以上のことから、改変音響信号に対して複製する際のサンプリング周波数が3Fs/2より小さい場合には、エイリアシングが発生して。複製を抑止することが可能となる。   That is, the right end of the right half of FIG. 8A is shifted to the right, and the signal component having a wider bandwidth than the right half of FIG. 8A is shifted to the right of the right end of the left half of FIG. Wrapped to When this duplicated sound signal is reproduced, the original sound signal is canceled halfway, and it cannot be expected that a sound equivalent to the sound recorded in the second sound signal will be emitted, but the original sound signal is accompanied by distortion and considerable noise. The sound based on the canceling component of the acoustic signal or the second acoustic signal is clearly heard by the human ear. Even in this case, the purpose of not being able to obtain reproduced sound that can be enjoyed for viewing can be achieved, so that duplication can be suppressed. However, if it is larger than 3Fs / 2, aliasing hardly occurs, the quality of the original sound signal and the second sound signal is maintained, the second sound signal is not made audible, and duplication cannot be suppressed. From the above, aliasing occurs when the sampling frequency when replicating the modified acoustic signal is smaller than 3Fs / 2. It becomes possible to suppress duplication.

(2.2.2.第2の実施形態)
次に、本発明の第2の実施形態である音響信号に対する妨害音の埋め込み装置について説明する。図9は、第2の実施形態に係る音響信号に対する妨害音の埋め込み装置の処理動作を示すフローチャートである。第1の実施形態では、あらかじめ準備しておいた第2の音響信号を用いたが、第2の実施形態では、あらかじめ音源を準備することなく白色雑音など人工的に生成した雑音を埋め込む処理を行う。本実施形態においても、第1の実施形態と同様、第1音響信号は、サンプリング周波数Fsとして48kHzでサンプリングしたものを用いる。また、本実施形態では、折り返しの中心となる周波数Ft=Fs/2とする。
(2.2.2 Second Embodiment)
Next, a description will be given of a disturbance sound embedding device for an acoustic signal according to a second embodiment of the present invention. FIG. 9 is a flowchart showing the processing operation of the interference sound embedding device for the acoustic signal according to the second embodiment. In the first embodiment, the second acoustic signal prepared in advance is used. However, in the second embodiment, processing for embedding artificially generated noise such as white noise without preparing a sound source in advance is performed. Do. Also in the present embodiment, as in the first embodiment, the first acoustic signal is sampled at 48 kHz as the sampling frequency Fs. In the present embodiment, the frequency Ft = Fs / 2, which is the center of folding, is used.

まず、第1の実施形態におけるステップS1と同様、アップサンプリング手段8が、音響信号記憶部61に記憶されたステレオの第1音響信号の左右の各チャンネルに対して、元のサンプリング周波数よりもサンプリング周波数を上げてサンプリングする処理を行う(ステップS11)。本実施形態でも、第1の実施形態と同様、上記〔数式1〕に従った処理を実行し、元の第1音響信号のサンプリング周波数48kHzを、サンプリング周波数96kHzにアップサンプリングする。   First, as in step S1 in the first embodiment, the upsampling means 8 samples the left and right channels of the stereo first acoustic signal stored in the acoustic signal storage unit 61 more than the original sampling frequency. A sampling process is performed by increasing the frequency (step S11). Also in the present embodiment, as in the first embodiment, the processing according to the above [Equation 1] is executed, and the sampling frequency 48 kHz of the original first acoustic signal is upsampled to the sampling frequency 96 kHz.

音響フレーム読込手段10は、アップサンプリングされたステレオの広帯域音響信号の左右の各チャンネルから、それぞれ所定数Nのサンプルを1つの音響フレームとして読み込む(ステップS12)。   The acoustic frame reading means 10 reads a predetermined number N of samples as one acoustic frame from each of the left and right channels of the upsampled stereo broadband acoustic signal (step S12).

音響フレーム読込手段10が読み込む1つの第1音響フレームのサンプル数N、適宜設定することができるが、本実施形態では、以下、N=4096の場合について説明する。したがって、音響フレーム読込手段10は、広帯域音響信号から左チャンネル、右チャンネルについてそれぞれ4096サンプルずつ、順次第1音響フレームとして読み込んでいくことになる。   Although the number N of samples of one first sound frame read by the sound frame reading means 10 can be set as appropriate, in the present embodiment, a case where N = 4096 will be described below. Therefore, the acoustic frame reading means 10 sequentially reads 4096 samples for each of the left channel and the right channel from the broadband acoustic signal as the first acoustic frame.

本実施形態でも、第1の実施形態と同様、奇数番目の音響フレーム、偶数番目の音響フレームは、互いに所定数(本実施形態ではN/2=2048)のサンプルを重複して設定される。したがって、奇数番目の音響フレームを先頭からA1、A2、A3…とし、偶数番目の音響フレームを先頭からB1、B2、B3…とすると、A1はサンプル1〜4096、A2はサンプル4097〜8192、A3はサンプル8193〜12288、B1はサンプル2049〜6144、B2はサンプル6145〜10240、B3はサンプル10241〜14336となる。なお、重複させるサンプル数は適宜設定することが可能である。   Also in the present embodiment, as in the first embodiment, the odd-numbered sound frames and the even-numbered sound frames are set by overlapping a predetermined number of samples (N / 2 = 2048 in the present embodiment). Therefore, if the odd-numbered acoustic frames are A1, A2, A3... From the top, and the even-numbered acoustic frames are B1, B2, B3... From the top, A1 is samples 1 to 4096, A2 is samples 4097 to 8192, A3. Is samples 8193-12288, B1 is samples 2049-6144, B2 is samples 6145-10240, and B3 is samples 10241-14336. Note that the number of samples to be overlapped can be set as appropriate.

次に、周波数変換手段20が、第1音響フレームに対して周波数変換を行って、その第1音響フレームの複素数のスペクトルを得る(ステップS13)。ステップS13では、具体的には、窓関数を利用して周波数変換を行う。周波数変換としては、フーリエ変換、ウェーブレット変換その他、複素数のスペクトルを得られる公知の種々の手法を用いることができる。本実施形態では、第1の実施形態と同様、フーリエ変換を用いた場合を例にとって説明する。   Next, the frequency conversion means 20 performs frequency conversion on the first sound frame to obtain a complex spectrum of the first sound frame (step S13). In step S13, specifically, frequency conversion is performed using a window function. As the frequency conversion, various known methods for obtaining a complex spectrum, such as Fourier transform, wavelet transform, and the like, can be used. In the present embodiment, as in the first embodiment, a case where Fourier transform is used will be described as an example.

本実施形態では、各第1音響フレームについてのフーリエ変換は、上記〔数式2〕で定義されるハニング窓関数W(i)を乗じたものに対して行われることになる。   In the present embodiment, the Fourier transform for each first acoustic frame is performed on the product multiplied by the Hanning window function W (i) defined by the above [Equation 2].

周波数変換手段20が、第1音響フレームに対してフーリエ変換を行う場合は、左チャンネル信号Xl(i)、右チャンネル信号Xr(i)(i=0,…,N−1)に対して、窓関数W(i)を用いて、上記〔数式4〕に従った処理を行い、左チャンネルに対応する変換データの実部Al(j)、虚部Bl(j)、右チャンネルに対応する変換データの実部Ar(j)、虚部Br(j)を得る。上記〔数式4〕による処理の結果、サンプリング周波数が96kHz、N=4096の場合、jの値が1つ異なると、周波数が約23.4Hz異なることになる。   When the frequency conversion unit 20 performs Fourier transform on the first sound frame, for the left channel signal Xl (i) and the right channel signal Xr (i) (i = 0,..., N−1), The window function W (i) is used to perform the processing according to the above [Equation 4] and the conversion corresponding to the real part Al (j), the imaginary part Bl (j), and the right channel of the conversion data corresponding to the left channel. Real part Ar (j) and imaginary part Br (j) of data are obtained. As a result of the above processing of [Equation 4], when the sampling frequency is 96 kHz and N = 4096, if the value of j is different by one, the frequency is different by about 23.4 Hz.

ステップS13において上記〔数式4〕に従った処理を実行することにより、各第1音響フレームに対応する複素数のスペクトルが得られる。続いて、周波数成分改変手段30が、第1音響フレームから得られた第1スペクトルを用いて、高域に低域打消し成分を追加する処理を行う(ステップS14)。具体的には、第1の実施形態におけるステップS6と同様、第1スペクトルの成分を正負反転させ、周波数Fs/2を中心に折り返す処理を行う。ステップS14における低域打消し成分の付加処理は、奇数番目の音響フレームに対してのみ行われ、偶数番目の音響フレームに対しては行われない。奇数番目と偶数番目で低域打消し成分をOn/Offさせることにより、原音響信号に対して改変を加える割合を半分にするとともに、On/Offの低周波的な交番変動を加えることにより雑音再生音を明瞭にすることができる。   By executing the processing according to [Formula 4] in step S13, a complex spectrum corresponding to each first acoustic frame is obtained. Subsequently, the frequency component modifying means 30 performs a process of adding a low frequency cancellation component to the high frequency using the first spectrum obtained from the first acoustic frame (step S14). Specifically, similarly to step S6 in the first embodiment, the first spectrum component is inverted in the positive and negative directions, and the process of folding around the frequency Fs / 2 is performed. The low frequency cancellation component addition processing in step S14 is performed only for odd-numbered sound frames, and is not performed for even-numbered sound frames. By turning On / Off the low-frequency canceling component at odd and even numbers, the ratio of modification to the original sound signal is halved, and noise is generated by adding low frequency alternating fluctuations of On / Off. The reproduced sound can be made clear.

ステップS14における低域打消し成分の追加処理を行ったら、次に、周波数成分改変手段30は、低域打消し成分の追加処理後の第1スペクトルに白色雑音を付加する処理を行う(ステップS15)。具体的には、以下の〔数式10〕に従った処理を実行し、高域の所定の範囲に、各周波数成分を同等に含む雑音である白色雑音を付加する処理を行う。   Once the low frequency cancellation component addition processing in step S14 has been performed, the frequency component modification means 30 then performs processing for adding white noise to the first spectrum after the low frequency cancellation component addition processing (step S15). ). Specifically, processing according to the following [Equation 10] is executed, and processing for adding white noise, which is noise that equally includes each frequency component, to a predetermined high frequency range is performed.

〔数式10〕
Al(j)≧0の場合
Al´(j)← −Al(N/2−j)・α+γ
Al(j)<0の場合
Al´(j)← −Al(N/2−j)・α−γ
Bl(j)≧0の場合
Bl´(j)← −Bl(N/2−j)・α+γ
Bl(j)<0の場合
Bl´(j)← −Bl(N/2−j)・α−γ
Ar(j)≧0の場合
Ar´(j)← −Ar(N/2−j)・α+γ
Ar(j)<0の場合
Ar´(j)← −Ar(N/2−j)・α−γ
Br(j)≧0の場合
Br´(j)← −Br(N/2−j)・α+γ
Br(j)<0の場合
Br´(j)← −Br(N/2−j)・α−γ
[Formula 10]
When Al (j) ≧ 0 Al ′ (j) ← −Al (N / 2−j) · α + γ
When Al (j) <0 Al ′ (j) ← −Al (N / 2−j) · α−γ
When B1 (j) ≧ 0 B1 ′ (j) ← −B1 (N / 2−j) · α + γ
When B1 (j) <0 B1 ′ (j) ← −B1 (N / 2−j) · α−γ
When Ar (j) ≧ 0 Ar ′ (j) ← −Ar (N / 2−j) · α + γ
When Ar (j) <0 Ar ′ (j) ← −Ar (N / 2−j) · α−γ
When Br (j) ≧ 0 Br ′ (j) ← −Br (N / 2−j) · α + γ
When Br (j) <0 Br ′ (j) ← −Br (N / 2−j) · α−γ

周波数成分改変手段30は、周波数成分Al(j)、Bl(j)、Ar(j)、Br(j)に対して、上記〔数式10〕に従った処理を、j=1,・・・,N/2の各jについて実行する。1音響フレームのサンプル数N=4096、アップサンプリング後のサンプリング周波数Fs´=96kHzの場合、j=N/4は、周波数Fs´/4に対応し、j=N/2は、周波数Fs/2に対応する。なお、j=N/2を超える高周波数成分に対しては、改変を加えない。上記〔数式10〕において、αは、0.0<α≦1.0の範囲で設定されるスケーリング実数値である。本実施形態ではα=1.0に設定されている。また、γは信号レベル実数値であり、本実施形態では、Al(j)、Bl(j)、Ar(j)、Br(j)が16ビットの範囲(−32768〜+32767)で定義されている場合、γ=10240.0に設定されている。上記〔数式10〕に示した各式右辺の第1項(−Al(N/2−j)・α等)は低域打消し成分であり、各式右辺の第2項γは、白色雑音である。   The frequency component modifying means 30 performs the processing according to the above [Formula 10] on the frequency components Al (j), Bl (j), Ar (j), Br (j), j = 1,. , N / 2 for each j. When the number of samples of one acoustic frame is N = 4096 and the sampling frequency after upsampling is Fs ′ = 96 kHz, j = N / 4 corresponds to the frequency Fs ′ / 4, and j = N / 2 is the frequency Fs / 2. Corresponding to It should be noted that the high frequency component exceeding j = N / 2 is not modified. In the above [Expression 10], α is a scaling real value set in a range of 0.0 <α ≦ 1.0. In this embodiment, α = 1.0 is set. In addition, γ is a real value of the signal level. In this embodiment, Al (j), Bl (j), Ar (j), and Br (j) are defined in a 16-bit range (−32768 to +32767). Γ = 10240.0 is set. The first term (−Al (N / 2−j) · α, etc.) on the right side of each equation shown in [Formula 10] is a low-frequency canceling component, and the second term γ on the right side of each equation is white noise. It is.

上記〔数式10〕に示したように、複素数の実数成分および虚数成分の絶対値を増加させるように、所定の強度γを白色雑音として与える。ステップS15における白色雑音の付加処理は、奇数番目の音響フレームに対してのみ行われ、偶数番目の音響フレームに対しては行われない。奇数番目と偶数番目で白色雑音をOn/Offさせることにより、原音響信号に対して改変を加える割合を半分にするとともに、On/Offの低周波的な交番変動を加えることにより雑音再生音を明瞭にすることができる。   As shown in [Equation 10] above, a predetermined intensity γ is given as white noise so as to increase the absolute values of the real and imaginary components of the complex number. The white noise addition processing in step S15 is performed only for odd-numbered sound frames, and is not performed for even-numbered sound frames. By turning on / off white noise at odd and even numbers, the ratio of modification to the original sound signal is halved and noise reproduction sound is reduced by adding low frequency alternating fluctuations of On / Off. Can be clear.

本実施形態では、ステップS14、S15における周波数成分の改変処理を奇数番目の音響フレームに対して行い、偶数番目の音響フレームに対しては行っていないが、1つ置きの音響フレームに対して改変処理を行う必要は必ずしもなく、妨害音の効果がより高まれば、2つ置きあるいは3つ置きの音響フレームに対して改変処理を行うようにしても良く、逆に全ての音響フレームに対して行うようにしても良い。なお、上記の例では、奇数番目と偶数番目は相対的なものであるため、偶数番目の音響フレームに対して処理を行い、奇数番目の音響フレームに対して処理を行わないようにしても良い。   In the present embodiment, the frequency component modification processing in steps S14 and S15 is performed on the odd-numbered sound frames and is not performed on the even-numbered sound frames, but is modified on every other sound frame. It is not always necessary to perform the processing. If the effect of the interfering sound is enhanced, the modification processing may be performed on every second or third sound frame, and conversely, it is performed on all sound frames. You may do it. In the above example, since the odd number and the even number are relative, the process may be performed on the even-numbered sound frame and may not be performed on the odd-numbered sound frame. .

周波数成分改変手段30が、ステップS15における白色雑音付加を行って改変処理を終えたら、次に、周波数逆変換手段40が、改変後のスペクトルを周波数逆変換して改変音響フレームを得る処理を行う(ステップS16)。この周波数逆変換は、当然のことながら、周波数変換手段20が実行した手法に対応していることが必要となる。本実施形態では、周波数変換手段20において、フーリエ変換を施しているため、周波数逆変換手段40は、上記〔数式7〕に従った処理によりフーリエ逆変換を実行することになる。   After the frequency component modification unit 30 performs the white noise addition in step S15 and completes the modification process, the frequency inverse transform unit 40 performs a process of performing frequency inverse transform on the modified spectrum to obtain a modified acoustic frame. (Step S16). Naturally, the inverse frequency conversion needs to correspond to the method executed by the frequency conversion means 20. In the present embodiment, since the frequency transform unit 20 performs the Fourier transform, the frequency inverse transform unit 40 performs the Fourier inverse transform by the process according to the above [Equation 7].

ステップS16における周波数逆変換の後、得られた改変音響フレームを順次出力して改変音響信号を得ることができる。しかし、この段階で複製が行われても、前述の通り、複製の際に利用されるA/D変換器やサンプラーに前置されるアンチエイリアシング処理により、埋め込んだ原音響信号に対する打ち消し成分および妨害音を発生させる信号成分が減衰されてしまうことが通常である。そこで、本実施形態においても、第1の実施形態と同様、複製時にLPF処理が行われた場合にも所望の妨害音が聴取されるようにするため、以下のステップS17、ステップS18の処理を行う。   After the frequency inversion in step S16, the modified acoustic frames obtained can be sequentially output to obtain the modified acoustic signal. However, even if duplication is performed at this stage, as described above, the anti-aliasing process that precedes the A / D converter and sampler used during duplication cancels out and disturbs the embedded original sound signal. Usually, signal components that generate sound are attenuated. Therefore, in the present embodiment as well, in the same way as in the first embodiment, the following steps S17 and S18 are performed so that a desired disturbing sound can be heard even when the LPF process is performed during duplication. Do.

まず、ステップS16までの処理により得られた改変音響信号に対して、間引き・拡大処理を行う(ステップS17)。具体的には、まず、間引き処理として、第1の実施形態と同様、サンプリング周波数2Fsの改変音響信号を、サンプリング周波数Fsでダウンサンプリングする。   First, thinning / enlarging processing is performed on the modified acoustic signal obtained by the processing up to step S16 (step S17). Specifically, first, as the thinning-out process, the modified acoustic signal having the sampling frequency 2Fs is down-sampled at the sampling frequency Fs as in the first embodiment.

さらに、間引き処理した信号の周波数方向への拡大処理を行う。具体的には、間引き処理したサンプリング周波数Fsの信号を、サンプリング周波数2Fsでアップサンプリングする。   Further, an expansion process in the frequency direction of the thinned signal is performed. Specifically, the sampling frequency Fs signal subjected to the thinning process is up-sampled at the sampling frequency 2Fs.

続いて、間引き・拡大処理後の信号に重み付けを行って改変音響信号に合成する処理を行う(ステップS18)。具体的には、改変音響信号の周波数Fs/2以下の成分に、間引き・拡大処理後の信号成分が加算されることになる。   Subsequently, the signal after the thinning / enlarging process is weighted and synthesized with the modified acoustic signal (step S18). Specifically, the signal component after the thinning / enlarging process is added to the component of the modified acoustic signal having the frequency Fs / 2 or less.

改変音響信号補正手段55が上記ステップS17、S18で行った処理は、第1の実施形態と同様、上記〔数式8〕として、まとめることができる。   The processing performed by the modified acoustic signal correcting unit 55 in steps S17 and S18 can be summarized as the above [Equation 8] as in the first embodiment.

改変音響フレーム出力手段50は、改変音響信号補正手段55の処理により得られた補正後の改変音響フレームを順次出力ファイルに出力する。上記図9のフローチャートに示した処理は、広帯域音響信号の全ての第1音響フレームに対して実行される。このようにして全ての第1音響フレームに対して処理を行った結果、改変音響フレームの集合である改変音響信号が、改変音響信号記憶部62に記憶される。本実施形態では、第1音響信号の先頭から最後まで妨害音を埋め込むようにしたが、埋め込む位置を設定して、その範囲にだけ埋め込むようにすることも可能である。   The modified sound frame output unit 50 sequentially outputs the modified sound frames after correction obtained by the processing of the modified sound signal correction unit 55 to the output file. The process shown in the flowchart of FIG. 9 is executed for all the first sound frames of the wideband sound signal. As a result of performing processing on all the first sound frames in this way, a modified sound signal that is a set of modified sound frames is stored in the modified sound signal storage unit 62. In the present embodiment, the disturbing sound is embedded from the beginning to the end of the first acoustic signal. However, it is also possible to set an embedding position and embed only in that range.

(2.2.3.第3の実施形態)
次に、本発明第3の実施形態の音響信号に対する第2の音響信号の埋め込み装置について説明する。第1の実施形態では、原音響信号をアップサンプリングして広帯域音響信号を作成し、広帯域音響信号に対して第2音響信号の埋め込みを行ったが、第3の実施形態では、アップサンプリングを行わず、原音響信号に対して直接第2音響信号を埋め込む処理を行う。第1の実施形態と類似する処理が多いため、図5のフローチャートを用いて説明を行う。本実施形態においては、第1音響信号として、サンプリング周波数Fs=44.1kHzでサンプリングしたものを用いる。また、本実施形態では、折り返しの中心となる周波数Ft=Fs/4とする。
(2.2.3. Third embodiment)
Next, a second acoustic signal embedding device for an acoustic signal according to a third embodiment of the present invention will be described. In the first embodiment, the original sound signal is upsampled to create a wideband sound signal, and the second sound signal is embedded in the wideband sound signal. In the third embodiment, upsampling is performed. First, the process of embedding the second acoustic signal directly into the original acoustic signal is performed. Since there are many processes similar to those of the first embodiment, description will be made with reference to the flowchart of FIG. In the present embodiment, the first sound signal sampled at the sampling frequency Fs = 44.1 kHz is used. In the present embodiment, the frequency Ft = Fs / 4, which is the center of folding, is used.

本実施形態では、アップサンプリング手段8を介さず、音響フレーム読込手段10が、直接音響信号記憶部61に記憶された音響信号を読み込む。音響フレーム読込手段10は、音響信号記憶部61に記憶されたステレオの音響信号の左右の各チャンネルから、それぞれ所定数Nのサンプルを1つの第1音響フレームとして読み込む(ステップS2)。同様に、音響フレーム読込手段10は、音響信号記憶部61に記憶されたステレオの第2音響信号の左右の各チャンネルから、それぞれ所定数Nのサンプルを1つの第2音響フレームとして読み込む(ステップS3)。   In the present embodiment, the acoustic frame reading unit 10 directly reads the acoustic signal stored in the acoustic signal storage unit 61 without using the upsampling unit 8. The acoustic frame reading means 10 reads a predetermined number N of samples as one first acoustic frame from each of the left and right channels of the stereo acoustic signal stored in the acoustic signal storage unit 61 (step S2). Similarly, the acoustic frame reading means 10 reads a predetermined number N of samples as one second acoustic frame from each of the left and right channels of the stereo second acoustic signal stored in the acoustic signal storage unit 61 (step S3). ).

音響フレーム読込手段10が読み込む1つの音響フレームのサンプル数Nは、適宜設定することができるが、サンプリング周波数が44.1kHzの場合、4096サンプル程度とすると、最も原音に対するダメージを少なくできることが分かっているので、以下この設定値で説明する。したがって、音響フレーム読込手段10は、音響信号から、左チャンネル、右チャンネルについてそれぞれ4096サンプルずつ、順次音響フレームとして読み込んでいくことになる。   The number N of samples of one sound frame read by the sound frame reading means 10 can be set as appropriate. However, when the sampling frequency is 44.1 kHz, it is understood that the damage to the original sound can be reduced most when the number is about 4096 samples. This setting value will be described below. Therefore, the acoustic frame reading means 10 sequentially reads 4096 samples for the left channel and the right channel as acoustic frames from the acoustic signal.

本実施形態でも、第1の実施形態と同様、奇数番目の音響フレーム、偶数番目の音響フレームは、互いに所定数(本実施形態では2048)のサンプルを重複して設定される。したがって、奇数番目の音響フレームを先頭からA1、A2、A3…とし、偶数番目の音響フレームを先頭からB1、B2、B3…とすると、A1はサンプル1〜4096、A2はサンプル4097〜8192、A3はサンプル8193〜12288、B1はサンプル2049〜6144、B2はサンプル6145〜10240、B3はサンプル10241〜14336となる。   Also in this embodiment, as in the first embodiment, the odd-numbered acoustic frames and the even-numbered acoustic frames are set by overlapping a predetermined number of samples (2048 in this embodiment). Therefore, if the odd-numbered acoustic frames are A1, A2, A3... From the top, and the even-numbered acoustic frames are B1, B2, B3... From the top, A1 is samples 1 to 4096, A2 is samples 4097 to 8192, A3. Is samples 8193-12288, B1 is samples 2049-6144, B2 is samples 6145-10240, and B3 is samples 10241-14336.

次に、周波数変換手段20が、第1音響フレームに対して周波数変換を行って、その第1音響フレームの複素数のスペクトルを得る(ステップS4)。同様に、周波数変換手段20が、第2音響フレームに対して周波数変換を行って、その第2音響フレームの複素数のスペクトルを得る(ステップS5)。ステップS4、S5では、具体的には、窓関数を利用して周波数変換を行う。周波数変換としては、フーリエ変換、ウェーブレット変換その他公知の種々の手法を用いることができるが、複素数のスペクトルを得られる手法である必要がある。本実施形態では、フーリエ変換を用いた場合を例にとって説明する。ステップS4、S5では、第1の実施形態と同様、上記〔数式2〕に示した窓関数W(i)を利用して周波数変換を行う。   Next, the frequency conversion means 20 performs frequency conversion on the first sound frame to obtain a complex spectrum of the first sound frame (step S4). Similarly, the frequency conversion means 20 performs frequency conversion on the second sound frame to obtain a complex spectrum of the second sound frame (step S5). In steps S4 and S5, specifically, frequency conversion is performed using a window function. As the frequency transform, various known methods such as Fourier transform, wavelet transform and the like can be used, but it is necessary to be a method capable of obtaining a complex spectrum. In the present embodiment, a case where Fourier transform is used will be described as an example. In steps S4 and S5, as in the first embodiment, frequency conversion is performed using the window function W (i) shown in the above [Equation 2].

周波数変換手段20が、第1音響フレームに対してフーリエ変換を行う場合は、左チャンネル信号Xl(i)、右チャンネル信号Xr(i)(i=0,…,N−1)に対して、窓関数W(i)を用いて、上記〔数式4〕に従った処理を行い、左チャンネルに対応する変換データの実部Al(j)、虚部Bl(j)、右チャンネルに対応する変換データの実部Ar(j)、虚部Br(j)を得る。上記〔数式4〕に従った処理の結果、サンプリング周波数が44.1kHz、N=4096の場合、jの値が1つ異なると、周波数が約10.8Hz異なることになる。ステップS4により得られる原音響信号の信号スペクトルは、図10(a)に示したようなものとなる。   When the frequency conversion unit 20 performs Fourier transform on the first sound frame, for the left channel signal Xl (i) and the right channel signal Xr (i) (i = 0,..., N−1), The window function W (i) is used to perform the processing according to the above [Equation 4] and the conversion corresponding to the real part Al (j), the imaginary part Bl (j), and the right channel of the conversion data corresponding to the left channel. Real part Ar (j) and imaginary part Br (j) of data are obtained. As a result of the processing according to the above [Equation 4], when the sampling frequency is 44.1 kHz and N = 4096, if the value of j is different by one, the frequency will be different by about 10.8 Hz. The signal spectrum of the original sound signal obtained in step S4 is as shown in FIG.

周波数変換手段20が、第2音響フレームに対してフーリエ変換を行う場合は、左チャンネル信号X2l(i)、右チャンネル信号X2r(i)(i=0,…,M−1)に対して、窓関数W(i)を用いて、上記〔数式5〕に従った処理を行い、左チャンネルに対応する変換データの実部A2l(j)、虚部Bl(j)、右チャンネルに対応する変換データの実部A2r(j)、虚部Br(j)を得る。上記〔数式4〕に従った処理の結果、サンプリング周波数が44.1kHz、N=4096の場合、jの値が1つ異なると、周波数が約10.8Hz異なることになる。ステップS5により得られる第2音響信号の信号スペクトルは、図10(b)に示したようなものとなる。   When the frequency conversion means 20 performs the Fourier transform on the second sound frame, for the left channel signal X2l (i) and the right channel signal X2r (i) (i = 0,..., M−1) Using the window function W (i), the processing according to the above [Formula 5] is performed, and the conversion corresponding to the real part A2l (j), the imaginary part Bl (j), and the right channel of the conversion data corresponding to the left channel is performed. Real part A2r (j) and imaginary part Br (j) of data are obtained. As a result of the processing according to the above [Equation 4], when the sampling frequency is 44.1 kHz and N = 4096, if the value of j is different by one, the frequency will be different by about 10.8 Hz. The signal spectrum of the second acoustic signal obtained in step S5 is as shown in FIG.

ステップS4、S5においてそれぞれ上記〔数式4〕〔数式5〕に従った処理を実行することにより、各第1音響フレーム、第2音響フレームに対応する複素数のスペクトルが得られる。続いて、周波数成分改変手段30が、第1音響フレームから得られた第1スペクトルを用いて、高域に低域打消し成分を追加する処理を行う(ステップS6)。具体的には、第1スペクトルの成分を正負反転させ、周波数Fs/2を中心に折り返す処理を行う。   In steps S4 and S5, the processes according to the above [Equation 4] and [Equation 5] are executed, whereby complex spectra corresponding to the first and second acoustic frames are obtained. Subsequently, the frequency component modifying means 30 performs a process of adding a low frequency cancellation component to the high frequency using the first spectrum obtained from the first acoustic frame (step S6). Specifically, the first spectrum component is inverted between positive and negative, and a process of turning around the frequency Fs / 2 is performed.

ステップS6における低域打消し成分の追加処理を行ったら、次に、周波数成分改変手段30は、低域打消し成分の追加処理後の第1スペクトルと第2スペクトルの合成を行う(ステップS7)。第2スペクトルについては、周波数Fs/4を中心に折り返しながら加算する。この結果、第1スペクトル(合成スペクトル)は、図10(c)に示すような状態となる。合成後の第1スペクトル(改変音響信号のスペクトル)においては、周波数Fs/4より大きい範囲において、元の第1スペクトルに存在した信号成分を振幅反転したものと、第2スペクトルの信号成分が、折り返された状態で存在することになる。   Once the low frequency cancellation component addition processing in step S6 has been performed, the frequency component modification means 30 then combines the first spectrum and the second spectrum after the low frequency cancellation component addition processing (step S7). . The second spectrum is added while being folded around the frequency Fs / 4. As a result, the first spectrum (synthetic spectrum) is in a state as shown in FIG. In the first spectrum after synthesis (the spectrum of the modified acoustic signal), a signal component obtained by inverting the amplitude of the signal component existing in the original first spectrum and a signal component of the second spectrum in a range larger than the frequency Fs / 4, It exists in a folded state.

図10(c)の例では、周波数Fs/4〜Fs/2において、2種のスペクトル成分を重ねて表示しているが、実際には複素ベクトルで加算される。図10(c)に示すように、合成後のスペクトルでは、周波数Fs/4〜Fs/2において、第1音響信号の振幅反転成分および第2音響信号に由来する成分は雑音化されて、第1音響信号の低域成分にマスキングされるため、改変後の音響信号を再生したとしても、第1音響信号の振幅反転成分および第2音響信号の成分は、人間には聴取されない。   In the example of FIG. 10C, two types of spectral components are superimposed and displayed at frequencies Fs / 4 to Fs / 2, but in reality they are added as complex vectors. As shown in FIG. 10C, in the synthesized spectrum, the amplitude inversion component of the first acoustic signal and the component derived from the second acoustic signal are converted into noise at frequencies Fs / 4 to Fs / 2. Since the low-frequency component of one acoustic signal is masked, even if the modified acoustic signal is reproduced, the amplitude inversion component of the first acoustic signal and the component of the second acoustic signal are not heard by humans.

周波数成分改変手段30が上記ステップS6、S7で行った処理は以下の〔数式11〕としてまとめることができる。   The processing performed by the frequency component modifying means 30 in the above steps S6 and S7 can be summarized as the following [Equation 11].

〔数式11〕
Al´(j)← −Al(N/2−j)・α+A2l(N/2−j)・β
Bl´(j)← −Bl(N/2−j)・α+B2l(N/2−j)・β
Ar´(j)← −Ar(N/2−j)・α+A2r(N/2−j)・β
Br´(j)← −Br(N/2−j)・α+B2r(N/2−j)・β
[Formula 11]
Al ′ (j) ← −Al (N / 2−j) · α + A2l (N / 2−j) · β
Bl ′ (j) ← −Bl (N / 2−j) · α + B2l (N / 2−j) · β
Ar ′ (j) ← −Ar (N / 2−j) · α + A2r (N / 2−j) · β
Br ′ (j) ← −Br (N / 2−j) · α + B2r (N / 2−j) · β

周波数成分改変手段30は、周波数成分Al(j)、Bl(j)、A2l(j)、B2l(j)に対して、上記〔数式11〕に従った処理を、j=N/4+1,・・・,N/2−1の各jについて実行する。1音響フレームのサンプル数N=4096、サンプリング周波数Fs=44.1kHz(=2Fs)の場合、j=N/4は、周波数Fs/4に対応し、j=N/2は、周波数Fs/2に対応する。したがって、〔数式11〕においては、j=1025,・・・,2048が処理対象となり、約11.1kHz〜約22.1kHz(略人間の可聴域上限)の周波数成分が変更される。   The frequency component modifying means 30 performs the processing according to the above [Formula 11] on the frequency components Al (j), B1 (j), A2l (j), B2l (j), j = N / 4 + 1,. .., for each j of N / 2-1. When the number of samples of one acoustic frame is N = 4096 and the sampling frequency Fs = 44.1 kHz (= 2Fs), j = N / 4 corresponds to the frequency Fs / 4, and j = N / 2 is the frequency Fs / 2. Corresponding to Therefore, in [Formula 11], j = 1025,..., 2048 is a processing target, and the frequency component of about 11.1 kHz to about 22.1 kHz (approximately the upper limit of the human audible range) is changed.

上記〔数式11〕において、α、βは、0.0<α、β≦1.0の範囲で設定されるスケーリング実数値である。本実施形態ではα=β=1.0に設定されている。上記〔数式11〕に示した各式右辺の第1項(−Al(N/2−j)・α等)は低域打消し成分であり、各式右辺の第2項(A2l(N/2−j)・β等)は、第2スペクトルを周波数方向に折り返した成分である。   In the above [Expression 11], α and β are scaling real values set in the range of 0.0 <α and β ≦ 1.0. In the present embodiment, α = β = 1.0 is set. The first term (−Al (N / 2−j) · α, etc.) on the right side of each formula shown in [Formula 11] is a low-frequency canceling component, and the second term (A2l (N / 2-j), β, etc. are components obtained by folding the second spectrum in the frequency direction.

図5のフローチャートと上記〔数式11〕の対応関係を示すと、ステップS6における高域に低域打消し成分を追加する処理が、上記〔数式11〕の右辺第1項を加算する処理に対応し、ステップS7における第1スペクトルと第2スペクトルの合成処理が、上記〔数式11〕の右辺第2項を加算する処理に対応することになる。   When the correspondence relationship between the flowchart of FIG. 5 and the above [Equation 11] is shown, the process of adding the low frequency cancellation component to the high frequency in Step S6 corresponds to the process of adding the first term on the right side of the above [Equation 11]. Then, the synthesis process of the first spectrum and the second spectrum in step S7 corresponds to the process of adding the second term on the right side of the above [Formula 11].

周波数成分改変手段30が、ステップS7における合成処理を終えたら、次に、周波数逆変換手段40が、改変後の第1スペクトルを周波数逆変換して改変音響フレームを得る処理を行う(ステップS8)。この周波数逆変換は、当然のことながら、周波数変換手段20が実行した手法に対応していることが必要となる。本実施形態では、周波数変換手段20において、フーリエ変換を施しているため、周波数逆変換手段40は、フーリエ逆変換を実行することになる。   After the frequency component modifying unit 30 finishes the synthesis process in step S7, the frequency inverse transform unit 40 performs a process of performing frequency inverse transform on the modified first spectrum to obtain a modified acoustic frame (step S8). . Naturally, the inverse frequency conversion needs to correspond to the method executed by the frequency conversion means 20. In the present embodiment, since the frequency transform unit 20 performs the Fourier transform, the frequency inverse transform unit 40 executes the Fourier inverse transform.

具体的には、第1の実施形態と同様、周波数逆変換手段40は、周波数成分改変手段30により得られた第1スペクトルの左チャンネルの実部Al´(j)、虚部Bl´(j)、右チャンネルの実部Ar´(j)、虚部Br´(j)を用いて、上記〔数式7〕に従った処理を行い、Xl´(i)、Xr´(i)を算出する。なお、周波数成分改変手段30において改変されていない周波数成分については、Al´(j)、Bl´(j)、Ar´(j)、Br´(j)として、それぞれ元の周波数成分であるAl(j)、Bl(j)、Ar(j)、Br(j)を用いる。   More specifically, as in the first embodiment, the frequency inverse transform unit 40 includes the real part Al ′ (j) and the imaginary part Bl ′ (j) of the left channel of the first spectrum obtained by the frequency component modification unit 30. ), Using the real part Ar ′ (j) and the imaginary part Br ′ (j) of the right channel, the process according to the above [Equation 7] is performed to calculate Xl ′ (i) and Xr ′ (i). . The frequency components that have not been modified by the frequency component modifying means 30 are Al ′ (j), Bl ′ (j), Ar ′ (j), and Br ′ (j), which are the original frequency components, Al. (J), Bl (j), Ar (j), and Br (j) are used.

第1の実施形態と同様、ステップS8における周波数逆変換の後、得られた改変音響フレームを順次出力して改変音響信号を得ることができる。ステップS8までの処理は前述の通り複製された際に、原音信号の打ち消し成分や第2音響信号の成分が複製の際に利用されるA/D変換器やサンプラーに前置されているアンチエイリアシング処理により減衰されてしまうことが通常である。本実施形態においても、複製時にLPF処理が行われた場合にも所望の効果を働かせるため以下のステップS9、ステップS10の処理を行う。   Similar to the first embodiment, after the inverse frequency conversion in step S8, the modified acoustic frames obtained can be sequentially output to obtain the modified acoustic signal. When the processing up to step S8 is duplicated as described above, the anti-aliasing component is preliminarily placed in the A / D converter or sampler in which the cancellation component of the original sound signal and the component of the second acoustic signal are used in the duplication. Usually, it is attenuated by the processing. Also in the present embodiment, the following steps S9 and S10 are performed in order to exert a desired effect even when the LPF process is performed at the time of replication.

図11は、ステップS9、ステップS10の処理を示す図である。図11において、図11(a)は図10(c)と同一であり、ステップS8までの処理の結果得られた改変音響信号の信号スペクトルを示す。図11(b)は、図11(a)の改変音響信号を間引き処理した信号の信号スペクトルを示す。図11(c)は、アップサンプリングしてサンプリング周波数を拡大した信号の信号スペクトルを示す。図11(d)は、図11(a)の改変音響信号に、図11(c)の信号を合成して得られる補正改変音響信号の信号スペクトルを示す。   FIG. 11 is a diagram illustrating the processes in steps S9 and S10. 11, FIG. 11 (a) is the same as FIG. 10 (c), and shows the signal spectrum of the modified acoustic signal obtained as a result of the processing up to step S8. FIG. 11B shows a signal spectrum of a signal obtained by thinning out the modified acoustic signal of FIG. FIG. 11C shows a signal spectrum of a signal obtained by upsampling and expanding the sampling frequency. FIG.11 (d) shows the signal spectrum of the correction | amendment modified acoustic signal obtained by synthesize | combining the signal of FIG.11 (c) with the modified acoustic signal of Fig.11 (a).

ステップS8までの処理により得られた図11(a)に示す改変音響信号に対して、間引き・拡大処理を行う(ステップS9)。具体的には、まず、間引き処理として、サンプリング周波数Fsの改変音響信号を、サンプリング周波数Fs/2でダウンサンプリングする。サンプリング周波数Fs/2でダウンサンプリングした信号のスペクトルのイメージは図11(b)に示したようなものとなる。   Thinning / enlarging processing is performed on the modified acoustic signal shown in FIG. 11A obtained by the processing up to step S8 (step S9). Specifically, first, as a thinning-out process, the modified acoustic signal having the sampling frequency Fs is down-sampled at the sampling frequency Fs / 2. An image of the spectrum of the signal down-sampled at the sampling frequency Fs / 2 is as shown in FIG.

さらに、間引き処理した信号の周波数方向への拡大処理を行う。具体的には、間引き処理したサンプリング周波数Fs/2の信号を、サンプリング周波数Fsでアップサンプリングする。サンプリング周波数Fsでアップサンプリングした後、周波数Fs/4を超える成分を除去した信号のスペクトルのイメージは図11(c)に示したようなものとなる。   Further, an expansion process in the frequency direction of the thinned signal is performed. Specifically, the sampling frequency Fs / 2 signal subjected to the thinning process is up-sampled at the sampling frequency Fs. After up-sampling at the sampling frequency Fs, an image of the spectrum of a signal from which components exceeding the frequency Fs / 4 are removed is as shown in FIG.

続いて、間引き・拡大処理後の信号に重み付けを行って改変音響信号に合成する処理を行う(ステップS10)。すなわち、図11(a)に示した改変音響信号に、図11(c)に示したような信号を加算する。この結果、図11(d)に示すような補正された改変音響信号が得られる。具体的には、改変音響信号の周波数Fs/4以下の成分に、間引き・拡大処理後の信号成分が加算されることになる。   Subsequently, the signal after the thinning / enlarging process is weighted and synthesized with the modified acoustic signal (step S10). That is, a signal as shown in FIG. 11C is added to the modified acoustic signal shown in FIG. As a result, a corrected modified acoustic signal as shown in FIG. 11D is obtained. Specifically, the signal component after the thinning / enlarging process is added to the component of the modified acoustic signal having a frequency of Fs / 4 or less.

改変音響信号補正手段55が上記ステップS9、S10で行った処理は、第1の実施形態と同様、上記〔数式8〕として、まとめることができる。   The processing performed by the modified acoustic signal correcting unit 55 in steps S9 and S10 can be summarized as the above [Equation 8] as in the first embodiment.

改変音響フレーム出力手段50は、改変音響信号補正手段55の処理により得られた補正後の改変音響フレームを順次出力ファイルに出力する。上記図5のフローチャートに示した処理は、第1音響信号の全ての第1音響フレームに対して実行される。第1音響フレームの数が、第2音響フレームの数より多い場合は、先頭の第2音響フレームに戻って繰り返し処理を行う。このようにして全ての第1音響フレームに対して処理を行った結果、改変音響フレームの集合である改変音響信号が、改変音響信号記憶部62に記憶される。本実施形態では、第1音響信号の先頭から最後まで第2音響信号を埋め込むようにしたが、埋め込む位置を設定して、その範囲にだけ埋め込むようにすることも可能である。   The modified sound frame output unit 50 sequentially outputs the modified sound frames after correction obtained by the processing of the modified sound signal correction unit 55 to the output file. The process shown in the flowchart of FIG. 5 is executed for all the first sound frames of the first sound signal. When the number of the first sound frames is larger than the number of the second sound frames, the process returns to the first second sound frame and is repeated. As a result of performing processing on all the first sound frames in this way, a modified sound signal that is a set of modified sound frames is stored in the modified sound signal storage unit 62. In the present embodiment, the second acoustic signal is embedded from the beginning to the end of the first acoustic signal. However, it is also possible to set an embedding position and embed only in that range.

図12は、第3の実施形態のステップS10までの処理により得られた改変音響信号が、LPF回路を備えた現実的な装置で複製される場合の概念を示す図である。図12において、図12(a)は、ステップS10までの処理の結果得られた補正後の改変音響信号の信号スペクトルを示す。図12(b)は、LPF(Low Pass Filter)処理によるフィルタゲインを示す。図12(c)は、改変音響信号に対してLPF処理を行った信号の信号スペクトルを示す。図12(d)は、改変音響信号をLPF処理後に再サンプリングして得られた複製音響信号の信号スペクトルを示す。   FIG. 12 is a diagram illustrating a concept in a case where the modified acoustic signal obtained by the processing up to step S10 of the third embodiment is replicated by a realistic device including an LPF circuit. In FIG. 12, FIG. 12 (a) shows the signal spectrum of the modified acoustic signal after correction obtained as a result of the processing up to step S10. FIG. 12B shows a filter gain by LPF (Low Pass Filter) processing. FIG. 12C shows a signal spectrum of a signal obtained by performing LPF processing on the modified acoustic signal. FIG. 12D shows a signal spectrum of a duplicated sound signal obtained by resampling the modified sound signal after LPF processing.

改変音響信号に対してLPF処理を行った信号は、図12(c)に示したようなものになる。図12(a)と図12(c)を比較するとわかるように、周波数Fs/4以下の元の音響信号に対応する部分、間引き・拡大処理した成分はそのまま残り、周波数Fs/4を超える打消し成分、第2音響信号に対応する成分については、LPFの影響で減衰する。   A signal obtained by performing the LPF process on the modified acoustic signal is as shown in FIG. As can be seen by comparing FIG. 12 (a) and FIG. 12 (c), the portion corresponding to the original acoustic signal having a frequency of Fs / 4 or lower and the thinned / enlarged component remain as they are, and the cancellation exceeds the frequency Fs / 4. The component corresponding to the second component and the second acoustic signal is attenuated by the influence of the LPF.

さらに、図12(c)に示す信号を、サンプリング周波数Fs/2で再サンプリングすると、図12(d)に示す複製音響信号が得られる。複製音響信号では、エイリアシングが発生し、減衰した打消し成分、第2音響信号に対応する成分が、人間の可聴域である周波数Fs/4以下に折り返され間引き・拡大処理した成分に同相で合成される。これにより、減衰した打消し成分、第2音響信号に対応する成分が強調され、人間に聴こえるようになる。警告メッセージ等の第2音響信号が音楽に重ねて聴こえると、本来の状態で音楽を鑑賞することができない。このため、複製に対する抑止力が働くことになる。   Further, when the signal shown in FIG. 12C is resampled at the sampling frequency Fs / 2, a duplicate acoustic signal shown in FIG. 12D is obtained. In the duplicated sound signal, aliasing occurs, the attenuated canceling component, and the component corresponding to the second sound signal are combined in-phase with the component that has been decimated and expanded to a frequency below the human audible frequency Fs / 4. Is done. Thereby, the attenuated canceling component and the component corresponding to the second acoustic signal are emphasized and can be heard by humans. If the second acoustic signal such as a warning message is heard over the music, the music cannot be appreciated in its original state. For this reason, deterrence against replication works.

また、改変音響信号に対して複製する際のサンプリング周波数がFs/2より若干小さくFs/4より大きいFs´の場合でも、同様にエイリアシングが発生し、周波数Fs´/2〜Fs´の信号成分は反転してFs´/2以下の周波数帯に重畳される。即ち、図12(a)の右半分より左端が左側にずれて、図12(a)の右半分より帯域幅が狭い信号成分が図12(d)の左半分より右端が左側にずれた位置に折り返される。この複製音響信号を再生すると、原音響信号が中途半端に打ち消され、第2音響信号に記録された音と同等の音が発せられることは期待できないが、歪みやかなりの雑音を伴って原音響信号の打ち消し成分と第2音響信号に基づく音が人間の耳に明瞭に聴取されることになる。この場合でも、鑑賞に堪える再生音を得ることができなくなるという目的は達成できるため、複製を抑止することが可能となる。更に、改変音響信号に対して複製する際のサンプリング周波数がFs/4より小さい場合には、顕著なエイリアシングが発生して原音響信号自身の主要信号成分が破壊され鑑賞に堪える再生音を得ることができなくなる。逆に、改変音響信号に対して複製する際のサンプリング周波数がFs/2より若干大きく3Fs/4より小さいFs´の場合でも、同様にエイリアシングが発生し、周波数Fs´/2〜Fs´の信号成分は反転してFs´/2以下の周波数帯に重畳される。即ち、図12(a)の右半分より右端が右側にずれて、図12(a)の右半分より帯域幅が広い信号成分が図12(d)の左半分より右端が右側にずれた位置に折り返される。この複製音響信号を再生すると、原音響信号が中途半端に打ち消され、第2音響信号に記録された音と同等の音が発せられることは期待できないが、歪みやかなりの雑音を伴って原音響信号の打ち消し成分と第2音響信号に基づく音が人間の耳に明瞭に聴取されることになる。この場合でも、鑑賞に堪える再生音を得ることができなくなるという目的は達成できるため、複製を抑止することが可能となる。しかし、3Fs/4より大きい場合には、エイリアシングが殆ど発生せず、原音響信号および第2音響信号の品質は維持され、第2音響信号は可聴化されず複製を抑止することはできない。以上のことから、改変音響信号に対して複製する際のサンプリング周波数が3Fs/4より小さい場合には、エイリアシングが発生して。複製を抑止することが可能となる。   Further, even when the sampling frequency for duplicating the modified acoustic signal is Fs ′ that is slightly smaller than Fs / 2 and larger than Fs / 4, aliasing occurs in the same manner, and signal components of frequencies Fs ′ / 2 to Fs ′. Is inverted and superimposed on a frequency band of Fs ′ / 2 or less. That is, the left end of the right half of FIG. 12A is shifted to the left, and the signal component having a narrower bandwidth than the right half of FIG. 12A is shifted to the left of the right end of the left half of FIG. Wrapped to When this duplicated sound signal is reproduced, the original sound signal is canceled halfway and it cannot be expected that a sound equivalent to the sound recorded in the second sound signal will be emitted, but the original sound signal is accompanied by distortion and considerable noise. The sound based on the signal cancellation component and the second acoustic signal is clearly heard by the human ear. Even in this case, the purpose of not being able to obtain reproduced sound that can be enjoyed for viewing can be achieved, so that duplication can be suppressed. Furthermore, when the sampling frequency when replicating the modified sound signal is smaller than Fs / 4, significant aliasing occurs, and the main signal component of the original sound signal itself is destroyed to obtain a reproduced sound that can be appreciated. Can not be. Conversely, even when the sampling frequency when replicating the modified acoustic signal is Fs ′ that is slightly larger than Fs / 2 and smaller than 3Fs / 4, aliasing occurs in the same manner, and signals with frequencies Fs ′ / 2 to Fs ′. The component is inverted and superimposed on the frequency band below Fs ′ / 2. That is, the right end of the right half of FIG. 12A is shifted to the right, and the signal component having a wider bandwidth than the right half of FIG. 12A is shifted to the right of the right half of the left half of FIG. Wrapped to When this duplicated sound signal is reproduced, the original sound signal is canceled halfway and it cannot be expected that a sound equivalent to the sound recorded in the second sound signal will be emitted, but the original sound signal is accompanied by distortion and considerable noise. The sound based on the signal cancellation component and the second acoustic signal is clearly heard by the human ear. Even in this case, the purpose of not being able to obtain reproduced sound that can be enjoyed for viewing can be achieved, so that duplication can be suppressed. However, if it is greater than 3Fs / 4, aliasing hardly occurs, the quality of the original sound signal and the second sound signal is maintained, the second sound signal is not made audible, and duplication cannot be suppressed. From the above, aliasing occurs when the sampling frequency when replicating the modified acoustic signal is smaller than 3Fs / 4. It becomes possible to suppress duplication.

(2.2.4.第4の実施形態)
次に、本発明の第4の実施形態である音響信号に対する妨害音の埋め込み装置について説明する。第2の実施形態では、原音響信号をアップサンプリングして広帯域音響信号を作成し、白色雑音の埋め込みを行ったが、第4の実施形態では、アップサンプリングを行わず、原音響信号に対して直接白色雑音を埋め込む処理を行う。第2の実施形態と類似する処理が多いため、図9のフローチャートを用いて説明を行う。本実施形態においては、第1音響信号として、サンプリング周波数Fs=44.1kHzでサンプリングしたものを用いる。また、本実施形態では、折り返しの中心となる周波数Ft=Fs/4とする。
(2.2.4. Fourth embodiment)
Next, an interference sound embedding device for an acoustic signal according to a fourth embodiment of the present invention will be described. In the second embodiment, the original sound signal is upsampled to create a wideband sound signal, and white noise is embedded. However, in the fourth embodiment, upsampling is not performed and the original sound signal is embedded. A process of directly embedding white noise is performed. Since there are many processes similar to those of the second embodiment, description will be made with reference to the flowchart of FIG. In the present embodiment, the first sound signal sampled at the sampling frequency Fs = 44.1 kHz is used. In the present embodiment, the frequency Ft = Fs / 4, which is the center of folding, is used.

本実施形態では、アップサンプリング手段8を介さず、音響フレーム読込手段10が、直接音響信号記憶部61に記憶された音響信号を読み込む。音響フレーム読込手段10は、音響信号記憶部61に記憶されたステレオの音響信号の左右の各チャンネルから、それぞれ所定数Nのサンプルを1つの第1音響フレームとして読み込む(ステップS12)。   In the present embodiment, the acoustic frame reading unit 10 directly reads the acoustic signal stored in the acoustic signal storage unit 61 without using the upsampling unit 8. The acoustic frame reading means 10 reads a predetermined number N of samples as one first acoustic frame from each of the left and right channels of the stereo acoustic signal stored in the acoustic signal storage unit 61 (step S12).

音響フレーム読込手段10が読み込む1つの第1音響フレームのサンプル数N、適宜設定することができるが、本実施形態では、以下、N=4096の場合について説明する。したがって、音響フレーム読込手段10は、広帯域音響信号から左チャンネル、右チャンネルについてそれぞれ4096サンプルずつ、順次第1音響フレームとして読み込んでいくことになる。   Although the number N of samples of one first sound frame read by the sound frame reading means 10 can be set as appropriate, in the present embodiment, a case where N = 4096 will be described below. Therefore, the acoustic frame reading means 10 sequentially reads 4096 samples for each of the left channel and the right channel from the broadband acoustic signal as the first acoustic frame.

本実施形態でも、第1〜第3の実施形態と同様、奇数番目の音響フレーム、偶数番目の音響フレームは、互いに所定数(本実施形態ではN/2=2048)のサンプルを重複して設定される。したがって、奇数番目の音響フレームを先頭からA1、A2、A3…とし、偶数番目の音響フレームを先頭からB1、B2、B3…とすると、A1はサンプル1〜4096、A2はサンプル4097〜8192、A3はサンプル8193〜12288、B1はサンプル2049〜6144、B2はサンプル6145〜10240、B3はサンプル10241〜14336となる。なお、重複させるサンプル数は適宜設定することが可能である。   Also in this embodiment, as in the first to third embodiments, odd-numbered acoustic frames and even-numbered acoustic frames are set by overlapping a predetermined number of samples (N / 2 = 2048 in this embodiment). Is done. Therefore, if the odd-numbered acoustic frames are A1, A2, A3... From the top, and the even-numbered acoustic frames are B1, B2, B3... From the top, A1 is samples 1 to 4096, A2 is samples 4097 to 8192, A3. Is samples 8193-12288, B1 is samples 2049-6144, B2 is samples 6145-10240, and B3 is samples 10241-14336. Note that the number of samples to be overlapped can be set as appropriate.

次に、周波数変換手段20が、第1音響フレームに対して周波数変換を行って、その第1音響フレームの複素数のスペクトルを得る(ステップS13)。ステップS13では、具体的には、窓関数を利用して周波数変換を行う。周波数変換としては、フーリエ変換、ウェーブレット変換その他、複素数のスペクトルを得られる公知の種々の手法を用いることができる。本実施形態では、第1の実施形態と同様、フーリエ変換を用いた場合を例にとって説明する。   Next, the frequency conversion means 20 performs frequency conversion on the first sound frame to obtain a complex spectrum of the first sound frame (step S13). In step S13, specifically, frequency conversion is performed using a window function. As the frequency conversion, various known methods for obtaining a complex spectrum, such as Fourier transform, wavelet transform, and the like, can be used. In the present embodiment, as in the first embodiment, a case where Fourier transform is used will be described as an example.

本実施形態では、各第1音響フレームについてのフーリエ変換は、上記〔数式1〕で定義されるハニング窓関数W(i)を乗じたものに対して行われることになる。   In the present embodiment, the Fourier transform for each first acoustic frame is performed on the product multiplied by the Hanning window function W (i) defined by the above [Equation 1].

周波数変換手段20が、第1音響フレームに対してフーリエ変換を行う場合は、左チャンネル信号Xl(i)、右チャンネル信号Xr(i)(i=0,…,N−1)に対して、窓関数W(i)を用いて、上記〔数式4〕に従った処理を行い、左チャンネルに対応する変換データの実部Al(j)、虚部Bl(j)、右チャンネルに対応する変換データの実部Ar(j)、虚部Br(j)を得る。上記〔数式4〕による処理の結果、サンプリング周波数が44.1kHz、N=4096の場合、jの値が1つ異なると、周波数が約10.8Hz異なることになる。   When the frequency conversion unit 20 performs Fourier transform on the first sound frame, for the left channel signal Xl (i) and the right channel signal Xr (i) (i = 0,..., N−1), The window function W (i) is used to perform the processing according to the above [Equation 4] and the conversion corresponding to the real part Al (j), the imaginary part Bl (j), and the right channel of the conversion data corresponding to the left channel. Real part Ar (j) and imaginary part Br (j) of data are obtained. As a result of the above processing of [Equation 4], when the sampling frequency is 44.1 kHz and N = 4096, if the value of j is different by one, the frequency will be different by about 10.8 Hz.

ステップS13において上記〔数式4〕に従った処理を実行することにより、各第1音響フレームに対応する複素数のスペクトルが得られる。続いて、第2の実施形態と同様、周波数成分改変手段30が、第1音響フレームから得られた第1スペクトルを用いて、高域に低域打消し成分を追加する処理を行う(ステップS14)。   By executing the processing according to [Formula 4] in step S13, a complex spectrum corresponding to each first acoustic frame is obtained. Subsequently, as in the second embodiment, the frequency component modifying unit 30 performs a process of adding a low frequency cancellation component to the high frequency using the first spectrum obtained from the first acoustic frame (step S14). ).

ステップS14における低域打消し成分の追加処理を行ったら、次に、周波数成分改変手段30は、第2の実施形態と同様、低域打消し成分の追加処理後の第1スペクトルに白色雑音を付加する処理を行う(ステップS15)。具体的には、以下の〔数式12〕に従った処理を実行し、高域の所定の範囲に、各周波数成分を同等に含む雑音である白色雑音を付加する処理を行う。   After performing the low frequency cancellation component addition processing in step S14, next, the frequency component modification means 30 adds white noise to the first spectrum after the low frequency cancellation component addition processing, as in the second embodiment. Processing to add is performed (step S15). Specifically, a process according to the following [Equation 12] is executed, and a process of adding white noise, which is a noise equivalently including each frequency component, to a predetermined high range is performed.

〔数式12〕
Al(j)≧0の場合
Al´(j)← −Al(N/4−j)・α+γ
Al(j)<0の場合
Al´(j)← −Al(N/4−j)・α−γ
Bl(j)≧0の場合
Bl´(j)← −Bl(N/4−j)・α+γ
Bl(j)<0の場合
Bl´(j)← −Bl(N/4−j)・α−γ
Ar(j)≧0の場合
Ar´(j)← −Ar(N/4−j)・α+γ
Ar(j)<0の場合
Ar´(j)← −Ar(N/4−j)・α−γ
Br(j)≧0の場合
Br´(j)← −Br(N/4−j)・α+γ
Br(j)<0の場合
Br´(j)← −Br(N/4−j)・α−γ
[Formula 12]
When Al (j) ≧ 0 Al ′ (j) ← −Al (N / 4−j) · α + γ
When Al (j) <0 Al ′ (j) ← −Al (N / 4−j) · α−γ
When B1 (j) ≧ 0 B1 ′ (j) ← −B1 (N / 4−j) · α + γ
When B1 (j) <0 B1 ′ (j) ← −B1 (N / 4−j) · α−γ
When Ar (j) ≧ 0 Ar ′ (j) ← −Ar (N / 4−j) · α + γ
When Ar (j) <0 Ar ′ (j) ← −Ar (N / 4−j) · α−γ
When Br (j) ≧ 0 Br ′ (j) ← −Br (N / 4−j) · α + γ
When Br (j) <0 Br ′ (j) ← −Br (N / 4−j) · α−γ

周波数成分改変手段30は、周波数成分Al(j)、Bl(j)、Ar(j)、Br(j)に対して、上記〔数式12〕に従った処理を、j=N/4+1,・・・,N/2−1の各jについて実行する。1音響フレームのサンプル数N=4096、サンプリング周波数Fs=44.1kHzの場合、j=N/4は、周波数Fs/4に対応し、j=N/2は、周波数Fs/2に対応する。なお、j=1,・・・N/4の各成分に対しては、改変を加えない。上記〔数式12〕において、αは、0.0<α≦1.0の範囲で設定されるスケーリング実数値である。本実施形態ではα=1.0に設定されている。また、γは信号レベル実数値であり、本実施形態では、Al(j)、Bl(j)、Ar(j)、Br(j)が16ビットの範囲(−32768〜+32767)で定義されている場合、γ=1024.0に設定されている。上記〔数式12〕に示した各式右辺の第1項(−Al(N/4−j)・α等)は低域打消し成分であり、各式右辺の第2項γは、白色雑音である。   The frequency component modifying means 30 performs the processing according to the above [Equation 12] on the frequency components Al (j), Bl (j), Ar (j), Br (j), j = N / 4 + 1,. .., for each j of N / 2-1. When the number of samples of one acoustic frame is N = 4096 and the sampling frequency Fs is 44.1 kHz, j = N / 4 corresponds to the frequency Fs / 4, and j = N / 2 corresponds to the frequency Fs / 2. Note that no modification is made to each component of j = 1,... N / 4. In the above [Equation 12], α is a scaling real value set in a range of 0.0 <α ≦ 1.0. In this embodiment, α = 1.0 is set. In addition, γ is a real value of the signal level. In this embodiment, Al (j), Bl (j), Ar (j), and Br (j) are defined in a 16-bit range (−32768 to +32767). Γ = 1024.0 is set. The first term (−Al (N / 4-j) · α, etc.) on the right side of each equation shown in [Equation 12] is a low-frequency canceling component, and the second term γ on the right side of each equation is white noise. It is.

上記〔数式12〕に示したように、複素数の実数成分および虚数成分の絶対値を増加させるように、所定の強度γを白色雑音として与える。ステップS15における白色雑音の付加処理は、第2の実施形態と同様、奇数番目の音響フレームに対してのみ行われ、偶数番目の音響フレームに対しては行われない。奇数番目と偶数番目で白色雑音をOn/Offさせることにより、原音響信号に対して改変を加える割合を半分にするとともに、On/Offの低周波的な交番変動を加えることにより雑音再生音を明瞭にすることができる。   As shown in the above [Equation 12], a predetermined intensity γ is given as white noise so as to increase the absolute values of the real and imaginary components of the complex number. The white noise addition processing in step S15 is performed only for odd-numbered sound frames, and not performed for even-numbered sound frames, as in the second embodiment. By turning on / off white noise at odd and even numbers, the ratio of modification to the original sound signal is halved and noise reproduction sound is reduced by adding low frequency alternating fluctuations of On / Off. Can be clear.

本実施形態では、ステップS14、S15における周波数成分の改変処理を奇数番目の音響フレームに対して行い、偶数番目の音響フレームに対しては行っていないが、前述の通り、1つ置きの音響フレームに対して改変処理を行う必要はなく、妨害音の効果が高い手法を適宜選択すれば良い。   In the present embodiment, the frequency component modification process in steps S14 and S15 is performed on the odd-numbered sound frames and not performed on the even-numbered sound frames. There is no need to perform modification processing on the above, and a method with a high effect of interfering sound may be appropriately selected.

周波数成分改変手段30が、ステップS15における白色雑音付加を行って改変処理を終えたら、次に、周波数逆変換手段40が、改変後のスペクトルを周波数逆変換して改変音響フレームを得る処理を行う(ステップS16)。この周波数逆変換は、当然のことながら、周波数変換手段20が実行した手法に対応していることが必要となる。本実施形態では、周波数変換手段20において、フーリエ変換を施しているため、周波数逆変換手段40は、上記〔数式7〕に従った処理によりフーリエ逆変換を実行することになる。   After the frequency component modification unit 30 performs the white noise addition in step S15 and completes the modification process, the frequency inverse transform unit 40 performs a process of performing frequency inverse transform on the modified spectrum to obtain a modified acoustic frame. (Step S16). Naturally, the inverse frequency conversion needs to correspond to the method executed by the frequency conversion means 20. In the present embodiment, since the frequency transform unit 20 performs the Fourier transform, the frequency inverse transform unit 40 performs the Fourier inverse transform by the process according to the above [Equation 7].

ステップS16における周波数逆変換の後、得られた改変音響フレームを順次出力して改変音響信号を得ることができる。ただし、前述の通りステップS16までの処理の段階では、複製防止効果はない。そこで、本実施形態においても、第1〜第3の実施形態と同様、複製時にLPF処理が行われた場合にも所望の妨害音が再生されるようにするため、以下のステップS17、ステップS18の処理を行う。   After the frequency inversion in step S16, the modified acoustic frames obtained can be sequentially output to obtain the modified acoustic signal. However, as described above, there is no copy prevention effect at the stage of processing up to step S16. Therefore, also in the present embodiment, as in the first to third embodiments, in order to reproduce a desired disturbing sound even when the LPF process is performed at the time of copying, the following steps S17 and S18 are performed. Perform the process.

まず、ステップS16までの処理により得られた改変音響信号に対して、間引き・拡大処理を行う(ステップS17)。具体的には、まず、間引き処理として、第3の実施形態と同様、サンプリング周波数Fsの改変音響信号を、サンプリング周波数Fs/2でダウンサンプリングする。   First, thinning / enlarging processing is performed on the modified acoustic signal obtained by the processing up to step S16 (step S17). Specifically, first, as a thinning-out process, the modified acoustic signal having the sampling frequency Fs is down-sampled at the sampling frequency Fs / 2, as in the third embodiment.

さらに、間引き処理した信号の周波数方向への拡大処理を行う。具体的には、間引き処理したサンプリング周波数Fs/2の信号を、サンプリング周波数Fsでアップサンプリングする。   Further, an expansion process in the frequency direction of the thinned signal is performed. Specifically, the sampling frequency Fs / 2 signal subjected to the thinning process is up-sampled at the sampling frequency Fs.

続いて、間引き・拡大処理後の信号に重み付けを行って改変音響信号に合成する処理を行う(ステップS18)。具体的には、改変音響信号の周波数Fs/4以下の成分に、間引き・拡大処理後の信号成分が加算されることになる。   Subsequently, the signal after the thinning / enlarging process is weighted and synthesized with the modified acoustic signal (step S18). Specifically, the signal component after the thinning / enlarging process is added to the component of the modified acoustic signal having a frequency of Fs / 4 or less.

改変音響信号補正手段55が上記ステップS17、S18で行った処理は、第1の実施形態と同様、上記〔数式8〕として、まとめることができる。   The processing performed by the modified acoustic signal correcting unit 55 in steps S17 and S18 can be summarized as the above [Equation 8] as in the first embodiment.

改変音響フレーム出力手段50は、改変音響信号補正手段55の処理により得られた補正後の改変音響フレームを順次出力ファイルに出力する。上記図9のフローチャートに示した処理は、第1音響信号の全ての第1音響フレームに対して実行される。このようにして全ての第1音響フレームに対して処理を行った結果、改変音響フレームの集合である改変音響信号が、改変音響信号記憶部62に記憶される。本実施形態では、第1音響信号の先頭から最後まで妨害音を埋め込むようにしたが、埋め込む位置を設定して、その範囲にだけ埋め込むようにすることも可能である。   The modified sound frame output unit 50 sequentially outputs the modified sound frames after correction obtained by the processing of the modified sound signal correction unit 55 to the output file. The process shown in the flowchart of FIG. 9 is executed for all the first sound frames of the first sound signal. As a result of performing processing on all the first sound frames in this way, a modified sound signal that is a set of modified sound frames is stored in the modified sound signal storage unit 62. In the present embodiment, the disturbing sound is embedded from the beginning to the end of the first acoustic signal. However, it is also possible to set an embedding position and embed only in that range.

(3.変形例等)
以上、本発明の好適な実施形態について限定したが、本発明は上記実施形態に限定されず、種々の変形が可能である。例えば、上記実施形態では、第1音響信号において、周波数Ft以上の信号成分を除去し、周波数Ftを中心に周波数Ft以下の信号成分を高域の周波数方向に折り返しているが、具体的なFtの値は上記実施形態に限定されず、様々な値を設定することが可能である。
(3. Modified examples)
As mentioned above, although it limited about the suitable embodiment of the present invention, the present invention is not limited to the above-mentioned embodiment, and various modifications are possible. For example, in the above-described embodiment, in the first acoustic signal, the signal component having the frequency Ft or higher is removed, and the signal component having the frequency Ft or lower is folded around the frequency Ft in the high frequency direction. The value of is not limited to the above embodiment, and various values can be set.

また、上記実施形態では、商品として一般に流通している2チャンネルのステレオ音響信号を利用した場合を例にとって説明したが、5.1チャンネルのサラウンド音響信号に対してもLFCを除く5チャンネルの各音響信号に同様な処理を施せば良く、逆に1チャンネルのモノラル音響信号を利用しても良い。この場合は、上記LチャンネルまたはRチャンネルのいずれか一方に対して行った処理を実行すれば良い。   In the above embodiment, a case where a two-channel stereo sound signal generally distributed as a product is used has been described as an example, but each of five channels except for LFC is also applied to a 5.1 channel surround sound signal. A similar process may be applied to the acoustic signal, and conversely, a mono-channel monaural acoustic signal may be used. In this case, the process performed on either the L channel or the R channel may be executed.

また、上記第2、第4の実施形態では、ステップS14、S15における低域打消し成分、白色雑音の付加処理を奇数番目の音響フレームまたは偶数番目の音響フレームに対して行ったが、2つ以上のフレーム間隔を置きながら付加処理を実行するようにしても良いし、あるいは全ての音響フレームに対して実行するようにしても良い。   In the second and fourth embodiments, the low-frequency cancellation component and white noise addition processing in steps S14 and S15 are performed on the odd-numbered acoustic frame or the even-numbered acoustic frame. The additional processing may be executed with the above frame interval, or may be executed for all sound frames.

1・・・CPU
2・・・RAM
3・・・記憶装置
4・・・キー入力I/F
5・・・データ入出力I/F
6・・・表示出力I/F
8・・・アップサンプリング手段
10・・・音響フレーム読込手段
20・・・周波数変換手段
30・・・周波数成分改変手段
40・・・周波数逆変換手段
45・・・改変音響フレーム補正手段
50・・・改変音響フレーム出力手段
60・・・記憶手段
61・・・音響信号記憶部
62・・・改変音響信号記憶部
1 ... CPU
2 ... RAM
3 ... Storage device 4 ... Key input I / F
5. Data input / output I / F
6 ... Display output I / F
8 ... Upsampling means 10 ... Acoustic frame reading means 20 ... Frequency converting means 30 ... Frequency component modifying means 40 ... Inverse frequency converting means 45 ... Modified acoustic frame correcting means 50 ... -Modified sound frame output means 60 ... storage means 61 ... sound signal storage section 62 ... modified sound signal storage section

Claims (9)

時系列のサンプル列で構成されるサンプリング周波数Fsの原音響信号に対して、時系列のサンプル列で構成される第2の音響信号を聴取不能な状態で埋め込む装置であって、
前記原音響信号から所定数のサンプルで構成される第1音響フレームを読み込むとともに、前記第2の音響信号から所定数のサンプルで構成される第2音響フレームを読み込む音響フレーム読込手段と、
前記第1音響フレームに対して周波数変換を行い、複素周波数成分である第1スペクトルを得るとともに、前記第2音響フレームに対して周波数変換を行い、複素周波数成分である第2スペクトルを得る周波数変換手段と、
前記第1スペクトルの信号成分の中で、周波数Ft以上の信号成分を除去するとともに、前記周波数Ftを中心に前記周波数Ft以下の信号成分を高域の周波数方向に折り返し、折り返された周波数Ftから周波数2Ftの範囲の第1スペクトルの信号成分に対して正負符号を反転しかつ所定の係数値を乗算しながら、前記第1スペクトルの対応する周波数の信号成分に加算することにより、前記第1スペクトルの周波数成分を改変する第1の周波数成分改変手段と、
前記第2スペクトルの信号成分の中で、周波数Ft以上の信号成分を除去するとともに、前記周波数Ftを中心に前記周波数Ft以下の信号成分を高域の周波数方向に折り返し、折り返された周波数Ftから周波数2Ftの範囲の第2スペクトルの信号成分に対して所定の係数値を乗算しながら、前記改変された第1スペクトルの対応する周波数の信号成分に加算することにより、前記第1スペクトルの周波数成分を改変する第2の周波数成分改変手段と、
前記周波数成分が改変された第1スペクトルに対して周波数逆変換を行って、改変音響フレームを生成する周波数逆変換手段と、
前記生成された改変音響フレームを順次出力する改変音響フレーム出力手段と、
を有することを特徴とする音響信号に対する第2の音響信号の埋込み装置。
A device for embedding a second acoustic signal composed of a time-series sample sequence in an inaudible state with respect to an original acoustic signal of a sampling frequency Fs composed of a time-series sample sequence,
An acoustic frame reading means for reading a first acoustic frame composed of a predetermined number of samples from the original acoustic signal and for reading a second acoustic frame composed of a predetermined number of samples from the second acoustic signal;
Frequency conversion is performed on the first sound frame to obtain a first spectrum that is a complex frequency component, and frequency conversion is performed on the second sound frame to obtain a second spectrum that is a complex frequency component. Means,
Among the signal components of the first spectrum, the signal components of the frequency Ft or higher are removed, the signal components of the frequency Ft or lower are folded back in the high frequency direction around the frequency Ft, and the folded frequency Ft is used. while multiplying the inverting and predetermined coefficient value the sign for the first spectral signal component of the range of frequencies 2 Ft, by adding the signal component of the corresponding frequency before Symbol first spectrum, said first First frequency component modifying means for modifying the frequency component of the spectrum;
Among the signal components of the second spectrum, the signal components of the frequency Ft or higher are removed, the signal components of the frequency Ft or lower are folded around the frequency Ft in the high frequency direction, and the folded frequency Ft is used. By multiplying the signal component of the second spectrum in the range of frequency 2Ft by a predetermined coefficient value and adding to the signal component of the corresponding frequency of the modified first spectrum, the frequency component of the first spectrum A second frequency component modifying means for modifying
Frequency inverse transforming means for performing frequency inverse transform on the first spectrum in which the frequency component is modified to generate a modified acoustic frame;
Modified acoustic frame output means for sequentially outputting the generated modified acoustic frames;
A device for embedding a second acoustic signal with respect to the acoustic signal.
時系列のサンプル列で構成されるサンプリング周波数Fsの原音響信号に対して、妨害音を聴取不能な状態で埋め込む装置であって、
前記原音響信号から所定数のサンプルで構成される第1音響フレームを読み込む音響フレーム読込手段と、
前記第1音響フレームに対して周波数変換を行い、複素周波数成分である第1スペクトルを得る周波数変換手段と、
前記第1スペクトルの信号成分の中で、周波数Ft以上の信号成分を除去するとともに、前記周波数Ftを中心に前記周波数Ft以下の信号成分を高域の周波数方向に折り返し、折り返された周波数Ftから周波数2Ftの範囲の第1スペクトルの信号成分に対して正負符号を反転しかつ所定の係数値を乗算しながら、前記第1スペクトルの対応する周波数の信号成分に加算することにより、前記第1スペクトルの周波数成分を改変する第1の周波数成分改変手段と、
前記第1スペクトルの信号成分の中で、周波数Ft以上、周波数Ft以下の信号成分に対して、信号の絶対値が所定値だけ増加するように、前記第1スペクトルの周波数成分を改変する第2の周波数成分改変手段と、
前記周波数成分が改変された第1スペクトルに対して周波数逆変換を行って、改変音響フレームを生成する周波数逆変換手段と、
前記生成された改変音響フレームを順次出力する改変音響フレーム出力手段と、
を有することを特徴とする音響信号に対する妨害音の埋込み装置。
An apparatus that embeds an interfering sound in an inaudible state with respect to an original sound signal having a sampling frequency Fs composed of a time-series sample sequence,
Sound frame reading means for reading a first sound frame composed of a predetermined number of samples from the original sound signal;
Frequency conversion means for performing frequency conversion on the first acoustic frame to obtain a first spectrum which is a complex frequency component;
Among the signal components of the first spectrum, the signal components of the frequency Ft or higher are removed, the signal components of the frequency Ft or lower are folded back in the high frequency direction around the frequency Ft, and the folded frequency Ft is used. while multiplying the inverting and predetermined coefficient value the sign for the first spectral signal component of the range of frequencies 2 Ft, by adding the signal component of the corresponding frequency before Symbol first spectrum, said first First frequency component modifying means for modifying the frequency component of the spectrum;
The frequency component of the first spectrum is modified so that the absolute value of the signal increases by a predetermined value with respect to the signal component of the frequency Ft or more and the frequency 2 Ft or less among the signal components of the first spectrum. Two frequency component modification means;
Frequency inverse transforming means for performing frequency inverse transform on the first spectrum in which the frequency component is modified to generate a modified acoustic frame;
Modified acoustic frame output means for sequentially outputting the generated modified acoustic frames;
A device for embedding a disturbing sound for an acoustic signal, comprising:
請求項2において、
前記第1の周波数成分改変手段および第2の周波数成分改変手段は、前記音響フレーム読込手段により読み込まれた音響フレームのうち、所定間隔ごとの音響フレームに対して、処理を行うものであることを特徴とする音響信号に対する妨害音の埋込み装置。
In claim 2,
The first frequency component modifying means and the second frequency component modifying means perform processing on acoustic frames at predetermined intervals among the acoustic frames read by the acoustic frame reading means. A device for embedding interfering sound with respect to a characteristic acoustic signal.
請求項1から請求項3のいずれか一項において、
前記原音響信号に対して、サンプリング周波数Fs´(Fs´>Fs)でアップサンプリングを行い、広帯域の原音響信号を作成するアップサンプリング手段をさらに有し、
前記Ft=Fs/2であり、
前記音響フレーム読込手段、前記周波数変換手段、前記第1の周波数成分改変手段、前記第2の周波数成分改変手段、前記周波数逆変換手段、前記改変音響フレーム出力手段は、前記アップサンプリング後の原音響信号に対して処理を行うものであることを特徴とする音響信号に対する第2の音響信号の埋込み装置または音響信号に対する妨害音の埋込み装置。
In any one of Claims 1-3,
Upsampling means for performing upsampling on the original sound signal at a sampling frequency Fs ′ (Fs ′> Fs) to create a wideband original sound signal;
Ft = Fs / 2,
The acoustic frame reading unit, said frequency converting means, before Symbol first frequency component changing means, the second frequency component changing means, said inverse frequency transform means, said modified acoustic frame output means, the original after the upsampling A device for embedding a second acoustic signal for an acoustic signal or an embedding device for an interfering sound for an acoustic signal, characterized by performing processing on the acoustic signal.
請求項1から請求項3のいずれか一項において、
前記Ft=Fs/4であることを特徴とする音響信号に対する第2の音響信号の埋込み装置または音響信号に対する妨害音の埋込み装置。
In any one of Claims 1-3,
The second acoustic signal embedding device for an acoustic signal or the disturbing sound embedding device for an acoustic signal, wherein Ft = Fs / 4.
請求項1から請求項5のいずれか一項において、
前記改変音響フレームの奇数番目と偶数番目のサンプル値のうち一方のサンプル値を、当該サンプル値の直前のサンプル値に1以下の実数値である重みGを乗算した値と、当該サンプル値に(1−G)を乗算した値との和に変換することにより前記改変音響フレームを補正する改変音響フレーム補正手段をさらに有し、
前記改変音響フレーム出力手段は、前記補正された改変音響フレームを順次出力するものであることを特徴とする音響信号に対する第2の音響信号の埋込み装置または音響信号に対する妨害音の埋込み装置。
In any one of Claims 1-5,
One sample value of the odd-numbered and even-numbered sample values of the modified acoustic frame is multiplied by a sample value immediately before the sample value by a weight G that is a real value of 1 or less, and the sample value is ( 1-G) is further provided with modified acoustic frame correction means for correcting the modified acoustic frame by converting it into a sum with a value multiplied by 1).
The modified acoustic frame output means sequentially outputs the corrected modified acoustic frames, and a second acoustic signal embedding device for an acoustic signal or an interfering sound embedding device for an acoustic signal.
請求項6において、
前記改変音響フレーム補正手段は、前記改変音響フレームに含まれるサンプルの平均値に基づいて前記重みGを算出するものであることを特徴とする音響信号に対する第2の音響信号の埋込み装置または音響信号に対する妨害音の埋込み装置。
In claim 6,
The modified acoustic frame correcting means calculates the weight G based on an average value of samples included in the modified acoustic frame, or a second acoustic signal embedding device or an acoustic signal for an acoustic signal Interference sound embedding device against.
請求項1から請求項7のいずれか一項において、
前記周波数変換手段は、窓幅Nサンプルとして、サンプル位置i(0≦i≦N−1)における重みW(i)(0≦W(i)≦1)が、W(i)=0.5−0.5cos(2πi/N)で定義されるハニング窓関数を用いて周波数変換を行うものであることを特徴とする音響信号に対する第2の音響信号の埋込み装置または音響信号に対する妨害音の埋込み装置。
In any one of Claims 1-7,
The frequency converting means uses a weight W (i) (0 ≦ W (i) ≦ 1) at a sample position i (0 ≦ i ≦ N−1) as a window width N samples, and W (i) = 0.5. A device for embedding a second acoustic signal in an acoustic signal or embedding an interfering sound in an acoustic signal, wherein frequency conversion is performed using a Hanning window function defined by −0.5 cos (2πi / N) apparatus.
請求項1から請求項8のいずれか一項に記載の音響信号に対する第2の音響信号の埋込み装置または音響信号に対する妨害音の埋込み装置として、コンピュータを機能させるためのプログラム。   A program for causing a computer to function as the second acoustic signal embedding device for the acoustic signal or the disturbing sound embedding device for the acoustic signal according to any one of claims 1 to 8.
JP2012050552A 2012-03-07 2012-03-07 Second sound signal embedding device for acoustic signal and interfering sound embedding device for acoustic signal Expired - Fee Related JP6003107B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012050552A JP6003107B2 (en) 2012-03-07 2012-03-07 Second sound signal embedding device for acoustic signal and interfering sound embedding device for acoustic signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012050552A JP6003107B2 (en) 2012-03-07 2012-03-07 Second sound signal embedding device for acoustic signal and interfering sound embedding device for acoustic signal

Publications (2)

Publication Number Publication Date
JP2013186253A JP2013186253A (en) 2013-09-19
JP6003107B2 true JP6003107B2 (en) 2016-10-05

Family

ID=49387740

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012050552A Expired - Fee Related JP6003107B2 (en) 2012-03-07 2012-03-07 Second sound signal embedding device for acoustic signal and interfering sound embedding device for acoustic signal

Country Status (1)

Country Link
JP (1) JP6003107B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017040305A1 (en) * 2015-08-28 2017-03-09 Pegasus Media Security, Llc System and method for preventing unauthorized recording, retransmission and misuse of audio and video

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4644422A (en) * 1982-07-22 1987-02-17 Tvi Systems, Ltd. Anti-copy system
EP0955634A1 (en) * 1998-05-04 1999-11-10 Spiro J. Pandelidis High Tech Applications Anti-copying system for audio signals
US20070192091A1 (en) * 2005-07-01 2007-08-16 Truelight Technologies, Llc Protection against sound piracy by microphones

Also Published As

Publication number Publication date
JP2013186253A (en) 2013-09-19

Similar Documents

Publication Publication Date Title
JP5409377B2 (en) High-frequency interpolation device and high-frequency interpolation method
JP5984943B2 (en) Improving stability and ease of listening to sound in hearing devices
US20070071249A1 (en) System for the simulation of a room impression and/or sound impression
JP6401521B2 (en) Signal processing apparatus and signal processing method
US9076437B2 (en) Audio signal processing apparatus
CN111970627B (en) Audio signal enhancement method, device, storage medium and processor
JP5147851B2 (en) Audio signal interpolation apparatus and audio signal interpolation method
TWI690220B (en) Spectral defect compensation for crosstalk processing of spatial audio signals
TWI750781B (en) System, method, and non-transitory computer readable medium for processing an audio signal
US20070052560A1 (en) Bit-stream watermarking
KR101637407B1 (en) Apparatus and method and computer program for generating a stereo output signal for providing additional output channels
JP4867765B2 (en) Information embedding device for sound signal and device for extracting information from sound signal
JP2006243043A (en) High-frequency interpolating device and reproducing device
JP6078993B2 (en) Device for embedding disturbance sound for acoustic signal
JP6003107B2 (en) Second sound signal embedding device for acoustic signal and interfering sound embedding device for acoustic signal
TW201317984A (en) Signal processing apparatus, signal processing method, and program
US20090259476A1 (en) Device and computer program product for high frequency signal interpolation
JP6003098B2 (en) Device for embedding interference noise for acoustic signals
JP2007272059A (en) Audio signal processing apparatus, audio signal processing method, program and recording medium
JP6003099B2 (en) Device for embedding different acoustic signals relative to acoustic signals
US20070192091A1 (en) Protection against sound piracy by microphones
JP6355049B2 (en) Acoustic signal processing method and acoustic signal processing apparatus
JP5906659B2 (en) Device for embedding interfering signals with respect to acoustic signals
JP5224586B2 (en) Audio signal interpolation device
JP5987511B2 (en) Device for embedding interfering sound for acoustic signals

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20130823

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150116

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160128

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160209

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160408

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160809

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160822

R150 Certificate of patent or registration of utility model

Ref document number: 6003107

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees