JP5011872B2

JP5011872B2 - 音響信号に対する情報の埋め込み装置および音響信号からの情報の抽出装置

Info

Publication number: JP5011872B2
Application number: JP2006206578A
Authority: JP
Inventors: 敏雄茂出木
Original assignee: Dai Nippon Printing Co Ltd
Current assignee: Dai Nippon Printing Co Ltd
Priority date: 2006-07-28
Filing date: 2006-07-28
Publication date: 2012-08-29
Anticipated expiration: 2026-07-28
Also published as: JP2008033024A

Description

本発明は、ＣＤ・ＤＶＤ等を用いた民生・業務用途における鑑賞用のパッケージ音楽分野、放送事業者等が商業目的で配信する放送・ネットワーク音楽配信分野における音楽著作権の保護（不正コピーの監視）および音楽属性情報の提供（楽曲タイトル検索サービス）分野、ミュージアム、イベント会場における展示説明ナレーションに連動した文字情報の提供サービス分野、放送番組やＣＤ／ＤＶＤパッケージの音声信号からＵＲＬなどの情報を抽出し、携帯電話を用いて所定のコンテンツに関連するｗｅｂサイトにアクセスして詳細情報を抽出したり、アンケートに回答したりする非接触なインターネットのゲートウェイサービス分野に関する。

最近、流れている音楽のタイトル等を知ることができる楽曲属性情報の提供サービスとして、放送された音楽に対して日時と地域を放送局に照会したり、携帯電話で流れている音楽断片を録音してデータベースに登録されているメロディーと照合したりするサービスが実用化されている（例えば、特許文献１、２参照）。

特許文献１、２に記載の発明では、録音した音楽の断片と、データベースに登録されているメロディーと照合するため、データベースに登録される楽曲が増えると、処理負荷が増え、類似したメロディーを誤判定する可能性が増える。そこで、曲名やアーチスト情報などの楽曲属性情報を不可聴な電子透かしとして音響信号に埋め込む手法も提案されている（例えば、特許文献３〜６参照）。

特許文献１〜６に記載の手法では、埋め込み可能な情報量が少なく、音質が少なからず劣化し、各種信号処理により透かし情報が消失し、またアナログコピーに対しては、透かし検出が困難であるという問題がある。そこで、本出願人は、複数チャンネル有する音響信号の低周波数成分の比率を属性情報のビット値に応じて変更することにより、属性情報（付加情報）を埋め込む手法を提案した（特許文献７参照）。

特許文献７に記載の発明は、ステレオ音響信号にのみ対応したものであったが、本出願人は、モノラル音響信号にも対応可能なように改良を加え、低周波成分のうち、より高い低周波成分とより低い低周波成分を利用して付加情報を埋め込む手法を提案した（特許文献８参照）。

特許文献８に記載の発明では、低い方の低周波数帯が、一般的なマイクロフォンの感度範囲に含まれないことになる場合が多く、埋め込まれた情報を正しく識別することができない場合が生じるため、本出願人は、音響信号の所定区間における低周波成分の先頭部分と後部部分のスペクトル強度の割合を変更することにより、付加情報を埋め込む手法を提案した（特許文献９参照）。

上記特許文献７〜９に記載の発明では、いずれも周波数４４．１ｋＨｚでサンプリングした音響信号について、４０９６サンプルを１音響フレームとし、この１音響フレームについて１ビットの情報を埋め込む処理を行っている。実際には、区切りを示す情報や、埋め込みエラーが生じた場合に対処する音響フレームも必要となり、全ての音響フレームに埋め込み対象とする有効な情報を埋め込むことができるわけではないため、現実には、毎秒１０ビット程度の情報量が埋め込み可能となっている。
特開２００２−２５９４２１号公報特開２００３−１５７０８７号公報特開平１１−１４５８４０号公報特開平１１−２１９１７２号公報特許第３３２１７６７号公報特開２００３−９９０７７号公報特願２００５−５１５７号特願２００５−５８８２４号特願２００５−１４７７４３号

しかしながら、付加情報として例えば“http:www.○○○.co.jp”といったＵＲＬを埋め込もうとすると、最低でも１８秒程度を要することになり、抽出時にも同様の時間を要するため、実用的に問題がある。埋め込み可能な情報量を増やすためには、単純に上記１音響フレームを構成するサンプル数を１／２にするという手法がある。

しかし、特許文献７〜９では、音響フレームに周波数変換を行うことにより処理するものであるため、１音響フレームのサンプル数を１／２にすると、周波数変換により得られる周波数成分の要素数も１／２となり、１音響フレームにおける解析のための情報量は、現状に比べ１／４となってしまう。このため、特に抽出時において、正確な情報を抽出することが困難となる。

そこで、本発明は、従来と同等以上の抽出精度を維持しつつ、より多くの情報を埋め込むことが可能な音響信号に対する情報の埋め込み装置、音響信号からの情報の抽出装置を提供することを課題とする。

上記課題を解決するため、本発明では、時系列のサンプル列で構成される音響信号に対して、付加情報を聴取不能な状態で埋め込む装置であって、前記音響信号より、所定数のサンプルを音響フレームとして読み込む音響フレーム読込手段と、前記音響フレームに対して、前記音響フレームの前部を抽出するための第１窓関数、前記音響フレームの中央部を抽出するための第２窓関数、前記音響フレームの後部を抽出するための第３窓関数を用いてそれぞれ周波数変換を行い、前記第１窓関数に対応するスペクトルである第１窓スペクトル、前記第２窓関数に対応するスペクトルである第２窓スペクトル、前記第３窓関数に対応するスペクトルである第３窓スペクトルを生成する周波数変換手段と、前記生成された第１窓スペクトルから互いに重複しない２以上の低周波数範囲のスペクトル集合を抽出するとともに、前記第３窓スペクトルから互いに重複しない２以上の低周波数範囲のスペクトル集合を抽出し、前記埋め込むべき付加情報の情報配列に基づいて、抽出したスペクトル集合の強度を変更すると共に、中央の第２窓関数に対応する低周波成分を除去する低周波成分変更手段と、前記変更された低周波スペクトルを含む各窓スペクトルに対して周波数逆変換を行って、改変音響フレームを生成する周波数逆変換手段と、前記生成された改変音響フレームを順次出力する改変音響フレーム出力手段を有する音響信号に対する情報の埋め込み装置を提供する。

また、本発明では、音響信号から、あらかじめ聴取不能な状態で埋め込まれた付加情報を抽出する装置であって、前記音響信号の所定区間をデジタル化して、所定数のサンプルで構成される音響フレームを獲得する音響フレーム獲得手段と、前記音響フレームに対して、前記音響フレームの前部を抽出するための第１窓関数、前記音響フレームの後部を抽出するための第３窓関数を用いてそれぞれ周波数変換を行い、前記第１窓関数に対応するスペクトルである第１窓スペクトル、前記第３窓関数に対応するスペクトルである第３窓スペクトルを生成する周波数変換手段と、前記生成された第１窓スペクトルから互いに重複しない２以上の低周波数範囲のスペクトル集合を抽出するとともに、前記第３窓スペクトルから互いに重複しない２以上の低周波数範囲のスペクトル集合を抽出し、抽出した各スペクトル集合のスペクトル強度を算出し、当該強度の関係に基づいて、所定の符号を出力する符号化手段と、前記出力された符号に対応する情報配列を、所定の規則により変換して付加情報を抽出する付加情報抽出手段を有する音響信号からの情報の抽出装置を提供する。

本発明によれば、音響信号の低周波領域から互いに重複しない２以上の低周波成分を抽出するとともに、音響信号における所定区間の低周波成分を前部部分と後部部分に分け、所定区間の低周波領域において分けた複数成分のスペクトル強度を変更するようにしたので、従来と同等以上の抽出精度を維持しつつ、より多くの情報を埋め込むことが可能となるという効果を奏する。

以下、本発明の実施形態について図面を参照して詳細に説明する。
（１．本発明の基本概念）
まず、本発明の基本概念について、特許文献８、９に記載の発明と比較して説明する。本発明、特許文献８、９に記載の発明は、いずれも音響信号から所定数（例えば４０９６個）のサンプルを１音響フレームとして抽出し、この音響フレームに対して、周波数変換の後、その低周波成分の状態を、埋め込むべき付加情報の値に応じて変更するものである。図１に、従来の手法による低周波成分の状態を１音響フレーム単位で示す。図１に示す各音響フレームにおいて、横軸は時間方向、縦軸は周波数方向を示している。また、網掛けされた部分は、低周波成分が存在している部分を示し、網掛けが濃いほど成分強度が強いことを示している。

特許文献８、９に記載の発明については、図１（ａ）（ｅ）に示すような原状態の低周波成分に対して、符号０を埋め込む場合、Ｌ-ch（左チャンネル）の信号の低周波成分を全て除去し、除去した成分と同等の成分をＲ-ch（右チャンネル）の信号の低周波成分に加算して図１（ｂ）（ｆ）に示すような状態に変更するのは同じである。

特許文献８に記載の発明では、低周波成分のうちより高い成分とより低い成分の分布により埋め込む符号の区別を行う。したがって、符号１を埋め込む場合、図１（ｃ）に示すように、Ｌ-chの信号のより高い低周波成分を除去し、除去した成分と同等の成分をＲ-chの信号に加算し、逆に、Ｒ-chの信号のより低い低周波成分を除去し、除去した成分と同等の成分をＬ-chの信号に加算する。符号２を埋め込む場合は、図１（ｄ）に示すように、Ｌ-chの信号のより低い低周波成分を除去し、除去した成分と同等の成分をＲ-chの信号に加算し、逆に、Ｒ-chの信号のより高い低周波成分を除去し、除去した成分と同等の成分をＬ-chの信号に加算する。

特許文献９に記載の発明では、低周波成分のうち時間的に前部（過去）の成分と後部（未来）の成分の分布により埋め込む符号の区別を行う。したがって、符号１を埋め込む場合、図１（ｇ）に示すように、Ｌ-chの信号の後部の低周波成分を除去し、除去した成分と同等の成分をＲ-chの信号に加算し、逆に、Ｒ-chの信号の前部の低周波成分を除去し、除去した成分と同等の成分をＬ-chの信号に加算する。符号２を埋め込む場合は、図１（ｈ）に示すように、Ｌ-chの信号の前部の低周波成分を除去し、除去した成分と同等の成分をＲ-chの信号に加算し、逆に、Ｒ-chの信号の後部の低周波成分を除去し、除去した成分と同等の成分をＬ-chの信号に加算する。

特許文献８に記載の発明では、図１（ｂ）〜（ｄ）に示すような３つの状態に低周波成分を変更することにより、情報の埋め込みを行い、特許文献９に記載の発明では、図１（ｆ）〜（ｈ）に示すような３つの状態に低周波成分を変更することにより、情報の埋め込みを行っている。３つの状態のうち、１つは、埋め込むべき付加情報を構成するワード間の区切りやエラー処理等に用いるものであるので、実質埋め込むことができるのは２つの状態、すなわち、１ビットに相当する。したがって、特許文献８、９に記載の発明では、１音響フレームに対して１ビットの情報が埋め込み可能となる。

図２に、本発明第１の実施形態による低周波成分の状態を１音響フレーム単位で示す。図２に示す各音響フレームにおいても、横軸は時間方向、縦軸は周波数方向を示している。本発明では、特許文献８、９に記載の発明のそれぞれの特徴を組み合わせ低周波成分のうちより高い成分とより低い成分の分布と、低周波成分のうち時間的に前部の成分と後部の成分の分布を組み合わせて埋め込む符号の区別を行う。

本発明第１の実施形態においても、図２（ａ）に示すような原状態の低周波成分に対して、符号０を埋め込む場合、Ｌ-chの信号の低周波成分を全て除去し、除去した成分と同等の成分をＲ-chの信号の低周波成分に加算して図２（ｂ）に示すような状態に変更するのは、特許文献８、９に記載の発明と同じである。なお、図２においては、図１と異なり、縦軸の周波数方向が５つに区分されているが、これは、最下部にギャップ領域を設けたためである。このギャップ領域は、抽出対象であるＬ-chの信号においては、常に成分が除去され、除去された成分と同等の成分がＲ-chの信号の低周波成分に加算される。最下部にギャップ領域を設けることにより、埋め込み可能な低周波成分の上限を高くすることができる。さらに、５つに区分された低周波成分のうち最上部と上から３番目にもギャップ領域を設けている。上から２番目は上位低周波領域であり、上から４番目は下位低周波領域である。図２（ｂ）に示すように、上位低周波領域の前部におけるスペクトルをＳＰ１Ｕ、上位低周波領域の後部におけるスペクトルをＳＰ３Ｕ、下位低周波領域の前部におけるスペクトルをＳＰ１Ｄ、下位低周波領域の後部におけるスペクトルをＳＰ３Ｄで表現することとする。また、直流成分すなわち周波数０からスペクトルＳＰ１ＤおよびＳＰ３Ｄの下限周波数Ｆ１までのギャップ領域をＧ１ＤおよびＧ３Ｄ、スペクトルＳＰ１ＤおよびＳＰ３Ｄの上限周波数とスペクトルＳＰ１ＵおよびＳＰ３Ｕの下限周波数までのギャップ領域をＧ１ＭおよびＧ３Ｍ、スペクトルＳＰ１ＵおよびＳＰ３Ｕの上限周波数からＦ２までのギャップ領域をＧ１ＵおよびＧ３Ｕで表現することとする。

本発明で、符号１を埋め込む場合、図２（ｃ）に示すように、Ｌ-chの信号の後部の低周波成分を除去し、除去した成分と同等の成分をＲ-chの信号に加算し、逆に、Ｒ-chの信号の前部の低周波成分を除去し、除去した成分と同等の成分をＬ-chの信号に加算する。符号２を埋め込む場合は、図２（ｄ）に示すように、Ｌ-chの信号の前部の低周波成分を除去し、除去した成分と同等の成分をＲ-chの信号に加算し、逆に、Ｒ-chの信号の後部の低周波成分を除去し、除去した成分と同等の成分をＬ-chの信号に加算する。

符号３を埋め込む場合、図２（ｅ）に示すように、Ｌ-chの信号の前部のより高い低周波成分と後部のより低い低周波成分を除去し、除去した成分と同等の成分をＲ-chの信号に加算し、逆に、Ｒ-chの信号の前部のより低い低周波成分と後部のより高い低周波成分を除去し、除去した成分と同等の成分をＬ-chの信号に加算する。符号４を埋め込む場合は、図２（ｆ）に示すように、Ｌ-chの信号の前部のより低い低周波成分と後部のより高い低周波成分を除去し、除去した成分と同等の成分をＲ-chの信号に加算し、逆に、Ｒ-chの信号の前部のより高い低周波成分と後部のより低い低周波成分を除去し、除去した成分と同等の成分をＬ-chの信号に加算する。

本発明第１の実施形態では、図２（ｂ）〜（ｆ）に示すような５つの状態に低周波成分を変更することにより、情報の埋め込みを行っている。５つの状態のうち、１つは、埋め込むべき付加情報を構成するワード間の区切りやエラー処理等に用いるものであるので、実質埋め込むことができるのは４つの状態、すなわち、２ビットに相当する。したがって、本発明では、１音響フレームに対して２ビットの情報が埋め込み可能となる。

（１．２．音響信号に対する情報の埋め込み装置）
図３は、本発明に係る音響信号に対する情報の埋め込み装置の構成を示す機能ブロック図である。図３において、１０は音響フレーム読込手段、２０は周波数変換手段、３０は低周波成分変更手段、４０は周波数逆変換手段、５０は改変音響フレーム出力手段、６０は記憶手段、６１は音響信号記憶部、６２は付加情報記憶部、６３は改変音響信号記憶部、７０は付加情報読込手段である。なお、図３に示す装置は、ステレオ音響信号、モノラル音響信号の両方に対応可能であるが、ここでは、ステレオ音響信号に対して処理を行う場合について説明していく。

音響フレーム読込手段１０は、付加情報の埋め込み対象とする元のステレオ音響信号の各チャンネルから所定数のサンプルを１フレームとして読み込む機能を有している。周波数変換手段２０は、音響フレーム読込手段１０が読み込んだ音響信号のフレームをフーリエ変換等により周波数変換してフレームスペクトルを生成する機能を有している。低周波成分変更手段３０は、生成されたフレームスペクトルから２つの所定周波数範囲に相当するスペクトル集合を２セット抽出し、付加情報記憶部６２から抽出した付加情報に基づいて、低周波強度データのスペクトル集合間比率を変更する機能を有している。周波数逆変換手段４０は、変更された低周波強度データを含む複数のフレームスペクトルに対して周波数逆変換を行うことにより、改変音響フレームを生成する機能を有している。改変音響フレーム出力手段５０は、生成された改変音響フレームを順次出力する機能を有している。記憶手段６０は、付加情報を埋め込む対象とするステレオ音響信号を記憶した音響信号記憶部６１と、ビット配列として構成され、ステレオ音響信号に埋め込まれる付加情報を記憶した付加情報記憶部６２と、付加情報埋め込み後の改変音響信号を記憶する改変音響信号記憶部６３を有しており、その他処理に必要な各種情報を記憶するものである。付加情報読込手段７０は、付加情報記憶部６２から付加情報を抽出する機能を有している。なお、付加情報とは、音響情報に付加して埋め込むべき情報であり、タイトルやアーティスト名等の属性情報、および属性情報以外の他の情報を含むものである。図３に示した各構成手段は、現実にはコンピュータおよびその周辺機器等のハードウェアに専用のプログラムを搭載することにより実現される。すなわち、コンピュータが、専用のプログラムに従って各手段の内容を実行することになる。

（１．３．埋め込み装置の処理動作）
次に、図３に示した音響信号に対する情報の埋め込み装置の第１の実施形態について説明する。ここでは、音響信号として、Ｌ（左）、Ｒ（右）の２チャンネルを有するステレオ音響信号に対して処理を行う場合について説明していく。音響フレーム読込手段１０は、音響信号記憶部６１に記憶されたステレオ音響信号の左右の各チャンネルから、それぞれ所定数のサンプルを１音響フレームとして読み込む。音響フレーム読込手段１０が読み込む１音響フレームのサンプル数は、適宜設定することができるが、サンプリング周波数が４４．１ｋＨｚの場合、４０９６サンプル程度とすることが望ましい。したがって、音響フレーム読込手段１０は、左チャンネル、右チャンネルについてそれぞれ４０９６サンプルずつ、順次音響フレームとして読み込んでいくことになる。

音響フレームとしては、ＡタイプとＢタイプが存在する。Ａタイプの音響フレーム、Ｂタイプの音響フレームは、それぞれ同タイプの先行する音響フレームの最後のサンプルの次のサンプルを先頭サンプルとして設定される。そして、ＡタイプとＢタイプの音響フレームは互いに所定数（本実施形態では２０４８）のサンプルを重複して設定される。例えば、Ａタイプの音響フレームを先頭からＡ１、Ａ２、Ａ３…とし、Ｂタイプの音響フレームを先頭からＢ１、Ｂ２、Ｂ３…とすると、Ａ１はサンプル１〜４０９６、Ａ２はサンプル４０９７〜８１９２、Ａ３はサンプル８１９３〜１２２８８、Ｂ１はサンプル２０４９〜６１４４、Ｂ２はサンプル６１４５〜１０２４０、Ｂ３はサンプル１０２４１〜１４３３６となる。なお、ＡタイプとＢタイプは相対的なものであるので、どちらが先であっても良い。すなわち、上記とは逆にＡ１がサンプル２０４９〜６１４４、Ａ２がサンプル６１４５〜１０２４０、Ａ３がサンプル１０２４１〜１４３３６、Ｂ１がサンプル１〜４０９６、Ｂ２がサンプル４０９７〜８１９２、Ｂ３がサンプル８１９３〜１２２８８であっても良い。

周波数変換手段２０は、音響フレーム読込手段１０が読み込んだ音響フレームに対して、周波数変換を行って、その音響フレームのスペクトルであるフレームスペクトルを得る。具体的には、窓関数を利用して周波数変換を行う。周波数変換としては、フーリエ変換、ウェーブレット変換その他公知の種々の手法を用いることができる。本実施形態では、フーリエ変換を用いた場合を例にとって説明する。

一般に、所定の信号に対してフーリエ変換を行う場合、信号を所定の長さに区切って行う必要があるが、この場合、所定長さの信号に対してそのままフーリエ変換を行うと、擬似高調波成分が発生する。そこで、一般にフーリエ変換を行う場合には、ハニング窓と呼ばれる窓関数を用いて、信号の値を変化させた後、変化後の値に対してフーリエ変換を実行する。

本発明では、擬似高調波成分の発生を防止するためだけではなく、特許文献９に記載の発明と同様、一つの音響フレームから、情報を埋め込むための複数の状態を作り出すため、複数の窓関数を用意し、一つの音響フレームに対して、各窓関数を利用してフーリエ変換を行い、複数のスペクトルを得る。複数の窓関数として、特許文献９に示すものと同一のものを用いても本発明による効果は得られるが、より良い効果を得るため、本発明では、図４（ｂ）〜（ｄ）に示したような第１窓関数Ｗ（１，ｉ）、第２窓関数Ｗ（２，ｉ）、第３窓関数Ｗ（３，ｉ）を用意し、抽出側で認識し易いようにした。第１窓関数Ｗ（１，ｉ）は、音響フレームの前部を抽出するためのものであり、図４（ｂ）に示すように前部の所定のサンプル番号ｉの位置において、最大値１をとり、後部においては、最小値０をとるように設定されている。どのサンプル番号の場合に最大値をとるかについては、窓関数Ｗ（１，ｉ）の設計によって異なってくるが、本実施形態では、後述する〔数式１〕で定義される。窓関数Ｗ（１，ｉ）を乗じることにより、図４（ａ）に示すような音響フレームの信号波形は、図４（ｆ）に示すように、前部に信号成分が残り、後部の信号成分が削除されたものとなり、これがフーリエ変換対象となる。

また、第２窓関数Ｗ（２，ｉ）は、音響フレームの中央部を抽出するためのものであり、図４（ｃ）に示すように、中央部の所定のサンプル番号ｉの位置において、最大値１をとり、前部、後部においては、最小値０をとるように設定されている。どのサンプル番号の場合に最大値をとるかについては、窓関数Ｗ（２，ｉ）の設計によって異なってくるが、本実施形態では、後述する〔数式２〕で定義される。窓関数Ｗ（２，ｉ）を乗じることにより、図４（ａ）に示すような音響フレームの信号波形は、図４（ｇ）に示すように、中央部に信号成分が残り、前部と後部の信号成分が除去されたものとなり、これがフーリエ変換対象となる。

また、第３窓関数Ｗ（３，ｉ）は、音響フレームの後部を抽出するためのものであり、図４（ｄ）に示すように、前部においては最小値０をとり、後部の所定のサンプル番号ｉの位置において、最大値１をとるように設定されている。どのサンプル番号の場合に最大値をとるかについては、窓関数Ｗ（３，ｉ）の設計によって異なってくるが、本実施形態では、後述する〔数式３〕で定義される。窓関数Ｗ（３，ｉ）を乗じることにより、図４（ａ）に示すような音響フレームの信号波形は、図４（ｈ）に示すように、前部の信号成分が除去され、後部に信号成分が残ったものとなり、これがフーリエ変換対象となる。このように前部、中央部、後部を抽出した後、フーリエ変換を実行するため、前部、中央部、後部に対応したスペクトルが得られることになる。１つの音響フレームにビット値を埋め込むためには、本来、前部と後部の２つに分けられれば良いのであるが、抽出側においては、必ずしも、信号を同期して読み込むことができるとは限らず、したがって、前部と後部をはっきりと区別するため、本発明では、埋め込み時に中央部の信号成分を常に削除し、前部と後部を時間的に分離することとしている（ただし、抽出時は前部と後部だけを解析すればよく、中央部は無視してよい）。本発明において用いる窓関数は、窓関数Ｗ（１，ｉ）と窓関数Ｗ（３，ｉ）が左右非対称であるため、抽出時において、埋め込まれていた情報の誤認識が起こりにくくなる。

また、本発明では、音響フレームを重複させて読み込み、奇数フレーム（または偶数フレーム）については、窓関数Ｗ（１，ｉ）、Ｗ（２，ｉ）、Ｗ（３，ｉ）を用い、偶数フレーム（または奇数フレーム）については、図４（ｅ）に示したような窓関数Ｗ（４，ｉ）を用いるようにした。

なお、本発明においては、音響フレームは重複して読み込まれる。すなわち、奇数番目の音響フレームと偶数番目の音響フレームは、所定数のサンプルを重複して読み込む。上記のように、奇数フレームと偶数フレームでは、用いられる窓関数が異なるが、奇数フレームと偶数フレームは単に奇数か偶数かの違いだけであるため、どちらに対して処理をどちらの処理を行っても良い。したがって、本明細書では、奇数フレーム、偶数フレームの一方をＡタイプフレーム、他方をＢタイプフレームと呼ぶことにする。本実施形態では、奇数フレームをＡタイプフレーム、偶数フレームをＢタイプフレームとして説明するが、逆に偶数フレームをＡタイプフレーム、奇数フレームをＢタイプフレームとしても良い。

本実施形態では、窓関数Ｗ（１，ｉ）〜Ｗ（４，ｉ）は、以下の〔数式１〕〜〔数式４〕で定義される。なお、図４において、横軸は時間軸（ｉ）である。ｉは、後述するように、各音響フレーム内のＮ個のサンプルに付した通し番号であるため時刻ｔに比例している。また、図４（ａ）（ｆ）（ｇ）（ｈ）（ｉ）において縦軸は信号の振幅値（レベル）を示す。図４（ｂ）〜（ｅ）において縦軸は窓関数Ｗ（１，ｉ）、Ｗ（２，ｉ）、Ｗ（３，ｉ）、Ｗ（４，ｉ）の値を示しており、Ｗ（１，ｉ）、Ｗ（２，ｉ）、Ｗ（３，ｉ）、Ｗ（４，ｉ）の最大値はいずれも１である。

〔数式１〕
ｉ≦３Ｎ／８のとき、Ｗ（１，ｉ）＝０．５−０．５ｃｏｓ（８πｉ／（３Ｎ））
３Ｎ／８＜ｉ≦Ｎ／２のとき、Ｗ（１，ｉ）＝０．５−０．５ｃｏｓ（８π（ｉ−Ｎ／４）／Ｎ）
ｉ＞Ｎ／２のとき、Ｗ（１，ｉ）＝０．０

〔数式２〕
ｉ≦３Ｎ／８のとき、Ｗ（２，ｉ）＝０．０
３Ｎ／８＜ｉ≦Ｎ／２のとき、Ｗ（２，ｉ）＝０．５−０．５ｃｏｓ（８π（ｉ−３Ｎ／８）／Ｎ）
Ｎ／２＜ｉ≦３Ｎ／４のとき、Ｗ（２，ｉ）＝０．５−０．５ｃｏｓ（４π（ｉ−Ｎ／４）／Ｎ）
ｉ＞３Ｎ／４のとき、Ｗ（２，ｉ）＝０．０

〔数式３〕
ｉ≦Ｎ／２のとき、Ｗ（３，ｉ）＝０．０
ｉ＞Ｎ／２のとき、Ｗ（３，ｉ）＝０．５−０．５ｃｏｓ（４π（ｉ−Ｎ／２）／Ｎ）

〔数式４〕
ｉ≦Ｎ／４のとき、Ｗ（４，ｉ）＝０．０
Ｎ／４＜ｉ≦Ｎ／２のとき、Ｗ（４，ｉ）＝０．５−０．５ｃｏｓ（４π（ｉ−Ｎ／４）／Ｎ）
Ｎ／２＜ｉ≦７Ｎ／８のとき、Ｗ（４，ｉ）＝０．５−０．５ｃｏｓ（８π（ｉ−Ｎ／８）／（３Ｎ））
ｉ＞７Ｎ／８のとき、Ｗ（４，ｉ）＝０．０

なお、図４および上記〔数式１〕〜〔数式４〕から明らかなように、窓関数Ｗ（１，ｉ）とＷ（３，ｉ）は、互いに非対称な形状である。これは、後述する抽出側において、両者の識別を容易にするためである。また、窓関数Ｗ（１，ｉ）、Ｗ（２，ｉ）、Ｗ（３，ｉ）は、ｉが所定の値のときに最大値１をとり、ｉがその他の値をとる場合には、ｉの値に応じて単調増加、または単調減少する窓関数を分割したものであるため、窓関数Ｗ（１，ｉ）とＷ（３，ｉ）が定まると、窓関数Ｗ（２，ｉ）も必然的に定まる。このため、窓関数Ｗ（２，ｉ）は左右非対称の形状となっている。

本発明においては、奇数フレームと偶数フレームを、所定サンプルずつ重複して読み込むため、情報の埋め込みを行った後、音響信号に復元する際に、窓関数を乗じた奇数フレームと、窓関数を乗じた偶数フレームの重複サンプルを加算した場合に、ほぼ元の値に戻るようにしなければならない。このため、窓関数Ｗ（４，ｉ）の形状は、窓関数Ｗ（１，ｉ）、Ｗ（２，ｉ）、Ｗ（３，ｉ）の値に応じて必然的に定まる。すなわち、奇数フレームと偶数フレームの重複部分において、窓関数Ｗ（１，ｉ）、Ｗ（２，ｉ）、Ｗ（３，ｉ）、Ｗ（４，ｉ）を加算すると、全区間固定値１になるように定義されている。

周波数変換手段２０が、Ａタイプの音響フレームに対してフーリエ変換を行う場合は、左チャンネル信号Ｘｌ（ｉ）、右チャンネル信号Ｘｒ（ｉ）（ｉ＝０，…，Ｎ−１）に対して、３つの窓関数Ｗ（１，ｉ）、Ｗ（２，ｉ）、Ｗ（３，ｉ）を用いて、以下の〔数式５〕に従った処理を行い、左チャンネルに対応する変換データの実部Ａｌ（１，ｊ）、Ａｌ（２，ｊ）、Ａｌ（３，ｊ）、虚部Ｂｌ（１，ｊ）、Ｂｌ（２，ｊ）、Ｂｌ（３，ｊ）、右チャンネルに対応する変換データの実部Ａｒ（１，ｊ）、Ａｒ（２，ｊ）、Ａｒ（３，ｊ）、虚部Ｂｒ（１，ｊ）、Ｂｒ（２，ｊ）、Ｂｒ（３，ｊ）を得る。なお、窓関数Ｗ（１，ｉ）、Ｗ（２，ｉ）、Ｗ（３，ｉ）は、それぞれ音響フレームの前部（先頭）付近、中央付近、後部付近において値が大きくなる関数となっている。

〔数式５〕
Ａｌ（１，ｊ）＝Σ_i=0,…,N-1Ｗ（１，ｉ）・Ｘｌ（ｉ）・ｃｏｓ（２πｉｊ／Ｎ）
Ｂｌ（１，ｊ）＝Σ_i=0,…,N-1Ｗ（１，ｉ）・Ｘｌ（ｉ）・ｓｉｎ（２πｉｊ／Ｎ）
Ａｌ（２，ｊ）＝Σ_i=0,…,N-1Ｗ（２，ｉ）・Ｘｌ（ｉ）・ｃｏｓ（２πｉｊ／Ｎ）
Ｂｌ（２，ｊ）＝Σ_i=0,…,N-1Ｗ（２，ｉ）・Ｘｌ（ｉ）・ｓｉｎ（２πｉｊ／Ｎ）
Ａｌ（３，ｊ）＝Σ_i=0,…,N-1Ｗ（３，ｉ）・Ｘｌ（ｉ）・ｃｏｓ（２πｉｊ／Ｎ）
Ｂｌ（３，ｊ）＝Σ_i=0,…,N-1Ｗ（３，ｉ）・Ｘｌ（ｉ）・ｓｉｎ（２πｉｊ／Ｎ）
Ａｒ（１，ｊ）＝Σ_i=0,…,N-1Ｗ（１，ｉ）・Ｘｒ（ｉ）・ｃｏｓ（２πｉｊ／Ｎ）
Ｂｒ（１，ｊ）＝Σ_i=0,…,N-1Ｗ（１，ｉ）・Ｘｒ（ｉ）・ｓｉｎ（２πｉｊ／Ｎ）
Ａｒ（２，ｊ）＝Σ_i=0,…,N-1Ｗ（２，ｉ）・Ｘｒ（ｉ）・ｃｏｓ（２πｉｊ／Ｎ）
Ｂｒ（２，ｊ）＝Σ_i=0,…,N-1Ｗ（２，ｉ）・Ｘｒ（ｉ）・ｓｉｎ（２πｉｊ／Ｎ）
Ａｒ（３，ｊ）＝Σ_i=0,…,N-1Ｗ（３，ｉ）・Ｘｒ（ｉ）・ｃｏｓ（２πｉｊ／Ｎ）
Ｂｒ（３，ｊ）＝Σ_i=0,…,N-1Ｗ（３，ｉ）・Ｘｒ（ｉ）・ｓｉｎ（２πｉｊ／Ｎ）

周波数変換手段２０が、Ｂタイプの音響フレームに対してフーリエ変換を行う場合は、左チャンネル信号Ｘｌ（ｉ）、右チャンネル信号Ｘｒ（ｉ）（ｉ＝０，…，Ｎ−１）に対して、窓関数Ｗ（４，ｉ）を用いて、以下の〔数式６〕に従った処理を行い、左チャンネルに対応する変換データの実部Ａｌ（４，ｊ）、虚部Ｂｌ（４，ｊ）、右チャンネルに対応する変換データの実部Ａｒ（４，ｊ）、虚部Ｂｒ（４，ｊ）を得る。

〔数式６〕
Ａｌ（４，ｊ）＝Σ_i=0,…,N-1Ｗ（４，ｉ）・Ｘｌ（ｉ）・ｃｏｓ（２πｉｊ／Ｎ）
Ｂｌ（４，ｊ）＝Σ_i=0,…,N-1Ｗ（４，ｉ）・Ｘｌ（ｉ）・ｓｉｎ（２πｉｊ／Ｎ）
Ａｒ（４，ｊ）＝Σ_i=0,…,N-1Ｗ（４，ｉ）・Ｘｒ（ｉ）・ｃｏｓ（２πｉｊ／Ｎ）
Ｂｒ（４，ｊ）＝Σ_i=0,…,N-1Ｗ（４，ｉ）・Ｘｒ（ｉ）・ｓｉｎ（２πｉｊ／Ｎ）

上記〔数式５〕〔数式６〕において、ｉは、各音響フレーム内のＮ個のサンプルに付した通し番号であり、ｉ＝０，１，２，…Ｎ−１の整数値をとる。また、ｊは周波数の値について、値の小さなものから順に付した通し番号であり、ｉと同様にｊ＝０，１，２，…Ｎ／２−１の整数値をとる。サンプリング周波数が４４．１ｋＨｚ、Ｎ＝４０９６の場合、ｊの値が１つ異なると、周波数が１０．８Ｈｚ異なることになる。

上記〔数式５〕〔数式６〕に従った処理を実行することにより、各音響フレームの信号成分を周波数に対応した成分であるスペクトルで表現されたフレームスペクトルが得られる。続いて、低周波成分変更手段３０が、生成されたフレームスペクトルから３つの所定周波数範囲のスペクトル集合を抽出する。人間の聴覚は、２００〜３００Ｈｚ程度までの低周波成分については、方向性を感知しにくくなっていることが知られている（コロナ社１９９０年１０月３０日発行「音響工学講座１．基礎音響工学、日本音響学会編」ｐ２４７図９・２６参照）。したがって、特許文献７〜９に記載の発明においては、低周波成分を２００〜３００Ｈｚ程度以下としていた。しかし、本出願人による研究の結果、最低周波数帯における成分を削除した場合は、４００Ｈｚ付近においても方向性を感知しにくくなることがわかった。そこで、本実施形態では、０〜１５０Ｈｚ付近の最低周波数帯の成分を除去し、１５０〜４００Ｈｚ程度の低周波数帯に情報を埋め込むことにしている。さらに、本実施形態では、埋め込み対象とする低周波数帯を比較的高い低周波数帯と比較的低い低周波数帯に分けて、それぞれに対して加工を行うようにしている。

ここで、本発明の処理による周波数成分全体の状況を図５に示す。図５において、上下方向は周波数方向であり、ｊ＝２０４７は２２．０５ｋＨｚに対応している。図５（ａ）は特許文献９に示した従来方式、図５（ｂ）は本発明による方式を示す。図５（ｂ）は、最低周波数帯をｊ＝０〜１４（０〜約１５０Ｈｚ）、埋め込み対象とする低周波数帯のうち比較的高い低周波数帯をｊ＝２７〜３５（約２９０〜３８０Ｈｚ）、埋め込み対象とする低周波数帯のうち比較的低い低周波数帯をｊ＝１５〜２３（約１６０〜２５０Ｈｚ）とした場合を示している。また、網掛けの濃さは、信号成分の強度を概念的に示したものである。従来方式も本発明もｊ＝４０（従来はｊ＝３０）以上の高周波成分に対しては、変更を加えず、原音を維持する点については同じである。また、原音部との境を明確にするために、数成分（本実施形態では、ｊ＝３６〜３９の４成分）を左（Ｌ）信号から右（Ｒ）信号に移動させているのも、従来方式と同じである。

本発明が従来方式と異なるのは、従来方式がｊ＝０を原音維持とし、ｊ＝１〜２９の成分を原則左（Ｌ）信号から右（Ｒ）信号に移動させ、ｊ＝１〜２６の成分に対しては付加情報に応じて選択的に右（Ｒ）信号から左（Ｌ）信号に移動させることにより、ｊ＝１〜２６を埋め込み領域としているのに対して、本発明ではｊ＝０〜３９の成分を原則左（Ｌ）信号から右（Ｒ）信号に移動させ、ｊ＝１５〜２３、２７〜３５の成分に対しては付加情報に応じて選択的に右（Ｒ）信号から左（Ｌ）信号に移動させることにより、ｊ＝１５〜３５を埋め込み領域としている点である。なお、図５中のｊ＝１５〜２３、２７〜３５の領域については、埋め込まれる情報により、ＬＲのどちらかに成分が移動されることを示している。

低周波成分変更手段３０は、Ａタイプの音響フレームについて、付加情報読込手段７０が読み込んだビット値に応じて、低周波成分の割合を変更する処理を行う。本発明では、付加情報を２ビットずつ読み込み、１音響フレームに対して２ビットの情報を埋め込む。埋め込まれる２ビットの値は、“００”“０１”“１０”“１１”の４通りがある。本実施形態では、これらを値１〜値４と定義する。そして、低周波成分変更手段３０は、読み込んだ値１〜値４に応じて、低周波成分を状態１〜状態４のいずれかに変更する。具体的には、まず、低周波成分変更手段３０は、上記〔数式５〕により求めた左チャンネルの実部Ａｌ（１，ｊ）、Ａｌ（３，ｊ）、虚部Ｂｌ（１，ｊ）、Ｂｌ（３，ｊ）、右チャンネルの実部Ａｒ（１，ｊ）、Ａｒ（３，ｊ）、虚部Ｂｒ（１，ｊ）、Ｂｒ（３，ｊ）を利用して、以下の〔数式７〕により、合算値Ｅ₁〜Ｅ₄を算出する。

〔数式７〕
Ｅ₁＝Σ_j=m,m+P-4｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²＋Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝＋Σ_j=m+p,m+2P-4｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²＋Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝
Ｅ₂＝Σ_j=m,m+P-4｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²＋Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝＋Σ_j=m+p,m+2P-4｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²＋Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝
Ｅ₃＝Σ_j=m,m+P-4｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²＋Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝＋Σ_j=m+p,m+2P-4｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²＋Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝
Ｅ₄＝Σ_j=m,m+P-4｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²＋Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝＋Σ_j=m+p,m+2P-4｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²＋Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝

上記〔数式７〕において、ｍは低周波数帯の下限の成分の番号、Ｍは低周波数帯の上限の成分の番号であり、Ｐ＝（Ｍ−ｍ）／２である。なお、Ｐが整数にならない場合、切捨て処理を行う。ｍ＝１５、Ｍ＝４０と設定すると、Ｐ＝１２となり、図５に例示したスケールと同じになる。上記〔数式７〕により算出されたＥ₁〜Ｅ₄は音響フレームの所定の範囲におけるスペクトル集合の成分強度の合算値を示すことになる。続いて、この合算値Ｅ₁〜Ｅ₄がレベル下限値Ｌｅｖ以上であるかどうかの判定を行う。レベル下限値Ｌｅｖは、音響信号Ｘｌ（ｉ）、Ｘｒ（ｉ）の振幅最大値が１に正規化されており、Ｍ＝４０に設定されている場合、０．５に設定する。このＬｅｖ＝０．５という値は、経験的にアナログ変換への耐性が維持できるレベルであり、低周波成分が少ない場合は適宜下げることになるが、その場合は、アナログ変換により検出精度も低下することになる。

合算値Ｅ₁〜Ｅ₄がレベル下限値Ｌｅｖ以上であるかどうかを判断するのは、信号の強度が小さいと、信号を変化させても、その変化を抽出側で検出することができないためである。すなわち、各低周波スペクトル成分を十分な大きさとすることができるかどうかを判断することになる。

Ｅ₁がレベル下限値Ｌｅｖより大きく、埋め込むべき２ビットが“値１”である場合、以下の〔数式８〕に従った処理を実行することにより、低周波成分の状態を“状態１”、すなわち、図２（ｃ）に示したような状態に変更する。

〔数式８〕
ｊ＝ｍ〜ｍ＋Ｐ−４、ｍ＋Ｐ〜ｍ＋２Ｐ−４の各成分に対して
Ａｌ´（３，ｊ）＝０
Ｂｌ´（３，ｊ）＝０
Ｅ（３，ｊ）＝｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²＋Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
Ａｒ´（３，ｊ）＝Ａｒ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
Ｂｒ´（３，ｊ）＝Ｂｒ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
Ａｒ´（１，ｊ）＝０
Ｂｒ´（１，ｊ）＝０
Ｅ（１，ｊ）＝｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²＋Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
Ａｌ´（１，ｊ）＝Ａｌ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²｝^1/2
Ｂｌ´（１，ｊ）＝Ｂｌ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²｝^1/2

上記〔数式８〕においては、ｊ＝ｍ〜ｍ＋Ｐ−４、ｍ＋Ｐ〜ｍ＋２Ｐ−４において、Ａｌ´（３，ｊ）、Ｂｌ´（３，ｊ）を共に０としている。これは、図２（ｃ）の上段に示すように、L-chにおいて、ＳＰ３Ｕ、ＳＰ３Ｄ内の各成分を０にすることを示しているが、“状態１”はＳＰ１Ｕ、ＳＰ１Ｄとの差を明確にすることができれば十分であるため、必ずしも０にする必要はなく、小さな値であれば良い。Ｅ₂がレベル下限値Ｌｅｖより大きく、埋め込むべき２ビットが“値２”である場合は、以下の〔数式９〕に従った処理を実行することにより、低周波成分の状態を“状態２” 、すなわち、図２（ｄ）に示したような状態に変更する。

〔数式９〕
ｊ＝ｍ〜ｍ＋Ｐ−４、ｍ＋Ｐ〜ｍ＋２Ｐ−４の各成分に対して
Ａｌ´（１，ｊ）＝０
Ｂｌ´（１，ｊ）＝０
Ｅ（１，ｊ）＝｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²＋Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
Ａｒ´（１，ｊ）＝Ａｒ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
Ｂｒ´（１，ｊ）＝Ｂｒ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
Ａｒ´（３，ｊ）＝０
Ｂｒ´（３，ｊ）＝０
Ｅ（３，ｊ）＝｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²＋Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
Ａｌ´（３，ｊ）＝Ａｌ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²｝^1/2
Ｂｌ´（３，ｊ）＝Ｂｌ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²｝^1/2

上記〔数式９〕においては、ｊ＝ｍ〜ｍ＋Ｐ−４、ｍ＋Ｐ〜ｍ＋２Ｐ−４において、Ａｌ´（１，ｊ）、Ｂｌ´（１，ｊ）を共に０としている。これは、図２（ｄ）の上段に示すように、L-chにおいて、ＳＰ１Ｕ、ＳＰ１Ｄ内の各成分を０にすることを示しているが、“状態２”はＳＰ３Ｕ、ＳＰ３Ｄとの差を明確にすることができれば十分であるため、必ずしも０にする必要はなく、小さな値であれば良い。Ｅ₃がレベル下限値Ｌｅｖより大きく、埋め込むべき２ビットが“値３”である場合、以下の〔数式１０〕に従った処理を実行することにより、低周波成分の状態を“状態３” 、すなわち、図２（ｅ）に示したような状態に変更する。

〔数式１０〕
ｊ＝ｍ〜ｍ＋Ｐ−４の各成分に対して
Ａｌ´（３，ｊ）＝０
Ｂｌ´（３，ｊ）＝０
Ｅ（３，ｊ）＝｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²＋Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
Ａｒ´（３，ｊ）＝Ａｒ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
Ｂｒ´（３，ｊ）＝Ｂｒ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
ｊ＝ｍ＋Ｐ〜ｍ＋２Ｐ−４の各成分に対して
Ａｌ´（１，ｊ）＝０
Ｂｌ´（１，ｊ）＝０
Ｅ（１，ｊ）＝｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²＋Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
Ａｒ´（１，ｊ）＝Ａｒ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
Ｂｒ´（１，ｊ）＝Ｂｒ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
ｊ＝ｍ〜ｍ＋Ｐ−４の各成分に対して
Ａｒ´（１，ｊ）＝０
Ｂｒ´（１，ｊ）＝０
Ｅ（１，ｊ）＝｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²＋Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
Ａｌ´（１，ｊ）＝Ａｌ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²｝^1/2
Ｂｌ´（１，ｊ）＝Ｂｌ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²｝^1/2
ｊ＝ｍ＋Ｐ〜ｍ＋２Ｐ−４の各成分に対して
Ａｒ´（３，ｊ）＝０
Ｂｒ´（３，ｊ）＝０
Ｅ（３，ｊ）＝｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²＋Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
Ａｌ´（３，ｊ）＝Ａｌ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²｝^1/2
Ｂｌ´（３，ｊ）＝Ｂｌ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²｝^1/2

上記〔数式１０〕においては、ｊ＝ｍ〜ｍ＋Ｐ−４においてＡｌ´（３，ｊ）、Ｂｌ´（３，ｊ）を共に０とし、ｊ＝ｍ＋Ｐ〜ｍ＋２Ｐ−４においてＡｌ´（１，ｊ）、Ｂｌ´（１，ｊ）を共に０としている。これは、図２（ｅ）の上段に示すように、L-chにおいて、ＳＰ３Ｄ、ＳＰ１Ｕ内の各成分を０にすることを示しているが、“状態３”はＳＰ３Ｕ、ＳＰ１Ｄとの差を明確にすることができれば十分であるため、必ずしも０にする必要はなく、小さな値であれば良い。Ｅ₄がレベル下限値Ｌｅｖより大きく、埋め込むべき２ビットが“値４”である場合、以下の〔数式１１〕に従った処理を実行することにより、低周波成分の状態を“状態４” 、すなわち、図２（ｆ）に示したような状態に変更する。

〔数式１１〕
ｊ＝ｍ〜ｍ＋Ｐ−４の各成分に対して
Ａｌ´（１，ｊ）＝０
Ｂｌ´（１，ｊ）＝０
Ｅ（１，ｊ）＝｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²＋Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
Ａｒ´（１，ｊ）＝Ａｒ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
Ｂｒ´（１，ｊ）＝Ｂｒ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
ｊ＝ｍ＋Ｐ〜ｍ＋２Ｐ−４の各成分に対して
Ａｌ´（３，ｊ）＝０
Ｂｌ´（３，ｊ）＝０
Ｅ（３，ｊ）＝｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²＋Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
Ａｒ´（３，ｊ）＝Ａｒ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
Ｂｒ´（３，ｊ）＝Ｂｒ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
ｊ＝ｍ〜ｍ＋Ｐ−４の各成分に対して
Ａｒ´（３，ｊ）＝０
Ｂｒ´（３，ｊ）＝０
Ｅ（３，ｊ）＝｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²＋Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
Ａｌ´（３，ｊ）＝Ａｌ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²｝^1/2
Ｂｌ´（３，ｊ）＝Ｂｌ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²｝^1/2
ｊ＝ｍ＋Ｐ〜ｍ＋２Ｐ−４の各成分に対して
Ａｒ´（１，ｊ）＝０
Ｂｒ´（１，ｊ）＝０
Ｅ（１，ｊ）＝｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²＋Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
Ａｌ´（１，ｊ）＝Ａｌ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²｝^1/2
Ｂｌ´（１，ｊ）＝Ｂｌ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²｝^1/2

上記〔数式１１〕においては、ｊ＝ｍ〜ｍ＋Ｐ−４においてＡｌ´（１，ｊ）、Ｂｌ´（１，ｊ）を共に０とし、ｊ＝ｍ＋Ｐ〜ｍ＋２Ｐ−４においてＡｌ´（３，ｊ）、Ｂｌ´（３，ｊ）を共に０としている。これは、図２（ｆ）の上段に示すように、L-chにおいて、ＳＰ１Ｄ、ＳＰ３Ｕ内の各成分を０にすることを示しているが、“状態４”はＳＰ３Ｄ、ＳＰ１Ｕとの差を明確にすることができれば十分であるため、必ずしも０にする必要はなく、小さな値であれば良い。上記〔数式８〕〜〔数式１１〕に従った処理を実行し、低周波成分の状態を“状態１”〜“状態４”に変更した場合、いずれの場合であっても、さらに以下の〔数式１２〕に従った処理を実行し、最低周波数帯におけるギャップ領域Ｇ１Ｄ、Ｇ３Ｄ、上位低周波数帯と下位低周波数帯の間にギャップ領域Ｇ１Ｍ、Ｇ３Ｍ、上位低周波数帯の高周波側にギャップ領域Ｇ１Ｕ、Ｇ３Ｕを設ける。

〔数式１２〕
ｊ＝０〜ｍ−１、ｍ＋Ｐ−３〜ｍ＋Ｐ−１、ｍ＋２Ｐ−３〜Ｍ−１の各成分に対して
Ａｌ´（１，ｊ）＝０
Ｂｌ´（１，ｊ）＝０
Ａｌ´（３，ｊ）＝０
Ｂｌ´（３，ｊ）＝０
Ｅ（１，ｊ）＝｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²＋Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
Ａｒ´（１，ｊ）＝Ａｒ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
Ｂｒ´（１，ｊ）＝Ｂｒ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
Ｅ（３，ｊ）＝｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²＋Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
Ａｒ´（３，ｊ）＝Ａｒ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
Ｂｒ´（３，ｊ）＝Ｂｒ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
ｊ＝０〜Ｍ−１の各成分に対して
Ａｌ´（２，ｊ）＝０
Ｂｌ´（２，ｊ）＝０
Ｅ（２，ｊ）＝｛Ａｌ（２，ｊ）²＋Ｂｌ（２，ｊ）²＋Ａｒ（２，ｊ）²＋Ｂｒ（２，ｊ）²｝^1/2
Ａｒ´（２，ｊ）＝Ａｒ（２，ｊ）・Ｅ（２，ｊ）／｛Ａｒ（２，ｊ）²＋Ｂｒ（２，ｊ）²｝^1/2
Ｂｒ´（２，ｊ）＝Ｂｒ（２，ｊ）・Ｅ（２，ｊ）／｛Ａｒ（２，ｊ）²＋Ｂｒ（２，ｊ）²｝^1/2

付加情報は、ビット値であるため、どこから開始してどこで終了するのかを示す区切りを表現することが必要となる。また、埋め込まれる側の低周波成分の強度が小さすぎると、信号を変化させても、その変化を抽出側で検出することができない。そこで、このような場合には、情報が埋め込まれている音響フレームとの違いを明確にするため、以下の〔数式１３〕に従った処理を実行し、その低周波成分を除去する。この状態を“状態０”と呼ぶことにする。これは、図２（ｂ）に示すような状態である。

〔数式１３〕
ｊ＝０〜Ｍ−１の各成分に対して
Ａｌ´（１，ｊ）＝０
Ｂｌ´（１，ｊ）＝０
Ａｌ´（２，ｊ）＝０
Ｂｌ´（２，ｊ）＝０
Ａｌ´（３，ｊ）＝０
Ｂｌ´（３，ｊ）＝０
Ｅ（１，ｊ）＝｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²＋Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
Ａｒ´（１，ｊ）＝Ａｒ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
Ｂｒ´（１，ｊ）＝Ｂｒ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
Ｅ（２，ｊ）＝｛Ａｌ（２，ｊ）²＋Ｂｌ（２，ｊ）²＋Ａｒ（２，ｊ）²＋Ｂｒ（２，ｊ）²｝^1/2
Ａｒ´（２，ｊ）＝Ａｒ（２，ｊ）・Ｅ（２，ｊ）／｛Ａｒ（２，ｊ）²＋Ｂｒ（２，ｊ）²｝^1/2
Ｂｒ´（２，ｊ）＝Ｂｒ（２，ｊ）・Ｅ（２，ｊ）／｛Ａｒ（２，ｊ）²＋Ｂｒ（２，ｊ）²｝^1/2
Ｅ（３，ｊ）＝｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²＋Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
Ａｒ´（３，ｊ）＝Ａｒ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
Ｂｒ´（３，ｊ）＝Ｂｒ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2

上記のように、Ａタイプの音響フレームに対しては、埋め込むべきビット値に応じて、低周波成分の変更を行う必要があるため、低周波成分変更手段３０は、上記〔数式８〕〜〔数式１３〕に従った処理を実行する。ところが、Ｂタイプの音響フレームは、Ａタイプの音響フレームのみの場合に生じる両端部分の不連続性を防止するために用いられるものであるので、ビット値に応じて低周波成分の変更を行う必要はない。そこで、低周波成分変更手段３０は、Ｂタイプの音響フレームについては、以下の〔数式１４〕に従った処理を実行し、常に左信号の低周波成分を除去する。

〔数式１４〕
ｊ＝０〜Ｍ−１の各成分に対して
Ａｌ´（４，ｊ）＝０
Ｂｌ´（４，ｊ）＝０
Ｅ（４，ｊ）＝｛Ａｌ（４，ｊ）²＋Ｂｌ（４，ｊ）²＋Ａｒ（４，ｊ）²＋Ｂｒ（４，ｊ）²｝^1/2
Ａｒ´（４，ｊ）＝Ａｒ（４，ｊ）・Ｅ（４，ｊ）／｛Ａｒ（４，ｊ）²＋Ｂｒ（４，ｊ）²｝^1/2
Ｂｒ´（４，ｊ）＝Ｂｒ（４，ｊ）・Ｅ（４，ｊ）／｛Ａｒ（４，ｊ）²＋Ｂｒ（４，ｊ）²｝^1/2

周波数逆変換手段４０は、上記のようにして、低周波成分の状態が変更されたフレームスペクトルを周波数逆変換して改変音響フレームを得る処理を行う。この周波数逆変換は、当然のことながら、周波数変換手段２０が実行した手法に対応していることが必要となる。本実施形態では、周波数変換手段２０において、フーリエ変換を施しているため、周波数逆変換手段４０は、フーリエ逆変換を実行することになる。

具体的には、Ａタイプの音響フレームに対しては、周波数逆変換手段４０は、上記〔数式８〕〜〔数式１３〕のいずれかにより得られたスペクトルの左チャンネルの実部Ａｌ´（１，ｊ）等、虚部Ｂｌ´（１，ｊ）等、右チャンネルの実部Ａｒ´（１，ｊ）等、虚部Ｂｒ´（１，ｊ）等を用いて、以下の〔数式１５〕に従った処理を行い、Ｘｌ´（ｉ）、Ｘｒ´（ｉ）を算出する。なお、上記〔数式８〕〜〔数式１３〕において改変されていない周波数成分については、Ａｌ´（１，ｊ）等として、元の周波数成分であるＡｌ（１，ｊ）等を用いる。

〔数式１５〕
Ｘｌ´（ｉ）＝１／Ｎ・｛Σ_jＡｌ´（１，ｊ）・ｃｏｓ（２πｉｊ／Ｎ）−Σ_jＢｌ´（１，ｊ）・ｓｉｎ（２πｉｊ／Ｎ）｝＋１／Ｎ・｛Σ_jＡｌ´（２，ｊ）・ｃｏｓ（２πｉｊ／Ｎ）−Σ_jＢｌ´（２，ｊ）・ｓｉｎ（２πｉｊ／Ｎ）｝＋１／Ｎ・｛Σ_jＡｌ´（３，ｊ）・ｃｏｓ（２πｉｊ／Ｎ）−Σ_jＢｌ´（３，ｊ）・ｓｉｎ（２πｉｊ／Ｎ）｝＋Ｘｌｐ（ｉ＋Ｎ／２）
Ｘｒ´（ｉ）＝１／Ｎ・｛Σ_jＡｒ´（１，ｊ）・ｃｏｓ（２πｉｊ／Ｎ）−Σ_jＢｒ´（１，ｊ）・ｓｉｎ（２πｉｊ／Ｎ）｝＋１／Ｎ・｛Σ_jＡｒ´（２，ｊ）・ｃｏｓ（２πｉｊ／Ｎ）−Σ_jＢｒ´（２，ｊ）・ｓｉｎ（２πｉｊ／Ｎ）｝＋１／Ｎ・｛Σ_jＡｒ´（３，ｊ）・ｃｏｓ（２πｉｊ／Ｎ）−Σ_jＢｒ´（３，ｊ）・ｓｉｎ（２πｉｊ／Ｎ）｝＋Ｘｒｐ（ｉ＋Ｎ／２）

上記〔数式１５〕においては、式が繁雑になるのを防ぐため、Σ_j=0,…_,N-1をΣ_jとして示している。上記〔数式１５〕における第１式の“＋Ｘｌｐ（ｉ＋Ｎ／２）”、第２式の“＋Ｘｒｐ（ｉ＋Ｎ／２）”の項は、直前に改変された改変音響フレームのデータＸｌｐ（ｉ）、Ｘｒｐ（ｉ）が存在する場合に、時間軸上Ｎ／２サンプル分重複することを考慮して加算するためのものである。上記〔数式１５〕によりＡタイプの改変音響フレームの左チャンネルの各サンプルＸｌ´（ｉ）、右チャンネルの各サンプルＸｒ´（ｉ）、が得られることになる。

Ｂタイプの音響フレームに対しては、周波数逆変換手段４０は、上記〔数式１４〕により得られたスペクトルの左チャンネルの実部Ａｌ´（４，ｊ）、虚部Ｂｌ´（４，ｊ）、右チャンネルの実部Ａｒ´（４，ｊ）、虚部Ｂｒ´（４，ｊ）を用いて、以下の〔数式１６〕に従った処理を行い、Ｘｌ´（ｉ）、Ｘｒ´（ｉ）を算出する。なお、上記〔数式１４〕において改変されていない周波数成分については、以下の〔数式１６〕においてはＡｌ´（４，ｊ）、Ｂｌ´（４，ｊ）、Ａｒ´（４，ｊ）、Ｂｒ´（４，ｊ）として、元の値であるＡｌ（４，ｊ）、Ｂｌ（４，ｊ）、Ａｒ（４，ｊ）、Ｂｒ（４，ｊ）を用いる。

〔数式１６〕
Ｘｌ´（ｉ）＝１／Ｎ・｛Σ_jＡｌ´（４，ｊ）・ｃｏｓ（２πｉｊ／Ｎ）−Σ_jＢｌ´（４，ｊ）・ｓｉｎ（２πｉｊ／Ｎ）｝＋Ｘｌｐ（ｉ＋Ｎ／２）
Ｘｒ´（ｉ）＝１／Ｎ・｛Σ_jＡｒ´（４，ｊ）・ｃｏｓ（２πｉｊ／Ｎ）−Σ_jＢｒ´（４，ｊ）・ｓｉｎ（２πｉｊ／Ｎ）｝＋Ｘｒｐ（ｉ＋Ｎ／２）

上記〔数式１６〕によりＢタイプの改変音響フレームの左チャンネルの各サンプルＸｌ´（ｉ）、右チャンネルの各サンプルＸｒ´（ｉ）、が得られることになる。

改変音響フレーム出力手段５０は、周波数逆変換手段４０の処理により得られたＡタイプの改変音響フレーム、Ｂタイプの改変音響フレームを順次出力ファイルに出力する。

次に、図３に示した音響信号に対する情報の埋め込み装置の処理の全体的な流れを、図６のフローチャートに従って説明する。図３に示した装置を構成する各構成要素は、連携して図６に従った処理を実行する。図６は、付加情報１ワード分の処理に対応したものとなっている。１ワードとしては、任意のビット数に設定することができるが、通常１バイト（８ビット）に設定する。

また、情報の埋め込みは、Ａタイプの音響フレームに対して行われるので、図６は、Ａタイプの音響フレームについての説明となっている。Ｂタイプの音響フレームについては、Ａタイプの音響フレームと並行して、音響フレーム読込手段１０により読み込まれ、窓関数Ｗ（４，ｉ）を利用して周波数変換手段２０により周波数変換された後、低周波成分変更手段３０により低周波成分が除去され、周波数逆変換手段４０により周波数逆変換された後、改変音響フレーム出力手段５０により出力される。

図６においては、まず、付加情報読込手段７０は、付加情報記憶部６２から付加情報を１ワード単位で読み込む（Ｓ１０１）。具体的には、音響信号に対する情報の埋め込み装置として用いられるコンピュータ内のレジスタに１ワード読み込むことになる。

続いて、モードを区切りモードに設定する（Ｓ１０２）。モードは区切りモードと、ビットモードの２種類が存在する。区切りモードは１ワード単位の区切りにおける処理を行うモードを示し、ビットモードは１ワードに含まれる２ビットの値に基づいた処理を行うモードを示している。付加情報記憶部６２から１ワード読み込んだ場合には、その直後に必ず区切りモードに設定されることになる。

続いて、音響フレーム読込手段１０が、音響信号記憶部６１に記憶されたステレオ音響信号の左右の各チャンネルから、それぞれ所定数のサンプルを１音響フレームとして読み込む（Ｓ１０４）。

モードが区切りモードである場合、左（Ｌ）チャンネル信号において、低周波成分を“状態０”とする処理を行う（Ｓ１０６）。具体的には、周波数変換手段２０が、読み込んだ音響フレームに対して周波数変換を行って、その音響フレームのスペクトルであるフレームスペクトルを得た後、低周波成分変更手段３０が、上記〔数式１３〕に従った処理を実行することになる。

モードがビットモードである場合は、周波数変換手段２０および低周波成分変更手段３０が、音響フレームの低周波成分の状態を“状態１”〜“状態４”のいずれかに変更する処理を行う（Ｓ１０５）。具体的には、まず、周波数変換手段２０が、読み込んだ音響フレームに対して、周波数変換を行って、その音響フレームのスペクトルであるフレームスペクトルを得る。すなわち、各音響フレームについて、３つの窓関数Ｗ（１，ｉ）、Ｗ（２，ｉ）、Ｗ（３，ｉ）を用いて、上記〔数式５〕に従った処理を行うことになる。

続いて、低周波成分変更手段３０が、上記〔数式７〕によりＥ₁〜Ｅ₄を算出する。そして、付加情報読込手段７０から受け取った値１〜値４に応じて上記〔数式８〕〜〔数式１１〕に従った処理を実行し、低周波成分の状態を“状態１”〜“状態４”のいずれかに変更する。

Ｓ１０５において、“状態１”〜“状態４”のいずれにも変更することができない場合は、低周波成分を“状態０”とする処理を行う（Ｓ１０６）。具体的には、上記〔数式１３〕に従った処理を実行することになる。“状態１”〜“状態４” のいずれにも変更することができない場合とは、埋め込むべき値に対応する合算値のいずれかが、レベル下限値Ｌｅｖ以下となっている場合である。例えば、値１を埋め込む場合、Ｅ₁がレベル下限値Ｌｅｖより大きい必要があるため、Ｅ₁がＬｅｖ以下である場合は、Ｓ１０６に進むことになる。

上記〔数式１３〕に従った処理を実行することにより、左チャンネルのフレームスペクトルの低周波数成分は、上位低周波領域前部のスペクトルＳＰ１Ｕ、上位低周波領域後部のスペクトルＳＰ３Ｕ、下位低周波領域前部のスペクトルＳＰ１Ｄ、下位低周波領域後部のスペクトルＳＰ３Ｄ全てにおいて、“０” で同一となる。この“状態０”のパターンは、付加情報の先頭位置（区切り）を示す情報か、または前述の合算値Ｅ₁〜Ｅ₄が下限値Ｌｅｖ以下であることにより、当該フレームに２ビットの値の記録が行なわれなかったことを示す情報となる。なお、上記〔数式１３〕においては、ｊ＝０〜Ｍ−１の各成分に対してＡｌ´（ｊ）＝Ｂｌ´（ｊ）＝０としているが、抽出側において、“状態１”〜“状態４”のいずれでもないことを認識可能とすることを目的としているため、十分小さな値であれば、必ずしも０とする必要はない。また、必ずしも４つのスペクトル成分の値が同一である必要はなく、差が小さければ良い。

次に、周波数逆変換手段４０が、上記Ｓ１０５、Ｓ１０６の処理により各低周波成分のスペクトル集合間の割合が変更されたフレームスペクトルを周波数逆変換して改変音響フレームを得る処理を行う（Ｓ１０７）。この周波数逆変換は、当然のことながら、周波数変換手段２０がＳ１０５において実行した手法に対応していることが必要となる。本実施形態では、周波数変換手段２０において、フーリエ逆変換を施しているため、周波数逆変換手段４０は、フーリエ逆変換を実行することになる。具体的には、上記〔数式８〕〜〔数式１３〕のいずれかにより得られたスペクトルの左チャンネルの実部Ａｌ´（１，ｊ）等、虚部Ｂｌ´（１，ｊ）等、右チャンネルの実部Ａｒ´（１，ｊ）等、虚部Ｂｒ´（１，ｊ）等を用いて、上記〔数式１５〕に従った処理を行い、Ｘｌ´（ｉ）、Ｘｒ´（ｉ）を算出する。

改変音響フレーム出力手段５０は、得られた改変音響フレームを順次出力ファイルに出力する。こうして１つの音響フレームに対する処理を終えたら、モードの判定を行い（Ｓ１０８）、モードが区切りモードである場合は、モードをビットモードに設定した後（Ｓ１０９）、音響フレーム読込手段１０が、音響フレームを読み込む（Ｓ１０４）。一方、モードがビットモードである場合は、低周波成分変更手段３０が付加情報のビット配列中の次の２ビットを読み込む（Ｓ１０３）。以上のような処理を音響信号の両チャンネルの全サンプルに渡って実行していく。すなわち、所定数のサンプルを音響フレームとして読み込み、音響信号から読み込むべき音響フレームがなくなったら（Ｓ１０４）、処理を終了する。なお、Ｓ１０１において読み込んだ１ワードのデータの各ビットに対応する処理を終えた場合、Ｓ１０３からＳ１０１に戻り、付加情報の次のワードを読み込み処理をすることになる。付加情報の全ワードに対して処理が終了した場合は、付加情報の先頭ワードに戻って処理を行う。この結果、全ての音響フレームに対して処理を行った全ての改変音響フレームが出力ファイルに記録されて、改変音響信号として得られる。得られた改変音響信号は、記憶手段６０内の改変音響信号記憶部６３に出力され、記憶される。

以上の処理による左チャンネル信号の変化の様子について、１音響フレームに１ビットを埋め込む従来の手法と比較して説明する。図７に、従来の手法によるビット埋め込みの手順を示す。図７において、図面左右方向は、時間軸方向である。また、図中多数存在する矩形は、改変音響フレームの第１成分、第２成分の存在（削除されていないこと）を示している。図７の例では、固定長８ビットの連続する４ワードの付加情報を埋め込む場合を示している。図７に示すように、最初に区切りを示す情報が埋め込まれた後は、ビット値を示す情報が埋め込まれる。低周波成分が小さいために埋め込みができないフレームが存在しない場合には、連続して１ワード分の８ビットが埋め込まれ、その後、再び、区切りを示す情報が埋め込まれ、続いて、ビット値を示す情報が埋め込まれる。低周波成分が小さいために埋め込みができないフレームが存在した場合には、図７に示す３ワード目のように、２ビット目の後、区切りを示す情報が埋め込まれ、その後、３ビット目から埋め込まれる。

これに対して、本発明では、１音響フレームに２ビットを埋め込むため、より多くの情報を埋め込むことができる。図８に、本発明によるビット埋め込みの手順を示す。図８において、第１成分と第２成分を結ぶ破線は、音響フレーム長を示しており、矩形は、改変音響フレームの第１成分、第２成分の存在を示している。図８の例でも、固定長８ビットの連続する４ワードの付加情報を埋め込む場合を示している。図８に示すように、最初に区切りを示す情報が埋め込まれた後は、２ビットの値を示す情報が埋め込まれる。低周波成分が小さいために埋め込みができないフレームが存在しない場合には、連続して１ワード分の８ビットが埋め込まれ、その後、再び、区切りを示す情報が埋め込まれ、続いて、２ビットの値を示す情報が埋め込まれる。低周波成分が小さいために埋め込みができないフレームが存在した場合には、図８に示す４ワード目のように、２ビット目の後、区切りを示す情報が埋め込まれるが、その後、３ビット目から埋め込まれる。なお、本実施形態で、低周波成分が小さいために埋め込みができないフレームが存在した場合とは、上記〔数式７〕により算出された合算値Ｅ₁〜Ｅ₄のうち埋め込むべき値に対応するものが、レベル下限値Ｌｅｖ以下となる音響フレームが存在する場合を示している。

図７、図８は、従来手法と、本発明における処理の一例であるが、図７に示すように、従来の手法では、３６個の音響フレームを利用して３０ビットしか埋め込むことができないのに対し、本発明の手法では、３３個の音響フレームを利用して４６ビット埋め込むことができ、埋め込み効率が高まる。

なお、本実施形態では、付加情報の１ワードを１バイトとした場合について説明したが、抽出側と取り決めがある限り、付加情報の１ワードを任意のビット数単位で記録することが可能である。

上記のようにして得られた改変音響信号の左チャンネルのうち、付加情報が埋め込まれている部分については、低周波成分は、上記状態０〜状態４の５通りの分布しかないことになる。しかし、高周波成分については、元の音響信号のままであるので、制作者の設定に基づいた種々な分布になる。また、上記の例で示したように、ステレオ音響信号を利用した場合には、左チャンネルにおいて変化させられた低周波成分は、上記〔数式８〕〜〔数式１４〕の処理からも明らかなように、必ず右チャンネルの低周波成分に付加されている。したがって、右チャンネルが左チャンネルにおいて削除された成分を補っているため、両チャンネル全体として見ると、信号の劣化がない。人間の聴覚は、高周波成分については、方向性を感知し易いが、低周波成分については、方向性を感知しにくくなっている。したがって、低周波成分が一方に偏っていても、聴いている人にとっては、通常の音響信号と変わりなく聴こえることになる。

（１．４．音響信号からの情報の抽出装置）
次に、本発明に係る音響信号からの情報の抽出装置について説明する。図９は、本発明に係る音響信号からの情報の抽出装置の一実施形態を示す構成図である。図９において、１００は音響信号入力手段、１１０は基準フレーム獲得手段、１２０は位相変更フレーム設定手段、１３０は周波数変換手段、１４０は符号判定パラメータ算出手段、１５０は符号出力手段、１６０は付加情報抽出手段、１７０は音響フレーム保持手段である。

音響信号入力手段１００は、流れている音声をデジタル音響信号として取得し、入力する機能を有している。現実には、マイクロフォンおよびＡ／Ｄ変換器により実現される。マイクロフォンとしては、低周波成分が検出可能なものであれば、モノラル無指向性のものであっても、ステレオ指向性のものであっても使用可能である。ステレオ指向性のものであっても一方のチャンネルだけ利用すれば良い。また、図３に示した装置で情報の埋め込みを行った場合には、特別精度の高いものでなく、一般的な精度のマイクロフォンを用いても情報の抽出が可能となる。基準フレーム獲得手段１１０は、入力されたデジタルのモノラル音響信号（あるいはステレオ音響信号の１チャンネル）から所定数のサンプルで構成される音響フレームを基準フレームとして読み込む機能を有している。位相変更フレーム設定手段１２０は、基準フレームと所定サンプルずつ移動させることにより位相を変更した音響フレームを位相変更フレームとして設定する機能を有している。周波数変換手段１３０は、図３に示した周波数変換手段２０と同様の機能を有している。

符号判定パラメータ算出手段１４０は、生成されたフレームスペクトルから所定の周波数以下に相当する各低周波強度データを抽出し、各成分に対応した各低周波強度データの合算値Ｅ_C1〜Ｅ_C4を以下の〔数式１７〕に基づいて算出し、この合算値Ｅ_C1〜Ｅ_C4を符号判定パラメータとし、この符号判定パラメータＥ_C1〜Ｅ_C4の比率等に基づいて、所定の状態であると判断する機能を有している。以下の〔数式１７〕は上記〔数式７〕において右チャンネル成分を削除したもので、抽出時には右チャンネル成分を参照しないためである。

〔数式１７〕
Ｅ_C1＝Σ_{j=m,…,m+P-4}｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²｝＋Σ_{j=m+P,…,m+2P-4}｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²｝
Ｅ_C2＝Σ_{j=m,…,m+P-4}｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²｝＋Σ_{j=m+P,…,m+2P-4}｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²｝
Ｅ_C3＝Σ_{j=m,…,m+P-4}｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²｝＋Σ_{j=m+P,…,m+2P-4}｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²｝
Ｅ_C4＝Σ_{j=m,…,m+P-4}｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²｝＋Σ_{j=m+P,…,m+2P-4}｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²｝

符号出力手段１５０は、１つの基準フレームに対応する音響フレーム（基準フレームおよび位相変更フレーム）の中から最適な位相であると判断されるものを判断し、その音響フレームの状態に対応する符号を出力する機能を有している。付加情報抽出手段１６０は、符号出力手段１５０により出力された符号の集合である５値配列を、所定の規則により変換して意味のある付加情報として抽出する機能を有している。音響フレーム保持手段１７０は、連続する２個の基準フレームを保持可能なバッファメモリである。図９に示した各構成手段は、現実には情報処理機能を有する小型のコンピュータおよびその周辺機器等のハードウェアに専用のプログラムを搭載することにより実現される。特に、本発明の目的をより簡易に達成するためには、携帯型端末装置をハードウェアとして用いることが望ましい。

（１．５．抽出装置の処理動作）
次に、図９に示した音響信号からの情報の抽出装置の処理動作について図１０のフローチャートに従って説明する。まず、本装置では、平均符号レベルＨＬ１、ＨＬ２、ＨＬ３、ＨＬ４、位相判定テーブルＳ（ｐ）、非符号カウンタＮｎを初期化する（Ｓ２００）。これらについて説明する。平均符号レベルＨＬ１〜ＨＬ４は、２ビットの値が埋め込まれていたと判断される音響フレーム（以下、有効フレームと呼ぶことにする）についての、上記〔数式１７〕で算出される低周波成分の合算値Ｅ_C1〜Ｅ_C4の平均値、すなわち、過去の有効フレームにおける合算値Ｅ_C1〜Ｅ_C4の平均値で与えられるものであり、初期値は、０．１に設定されている。位相判定テーブルＳ（ｐ）は、位相を判定するためのテーブルであり、ｐは０〜５の整数値をとる。初期値はＳ（ｐ）＝０に設定されている。非符号カウンタＮｎは、信号レベルが低く、非符号（区切り又は埋め込みエラーを示す情報と同一）であると判断されるフレーム数のカウンタであり、初期状態では、Ｎｎ＝０に設定される。

このように、初期値が設定されている状態で、利用者が流れている音楽について、その楽曲名等の属性情報を知りたいと思った場合、まず、抽出装置に対して、抽出装置としての起動の指示を行う。これは、例えば、抽出装置を携帯電話機等の携帯端末で実現している場合は、所定のボタンを操作することにより実行できる。抽出装置は、指示が入力されると、音響信号入力手段１００が、流れている音楽を録音し、デジタル化してデジタル音響信号として入力する。具体的には、無指向性マイクロフォン（または指向性マイクロフォンの一方のチャンネル）から入力される音声を、Ａ／Ｄ変換器によりデジタル化する処理を行うことになる。

続いて、基準フレーム獲得手段１１０が、音響信号入力手段１００から入力された音響信号から、所定数のサンプルで構成される音響フレームを基準フレームとして抽出する（Ｓ２０１）。具体的には、基準フレームを抽出して音響フレーム保持手段１７０に読み込むことになる。基準フレーム獲得手段１１０が基準フレームとして読み込む１音響フレームのサンプル数は、図３に示した音響フレーム読込手段１０で設定されたものと同一にする必要がある。したがって、本実施形態の場合、基準フレーム獲得手段１１０は、４０９６サンプルずつ、順次基準フレームとして読み込んでいくことになる。音響フレーム保持手段１７０には、上述のように２個の基準フレームが格納可能となっており、新しい基準フレームが読み込まれると、古い基準フレームを破棄するようになっている。したがって、音響フレーム保持手段１７０には、常に基準フレーム２個分（連続する８１９２サンプル）が格納されていることになる。

埋め込み装置で処理する音響フレームは、先頭から途切れることなく隣接して設定される基準フレームと、この基準フレームと位相を変更した位相変更フレームとに分けることができる。基準フレームについては、最初の基準フレームをサンプル番号１からサンプル番号４０９６までを設定したら、次の基準フレームは、サンプル番号４０９７からサンプル番号８１９２、さらに次の基準フレームは、サンプル番号８１９３からサンプル番号１２２８８、というように途切れることなく設定される。そして、各基準フレームについて、１／６フレーム（約６８３サンプル）ずつ移動した５個の位相変更フレームを設定する。例えば、最初の基準フレームについては、サンプル番号６８３、１３６６、２０４９、２７３２、３４１３から始まる４０９６のサンプルで構成される５個の位相変更フレームが設定されることになる。続いて、周波数変換手段１３０、符号判定パラメータ算出手段１４０が、読み込んだ各音響フレームから、埋め込まれている情報を判定し、対応する符号を出力する（Ｓ２０２）。出力される符号の形式は、埋め込み側の２ビットの値に対応する値１〜値４の４値、および値０の計５値の形式となる。

ここで、ステップＳ２０２の符号判定処理の詳細を図１１のフローチャートに従って説明する。まず、周波数変換手段１３０が、読み込んだ各音響フレームに対して、周波数変換を行ってフレームスペクトルを得る（Ｓ４０１）。この処理は、図３に示した周波数変換手段２０における処理と同様である。ただし、抽出に用いるのは、左チャンネルだけであるので、上記〔数式５〕に従った処理を行い、左チャンネルに対応する変換データの実部Ａｌ（１，ｊ）等、虚部Ｂｌ（１，ｊ）等を得る。

上記周波数変換手段１３０における処理により、周波数に対応した成分であるスペクトルで表現されたフレームスペクトルが得られる。続いて、符号判定パラメータ算出手段１４０は、平均符号レベルＨＬ１〜ＨＬ４の算出を行う（Ｓ４０２）。具体的には、過去“状態１”であると判断された音響フレームについての合算値Ｅ_C1の積算値であるｖ１を、過去“状態１”であると判断された音響フレームの数であるｎ１で除算することによりＨＬ１を算出し、過去“状態２”であると判断された音響フレームについての合算値Ｅ_C2の積算値であるｖ２を、過去“状態２”であると判断された音響フレームの数であるｎ２で除算することによりＨＬ２を算出し、過去“状態３”であると判断された音響フレームについての合算値Ｅ_C3の積算値であるｖ３を、過去“状態３”であると判断された音響フレームの数であるｎ３で除算することによりＨＬ３を算出し、過去“状態４”であると判断された音響フレームについての合算値Ｅ_C4の積算値であるｖ４を、過去“状態４”であると判断された音響フレームの数であるｎ４で除算することによりＨＬ４を算出する。したがって、平均符号レベルＨＬ１〜ＨＬ４は、過去対応する状態であると判断された音響フレームの低周波強度データの合算値の平均値となる。

続いて、符号判定パラメータ算出手段１４０は、候補符号テーブルの初期化を行う（Ｓ４０３）。候補符号テーブルは、１つの基準フレームおよび５個の位相変更フレームを特定する０〜５の位相番号および、この６個の音響フレームの状態から得られる５値の符号を記録するものである。

続いて、符号判定パラメータ算出手段１４０は、合算値Ｅ_C1〜合算値Ｅ_C4を用いて、低周波成分の状態がどのような状態であるか、すなわち、２ビットの値としてどのような値が埋め込まれていたかを判断する処理を行う（Ｓ４０４）。具体的には、以下の４群の判定処理を実行し、各群における全ての条件を満たす場合に、対応する状態であったと判断し、対応する２ビットの値を出力する。

Ｅ_C1＞０．００１・ＨＬ１かつＥ_C1＞２・Ｅ_C2かつＥ_C1＞Ｅ_C3かつＥ_C1＞Ｅ_C4の場合、“状態１”であると判断し、値１を出力する。

Ｅ_C2＞０．００１・ＨＬ２かつＥ_C2＞２・Ｅ_C1かつＥ_C2＞Ｅ_C3かつＥ_C2＞Ｅ_C4の場合、“状態２”であると判断し、値２を出力する。

Ｅ_C3＞０．００１・ＨＬ３かつＥ_C3＞２・Ｅ_C4かつＥ_C3＞Ｅ_C1かつＥ_C3＞Ｅ_C2の場合、“状態３”であると判断し、値３を出力する。

Ｅ_C4＞０．００１・ＨＬ４かつＥ_C4＞２・Ｅ_C3かつＥ_C4＞Ｅ_C1かつＥ_C4＞Ｅ_C2の場合、“状態４”であると判断し、値４を出力する。

上記各群は、比較的厳しい判定を行うものであるが、上記各群のいずれも満たさない場合は、符号判定パラメータ算出手段１４０は、上記各群の先頭２つの条件のみの判定処理を実行し、状態を判断し、対応する２ビットの値を出力する。すなわち、以下の各群における判定処理を実行することになる。

Ｅ_C1＞０．００１・ＨＬ１かつＥ_C1＞２・Ｅ_C2の場合、“状態１”であると判断し、値１を出力する。

Ｅ_C2＞０．００１・ＨＬ２かつＥ_C2＞２・Ｅ_C1の場合、“状態２”であると判断し、値２を出力する。

Ｅ_C3＞０．００１・ＨＬ３かつＥ_C3＞２・Ｅ_C4の場合、“状態３”であると判断し、値３を出力する。

Ｅ_C4＞０．００１・ＨＬ４かつＥ_C4＞２・Ｅ_C3の場合、“状態４”であると判断し、値４を出力する。

符号判定パラメータ算出手段１４０は、各音響フレーム単位で、上記判定結果に応じて値１〜値４のいずれかを出力する（Ｓ４０７）。上記いずれの群の条件も満たさない場合は、“状態０”であると判断し、値０を出力する（Ｓ４０８）。
この“状態０”は、合算値Ｅ₁〜Ｅ₄が下限値Ｌｅｖ以下であることにより、当該フレームに２ビットの値の記録が行なわれなかったことを示す埋め込みエラーを示す場合と、ワードの区切りを示す場合とがある。“状態０”がワードの区切りを示すか否かは、後述するようにビットカウンタが８以上に達しているかどうかで判断する。

また、上記判定の結果、値１〜値４のいずれかを出力した場合には、さらに、以下の〔数式１８〕に従って位相判定テーブルＳ（ｐ）の更新を行う（Ｓ４０９）。

〔数式１８〕
“状態１”であると判断し、値１を出力した場合、Ｓ（ｐ）←Ｓ（ｐ）＋Ｅ_C1
“状態２”であると判断し、値２を出力した場合、Ｓ（ｐ）←Ｓ（ｐ）＋Ｅ_C2
“状態３”であると判断し、値３を出力した場合、Ｓ（ｐ）←Ｓ（ｐ）＋Ｅ_C3
“状態４”であると判断し、値４を出力した場合、Ｓ（ｐ）←Ｓ（ｐ）＋Ｅ_C4

続いて、符号判定パラメータ算出手段１４０は、候補符号テーブルに、最適位相となる候補を保存する（Ｓ４１０）。具体的には、位相判定テーブルに記録されているＳ（ｐ）の値が最大となる位相番号ｐの値、前記Ｓ４０７、Ｓ４０８により判定された５値のいずれかの符号、その音響フレームについての上記〔数式１７〕に従った処理を実行することにより算出した、低周波数成分に対応する各Ｅ_C1〜Ｅ_C4の値を最適位相の候補として候補符号テーブルに保存する。

続いて、全ての位相番号ｐに対応する処理を終えたかどうかを判定する（Ｓ４１１）。これは、ある基準フレームに対して全ての位相変更フレームの処理を行ったかどうかを判定している。本実施形態では、ｐが０〜５までの値をとるので、６回分処理していない場合は、処理していた音響フレームから所定サンプル数ずらして、位相の異なる音響フレームを設定し、Ｓ４０４に戻って処理を繰り返す。なお、ｐ＝０の場合が基準フレームであり、ｐ＝１〜５の場合が位相変更フレームである。全ての位相番号ｐに対応する処理を終えた場合は、候補保存テーブルに記録されている位相番号ｐに対応する位相が最適位相であると判定し、候補保存テーブルに記録されている符号を出力する（Ｓ４１２）。

再び図１０のフローチャートに戻って説明する。Ｓ２０２による処理の結果、値１〜値４に相当する符号が出力された場合には、平均符号レベルのパラメータの更新処理を行う（Ｓ２０３）。具体的には、平均符号レベルＨＬ１〜ＨＬ４算出の際の分子となる積算値ｖ１〜ｖ４にそれぞれ合算値Ｅ_C1〜Ｅ_C4を加算して積算値ｖ１〜ｖ４を更新し、分母となるフレーム数ｎ１〜ｎ４にそれぞれ１を加算してフレーム数ｎ１〜ｎ４を更新することにより行う。ｎ１〜ｎ４はあらかじめ設定したｎ_max（例えば１００）を超えないように設定する。

続いて、非符号カウンタの初期化処理を行う（Ｓ２０４）。具体的には、上記Ｓ２００の初期化処理における処理と同様、非符号カウンタＮｎ＝０と設定する。さらに、出力された値に対応する２ビットをバッファに保存する（Ｓ２０５）。次に、ビットカウンタを“２”だけカウントアップする（Ｓ２０６）。

一方、Ｓ２０２による処理の結果、値０が出力された場合には、非符号カウンタのカウントアップ処理を行う（Ｓ２０７）。具体的には、非符号カウンタＮｎの値に１を加算する。そして、非符号カウンタＮｎの値がｎ_max以上である場合は、Ｓ２００に戻って初期化処理を行う。非符号カウンタＮｎの値がｎ_max未満である場合は、ビットカウンタが８以上であるかどうかを判断し、８未満である場合は、値０は、ワードの区切りではなく埋め込みエラーを示す符号と判断し、現在のビットカウンタ値を維持してＳ２０１に戻って符号抽出処理を継続する。ビットカウンタが８以上である場合は、値０は、ワードの区切りを示すと判断できるので、バッファに記録された１ワード分のデータを、付加情報抽出手段１６０が出力する（Ｓ２０８）。そして、ビットカウンタを０に初期化する（Ｓ２０９）。図１０に示す処理を各基準フレームに対して実行することにより、付加情報が抽出されることになる。Ｓ２０１において全ての基準フレームが抽出されたと判断された場合には、処理を終了する。

上記Ｓ２０８の処理において、付加情報抽出手段１６０は、まず、符号判定パラメータ算出手段１４０により出力された値のうち、値０を区切り位置として、その次の値を先頭と仮定して、各値に対応する２ビットの値に対応させて、ビット配列を作成する。続いて、値０を抽出した際に、ビット配列のビットカウンタが８未満であれば、値０は埋め込みエラーを示すものと判断し、現状のビットカウンタの値を維持してビット配列の作成を継続する。ビット配列のビットカウンタが丁度８または８を超えていれば、値０はワード（１バイト）の区切りを示すものと判断し、ビット配列の最後の８ビットを、所定の規則により変換して意味のある付加情報として抽出する。ここで、８ビットを超える場合は、データの抽出処理を開始する直後に発生しやすく、値０を先頭と誤判断してビットカウンタを初期化した場合に発生する。所定の規則としては、情報を埋め込む者が意図した情報が受け取った者に認識可能な状態とできるものであれば、さまざまな規則が適用できるが、本実施形態では、文字情報として認識するための規則としている。すなわち、付加情報抽出手段１６０は、符号判定パラメータ算出手段１４０が判定し、符号出力手段１５０から出力される符号を１バイト（８ビット）単位で認識し、これを設定されたコード体系に従って文字情報を認識する。このようにして得られた文字情報は、表示装置（図示省略）の画面に表示出力される。

従って、埋め込み装置により音響信号に、その楽曲の曲名やアーチスト等の属性情報を文字情報として埋め込んでおけば、利用者は、その音楽が流れているのを聞いて、その曲名やアーチストを知りたいと思ったときに、抽出装置として機能する自身の携帯端末に所定の操作を行えば、自身の携帯端末の画面に曲名やアーチスト等の属性情報が文字情報として表示されることになる。

（１．６．位相補正処理について）
上記のように、抽出時には、埋め込み時に埋め込んだ音響フレームに対応して、音響信号を読み込むことができるとは限らない。そこで、音響フレームの位相をずらして複数通り（本実施形態では６通り）で読み込み、その中で最適な位相を決定し、その位相で特定される音響フレームに対応する符号を出力することにしている。例えば、６通りで読み込む場合、先頭の音響フレームは、本来サンプル番号１〜４０９６のサンプルであるが、サンプル番号１、６８３、１３６６、２０４９、２７３２、３４１３から始まる４０９６のサンプルで構成される６個の各音響フレームに対して処理を行い、最適な音響フレームに対応する符号を出力することになる。この位相補正処理は、Ｓ４０３、Ｓ４０９、Ｓ４１０、Ｓ４１１、Ｓ４１２における処理を中心として行われることになる。

（１．７．下限閾値補正処理について）
信号レベルが小さい場合には、窓成分の強度の大小が判定できず、抽出側で誤判断することが多くなる。そこで、合算値Ｅ_C1〜Ｅ_C4が所定の閾値以下のフレームについては、無効なフレームであると判断するようにしているが、この際の閾値を過去の有効フレームについての低周波強度の積算値を利用して補正する処理を行っている。このように閾値を変動させることにより、信号レベルが変動しても無効なフレームであるか、有効なフレームであるかを正確に判断することが可能となる。この下限閾値補正処理は、Ｓ４０２、Ｓ２０３における処理を中心として行われることになる。

（１．８．モノラル音響信号の場合）
上記実施形態においては、埋め込み装置、抽出装置のいずれにおいても、左右のチャンネルを有するステレオ音響信号の左チャンネル信号に付加情報を埋め込む場合を例にとって説明したが、逆に右チャンネル信号に付加情報を埋め込むようにしても良い。本発明は、左右の特性には無関係だからである。また、１つのチャンネルしかないモノラル音響信号に対して処理を行う場合は、上記実施形態において、左チャンネル信号に対して行った処理を行うことになる。本発明は、１つのチャンネル信号に対して付加情報を埋め込み、また抽出を行うので、モノラル音響信号であってもステレオ音響信号であっても同様に行うことができる。

（１．９．信号成分が小さくても情報の埋め込みを可能とする手法）
ここまで、説明してきた処理においては、上記Ｅ₁〜Ｅ₄が所定の大きさより大きいことが必要となり、上記Ｅ₁〜Ｅ₄が所定の大きさ以下の場合には、情報の埋め込みを行うことができない。そこで、以下、上記Ｅ₁〜Ｅ₄が所定の大きさ以下であっても、信号の埋め込みを可能とする手法について説明する。

この場合、図３に示した埋め込み装置における情報の埋め込み処理は、図６のフローチャートに従って行われるが、合算値Ｅ₁〜Ｅ₄がレベル下限値Ｌｅｖ以下となることがなくなるため、Ｓ１０５における周波数変換処理において低周波成分変更手段３０がレベルの判定を行わない。これは、この処理では、信号レベルが小さくても強制的に情報を埋め込むこととしているため、情報の埋め込みが不可能な信号レベルが小さい部分が存在するかどうかを判断し、区切りモードに設定する必要がないからである。

したがって、Ｓ１０５における状態１〜状態４に設定する処理としては、まず、以下の〔数式１９〕に従って算出される固定値Ｖを、低周波成分の強度として設定する。

〔数式１９〕
Ｖ＝｛０．５・Ｌｅｖ／（２Ｐ−６）｝^1/2

そして、状態１とする場合は、上記〔数式８〕に従った処理を実行した後、以下の〔数式２０〕に従った処理を実行する。

〔数式２０〕
ｊ＝ｍ〜ｍ＋Ｐ−４、ｍ＋Ｐ〜ｍ＋２Ｐ−４の各成分に対して
Ａｌ´（１，ｊ）＝Ａｌ（１，ｊ）・Ｖ／｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²｝^1/2
Ｂｌ´（１，ｊ）＝Ｂｌ（１，ｊ）・Ｖ／｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²｝^1/2

状態２とする場合は、上記〔数式９〕に従った処理を実行した後、以下の〔数式２１〕に従った処理を実行する。

〔数式２１〕
ｊ＝ｍ〜ｍ＋Ｐ−４、ｍ＋Ｐ〜ｍ＋２Ｐ−４の各成分に対して
Ａｌ´（３，ｊ）＝Ａｌ（３，ｊ）・Ｖ／｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²｝^1/2
Ｂｌ´（３，ｊ）＝Ｂｌ（３，ｊ）・Ｖ／｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²｝^1/2

状態３とする場合は、上記〔数式１０〕に従った処理を実行した後、以下の〔数式２２〕に従った処理を実行する。

〔数式２２〕
ｊ＝ｍ〜ｍ＋Ｐ−４の各成分に対して
Ａｌ´（１，ｊ）＝Ａｌ（１，ｊ）・Ｖ／｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²｝^1/2
Ｂｌ´（１，ｊ）＝Ｂｌ（１，ｊ）・Ｖ／｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²｝^1/2
ｊ＝ｍ＋Ｐ〜ｍ＋２Ｐ−４の各成分に対して
Ａｌ´（３，ｊ）＝Ａｌ（３，ｊ）・Ｖ／｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²｝^1/2
Ｂｌ´（３，ｊ）＝Ｂｌ（３，ｊ）・Ｖ／｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²｝^1/2

状態４とする場合は、上記〔数式１１〕に従った処理を実行した後、以下の〔数式２３〕に従った処理を実行する。

〔数式２３〕
ｊ＝ｍ〜ｍ＋Ｐ−４の各成分に対して
Ａｌ´（３，ｊ）＝Ａｌ（３，ｊ）・Ｖ／｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²｝^1/2
Ｂｌ´（３，ｊ）＝Ｂｌ（３，ｊ）・Ｖ／｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²｝^1/2
ｊ＝ｍ＋Ｐ〜ｍ＋２Ｐ−４の各成分に対して
Ａｌ´（１，ｊ）＝Ａｌ（１，ｊ）・Ｖ／｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²｝^1/2
Ｂｌ´（１，ｊ）＝Ｂｌ（１，ｊ）・Ｖ／｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²｝^1/2

上記のように、周波数成分が小さい場合に情報を埋め込んだ場合であっても、抽出側の、音響信号からの情報の抽出装置の構成は図９と同一であり、処理動作は図１０のフローチャートに従ったものと同一である。

（２．第２の実施形態）
ここからは、第２の実施形態について説明する。第１の実施形態では、図２に示したように、音響フレームの低周波成分を４つの状態に変更し、２ビットの情報を埋め込むようにしたが、第２の実施形態では、図１２に示すように、音響フレームの低周波成分を８つの状態に変更し、３ビットの情報を埋め込むことを特徴とする。

図１２に示す各音響フレームにおいても、図２と同様、横軸は時間方向、縦軸は周波数方向を示している。また、網掛けされた部分は、低周波成分が存在している部分を示し、網掛けが濃いほど成分強度が強いことを示している。第２の実施形態において、図１２（ａ）に示すような原状態の低周波成分に対して、符号０を埋め込む場合、Ｌ-chの信号の低周波成分を全て除去し、除去した成分と同等の成分をＲ-chの信号の低周波成分に加算して図１２（ｂ）に示すような状態に変更する。図１２においても、図２と同様、縦軸の周波数方向において、周波数領域が５つに区分されている。

本実施形態で、符号１を埋め込む場合、図１２（ｃ）に示すように、Ｌ-chの信号の後部の低周波成分を除去し、除去した成分と同等の成分をＲ-chの信号に加算し、逆に、Ｒ-chの信号の前部の低周波成分を除去し、除去した成分と同等の成分をＬ-chの信号に加算する。符号２を埋め込む場合は、図１２（ｄ）に示すように、Ｌ-chの信号の前部の低周波成分を除去し、除去した成分と同等の成分をＲ-chの信号に加算し、逆に、Ｒ-chの信号の後部の低周波成分を除去し、除去した成分と同等の成分をＬ-chの信号に加算する。

符号３を埋め込む場合、図１２（ｅ）に示すように、Ｌ-chの信号の前部の上位低周波領域の成分である上位低周波成分と、後部の下位低周波領域の成分である下位低周波成分を除去し、除去した成分と同等の成分をＲ-chの信号に加算し、逆に、Ｒ-chの信号の前部の下位低周波成分と後部の上位低周波成分を除去し、除去した成分と同等の成分をＬ-chの信号に加算する。符号４を埋め込む場合は、図１２（ｆ）に示すように、Ｌ-chの信号の前部の下位低周波成分と後部の上位低周波成分を除去し、除去した成分と同等の成分をＲ-chの信号に加算し、逆に、Ｒ-chの信号の前部の上位低周波成分と後部の下位低周波成分を除去し、除去した成分と同等の成分をＬ-chの信号に加算する。

符号５を埋め込む場合、図１２（ｇ）に示すように、Ｌ-chの信号の前部の上位低周波成分と、後部の低周波成分を除去し、除去した成分と同等の成分をＲ-chの信号に加算し、逆に、Ｒ-chの信号の前部の下位低周波成分を除去し、除去した成分と同等の成分をＬ-chの信号に加算する。符号６を埋め込む場合は、図１２（ｈ）に示すように、Ｌ-chの信号の前部の低周波成分と後部の上位低周波成分を除去し、除去した成分と同等の成分をＲ-chの信号に加算し、逆に、Ｒ-chの信号の後部の下位低周波成分を除去し、除去した成分と同等の成分をＬ-chの信号に加算する。

符号７を埋め込む場合、図１２（ｉ）に示すように、Ｌ-chの信号の前部の低周波成分と、後部の下位低周波成分を除去し、除去した成分と同等の成分をＲ-chの信号に加算し、逆に、Ｒ-chの信号の後部の上位低周波成分を除去し、除去した成分と同等の成分をＬ-chの信号に加算する。符号８を埋め込む場合は、図１２（ｊ）に示すように、Ｌ-chの信号の前部の下位低周波成分と後部の低周波成分を除去し、除去した成分と同等の成分をＲ-chの信号に加算し、逆に、Ｒ-chの信号の前部の上位低周波成分を除去し、除去した成分と同等の成分をＬ-chの信号に加算する。

本実施形態では、図１２（ｂ）〜（ｊ）に示すような９つの状態に低周波成分を変更することにより、情報の埋め込みを行っている。９つの状態のうち、１つは、埋め込むことができない状態におけるエラー処理に用いるものであるので、実質埋め込むことができるのは８つの状態、すなわち、３ビットに相当する。

（２．１．埋め込み装置）
第２の実施形態においても、装置構成は図３に示したものと同様であるが、主に低周波成分変更手段３０の内容が異なっている。具体的には、低周波成分変更手段３０は、Ａタイプの音響フレームについて、付加情報読込手段７０が読み込んだビット値に応じて、低周波成分の割合を変更する処理を行うが、第２の実施形態では、ビット配列を３ビットずつ読み込み、１音響フレームに対して３ビットの情報を埋め込む。埋め込まれる３ビットの値は、“０００”“００１”“０１０”“０１１” “１００”“１０１”“１１０”“１１１”の８通りがある。第２の実施形態では、これらを値１〜値８と定義する。この際、“０００”〜“１１１”の８通りのうち、いずれを値１〜値８と定義しても良い。抽出側において、埋め込み側で埋め込まれた３ビットの配列が特定できれば良いためである。したがって、この定義は、埋め込み側と抽出側で一致している必要がある。

そして、低周波成分変更手段３０は、この値１〜値８に応じて、低周波成分を状態１〜状態８のいずれかに変更する。具体的には、まず、低周波成分変更手段３０は、上記〔数式５〕により求めた左チャンネルの実部Ａｌ（１，ｊ）、Ａｌ（３，ｊ）、虚部Ｂｌ（１，ｊ）、Ｂｌ（３，ｊ）、右チャンネルの実部Ａｒ（１，ｊ）、Ａｒ（３，ｊ）、虚部Ｂｒ（１，ｊ）、Ｂｒ（３，ｊ）を利用して、以下の〔数式２４〕により、合算値Ｅ₁〜Ｅ₄を算出する。この合算値Ｅ₁〜Ｅ₄は、第１の実施形態におけるものとは異なっている。なお、Ｅ₁〜Ｅ₆、Ｅ_C1〜Ｅ_C6、ＨＬ１〜ＨＬ１６等の各変数は、各実施形態で独立しており、同一名の変数であっても、算出手法が異なる。ただし、本明細書で用いられる数式については、明細書全体を通じて統一されている。

〔数式２４〕
Ｅ₁＝Σ_j=m,m+P-4｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²＋Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝
Ｅ₂＝Σ_j=m,m+P-4｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²＋Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝
Ｅ₃＝Σ_j=m+p,m+2P-4｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²＋Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝
Ｅ₄＝Σ_j=m+p,m+2P-4｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²＋Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝

上記〔数式２４〕において、ｍは低周波数帯の下限の成分の番号、Ｍは低周波数帯の上限の成分の番号であり、Ｐ＝（Ｍ−ｍ）／２である。なお、Ｐが整数にならない場合、切捨て処理を行う。ｍ＝１５、Ｍ＝４０と設定すると、Ｐ＝１２となり、図５に例示したスケールと同じになる。上記〔数式２４〕により算出されたＥ₁〜Ｅ₄は音響フレームの所定の範囲におけるスペクトル集合の成分強度の合算値を示すことになる。続いて、この合算値Ｅ₁〜Ｅ₄がレベル下限値Ｌｅｖより大きいかどうかの判定を行う。レベル下限値Ｌｅｖは、音響信号Ｘｌ（ｉ）、Ｘｒ（ｉ）の振幅最大値が１に正規化されており、Ｍ＝４０に設定されている場合、０．２５に設定する。このＬｅｖ＝０．２５という値は、経験的にアナログ変換への耐性が維持できるレベルであり、低周波成分が少ない場合は適宜下げることになるが、その場合は、アナログ変換により検出精度も低下することになる。

合算値Ｅ₁〜Ｅ₄がレベル下限値Ｌｅｖより大きいかどうかを判断するのは、信号の強度が小さいと、信号を変化させても、その変化を抽出側で検出することができないためである。すなわち、各低周波スペクトル成分を十分な大きさとすることができるかどうかを判断することになる。

Ｅ₁およびＥ₃が共にレベル下限値Ｌｅｖより大きく、埋め込むべき情報が“値１”である場合、以下の〔数式２５〕に従った処理を実行することにより、低周波成分の状態を“状態１”、すなわち、図１２（ｃ）に示したような状態に変更する。

〔数式２５〕
ｊ＝ｍ〜ｍ＋Ｐ−４、ｍ＋Ｐ〜ｍ＋２Ｐ−４の各成分に対して
Ａｌ´（３，ｊ）＝０
Ｂｌ´（３，ｊ）＝０
Ｅ（３，ｊ）＝｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²＋Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
Ａｒ´（３，ｊ）＝Ａｒ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
Ｂｒ´（３，ｊ）＝Ｂｒ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
Ａｒ´（１，ｊ）＝０
Ｂｒ´（１，ｊ）＝０
Ｅ（１，ｊ）＝｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²＋Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
Ａｌ´（１，ｊ）＝Ａｌ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²｝^1/2
Ｂｌ´（１，ｊ）＝Ｂｌ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²｝^1/2

上記〔数式２５〕においては、ｊ＝ｍ〜ｍ＋Ｐ−４、ｍ＋Ｐ〜ｍ＋２Ｐ−４において、Ａｌ´（３，ｊ）、Ｂｌ´（３，ｊ）を共に０としている。これは、図１２（ｃ）の上段に示すように、L-chにおいて、ＳＰ３Ｕ、ＳＰ３Ｄ内の各成分を０にすることを示しているが、“状態１”はＳＰ１Ｕ、ＳＰ１Ｄとの差を明確にすることができれば十分であるため、必ずしも０にする必要はなく、小さな値であれば良い。

Ｅ₂およびＥ₄が共にレベル下限値Ｌｅｖより大きく、埋め込むべき情報が“値２”である場合は、以下の〔数式２６〕に従った処理を実行することにより、低周波成分の状態を“状態２” 、すなわち、図１２（ｄ）に示したような状態に変更する。

〔数式２６〕
ｊ＝ｍ〜ｍ＋Ｐ−４、ｍ＋Ｐ〜ｍ＋２Ｐ−４の各成分に対して
Ａｌ´（１，ｊ）＝０
Ｂｌ´（１，ｊ）＝０
Ｅ（１，ｊ）＝｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²＋Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
Ａｒ´（１，ｊ）＝Ａｒ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
Ｂｒ´（１，ｊ）＝Ｂｒ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
Ａｒ´（３，ｊ）＝０
Ｂｒ´（３，ｊ）＝０
Ｅ（３，ｊ）＝｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²＋Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
Ａｌ´（３，ｊ）＝Ａｌ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²｝^1/2
Ｂｌ´（３，ｊ）＝Ｂｌ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²｝^1/2

上記〔数式２６〕においては、ｊ＝ｍ〜ｍ＋Ｐ−４、ｍ＋Ｐ〜ｍ＋２Ｐ−４において、Ａｌ´（１，ｊ）、Ｂｌ´（１，ｊ）を共に０としている。これは、図１２（ｄ）の上段に示すように、L-chにおいて、ＳＰ１Ｕ、ＳＰ１Ｄ内の各成分を０にすることを示しているが、“状態２”はＳＰ３Ｕ、ＳＰ３Ｄとの差を明確にすることができれば十分であるため、必ずしも０にする必要はなく、小さな値であれば良い。

Ｅ₁およびＥ₄が共にレベル下限値Ｌｅｖより大きく、埋め込むべき情報が“値３”である場合、以下の〔数式２７〕に従った処理を実行することにより、低周波成分の状態を“状態３” 、すなわち、図１２（ｅ）に示したような状態に変更する。

〔数式２７〕
ｊ＝ｍ〜ｍ＋Ｐ−４の各成分に対して
Ａｌ´（３，ｊ）＝０
Ｂｌ´（３，ｊ）＝０
Ｅ（３，ｊ）＝｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²＋Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
Ａｒ´（３，ｊ）＝Ａｒ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
Ｂｒ´（３，ｊ）＝Ｂｒ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
ｊ＝ｍ＋Ｐ〜ｍ＋２Ｐ−４の各成分に対して
Ａｌ´（１，ｊ）＝０
Ｂｌ´（１，ｊ）＝０
Ｅ（１，ｊ）＝｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²＋Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
Ａｒ´（１，ｊ）＝Ａｒ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
Ｂｒ´（１，ｊ）＝Ｂｒ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
ｊ＝ｍ〜ｍ＋Ｐ−４の各成分に対して
Ａｒ´（１，ｊ）＝０
Ｂｒ´（１，ｊ）＝０
Ｅ（１，ｊ）＝｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²＋Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
Ａｌ´（１，ｊ）＝Ａｌ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²｝^1/2
Ｂｌ´（１，ｊ）＝Ｂｌ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²｝^1/2
ｊ＝ｍ＋Ｐ〜ｍ＋２Ｐ−４の各成分に対して
Ａｒ´（３，ｊ）＝０
Ｂｒ´（３，ｊ）＝０
Ｅ（３，ｊ）＝｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²＋Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
Ａｌ´（３，ｊ）＝Ａｌ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²｝^1/2
Ｂｌ´（３，ｊ）＝Ｂｌ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²｝^1/2

上記〔数式２７〕においては、ｊ＝ｍ〜ｍ＋Ｐ−４においてＡｌ´（３，ｊ）、Ｂｌ´（３，ｊ）を共に０とし、ｊ＝ｍ＋Ｐ〜ｍ＋２Ｐ−４においてＡｌ´（１，ｊ）、Ｂｌ´（１，ｊ）を共に０としている。これは、図１２（ｅ）の上段に示すように、L-chにおいて、ＳＰ３Ｄ、ＳＰ１Ｕ内の各成分を０にすることを示しているが、“状態３”はＳＰ３Ｕ、ＳＰ１Ｄとの差を明確にすることができれば十分であるため、必ずしも０にする必要はなく、小さな値であれば良い。

Ｅ₂およびＥ₃が共にレベル下限値Ｌｅｖより大きく、埋め込むべき情報が“値４”である場合、以下の〔数式２８〕に従った処理を実行することにより、低周波成分の状態を“状態４” 、すなわち、図１２（ｆ）に示したような状態に変更する。

〔数式２８〕
ｊ＝ｍ〜ｍ＋Ｐ−４の各成分に対して
Ａｌ´（１，ｊ）＝０
Ｂｌ´（１，ｊ）＝０
Ｅ（１，ｊ）＝｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²＋Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
Ａｒ´（１，ｊ）＝Ａｒ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
Ｂｒ´（１，ｊ）＝Ｂｒ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
ｊ＝ｍ＋Ｐ〜ｍ＋２Ｐ−４の各成分に対して
Ａｌ´（３，ｊ）＝０
Ｂｌ´（３，ｊ）＝０
Ｅ（３，ｊ）＝｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²＋Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
Ａｒ´（３，ｊ）＝Ａｒ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
Ｂｒ´（３，ｊ）＝Ｂｒ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
ｊ＝ｍ〜ｍ＋Ｐ−４の各成分に対して
Ａｒ´（３，ｊ）＝０
Ｂｒ´（３，ｊ）＝０
Ｅ（３，ｊ）＝｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²＋Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
Ａｌ´（３，ｊ）＝Ａｌ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²｝^1/2
Ｂｌ´（３，ｊ）＝Ｂｌ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²｝^1/2
ｊ＝ｍ＋Ｐ〜ｍ＋２Ｐ−４の各成分に対して
Ａｒ´（１，ｊ）＝０
Ｂｒ´（１，ｊ）＝０
Ｅ（１，ｊ）＝｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²＋Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
Ａｌ´（１，ｊ）＝Ａｌ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²｝^1/2
Ｂｌ´（１，ｊ）＝Ｂｌ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²｝^1/2

上記〔数式２８〕においては、ｊ＝ｍ〜ｍ＋Ｐ−４においてＡｌ´（１，ｊ）、Ｂｌ´（１，ｊ）を共に０とし、ｊ＝ｍ＋Ｐ〜ｍ＋２Ｐ−４においてＡｌ´（３，ｊ）、Ｂｌ´（３，ｊ）を共に０としている。これは、図１２（ｆ）の上段に示すように、L-chにおいて、SP1D、SP3U内の各成分を０にすることを示しているが、“状態４”はSP3D、SP1Uとの差を明確にすることができれば十分であるため、必ずしも０にする必要はなく、小さな値であれば良い。

Ｅ₁がレベル下限値Ｌｅｖより大きく、埋め込むべき情報が“値５”である場合、以下の〔数式２９〕に従った処理を実行することにより、低周波成分の状態を“状態５” 、すなわち、図１２（ｇ）に示したような状態に変更する。

〔数式２９〕
ｊ＝ｍ＋Ｐ〜ｍ＋２Ｐ−４の各成分に対して
Ａｌ´（１，ｊ）＝０
Ｂｌ´（１，ｊ）＝０
Ｅ（１，ｊ）＝｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²＋Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
Ａｒ´（１，ｊ）＝Ａｒ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
Ｂｒ´（１，ｊ）＝Ｂｒ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
ｊ＝ｍ〜ｍ＋Ｐ−４、ｍ＋Ｐ〜ｍ＋２Ｐ−４の各成分に対して
Ａｌ´（３，ｊ）＝０
Ｂｌ´（３，ｊ）＝０
Ｅ（３，ｊ）＝｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²＋Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
Ａｒ´（３，ｊ）＝Ａｒ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
Ｂｒ´（３，ｊ）＝Ｂｒ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
ｊ＝ｍ〜ｍ＋Ｐ−４の各成分に対して
Ａｒ´（１，ｊ）＝０
Ｂｒ´（１，ｊ）＝０
Ｅ（１，ｊ）＝｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²＋Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
Ａｌ´（１，ｊ）＝Ａｌ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²｝^1/2
Ｂｌ´（１，ｊ）＝Ｂｌ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²｝^1/2

上記〔数式２９〕においては、ｊ＝ｍ＋Ｐ〜ｍ＋２Ｐ−４においてＡｌ´（１，ｊ）、Ｂｌ´（１，ｊ）を共に０とし、ｊ＝ｍ〜ｍ＋Ｐ−４、ｍ＋Ｐ〜ｍ＋２Ｐ−４においてＡｌ´（３，ｊ）、Ｂｌ´（３，ｊ）を共に０としている。これは、図１２（ｇ）の上段に示すように、L-chにおいて、SP1U、SP3U、SP3D内の各成分を０にすることを示しているが、“状態５”はSP1Dとの差を明確にすることができれば十分であるため、必ずしも０にする必要はなく、小さな値であれば良い。

Ｅ₂がレベル下限値Ｌｅｖより大きく、埋め込むべき情報が“値６”である場合、以下の〔数式３０〕に従った処理を実行することにより、低周波成分の状態を“状態６” 、すなわち、図１２（ｈ）に示したような状態に変更する。

〔数式３０〕
ｊ＝ｍ〜ｍ＋Ｐ−４、ｍ＋Ｐ〜ｍ＋２Ｐ−４の各成分に対して
Ａｌ´（１，ｊ）＝０
Ｂｌ´（１，ｊ）＝０
Ｅ（１，ｊ）＝｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²＋Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
Ａｒ´（１，ｊ）＝Ａｒ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
Ｂｒ´（１，ｊ）＝Ｂｒ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
ｊ＝ｍ＋Ｐ〜ｍ＋２Ｐ−４の各成分に対して
Ａｌ´（３，ｊ）＝０
Ｂｌ´（３，ｊ）＝０
Ｅ（３，ｊ）＝｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²＋Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
Ａｒ´（３，ｊ）＝Ａｒ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
Ｂｒ´（３，ｊ）＝Ｂｒ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
ｊ＝ｍ〜ｍ＋Ｐ−４の各成分に対して
Ａｒ´（３，ｊ）＝０
Ｂｒ´（３，ｊ）＝０
Ｅ（３，ｊ）＝｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²＋Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
Ａｌ´（３，ｊ）＝Ａｌ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²｝^1/2
Ｂｌ´（３，ｊ）＝Ｂｌ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²｝^1/2

上記〔数式３０〕においては、ｊ＝ｍ〜ｍ＋Ｐ−４、ｍ＋Ｐ〜ｍ＋２Ｐ−４においてＡｌ´（１，ｊ）、Ｂｌ´（１，ｊ）を共に０とし、ｊ＝ｍ＋Ｐ〜ｍ＋２Ｐ−４においてＡｌ´（３，ｊ）、Ｂｌ´（３，ｊ）を共に０としている。これは、図１２（ｈ）の上段に示すように、L-chにおいて、SP1U、SP3U、SP1D内の各成分を０にすることを示しているが、“状態６”はSP3Dとの差を明確にすることができれば十分であるため、必ずしも０にする必要はなく、小さな値であれば良い。

Ｅ₄がレベル下限値Ｌｅｖより大きく、埋め込むべき情報が“値７”である場合、以下の〔数式３１〕に従った処理を実行することにより、低周波成分の状態を“状態７” 、すなわち、図１２（ｉ）に示したような状態に変更する。

〔数式３１〕
ｊ＝ｍ〜ｍ＋Ｐ−４、ｍ＋Ｐ〜ｍ＋２Ｐ−４の各成分に対して
Ａｌ´（１，ｊ）＝０
Ｂｌ´（１，ｊ）＝０
Ｅ（１，ｊ）＝｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²＋Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
Ａｒ´（１，ｊ）＝Ａｒ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
Ｂｒ´（１，ｊ）＝Ｂｒ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
ｊ＝ｍ〜ｍ＋Ｐ−４の各成分に対して
Ａｌ´（３，ｊ）＝０
Ｂｌ´（３，ｊ）＝０
Ｅ（３，ｊ）＝｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²＋Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
Ａｒ´（３，ｊ）＝Ａｒ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
Ｂｒ´（３，ｊ）＝Ｂｒ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
ｊ＝ｍ＋Ｐ〜ｍ＋２Ｐ−４の各成分に対して
Ａｒ´（３，ｊ）＝０
Ｂｒ´（３，ｊ）＝０
Ｅ（３，ｊ）＝｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²＋Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
Ａｌ´（３，ｊ）＝Ａｌ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²｝^1/2
Ｂｌ´（３，ｊ）＝Ｂｌ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²｝^1/2

上記〔数式３１〕においては、ｊ＝ｍ〜ｍ＋Ｐ−４、ｍ＋Ｐ〜ｍ＋２Ｐ−４においてＡｌ´（１，ｊ）、Ｂｌ´（１，ｊ）を共に０とし、ｊ＝ｍ〜ｍ＋Ｐ−４においてＡｌ´（３，ｊ）、Ｂｌ´（３，ｊ）を共に０としている。これは、図１２（ｉ）の上段に示すように、L-chにおいて、SP1U、SP1D、SP3D内の各成分を０にすることを示しているが、“状態７”はSP3Uとの差を明確にすることができれば十分であるため、必ずしも０にする必要はなく、小さな値であれば良い。

Ｅ₃がレベル下限値Ｌｅｖより大きく、埋め込むべき情報が“値８”である場合、以下の〔数式３２〕に従った処理を実行することにより、低周波成分の状態を“状態８” 、すなわち、図１２（ｊ）に示したような状態に変更する。

〔数式３２〕
ｊ＝ｍ〜ｍ＋Ｐ−４の各成分に対して
Ａｌ´（１，ｊ）＝０
Ｂｌ´（１，ｊ）＝０
Ｅ（１，ｊ）＝｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²＋Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
Ａｒ´（１，ｊ）＝Ａｒ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
Ｂｒ´（１，ｊ）＝Ｂｒ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
ｊ＝ｍ〜ｍ＋Ｐ−４、ｍ＋Ｐ〜ｍ＋２Ｐ−４の各成分に対して
Ａｌ´（３，ｊ）＝０
Ｂｌ´（３，ｊ）＝０
Ｅ（３，ｊ）＝｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²＋Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
Ａｒ´（３，ｊ）＝Ａｒ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
Ｂｒ´（３，ｊ）＝Ｂｒ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
ｊ＝ｍ＋Ｐ〜ｍ＋２Ｐ−４の各成分に対して
Ａｒ´（１，ｊ）＝０
Ｂｒ´（１，ｊ）＝０
Ｅ（１，ｊ）＝｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²＋Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
Ａｌ´（１，ｊ）＝Ａｌ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²｝^1/2
Ｂｌ´（１，ｊ）＝Ｂｌ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²｝^1/2

上記〔数式３２〕においては、ｊ＝ｍ〜ｍ＋Ｐ−４においてＡｌ´（１，ｊ）、Ｂｌ´（１，ｊ）を共に０とし、ｊ＝ｍ〜ｍ＋Ｐ−４、ｍ＋Ｐ〜ｍ＋２Ｐ−４においてＡｌ´（３，ｊ）、Ｂｌ´（３，ｊ）を共に０としている。これは、図１２（ｊ）の上段に示すように、L-chにおいて、ＳＰ１Ｄ、ＳＰ３Ｕ、ＳＰ３Ｄ内の各成分を０にすることを示しているが、“状態８”はＳＰ１Ｕとの差を明確にすることができれば十分であるため、必ずしも０にする必要はなく、小さな値であれば良い。

上記〔数式２５〕〜〔数式３２〕に従った処理を実行し、低周波成分の状態を“状態１”〜“状態８”に変更した場合、いずれの場合であっても、さらに第１の実施形態と同様、上記〔数式１２〕に従った処理を実行し、最低周波数帯におけるギャップ領域Ｇ１Ｄ、Ｇ３Ｄ、上位低周波数帯と下位低周波数帯の間にギャップ領域Ｇ１Ｍ、Ｇ３Ｍ、上位低周波数帯の高周波側にギャップ領域Ｇ１Ｕ、Ｇ３Ｕを設ける。

第２の実施形態においても、ワード間の区切りとする場合、埋め込まれる側の低周波成分の強度が小さすぎる場合には、第１の実施形態と同様、上記〔数式１３〕に従った処理を実行し、その低周波成分を除去し、状態を“状態０”に変更する。これは、図１２（ｂ）に示すような状態である。

Ｂタイプの音響フレームについては、低周波成分変更手段３０は、第１の実施形態と同様、上記〔数式１４〕に従った処理を実行し、常にその低周波成分を除去する。

続いて、周波数逆変換手段４０は、第１の実施形態と同様、低周波成分の状態が変更されたフレームスペクトルを周波数逆変換して改変音響フレームを得る処理を行う。

具体的には、Ａタイプの音響フレームに対しては、周波数逆変換手段４０は、上記〔数式２５〕〜〔数式３２〕、〔数式１３〕のいずれかにより得られたスペクトルの左チャンネルの実部Ａｌ´（１，ｊ）等、虚部Ｂｌ´（１，ｊ）等、右チャンネルの実部Ａｒ´（１，ｊ）等、虚部Ｂｒ´（１，ｊ）等を用いて、第１の実施形態と同様、上記〔数式１５〕に従った処理を行い、Ｘｌ´（ｉ）、Ｘｒ´（ｉ）を算出する。なお、上記〔数式２５〕〜〔数式３２〕、〔数式１３〕において改変されていない周波数成分については、Ａｌ´（１，ｊ）等として、元の周波数成分であるＡｌ（１，ｊ）等を用いる。

Ｂタイプの音響フレームに対しては、周波数逆変換手段４０は、上記〔数式１４〕により得られたスペクトルの左チャンネルの実部Ａｌ´（４，ｊ）、虚部Ｂｌ´（４，ｊ）、右チャンネルの実部Ａｒ´（４，ｊ）、虚部Ｂｒ´（４，ｊ）を用いて、第１の実施形態と同様、上記〔数式１６〕に従った処理を行い、Ｘｌ´（ｉ）、Ｘｒ´（ｉ）を算出する。

次に、第２の実施形態における音響信号に対する情報の埋め込み装置の処理の全体的な流れを、図１３のフローチャートに示す。図１３において、図６と同一の部分は、図６と同一または類似の処理を行うものである。図１３において、図６と大きく異なるのは、Ｓ１１０の部分であり、第２の実施形態では、低周波成分変更手段３０が、レジスタに保持された１ワードから２ビットを読み込む処理を行った後、読み込む２ビットが末端２ビットでない場合は、さらにもう１ビット読み込む処理を行う。すなわち、この場合、レジスタから３ビット読み込むことになる。すなわち、本実施形態では、１ワードとしてレジスタに８ビットが保持されているため、３ビット、３ビット、２ビットの順に読み込まれる。末端の２ビット以外では、３ビット読み込む方が効率が良いため、末端２ビットであるかどうかを判断し、そうでない場合は、さらに１ビット読み込んで３ビット読み込みとしているのである。

モードがビットモードである場合は、周波数変換手段２０および低周波成分変更手段３０が、音響フレームの低周波成分の状態を“状態１”〜“状態８”のいずれかに変更する処理を行う（Ｓ１０５）。具体的には、まず、周波数変換手段２０が、読み込んだ音響フレームに対して、周波数変換を行って、その音響フレームのスペクトルであるフレームスペクトルを得る。すなわち、各音響フレームについて、３つの窓関数Ｗ（１，ｉ）、Ｗ（２，ｉ）、Ｗ（３，ｉ）を用いて、上記〔数式５〕に従った処理を行うことになる。

続いて、低周波成分変更手段３０が、上記〔数式２４〕によりＥ₁〜Ｅ₄を算出する。そして、付加情報読込手段７０から受け取った値１〜値８に応じて上記〔数式２５〕〜〔数式３２〕に従った処理を実行し、低周波成分の状態を“状態１”〜“状態８”のいずれかに変更する。

Ｓ１０５において、“状態１”〜“状態８”のいずれにも変更することができない場合は、低周波成分を“状態０”とする処理を行う（Ｓ１０６）。具体的には、上記〔数式１３〕に従った処理を実行することになる。“状態１”〜“状態８” のいずれにも変更することができない場合とは、埋め込むべき値に対応する合算値のいずれかが、レベル下限値Ｌｅｖ以下となっている場合である。例えば、値１を埋め込む場合、Ｅ₁およびＥ₃が共にレベル下限値Ｌｅｖより大きい必要があるため、Ｅ₁、Ｅ₃のいずれかがＬｅｖ以下である場合は、Ｓ１０６に進むことになる。

上記〔数式１３〕に従った処理を実行することにより、左チャンネルのフレームスペクトルの低周波数成分は、上位低周波領域前部のスペクトルＳＰ１Ｕ、上位低周波領域後部のスペクトルＳＰ３Ｕ、下位低周波領域前部のスペクトルＳＰ１Ｄ、下位低周波領域後部のスペクトルＳＰ３Ｄ全てにおいて、“０” で同一となる。この“状態０”のパターンは、付加情報の先頭位置（区切り）を示す情報か、または前述の合算値Ｅ₁〜Ｅ₄が下限値Ｌｅｖ以下であることにより、当該フレームに３ビットまたは２ビットの値の記録が行なわれなかったことを示す情報となる。なお、上記〔数式１３〕においては、ｊ＝０〜Ｍ−１の各成分に対してＡｌ´（ｊ）＝Ｂｌ´（ｊ）＝０としているが、抽出側において、“状態１”〜“状態８”のいずれでもないことを認識可能とすることを目的としているため、十分小さな値であれば、必ずしも０とする必要はない。また、必ずしも４つのスペクトル成分の値が同一である必要はなく、差が小さければ良い。

次に、周波数逆変換手段４０が、上記Ｓ１０５、Ｓ１０６の処理により各低周波成分のスペクトル集合間の割合が変更されたフレームスペクトルを周波数逆変換して改変音響フレームを得る処理を行う（Ｓ１０７）。この周波数逆変換は、当然のことながら、周波数変換手段２０がＳ１０５において実行した手法に対応していることが必要となる。本実施形態では、周波数変換手段２０において、フーリエ逆変換を施しているため、周波数逆変換手段４０は、フーリエ逆変換を実行することになる。具体的には、上記〔数式２５〕〜〔数式３２〕〔数式１２〕〔数式１３〕のいずれかにより得られたスペクトルの左チャンネルの実部Ａｌ´（１，ｊ）等、虚部Ｂｌ´（１，ｊ）等、右チャンネルの実部Ａｒ´（１，ｊ）等、虚部Ｂｒ´（１，ｊ）等を用いて、上記〔数式１５〕に従った処理を行い、Ｘｌ´（ｉ）、Ｘｒ´（ｉ）を算出する。

（２．２．抽出装置）
第２の実施形態においても、装置構成は図９に示したものと同様であるが、主に符号判定パラメータ算出手段１４０の内容が異なっている。具体的には、符号判定パラメータ算出手段１４０は、生成されたフレームスペクトルから所定の周波数以下に相当する各低周波強度データを抽出し、各成分に対応した各低周波強度データの合算値Ｅ_C1〜Ｅ_C4を以下の〔数式３３〕に基づいて算出し、この合算値Ｅ_C1〜Ｅ_C4を符号判定パラメータとし、この符号判定パラメータＥ_C1〜Ｅ_C4の比率等に基づいて、所定の状態であると判断する機能を有している。以下の〔数式３３〕は上記〔数式２４〕において右チャンネル成分を削除したものとなっている。

〔数式３３〕
Ｅ_C1＝Σ_{j=m,…,m+P-4}｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²｝
Ｅ_C2＝Σ_{j=m,…,m+P-4}｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²｝
Ｅ_C3＝Σ_{j=m+P,…,m+2P-4}｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²｝
Ｅ_C4＝Σ_{j=m+P,…,m+2P-4}｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²｝

次に、第２の実施形態における音響信号からの情報の抽出装置の処理の全体的な流れについて説明する。第２の実施形態においても、基本的な流れは、図１０に示したフローチャートと同じである。しかし、第２の実施形態では、値１〜値８が出力されるため、各ステップにおいて実行される処理が若干異なっている。

まず、本装置では、平均符号レベルＨＬ１〜ＨＬ８、位相判定テーブルＳ（ｐ）、非符号カウンタＮｎを初期化する（Ｓ２００）。平均符号レベルＨＬ１〜ＨＬ１６の初期値は、第１の実施形態と同様、０．１に設定されている。位相判定テーブルＳ（ｐ）、非符号カウンタＮｎについても第１の実施形態と同様である。

利用者が抽出装置に対して、抽出装置としての起動の指示を行うと、音響信号入力手段１００が、流れている音楽を録音し、デジタル化してデジタル音響信号として入力する。続いて、基準フレーム獲得手段１１０が、音響信号入力手段１００から入力された音響信号から、所定数のサンプルで構成される音響フレームを基準フレームとして抽出する（Ｓ２０１）。

続いて、周波数変換手段１３０、符号判定パラメータ算出手段１４０が、読み込んだ各音響フレームから、埋め込まれている情報を判定し、対応する符号を出力する（Ｓ２０２）。出力される情報の形式は、付加情報が埋め込まれる場合に対応する値１〜値８の８値、および値０の計９値の形式となる。

ステップＳ２０２の符号判定処理の詳細については、図１１のフローチャートと同様となる。まず、周波数変換手段１３０が、第１の実施形態と同様、周波数変換を行った後（Ｓ４０１）、符号判定パラメータ算出手段１４０は、平均符号レベルＨＬ１〜ＨＬ８の算出を行う（Ｓ４０２）。具体的には、過去“状態１”であると判断された音響フレームについての合算値Ｅ_C1と合算値Ｅ_C3の和の積算値であるｖ１を、過去“状態１”であると判断された音響フレームの数であるｎ１で除算することによりＨＬ１を算出し、過去“状態２”であると判断された音響フレームについての合算値Ｅ_C2と合算値Ｅ_C4の和の積算値であるｖ２を、過去“状態２”であると判断された音響フレームの数であるｎ２で除算することによりＨＬ２を算出し、過去“状態３”であると判断された音響フレームについての合算値Ｅ_C1と合算値Ｅ_C4の和の積算値であるｖ３を、過去“状態３”であると判断された音響フレームの数であるｎ３で除算することによりＨＬ３を算出し、過去“状態４”であると判断された音響フレームについての合算値Ｅ_C2と合算値Ｅ_C3の和の積算値であるｖ４を、過去“状態４”であると判断された音響フレームの数であるｎ４で除算することによりＨＬ４を算出する。

さらに、過去“状態５”であると判断された音響フレームについての合算値Ｅ_C1の２倍の積算値であるｖ５を、過去“状態５”であると判断された音響フレームの数であるｎ５で除算することによりＨＬ５を算出し、過去“状態６”であると判断された音響フレームについての合算値Ｅ_C2の２倍の積算値であるｖ６を、過去“状態６”であると判断された音響フレームの数であるｎ６で除算することによりＨＬ６を算出し、過去“状態７”であると判断された音響フレームについての合算値Ｅ_C3の２倍の積算値であるｖ７を、過去“状態７”であると判断された音響フレームの数であるｎ７で除算することによりＨＬ７を算出し、過去“状態８”であると判断された音響フレームについての合算値Ｅ_C4の２倍の積算値であるｖ８を、過去“状態８”であると判断された音響フレームの数であるｎ８で除算することによりＨＬ８を算出する。したがって、平均符号レベルＨＬ１〜ＨＬ４は、過去対応する状態であると判断された音響フレームの低周波強度データの合算値の平均値となる。平均符号レベルＨＬ５〜ＨＬ８は、過去対応する状態であると判断された音響フレームの低周波強度データの合算値の２倍の平均値となる。

続いて、符号判定パラメータ算出手段１４０は、候補符号テーブルの初期化を行う（Ｓ４０３）。候補符号テーブルは、１つの基準フレームおよび５個の位相変更フレームを特定する０〜５の位相番号および、この６個の音響フレームの状態から得られる９値の符号を記録するものである。

続いて、符号判定パラメータ算出手段１４０は、合算値Ｅ_C1〜合算値Ｅ_C4を用いて、低周波成分の状態がどのような状態であるか、すなわち、３ビットまたは２ビットの値としてどのような値が埋め込まれていたかを判断する処理を行う（Ｓ４０４）。具体的には、まず、以下の４群の判定処理を実行し、各群における全ての条件を満たす場合に、対応する状態であったと判断し、対応する値を出力する。

Ｅ_C1＞０．０００５・ＨＬ１、かつＥ_C3＞０．０００５・ＨＬ３、かつＥ_C1＞２・Ｅ_C2、かつＥ_C3＞２・Ｅ_C4の場合、“状態１”であると判断し、値１を出力する。

Ｅ_C2＞０．０００５・ＨＬ２、かつＥ_C4＞０．０００５・ＨＬ４、かつＥ_C2＞２・Ｅ_C1、かつＥ_C4＞２・Ｅ_C3の場合、“状態２”であると判断し、値２を出力する。

Ｅ_C1＞０．０００５・ＨＬ１、かつＥ_C4＞０．０００５・ＨＬ４、かつＥ_C1＞２・Ｅ_C2、かつＥ_C4＞２・Ｅ_C3の場合、“状態３”であると判断し、値３を出力する。

Ｅ_C2＞０．０００５・ＨＬ２、かつＥ_C3＞０．０００５・ＨＬ３、かつＥ_C2＞２・Ｅ_C1、かつＥ_C3＞２・Ｅ_C4の場合、“状態４”であると判断し、値４を出力する。

上記各群のいずれも満たさない場合は、符号判定パラメータ算出手段１４０は、さらに以下の各群における判定処理を実行して状態を判断し、対応する値を出力する。

Ｅ_C1＞０．０００５・ＨＬ１、かつＥ_C1＞２・Ｅ_C2、かつＥ_C1＞Ｅ_C3、かつＥ_C1＞Ｅ_C4の場合、“状態５”であると判断し、値５を出力する。

Ｅ_C2＞０．０００５・ＨＬ２、かつＥ_C2＞２・Ｅ_C1、かつＥ_C2＞Ｅ_C3、かつＥ_C2＞Ｅ_C4の場合、“状態６”であると判断し、値６を出力する。

Ｅ_C4＞０．０００５・ＨＬ４、かつＥ_C4＞２・Ｅ_C3、かつＥ_C4＞Ｅ_C1、かつＥ_C4＞Ｅ_C2の場合、“状態７”であると判断し、値７を出力する。

Ｅ_C3＞０．０００５・ＨＬ３、かつＥ_C3＞２・Ｅ_C4、かつＥ_C3＞Ｅ_C1、かつＥ_C3＞Ｅ_C2の場合、“状態８”であると判断し、値８を出力する。

符号判定パラメータ算出手段１４０は、各音響フレーム単位で、上記判定結果に応じて値１〜値８のいずれかを出力する（Ｓ４０７）。上記いずれの群の条件も満たさない場合は、“状態０”であると判断し、値０を出力する（Ｓ４０８）。この“状態０”は、合算値Ｅ₁〜Ｅ₄が下限値Ｌｅｖ以下であることにより、当該フレームに値１〜値８の記録が行なわれなかったことを示す埋め込みエラーを示す場合と、ワードの区切りを示す場合とがある。“状態０”がワードの区切りを示すか否かは、後述するようにビットカウンタが８以上に達しているかどうかで判断する。

また、上記判定の結果、値１〜値８のいずれかを出力した場合には、さらに、以下の〔数式３４〕に従って位相判定テーブルＳ（ｐ）の更新を行う（Ｓ４０９）。

〔数式３４〕
“状態１”であると判断し、値１を出力した場合、Ｓ（ｐ）←Ｓ（ｐ）＋Ｅ_C1＋Ｅ_C3
“状態２”であると判断し、値２を出力した場合、Ｓ（ｐ）←Ｓ（ｐ）＋Ｅ_C2＋Ｅ_C4
“状態３”であると判断し、値３を出力した場合、Ｓ（ｐ）←Ｓ（ｐ）＋Ｅ_C1＋Ｅ_C4
“状態４”であると判断し、値４を出力した場合、Ｓ（ｐ）←Ｓ（ｐ）＋Ｅ_C2＋Ｅ_C3
“状態５”であると判断し、値５を出力した場合、Ｓ（ｐ）←Ｓ（ｐ）＋２・Ｅ_C1
“状態６”であると判断し、値６を出力した場合、Ｓ（ｐ）←Ｓ（ｐ）＋２・Ｅ_C2
“状態７”であると判断し、値７を出力した場合、Ｓ（ｐ）←Ｓ（ｐ）＋２・Ｅ_C4
“状態８”であると判断し、値８を出力した場合、Ｓ（ｐ）←Ｓ（ｐ）＋２・Ｅ_C3

続いて、符号判定パラメータ算出手段１４０は、候補符号テーブルに、最適位相となる候補を保存する（Ｓ４１０）。具体的には、位相判定テーブルに記録されているＳ（ｐ）の値が最大となる位相番号ｐの値、前記Ｓ４０７、Ｓ４０８により判定された９値のいずれかの符号、その音響フレームについての上記〔数式３３〕に従った処理を実行することにより算出した、低周波数成分に対応するＥ_C1＋Ｅ_C3、Ｅ_C2＋Ｅ_C4、Ｅ_C1＋Ｅ_C4、Ｅ_C2＋Ｅ_C3、２・Ｅ_C1、２・Ｅ_C2、２・Ｅ_C4、２・Ｅ_C3のいずれかを最適位相の候補として候補符号テーブルに保存する。

再び図１０のフローチャートに戻って説明する。Ｓ２０２による処理の結果、値１〜値８に相当する符号が出力された場合には、平均符号レベルのパラメータの更新処理を行う（Ｓ２０３）。具体的には、平均符号レベルＨＬ１〜ＨＬ８算出の際の分子となる積算値ｖ１〜ｖ８に、それぞれＥ_C1＋Ｅ_C3、Ｅ_C2＋Ｅ_C4、Ｅ_C1＋Ｅ_C4、Ｅ_C2＋Ｅ_C3、２・Ｅ_C1、２・Ｅ_C2、２・Ｅ_C4、２・Ｅ_C3のいずれかを加算して積算値ｖ１〜ｖ８を更新し、分母となるフレーム数ｎ１〜ｎ８にそれぞれ１を加算してフレーム数ｎ１〜ｎ８を更新することにより行う。ｎ１〜ｎ８はあらかじめ設定したｎ_max（例えば１００）を超えないように設定する。

続いて、非符号カウンタの初期化処理を行う（Ｓ２０４）。具体的には、上記Ｓ２００の初期化処理における処理と同様、非符号カウンタＮｎ＝０と設定する。さらに、出力された値に対応する３ビットをバッファに保存する（Ｓ２０５）。次に、ビットカウンタを“３”だけカウントアップする（Ｓ２０６）。そして、Ｓ２００の戻り、初期化処理を行う。

上記Ｓ２０８の処理において、付加情報抽出手段１６０は、まず、符号判定パラメータ算出手段１４０により出力された値のうち、値０を区切り位置として、その次の値を先頭と仮定して、各値に対応する３ビットまたは２ビットの値に対応させて、ビット配列を作成する。続いて、値０を抽出した際に、ビット配列のビットカウンタが８未満であれば、値０は埋め込みエラーを示すものと判断し、現状のビットカウンタの値を維持してビット配列の作成を継続する。ビット配列のビットカウンタが８以上であれば、値０はワード（１バイト）の区切りを示すものと判断し、ビット配列の最後の８ビットを、所定の規則により変換して意味のある付加情報として抽出する。ここで、８ビットを超える場合は、データの抽出処理を開始する直後に発生しやすく、値０を先頭と誤判断してビットカウンタを初期化した場合に発生する。所定の規則としては、情報を埋め込む者が意図した情報が受け取った者に認識可能な状態とできるものであれば、さまざまな規則が適用できるが、本実施形態では、文字情報として認識するための規則としている。すなわち、付加情報抽出手段１６０は、符号判定パラメータ算出手段１４０が判定し、符号出力手段１５０から出力される符号を１バイト（８ビット）単位で認識し、これを設定されたコード体系に従って文字情報を認識する。このようにして得られた文字情報は、表示装置（図示省略）の画面に表示出力される。

（２．３．信号成分が小さくても情報の埋め込みを可能とする手法）
ここまで、説明してきた処理においては、上記Ｅ₁〜Ｅ₄が所定値より大きいことが必要となり、上記Ｅ₁〜Ｅ₄が所定値以下の場合には、情報の埋め込みを行うことができない。そこで、元の信号の低周波成分が小さくても、信号の埋め込みを可能とする手法について説明する。

この場合、図３に示した埋め込み装置における情報の埋め込み処理は、図１３のフローチャートに従って行われるが、Ｅ₁〜Ｅ₄がレベル下限値Ｌｅｖ以下となることがなくなるため、Ｓ１０５において低周波成分変更手段３０がレベルの判定を行わない。これは、この処理では、信号レベルが小さくても強制的に情報を埋め込むこととしているため、情報の埋め込みが不可能な信号レベルが小さい部分が存在するかどうかを判断する必要がないからである。

したがって、Ｓ１０５における状態１〜状態８に設定する処理としては、まず、以下の〔数式３５〕に従って算出される固定値Ｖを、低周波成分の強度として設定する。

〔数式３５〕
Ｖ＝｛０．５・Ｌｅｖ／（２Ｐ−６）｝^1/2

そして、状態１とする場合は、上記〔数式２５〕に従った処理を実行した後、以下の〔数式３６〕に従った処理を実行する。

〔数式３６〕
ｊ＝ｍ〜ｍ＋Ｐ−４、ｍ＋Ｐ〜ｍ＋２Ｐ−４の各成分に対して
Ａｌ´（１，ｊ）＝Ａｌ（１，ｊ）・Ｖ／｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²｝^1/2
Ｂｌ´（１，ｊ）＝Ｂｌ（１，ｊ）・Ｖ／｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²｝^1/2

状態２とする場合は、上記〔数式２６〕に従った処理を実行した後、以下の〔数式３７〕に従った処理を実行する。

〔数式３７〕
ｊ＝ｍ〜ｍ＋Ｐ−４、ｍ＋Ｐ〜ｍ＋２Ｐ−４の各成分に対して
Ａｌ´（３，ｊ）＝Ａｌ（３，ｊ）・Ｖ／｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²｝^1/2
Ｂｌ´（３，ｊ）＝Ｂｌ（３，ｊ）・Ｖ／｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²｝^1/2

状態３とする場合は、上記〔数式２７〕に従った処理を実行した後、以下の〔数式３８〕に従った処理を実行する。

〔数式３８〕
ｊ＝ｍ〜ｍ＋Ｐ−４の各成分に対して
Ａｌ´（１，ｊ）＝Ａｌ（１，ｊ）・Ｖ／｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²｝^1/2
Ｂｌ´（１，ｊ）＝Ｂｌ（１，ｊ）・Ｖ／｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²｝^1/2
ｊ＝ｍ＋Ｐ〜ｍ＋２Ｐ−４の各成分に対して
Ａｌ´（３，ｊ）＝Ａｌ（３，ｊ）・Ｖ／｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²｝^1/2
Ｂｌ´（３，ｊ）＝Ｂｌ（３，ｊ）・Ｖ／｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²｝^1/2

状態４とする場合は、上記〔数式２８〕に従った処理を実行した後、以下の〔数式３９〕に従った処理を実行する。

〔数式３９〕
ｊ＝ｍ〜ｍ＋Ｐ−４の各成分に対して
Ａｌ´（３，ｊ）＝Ａｌ（３，ｊ）・Ｖ／｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²｝^1/2
Ｂｌ´（３，ｊ）＝Ｂｌ（３，ｊ）・Ｖ／｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²｝^1/2
ｊ＝ｍ＋Ｐ〜ｍ＋２Ｐ−４の各成分に対して
Ａｌ´（１，ｊ）＝Ａｌ（１，ｊ）・Ｖ／｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²｝^1/2
Ｂｌ´（１，ｊ）＝Ｂｌ（１，ｊ）・Ｖ／｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²｝^1/2

状態５とする場合は、上記〔数式２９〕に従った処理を実行した後、以下の〔数式４１〕に従った処理を実行する。

〔数式４０〕
ｊ＝ｍ〜ｍ＋Ｐ−４の各成分に対して
Ａｌ´（１，ｊ）＝Ａｌ（１，ｊ）・Ｖ／｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²｝^1/2
Ｂｌ´（１，ｊ）＝Ｂｌ（１，ｊ）・Ｖ／｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²｝^1/2

状態６とする場合は、上記〔数式３０〕に従った処理を実行した後、以下の〔数式４１〕に従った処理を実行する。

〔数式４１〕
ｊ＝ｍ〜ｍ＋Ｐ−４の各成分に対して
Ａｌ´（３，ｊ）＝Ａｌ（３，ｊ）・Ｖ／｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²｝^1/2
Ｂｌ´（３，ｊ）＝Ｂｌ（３，ｊ）・Ｖ／｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²｝^1/2

状態７とする場合は、上記〔数式３１〕に従った処理を実行した後、以下の〔数式４２〕に従った処理を実行する。

〔数式４２〕
ｊ＝ｍ＋Ｐ〜ｍ＋２Ｐ−４の各成分に対して
Ａｌ´（３，ｊ）＝Ａｌ（３，ｊ）・Ｖ／｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²｝^1/2
Ｂｌ´（３，ｊ）＝Ｂｌ（３，ｊ）・Ｖ／｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²｝^1/2

状態８とする場合は、上記〔数式３２〕に従った処理を実行した後、以下の〔数式４３〕に従った処理を実行する。

〔数式４３〕
ｊ＝ｍ＋Ｐ〜ｍ＋２Ｐ−４の各成分に対して
Ａｌ´（１，ｊ）＝Ａｌ（１，ｊ）・Ｖ／｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²｝^1/2
Ｂｌ´（１，ｊ）＝Ｂｌ（１，ｊ）・Ｖ／｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²｝^1/2

〔数式３６〕〜〔数式４３〕により算出されたＡｌ´、Ｂｌ´の値を、上記〔数式７〕におけるＡｌ、Ｂｌに代えて用いると、Ｅ₁〜Ｅ₄＝Ｌｅｖとなるため、Ｓ１０５において、Ｌｅｖとの大小関係の判断を行う必要が不要となる。

（３．第３の実施形態）
ここからは、第３の実施形態について説明する。第１の実施形態では、図２に示したように、音響フレームの低周波成分を４つの状態に変更し、２ビットの情報を埋め込むようにしたが、第３の実施形態では、図１４、図１５に示すように、音響フレームの低周波成分を１６の状態に変更し、４ビットの情報を埋め込むことを特徴とする。

図１４、図１５に示す各音響フレームにおいても、図２と同様、横軸は時間方向、縦軸は周波数方向を示している。また、網掛けされた部分は、低周波成分が存在している部分を示し、網掛けが濃いほど成分強度が強いことを示している。第３の実施形態において、図１４（ａ）に示すような原状態の低周波成分に対して、符号０を埋め込む場合、Ｌ-chの信号の低周波成分を全て除去し、除去した成分と同等の成分をＲ-chの信号の低周波成分に加算して図１４（ｂ）に示すような状態に変更する。図１４、図１５においては、縦軸の周波数方向において、周波数領域が７つに区分されている。これは、第１、第２の実施形態が上位低周波成分と下位低周波成分を利用して状態の変更を行うのに対して、第３の実施形態ではさらに中位低周波成分を利用して状態の変更を行うものであり、これにともなってギャップ領域も１つ増えるためである。すなわち、７つに区分された低周波成分のうち最上部と上から３番目、５番目、7番目がギャップ領域であり、上から２番目は上位低周波領域であり、上から４番目は中位低周波領域、上から６番目は下位低周波領域である。図１４（ｂ）に示すように、中位低周波領域の前部におけるスペクトルをＳＰ１Ｍ、中位低周波領域の後部におけるスペクトルをＳＰ３Ｍで表現することとする。また、スペクトルＳＰ１ＭおよびＳＰ３Ｍの上限周波数とスペクトルＳＰ１ＵおよびＳＰ３Ｕの下限周波数までのギャップ領域をＧ１Ｍ１およびＧ３Ｍ１、スペクトルＳＰ１ＭおよびＳＰ３Ｍの下限周波数とスペクトルＳＰ１ＤおよびＳＰ３Ｄの上限周波数までのギャップ領域をＧ１Ｍ２およびＧ３Ｍ２で表現することとする。

本実施形態で、符号１を埋め込む場合、図１４（ｃ）に示すように、Ｌ-chの信号の前部の上位低周波成分と中位低周波成分、後部の下位低周波成分を除去し、除去した成分と同等の成分をＲ-chの信号に加算し、逆に、Ｒ-chの信号の前部の下位低周波成分と後部の上位低周波成分と中位低周波成分を除去し、除去した成分と同等の成分をＬ-chの信号に加算する。符号２を埋め込む場合は、図１４（ｄ）に示すように、Ｌ-chの信号の前部の上位低周波成分と下位低周波成分、後部の中位低周波成分を除去し、除去した成分と同等の成分をＲ-chの信号に加算し、逆に、Ｒ-chの信号の前部の中位低周波成分、後部の上位低周波成分と下位低周波成分を除去し、除去した成分と同等の成分をＬ-chの信号に加算する。

符号３〜符号１６を埋め込む場合も、同様にして、各領域の低周波成分の強度を図１４（ｅ）〜（ｊ）、図１５（ａ）〜（ｈ）に示すように変更する処理を行う。

第３の実施形態では、図１４（ｂ）〜（ｊ）、図１５（ａ）〜（ｈ）に示すような１７個の状態に低周波成分を変更することにより、情報の埋め込みを行っている。１７個の状態のうち、１つは、埋め込むことができない状態におけるエラー処理に用いるものであるので、実質埋め込むことができるのは１６個の状態、すなわち、４ビットに相当する。

（３．１．埋め込み装置）
第３の実施形態においても、装置構成は図３に示したものと同様であるが、主に低周波成分変更手段３０の内容が異なっている。具体的には、低周波成分変更手段３０は、Ａタイプの音響フレームについて、付加情報読込手段７０が作成したビット配列に応じて、低周波成分の割合を変更する処理を行うが、第３の実施形態では、ビット配列を４ビットずつ読み込み、１音響フレームに対して４ビットの情報を埋め込む。埋め込まれる４ビットの値は、“００００”“０００１”“００１０”“００１１” “０１００”“０１０１”“０１１０”“０１１１” “１０００”“１００１”“１０１０”“１０１１” “１１００”“１１０１”“１１１０”“１１１１”の１６通りがある。第３の実施形態では、これらを値１〜値１６と定義する。この際、“００００”〜“１１１１”の１６通りのうち、いずれを値１〜値１６と定義しても良い。抽出側において、埋め込み側で埋め込まれた４ビットの配列が特定できれば良いためである。したがって、この定義は、埋め込み側と抽出側で一致している必要がある。

そして、低周波成分変更手段３０は、この値１〜値１６に応じて、低周波成分を状態１〜状態１６のいずれかに変更する。具体的には、まず、低周波成分変更手段３０は、上記〔数式５〕により求めた左チャンネルの実部Ａｌ（１，ｊ）、Ａｌ（３，ｊ）、虚部Ｂｌ（１，ｊ）、Ｂｌ（３，ｊ）、右チャンネルの実部Ａｒ（１，ｊ）、Ａｒ（３，ｊ）、虚部Ｂｒ（１，ｊ）、Ｂｒ（３，ｊ）を利用して、以下の〔数式４４〕により、合算値Ｅ₁〜Ｅ₆を算出する。この合算値Ｅ₁〜Ｅ₆は、第１の実施形態におけるものとは異なっている。上述のように、Ｅ₁〜Ｅ₆、Ｅ_C1〜Ｅ_C6、ＨＬ１〜ＨＬ１６等の各変数は、各実施形態で独立しており、同一名の変数であっても、算出手法が異なる。ただし、本明細書で用いられる数式については、明細書全体を通じて統一されている。

〔数式４４〕
Ｅ₁＝Σ_j=m,m+P-2｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²＋Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝
Ｅ₂＝Σ_j=m,m+P-2｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²＋Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝
Ｅ₃＝Σ_j=m+p,m+2P-2｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²＋Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝
Ｅ₄＝Σ_j=m+p,m+2P-2｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²＋Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝
Ｅ₅＝Σ_{j=m+2p,m+3P-2}｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²＋Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝
Ｅ₆＝Σ_{j=m+2p,m+3P-2}｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²＋Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝

上記〔数式４４〕において、ｍは低周波数帯の下限の成分の番号、Ｍは低周波数帯の上限の成分の番号であり、Ｐ＝（Ｍ−ｍ）／３である。なお、Ｐが整数にならない場合、切捨て処理を行う。ｍ＝１５、Ｍ＝４０と設定すると、Ｐ＝８となる。上記〔数式４４〕により算出されたＥ₁〜Ｅ₆は音響フレームの所定の範囲におけるスペクトル集合の成分強度の合算値を示すことになる。続いて、この合算値Ｅ₁〜Ｅ₆がレベル下限値Ｌｅｖより大きいかどうかの判定を行う。レベル下限値Ｌｅｖは、音響信号Ｘｌ（ｉ）、Ｘｒ（ｉ）の振幅最大値が１に正規化されており、Ｍ＝４０に設定されている場合、０．２５に設定する。

Ｅ₁、Ｅ₄、Ｅ₆がいずれもレベル下限値Ｌｅｖより大きく、埋め込むべき情報が“値１”である場合、以下の〔数式４５〕に従った処理を実行することにより、低周波成分の状態を“状態１”、すなわち、図１４（ｃ）に示したような状態に変更する。ここで、Ｅ₁、Ｅ₄、Ｅ₆がいずれもレベル下限値Ｌｅｖより大きいことを条件とするのは、Ｅ₁、Ｅ₄、Ｅ₆は、それぞれ前部の下位低周波成分の強度、後部の中位低周波成分の強度、後部の下位低周波成分の強度に対応しており、図１４（ｃ）に示すように、“状態１”とする場合は、これらに所定の強度が必要とされるためである。

〔数式４５〕
ｊ＝ｍ〜ｍ＋Ｐ−２の各成分に対して
Ａｌ´（３，ｊ）＝０
Ｂｌ´（３，ｊ）＝０
Ｅ（３，ｊ）＝｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²＋Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
Ａｒ´（３，ｊ）＝Ａｒ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
Ｂｒ´（３，ｊ）＝Ｂｒ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
Ａｒ´（１，ｊ）＝０
Ｂｒ´（１，ｊ）＝０
Ｅ（１，ｊ）＝｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²＋Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
Ａｌ´（１，ｊ）＝Ａｌ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²｝^1/2
Ｂｌ´（１，ｊ）＝Ｂｌ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²｝^1/2
ｊ＝ｍ＋Ｐ〜ｍ＋２Ｐ−２、ｍ＋２Ｐ〜ｍ＋３Ｐ−２の各成分に対して
Ａｌ´（１，ｊ）＝０
Ｂｌ´（１，ｊ）＝０
Ｅ（１，ｊ）＝｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²＋Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
Ａｒ´（１，ｊ）＝Ａｒ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
Ｂｒ´（１，ｊ）＝Ｂｒ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
Ａｒ´（３，ｊ）＝０
Ｂｒ´（３，ｊ）＝０
Ｅ（３，ｊ）＝｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²＋Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
Ａｌ´（３，ｊ）＝Ａｌ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²｝^1/2
Ｂｌ´（３，ｊ）＝Ｂｌ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²｝^1/2

上記〔数式４５〕においては、ｊ＝ｍ〜ｍ＋Ｐ−２においてＡｌ´（３，ｊ）、Ｂｌ´（３，ｊ）を共に０とし、ｊ＝ｍ＋Ｐ〜ｍ＋２Ｐ−２、ｍ＋２Ｐ〜ｍ＋３Ｐ−２においてＡｌ´（１，ｊ）、Ｂｌ´（１，ｊ）を共に０としている。これは、図１４（ｃ）の上段に示すように、L-chにおいて、SP3Ｄ、SP1U、SP1M内の各成分を０にすることを示しているが、“状態１”はSP1Ｄ、SP3U、SP3Mとの差を明確にすることができれば十分であるため、必ずしも０にする必要はなく、小さな値であれば良い。

同様にして、“値２”〜“値１６”を埋め込む場合も、上記〔数式４５〕と同様の規則に従った別の数式を実行することにより、低周波成分の状態を“状態２”〜“状態１６”、すなわち、図１４（ｄ）〜（ｊ）、図１５（ａ）〜（ｈ）に示したような状態に変更する。

上記のような処理を実行し、低周波成分の状態を“状態１”〜“状態１６”に変更した場合、いずれの場合であっても、さらに以下の〔数式４６〕に従った処理を実行し、最低周波数帯におけるギャップ領域Ｇ１Ｄ、Ｇ３Ｄ、中位低周波数帯と下位低周波数帯の間にギャップ領域Ｇ１Ｍ２、Ｇ３Ｍ２、上位低周波数帯と中位低周波数帯の間にギャップ領域Ｇ１Ｍ２、Ｇ３Ｍ２、上位低周波数帯の高周波側にギャップ領域Ｇ１Ｕ、Ｇ３Ｕを設ける。また、Ｌ-chにおいて時間的に中央となる部分については、全て除去する。

〔数式４６〕
ｊ＝０〜ｍ−１、ｍ＋Ｐ−１、ｍ＋２Ｐ−１、ｍ＋３Ｐ−１〜Ｍ−１の各成分に対して
Ａｌ´（１，ｊ）＝０
Ｂｌ´（１，ｊ）＝０
Ａｌ´（３，ｊ）＝０
Ｂｌ´（３，ｊ）＝０
Ｅ（１，ｊ）＝｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²＋Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
Ａｒ´（１，ｊ）＝Ａｒ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
Ｂｒ´（１，ｊ）＝Ｂｒ（１，ｊ）・Ｅ（１，ｊ）／｛Ａｒ（１，ｊ）²＋Ｂｒ（１，ｊ）²｝^1/2
Ｅ（３，ｊ）＝｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²＋Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
Ａｒ´（３，ｊ）＝Ａｒ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
Ｂｒ´（３，ｊ）＝Ｂｒ（３，ｊ）・Ｅ（３，ｊ）／｛Ａｒ（３，ｊ）²＋Ｂｒ（３，ｊ）²｝^1/2
ｊ＝０〜Ｍ−１の各成分に対して
Ａｌ´（２，ｊ）＝０
Ｂｌ´（２，ｊ）＝０
Ｅ（２，ｊ）＝｛Ａｌ（２，ｊ）²＋Ｂｌ（２，ｊ）²＋Ａｒ（２，ｊ）²＋Ｂｒ（２，ｊ）²｝^1/2
Ａｒ´（２，ｊ）＝Ａｒ（２，ｊ）・Ｅ（２，ｊ）／｛Ａｒ（２，ｊ）²＋Ｂｒ（２，ｊ）²｝^1/2
Ｂｒ´（２，ｊ）＝Ｂｒ（２，ｊ）・Ｅ（２，ｊ）／｛Ａｒ（２，ｊ）²＋Ｂｒ（２，ｊ）²｝^1/2

埋め込まれる側の低周波成分の強度が小さすぎると、信号を変化させても、その変化を抽出側で検出することができない。そこで、このような場合には、付加情報が埋め込まれている音響フレームとの違いを明確にするため、上記〔数式１３〕に従った処理を実行し、その低周波成分を除去し、“状態０”とする。これは、図１４（ｂ）に示すような状態である。

また、第３の実施形態においても第１、第２の実施形態と同様、低周波成分変更手段３０は、Ｂタイプの音響フレームについては、上記〔数式１４〕に従った処理を実行し、常にその低周波成分を除去する。低周波成分変更手段３０により上記のような処理が行われたら、周波数逆変換手段４０、改変音響フレーム出力手段５０については、第１、第２の実施形態と同様の処理が行われる。

次に、第３の実施形態における音響信号に対する情報の埋め込み装置の処理の全体的な流れについて説明する。第３の実施形態においても、基本的な流れは、図１０に示したフローチャートと同じである。しかし、第３の実施形態では、値１〜値１６が出力されるため、各ステップにおいて実行される処理が若干異なっている。特に第１の実施形態と異なるのは、Ｓ１０３、１０５の部分である。第３の実施形態では、低周波成分変更手段３０が、レジスタに保持された１ワードから４ビットを読み込む処理を行う（Ｓ１０３）。すなわち、第３の実施形態では、１ワードとしてレジスタに８ビットが保持されているため、常に４ビットずつ読み込まれる。

Ｓ１０４において音響フレーム読込手段１０が音響フレームを読み込んだ後、周波数変換手段２０および低周波成分変更手段３０が、音響フレームの低周波成分の状態を“状態１”〜“状態１６”のいずれかに変更する処理を行う（Ｓ１０５）。まず、第１の実施形態と同様、周波数変換手段２０が、音響フレームに対して窓関数Ｗ（１，ｉ）、Ｗ（２，ｉ）、Ｗ（３，ｉ）を用いて、上記〔数式５〕に従った処理を行って、フレームスペクトルを得る。

続いて、低周波成分変更手段３０は、上記〔数式４４〕によりＥ₁〜Ｅ₆を算出する。そして、付加情報読込手段７０から受け取った値１〜値１６に応じて上記〔数式４５〕、または〔数式４５〕と同様の規則に従った別の数式に従った処理を実行し、低周波成分の状態を“状態１”〜“状態１６”のいずれかに変更する。

Ｓ１０５において、“状態１”〜“状態１６”のいずれにも変更することができない場合は、低周波成分を“状態０”とする処理を行う（Ｓ１０６）。具体的には、上記〔数式１３〕に従った処理を実行することになる。“状態１”〜“状態１６” のいずれにも変更することができない場合とは、埋め込むべき値に対応する合算値のいずれかが、レベル下限値Ｌｅｖ以下となっている場合である。例えば、値１を埋め込む場合、Ｅ₁、Ｅ₄、Ｅ₆がいずれもレベル下限値Ｌｅｖより大きい必要があるため、Ｅ₁、Ｅ₄、Ｅ₆のいずれかがＬｅｖ以下である場合は、Ｓ１０６に進むことになる。

上記〔数式１３〕に従った処理を実行することにより、左チャンネルのフレームスペクトルの低周波数成分は、上位低周波領域前部のスペクトルＳＰ１Ｕ、上位低周波領域後部のスペクトルＳＰ３Ｕ、下位低周波領域前部のスペクトルＳＰ１Ｄ、下位低周波領域後部のスペクトルＳＰ３Ｄ全てにおいて、“０” で同一となる。なお、上記〔数式１３〕においては、ｊ＝０〜Ｍ−１の各成分に対してＡｌ´（ｊ）＝Ｂｌ´（ｊ）＝０としているが、抽出側において、“状態１”〜“状態１６”のいずれでもないことを認識可能とすることを目的としているため、十分小さな値であれば、必ずしも０とする必要はない。また、必ずしも４つのスペクトル成分の値が同一である必要はなく、差が小さければ良い。

次に、第１、第２の実施形態と同様、周波数逆変換手段４０が、上記Ｓ１０５、Ｓ１０６の処理により各窓成分のスペクトル集合間の割合が変更されたフレームスペクトルを周波数逆変換して改変音響フレームを得る処理を行う（Ｓ１０７）。

改変音響フレーム出力手段５０は、得られた改変音響フレームを順次出力ファイルに出力する。こうして１つの音響フレームに対する処理を終えたら、状態０に設定した場合には、音響フレーム読込手段１０が、次の音響フレームを読み込む（Ｓ１０４）。一方、状態１〜状態１６のいずれかに設定した場合には、低周波成分変更手段３０がビット配列中の次の４ビットを読み込む（Ｓ１０２）。以上のような処理を音響信号の両チャンネルの全サンプルに渡って実行していく。

（３．２．抽出装置）
第３の実施形態においても、装置構成は図９に示したものと同様であるが、主に符号判定パラメータ算出手段１４０の内容が異なっている。具体的には、符号判定パラメータ算出手段１４０は、生成されたフレームスペクトルから所定の周波数以下に相当する各低周波強度データを抽出し、各成分に対応した各低周波強度データの合算値Ｅ_C1〜Ｅ_C6を以下の〔数式４７〕に基づいて算出し、この合算値Ｅ_C1〜Ｅ_C6を符号判定パラメータとし、この符号判定パラメータＥ_C1〜Ｅ_C6の比率等に基づいて、所定の状態であると判断する機能を有している。以下の〔数式４７〕は上記〔数式４４〕において右チャンネル成分を削除したものとなっている。

〔数式４７〕
Ｅ_C1＝Σ_{j=m,…,m+P-2}｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²｝
Ｅ_C2＝Σ_{j=m,…,m+P-2}｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²｝
Ｅ_C3＝Σ_{j=m+P,…,m+2P-2}｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²｝
Ｅ_C4＝Σ_{j=m+P,…,m+2P-2}｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²｝
Ｅ_C5＝Σ_{j=m+2P,…,m+3P-2}｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²｝
Ｅ_C6＝Σ_{j=m+2P,…,m+3P-2}｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²｝

次に、第３の実施形態における音響信号からの情報の抽出装置の処理の全体的な流れについて説明する。第３の実施形態においても、基本的な流れは、図１０に示したフローチャートと同じである。しかし、各ステップにおいて実行される処理が若干異なっている。

まず、本実施形態では、平均符号レベルＨＬ１〜ＨＬ１６、位相判定テーブルＳ（ｐ）、非符号カウンタＮｎを初期化する（Ｓ２００）。平均符号レベルＨＬ１〜ＨＬ１６の初期値は、第１、第２の実施形態と同様、０．１に設定されている。位相判定テーブルＳ（ｐ）、非符号カウンタＮｎについても第１、第２の実施形態と同様である。

続いて、周波数変換手段１３０、符号判定パラメータ算出手段１４０が、読み込んだ各音響フレームから、埋め込まれている情報を判定し、対応する符号を出力する（Ｓ２０２）。出力される情報の形式は、付加情報が埋め込まれる場合に対応する値１〜値１６の１６値、および値０の計１７値の形式となる。

ステップＳ２０２の符号判定処理の詳細については、図１１のフローチャートと同様となる。まず、周波数変換手段１３０が、第１の実施形態と同様、周波数変換を行った後（Ｓ４０１）、符号判定パラメータ算出手段１４０は、平均符号レベルＨＬ１〜ＨＬ１６の算出を行う（Ｓ４０２）。具体的には、過去“状態ｋ（ｋ＝１〜１６）”であると判断された音響フレームについてのＥＧｋの積算値であるｖｋを、過去“状態１”であると判断された音響フレームの数であるｎｋで除算することによりＨＬｋを算出する。

続いて、符号判定パラメータ算出手段１４０は、候補符号テーブルの初期化を行う（Ｓ４０３）。候補符号テーブルには、１つの基準フレームおよび５個の位相変更フレームを特定する０〜５の位相番号および、この６個の音響フレームの状態から得られる１７値の符号を記録する。

続いて、符号判定パラメータ算出手段１４０は、合算値Ｅ_C1〜合算値Ｅ_C6を用いて、低周波成分の状態がどのような状態であるか、すなわち、４ビットの値としてどのような値が埋め込まれていたかを判断する処理を行う（Ｓ４０４）。具体的には、まず、判断のための総和値ＥＧｋ（ｋ＝１〜１６）を以下の〔数式４８〕に従って算出し、このうちＥＧｋが最大となるｋを求める。

〔数式４８〕
ＥＧ１＝Ｅ_C1＋Ｅ_C4＋Ｅ_C6 ＥＧ２＝Ｅ_C6＋Ｅ_C3＋Ｅ_C6
ＥＧ３＝Ｅ_C2＋Ｅ_C4＋Ｅ_C5 ＥＧ４＝Ｅ_C1＋Ｅ_C4＋Ｅ_C5
ＥＧ５＝Ｅ_C1＋Ｅ_C4＋Ｅ_C5 ＥＧ６＝Ｅ_C1＋Ｅ_C3＋Ｅ_C6
ＥＧ７＝Ｅ_C1＋Ｅ_C3＋Ｅ_C5 ＥＧ８＝Ｅ_C2＋Ｅ_C4＋Ｅ_C6
ＥＧ９＝Ｅ_C1＋Ｅ_C2＋Ｅ_C3 ＥＧ１０＝Ｅ_C1＋Ｅ_C2＋Ｅ_C4
ＥＧ１１＝Ｅ_C1＋Ｅ_C3＋Ｅ_C4 ＥＧ１２＝Ｅ_C2＋Ｅ_C3＋Ｅ_C4
ＥＧ１３＝Ｅ_C3＋Ｅ_C4＋Ｅ_C5 ＥＧ１４＝Ｅ_C3＋Ｅ_C4＋Ｅ_C6
ＥＧ１５＝Ｅ_C3＋Ｅ_C5＋Ｅ_C6 ＥＧ１６＝Ｅ_C4＋Ｅ_C5＋Ｅ_C6

これにより値ｋが仮決定される。続いて、仮決定されたｋの値に応じて以下の１６群のうち、いずれかの群の判定処理を実行し、各群における全ての条件を満たす場合に、仮決定されていたｋを値ｋとして出力する（Ｓ４０７）。

ｋ＝１の場合、Ｅ_C1＞０．０００５・ＨＬ１、かつＥ_C4＞０．０００５・ＨＬ４、かつＥ_C6＞０．０００５・ＨＬ６、かつＥ_C1＞２・Ｅ_C2、かつＥ_C4＞２・Ｅ_C3、かつＥ_C6＞２・Ｅ_C5であれば、値１を出力する。

ｋ＝２の場合、Ｅ_C2＞０．０００５・ＨＬ２、かつＥ_C3＞０．０００５・ＨＬ３、かつＥ_C6＞０．０００５・ＨＬ６、かつＥ_C2＞２・Ｅ_C1、かつＥ_C3＞２・Ｅ_C4、かつＥ_C6＞２・Ｅ_C5であれば、値２を出力する。

ｋ＝３の場合、Ｅ_C2＞０．０００５・ＨＬ２、かつＥ_C4＞０．０００５・ＨＬ４、かつＥ_C5＞０．０００５・ＨＬ５、かつＥ_C2＞２・Ｅ_C1、かつＥ_C4＞２・Ｅ_C3、かつＥ_C5＞２・Ｅ_C6であれば、値３を出力する。

ｋ＝４の場合、Ｅ_C2＞０．０００５・ＨＬ２、かつＥ_C3＞０．０００５・ＨＬ３、かつＥ_C5＞０．０００５・ＨＬ５、かつＥ_C2＞２・Ｅ_C1、かつＥ_C3＞２・Ｅ_C4、かつＥ_C5＞２・Ｅ_C6であれば、値４を出力する。

ｋ＝５の場合、Ｅ_C1＞０．０００５・ＨＬ１、かつＥ_C4＞０．０００５・ＨＬ４、かつＥ_C5＞０．０００５・ＨＬ５、かつＥ_C1＞２・Ｅ_C2、かつＥ_C4＞２・Ｅ_C3、かつＥ_C5＞２・Ｅ_C6であれば、値５を出力する。

ｋ＝６の場合、Ｅ_C1＞０．０００５・ＨＬ１、かつＥ_C3＞０．０００５・ＨＬ３、かつＥ_C6＞０．０００５・ＨＬ６、かつＥ_C1＞２・Ｅ_C2、かつＥ_C3＞２・Ｅ_C4、かつＥ_C6＞２・Ｅ_C5であれば、値６を出力する。

ｋ＝７の場合、Ｅ_C1＞０．０００５・ＨＬ１、かつＥ_C3＞０．０００５・ＨＬ３、かつＥ_C5＞０．０００５・ＨＬ５、かつＥ_C1＞２・Ｅ_C2、かつＥ_C3＞２・Ｅ_C4、かつＥ_C5＞２・Ｅ_C6であれば、値７を出力する。

ｋ＝８の場合、Ｅ_C2＞０．０００５・ＨＬ２、かつＥ_C4＞０．０００５・ＨＬ４、かつＥ_C6＞０．０００５・ＨＬ６、かつＥ_C2＞２・Ｅ_C1、かつＥ_C4＞２・Ｅ_C3、かつＥ_C6＞２・Ｅ_C5であれば、値８を出力する。

ｋ＝９の場合、Ｅ_C1＞０．０００５・ＨＬ１、かつＥ_C2＞０．０００５・ＨＬ２、かつＥ_C3＞０．０００５・ＨＬ３、かつＥ_C1＞２・Ｅ_C6、かつＥ_C2＞２・Ｅ_C5、かつＥ_C3＞２・Ｅ_C4であれば、値９を出力する。

ｋ＝１０の場合、Ｅ_C1＞０．０００５・ＨＬ１、かつＥ_C2＞０．０００５・ＨＬ２、かつＥ_C4＞０．０００５・ＨＬ４、かつＥ_C1＞２・Ｅ_C6、かつＥ_C2＞２・Ｅ_C5、かつＥ_C4＞２・Ｅ_C3であれば、値１０を出力する。

ｋ＝１１の場合、Ｅ_C1＞０．０００５・ＨＬ１、かつＥ_C3＞０．０００５・ＨＬ３、かつＥ_C4＞０．０００５・ＨＬ４、かつＥ_C1＞２・Ｅ_C2、かつＥ_C3＞２・Ｅ_C6、かつＥ_C4＞２・Ｅ_C5であれば、値１１を出力する。

ｋ＝１２の場合、Ｅ_C2＞０．０００５・ＨＬ２、かつＥ_C3＞０．０００５・ＨＬ３、かつＥ_C4＞０．０００５・ＨＬ４、かつＥ_C2＞２・Ｅ_C1、かつＥ_C3＞２・Ｅ_C6、かつＥ_C4＞２・Ｅ_C5であれば、値１２を出力する。

ｋ＝１３の場合、Ｅ_C3＞０．０００５・ＨＬ３、かつＥ_C4＞０．０００５・ＨＬ４、かつＥ_C5＞０．０００５・ＨＬ５、かつＥ_C3＞２・Ｅ_C2、かつＥ_C4＞２・Ｅ_C1、かつＥ_C5＞２・Ｅ_C6であれば、値１３を出力する。

ｋ＝１４の場合、Ｅ_C3＞０．０００５・ＨＬ３、かつＥ_C4＞０．０００５・ＨＬ４、かつＥ_C6＞０．０００５・ＨＬ６、かつＥ_C3＞２・Ｅ_C2、かつＥ_C4＞２・Ｅ_C1、かつＥ_C6＞２・Ｅ_C5であれば、値１４を出力する。

ｋ＝１５の場合、Ｅ_C3＞０．０００５・ＨＬ３、かつＥ_C5＞０．０００５・ＨＬ５、かつＥ_C6＞０．０００５・ＨＬ６、かつＥ_C3＞２・Ｅ_C4、かつＥ_C5＞２・Ｅ_C1、かつＥ_C6＞２・Ｅ_C2であれば、値１５を出力する。

ｋ＝１６の場合、Ｅ_C4＞０．０００５・ＨＬ４、かつＥ_C5＞０．０００５・ＨＬ５、かつＥ_C6＞０．０００５・ＨＬ６、かつＥ_C4＞２・Ｅ_C3、かつＥ_C5＞２・Ｅ_C2、かつＥ_C6＞２・Ｅ_C1であれば、値１６を出力する。

符号判定パラメータ算出手段１４０は、各音響フレーム単位で、上記判定結果に応じて値１〜値１６のいずれかを出力する（Ｓ４０７）。上記いずれの群の条件も満たさない場合は、“状態０”であると判断し、値０を出力する（Ｓ４０８）。

また、上記判定の結果、値１〜値１６のいずれかを出力した場合には、さらに、以下の〔数式４９〕に従って位相判定テーブルＳ（ｐ）の更新を行う（Ｓ４０９）。

〔数式４９〕
“状態ｋ”であると判断し、値ｋを出力した場合
Ｓ（ｐ）←Ｓ（ｐ）＋ＥＧｋ／３

続いて、符号判定パラメータ算出手段１４０は、候補符号テーブルに、最適位相となる候補を保存し（Ｓ４１０）、全ての位相番号ｐに対応する処理を終えたかどうかを判定する（Ｓ４１１）。全ての位相番号ｐに対応する処理を終えた場合は、候補保存テーブルに記録されている位相番号ｐに対応する位相が最適位相であると判定し、候補保存テーブルに記録されている符号を出力する（Ｓ４１２）。

再び図１０のフローチャートに戻って説明する。Ｓ２０２による処理の結果、値１〜値１６に相当する符号が出力された場合には、平均符号レベルのパラメータの更新処理を行う（Ｓ２０３）。具体的には、平均符号レベルＨＬ１〜ＨＬ１６算出の際の分子となる積算値ｖ１〜ｖ１６に、それぞれＥＧ１〜ＥＧ１６を加算して積算値ｖ１〜ｖ１６を更新し、分母となるフレーム数ｎ１〜ｎ１６にそれぞれ１を加算してフレーム数ｎ１〜ｎ１６を更新することにより行う。ｎ１〜ｎ１６はあらかじめ設定したｎ_max（例えば１００）を超えないように設定する。

続いて、非符号カウンタの初期化処理を行う（Ｓ２０４）。さらに、出力された値に対応する４ビットをバッファに保存する（Ｓ２０５）。次に、ビットカウンタを“４”だけカウントアップする（Ｓ２０６）。そして、Ｓ２００の戻り、初期化処理を行う。

上記Ｓ２０８の処理において、付加情報抽出手段１６０は、まず、符号判定パラメータ算出手段１４０により出力された値のうち、値０を区切り位置として、その次の値を先頭と仮定して、各値に対応する４ビットの値に対応させて、ビット配列を作成する。続いて、値０を抽出した際に、ビット配列のビットカウンタが８未満であれば、値０は埋め込みエラーを示すものと判断し、現状のビットカウンタの値を維持してビット配列の作成を継続する。ビット配列のビットカウンタが８以上であれば、値０はワード（１バイト）の区切りを示すものと判断し、ビット配列の最後の８ビットを、所定の規則により変換して意味のある付加情報として抽出する。ここで、８ビットを超える場合は、データの抽出処理を開始する直後に発生しやすく、値０を先頭と誤判断してビットカウンタを初期化した場合に発生する。所定の規則としては、情報を埋め込む者が意図した情報が受け取った者に認識可能な状態とできるものであれば、さまざまな規則が適用できるが、本実施形態では、文字情報として認識するための規則としている。すなわち、付加情報抽出手段１６０は、符号判定パラメータ算出手段１４０が判定し、符号出力手段１５０から出力される符号を１バイト（８ビット）単位で認識し、これを設定されたコード体系に従って文字情報を認識する。このようにして得られた文字情報は、表示装置（図示省略）の画面に表示出力される。

（３．３．信号成分が小さくても情報の埋め込みを可能とする手法）
ここまで、説明してきた処理においては、上記Ｅ₁〜Ｅ₆が所定値より大きいことが必要となり、上記Ｅ₁〜Ｅ₆が所定値以下の場合には、情報の埋め込みを行うことができない。そこで、元の信号の低周波成分が小さくても、信号の埋め込みを可能とする手法について説明する。

この場合、図３に示した埋め込み装置における情報の埋め込み処理は、図１１のフローチャートに従って行われるが、Ｅ₁〜Ｅ₆がレベル下限値Ｌｅｖ以下となることがなくなるため、Ｓ１０５において低周波成分変更手段３０がレベルの判定を行わない。これは、この処理では、信号レベルが小さくても強制的に情報を埋め込むこととしているため、情報の埋め込みが不可能な信号レベルが小さい部分が存在するかどうかを判断する必要がないからである。

したがって、Ｓ１０５における状態１〜状態１６に設定する処理としては、まず、以下の〔数式５０〕に従って算出される固定値Ｖを、低周波成分の強度として設定する。

〔数式５０〕
Ｖ＝｛０．２５・Ｌｅｖ／（３Ｐ−３）｝^1/2

そして、状態１とする場合は、上記〔数式４５〕に従った処理を実行した後、以下の〔数式５１〕に従った処理を実行する。

〔数式５１〕
ｊ＝ｍ〜ｍ＋Ｐ−２の各成分に対して
Ａｌ´（１，ｊ）＝Ａｌ（１，ｊ）・Ｖ／｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²｝^1/2
Ｂｌ´（１，ｊ）＝Ｂｌ（１，ｊ）・Ｖ／｛Ａｌ（１，ｊ）²＋Ｂｌ（１，ｊ）²｝^1/2
ｊ＝ｍ＋Ｐ〜ｍ＋２Ｐ−２、ｍ＋２Ｐ〜ｍ＋３Ｐ−２の各成分に対して
Ａｌ´（３，ｊ）＝Ａｌ（３，ｊ）・Ｖ／｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²｝^1/2
Ｂｌ´（３，ｊ）＝Ｂｌ（３，ｊ）・Ｖ／｛Ａｌ（３，ｊ）²＋Ｂｌ（３，ｊ）²｝^1/2

状態２〜状態１６とする場合についても、〔数式５１〕に類似の数式に従った処理を実行する。

（５．その他）
以上、本発明の好適な実施形態について限定したが、本発明は上記実施形態に限定されず、種々の変形が可能である。例えば、上記第１、第２の実施形態では、低周波領域を上位低周波領域と下位低周波領域の２つに分け、４つの周波数成分の状態を変更して４つの状態、８つの状態を生成するようにし、上記第３の実施形態では、低周波領域を上位低周波領域、中位低周波領域、下位低周波領域の３つに分け、６つの周波数成分の状態を変更して１６の状態を生成するようにし、各状態に値（符号）を割り当てることにより、情報を埋め込むようにしたが、低周波領域を４以上の低周波領域に分け、８以上の周波数成分の状態を変更してより多数の状態を生成することにより、１音響フレームに５ビット以上の情報を埋め込むようにしても良い。

従来の手法による低周波成分の変化の状態を示す図である。本発明第１の実施形態による低周波成分の変化の状態を示す図である。音響信号に対する情報の埋め込み装置の機能ブロック図である。本発明で用いる窓関数を示す図である。本発明の処理による周波数成分全体の状態を示す図である。図３に示した装置の処理概要を示すフローチャートである。従来の手法によるビット埋め込みの手順を示す図である。本発明によるビット埋め込みの手順を示す図である。本発明に係る音響信号からの情報の抽出装置の機能ブロック図である。図９に示した装置の処理概要を示すフローチャートである。図１０のＳ２０２の符号判定処理の詳細を示すフローチャートである。本発明第２の実施形態による低周波成分の変化の状態を示す図である。図３の装置の第２の実施形態の処理概要を示すフローチャートである。本発明第３の実施形態による低周波成分の変化の状態を示す図である。本発明第３の実施形態による低周波成分の変化の状態を示す図である。

符号の説明

１０・・・音響フレーム読込手段
２０・・・周波数変換手段
３０・・・低周波成分変更手段
４０・・・周波数逆変換手段
５０・・・改変音響フレーム出力手段
６０・・・記憶手段
６１・・・音響信号記憶部
６２・・・付加情報記憶部
６３・・・改変音響信号記憶部
７０・・・付加情報読込手段
１００・・・音響信号入力手段
１１０・・・基準フレーム獲得手段
１２０・・・位相変更フレーム設定手段
１３０・・・周波数変換手段
１４０・・・符号判定パラメータ算出手段
１５０・・・符号出力手段
１６０・・・付加情報抽出手段
１７０・・・音響フレーム保持手段

Claims

時系列のサンプル列で構成される音響信号に対して、付加情報を聴取不能な状態で埋め込む装置であって、
前記音響信号より、所定数のサンプルを音響フレームとして読み込む音響フレーム読込手段と、
前記音響フレームに対して、前記音響フレームの前部を抽出するための第１窓関数、前記音響フレームの中央部を抽出するための第２窓関数、前記音響フレームの後部を抽出するための第３窓関数を用いてそれぞれ周波数変換を行い、前記第１窓関数に対応するスペクトルである第１窓スペクトル、前記第２窓関数に対応するスペクトルである第２窓スペクトル、前記第３窓関数に対応するスペクトルである第３窓スペクトルを生成する周波数変換手段と、
前記生成された第１窓スペクトルから互いに重複しない２以上の低周波数範囲のスペクトル集合を抽出するとともに、前記第３窓スペクトルから互いに重複しない２以上の低周波数範囲のスペクトル集合を抽出し、前記埋め込むべき付加情報の情報配列に基づいて、抽出したスペクトル集合の強度を変更すると共に、中央の第２窓関数に対応する低周波成分を除去する低周波成分変更手段と、
前記変更された低周波スペクトルを含む各窓スペクトルに対して周波数逆変換を行って、改変音響フレームを生成する周波数逆変換手段と、
前記生成された改変音響フレームを順次出力する改変音響フレーム出力手段と、
を有することを特徴とする音響信号に対する情報の埋め込み装置。
請求項１において、
前記低周波成分変更手段は、前記生成された第１窓スペクトルから互いに重複しない２つの低周波数範囲のスペクトル集合ＳＰ１ＵとＳＰ１Ｄを抽出するとともに、前記第３窓スペクトルから互いに重複しない２つの低周波数範囲のスペクトル集合ＳＰ３ＵとＳＰ３Ｄを抽出し、前記埋め込むべき付加情報の情報配列に基づいて、ＳＰ１Ｕ＋ＳＰ１ＤとＳＰ３Ｕ＋ＳＰ３Ｄ、またはＳＰ１Ｕ＋ＳＰ３ＤとＳＰ１Ｄ＋ＳＰ３Ｕの割合を変更すると共に、中央の第２窓関数に対応する低周波成分を除去するものであることを特徴とする音響信号に対する情報の埋め込み装置。
請求項１において、
前記低周波成分変更手段は、前記生成された第１窓スペクトルから互いに重複しない２つの低周波数範囲のスペクトル集合ＳＰ１ＵとＳＰ１Ｄを抽出するとともに、前記第３窓スペクトルから互いに重複しない２つの低周波数範囲のスペクトル集合ＳＰ３ＵとＳＰ３Ｄを抽出し、前記埋め込むべき付加情報の情報配列に基づいて、ＳＰ１Ｕ、ＳＰ１Ｄ、ＳＰ３Ｕ、ＳＰ３Ｄの強度を変更すると共に、中央の第２窓関数に対応する低周波成分を除去するものであることを特徴とする音響信号に対する情報の埋め込み装置。
請求項１において、
前記低周波成分変更手段は、前記生成された第１窓スペクトルから互いに重複しない３つの低周波数範囲のスペクトル集合ＳＰ１Ｕ、ＳＰ１Ｍ、ＳＰ１Ｄを抽出するとともに、前記第３窓スペクトルから互いに重複しない３つの低周波数範囲のスペクトル集合ＳＰ３Ｕ、ＳＰ３Ｍ、ＳＰ３Ｄを抽出し、前記埋め込むべき付加情報の情報配列に基づいて、前記抽出したスペクトル集合ＳＰ１Ｕ、ＳＰ１Ｍ、ＳＰ１Ｄ、ＳＰ３Ｕ、ＳＰ３Ｍ、ＳＰ３Ｄの強度を変更すると共に、中央の第２窓関数に対応する低周波成分を除去するものであることを特徴とする音響信号に対する情報の埋め込み装置。
請求項１から請求項４のいずれかにおいて、
前記低周波成分変更手段は、所定の固定値Ｖを利用して、前記抽出したスペクトル集合のいずれかに所定の強度を与えることにより、前記抽出したスペクトル集合のスペクトル強度の割合を変更するものであることを特徴とする音響信号に対する情報の埋め込み装置。
請求項１から請求項５のいずれかにおいて、
前記音響フレーム読込手段は、先行する音響フレームと所定数のサンプルを重複させて読み込み、読み込んだ音響フレーム全体に所定の窓関数を乗じて前記周波数変換手段に渡すものであり、
前記改変音響フレーム出力手段は、前記生成された改変音響フレームを先行する改変音響フレームと連結させて出力するものであることを特徴とする音響信号に対する情報の埋め込み装置。
請求項３または請求項４において、
前記低周波成分変更手段は、前記低周波数範囲をＦ１以上およびＦ２以下に設定し、前記スペクトル集合ＳＰ１ＤおよびＳＰ３Ｄの下限周波数はＦ１に一致させて設定し、前記スペクトル集合ＳＰ１ＤおよびＳＰ３Ｄの上限周波数はＳＰ１ＵおよびＳＰ３Ｕの下限周波数より所定の幅だけ小さく設定し、前記ＳＰ１ＵおよびＳＰ３Ｕの上限周波数はＦ２より所定の幅だけ小さく設定し、直流成分から前記ＳＰ１ＤおよびＳＰ３Ｄの下限周波数までのギャップ領域をＧ１ＤおよびＧ３Ｄとし、ＳＰ１ＤおよびＳＰ３Ｄの上限周波数とＳＰ１ＵおよびＳＰ３Ｕの下限周波数までのギャップ領域をＧ１ＭおよびＧ３Ｍとし、ＳＰ１ＵおよびＳＰ３Ｕの上限周波数からＦ２までのギャップ領域をＧ１ＵおよびＧ３Ｕとするとき、前記全てのギャップ領域の成分を常に除去するものであることを特徴とする音響信号に対する情報の埋め込み装置。
請求項７において、
前記低周波成分変更手段は、前記Ｆ１を１５０Ｈｚ、前記Ｆ２を４００Ｈｚに設定するものであることを特徴とする音響信号に対する情報の埋め込み装置。
請求項１から請求項８のいずれかにおいて、
前記音響信号が左右２チャンネルの時系列のサンプル列で構成されるステレオ音響信号であって、
前記音響フレーム読込手段は、各チャンネルに対応する音響フレームをそれぞれ読み込み、
前記周波数変換手段は、各チャンネルの音響フレームに対して周波数変換を行い、各チャンネル別の第１窓スペクトル、第２窓スペクトル、第３窓スペクトルを生成するものであり、
前記低周波成分変更手段は、一方のチャンネルの窓スペクトルから抽出した所定の低周波数範囲に対応する各スペクトル集合に対して、前記埋め込むべき付加情報の情報配列の値に基づいて、各スペクトル集合の強度を変更するにあたり、各スペクトル集合の成分を除去する際、前記一方のチャンネルにおいて行われた変更により除去された成分を補足するよう他方のチャンネルの前記スペクトル集合間の割合を変更するものであり、
前記周波数逆変換手段は、各チャンネルについて、変更されたスペクトル集合を含むフレームスペクトルに対して周波数逆変換を行って改変音響フレームを生成し、
前記改変音響フレーム出力手段は、各チャンネルについて、生成された改変音響フレームを順次出力するものであることを特徴とする音響信号に対する情報の埋め込み装置。
コンピュータを、請求項１から請求項９のいずれかに記載の音響信号に対する情報の埋め込み装置として、機能させるためのプログラム。
音響信号から、あらかじめ聴取不能な状態で埋め込まれた付加情報を抽出する装置であって、
前記音響信号の所定区間をデジタル化して、所定数のサンプルで構成される音響フレームを獲得する音響フレーム獲得手段と、
前記音響フレームに対して、前記音響フレームの前部を抽出するための第１窓関数、前記音響フレームの後部を抽出するための第３窓関数を用いてそれぞれ周波数変換を行い、前記第１窓関数に対応するスペクトルである第１窓スペクトル、前記第３窓関数に対応するスペクトルである第３窓スペクトルを生成する周波数変換手段と、
前記生成された第１窓スペクトルから互いに重複しない２以上の低周波数範囲のスペクトル集合を抽出するとともに、前記第３窓スペクトルから互いに重複しない２以上の低周波数範囲のスペクトル集合を抽出し、抽出した各スペクトル集合のスペクトル強度を算出し、当該強度の関係に基づいて、所定の符号を出力する符号化手段と、
前記出力された符号に対応する情報配列を、所定の規則により変換して付加情報を抽出する付加情報抽出手段と、
を有することを特徴とする音響信号からの情報の抽出装置。
請求項１１において、
前記符号化手段は、前記生成された第１窓スペクトルから互いに重複しない２つの低周波数範囲のスペクトル集合ＳＰ１ＵとＳＰ１Ｄを抽出するとともに、前記第３窓スペクトルから互いに重複しない２つの低周波数範囲のスペクトル集合ＳＰ３ＵとＳＰ３Ｄを抽出し、４種類のスペクトル集合ＳＰ１Ｕ＋ＳＰ１Ｄ、ＳＰ３Ｕ＋ＳＰ３Ｄ、ＳＰ１Ｕ＋ＳＰ３Ｄ、ＳＰ１Ｄ＋ＳＰ３Ｕのスペクトル強度の総和値を算出し、その総和値の２種類の組み合わせの割合、ＳＰ１Ｕ＋ＳＰ１ＤとＳＰ３Ｕ＋ＳＰ３Ｄとの割合、またはＳＰ１Ｕ＋ＳＰ３ＤとＳＰ１Ｄ＋ＳＰ３Ｕの割合に基づいて、所定の符号を出力するものであることを特徴とする音響信号からの情報の抽出装置。
請求項１１において、
前記符号化手段は、前記生成された第１窓スペクトルから互いに重複しない２つの低周波数範囲のスペクトル集合ＳＰ１ＵとＳＰ１Ｄを抽出するとともに、前記第３窓スペクトルから互いに重複しない２つの低周波数範囲のスペクトル集合ＳＰ３ＵとＳＰ３Ｄを抽出し、スペクトル集合ＳＰ１Ｕ、ＳＰ１Ｄ、ＳＰ３Ｕ、ＳＰ３Ｄのスペクトル強度に基づいて、所定の符号を出力するものであることを特徴とする音響信号からの情報の抽出装置。
請求項１１において、
前記符号化手段は、前記生成された第１窓スペクトルから互いに重複しない３つの低周波数範囲のスペクトル集合ＳＰ１Ｕ、ＳＰ１Ｍ、ＳＰ１Ｄを抽出するとともに、前記第３窓スペクトルから互いに重複しない３つの低周波数範囲のスペクトル集合ＳＰ３Ｕ、ＳＰ３Ｍ、ＳＰ３Ｄを抽出し、前記抽出したスペクトル集合ＳＰ１Ｕ、ＳＰ１Ｍ、ＳＰ１Ｄ、ＳＰ３Ｕ、ＳＰ３Ｍ、ＳＰ３Ｄのスペクトル強度に基づいて、所定の符号を出力するものであることを特徴とする音響信号からの情報の抽出装置。
請求項１１から請求項１４のいずれかにおいて、
前記音響フレーム獲得手段は、前記音響信号から、所定数のサンプルで構成される音響フレームを基準フレームとして獲得する基準フレーム獲得手段と、前記基準フレームと所定サンプルずつ移動させることにより位相を変更して設定される複数の音響フレームを位相変更フレームとして設定する位相変更フレーム設定手段により構成され、
前記符号化手段は、前記抽出したスペクトル集合に基づいて、符号判定パラメータを算出する符号判定パラメータ算出手段と、基準フレームが異なる過去の同位相の音響フレームにおいて算出された符号判定パラメータに基づいて、前記基準フレームおよび複数の位相変更フレームのうち１つの音響フレームを位相が最適なものであると判断し、当該最適な位相の音響フレームについて判断された前記符号判定パラメータに基づいて、所定の符号を出力する符号出力手段を有するものであることを特徴とする音響信号からの情報の抽出装置。
コンピュータを、請求項１１から請求項１５のいずれかに記載の音響信号からの情報の抽出装置として、機能させるためのプログラム。