JP2003526274A - ディジタル電話信号へのデータの埋め込み - Google Patents

ディジタル電話信号へのデータの埋め込み

Info

Publication number
JP2003526274A
JP2003526274A JP2001565577A JP2001565577A JP2003526274A JP 2003526274 A JP2003526274 A JP 2003526274A JP 2001565577 A JP2001565577 A JP 2001565577A JP 2001565577 A JP2001565577 A JP 2001565577A JP 2003526274 A JP2003526274 A JP 2003526274A
Authority
JP
Japan
Prior art keywords
signal
data
user
handset
digital
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001565577A
Other languages
English (en)
Inventor
メイヤー,トーマス,ダブリュー
メイヤー,ジョスリン,モーザ
Original Assignee
メイヤー,トーマス,ダブリュー
メイヤー,ジョスリン,モーザ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by メイヤー,トーマス,ダブリュー, メイヤー,ジョスリン,モーザ filed Critical メイヤー,トーマス,ダブリュー
Publication of JP2003526274A publication Critical patent/JP2003526274A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Telephonic Communication Services (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

(57)【要約】 セルラー電話システムにおいて、セル電話音声信号の送信に、ユーザの送受話器に提示可能な追加の広告、娯楽、電子商取引及びサービス情報などを追加するための新規な技術である。この技術は、ディジタル音声電話信号を該信号の周波数領域または他の変換の係数表現の符号化された組に変換することによって、ディジタル電話信号の下位互換性に影響を与えることなく、ディジタル電話信号に上記のような追加のディジタルデータを埋め込むステップと、追加のデータのビットを含むことになる所定の係数部分を選択するステップと、埋め込まれた追加のデータを含む圧縮されたディジタル音声信号を送信するために、音声信号を圧縮する一方で、選択された部分に上記ビットを埋め込んで、ユーザが、送信された音声信号を受信する一方で、追加のデータを復号化して取り出すことができるようにするステップを含む。

Description

【発明の詳細な説明】
「発明の分野」 本発明のおそらく最も重要な用途に関する分野は、デジタル電話信号などに組
み込むための改良された技術分野に属し、特に、特定のセルラーフォンシステム
(セルラー電話システム、または携帯電話システム)、音声信号へのデータの追
加(例えば、対象とする広告画像、音楽または他の娯楽用コンテンツ、市場を限
定した広告、対話型の電子商取引アプリケーション、ゲーム、天気予報や他のサ
ービス)における技術分野に関連する。このような埋め込みは、オーディオ音声
信号が、送信される前に、符号化及び圧縮処理の一部として、非圧縮表現から高
圧縮されたディジタル表現に変換されるポイント(箇所)において実行されるの
が好ましい。そのポイントとは、例えば、中央のポイントにおける抽出に関して
はユーザの送受話器であり、送受話器における抽出に関しては中央のディジタル
化ポイントである。本発明は、いかなる形であれ、ディジタル信号に影響を与え
ることなく、処理の任意のポイントにおいて、ディジタル音声信号からそれに埋
め込まれたデータの上記のような抽出を可能にする。
【0001】 追加データがユーザの電話器(送受話器のこと)によって受信されることが意
図されている場合は、例えば、その追加データを、電話器によって抽出して適切
なフォーマットにし、表示し、実行し、記録し、または別様に処理することがで
きる。また、追加データが、システム内の他のポイントで受信されることが意図
されている場合には、その追加データを、所望のシステムのセマンティクス(規
則)に基づいたやり方で、抽出して適切なフォーマットにし、実行することがで
きる。
【0002】 さらに、本発明の技術は、システムの任意の中間ポイントに上記のような追加
データを埋め込むのに有効であり、ディジタル信号が既に圧縮されている場合に
も埋め込むことができる。但し、この場合には、伝達性、効率及びビットレート
が幾分低下する。
【0003】 しかしながら、全てのアプリケーションにおいて、本発明は、1999年9月3日に
提出した係属中の本出願人との共同出願である、「Process, System, And Appar
atus For Embedding Data In Compressed Audio, Image, Video And Other Medi
a Files And The Like」と題する米国特許出願第09/389,941号(PCT出願番号PCT
/IB00,00227)に開示されている基本的な技術を使用するのが好ましい。
【0004】 「背景」 前記係属中の共同出願で説明されているように、その出願に係る発明以前には
、データは、これまで、メディア情報及びフォーマットのアナログ表現にしばし
ば埋め込まれていた。これは、広範囲に、例えば、文字のような追加データの伝
送に関してテレビやラジオ用アプリケーションにおいて使用されてきた。しかし
、それに使用された技術は、一般には、高ビットレートのディジタルデータの伝
送を行うことはできない。
【0005】 ウォーターマーキングデータもまた、メディアの劣化及び操作に対して頑強で
あるように埋め込まれている。典型的なウォーターマーキング技術は、メディア
ファイルに適用される共通の変換タイプを通じて保存される信号の全体的な特性
を利用している。これらの技術もまた、かなり低いビットレートに制限される。
実際、オーディオウォーターマーキング技術に対する良好なビットレートは、1
秒間に24ビット程度のデータが符号化されるものに過ぎない。
【0006】 ディジタルメディアの信号領域の下位ビットにデータを埋め込んで高ビットレ
ートの使用を可能にしているが、そのようなデータは、圧縮されていないか、か
なり低い圧縮率しか達成できない。さらに、今日の多くの圧縮ファイルフォーマ
ットは、そのような信号領域表現を使用せず、従って、この技術の使用に適さな
い。さらに、この技術は、音声ファイルにデータを符号化するために使用される
場合には、耳に聞こえるノイズを生じる傾向がある。
【0007】 上記技術及び関連する技術及び用途を記載している先行特許には、米国特許第
4,379,947号(オーディオと同時にデータを送信する処理)、第5,185,800号(心
理的聴覚基準に基づく適応量子化と共に、変換されたディジタルオーディオ放送
信号に対するビット割り当てを使用する)、第5,687,236号(ステガノグラフィ
ー技術(steganographic technique)、第5,710,834号(グラフィックイメージ
を介して伝送されるコード信号)、第5,832,119号(経験的データ内に埋め込ま
れた制御信号によってシステムを制御する)、第5,850,481号(埋め込まれたド
キュメント。但し、任意のデータやコンピュータコードではない)、第5,889,86
8号(ディジタルデータ内のディジタルウォーターマーク)、及び第5,893,067号
(オーディオ信号内に隠されたエコーデータ)がある。
【0008】 上記の技術に関連する先行文献には、Bender, W. D. Gruhl, M. Morimoto,及
びA. Luによる「Techniques for data hiding」(IBM Systems Journal, Vol.35
, Nos. 3 & 4, 1996,p.313-336)、 MPEG Spec-ISO/IEC 11172, part 1-3, Information Technology-Coding of mov
ing pictures and associated audio for digital storage media at up to abo
ut 1.5Mbit/s Copyright 1993, ISO/IEC、 ID3v2 spec;http://www.id3.org/easy.html及びhttp://www.id3.org/id3v2.3. 0.html がある。
【0009】 マルチメディアデータラベリング、特に、符号化低ビットレート情報にウォー
ターマークを使用して著作権情報をラベリングする技術の概要は、Langelaar, G
.C.他による「Copy Protection For Multimedia Data based on Labeling Techn
iques」に記載されている(http://www-it.et.tudelft.nl/html/research/smash
/pulblic/benlx96/benelux_cr.html)。
【0010】 上記「MPEG Spec」及び「IDSv2 Spec」との特定の関連において、本出願人は
、「Process Of And System For Seamlessly Embedding Executable Program Co
de Into Media File Formats Such As MP3 And The Like for Execution By Dig
ital Media Player And Viewing Systems」と題する係属中の米国特許出願第09/
389,942号(PCT出願番号PCT/IB00,00227号)中に、本発明の埋め込み概念のいく
つかを適用する技術を開示した。しかしながら、それらの技術は、1つ以上の事
前に準備されたオーディオ、ビデオ、静止画像、3D(3次元)またはその他の
一般に非圧縮のメディアフォーマットに拡張機能を組み込み、この拡張機能によ
り、それらの事前に準備された表現に、ディジタルメディア再生機器において、
追加のグラフィック、対話型の及び/または電子商取引のコンテンツ表現を追加
することに特に向けられたものである。
【0011】 しかしながら、前述したように、最初に挙げた特許出願第09/389,941号の技術
は、圧縮されたフォーマットへのデータの埋め込みにより広く関連しており、実
際、典型的には、フーリエ変換、離散コサイン変換、または他の周知の関数を用
いてデータの周波数表現を符号化することに関連している。本発明は、メディア
の圧縮されたディジタル表現に高いレートのデータを埋め込むものであり、圧縮
されたデータの周波数表現の係数の下位ビットを変更するステップを含んでおり
、これによって、高速の符号化及び復号化という更なる利点を可能にする。なぜ
なら、圧縮されたメディアの係数を、長々とした余分な解凍/圧縮処理を行うこ
となく直接変換することができるからである。また、この技術をウォーターマー
キングと組み合わせて使用することができるが、この場合、ウォーターマークは
、データ符号化処理の前に適用される。
【0012】 前述したLangelaar他による文献は、以下に記す追加の先行技術文献を参照す
ると共に、それらについて論じている。 J. Zhao, E. Kochによる「Embedding Robust Labels into Images for Copyrigh
t Protection」(Proceedings of the International Congress on Intellectua
l Property Rights for Specialized Information, Knowledge and New Technol
ogies, Vienna, Austria, August 1995)、 E. Koch, J. Zhaoによる「Towards Robust and Hidden Image Copyright Labeli
ng」(Proceedings IEEE Workshop on Nonlinear Signal and Image Processing
, Neos Marmaras, june,1995)、及び、 F. M. Boland, J.J.K O Ruanaidh, C, Dautzenbergによる「Watermarking Digit
al Images for Copyright Protection」(Proceedings of the 5th Internation
al Conference on Image Processing and its Applications, No.410, Endinbur
gh, July, 1995)。
【0013】 Langelaarによる以下の文献には、MPEG圧縮ビデオフォーマットの先行するラ
ベリング技術が開示されている。 G.C Langelaar, R. L. Lagendijk, J.Biemondによる「Real-time Labeling Meth
ods of MPEG Compressed Video,」(18th Symposium on Information Theory in
the Benelux, 15-16 May 1997, Veldhoven, The Netherlands)。
【0014】 これらのZhao及びKoch, Boland他、及び、Langelaar他による開示は、本発明
によって利用される技術のコンポーネントに部分的に類似した符号化技術手法を
教示しているが、以下により詳しく説明するように、本発明が追求し取り組む、
所望の利点を有する全体的な課題を見越したものでも、実際にそれらの課題を解
決するために適合されたものでもない。
【0015】 先ず、前記したZhao及びKochのアプローチについて検討する。彼らは、JPEGベ
ースの技術を使用して信号を画像に埋め込んだ。([JPEG]Digital Compressio
n and Coding of Continuous-tone Still Images, Part1:Requirements and gui
delines, ISO/IEC DIS 10918-1.) 彼らは、先ず信号を、8ブロックすなわちオ
クテットDCT内の中間周波数範囲の係数から選択した3つの係数の大きさの順で
符号化した。彼らは、これらの3つの係数間の順序関係の8つの順列を3つのグ
ループに分割した。1つは、「1」ビット符号化(HML、MHL、及びHHL)であり
、1つは、「0」ビット符号化(MLH、LMH、及びLLH)であり、3番目のグルー
プは、「データ無し(ノーデータ)」符号化(HLM、LHM、及びMMM)である。彼
らはまた、この技法をビデオデータのウォーターマーキングに拡張した。かれら
の技法は、頑強であり(ロバスト性があり)、変更にも柔軟に対応できるもので
あるが、彼らは、大量のデータを符号化することはできなかった。なぜなら、デ
ータが符号化されているデータの近くにすでにあるところのブロックしか変更で
きないからである。他の点では、彼らは、「データ無し」を符号化するために係
数を変更しなければならない。彼らは、また、大規模な係数の順序関係を変えな
ければならないために、データを厳密に変更しなければならない。より詳細に後
述するように、これらの欠点は、係数内の1ビットのみを変えることによってデ
ータを符号化する本発明の技法によって克服される。
【0016】 Boland、Ruanaidh、及びDautzenbergについては、彼らは、DCT ウォルシュ変
換(DCT Walsh Transform)、または、画像のウェブレット変換を生成し、次に、
選択された係数に1を加えて「1」ビットを符号化するか、または、選択された
係数から1を引いて「0」ビットを符号化する技法を使用する。この技法は、一
見したところ、本発明の1つのコンポーネントの1側面に外見上類似しているが
、本発明によって除去される非常に重要な制限を有している。その制限とは、符
号化された画像を元の画像と比較することによってのみ情報を抽出することがで
きるということである。これは、ウォーターマークされたメディアファイルのコ
ピー、及びウォーターマークされていないメディアファイルのコピーを、ウォー
ターマークを行うために同時に送らなければならないことを意味する。これは、
かなり大きな制限であるが、最下位ビット符号化技法の使用を新規に組み込んだ
本発明によって克服されるものである。
【0017】 かかる最下位ビット符号化技法は、既に提案されているのであるが、本発明で
実施されるようなものとしては提案されていない。例えば、Langelaar、Langend
ijk、及び、Biemondの文献は、DCT係数を表す可変長コード(VLC)の最下位ビッ
トを変更することによってMPEGビデオストリームにおけるデータを符号化する技
法を教示する。Langelaar他の符号化は、それらのVLC値のみを置換できるように
することによってファイルの長さを一定に維持する。この場合、それらのVLC値
は、同じ長さの他の値によって置き換えることができ、異なる大きさを有する。
この符号化は、ファイルを単純に横断して、適切なVLC値の全てを変更する。し
かしながら、かれらの技法には、適切なVLC値が比較的少ないという欠点がある
(1.4Mビット/秒のビデオファイルにおいて167/秒であり、したがって
、わずか167ビットを140万ビットの情報において符号化可能である)。
【0018】 これとは対照的に、最初に挙げた特許出願第09/389,941号の技法は、例えば、
ビデオに適用した場合には、1グループまたは1セットの近隣の係数を共に変更
できるようにすることによって、上記制限を除去し、ファイル長を一定に維持し
つつ、はるかに高いビットレートを達成することができる。これは、また、知覚
可能な効果を生じることなくはるかに大量の情報を記憶することを可能にする。
なぜなら、この技法によって、心理的知覚モデルが、変更される係数の選択を行
うことが可能となるからである。
【0019】 実際、本発明者が先になした発明による改良された技法は、従来技術とは異な
り、オーディオ、画像、またはビデオファイルへのディジタル情報の符号化を、
前述の文献に記載されたもの(1秒につき300ビットのオーダー)よりも数桁
大きな速度で可能にする。後述するように、本発明は、実際に、128,000ビット
/秒のオーディオファイルに、3000ビット/秒のデータストリームを容易に埋め
込むことができた。
【0020】 従来技術では、比較的短いシーケンスのデータのみ、典型的には、符号化され
た単純な著作権や所有権情報をメディアファイルに埋め込んでいる。我々の技法
によれば、メディアファイルに全く新しい部類のコンテンツ、例えば、コンピュ
ータプログラムの全体、マルチメディア注釈、または、長い追加情報を含めるこ
とが可能である。前述の係属中の出願に記載されているように、メディアファイ
ルに埋め込まれたコンピュータプログラムは、売買、対話型のコンテンツ、対話
型及び伝統的な広告、世論調査、CDやコンサートチケット購入のような電子商
取引におけるセールス、及び、ゲームや対話型の音楽ビデオのような完全に反応
型のコンテンツを含む、全ての種類の拡張された統合化トランザクションメディ
アを可能にする。これらのコンテンツは、パーソナルコンピュータによって使用
され、ユーザのマウスの動きに反応し、音楽のビートに同期する。これによって
、上記のソフトウエアや、テレビ、ソニーのウォークマン(登録商標)のような
携帯機器、任天堂のゲームボーイ(登録商標)、及び、Rio(リオ)やNomad(ノ
マド)などの携帯型MP3プレーヤといったハードウエアプラットホーム上に音楽
と共に統合化された売買ポイントを可能にする。これによって、新たなビジネス
モデルが作成される。例えば、レコード会社は、所有する歌曲のコピーをやめさ
せようとする代わりに、音楽の自由でオープンな配信を促進し、これによって、
埋め込まれた広告や電子商取引のメッセージを、可能性のある最大数の聴取者や
潜在的な顧客に伝えることができる。
【0021】 次に、本発明について言えば、本発明は、本出願による先の特許出願に記載さ
れた前述の技法を、事前に記録されたメディアとは大きく異なる問題を有するセ
ルラー(及び他の)電話やそれと同様のもので使用するという特別な問題に適用
することに関する。但し、電話を介して伝送される、目下生成中のリアルタイム
音声や他の信号の代わりに事前記録された音声に使用することもまた有効である
【0022】 「本発明の目的」 従って、本発明の主な目的は、デジタルセルラー(及び他の)電話信号に、デ
ィジタル電話信号のディジタル上の下位互換性(以前の製品との互換性)に影響
を与えることなく、追加データ(例えば、広告画像、市場を限定した広告、電子
商取引アプリケーション、ゲーム、フォーム(form)などの対話型コンピュータ
プログラム、追加の文字やオーディオコンテンツ、音楽や他の娯楽コンテンツな
ど)を埋め込むための新規で改善された処理、システム及び装置を提供すること
である。
【0023】 本発明の他の目的は、埋め込むステップに、あるポイントにおいて付加される
信号処理が含まれる新規な処理を提供することである。ここで、あるポイントと
は、オーディオ音声信号が、非圧縮の表現から高度に圧縮されたディジタル表現
に変換されて、それが送信される前に、符号化及び圧縮処理の一部として、追加
のデータが音声信号に付加されるポイントである。
【0024】 本発明のさらに他の目的は、特に、無線式セルラーフォンシステム内の、移動
交換センター(MSC)や、ユーザの送受話器における抽出のために他の中央ポイ
ントにおいて、または、中央ポイントにおける抽出のために送受話器において、
新規の埋め込み技法を提供することである。
【0025】 本発明のさらに他の目的は、既に圧縮されているディジタル信号に追加データ
を埋め込むための手段を提供することである。
【0026】 本発明のさらに他の目的は、ユーザーの送受話器(中央ステーションでの受信
のため)、中央ステーション(ユーザの送受話器での受信のため)、または、効
率が低下する任意の中間ポイントにおいて、追加データを電話信号に埋め込む能
力を介して、送受話器が音声のみのネットワークで使用される一方で、新規な2
方向(または双方向)ネットワーク接続を形成することである。
【0027】 さらに他の目的については、以下で説明するが、より具体的には、特許請求の
範囲に示されている。
【0028】 「概要」 従って、広い観点の1つから簡潔に言うと、本発明は、ディジタル電話信号の
下位互換性に影響を与えることなく、音声ディジタル電話信号に追加のディジタ
ルデータを埋め込む方法を含み、その方法は、ディジタル音声電話信号をその信
号の周波数領域または他の変換の係数表現の符号化された組に変換するステップ
と、各々が追加データのビットを含むことになる所定の係数部分を選択するステ
ップと、その選択された部分にそのビットを埋め込み、一方で、信号を圧縮して
埋め込まれた追加データを含む圧縮されたディジタル音声信号を送信し、これに
よって、ユーザーが、送信された音声信号を受け取る一方で、追加データを抽出
するために復号化できるようにするステップ、を含む。
【0029】 別の観点から見ると、本発明は、中央ステーションを介してシステム内で相互
接続されたユーザの音声送受話器によりシステム内で送受信されるディジタル電
話信号に、ディジタル電話信号の下位互換性に影響を与えることなく、追加デー
タを埋め込む方法を含む。この方法は、中央ステーションまたはユーザの送受話
器において音声信号を、音声信号の中間表現に変換するステップであって、この
変換を、音声信号に符号化変換を適用して、浮動小数点係数を生成することによ
って行い、この係数表現を最終的に圧縮された離散ディジタル信号に変換するた
めに必要な量子化及びトランケーション(丸めまたは打ち切り)ステップを実行
することなく行うステップと、各々が追加データのビットを含むことになる変換
された音声信号の所定の部分を選択するステップと、係数を変更する係数領域パ
リティ符号化技法によって量子化及びトランケーションを実行し、これによって
、生じた、量子化されトランケーションを施された(すなわち、丸められ、また
は打ち切られた)ディジタル信号の圧縮バージョンが埋め込まれた追加データを
含むようにするステップと、その圧縮された追加信号を、中央ステーションから
ユーザの送受話器へと、または、ユーザの送受話器から中央ステーションへと、
通常のディジタル電話信号の様式でそれぞれ送信するステップ、を含む。
【0030】 好適な、及び最良モードの実施形態、構成及び技法については、詳細に後述す
る。
【0031】 以下に、本発明を添付の図面を参照して説明する。
【0032】 「本発明の好適な実施形態の説明」 前述したように、本発明は、セルラーフォオンネットワークシステムなどにお
けるディジタル電話信号に、そのディジタル電話信号の下位互換性に影響を与え
ることなくデータを埋め込むことに関連する。
【0033】 本発明の技術によれば、中央ステーションでの受信のためにユーザの端末にお
いて、ユーザの送受話器での受信のために中央ステーションにおいて、または、
(より効率が低下する)任意の中間ポイントにおいて、追加のデータを電話信号
に埋め込むことができる。また、この技術によれば、送受話器を音声のみのネッ
トワーク上で使用しつつ、2方向ネットワーク接続を形成することができる。
【0034】 このようなディジタル電話信号に埋め込むことが可能なデータのタイプの例を
以下に示す。
【0035】 中央ステーションサーバーからのデータ ・ユーザが電話を使用している間に、更新される個別に対象とされる広告画像(
広告イメージ)。 ・図13に示すような、差し込まれた市場限定の広告や勧誘。 ・電子商取引アプリケーション、世論調査、ゲームまたはフォームなどの対話型
のコンピュータプログラム。 ・追加の文字やオーディオコンテンツ(例えば図13に示すようなものであって
、天候、ニュース、ページャーメッセージ、翻訳、サービスの更新)。 ・音楽や他の娯楽用コンテンツ。すなわち、通話中着信音楽及びメッセージなど
。 ・双方向にインターネットコンテンツを送信するためのワイヤレスアプリケーシ
ョンプロトコル(wireless application protocol :WAP。または無線アプリケー
ションプロトコル)。
【0036】 ユーザの送受話器からのデータ。 ・GPS追加データ。 ・タイプされた、またはキー入力された応答(データバックチャンネル(data b
ackchannel。またはデータ戻しチャンネル))。 ・静止画像、ビデオまたはオーディオチャンネル。 ・WAP。
【0037】 図5に示すように、データ埋め込み処理は、オーディオ音声信号が、圧縮され
ていない表現(非圧縮表現)から高度に圧縮された(高い圧縮率で圧縮された)
ディジタル表現に変換されるポイントにおいて付加される信号処理から構成され
る。この処理は、音声信号が送信される前に、符号化及び圧縮処理の一部として
音声信号にデータを追加する。
【0038】 かかるポイントが典型的な無線システムには2つある。
【0039】 ・1つは、中央セルラーフォンシステムが、外部のソース、典型的には公衆電
話回線網(PSTN)から信号を受け取るポイントである。このポイントは、ほとん
どのセルラーフォンシステムでは、一般に移動交換センター(MSC)である。
【0040】 ・もう1つは、セルラーフォンが、セルラーフォンシステムに送信するために
ユーザの音声を変換するポイントである。 いずれのポイントにおいても、任意のデータをオーディオストリーム中に配置す
ることができる。
【0041】 図5の左側の列に、ユーザからの追加のユーザデータをセルシステムに埋め込
む処理が示されている。この処理は、セルラー受信器に送信し、及びセルラー受
信器で受信するステップと、追加のデータを取り出す(抽出する)一方で、元の
ユーザの音声信号を再構成して提示するステップと、例えばPSTNに再送信(また
は転送)するステップから構成される。右側の列には、下から上に、セルシステ
ムからユーザに向かう場合の動作が示されている。
【0042】 前述した、及び図5の下部に示されたデータを、同じ技法を用いてではあるが
、典型的にはより低ビットレートで、前もって圧縮された信号に任意のポイント
で追加することができる。
【0043】 前述したように、追加データを中央ディジタル化ポイントにおいて埋め込むこ
とができる。図6は、ユーザの送受話器での抽出のために、中央ディジタル化ポ
イントにおいてデータを埋め込む処理を示すものである。セルフォンにおける会
話データを圧縮するために使用される既知の全てのコーダー(符号器)に適用さ
せるために、必要な方法ステップを十分に一般的な用語を用いて説明する。
【0044】 埋め込み処理は、2つのコンポーネントを有して開始する。それらのコンポー
ネントは、オーディオ音声信号と、オーディオ信号に埋め込まれることになる追
加データファイルである。
【0045】 図6に示すように最初のステップは、実際に使用されるコーダーによって決ま
る中間表現に音声信号を変換することである。これは、典型的には、Tにおいて
符号化変換を音声信号に適用して、浮動小数点係数の組を生成するステップであ
って、この係数表現を圧縮された離散ディジタル信号に変換するのに必要な最終
的な量子化及びトランケーション(丸めまたは打ち切り)ステップを実行しない
ステップから構成される。図4に、サイン(Sine)、ウェーブレット(Wavelet
)または関連する離散変換を、信号波形及び係数ベースの表形式として示す。
【0046】 第2のステップは、各々が追加のデータファイルのビットを含むことになる変
換された音声信号の部分を選択することである。典型的には、これは、Sにおい
て、1組の係数を、好ましくは、データ内において一定のインターバル(間隔)
で選択することによってなされる。
【0047】 このポイントにおいて、前述した図4の係数領域パリティ符号化技法を使用し
て、図6のQにおいて、ディジタル信号の量子化されトランケーションを施され
たバージョンが埋め込まれたデータを含むように係数を変更することができる。
今や、ディジタルデータ信号を、通常のディジタル電話信号としてTxにおいて
送信することができる。
【0048】 図1に、こうして圧縮された音声信号を、より詳細に後述する任意の周知のタ
イプの符号化処理(そのように表記されている)によって、その圧縮された音声
信号中に埋め込むための追加データコンテンツ(「データ」)と結合されるもの
として概略的に示す。この場合、追加の埋め込みデータを有する圧縮された音声
信号が、既存のファイルフォーマットとの下位互換性(以前の製品との互換性)
に影響を与えることなく、かつ、送受話器のユーザの受信または再生体験に実質
的に影響を与えることなく生成される。さらに、所望であれば、図1の変換ステ
ップを符号化処理の一部とすることができ、また、オプションの圧縮ステップを
含むようにすることも可能である。また、これらのステップを追加の個別のステ
ップとして適用することも可能である。そのような変換、圧縮及び符号化処理を
組み合わせると、実際、知覚符号化技法(perceptual encoding technique)を
使用して、データを埋め込むための係数を選択することが可能となる。
【0049】 この概観を継続するために、復号化及び再生の概要を図2に示す。図2におい
て、復号化処理(このように表記されており、より詳細に後述する)は、追加デ
ータを埋め込むために図1で使用される符号化処理のタイプに依存する。典型的
には、これには、周知の符号化処理の単純な逆処理が含まれる。図示の音声信号
は、復号化処理において変化しない。さらに所望であれば、追加データを、周知
のチェックサムやディジタル署名によって検証して(「検証処理」)、データが
、図1で最初に符号化され埋め込まれたデータとビット毎に同一であるというこ
とを保証することができる。
【0050】 さらに、音声信号の受信環境において、音声送受話器またはステーション受信
器とデータ操作環境ボックスとの間のSYNC線によって図2に模式的に示すように
、受信側の送受話器またはステーションと実行環境とが互いに通信を行うことが
でき、これによって、追加データの実行を、受信コンテンツと同期化させること
ができる。
【0051】 ステガノグラフィー技術を用いたデータ符号化の可能性のある使用は、引用文
献とともに前述したが、本発明の技術への適用については図3に示す。埋め込ま
れる追加データは、ビットストリームコードに変換されるものとして図示されて
おり、データのバイトを抽出してビット毎の表現にし、これによって、それらを
、音声信号に小さな変化として挿入することができる。データビットを埋め込む
音声信号コンテンツ内の適切な位置の選択は、ユーザの音声信号の受信体験に与
える影響が最小の状態で実際のメディアコンテンツに加えることが可能な小さな
変化を識別することに基づく。しかしながら、そのような変化は、自動化された
復号化処理によって容易に検出することができ、情報を復元することができるよ
うなものでなければならない。
【0052】 図3の「実行可能コードの挿入」のステップにおいて、いくつかのステガノグ
ラフィー符号化処理(前述した引例のものを含む)のうちの任意の1つを使用す
ることができる。本発明によれば、音声信号コンテンツは、1組の関数係数(ま
たは機能係数)として表され、以下でより詳細に説明するような、いくつかの選
択された係数の最下位ビットを変更する技法によってデータビットを埋め込むの
が好ましい。
【0053】 埋め込まれた実行可能コードを有する生成された音声信号もまた、下位互換性
がある。この下位互換性は、いくつかの場合にはわずかに低減するが、埋め込み
処理に起因するユーザの可能性のある受信体験は十分に許容可能なものである。
本発明によれば、1秒間に3000ビット以上のデータを、128,000ビット/秒のビ
ットレートで符号化されたオーディオファイルに容易に埋め込むことができた。
【0054】 ここで、本発明に従ってデータビットの埋め込みを実施するために、音声信号
変換の適切な係数の組の選択を、好ましくは一定のインターバルで行うことにつ
いて詳しく説明する。前述したように、本発明は、選択された係数において1ビ
ットのみを変えることを必要とし、これは、係数の関係において大規模な順序の
変更を行う従来技術(例えば、前述したZhao及びKochの文献に記載されているも
の)とは異なる。この組は、音声信号内の連続する一連の係数を単に選ぶことに
よって選択することができる。好適な技法は、図4の係数領域パリティ符号化表
現に関連して説明したように音声信号に広範囲の周波数を符号化した1組の係数
を選択することである。
【0055】 データビットストリーム内の各ビットについて、選択された係数、及び符号化
される次のデータビットが結合され、そのビットを符号化するために係数を再ス
スケーリングする(図6の「再スケール」)。可能であれば、これは、変更され
る係数の選択が、所望の値に対する元の係数の近さに基づくように、量子化及び
再スケーリングステップと共に行われるのが好ましい。さらに、かかる量子化及
び再スケーリングの後には、この決定の基礎となる程多くのデータはない。
【0056】 さらに、ファイルサイズを一定に維持するという制限を追加して、既に符号化
されたオーディオファイル内の所定の位置で再スケーリングを行うことができる
。フレームレートを維持しつつ単一の係数を再スケーリングするだけでビットを
符号化することが不可能な場合には、複数の係数を変更して、それらの圧縮され
た表現を同じ長さに維持し、それに応じて、オーディオファイルへの妨害が最小
になるようにすることができる。この符号化は、LSB符号化処理を用いて、また
は、好ましくは、図4のLSBパリティ符号化を用いて行うことができる。かかる
パリティ符号化は、変更される係数についてのより多くの選択を可能にする。
【0057】 図4のテーブルの例示的な係数ベースの表現を参照すると、それらの係数を足
し合わせることによって係数のパリティを計算することができる。
【0058】 12+15+5+3+10+6+12+1=64 64は偶数なので、これらの係数において現在符号化されているビット値は0で
ある。しかしながら、この係数の組において1を符号化することが所望される場
合には、パリティを奇数にするだけでよい。これは、任意の振幅または位相値を
選択し、及び、1を加えるかまたは引くかすることによってなしうる。この値の
選択は任意選択的に行うことができ、または、前述のMPEG符号化処理で現在使用
されている心理音響学的モデルのタイプに基づいて行うことができる。
【0059】 これは、振幅周波数領域下位ビット符号化(magnitude frequency-domain low
-bit coding)によるデータの符号化において一連の係数の下位ビットのパリテ
ィを使用することを例示したものである。1例として、一連の、例えば8個の係
数においてデータ情報の1ビットを符号化したい場合を考える。本発明によれば
、最初の係数の下位ビットを単に変更するのではなく、8個の下位ビットのパリ
ティを共に変更することによって符号化が行われる。アルゴリズムは1組の連続
する係数を調べ、下位ビットを抜き出し、それらのうちのいくつがセットされて
いるかをカウントする。したがって、本発明の技法によれば、セットされている
ビットの数が偶数(偶数パリティ)であるか奇数(奇数パリティ)であるかに関
係なく、データの1ビットを符号化することができる。これは、どの係数(もし
あれば)を変更するかを決定する際に、アルゴリズム的な選択を提供するという
利点をもたらす。
【0060】 代替的には、この技法を、より高位のパリティを使用しつつ、より広範囲の値
に適用することができる。1例として、28の係数領域について符号化できるの
と同じデータ量を、32の係数について符号化することができるが、これは、そ
れらの32の係数の下位ビットを加え合わせて、次に、その結果についてモジュ
ロ4(4で除したときの余り)を計算することによって行う。これにより、どの
係数を変更するかの選択をよりフレキシブルに行うことが可能になる。但し、多
くのデータをストリームに挿入することはできない。
【0061】 本発明の符号化及び復号化処理のコンポーネントにおいて使用可能な上述の技
法についてより詳述している特定の文献として、 [ISO 8859-1]ISO/IEC DIS 8859-1. 8-bit single-byte coded graphic character sets, Part 1:Latin alphabet No
.1. Technical committee/subcommittee: JTC 1/SC 2; [MIME] Freed, N. and N. Borenstein, “Multipurpose Internet Mail Extensi
ons(MIME) Part One: Format of Internet Message Bodies”,RFC 2045, Novemb
er 1996.<url::ftp://fttp.isi.cdu/in-notcs/rfc2045.txt> [UNICODE] ISO/IEC 10646-1:1993. Universal Multiple-Octet Coded Character Set(UCS),Part 1: Architecture a
nd Basic Multilingual Plain Technical committee/subcommittee: JTC 1/SC 2
<url: http://www.unicode.org>. がある。
【0062】 圧縮された音声信号の変換周波数表現の大きさすなわち振幅係数の最下位ビッ
トの好適な使用について説明したが、他の技法を使用することもできる。例えば
、音声信号の変換周波数表現の位相係数(図4)の最下位ビットをプログラムを
符号化するために使用する位相周波数領域下位ビット符号化がある。これの実施
は、データを符号化するために振幅係数ではなく位相係数を使用することを除い
ては同じであり、オーディオコンテンツの場合には、人間の耳が、音の大きさに
比べて音の位相にはるかに鈍感なために、受信して再生する際に、ひずみが聞こ
える可能性はより少ないであろう。
【0063】 本発明を、中央ディジタル化ポイントまたはサーバーステーションにおける追
加データを埋め込みに関して図6に例示的に示している。しかしながら、前述し
たように、ユーザのセルフォン送受話器においても追加データの埋め込みを実施
することが可能である。この場合の動作を図7に示す。図7では、図6と同じ参
照文字を使用している。図7は、中央のポイントにおける抽出のために、ユーザ
の送受話器においてデータを埋め込む処理を例示するものである。これは、埋め
込み処理が送受話器で実施され、かつ、送受話器から中央ステーションにデータ
を送信するということを除いて、図6に関して詳細に説明した中央ディジタル化
ポイントにおけるデータの埋め込み処理と同じである。
【0064】 他のポイントにおいてデータを埋め込むことに関しては、図8に、既に圧縮さ
れているディジタル信号にデータを埋め込むことが可能な手段が示されている。
しかし、符号化処理はもはや元の音声信号(オリジナルの音声信号)に関する情
報を利用することができないので、前述したのと同じ透過性(または伝達性)及
び効率をもって信号にデータを埋め込むことはできない。しかしながら、それが
可能であって、このより低いビットレートで信号にデータを追加するために有効
な場合がしばしばある。これは、ディジタル音声信号を検査すること、及び、音
声信号を表す離散的な係数を変更することによって一定のインターバルでデータ
を挿入することを含む。
【0065】 本発明に有用なデータ抽出技法に再び目を向けると、ディジタル信号にどんな
形であれ影響を与えることなく、埋め込まれているデータを、処理の任意のポイ
ントにおいてディジタル音声信号から抽出することができる。既に説明した図2
は大まかなシステムを表しているが、図9に示す構成は、より詳しく、本発明の
送信された圧縮音声信号(圧縮音声信号は圧縮された音声信号のこと)に埋め込
まれた追加データを抽出することに特化されたものである。データがユーザの電
話器によって受信されることが意図されている場合には、データを抜き出して適
切なフォーマットにし、表示し、実行し、記憶し、あるいは、図9に示すように
電話機によって別様に処理することができる。データが、システム内の他のポイ
ントで受信されることが意図されている場合には、データを抜き出して適切なフ
ォーマットにし、システムのセマンティクス(規則)に従ったやり方でデータが
実行される。
【0066】 圧縮音声信号への追加データの埋め込みを可能にする時間領域波形符号化の詳
細を図10に示す。周波数領域波形符号化及びベクトル符号化の代替的な使用に
おけるより詳細なステップを図11及び図12にそれぞれ示す。
【0067】 追加データを埋め込むための符号化処理に戻る。前述したように、非圧縮表現
から、ディジタル電話用の高度に圧縮されたディジタル表現にデータを変換する
ために使用される3つの主要な種類のコーダー、すなわち、時間領域波形コーダ
ー、周波数領域波形コーダー、及びボコーダーがある。
【0068】 図10の各ステップにおいて、音声信号は、音声サンプルのディジタル化(こ
のように表記されている)、隣接するサンプルの差違の計算、及び、そのような
サンプルの差違のサブセットの選択、を施されるものして示されている。これは
、変換追加データビットストリームから次に選択された符号化と組み合わせられ
て、適応量子化を使用してそのようなビットを埋め込む。この例では、埋め込ま
れたデータを有するADPCM圧縮音声が生成される。
【0069】 このような時間領域波形コーダーは、ソースに依存して、会話信号の時間波形
を再現することを試み、従って、種々の信号を符号化することができる。これら
のタイプのコーダーの例として、上述した、パルスコード変調(PCM)、差動パ
ルスコード変調(DPCM)、適応差分パルス符号変調(ADPCM)、デルタ変調(DM
)、連続可変スロープデルタ変調(CVSDM)、及び適応予測符号化(APC)がある
。全ての時間領域コーダーは、波形の量子化表現を構成する。
【0070】 図10のADPCMコーダーは、PACS(パーソナルアクセスコミュニケーションシ
ステム)第3世代PCMシステム、パーソナルハンディフォンシステムようなシス
テム、及び、32kbpsのビットレートにおいてCT2及びDECTコードレス電話シス
テムで広く使用されている。このタイプの代表的なシステムを図10に示す。こ
のビットレートでは、システムは、オーディオストリームを8kHzでサンプリン
グし、連続する各オーディオサンプル間の適応ステップ幅の差違を表すために4
ビットを使用する。これらのオーディオサンプルの最下位ビットに6サンプルあ
たり1ビットの割合(レート)でデータを埋め込むことによって、1300ビット/
秒、すなわち、10kバイト/分のレートでデータを埋め込むことができる。
【0071】 周波数領域波形コーダーは、信号を、別々に量子化され符号化された1組の周
波数成分に分割する。
【0072】 図11の周波数領域符号化は、音声をサブバンド符号化圧縮してデータを埋め
込む処理に関する。この場合、ディジタル化された音声サンプルはサブバンドに
フィルタリングされ、サブバンドデータ(ビットレートは個々のサブバンドに依
存する)のサブセットが、変換された追加データビットストリームにおいて符号
化される次のビットを適切に埋め込むために選択される。
【0073】 例えば、CD-900セルラー電話システムは、サブバンド符号化として既知のタイ
プの周波数領域波形コーダーを使用する。図11に示すような、8.3kbpsのビッ
トレートを有する代表的なサブバンド符号化システムを考える。このシステムは
、オーディオを次の4つのサブバンドに分割する。すなわち、450サンプル/秒
で4ビットを使用してそれらの周波数範囲225〜450Hzを符号化するもの
、450〜900Hzについて900サンプル/秒で3ビットを使用するもの、1
000〜1500Hzについて1000サンプル/秒で2ビットを使用するもの、1
800〜2700Hzについて1800サンプル/秒で1ビットを使用するものであ
る。信号の各周波数範囲が個別に符号化されるので、各範囲において異なるビッ
トレートでデータを埋め込むことができる。最も低い範囲において4サンプルに
つき1ビットでデータを埋め込み、次に、8サンプルにつき1ビットを、12サ
ンプルにつき1ビットを、そして、最も高い範囲において16サンプルにつき1
ビットをそれぞれ埋め込むことによって、420ビット/秒のレート、すなわち、3
.1kバイト/分のレートでデータを埋め込むことができる。
【0074】 追加データの埋め込みのためにボコーディング(ボコーダーを用いた処理)を
使用するVSELPの例示的な例についての同様な手順を図12に示す。この場合は
、知覚的な重要度に基づいて係数のサブセットを選択する前に、ディジタル化さ
れた音声サンプルをRTE-LTP関数によって解析し、その後、RTE-LTP係数の量子化
において送信されたデータビットストリームの次のビットの埋め込みを実行する
【0075】 ボコーダーは、符号化される信号、典型的には音声に関する広範囲の知識に基
づいており、信号に固有である。例えば、GSMにおいて、ベクトル和励起線形予
測(Vector Sum Excited Linear Predictive :VSELP)コーダーは、1秒間に5
0の会話フレームを出力する。これらの会話フレームは、RPE-LTP(規則的パル
ス励起長期予測:regular pulse excited longer-term prediction)関数に対す
る1組の係数パラメータから構成される。これらの係数は次に量子化され260ビ
ット中に符号化される。暫定欧州電気通信標準(Interim European Telecommuni
cation Standard, IETS 300 036)の付属書2「European digital cellular tel
ecommunications system (phase 1): Full-rate speech transcoding,」によれ
ば、主観的なテストが、これらの260ビットのうちのどれが最も知覚上重要であ
るかを判定するために実施されている。69の最も知覚上重要でないビットは全て
、フレームの最後の78ビットである、ビットの「クラスII」の部分に含まれる。
【0076】 図12に示す埋め込み処理には、4つの係数当たり1データビットの埋め込み
レートで、これらの69ビットにデータを埋め込むことが含まれる。1フレーム当
たり17の追加データビットを埋め込むことができる。これは、13kbpsで伝送さ
れるメディアストリームにおいて、850ビット/秒のレートである。これは、1
分当たり6.2kのピクチャ(画像)を送信するのと等価である。
【0077】 ディジタル電話信号は妨害及びフェージングを被る。ディジタル電話信号を強
化し、および、頑強度(ロバスト性)、エラー検出、及びエラー訂正を行うため
に任意の一般的な技術を使用することができる。そのような技術には、パリティ
ビット、ハミング符号やリードソロモン符号のようなブロック符号(block code
)、及び、畳み込み符号がある。さらに、データの再送、及び、データの時間遅
延バージョンのインターリービングにより、ロバスト性を改善することができる
【0078】 (例えばTCP/IPに基づいて)配信を保証するためのプロトコル、またはWAPな
どを生成するために他の技法が使用される。これは、双方向データ接続を確立す
るために、前述した2方向データ埋め込み技法を使用する。このような技法は、
一般に、ストリームに埋め込むことが可能なデータ量が低減するものであるが、
ディジタルデータ及び実行可能プログラムをエラーなしに伝送しなければならな
い場合には不可欠である。
【0079】 当業者には他の変形態様も想起されることであろう。そのような変形態様は、
特許請求の範囲において規定された本発明の思想及び範囲内のものと考えられる
【図面の簡単な説明】
【図1】 本発明のセルラーフォンネットワークシステムでの使用に適合された本出願人
による係属中の先行特許出願第09/389,941号に開示した好適なデータ符号化処理
及びシステムの概要を示すブロック及びフロー図である。
【図2】 送受話器のユーザ及び/または中央ステーションによって受信される、図1の
追加データと共に埋め込まれる圧縮された音声信号の好適な復号化処理の概要を
示す図1と類似の図である。
【図3】 上述した(及び後述する)符号化処理におけるステガノグラフィー技術の使用
を示す図1と類似の図である。
【図4】 本発明に有用な係数領域パリティ符号化処理において使用するための、音声信
号の例示的な信号波形、及び、音声信号のフーリエ変換に基づく、圧縮された係
数ベースの表現を示す。
【図5】 本発明のセルラーネットワークアプリケーションに特に対処する幾分詳細なブ
ロック図及びフロー図であり、ユーザから全てのシステムへの、及び、セルシス
テムから送受話器のユーザへの送信に先立って、圧縮されていない表現から高度
に圧縮されたディジタル表現に音声信号が変換されるポイントにおいて、追加の
データをディジタル音声信号に埋め込む単一の処理ステップを示す。
【図6】 図5と類似の図であるが、中央ディジタル化ポイントにおけるデータの埋め込
みに関する処理を示す。
【図7】 図5と類似の図であるが、ユーザのセルフォン(セル電話器)におけるデータ
の埋め込みに関する処理を示す。
【図8】 既に圧縮された信号へのデータの埋め込み処理に関する図である。
【図9】 圧縮された信号からの埋め込まれたデータの抽出に関する図である。
【図10】 時間領域波形符号化を使用したデータの埋め込みを示す図である。
【図11】 周波数領域波形符号化を使用したデータの埋め込みを示す図である。
【図12】 ボコーダー符号化を使用したデータの埋め込みを示す図である。
【図13】 送受話器に表示される例示的な追加の画面広告を示す。
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE,TR),OA(BF ,BJ,CF,CG,CI,CM,GA,GN,GW, ML,MR,NE,SN,TD,TG),AP(GH,G M,KE,LS,MW,MZ,SD,SL,SZ,TZ ,UG,ZW),EA(AM,AZ,BY,KG,KZ, MD,RU,TJ,TM),AE,AG,AL,AM, AT,AU,AZ,BA,BB,BG,BR,BY,B Z,CA,CH,CN,CR,CU,CZ,DE,DK ,DM,DZ,EE,ES,FI,GB,GD,GE, GH,GM,HR,HU,ID,IL,IN,IS,J P,KE,KG,KP,KR,KZ,LC,LK,LR ,LS,LT,LU,LV,MA,MD,MG,MK, MN,MW,MX,MZ,NO,NZ,PL,PT,R O,RU,SD,SE,SG,SI,SK,SL,TJ ,TM,TR,TT,TZ,UA,UG,UZ,VN, YU,ZA,ZW (72)発明者 メイヤー,ジョスリン,モーザ アメリカ合衆国カリフォルニア州92024, インシニタス,101,サウス・コースト・ ハイウェイ・315 Fターム(参考) 5J064 AA02 BA16 BB03 BB08 BB13 BD02 5K101 KK16 KK18 LL12 SS00

Claims (38)

    【特許請求の範囲】
  1. 【請求項1】 中央ステーションを介してシステム内で相互接続されたユーザの音声送受話器
    により、そのシステム内で送受信されるディジタル電話信号に、ディジタル電話
    信号の下位互換性に影響を与えることなく、追加データを埋め込む方法において
    、 中央ステーションまたはユーザの送受話器において、音声信号に符号化変換を
    適用して浮動小数点係数を生成することにより、音声信号を、該音声信号の中間
    表現に変換するステップであって、この係数表現を最終的に圧縮された離散ディ
    ジタル信号に変換するために必要な量子化及びトランケーションステップを実行
    することなく行われるステップと、 各々が追加データのビットを含むことになる、変換された音声信号の所定の部
    分を選択するステップと、 前記係数を変更する係数領域パリティ符号化技法によって量子化及びトランケ
    ーションを実施し、これによって、生じた量子化されトランケーションを施され
    たディジタル信号の圧縮バージョンが、埋め込まれた追加データを含むようにす
    ることからなる、ステップと、 中央ステーションからユーザの送受話器へ、または、ユーザの送受話器から中
    央ステーションへと、通常のディジタル電話信号の様式で、そのような圧縮され
    た追加信号を送信するステップ を含む、方法。
  2. 【請求項2】 前記送信された信号を受信するシステムの所望のポイントにおいて、そこでの
    音声ディジタル信号の受信に影響を与えることなく、埋め込まれた追加データを
    、前記送信された信号から取り出す、請求項1の方法。
  3. 【請求項3】 受信側の所望のポイントがユーザの送受話器であり、音声信号の通信に影響を
    与えることなく、前記追加データを、所定のフォーマットで送受話器において取
    り出し、表示し、実行し、記憶し、または、送受話器で別様に処理する、請求項
    2の方法。
  4. 【請求項4】 前記追加データが中央ステーションサーバーにおいて埋め込まれ、前記追加デ
    ータが、ユーザが送受話器を使用している間に更新可能な個別に対象とされる1
    つ以上の広告画像、市場を限定した広告、電子商取引アプリケーション、世論調
    査、ゲームまたはフォームなどの対話型のコンピュータプログラム、天候、ニュ
    ース、ページャメッセージのような追加の文字またはオーディオコンテンツ、翻
    訳及びサービスの更新、音楽及び他の娯楽コンテンツ、通話中着信音楽及びメッ
    セージ、インターネットコンテンツの2方向送信のためのワイヤレスアプリケー
    ションプロトコルの中から選択される、請求項2の方法。
  5. 【請求項5】 前記追加データが、ユーザの送受話器において埋め込まれ、前記追加データが
    、データバックチャンネルにおける1つ以上のタイプされた、または、キー入力
    された応答、GPS位置データ、静止画像、ビデオまたはオーディオチャンネル、
    及びワイヤレスアプリケーションプロトコルの中から選択される請求項2の方法
  6. 【請求項6】 前記システムが、無線セルラーフォンシステムであり、前記追加データを埋め
    込むための符号化するポイントが、中央ステーションが、セルラーフォンシステ
    ム移動交換センターのような交換電話ネットワークから音声信号を受け取る箇所
    である、請求項2の方法。
  7. 【請求項7】 前記システムが、無線セルラーフォンシステムであり、追加データを埋め込む
    ための符号化するポイントが、セルラーフォンが、ユーザの音声をセルラーフォ
    ンシステムに送信するために変換する箇所である。請求項2の方法。
  8. 【請求項8】 前記符号化変換が、周波数領域波形符号化、時間領域波形符号化、ボコーディ
    ングのうちの1つによって実行される、請求項2の方法。
  9. 【請求項9】 前記係数が、フーリエ変換、コサイン変換、サイン変換、ウェーブレット変換
    から成るグループから選択された離散変換によって用意される、請求項2の方法
  10. 【請求項10】 前記埋め込みステップが、選択された係数の最下位ビットを使用する、請求項
    2の方法。
  11. 【請求項11】 前記選択された係数が、一定のインターバルで選択される、請求項10の方法
  12. 【請求項12】 前記係数が、周波数係数と位相係数のうちの1つ、または、それらの両方とし
    て選択される、請求項10の方法。
  13. 【請求項13】 データの単一のビットが、前記係数のグループの最下位ビットのパリティを計
    算することによって埋め込まれる、請求項10の方法。
  14. 【請求項14】 前記係数のグループのうちのどれをデータ埋め込みによって変更するかを選択
    するために、知覚符号化技法を使用する、請求項13の方法。
  15. 【請求項15】 音声信号の受信についてのユーザの知覚に対する影響を最小化しつつ、前記係
    数のグループの最下位ビットの前記パリティによってデータのビットを埋め込む
    、請求項14の方法。
  16. 【請求項16】 ステガノグラフィー符号化を利用する請求項2の方法であって、データをビッ
    トストリームに変換し、追加データビットの挿入及び埋め込みによって与えられ
    る、ユーザの知覚への影響が、音声信号の受信の間最小になるように、前記部分
    を選択する、方法。
  17. 【請求項17】 前記挿入及び埋め込みが、選択された係数の最下位ビットにおいて実施される
    、請求項16の方法。
  18. 【請求項18】 ステガノグラフィー符号化を使用する請求項2の方法であって、データをビッ
    トストリームに変換し、音声信号情報内の周波数範囲を含むように係数の組を選
    択し、ビットストリーム内の各ビットについて、選択された係数と符号化される
    次のビットを結合して、前記係数を再スケーリングし、及び埋め込むビットを符
    号化する、方法。
  19. 【請求項19】 中央ステーションを介してシステム内で相互接続されたユーザの音声送受話器
    により、そのシステム内で送受信されるディジタル電話信号に、ディジタル電話
    信号の下位互換性に実質的に影響を与えることなく、追加データを埋め込む方法
    において、 中央ステーションまたはユーザの送受話器において、音声信号に符号化変換を
    適用して浮動小数点係数を生成することにより、音声信号を、該音声信号の中間
    表現に変換するステップと、 この係数表現を最終的に圧縮された離散ディジタル信号に変換するために必要
    な量子化及びトランケーションステップを実行するステップと、 追加データのビットを含むことになる、変換され圧縮された音声信号の1つま
    たは複数の所定の部分を選択するステップと、 前記ディジタル信号の圧縮されたバージョンが埋め込まれた追加データを含む
    ように、前記係数を変更するステップと、 中央ステーションからユーザの送受話器へ、または、ユーザの送受話器から中
    央ステーションへと、通常のディジタル電話信号の様式で、そのような圧縮され
    た追加信号を送信するステップ を含む、方法。
  20. 【請求項20】 前記埋め込まれた追加データを、前記送信された信号を受信するシステムの所
    望のポイントにおいて、音声ディジタル信号の受信に影響を与えることなく、前
    記送信された信号から抽出する、請求項19の方法。
  21. 【請求項21】 ディジタル電話信号の下位互換性に影響を与えることなく、ディジタル音声電
    話信号に追加のディジタルデータを埋め込む方法であって、 ディジタル音声電話信号を、該信号の周波数領域の係数表現または他の変換の
    係数表現の符号化された組に変換するステップと、 各々が追加データのビットを含むことになる、所定の係数部分を選択するステ
    ップと、 埋め込まれた追加データを含む圧縮されたディジタル音声信号を送信するため
    に、前記音声信号を圧縮する一方で、前記選択された部分にビットを埋め込んで
    、ユーザが、送信された音声信号を受け取りながら、前記追加データを復号化し
    て抽出できるようにするステップ を含む、方法。
  22. 【請求項22】 中央ステーションを介して相互接続されたユーザの音声送受話器により、ネッ
    トワーク内で送受信されるディジタル電話信号に、ディジタル電話信号の下位互
    換性に影響を与えることなく、追加データを埋め込むためのシステムにおいて、 中央ステーションまたはユーザの送受話器において、音声信号に符号化変換を
    適用して浮動小数点係数を生成することにより、音声信号を、該音声信号の中間
    表現に変換するための符号化手段であって、この係数表現を最終的に圧縮された
    離散ディジタル信号に変換するために必要な量子化及びトランケーションを実行
    することなく行う、符号化手段と、 各々が追加データのビットを含むことになる、変換された音声信号の所定の部
    分を選択するための手段と、 前記係数を変更する係数領域パリティ符号化技法によって量子化及びトランケ
    ーションを実施し、これによって、生じた量子化されトランケーションを施され
    たディジタル信号の圧縮バージョンが埋め込まれた追加データを含むようにする
    ための他の符号化手段と、 中央ステーションからユーザの送受話器へ、または、ユーザの送受話器から中
    央ステーションへと、通常のディジタル電話信号の様式で、そのような圧縮され
    た追加信号を送信するための手段 を備える、システム。
  23. 【請求項23】 前記送信された信号を受信するシステムの所望のポイントにおいて、そこにお
    ける音声ディジタル信号の受信に影響を与えることなく、埋め込まれた追加デー
    タを取り出すための手段を備える、請求項22のシステム。
  24. 【請求項24】 受信側の所望のポイントがユーザの送受話器であり、音声信号の通信に影響を
    与えることなく、前記追加データを、所定のフォーマットでその送受話器におい
    て取り出し、表示し、実行し、記憶し、または、送受話器で別様に処理する、請
    求項23のシステム。
  25. 【請求項25】 追加のディジタルデータをディジタル音声電話信号に埋め込むためのシステム
    であって、 音声信号情報を、前記音声信号の周波数領域の係数表現または他の変換の係数
    表現の組に変換するための符号化手段と、 各々が追加データのビットを含むことになる、所定の係数部分を選択するため
    の手段と、 そのような選択された係数部分の各々において追加のディジタルデータのビッ
    トを埋め込んで、そのような埋め込まれたデータを含む追加の圧縮音声信号を生
    成し、これによって、ユーザが、音声信号と埋め込まれた追加データの両方を、
    システムの所望のポイントでデコードし、個別に抽出できるようにするための他
    の符号化及び圧縮手段 を備える、システム。
  26. 【請求項26】 前記音声信号が、ユーザの送受話器においてユーザによってリアルタイムで生
    成される、請求項25のシステム。
  27. 【請求項27】 前記音声信号が事前に記録される、請求項25のシステム。
  28. 【請求項28】 前記最初に記載した符号化手段が、フーリエ変換、コサイン変換、サイン変換
    及びウェーブレット変換のうちの1つによって前記係数を用意する、請求項25
    のシステム。
  29. 【請求項29】 動作時、前記他の符号化手段が、前記選択された係数の最下位ビットを使用す
    る、請求項25のシステム。
  30. 【請求項30】 前記選択された係数が、一定のインターバルで選択される、請求項29のシス
    テム。
  31. 【請求項31】 前記係数が、周波数係数と位相係数の1つまたは両方について選択される、請
    求項29のシステム。
  32. 【請求項32】 前記他の符号化手段が、前記係数のグループの最下位ビットのパリティを計算
    することによってデータの単一ビットを埋め込む、請求項29のシステム。
  33. 【請求項33】 前記係数のグループのうちのどれをデータ埋め込みによって変更するかを選択
    するために、知覚符号化技法を使用する、請求項32のシステム。
  34. 【請求項34】 前記他の符号化手段が、音声信号の再生についてのユーザの知覚に対する影響
    を最小化しつつ、前記係数のグループの最下位ビットの前記パリティに応答して
    、データのビットを埋め込む、請求項33のシステム。
  35. 【請求項35】 前記抽出によって、送受話器の下位互換性が保持される、請求項25のシステ
    ム。
  36. 【請求項36】 前記追加データが中央ステーションサーバーにおいて埋め込まれ、前記追加デ
    ータが、ユーザが送受話器を使用している間に更新可能な個別に対象とされる1
    つ以上の広告画像、市場を限定した広告、電子商取引アプリケーション、世論調
    査、ゲームまたはフォームなどの対話型のコンピュータプログラム、天候、ニュ
    ース、ページャメッセージ、翻訳及びサービスの更新のような追加の文字または
    オーディオコンテンツ、音楽及び他の娯楽コンテンツ、通話中着信音楽及びメッ
    セージ、インターネットコンテンツの2方向送信のためのワイヤレスアプリケー
    ションプロトコルの中から選択される、請求項23のシステム。
  37. 【請求項37】 前記追加データが、ユーザの送受話器において埋め込まれ、前記追加データが
    、データバックチャンネルにおける1つ以上のタイプされた、または、キー入力
    された応答、GPS位置データ、静止画像、ビデオまたはオーディオチャンネル、
    及びワイヤレスアプリケーションプロトコル、から選択される請求項23のシス
    テム。
  38. 【請求項38】 前記システムが2方向電話ネットワーク接続を提供し、その一方で、送受話器
    が音声のみのネットワーク上で使用される、請求項22のシステム。
JP2001565577A 2000-03-06 2001-02-12 ディジタル電話信号へのデータの埋め込み Pending JP2003526274A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US51887500A 2000-03-06 2000-03-06
US09/518,875 2000-03-06
PCT/IB2001/000172 WO2001067671A2 (en) 2000-03-06 2001-02-12 Data embedding in digital telephone signals

Publications (1)

Publication Number Publication Date
JP2003526274A true JP2003526274A (ja) 2003-09-02

Family

ID=24065858

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001565577A Pending JP2003526274A (ja) 2000-03-06 2001-02-12 ディジタル電話信号へのデータの埋め込み

Country Status (6)

Country Link
EP (1) EP1264437A2 (ja)
JP (1) JP2003526274A (ja)
AU (1) AU2875501A (ja)
CA (1) CA2400947A1 (ja)
TW (1) TW546939B (ja)
WO (1) WO2001067671A2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005049794A (ja) * 2003-07-31 2005-02-24 Fujitsu Ltd データ埋め込み装置及びデータ抽出装置
WO2008111230A1 (ja) * 2007-03-15 2008-09-18 Fujitsu Limited センシング装置、センサ情報取得装置、センシング方法及びリモートセンシング方法
JP2014519215A (ja) * 2011-04-22 2014-08-07 トムソン ライセンシング データをロッシー圧縮符号化する方法および装置、および、データを再構築する対応する方法および装置

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6795698B1 (en) * 2000-04-12 2004-09-21 Northrop Grumman Corporation Method and apparatus for embedding global positioning system (GPS) data in mobile telephone call data
TW521935U (en) * 2001-11-09 2003-02-21 Sin Etke Technology Co Ltd Communication device for use in a car
US20030158730A1 (en) * 2002-02-04 2003-08-21 Yasuji Ota Method and apparatus for embedding data in and extracting data from voice code
JP4330346B2 (ja) * 2002-02-04 2009-09-16 富士通株式会社 音声符号に対するデータ埋め込み/抽出方法および装置並びにシステム
US7310596B2 (en) 2002-02-04 2007-12-18 Fujitsu Limited Method and system for embedding and extracting data from encoded voice code
GB0203834D0 (en) * 2002-02-19 2002-04-03 Univ Surrey Data transmission
EP1542422B1 (en) * 2002-10-25 2014-10-29 Fujitsu Limited Two-way communication system, communication instrument, and communication control method
US7949016B2 (en) 2002-10-25 2011-05-24 Fujitsu Limited Interactive communication system, communication equipment and communication control method
EP1455509A3 (de) * 2003-03-03 2005-01-05 FREQUENTIS GmbH Verfahren und Anordnung zur Sprachaufzeichnung
BRPI0411667A (pt) * 2003-06-25 2006-08-08 Thomson Licensing método e aparelho de decodificação para detecção de marcas d'água em um fluxo de bits de vìdeo compactado
KR100565682B1 (ko) 2004-07-12 2006-03-29 엘지전자 주식회사 이동통신 단말기를 이용한 통화중 디지털 데이터 전송방법및 전송장치
DE102009022606A1 (de) 2009-05-26 2010-12-02 Siemens Aktiengesellschaft Verfahren und Vorrichtung zur steganographischen Modifikation eines Bitstroms
US8930182B2 (en) * 2011-03-17 2015-01-06 International Business Machines Corporation Voice transformation with encoded information
GB2524424B (en) * 2011-10-24 2016-04-27 Graham Craven Peter Lossless buried data
US11699147B2 (en) * 2020-09-23 2023-07-11 SOURCE Ltd. System and method of performing secured transactions in a communication network

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5768426A (en) * 1993-11-18 1998-06-16 Digimarc Corporation Graphics processing system employing embedded code signals
US5687191A (en) * 1995-12-06 1997-11-11 Solana Technology Development Corporation Post-compression hidden data transport
US6748362B1 (en) * 1999-09-03 2004-06-08 Thomas W. Meyer Process, system, and apparatus for embedding data in compressed audio, image video and other media files and the like

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005049794A (ja) * 2003-07-31 2005-02-24 Fujitsu Ltd データ埋め込み装置及びデータ抽出装置
JP4527369B2 (ja) * 2003-07-31 2010-08-18 富士通株式会社 データ埋め込み装置及びデータ抽出装置
US7974846B2 (en) 2003-07-31 2011-07-05 Fujitsu Limited Data embedding device and data extraction device
US8340973B2 (en) 2003-07-31 2012-12-25 Fujitsu Limited Data embedding device and data extraction device
WO2008111230A1 (ja) * 2007-03-15 2008-09-18 Fujitsu Limited センシング装置、センサ情報取得装置、センシング方法及びリモートセンシング方法
JPWO2008111230A1 (ja) * 2007-03-15 2010-06-24 富士通株式会社 センシング装置、センサ情報取得装置、センシング方法及びリモートセンシング方法
US8558691B2 (en) 2007-03-15 2013-10-15 Fujitsu Limited Sensing apparatus, sensor information gathering apparatus, sensing method, and remote sensing method
JP5378201B2 (ja) * 2007-03-15 2013-12-25 富士通株式会社 センシング装置、センサ情報取得装置、センシング方法及びリモートセンシング方法
JP2014519215A (ja) * 2011-04-22 2014-08-07 トムソン ライセンシング データをロッシー圧縮符号化する方法および装置、および、データを再構築する対応する方法および装置
US9288453B2 (en) 2011-04-22 2016-03-15 Thomson Licensing Method and device for lossy encoding data and corresponding device for reconstructing data

Also Published As

Publication number Publication date
WO2001067671A3 (en) 2002-01-17
CA2400947A1 (en) 2001-09-13
EP1264437A2 (en) 2002-12-11
WO2001067671A2 (en) 2001-09-13
TW546939B (en) 2003-08-11
AU2875501A (en) 2001-09-17

Similar Documents

Publication Publication Date Title
JP2003526274A (ja) ディジタル電話信号へのデータの埋め込み
US6768980B1 (en) Method of and apparatus for high-bandwidth steganographic embedding of data in a series of digital signals or measurements such as taken from analog data streams or subsampled and/or transformed digital data
US8694665B2 (en) System and method for embedding supplementary data into digital media files
RU2282888C2 (ru) Система и способ для обмена сигналами аудиовизуальной информации
CA2444151C (en) Method and apparatus for transmitting an audio stream having additional payload in a hidden sub-channel
Qiao et al. Noninvertible watermarking methods for mpeg-encoded audio
CA2554757A1 (en) Systems and methods for providing digital content and caller alerts to wireless network-enabled devices
US20100020827A1 (en) Signal processing system, signal processing apparatus and method, recording medium, and program
AU2002334720A1 (en) System and method for communicating media signals
EP1332470B1 (en) Steganographic embedding of data in digital signals
EP1969843A2 (en) System and method for delivery of content to mobile devices
JP2010508776A (ja) 複数の無線通信機器間でメディアファイルを通信するための方法及び装置
CN101807402A (zh) 一种在广播信号中嵌入文字信息的方法
WO2005112269A1 (en) A system and method for lossless audio encoding and decoding
CN111199745A (zh) 广告识别方法、设备、媒体平台、终端、服务器、介质
US7149592B2 (en) Linking internet documents with compressed audio files
CN101207500A (zh) 一种音频数据变音方法
JP4293115B2 (ja) ダウンロードされた音楽コンテンツを再生又は記録する方法、端末及びプログラム
JP2010141624A (ja) データ放送送信装置
KR20000050118A (ko) 컴퓨터 통신망을 이용하여 복합 메시지를 송수신하는 방법및 그 장치
US20040015361A1 (en) Encoding media data for decompression at remote computers employing automatic decoding options
JP2003502756A (ja) コンピュータ通信網を介して視聴覚メッセージを送受信する方法及びシステム
KR20020024719A (ko) 네트워크를 통한 객체 상호작용을 이용한 멀티미디어 광고시스템 및 광고 방법
JP2001268240A (ja) 情報配信システム
CN1395799A (zh) 接收编码信息