JPH05501166A - 信号認識システムと方法 - Google Patents

信号認識システムと方法

Info

Publication number
JPH05501166A
JPH05501166A JP3508688A JP50868891A JPH05501166A JP H05501166 A JPH05501166 A JP H05501166A JP 3508688 A JP3508688 A JP 3508688A JP 50868891 A JP50868891 A JP 50868891A JP H05501166 A JPH05501166 A JP H05501166A
Authority
JP
Japan
Prior art keywords
signal
value
quantization
values
feature vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3508688A
Other languages
English (en)
Other versions
JP3130926B2 (ja
Inventor
ケンヨン,ステフェン シー.
Original Assignee
ブロードキャスト データ システムズ リミテッド パートナーシップ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ブロードキャスト データ システムズ リミテッド パートナーシップ filed Critical ブロードキャスト データ システムズ リミテッド パートナーシップ
Publication of JPH05501166A publication Critical patent/JPH05501166A/ja
Application granted granted Critical
Publication of JP3130926B2 publication Critical patent/JP3130926B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/0033Recording/reproducing or transmission of music for electrophonic musical instruments
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/121Musical libraries, i.e. musical databases indexed by musical parameters, wavetables, indexing schemes using musical parameters, musical rule bases or knowledge bases, e.g. for automatic composing methods
    • G10H2240/131Library retrieval, i.e. searching a database or selecting a specific musical piece, segment, pattern, rule or parameter set
    • G10H2240/141Library retrieval matching, i.e. any of the steps of matching an inputted segment or phrase with musical database contents, e.g. query by humming, singing or playing; the steps may include, e.g. musical analysis of the input, musical feature extraction, query formulation, or details of the retrieval process

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Image Analysis (AREA)
  • Geophysics And Detection Of Objects (AREA)
  • Complex Calculations (AREA)
  • Radar Systems Or Details Thereof (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】 信号認識システムと方法 11立1遣 本発明は、信号を認識するための装置と方法、特に特徴ベクトルを生々するべく サンプリングされた信号値の統計的モーメントを用いることにより信号を認識す るための装置及び方法、ならびにその信号を予め定められた信号データベースと 比較し信号データベースを誘導するための特徴ベクトルの量子化に関する。
本発明は音楽といった放送信号を認識するためのシステムに関して以下に記述す るが、この利用分野の教示は。
信号!!*の分野における広範な領域に対して適用可能であることを理解された い。
放送信号の正確な認識は、マーケティングの管理者、ロイヤルテイ集金会社、音 楽プロモータなどにとって重要なことである。さまざまな法tIL、&I済およ び社会的事業が放送情報の定期的監視を必要としているということは周知の事実 である。このような必要条件は全てどんな情報がいつ放送されるかといった成る 種の情報に対して共通のニーズを共有している。先行技術においては、放送局は 、放送番組を物理的に監視しどの情報が何時放送されたかを手で作表する複数の 聴取者によって手作業で監視された。信頼性とコストの問題によって、自動化さ れた放送信号認識システムを実現する方向に向けての努力が刺激された。最初の 自動化された方法としては、各々の歌の中の独自のキュー信号をコード化し次に このキュー信号を検出すべく各放送局を監視するというものがあった。しかしな がら、付随するコード化及び復号用回路は高価でかつI[Ilなものであり、政 府の取締り機関は、独自のキュー信号を大量に提供するのに必要な付加的な帯域 幅を提供することに反対である。
自動化された放送信号認識の分野におけるもう1つの進歩はムーン(Moon) 他による米国特許j[3,919,479号に開示されている。Moon他にお いては、基準ライブラリ内に記憶される基準信号セグメントを提供すべく1つの 可聴信号がデジタル式にサンプリングされる。次にこの可聴信号が放送されると 、その連続する部分がデジタル化されライブラリ内の基準セグメントと比較され る。この比較は、相関関数信号を生成する相関プロセスにおいて行なわれる。基 憔及び放送信号セグメントが同一でない場合、比較的小さな振幅の相関関数が結 果として得られる。一方基準及び放送信号セグメントが比較的同一である場合、 大きな相関関数が生成される。
相関関数信号の振幅は、この振幅が予め定められたWA値レベルを超えた時点で 認識信号を与えるべく検知される。
しかしながらM o o n他の単一セグメント相関システムは、システムを全 て無効化しろる信号のドロップアウトを受ける。同様にM o o n他のシス テムは比較的、放送情報自体の時間軸変動を受けやすい0例えば、数多くのディ スクジョツキ−が駆動機構のスピードアップによって放送歌を「圧縮」している ということが知られて0る。同様に、その他のディスクジョツキ−が聴衆の中で 成る種の望ましい効果を生み出すため放送情報を定期的に「圧縮」及び/又は「 引伸ばし」していることも知られている。M o o n他は、放送信号をエン ベロープ検出し著しく低い好ましくは可視下の周波数信号成分をもつエンベロー プ信号を提供することによって放送信号の帯域幅を減少させることによりこのよ うな時間軸変動を克服しようとしている。可聴下周波数でのエンベロープ信号が 相関プロセス中に用いられる場合、デジタルサンプリングを受けた波形は時間軸 変動に対する感度がさらに低いということがわかっている。しかしながら、この ような解決法によって達成されうる改良はきわめて制限されたものであり、少量 の「圧縮」又は[引伸ばし」を受けた放送信号に対してのみ有効となる。さらに このような解決法は高いフォールスアラーム率を受ける。これらの欠点から、M  o o n他のシステムは、高速で精確かつ低価格の自動放送信号認識システ ムにとっては望ましく為ものではない。
自動信号ff、 Im分野におけるもう1つの進歩は、ケニイオン(Ker+y on)他による米国特許j!4,450.531号に開示されている。同じKe nyon氏は、当該出願の単独発明者であり、 1531号特許の教示はこの出 願に参考として内含される。 1531号特許のシステムは、単一セグメント相 関システムの信頼性の問題及び先行技術によるシステムがもつ時間軸変動の問題 にうまく対処している。 1531号特許においては、複数の基準信号セグメン トが、プログラム里位(歌)から抽出され、デジタル化され、フーリエ変換され 、周波数領域複合スペクトルの中の1基準ライブラリ内に記憶される。受けとら れた放送信号は次に、識別のための安定した特性をもつ音声スペクトルの周波数 部分を選定するべく予めろ過される。さらなるろ過及びデジタル信号への変換の 後、放送信号はフーリエ変換され、ベクトル積を得るべく基準信号セグメントと の虚数乗法プロセスを受ける。虚数乗法プロセスの結果は次に逆フーリエ変換段 階に付され、周波数から時間領域へと変換された相関関数を得る。この相関関数 は次に正規化され、各セグメントに対する相関ピークが選定され、ピーク間隔は セグメント長と比較される。同時に、相関ピークセグメントと一致するセグメン トのRMS電力は、セグメントの動力点パターンを決定すべく検知される。従っ て、 ″531号特許は、複数の相関セグメントを提供し相関ピークの間の距離 を測定することにより、虫−セグメント相関システムの欠点を克服する。距離が 符号する場合、放送信号は基信ライブラリ内に記憶されている信号セグメントと 類似するものであるとして宣言される。さらに、RMS値比較は。
信号セグメントを用いて行なわれた分類を確認するように機能する。
時間軸変動の問題を克服するために、 1531号特許は放送情報のためのエン ベロープ検出器及び帯域フィルタを使用している。しかしながら 1531号特 許に従ったシステムは、計算上きわめて要求条件の多いものである。例えば、さ まざまな多重セグメントの相関を行なうためには、多大なコンピュータ出方が必 要である。多数のセグメントがサンプリングされることから、 +531号特許 に従ったシステムは、時間を多くとり、又高価で強力なコンピュータの使用を必 要とする可能性がある。
音声パターン総員に対する自動化されたアプローチは、す:+z(Sakoe) による米国特許第4. 282. 403号において開示されている。5ako eは、パターン特徴ベクトルの時間シーケンス入力が基準ライブラリ内に六カさ れる、1つの音声認識システムを開示している。受けとら九た音声信号は次−二 、そ九ぞれのサンプリング例における音冑音の特徴を表わすベクトルの時間シー ケンスの形に変換されるように、スペクトル解析、サンプリング及びデジタル化 を受ける。数本のチャンネルの特賞ベクトルの使用により各々の基憔パターンに ついて1つの時間ねし孔関数を使用することが可能である。
各々の基準パターン特徴ベクトルのための時間ねじれ関数は、入カバターン特徴 ベクトルと基準パターン特徴ベクトルを相関するために用いられる。入力パター ン特徴ベクトルシーケンスは次に1g!i′さ九た言葉を識別する目的で、タイ ムワービング関数を基準にして、基準パターン特徴ベクトルシーケンスと比較さ れる。しかしながら5akoeのシステムは、入力信号ではなく基準パターンの 時間をねじり、従って、各基準パターンについて複数のパターンが計算されかく してシステムの記憶及び計算上の需要を増大させなくてはならない。
もう1つの信号認識システムはバンク(Bunge)による米国特許第4,43 2,096号に開示されている。Bungeにおいては、音又は音声信号は電気 信号に変換され、フィルタバンク内の複数のスペクトル成分にi分される。これ らの成分は次に、信号の短時間スペクトルを生成すべく短い時間にわたり積分さ れる。信号のスペクトル成分は、短時間スペクトルが関連するパターン検出器内 で調整されたパターンに一致する場合にのみ出力信号を適用するような一定数の パターン検出器に対して適用される。各々のパターン検出器は、調整可能な閾値 の間に適用された入力が存在する場合に1つの信号を供給する2つの1III値 検出器を有している。従って、パターン検出器は、全ての閾値検出器が活化され た場合にのみ出力信号を供給する。各々の音冑音について1っのパターン検出器 が提供される。一連の音と認識する場合、出力信号をうまく生成したパターン検 出器のアドレスシリーズが記憶され、次にコンピュータに適用されて比較される 。このようなシステムが一定数のパターン検出器及び相応する強力な計算装置を 必要とすることは。
直ちにわかる。さらに、Bungeシステムは1時間軸変動に対する感度が比較 的低い低周波出力信号を提供するフィルタバンクを使用する一方で、なお時間ひ ずみの問題及び高いフォールスアラーム率を有している。
最近商品化された自動放送信号認識システムは、ケニイオン(Kenyon)他 による米国特許j14,843゜562号に開示されている。ここでもこのKe nyon氏は当該出願の単独発明者であり、 2562号特許の教示はここに参 考として内含されている、実際、 2562号特許からの特定的な教示が本明箱 書の以下部分に内含されている。 1562号特許は、より少ないプロセッサ資 源を用いた2段式(粗及びM)9票システムを記述している。 2562号特許 によると、放送信号は、帯域ろ過され、修正され、低帯域ろ過されて複数の低帯 域幅波形を提供する。波形はサンプリングされ、サンプルは1つの分光写真を生 成するのに用いられ、かかる分光写真は次に、j[1段基準ライブラリ内に記憶 された複数の基準分光写真と比較される。第1段基準分光写真は次に、生成され た分光写真に対するその類似性の順に待ち行列に作成される。次に、待ち行列に された算1段の基準分光写真に相応する複数の第2段基準パターンが、前に設定 さ九た待ち行列作成順で解析された波形の1つと相関される。第2段基準ライブ ラリ内に記憶された各々の第2段基準パターンについて1つの相関値が提供され る。
相関値が閾値を上回ることが見極められると、認識が宣言され、放送信号は、そ の相関値が閾値を上回るj!2段基準基準パターン似するものとして分類される 。 I!2段分類において用いれた解析された波形は、放送信号内の速度変動を 補償するために時間がねじられる。
2562号特許に従ったシステムは成功したものではあるが、大量の歌をl!識 する能力について幾分かIg限がある7例えば、 2562号特許に従ったシス テムは、高い信頼性で垂−チャンネル上で500曲の歌のいずれでも認識するこ とができる。このシステムは同時に5本の異なるチャンネルを監視できる、しか しながら高い信頼性で5つの同時放送された局の各々上の3000曲の歌のいず れか1つを識別できるシステムがあればそれは非常に1力ある商業的に成功する 信号認識システムとなるだろう。さらに 1562号特許に従ったシステムは、 放送さ几た歌を検出し分類するのに約64秒を必要とした。
広告といったより持続時間の短い記録の識別を可能にするためには、この時間を 28秒に減夕させることが望ましい。性能を増大させる一方で +562号特許 の望ましいコンパクトなアーキテクチャを保持することも重要である。
従って、必要とされるのは、同時にかつ高い信頼性で複数の放送チャンネル上の 大量の持合の放送信号を精確に認識し分類するための改良型システムである。シ ステムは、小型で安価でかつ操作し易いものでなくてはならない。
且ノL9」L里 本発明は、上述の目的を満たしながら同時に既知の自動放送信号認識システムの 欠点を克服するように設計されている。さらに本発明↓よ放送信号の認知だけで はなく広範な信号認識の分野にも利用できる。
本発明人は、 1つの信号が受信され複数のサンプリング点でサンプリングされ て複数の信号値を生成するような改良型信号認識方法を発見した。信号値の統計 的モーメントが、次に以下の式に従って計算される:なお式中 N:サンプリン グ点の数 n=1<n<N: X=サンプリング点におけるこの信号の信号値μ=信号値の平均 σ=信号値の砿準偏差 に=1より大きい整数 計算された統計モーメントは、複数の記憶された信号*副情報と比較され、受信 された信号は次に記憶された好ましくは受信された信号は、帯域ろ過、修正及び 低帯域ろ過されて複数の低周波数形を提供する。次にこの低周波数形は、複数の その線形組合せの形に組合せられる。各々の線形組合せは次にサンプリングされ て統計モーメントを計算するのに用いられる複数の信号値を生成する。
好ましくは、各々の線形組合せのサンプリングされた値について、2つの統計モ ーメント[スキュー(歪)及びとがり]が計算される。次に、複数の特徴ベクト ルを誘導することができ、各々の特徴ベクトルは、予め定められたサンプリング 時間内で全ての線形組合せのためのスキュー及びとがり値を含んでいる。
次に、各々の特徴ベクトルは、干め定められた量子化パターンに従って里−の整 数でスキュー及びとがりの浮動小数点を置換することによって量子化されうる。
量子化の後、量子化されたベクトルの加重和は非十進基数を用いて計算できる。
加重和の値はその後、アドレスに従って信号識別情報を記憶するデータベースを アドレスするのに使用できる。
本発明は同様に、受信信号を認識するためにアクセスされる信号データベースを 作成するためのシステムをも提案している。データベースを作成するプロセスは 、上述の信号を認識するためのプロセスに非常に類似している。しかしながら、 目標信号はまず第1に解析されてそのスペクトル的に独特の部分が見極められる 。信号のこのスペクトル的に独特の部分は次に、帯域ろ過され、修正され、低帯 域ろ過されて、複数の線形組合せが誘導される基となる低周波数形を生成する。
スペクトル的に独特の部分の線形組合せは1次に変更サンプリング手順に付され 、こうして各々の線形組合せは移動するウィンドウで何度もサンプリングされる 。サンプリングされた値は次にスキュー及びとがりを計算するのに用いられ、か くして、信号のスペクトル的に独特の部分のための複数の基準特徴ベクトルを生 成する。
複数の特徴ベクトルは、特徴超空間内のベクトルの間の距離を広げることにより その値をより特徴的なものにする目的で量子化される。量子化の手順としては2 つ考えられる。まずj[1に、特徴ベクトル信号値母集団を5といった複数のセ グメントに等分する、非並行量子化スキーマを採用することができる。このとき 、各々の特徴ベクトル内のスキュー又はとがりの値がプロットされ、5つの値の うちの1つを割当てられる。かくして、各々のサンプリングされた信号について 複数の量子化されたベクトルが生成される。スキュー又はとがり値が2つの部域 に対して割当てられる複数の重複する部域の形にスキュー及びとがりの信号値母 集団を分割する並行方式の量子化も同様に可能である。各々の特徴ベクトルは次 にプロットされ、各々のキュー又はとがり値が2つの値をとりうることがら2つ の量子化されたベクトルが生成される。2つの量子化された特徴ベクトルは次に 、基準データベースのためのさらなる複数の量子化された特徴ベクトルを提供す るため置換される。
どの量子化スキーマが採用されようとも、好ましくは、非10進基数を用いて各 々の量子化されたベクトルの加重和が生成される。この加重和は次に、目標信号 の!1Ij111コードが記憶されているもう1つのデータベースの場所を指す 1つのポインタが記憶されているデータベースをアクセスするためのアドレスと して月いられる。
の 本発明の有利な特徴は、以下のものを含む添付の図面を参考にして考慮した場合 以下に示す好ましい実施例の記述から容易に理解できることだろう。
図1は、好ましい実施態様に従ったシステムを示すブロックダイヤグラムである 。
図2は、受信信号を4つの異なる周波数帯にろ過する原理を示すブロックダイヤ グラムである。
図3は1図1のプロセッサの中で行なわれる波整形を示す一連の波形を描いてい る。
図4は、プロセッサが生成した4つの特徴シーケンスを示す一連の波形である。
図5は、基準ライブラリを作成するための信号のスペクトル的に独特の部分の並 行方式のサンプリングを示す図である。
図6は、図5において行なわれたサンプリングによって生成された特徴ベクトル を示す。
図7は、一定の与えられた数の量子化レベル及び一定の与えられた数の特徴に対 する独特の個性(アイデンティティ)の数を示すベクトル量子比表である。
図8は、特徴ベクトルの量子化を示す。
図9は、3次元空間内にプロットされた量子化された特徴ベクトルを示している 。
図10は、重複の無い非均等ベクトル量子化において用いられるとがり値の母集 団密度を示す。
図11は、図10の母集団において特徴ベクトル量に量子化された値をいかに割 り当てるかを示している。
図12は、非均等並行コード化されたベクトルの量子化−二おいて用いられると がり値の母集団密度を示す。
図13は、図12の母集団において特徴ベクトル量に量子化された値をいかに割 当てるかを示す。
図14は、並行コード化されたベクトル量子化スキーマにおいて、特徴ベクトル かいかに量子化されるかを示している。
図15は、量子化されたベクトルが、1つの信号を識別するためデータベースを アドレスするのに用いられる加重和の形にいかにして変換されるかを示している 。
図16は、好ましい実施態様に従った方法を示す、最上レベルの流れ図である。
図17は、統計モーメントの計算方法を示す流れ図である。
図18は、図16に従った確認段階を示す流れ図である。
しい の t−1 本発明は 1562号特許内に記されているシステムにおける改良に関して以下 に記述さ九るが、当業者であれば本発明の教示が広範な信号総員環境において使 用できるものであることを認識できるだろう0例えば、本発明は音声処理システ ム、音声認識システム、音響通信システムなどにも利用可能である。従って後述 のクレームはこのような同等の信号認識システム全てを**するものとして解釈 されるべきである。
まず篇1に、明確化を目的として本発明の概論が示されている。 +562号特 許は、2段式分類プロセスを用いて放送情報が認識されるような装置及び方法を 記述している。第1段階において、入力信号は第1段ライブラリに比較され、粗 スペクトル解析が行なわれる。第1段の比較は、粗スペクトル解析に従った第1 段基惰う1′ブラリからの信号識別の待ち行列を生成する。次に、第2のさらに 細かい相関が、第1段で設定された待ち行列作成類で第2段において行なわれる 。本発明は、311段の待ち行列における入力数及び認識時間を低減させるため の11段分類プロセスにおける改良を提案している。実際、本発明は非常に高い 効率を示したため、成る種の信号認識システムについてはj!2段無しでも有効 でありうる。
!J2段解析は入力信号を予備選択し、葉2段で行なわれた計算上要求の多い時 間のねじられた相関の考慮に入れないように多数の候補信号を削除する。311 段の効率を80%から90%まで増大できる場合、システムの容量は2倍になる 。本発明のプロトタイプは、フォールスアラームを拒絶する上で98%以上の効 率を実証した。
従って +562号特許に従ったシステムにおいて10倍の改良が達成できる。
+531号特許においては、システムを放送速度の変動及び送信収差に感応しな いものにするための手段を提供しながら信号の符号数の精確な識別を可能にする ように充分な時間−帯域幅の積を維持するような効率の良い慣号認識システムが 開示された。セグメント化された相関として知られているこの技術及び′531 号特許内に記されていたその他の実施の詳箱は、高い信頼性で単一のチャンネル 上の25曲の歌のいずれかを認識することのできるきわめて好結果のシステムを 提供していた。本発明の目的は、同じような信頼性で5本の同時放送チャンネル の各々の上の6000の記録された信号のいずれかを識別する能力にある。付加 的なシステム変数調整及びプロトタイプのモデリングは、容量をチャンネル1本 あたりほぼ10000曲の歌にまで増大させるはずである。
+562号の発明において具現化されたコンセプトの中心になっているのは、線 形時間ねじれ相関として知られている放送速度の変動を補償するための技術であ る。
この技術は、それが、記録の異なる部分から誘導された特徴ベクトルの部分の間 にさらに強い関係を維持するという点で、前述のセグメント相関に比べさらに頑 強なものである。さらに、暗層的′t!Ps11手順は、粗アルゴリズムを用い て候補認識を予備選択することにより、利用可能な処理容量を増加させるのに役 立つ。この技術は、明らかに第2段の認識基準をパスしない候補を除外しながら 。
゛ 全での信号データベースを走置するのにより少ない計算資源を消費する。第 1段プロセスで受諾可能なもの(I[′携的には10%乃至20%)は、311 段で設定された認識確率順(待ち行列)でj[2段の計算上集中的な線形時間ね じれ相関手順によって解析される。システム容量を大幅に増大する他に、 ′5 62号発明は、基筒パターン持続時間を易前の64秒から28秒まで短縮し、コ マーシャ川といったさらに短い持続時間の識別を可能にした。
ここで提案されているシステムに導く技術的アプローチについて個々で説明する 。上述のシステムの目的を考慮すると、2つの開運が浮上する。すなわち、第1 に、11段の解析のために、さらに独特な特徴ベクトルを提供しなくてはならな い点であり、又j12に、新しいアーキテクチャは 1562号特許に記されて いるアーキテクチャと互換性のあるものでなくてはならないという点である。す なわちjl1段分類プロセスは′562号特許で用いられている4つのエンベロ ープ検出された周波数帯の同じセットを受諾しなくてはならない。第1段の分類 子は512段の相関予肉で評価されるべきパターン番号でなくてはならない。
有効であるためには竿1段アルゴリズムはパターン間の高い識別を与えながら速 度変動及びその他の収差に寛容である必要がある。フォールスアラーム率は検出 ミスをひき起こすことなく最大限でなくてはならない。実際$1段分類子は、明 らかに正しくない符号数のみが拒絶されるようにバイヤスされなくてはならない 。これは通常フォールスアラーム率の増大という結果をもたらす。
これらの性能パラメータを両方とも同時に最適化することは困難である。
ベクトル内の特徴数に等しい数の次元をもつ特徴空間を*tするのに1つの特徴 ベクトルを用いることができる。このような特徴空間は[超空間」と呼ぶことが できる。各目標信号の特徴ベクトルはその計算値に従って超空間内に記憶される 。認識中、受信信号から誘導されたベクトルは超空間の特定の部域に記憶された 符号数をもつ単数又は複数の信号を発見すべく超空間を探索するのに用いられる 。超空間は、複数の信号を中に記憶できる複数の「クラスタ」を含んでいてよい 。例えば、類似した信号は、超空間の中で互いに近接して記憶される類似した特 徴ベクトルを生成することができる。超空間内のこのような信号クラスタの間の 間隔がクラスタのサイズとの関係において大きい場合、中にその他の領域の最小 限の重複をもつ超空間内の各々の特徴ベクトルのまわりに確実性領域を提供する ことが可能である。この増大した間隔どりを達成する1つの方法は特徴超空間の 次元の数を増大させることである。各々の特徴の値は超空間内の一座表として処 理される。例えば、図9に示されているように、 3つの特徴が使用される場合 、これらは、三次元空間内の1つの位置を規定する1つの特徴ベクトルを形成す る6次に特徴ベクトルが量子化されると(検出された特徴値に基づいて特定のカ テゴリに割当てられると)、各々の成分は1例えば5といった一定数の離散値の 1つを受けることができる。このとき、空間は離散的場所を125含むことにな る6 1つの信号識別コードが各々の場所に割当てられ次に受信信号から同じ特 徴を抽出し量子化することが可能である場合、特徴ベクトルを三次元空間内の同 じ場所にマツピングすることができ。
又適切な信号識別子を検索することができる。こうして、そのベクトル値が量子 化後唯−のものである場合125の信号に対し唯一のアクセスが可能となる。残 念なことに、測定される特徴は唯一のものではない。複数の異なる信号が同じ特 徴ベクトルを生成しうるのである。これは、超空間内の各々の場所に可能性リス トを割当てることによって対処できる6 図9は、3つの特徴の各々が5つの値 をとりうるような3次元超空間の一例を示している。 「クラスタ」40はここ で場所(S (4−3) =3;S (2−1) =2; S (3−2) = o)を中心にした形で描かれている。
12の開運は、認識されるべき信号又はパターンが、時間の圧縮又はその他の送 信上の収差により適切なベクトルを生成しない可能性があるという点にある。従 って特徴の変動性を研究しなくてはならず、結果として得られる特徴ベクトルが 超空間内の異なる領域をいかに指定するかが決定されなくてはならない。独特の 特徴の探索は、それらが予想される収差の影響下で安定していること、又それら が特有のものであることという基準に基づいている。特徴ベクトルを構成する個 々の特徴が独立したものであると仮定できるならば、特徴の数を増大させること によって、超空間内のクラスタ間の離隔距離をクラスフサイズの増大なく劇的に 増大させることができる。
量子化された特徴における変動を可能にし、時間的アラインメントに対する必要 条件を低減させるために、異なる時間変異にて多数の特徴ベクトルを生成するこ とができ、各々の信号にそれが占有することになる超空間の1領域を掃引させる ことができることになる。このような特有の時間不変特徴ベクトルの探索につい て以下に記述する。
あらゆるパターン認識問題の最も重要な態様の1つは、特定の符号数が存在する とき安定しているものの符号数が存在しない場合異なる指示を与えるような特徴 の識別、生成及び選定である。本発明を開発するにあたっては、レコード、テー プ及びレコード音楽ラジオ放送からの音響信号が、 1.0kHzのカットオフ 周波数での低域ろ過の後1秒あたり2500サンプルの速度でデジタル化された 。1キロヘルツ以下の周波数は、放送装置によって使用されるスペクトル修正に よる影響を比較的受けないことがわかった。
これらの信号からの約65秒の音響を72曲の歌からデジタル化し、実験用デー タベースとして記憶した。これらのデータファイルの各々を接ぎに、つの周波数 帯のエンベロープを形成するフロントエンドプロセッサのソフトウェアシミレー ションで処理した。シミュレータからの出力は、−組の多重化された浮動小数点 ファイルであり、これは、図形端末上にプロットさせるか又は特徴ベクトルのた めの優れた特徴を形成すべく開発利用できるデータの特性を決定するよう1つの プログラムによって処理させることができた。1つのスペクトル解析プログラム が、各々の周波数帯のパワースペクトル、対数パワースペクトルケプストラム( cepstrum)及び自己相関関数を計算した。パワースペクトル及び対数パ ワースペクトルは周波数領域関数であり、一方ケプスドラム及び自己相関関数は 時間領域関数である。次に、受信信号の4つの帯域の信号値の統計的モーメント を計算するのに、統計学プログラムが用いられた。このような統計的モーメント は、平均1分散、スキュー及びとがりを含む。さらに、4つの帯域の共分散行列 が計算された。
パワースペクトル及び対数パワースペクトルを検討する時点で、異なる歌は異な る周波数でスペクトルピークを有するものの、異なる歌の間で高い信頼性での区 別を行なう少数のスペクトル成分をいかに選択するかは明白でないということが わかった。このことは、線形及び対数の両方のパワースペクトルについてあては まる。しかしながら、各帯域の信号帯域幅を計算することにより、速度変動に関 して安定したものであるべき4つの数の1組が与えられる。これらの特徴は、8 つの異なる時間的遅延を用いて評価された。
自己相関関数を検討する時点で、誘導できる唯一の安定した特徴は上述の帯域幅 の測定値に密に関係することがわかった。パワースペクトル及び自己相関関数は フーリエ変換対であることから、これは予想すべきことである。自己相関関数か ら誘導された特徴は従って、冗長であるとみなされ、パワースペクトルから誘導 されたもののために捨てられた。ケプストラムを検討し、有効な安定した特徴を 全くもたないことがわかった。これは、ケプストラムが、合一波形の周期を決定 するのに調波的に関係づけされた信号構造の存在を利用するからである。
これらの調波構造は、帯域ろ過された音響のエンベロープには存在しないことが わかった。
統計学プログラムで生成された特徴の挙動を調量する上で、スキュー及びとがり 値が歌によって特有のものでありその歌の中での時間的オフセットで計算された とき比較的安定していることが発見された。有利であるとわかったこれらの特徴 のその他の特性が2つある。まず第1に、スキューもとがりも両方共自己正規化 するものである。すなわちその値は音の大きさとは無関係である。
j[2に、その値は、記録内の速度変動によってほとんど影響を受けない。これ は、その計算に時間又は周波数が明示的に関与しないからである。このことは、 システム全体を放送装置により誘発された速度変動から免れた状態にするべく多 大な努力が払われてきたことから、きわめて重要であるとみなされた。いくつか の歌が、異なる時間的オフセットで大幅に異なるスキュー及びとがりの値を生成 することが発見された。これは、時間的オフセットが解析のウィンドウを歌の性 質全体が異なる歌の領域内へと移動させた時に起こった。これは、選択されたい ずれの特徴セットにも影響を与える一般的問題であると仮定され、従って使用す べき特徴の選択の代わりに認識アルゴリズムの中で処理されなくてはならない。
結論として、当該発明人は、スキュー及びとがりの特性は、効率良くしかも高い 信頼性で放送信号をカテゴリー分類するのに充分適したものであるということを 発見した。帯域幅の推定もうまく働いたが、時間オフセットの効果に対しての免 疫性は比較的低いものであった。認識アルゴリズムはこれを直接処理するもので あるため、エンベロープ帯域幅はなおも有効な識別用特徴でありうる。ここで論 述されている特徴の各々は、4つの周波数帯金てについて計算されたものである ことを指摘しておかなくてはならない。従って、合計12の特徴つまりスキュー 、とがり及びエンベロープの帯域幅の各々について4つずつの特徴がその識別能 力に関し認定されたものとしてみなされた。12の特徴全てが用いられる場合、 12次元の特徴超空間が生成されることになる。これは、所要メモリ及び計算さ れなくてはならない特徴の数という点から見て恐らく受諾できないだろう、従っ て、本発明の実施態様に関しては、スキュー及びとがりの値のみを用い、かくし て合計8つの特徴を生成することが決定された。しかしながら、これでもまだ、 所要メモリの観点から見ると受諾不可能でありうる。従って、4つの周波数帯を 3つの波形に線形的に組合せ、かくして3つの波形の各々についてスキューとと がりの値を提供し、6次元の特徴超空間を作り出した。この選択の確認について 、以下に記すベクトル量子化に関連してより詳しく説明する。
ベクトル量子化は、原則として単純なコンセプトである。これには、各ベクトル 成分の解像度をその値の連続的範囲から少数の値のうちの1つに減少させること 、例えば複数の多重桁値を複数の単−桁値に減少させることが関与する(図8参 照)。例えば特徴値範囲は、単純に複数の同等な幅の帯域に区分することができ る。特徴は次にその多重桁値をその帯域数で置換することによりコード化又は量 子化される。この単純なアプローチには。
2つの主要な問題点が存在する。第1に、2つの帯域の間の境界近くにくる値は 、雑音、ひずみ又は計算の精度限界のために誤って量子化される可能性がある。
第2に。
特徴値が範囲全体にわたり等分布させられる可能性が低いのである。このため、 成る帯域においてきわめて集中する結果となり、量子化された特徴の情報内容は 減少させられる。全ての値が同じ帯域に入る限定的ケースにおいては、特徴は、 全く情報を含まない。これは、帯域の不均一な幅を用いることにより(例えば図 10)及び基準ライブラリのための基準特徴ベクトルのコード化のための並行方 式の量子化プロセスを利用することにより(例えば図12)、処理される。
第1に、量子化レベルの数ならびに特徴ベクトル内で利用される特徴の数を考慮 することが必要である。こ九らは、特徴超空間の次元の数及び密度を規定する。
図7は、使用される特徴の数及びそれらが童子化されるレベルの数の−R数とし て超空間内の離散的な場所の数をリストアンプしている。レベル数が3より大き い全てのケースについて、量子化レベルの数を増大させることによってよりも特 徴数を増大させることによっての方が多くのものを達成することができるという ことに留意されたい。メモリの限界内でできるかぎり大きい特徴超空間を利用す ることが有益である。これは、より大きい体積にわたり特徴ベクトルが表示する 信号を広げる傾向をもち、その結果第2段相関子により評価される必要のある符 号数はψなくなる。好ましい実施態様においては、当該発明人は5つの量子化レ ベルと6つの特徴を適正な妥協点として選択した。これは15625個の離散的 場所を有する超空間を提供する。
2つのベクトル量子化アルゴリズムが開発された。第1のものは、各領域が同じ 数の入力を含むような形でその統計的分布に従って各ベクトルを分割する(図1 0及び11参照)。第2のものは類似のプロセスを行なうが2つの量子化された 特徴ベクトルを戻す(例えば図12゜13及び14)、2つのベクトルは、最も 可能性の高い領域及び最も近い隣接領域を表わす。サンプル信号ライブラリを用 いてスキュー、とがり及び−IF城幅の値についてヒストグラムが作成された。
とがりについてのヒストグラムについて以下に、並行及び非並行方式のベクトル 童子化アルゴリズムとの関係において論述する。
図12は、とがり特徴の並行コード化されたベクトルの量子化を示している。と がり値の母集団がまず第1に。
各領域がサンプル台計数の3分の1を含むように分割されるということに留意さ れたい。領域1,3及び5を分離するために、M値BおよびDが用いられる。同 様に各々3分の1の点を含む付加的な2つの領域が構築されるにれらは、全社点 の3分の1が上下にある状態で閾WBおよびDに集中している。領域2及び4は M411A、CおよびEで境界設定されている。図13に示されているように、 HMAより小さい特徴値は明らかに領域1の中にあり、 (0,O’)としてコ ード化されている。閾値A及びBの間にくる特徴値は領域1又は2の中に属して いる可能性があり、C0,1)としてコード化される。閾値B及びCの間にくる ものは、領域2又は3の中に属する可能性があり、(1,2)としてコード化さ れる。、Cとbの間の値は領域3又は4に入り、(2,3)としてコード化され る。DとEの間の値は領域4又は5に属する可能性があり、(3,4)としてコ ード化される。最後に、値が閾値Eよりも大きい場合、これは明らかに領域5の 中にあり、 (4,4)としてコード化される。各々のベクトルが6つの特徴を 利用することから、並行ベクトル量子化プロセスは、図14に示されているよう に6つの要素ベクトルの対を作成する。これら2つのベクトルの要素を置換する ことにより、信号を記憶できる超空間の場所を規定する最高64の新しいベクト ルを形成することができる。しかしながら、 (0,0)又は(4゜4)コード が生成される毎に、2重ベクトルが生成される。予備的調査において使用された サンプルライブラリの場合、並行量子化されたベクトルA及びBの要素を置換す ることにより平均21.4の独特のベクトルが生成されるということがわかった 。これらの独特のベクトルは、超空間内の1つの歌のメモリ「近傍」と呼ばれる 。
並行方式の量子化アルゴリズムに対する代替案は、図10及び11に示されてい る非並行方式の量子化アルゴリズムである。IMIO及び11は、サンプルライ ブラリから生成されたとがりの僅のヒストグラムを示している。
非並行ベクトル量子化アルゴリズムによると、量子化闇値は、上昇順に特waM の全てを分類(ソート)し次にこのリストを5つの等しい今イズの領域に分割す ることによって誘導される。境界にあるデータ値は、閾値として選定される。こ のことにより、各々の領域は同数のサンプルを含むことになり、結果として得ら れる超空間は均等に満たされることになる。領域1. 2. 3. 4又は5の いずれかの中に入る特徴ベクトルの値は、単に、図11の中に示されているよう に、値と共にコード化される。
このプロセスはメモリ内に超空間を生成するのにも有効であるが、並行量子化ベ クトルアルゴリズムの方が好ましい。ただし、この非並行量子化アルゴリズムは 、以下に論述する受信信号を認識するプロセスの間に使用される。
技術的アプローチに関して論述すべき最後のプロセスは、信号識別情報を含むデ ータベースへ又はこのデータベースから情報を書き込むか又は抽出するためにこ の量子化されたベクトルをいかに使用するかということである。当該発明人は、 信号パターンの認識に適用できる情報を記憶し検索する2つのアプローチを調査 した。第1のアプローチには、超空間内に予想されるパターンの変動を全て記憶 させることが関与している。これは量に、並行方式のベクトル量子化プロセスに より戻された2つのベクトルの置換により上述の各々の場所に歌識別コードを割 当てる問題である。アクセスには、探索基準を満たすパターンのリストを含む単 一の場所の計算が関与している。これは、実時間認識の観点からみて最も効率の 良いものであるが、特徴超空間内の数多くの場所における識別コードの記憶を必 要とする。代替的な1つのアプローチは、各々のパターンを空間中に一回だけ記 憶するというものである。候補の歌のリストを見い出すため空間をアクセスする とき、並行方式の量子化プロセス内で観察される全ての変動が探索されなくては ならない。各々の場所で発見されるリストが次に組合せられなくてはならない。
この第2のアプローチはメモリを保存するものの、認識プロセスを緩慢なものに する。予期される全ての特徴変動を記憶し次にひずみについて領域を探索するよ うな[ベルト−サスペンダ」プロセスも可能である。
この方法は恐らく最も頑強なものであるが、時間及びメモリの両方のペナルティ を払うことになる。実時間実行が重要であり、かつメモリの限界が引伸ばされて いるとは感じられないことから、第1の方法が選定された。
メモリ内に信号識別情報をマツピングし、次に受信信号に従って識別情報を検索 する方法は、数多く存在する。
好ましい実施態様では、1つの考えられるアプローチが用いられているが、本発 明は全ての明白な同等物を網羅するものとみなされるべきである。上述のパラメ ータに従うと、ベクトル超空間の中には15,625の離散的場所が存在する。
従って、WI在的なパターン整合の識別コードを含むリストを指すポインタの表 が構築された。
各々のリストは、信号が付加及び除去される時点で更新されるような可変的長さ を持つ。図15は、このアクセス方法を例示する。データベースに1つの信号が 付加される場合、並行量子化プロセスから誘導された2つのベクトルの全ての置 換が計算される。次に、例えば5といった非10進基数を用いたベクトル成分の 加重和として、リスト上の1つの位置が計算される。この表中の各々の位置は、 1つの空のリストを指していてもよいし、或いは又超空間内でこの場所にマツピ ングする信号の識別コードを含むリストの場所を指していてもよい。これらのリ ストは、動的に生成され修正される。信号リスト内の11の入力は、次に続く識 別コードの数を示す。リストの残りの部分には、識別コードが含まれている。リ ストに信号識別情報を付加することには、そのリストが存在するか否かをテスト することが含まれる。それが存在しない場合、これを作り出さなくてはならない 。このとき信号識別情報が付加され、リストサイズは1に設定される。リストが すでに存在する場合、信号識別情報がすでにリスト上にあるか否かを見るためチ ェックを行なう。
それがすでにリスト上にある場合、表は単に退出させられる。無い場合には、リ ストは1だけ拡張され、新し0諏別コードが付加される。付加的な信号識別コー ドが付加されたことを示すため信号リスト中の第1の入力も同様に更新される。
信号識別コードを除去することも、類似のプロセスである。
このアプローチの実行は、選択された統計的特徴の安定性によって左右される。
モーメントは速度の変動によって影響されないために選択された。しかしながら 、時間オフセットが関与する場合、歌のセグメントが異なる特性を示しそれがこ の歌を超空間の異なる領域に置くことになるということも極めて可能である。そ の結果、検出ミスが起こることになる。このことは、複数の時間的遅延にて特徴 安定性を評価することによってv4査され、はとんどは安定していることがわか った。しかしながら、時間的遅延で著しく変化したものもいくつかあった。これ を押しとどめるため、相関子によって用いられた28秒以内で14秒の間隔の1 セット全体にわたり、統計力く算出される。各々のオフセントにおいて、超空間 内の1セツトの重複した場所が計算され、相応するリスト番二対して歌のIDコ ードが付加される。歌が安定して(Aる場合、いかなるλカも生成されない。し かしながら、統計が時間的遅延と共に変化する場合、歌は、それ力(存在する可 能性のある全ての領域に対して付加される。
これで、本発明の技術的アプローチ及び概論の説明を終わる。
図1は、本発明に従った装置のブロックダイアダラムを示し、図16は、本発明 に従ったプロセスのための2レベル式流れ図を表わす。本発明において1図1の 処理構造は、最高5つの音声チャンネルの同時処理を可能にする。従って、最高 5つの放送局を監視し、その放送番組を分類することが可能である。同時に監視 可能なチャンネルの数を増減するために、付加的なハードウェア及びソフトウェ アの修正を行なうことができる。
アンテナ2は、可聴信号を支持する電波を受信する。
アンテナ装置は、同時に最高5つの無線チャンネルを受け入れることができる。
この可聴信号は、音声チャンネル受信機4によって受信され、音声前処理プロセ ッサ6に与えられる。音声前処理プロセッサ6は、フィルタバンク8、エンベロ ープ検出器10及び低域フィルタ12を、図2に示されているように含んでいる 。代替的には、この音声前処理プロセッサ6をプロセッサ24内にデジタル式に 内蔵させてもよい。
図1は同様に、可聴信号をデジタル化するのに用いることのできるアナログ−デ ジタル変換器14をも示している。複数の音声チャンネルが同時に監視されてい るとき多重化オペレーションを行なうのに、マルチプレクサ16が用いられる。
A/D変換器14及びマルチプレクサ16は両者共母線100に連結されている 。同様に母線100に連結されているのは、アレイプロセッサ18である。特徴 ベクトルのオペレージ目ンはアレイプロセッサ18内で行なわれ、これには、第 2段の特徴シーケンスの時間ねじれ及び512段相関計算が含まれる。
プロセッサ24は同様に母1g1ooに連結され、制御、データベース管理及び 第1段分類計算における全ての入圧力(Ilo)管理のI11能を果たす、プロ セッサ24は、マイクロプロセッサ26、メモリ28、I10インタフェイス3 0、実時間クロック32、基準パターンメモリ34及びオフラインメモリ36を 含むことができる。好ましくは、マイクロプロセッサ26は、モトローラ680 20シリーズのマイクロプロセッサであってよい。好ましくは、動作メモリ28 はψなくとも8メガバイトのメモリを含む。同様にして、パターンメモリ34は 第1段及び第2段の基準ライブラリの両方を記憶し、好ましくは少なくとも1つ の140メガバイトのハードディスクによって実現される。メモリ34内の基準 パ、ターンライブラリからの基準パターンを変更/付加/削除するために、オフ ラインメモリ36を用いることができる。好ましくは、オフラインメモリ36は テープカートリッジを含んでいる。
最後に、処理システムは、CRT38、プリンタ又はモデム40及び端末42と いった周辺機器と連結することができる。このような周辺機器はI10インター フェイス30を通してシステムに連結される。
ここで図2に戻り、粗スペクトル解析について記述する。受信可聴信号は音声前 処理プロセッサ6に与えられ、ここで複数のチャンネルに分割される。好ましい 実施態様においては、4つのチャンネルが選択された。しかしながら、分類され るべき信号の正確なタイプに応じて、さらに多い又はφないチャンネルを泪いる ことができる。
各々のチャンネルは、各々異なる値を有する帯域フィルタ8を含んでいる。各々 のチャンネルは、整流器10及び低域フィルタ12をも含んでいる。音声前処理 プロセッサの目的は、第1段で処理される情報の量を減少させることにある。こ うして、第1段の特徴の長期平均化が提供される。第1段の目的は、認識のため に必要とされる計算を減少させることにあることから、単位時間あたりに処理さ れる情報量を減少させることが望ましい、信号識別精度は、特徴ベクトルの時間 帯域幅積に比例する。
従って持続時間を拡張させながら特徴ベクトルを減少させることにより、必要と される単位時間あたりの処理は減少する一方で、精度は維持される。これは、時 系列事象に対する連続的探索を必要とするあらゆるプロセスについて言えること である。
これを達成するためには、図3に示されている可聴入力信号が、帯域フィルタ8 の各々に対して与えられる。
各々の帯域フィルタはろ過された信号例えば図3に示されているものを出力する 。ろ過された信号は、低域フィルタ12に提供され、各々の整流器は図3に示さ れているように低域ろ過された信号を出力する。減少した帯域幅の信号をサンプ リングすることにより、可聴信号内の速度変動に対するシステムの感応性を同時 に減少させながら、処理時間が保たれる。従って、低域フィルタ12から、図4 に記されているように複数の波形が与えられる。これらの波形はそれぞれXI( t)、X2(t)、X3(1)及びXl(t)によって表わされる。これらの波 形の各々はプロセッサ24に与えられ、このプロセッサは波形に従って特徴シー ケンスを生成する。
従ってプロセッサ24は、Xa+ (t)、X−2(t)、x=g(t)及び  Xt、(t)(図2)で表わされた複数の特徴シーケンスを提供する。これらの 特徴シーケンスの各々は、波形X+(t)からx、(t)までの線形組合せとし て形成される。本発明において、線形組合せは2つの帯の間の差にほかならない 。例えば、信号Xa+(t)は、X4(t)−x3(t)の線形組合せである( 以下「帯(4−3)」と呼ぶ)。同様にして、帯域<3−2)及び帯域(2−1 )についての信号がプロセッサ24内に生成される。この段階は、段階5110 として図16中に示さ九でいる。
しかしながら、いくつかの実施例においては、4つの入力波形の線形組合せで直 交性といった成る種の特定的特性をもつシーケンスを形成するのが望ましくなる 。この時点で、放送装置により誘発されたひずみを補償するため付加的な前処理 を適用することができる。このようなひずみの−例は、動的範囲の圧縮又は対数 圧縮関数を用いてそれを拡張することである。このようなひずみは、データベー スを作成するとき動的範囲のひずみをシミュレーションすること及び/又は動的 範囲のひずみについて受信信号を補償することによって補償される。
次の段階は、図16に段1s120として表わされているように、帯域差信号の 各々の統計的モーメントを計算することである。各々の帯域差信号は、これらの 統計的モーメントを計算するのに用いられた信号値を生成するため複数の点でサ ンプリングされなくてはならない。
図5は、帯域(4−3)のサンプリングを示している。
サンプリングプロセスは、基準ライブラリを生成するためと受信信号を認識する ためとで少し異なっている。基準ライブラリが生成される場合、信号は@1の装 置内へ音声チャンネル受信器4にて入れられる。基準ライブラリ内で使用するた めの信号のスペクトル的に最も独特の部分を選択するのに図16内で段階521 0及び5270として描かれている第2段相関手順が用いられる。限定的に言っ て、プロセッサは、fi1段及び第2段の基準ライブラリを生成する際に使用す るため信号のスペクトル的に最も独特な28秒を識別する。一方1図1の構造に より放送信号が監視されている場合、その信号は、一連の14秒のセグメントに 分割され、各々のセグメントは解析され基準信号ライブラリと比較される。
図5に従うと、目標信号のための基準ライブラリ入力は、9つの間隔を通して1 28のサンプリング点ウィンドウで各帯域差信号を繰り返しサンプリングしてウ インドウを各間隔について16点ずつシフトさせることにより、決定される。サ ンプリング点において決定された信号値は次に、図16に段ff5120として 記されているように、統計的モーメントのスキュー及びとがりを計算するのに用 いられる。図17は、統計的モーメントを計算する方法を示す。第1に1次の式 にしたがって、サンプリングされた信号値の平均が得られる:μ=(1−N)Σ X (n) ・・・・・・・・・・・・・・・・(1)なお式中、Nはサンプリ ング点の数であり、 1くn〈Nであり、Xはサンプリング点における信号の値 (例えば電圧)である。次に、以下の式を用いてサンプリングされた信号の分散 をめる: 分散= (1/N)Σ(X(n)−u) 2−= (2)この分散から、以下の ようにして標準偏差が計算される: σ=f分]F・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ ・・(3)次に、単数又は複数の統計的モーメントを以下の式に従って計算する ことができる: 本発明では2つの統計的モーメントつまりスキューととがりを用いているが、式 (4)に従って単一の統計的モーメントを計算することもできるし、或いは又代 替的に単数又は複数のさらに高次のモーメントを用いることもできる。
好ましい実施態様に従うと、スキューは次のように計算できる: 又、とがりは以下のように計算される:上述の計算は1図17に示されているよ うに1段階5121〜5125において行なわれる。
統計的モーメントがひとたび計算されると、特徴ベクトルを誘導することができ る(図16の段[5130)。
図6に示されているように、特徴ベクトルが5 基準ライブラリの作成中に9つ の間隔の各々について誘導される。
各々の間隔における3つの帯域差信号についてのスキュー及びとがり値を含む、 従って、ベクトル1は、5(4−3)1. S (3−2)I、S (2−1) l、K (4−3)I。
K(32)+及びK(21)+に対する値を含む。これらの値は実際の信号値で あり、浮動小数点数で表わされる。
ここで、各信号について9つの特徴ベクトルが生成されたことになり、各々の特 徴ベクトルは超空間内の1つの場所を示している。次に、歌識別コードが超空間 内の各近傍におかれ、近傍は2重値を削除する。
次の段階は、すでに論述したように(図16内の段階5140)、特徴ベクトル を量子化することである。基準ライブラリを作成するプロセス中、@12−14 に従った並行方式のベクトル量子化アルゴリズムが好ましくは利用される。例え ば、図14に示されているように。
ベクトル1の値は図12のグラフ上にプロットされ、 2つの並行量子化された ベクトルA及びBが生成される。
これらの量子化されたベクトル成分は、0−4の値をもつ単一の桁で表わされる 。しかしながら、−変形実施態様においては、量子化されたベクトルは多重桁で あってよく、5つ以上又は以下の独特の値を含んでいてよい。
2つの量子化されたベクトルA及びBを得た後、その可能なバリエーションを全 て生成するため、これらベクトルの置換が行なわれる。従って、ベクトル1から の信号値を記憶することのできる超空間内の可能な64の場所が存在する。この 置換は、生成された9つの特徴ベクトルの各々について行なわれるため、各々の 信号について超空間内で合計576のベクトルがマツピングされなくてはならな い可能性がある。しかしながら当該発明人が行なった実験によると、超空間の中 の約21の実際の場所が各ベクトルについて生成される。
各順序付られた量子化ベクトルを超空間にマツピングするには、メモリの特定の 位置へ歌識別コードを投入するだけでよい(図16のステップ5150)、これ は、図15に示すプロセスに従って実行される。ただし、多数のマンピングアル ゴリズムを使用する。
図15において、順序付ら九た量子化ベクトル2Aの重みつき合計は、非10進 数の基数5でめられる。すなわち、ベクトル値と底5の異なる累乗の積である。
当然、這う基数を使用することもできるし、全く異なった方法でアドレスをめて もよい。図15に示す例では、ベクトル成分の重みつき合計は11,117に等 しい。
次に、このアドレスから、Qテーブルという表がアクセスされる(図16のステ ップ5160)。ポインタから、特定の歌リスト1が指定される。データベース を作成するプロセスでは、歇識別コードが当該歌リストに投入される。また、リ スト内の歌数が1だけ増分される。この手順は、サンプル信号からめられる順序 付られた量子化ベクトルの各々に対して繰り返し実行される。これによって、サ ンプルの識別コードがメモリ内の複数の歌リストに書込まれる。これで、信号認 識に使用されるデータベースの作成が完了する。
信号認識でも、上記のステップは大体同様である。放送信号が受信され、帯域フ ィルタで処理され、整流され、低域フィルタで処理される。そして、4帯域の一 次結合がめられる。認識処理のサンプルステップについては、歌が14秒間隔で 連続的にサンプルされるという点で上記とはやや異なる。たった1つの特徴ベク トルが、方程式(5)と(6)に従って算出された尖り値と歪値から期間毎に作 成される。
その後、各サンプル期間の単一特徴ベクトルが、先に述べた非1に複量子化アル ゴリズムで量子化される。このようにして、各秋期間で単一特徴ベクトルがめら れる6次に、単一量子化ベクトルの成分の重みつき合計がめられ、その重みつき 合計からQテーブルがアクセスさ九る。Qテーブルが指定するポインタが、単− 歌リストをアクセスする。単−歌リスト内の歌が、第二段階の分類手順で検索さ れる歌の候補となる。分類プロセスが一つだけの場合、当然、単−歌リストから 取部される一つ以上の歌が放送信号とみなされる。
第二段階の分類プロセスは、特許第+526号の13列58行〜15列57行お よび図2、図7、図8、図9、及び図14で詳細に説明されている。特許第 + 526号の当該部分を特にここで引用する。基本的に、第一分類プロセスで生成 される一つ以上の歌リストが1図2に示す出力信号Xc (t)と共に第2段階 の相関プログラムにサブミントされる。信号Xc (t)は、特許第+562号 で考察されているように線形に時間でゆがむこともある。時間でゆがんだのとゆ がまなかった5つ波形にフーリエ変換を行うことによって、複合スペクトルが得 られる。この複合スペクトルは第二段階ライブラリに存在する第二段階基準パタ ーンと比較される。デジタル化された放送信号のサンプルとその基準波形がたす き掛けされ逆フーリエ変換されて、相関信号がめられる(図18のステップ52 11)。次に、第二段階基準パターンと!f数の時間でゆがんだ(及びゆがまな かった)入力信号との相関関数が比較され、現時点の入力信号の最大相関値が指 定される(図18のステップ5213)、最大相M値を持つ波形が選ばれ、認識 を判定するしきい値と比較される。相関ピーク値が上記のように決定されるとす ぐに、その信号はF認識」される(図18のステップ5215)。また、歌讃別 コードのログが取得される。歌識別コードはCRT38に表示してもよい。
このように、上記の装置と方法によって、正確で信頼性があり小型で、しかも安 価な信号分類装置が実現される。
先述のように1本発明の装置を使用して、第一段階と第二段階の基準ライブラリ を生成することができる。第一段階のライブラリ生成手順については既に説明し た。
また、第二段階のライブラリの生成手順については、特許+526号の15コラ ム64行〜16コラム43行に詳細な説明がある。特許+526号の当該部分を 特にここで引用する。
上記の装置と方法は、自動的に信号を、とりわけ放送信号を分類するものである 。システムはマイクロプロセッサを基盤としており、非常に小型で経済的なパッ ケージとして実現できる。例えば、現存のプロトタイプは、市販のFM高周波受 信器、S u n 3 / 150プロセツサを有する小型コンビユニり、Mo torola68020マイクロプロセッサを使用したS u nCPU基板、 複数のメモリ基板、Mercuryアレイプロセッサ、プリプロセッサ、ディス クと周辺機器用コントローラ、およびCRTで構成されている。この分野に精通 した人なら、本発明で明らかにされた信号認識における重要な改良点について容 易に理解できよう。
本発明を最も実用的な優先的実施態様と現在考えられているものとの関連におい て説明してきたが1本発明はその実施態様に限定されるものではない。逆に1本 発明は、添付の請求の精神及び範囲内でそれを様々に変形させ同様に配置させた 態様をも包含するものである。添付の請求の範囲は、最も広い解釈と一致するも のであり、そのような変形態様および同様な構造と作用の全てを包含する。
FIo、5 FIG、θ FIo、1 FIG、Iθ tlll FIG、12 FIG、I4 FIG、Iθ 浄書(内容に変更なし) !」11 信号を受信しそして複数のサンプリング点でサンプリングして複数の信号値を生 成する信号認識装置及び方法。
信号の統計モーメントが式(1/N)Σ((X (n) −μ)k/σ賢)に従 った信号値を用いて計算される。ここで、Nはサンプリング点の数、nは1 <  n < Nを満足させる値、Xはサンプリング点における信号の信号値、μは 信号値の平均値、σは信号値の標準偏差、モしてkは1より大きい整数である。
計算された統計モーメントは複数の格納信号識別コードと比較されて、受信信号 が格納された信号識別コード中の一つに類似するものとして認識される。好まし くは、計算された統計モーメントは。
量子化される特徴ベクトルを生成するために使用され、そして重み付けされた量 子化特徴ベクトルは信号識別ニードを格納するメモリをアクセスするために使用 される。
手続補正書(放) 平成4年IO月21日

Claims (80)

    【特許請求の範囲】
  1. 1.信号を受信する段階と、複数のサンプリング点で信号を抽出し複数の信号値 を求める段階と、以下の式に従って前記信号の統計モーメントを算出する段階と ;▲数式、化学式、表等があります▼ ここで、 N=サンプリング点の数 n=1<n<N X=サンプリング点での前記信号の信号値μ=信号値の平均値 σ=信号値の標準偏差 k=1より大きい整数 算出された統計モーメントと複数の格納された信号識別コードを保持するライブ ラリの内容とを比較する段階と、受信信号を前記の格納された信号識別コードの 少なくとも一つに類似したものと認識する段階とで構成されることを特徴とする 信号認識法。
  2. 2.前記算出段階は、前記信号の歪を算出する段階と尖りを算出する段階を含み 、前記比較段階は、前記歪値と前記尖り値から特徴ベクトルを求める段階を含む ことを特徴とする請求の範囲第1項に記載の方法。
  3. 3.前記受信段階は、受信信号を帯域フィルタで処理し複数のフィルタ処理信号 を得る段階と、前記フィルタ処理信号を整流する段階と、整流信号を低帯域フィ ルタで処理する段階と、低帯域フィルタ処理信号の複数の一次結合をコンピュー タ処理する段階とを含むことを特徴とする請求の範囲第1項に記載の方法。
  4. 4.前記サンプリング段階は、複数のサンプリング点で前記一次結合の第一の一 つを抽出し第一の複数の信号値を求める段階と、複数のサンプリング点で前記一 次結合の第二の一つを抽出し第二の複数の信号値を得る段階とを含むことを特徴 とする請求の範囲第3項に記載の方法。
  5. 5.前記算出段階は、前記第一の複数の信号値から第一の歪値と第一の尖り値と を算出する段階と、前記第二の複数の信号値から第二の歪値と第二の尖り値とを 算出する段階と、前記第一と第二の歪値と前記第一と第二の尖り値とから成る特 徴ベクトルを得る段階とを含むことを特徴とする請求の範囲第4項に記載の方法 。
  6. 6.前記比較段階は、複数の予め設定された量子化パターンに従って前記特徴ベ クトルを量子化し量子化ベクトルを得る段階と、前記量子化ベクトルで前記ライ ブラリにアクセスし量子化ベクトルに対応する信号識別コードを探索する段階と を含むことを特徴とする請求の範囲第5項に記載の方法。
  7. 7.前記アクセス段階は、非10進数の基数を使って前記量子化ベクトルの値の 重み付き合計を求める段階と、重み付き合計をアドレスとし使用してポインタ表 にアクセスし前記重み付き合計に対応するポインタを探索する段階と、前記ポイ ンタを使用して量子化ベクトルに対応する信号識別コードを保持する信号識別コ ードリストを探索する段階とを含むことを特徴とする請求の範囲第6項に記載の 方法。
  8. 8.前記認識段階は、前記複数の一次結合の第三の一つと前記信号識別コードリ ストにある信号識別コードに対応する複数の格納された信号とを相関させる段階 と、前記第三の一次結合との相関値があらかじめ設定されたしきい値より大きい 一つの格納された信号を指定する段階とを含むことを特徴とする請求の範囲第7 項に記載の方法。
  9. 9.前記量子化段階は、非均一的に分散された範疇を有する予め設定された尖り 量子化パターンに従って前記特徴ベクトルの各歪値を類別する段階と、非均一的 に分散された範疇を有する予め設定された歪量子化パターンに従って前記特徴ベ クトルの各尖り値を類別する段階とを含むことを特徴とする請求の範囲第6項に 記載の方法。
  10. 10.基準信号を受信する段階と、複数のサンプリング点で前記基準信号を抽出 し複数の信号値を求める段階と、以下の式に従って受信された基準信号の統計モ ーメントを算出する段階と; ▲数式、化学式、表等があります▼ ここで、 N=サンプリング点の数 n=1<n<N X=サンプリング点で抽出された信号 μ=信号値の平均値 σ=信号値の標準偏差 k=1より大きい整数 算出された統計モーメントから特徴ベクトルを引出す段階、特徴ベクトルもしく はその表現をメモリに格納する段階とで構成されることを特徴とする信号認識に 便利な信号ライブラリ作成方法。
  11. 11.前記算出段階は、受信された基準信号の二つの統計モーメントを算出する 段階を含み、前記引出し段階は、算出された統計モーメントの両方から前記特徴 ベクトルを引出す段階を含むことを特徴とする請求の範囲第10項に記載の方法 。
  12. 12.前記受信段階は、受信信号を帯域フィルタで処理し複数のフィルタ処理信 号を得る段階と、前記フィルタ処理信号を整流する段階と、整流信号を低帯域フ ィルタで処理する段階と、低帯域フィルタ処理信号の複数の一次結合をコンピュ ータ処理する段階とを含むことを特徴とする請求の範囲第10項に記載の方法。
  13. 13.前記サンプリング段階は、複数の点で前記一次結合の一つの第一の部分を 抽出し第一の複数の信号値を求める段階と、複数の点で前記の一つの一次結合の 第二の部分を抽出し第二の複数の信号値を求める段階とを含むことを特徴とする 請求の範囲第12項に記載の方法。
  14. 14.前記算出段階は、前記第一の複数の信号値の歪と尖りを算出して第一の歪 値と第一の尖り値とを得る段階と、前記第二の複数の信号値の歪と尖りを算出し て第二の歪値と第二の尖り値とを得る段階とを含むことを特徴とする請求の範囲 第13項に記載の方法。
  15. 15.前記引出し段階は、前記第一の歪値と前記第一の尖り値を有する第一の特 徴ベクトルを求める段階と、前記第二の歪値と前記第二の尖り値とを有する第二 の特徴ベクトルを求める段階とを含むことを特徴とする請求の範囲第14項に記 載の方法。
  16. 16.前記引出し段階は、予め設定された非均一量子化パターンに従って歪値と 尖り値とを整数に置換えることによって前記特徴ベクトルの両方を量子化し、第 一と第二の量子化ベクトルを求める段階を含むことを特徴とする請求の範囲第1 5項に記載の方法。
  17. 17.前記格納段階は、非10進数の基数を使って前記第一のベクトルの重み付 き合計をコンピュータ処理する段階と、前記非10進数の基数を使って前記第二 のベクトルの重みつき合計をコンピュータ処理する段階と、重み付き合計を使用 して前記メモリにアドレス指定する段階と、前記メモリの重み付き合計に対応す るアドレスに前記基準信号に対応する信号識別コードを格納する段階とを含むこ とを特徴とする請求の範囲第16項に記載の方法。
  18. 18.前記引出し段階は、予め設定された非均一な重複量子化パターンに従って 前記第一の特徴ベクトルから第一と第二の重複量子化ベクトルを求める段階と、 予め設定された非均一な重複量子化パターンに従って前記第二の特徴ベクトルか ら第三と第四の重複量子化ベクトルを求める段階と、前記第一と第二の重複量子 化ベクトルの第一の複数の順列を求める段階と、前記第三と第四の重複量子化ベ クトルの第二の複数の順列を求める段階とを含むことを特徴とする請求の範囲第 15項に記載の方法。
  19. 19.前記格納段階は、前記第一と第二の複数の順列各々の値の重み付き合計を コンピュータ処理する段階と、前記メモリの前記重み付き合計に対応するアドレ スにアクセスする段階と、前記メモリの前記アドレスに対応する領域に前記基準 信号を識別する信号識別コードを格納する段階とを含むことを特徴とする請求の 範囲第18項に記載の方法。
  20. 20.信号を受信する段階と、複数の点で信号を抽出し複数の信号値を求める段 階と、前記信号値から多値特徴ベクトルを引出す段階と、各特徴ベクトル値を非 均一的に特徴ベクトル値を類別する予め設定された量子化パターンで指定された 範疇値に置換えることによって前記特徴ベクトルを量子化する段階と、量子化ベ クトルで信号ライブラリにアクセスし受信信号に対応する信号識別コードを得る 段階とで構成されることを特徴とする信号分類法。
  21. 21.前記予め設定された量子化パターンは重複量子化パターンであることを特 徴とする請求の範囲第20項に記載の方法。
  22. 22.前記量子化段階は、複数の異なる予め設定された量子化パターンを使用し て前記特徴ベクトルを量子化することを特徴とする請求の範囲第20項に記載の 方法。
  23. 23.前記引出し段階は、前記複数の信号値の二つの異なる統計モーメントを算 出する段階と、二つの算出された統計モーメントを使って前記特徴ベクトルを求 める段階とを含むことを特徴とする請求の範囲第20項に記載の方法。
  24. 24.予め設定された量子化パターンは二つの統計モーメント各々に対して求め られることを特徴とする請求の範囲第23項に記載の方法。
  25. 25.前記二つの異なる統計モーメントは歪と尖りで構成されることを特徴とす る請求の範囲第23項に記載の方法。
  26. 26.前記受信段階は、前記受信信号のエンベロープ検出を行う段階を含むこと を特徴とする請求の範囲第20項に記載の方法。
  27. 27.前記量子化段階は、重複する範疇を持つ少なくとも一つの予め設定された 量子化パターンに従って前記特徴ベクトルを複数の量子化ベクトルに置換える段 階と、前記複数の量子化ベクトルを順序付けて複数の順序付けられた量子化ベク トルを求める段階とを含むことを特徴とする請求の範囲第20項に記載の方法。
  28. 28.前記アクセス段階は、前記複数の順序付けられた量子化ベクトルで前記信 号ライブラリをアクセスして複数のメモリ記憶位置に到達する段階と、受信信号 に対応する信号識別コードを各前記メモリ記憶位置に書込む段階とを含むことを 特徴とする請求の範囲第27項に記載の方法。
  29. 29.前記受信段階は、前記信号を分光分析して異なる周波数帯域の複数の分析 信号を得る段階と、前記分析された波形の一次結合を求める段階とを含み、前記 サンプリング段階は、一次結合を抽出し一次結合毎に複数のサンプリング点を得 る段階を含み、前記引出し段階は、対応するサンプリング点から一次結合毎に歪 値と尖り値とを算出する段階と、前記特徴ベクトルを求め前記一次結合の全部の 歪値と尖り値とを算入する段階とを含むことを特徴とする請求の範囲第20項に 記載の方法。
  30. 30.放送される信号を抽出して放送される信号毎に複数の分析された波形を得 る段階と、抽出された信号毎に少なくとも一つの特徴ベクトルが得られるように 前記分析された波形から複数の特徴ベクトルを引出す段階と、複数の量子水準を 設定する副段階と、量子水準を予め設定された統計的分布上に分散させる副段階 と、分散された量子水準に従って複数の量子化しきい値を得る副段階と、各特徴 ベクトルの各々の値を前記量子化しきい値によって決定された対応する量子化値 に置換える副段階とを有する各特徴ベクトルを量子化する段階と、対応する抽出 信号に対する信号識別コードとして各量子化ベクトルの値をメモリに格納する段 階とで構成されることを特徴とする放送信号の識別に便利な信号識別コードライ ブラリを準備する方法。
  31. 31.量子水準を分散させる段階は、量子水準を重複した状態で分散させる段階 を含み、各特徴ベクトルの各々の値を置換える段階は、更に各特徴ベクトルの各 々の値を重複量子水準によって決定された複数の量子化値に置換えて、各特徴ベ クトルを複数の量子化ベクトルに置換える段階と、各特徴ベクトルの複数の量子 化ベクトルを順序付けて複数の順序付けられたベクトルを得る段階とを含み、前 記格納する段階は、抽出された信号毎に複数の量子化ベクトルに対応する値を格 納する段階を含むことを特徴とする請求の範囲第30項に記載の方法。
  32. 32.前記引出し段階は、分析された波形毎に二つの統計モーメントを算出し、 特徴ベクトルを求め二つの統計モーメントを算入する段階を含むことを特徴とす る請求の範囲第30項に記載の方法。
  33. 33.放送情報を受信する段階と、受信された放送情報を分光分析して複数の分 析された波形を得る段階と、前記分析された波形の複数の一次結合を求める段階 と、前記一次結合毎に少なくとも一つの統計モーメントをコンピュータ処理する 段階と、コンピュータ処理された統計モーメントから一つの特徴ベクトルを引出 す段階と、特徴ベクトルを量子化する段階と、量子化特徴ベクトルを使用して放 送情報の複数の識別コードを格納するメモリにアクセスする段階と、受信された 放送情報を格納された識別コードに基づいて識別する段階とを含むことを特徴と する放送情報識別法。
  34. 34.前記コンピュータ処理段階は、複数のサンプリング点で分析された波形を 抽出して複数の抽出値を得る段階と、以下の式に従って分析波形毎に二つの異な った統計モーメントを算出する段階とを含み;▲数式、化学式、表等があります ▼ ここで、 N=サンプリング点の数 n=1<n<N X=サンプリング点で抽出された信号 μ=信号値の平均値 σ=信号値の標準偏差 k=1より大きい整数 二つの異なる統計モーメントの各々に対して異なる値がk値として求められるこ とを特徴とする請求の範囲第33項に記載の方法。
  35. 35.前記引出し段階は、特徴ベクトルを求めて二つの算出された統計モーメン トの各々に対応する値を算入する段階を含むことを特徴とする請求の範囲第34 項に記載の方法。
  36. 36.前記量子化段階は、前記特徴ベクトルの各々の値を予め設定された非均一 な量子化パターンから得られた量子化値に置換える段階を含むことを特徴とする 請求の範囲第33項に記載の方法。
  37. 37.前記使用段階は、前記メモリから放送情報の識別コードリストを取出す段 階を含み、前記識別段階は、前記分析された波形の一つを前記メモリ内の相関ラ イブラリに存在する複数の情報コードに相関させる段階と、複数の情報コードは 前記使用段階において取出された識別コードリストに対応し、相関値が予め設定 されたしきい値より大きい場合に当該放送情報が複数の情報コードの一つに類似 すると宣言する段階とを含むことを特徴とする請求の範囲第36項に記載の方法 。
  38. 38.放送情報を受信する段階と、前記情報の分光分析を実行し複数の対応する 分析された波形を得る段階と、前記複数の分析された波形の一次結合をコンピュ ータ処理する段階と、前記一次結合の統計モーメントを算出する段階と、算出さ れた統計モーメントに基づいて受信された放送情報を分類する段階とで構成され ることを特徴とする放送情報分類法。
  39. 39.前記算出段階は、前記一次結合の上位統計モーメントを算出する段階と、 算出された統計モーメントを有する特徴ベクトルを求める段階とを含み、前記分 類段階は、求められた特徴ベクトルに基づいて受信された放送情報を分類する段 階を含むことを特徴とする請求の範囲第38項に記載の方法。
  40. 40.放送信号を受信する段階と、受信信号を帯域フィルタで処理し複数の異な った帯域のフィルタ処理信号を得る段階と、フイルタ処理信号を整流し低帯域フ イルタで処理し複数の低帯域信号を得る段階と、前記低帯域信号の複数の一次結 合をコンピュータ処理する段階と、一次結合の中の数個を抽出して数組の抽出値 を得る段階と、抽出値一組毎に歪値と尖り値とを算出する段階と、数組の抽出値 の歪値と尖り値とから特徴ベクトルを求める段階と、各歪尖り値を複数の予め設 定されたの非均一な量子化パターンから得られた範疇値に置換えることによって 特徴ベクトルを量子化する段階と、量子化ベクトルを使用し複数の信号識別コー ドリストを格納している第一のデータベースにアクセスする段階と、ここで各リ ストは複数の信号識別コードを格納でき、量子化ベクトルに対応する信号識別コ ードリストを第一のデータベースから取出す段階と、第一のデータベースから取 出した信号識別コードリストにある信号に対応する格納された相関信号を第二の データベースから取出す段階と、取出した相関信号を前記コンピュータ処理段階 でコンピュータ処理された一次結合の中の一つに相関させる段階と、前記一つの 一次結合との相関値が予め設定されたしきい値より大きい場合に、当該放送情報 を前記相関信号の一つに類似するものとして分類する段階とで構成されることを 特徴とする放送信号分類方法。
  41. 41.信号を受信するための手段と、複数のサンプリング点で信号を抽出して複 数の信号値を得るための処理手段(a)と、以下の式に従って前記信号の統計モ ーメントを算出するための処理手段(b)と;▲数式、化学式、表等があります ▼ ここで、 N=サンプリング点の数 n=1<n<N x=サンプリング点の前記信号の信号値μ=信号値の平均値 σ=信号値の標準偏差 k=1より大きい整数 複数の格納された信号識別コードを保持するライブラリに格納するための処理手 段(c)と、算出された統計モーメントと前記ライブラリ内の複数の格納された 信号識別コードとを比較するための処理手段(d)と、受信信号を前記格納され た信号識別コードの中の一つに類似するものとして認識するための処理手段(e )とで構成されることを特徴とする信号認識装置。
  42. 42.前記処理手段は、前記信号の歪と尖りを算出し、前記歪と前記尖りから特 徴ベクトルを求めることを特徴とする請求の範囲第41項に記載の装置。
  43. 43.前記処理手段は、受信信号を低帯域フィルタで処理し複数のフイルタ処理 信号をえるための手段と、前記フイルタ処理信号を整流するための手段と、整流 信号を低帯域フイルタで処理するための手段と、低帯域フイルタ処理信号の複数 の一次結合をコンピュータ処理するための手段とを有することを特徴とする請求 の範囲第41項に記載の装置。
  44. 44.前記処理手段は、(a1)複数のサンプリング点で前記一次結合の中の第 一の一つを抽出し第一の複数の信号値を得、(a2)複数のサンプリング点で前 記一次結合の中の第二の一つを抽出し第二の複数の信号値を得ることを特徴とす る請求の範囲第43項に記載の装置。
  45. 45.前記処理手段は、(b1)前記第一の複数の信号値から第一の歪値と第一 の尖り値とを算出し、前記第二の複数の信号値から第二の歪値と第二の尖り値と を算出し、(b2)前記第一と第二の歪値と前記第一と第二の尖り値とから成る 特徴ベクトルを引出すことを特徴とする請求の範囲第44項に記載の装置。
  46. 46.前記処理手段は、(d1)複数の格納された予め設定された量子化パター ンにしたがって前記特徴ベクトルを量子化して量子化ベクトルを得、(d2)前 記量子化ベクトルで前記ライブラリにアクセスして量子化ベクトルに対応する信 号識別コードを探索することを特徴とする請求の範囲第45項に記載の装置。
  47. 47.前記処理手段は、(d2a)非10進数の基数を使って前記量子化ベクト ルの値の重み付き合計を求め、(d2b)重み付き合計をアドレスとして使用し て前記ライブラリ内に存在するポインタ表にアクセスし前記重みつき合計に対応 するポインタを探索し、前記ポインタを使用して前記ライブラリにアクセスし量 子化ベクトルに対応する信号識別コードを保持する信号識別コードリストを探索 することを特徴とする請求の範囲第46項に記載の装置。
  48. 48.前記処理手段は、(e1)前記複数の一次結合の中の第三の一つを前記信 号識別コードリスト内の信号識別コードに対応する複数の格納された信号に相関 させ、(e2)前記第三の一次結合との相関値が予め設定されたしきい値より大 きい場合に、一つの格納された信号を指定することを特徴とする請求の範囲第4 7項に記載の装置。
  49. 49.前記処理手段は、(d1a)非均一的に分布された範疇の格納された予め 設定された歪量子化パターンにしたがって前記特徴ベクトルの各歪値を類別し、 (d1b)非均一的に分散された範疇の格納された予め設定された尖り量子化パ ターンにしたがって前記特徴ベクトルの各尖り値を類別することを特徴とする請 求の範囲第46項に記載の装置。
  50. 50.基準信号を受信するための手段と、メモリと、複数のサンプリング点で前 記基準信号を抽出して複数の信号値を得るための処理手段(a)と、以下の式に 従って受信された基準信号の統計モーメントを算出するための処理手段(b)と ; ▲数式、化学式、表等があります▼ ここで、 N=サンプリング点の数 n=1<n<N x=サンプリング点で抽出された信号値μ=信号値の平均値 σ=信号値の標準偏差 k=1より大きい整数 算出された統計モーメントから特徴ベクトルを引出すための処理手段(c)と、 特徴ベクトルかもしくはその表現を前記メモリに格納するための処理手段(d) とで構成されることを特徴とする信号認識に便利な信号ライブラリ作成装置。
  51. 51.前記処理手段は、受信された基準信号の二つの統計モーメンドを算出し、 算出された統計モーメントの両方から前記特徴ベクトルを引出すことを特徴とす る請求の範囲第50項に記載の装置。
  52. 52.前記処理手段は、受信信号を帯域フイルタで処理し複数のフイルタ処理信 号を得、フイルタ処理信号を整流し、整流信号を低帯域フィルタで処理し、低帯 域フィルタ処理信号の複数の一次結合をコンピュータ処理することを特徴とする 請求の範囲第50項に記載の装置。
  53. 53.前記処理手段は、(a1)複数の点で前記一次結合の中の一つの第一の部 分を抽出し第一の複数の信号値を得、(a2)複数の点で前記一つの一次結合の 第二の部分を抽出し第二の複数の信号値を得ることを特徴とする請求の範囲第5 2項に記載の装置。
  54. 54.前記処理手段は、(b1)前記第一の複数の信号値の歪と尖りを算出して 第一の歪値と第一の尖り値とを得、(b2)前記第二の複数の信号値の歪と尖り を算出し第二の歪値と第二の尖り値とを得ることを特徴とする請求の範囲第53 項に記載の装置。
  55. 55.前記処理手段は、(c1)前記第一の歪値と前記第一の尖り値とを有する 第一の特徴ベクトルを求め、(c2)前記第二の歪値と前記第二の尖り値とを有 する第二の特徴ベクトルを求めることを特徴とする請求の範囲第54項に記載の 装置。
  56. 56.前記処理手段は、(c3)予め設定された非均一な量子化パターンに従っ て歪値と尖り値を整数に置換えることによって前記特徴ベクトルの両方を重子化 して第一と第二の量子化ベクトルを得ることを特徴とする請求の範囲第55項に 記載の装置。
  57. 57.前記処理手段は、(d1)非10進数の基数を使って前記第一のベクトル の重み付き合計をコンピュータ処理し、(d2)前記非10進数の基数を使って 前記第二のベクトルの重み付け合計をコンピュータ処理し、(d3)重み付き合 計を使用して前記メモリにアドレス指定し、(d4)前記メモリの重み付き合計 に対応するアドレスに前記基準信号に対応する信号識別コードを格納することを 特徴とする請求の範囲第56項に記載の装置。
  58. 58.前記処理手段は、(c3)前記メモリに存在する予め設定された非均一な 重複量子化パターンに従って前記第一の特徴ベクトルから第一と第二の重複量子 化ベクトルを求め、(c4)前記メモリに存在する前記予め設定された非均一な 重複量子化パターンにしたがって第二の特徴ベクトルから第三と第四の重複量子 化ベクトルを求め、(c5)前記第一と第二の重複量子化ベクトルの第一の複数 の順列を求め、(c6)前記第三と第四の重複量子化ベクトルの第二の複数の順 列を求めることを特徴とする請求の範囲第55項に記載の装置。
  59. 59.前記処理手段は、(d1)前記第一と第二の複数の順列の各々の値の重み 付き合計をコンピュータ処理し、(d2)前記メモリの前記重み付き合計に対応 するアドレスをアクセスし、(d3)前記基準信号を識別する信号識別コードを 前記メモリの前記アドレスに対応する領域に格納することを特徴とする請求の範 囲第58項に記載の装置。
  60. 60.信号を受信するための受信器と、メモリと、複数の点で信号を抽出し複数 の信号値を得るためのプロセッサ(a)と、前記信号値から多値特徴ベクトルを 引出すためのプロセッサ(b)と、各特徴ベクトル値を特徴ベクトル値を非均一 的に類別する予め設定された量子化パターンによって決定される範疇値に置換え ることによって前記特徴ベクトルを量子化するためのプロセッサ(c)と、量子 化ベクトルで信号ライブラリにアクセスして受信信号に対応する信号識別コード を得るためのプロセッサ(d)とで構成され、前記ライブラリは前記メモリに存 在することを特徴とする信号分類装置。
  61. 61.前記予め設定された量子化パターンは重複量子化パターンであることを特 徴とする請求の範囲第60項に記載の装置。
  62. 62.前記プロセッサは複数の異なる予め設定された量子化パターンを利用して 前記特徴ベクトルを量子化することを特徴とする請求の範囲第60項に記載の装 置。
  63. 63.前記プロセッサは、(b1)前記複数の信号値の二つの異なる統計モーメ ントを算出し、(b2)二つの算出された統計モーメントを使って前記特徴ベク トルを求めることを特徴とする請求の範囲第60項に記載の装置。
  64. 64.予め設定された量子化パターンは、二つの統計モーメントの各々に対して 求められることを特徴とする請求の範囲第63項に記載の装置。
  65. 65.前記二つの異なる統計モーメントは歪と尖りとで構成されることを特徴と する請求の範囲第63項に記載の装置。
  66. 66.前記プロセッサは、前記受信信号のエンベロープ検出を行うことを特徴と する請求の範囲第60項に記載の装置。
  67. 67.前記プロセッサは、(c1)重複する範疇の少なくとも一つの予め設定さ れた量子化パターンに従って前記特徴ベクトルを複数の量子化ベクトルに置換え 、(c2)前記複数の量子化ベクトルを順序付け別の複数の順序付けられた量子 化ベクトルを求めることを特徴とする請求の範囲第60項に記載の装置。
  68. 68.前記プロセッサは、(d1)前記複数の順序付けられた量子化ベクトルで 前記信号ライブラリにアクセスし、(d2)前記メモリ記憶位置に受信信号に対 応する信号識別コードを書き込むことを特徴とする請求の範囲第67項に記載の 装置。
  69. 69.前記受信器は、(a)前記信号を分光分析し異なる周波数帯域の複数の分 析された信号を得、(b)前記分析された波形の一次結合を求め、前記プロセッ サは、一次結合を抽出して一次結合毎に複数のサンプリング点を得、対応するサ ンプリング点から一次結合毎に歪と尖りを算出し、前記特徴ベクトルを求め前記 一次結合の全部の歪値と尖り値を算入することを特徴とする請求の範囲第60項 に記載の装置。
  70. 70.放送される複数の信号を受信するための受信器と、メモリと、放送される 信号を抽出して放送される信号毎に複数の分析された波形を求めるためのプロセ ッサ(a)と、前記分析波形から複数の特徴ベクトルを引出すためのプロセッサ (b)と、複数の量子水準を設定する副段階(c1)と、予め設定された統計分 布上に量子水準を非均一的に分散させる副段階(c2)と、分散された量子水準 にしたがって複数の量子化しきい値を得る副段階(c3)と、各特徴ベクトルの 各々値を前記量子化しきい値によって決定された対応する量子化値に置換える副 段階(c4)とを実行して各特徴ベクトルを量子化するためのプロセッサ(c) とで構成され、前記プロセッサは、(d)各量子化ベクトルの値を対応する抽出 信号の信号識別コードとして前記メモリに格納することを特徴とする放送信号の 識別に便利な信号識別コードライブラリを準備するための装置。
  71. 71.量子水準は、重複した状態で分散され、前記プロセッサは、(c4a)各 特徴ベクトルの各々の値を重複量子水準で決定される複数の量子化値に置換え、 これによって各特徴ベクトルを複数の量子化ベクトルに置換え、(c4b)各特 徴ベクトルの複数の量子化ベクトルを順序づけ複数の順序付けられたベクトルを 求め、また、前記プロセッサは、(d1)複数の量子化ベクトルに対応する値を 抽出された信号毎に前記メモリに格納することを特徴とする請求の範囲第70項 に記載の装置。
  72. 72.前記プロセッサは、(b1)分析された波形毎に二つの統計モーメントを 算出し、(b2)各特徴ベクトルを求めて二つの算出された統計モーメントを算 入することを特徴とする請求の範囲第70項に記載の装置。
  73. 73.放送情報を受信するための手段と、放送情報の複数の識別コードを格納す るメモリと、受信された放送情報を分光分析して複数の分析された波形を求める ための手段と、前記分析波形の複数の一次結合を求めるための処理手段(a)と 、前記一次結合毎に少なくとも一つの統計モーメントをコンピュータ処理するた めの処理手段(b)と、コンピュータ処理された統計モーメントから特徴ベクト ルを引出すための処理手段(c)と、特徴ベクトルを量子化するための処理手段 (d)と、量子化特徴ベクトルを使用して前記メモリに存在する前記複数の放送 情報識別にアクセスするための処理手段(e)と、存在する識別コードに基づい て受信された放送を識別するための処理手段(f)とで構成されることを特徴と する放送識別装置。
  74. 74.前記プロセッサは、(b1)複数のサンプリング点で分析された波形を描 出し複数の抽出値を求め、(b2)以下の式に従って分析波形毎に二つの異なる 統計モーメントを算出し; ▲数式、化学式、表等があります▼ ここで、 N=サンプリング点の数 n=1<n<N x=サンプリング点の抽出値 μ=信号値の平均値 σ=信号値の標準偏差 k=1より大きい整数 二つの異なる統計モーメントの各々に対して異なる値がk値として求められるこ とを特徴とする請求の範囲第73項に記載の装置。
  75. 75.前記プロセッサは、(c1)特徴ベクトルを求めて二つの算出された統計 モーメントの各々に対応する値を算入することを特徴とする請求の範囲第74項 に記載の装置。
  76. 76.前記プロセッサは、(d1)前記特徴ベクトルの各々の値を前記メモリに 存在する予め設定された非均一量子化パターンから得られた量子化値に置換える ことを特徴とする請求の範囲第73項に記載の装置。
  77. 77.前記プロセッサは、(e1)前記メモリから放送情報の識別コードリスト を取出し、(f1)前記分析された波形の一つを前記メモリ内の相関ライブラリ に存在する複数の情報コードに相関させ、その複数の情報コードは取出された識 別リストに対応し、(f2)相関値が予め設定されたしきい値より大きい場合に 当該放送情報が複数の情報コードの一つに類似すると宣言することを特徴とする 請求の範囲第76項に記載の装置。
  78. 78.放送情報を受信するための手段と、前記情報の分光分析を行いそれに対応 する複数の分析された波形を求めるための処理手段(a)と、前記複数の分析波 形の一次結合をコンピュータ処理するための処理手段(b)と、受信された放送 情報を算出された統計モーメントに基づいて分類するための処理手段(c)とを 備えたことを特徴とする放送情報分類装置。
  79. 79.前記プロセッサは、(c1)前記一次結合の二つの上位統計モーメントを 算出し、(c2)算出された統計モーメントを有する特徴ベクトルを求め、(d 1)求められた特徴ベクトルに基づいて受信された放送情報を分類することを特 徴とする請求の範囲第78項に記載の装置。
  80. 80.放送信号を受信するための受信器と、メモリと、受信信号を帯域フィルタ で処理し複数の帯域の異なるフィルタ処理信号を得るためのコンピュータ(a) と、フィルタ処理信号にエンベロープ検出と低帯域フイルタ処理を行い複数の低 帯域信号を得るためのコンピュータ(b)と、前記低帯域信号の複数の一次結合 をコンピュータ処理するためのコンピュータ(c)と、数個の一次結合を抽出し て数組の抽出値を得るためのコンピュータ(d)と、各組の抽出値に対して歪値 と尖り値とを算出するためのコンピュータ(e)と、数組の抽出値の歪値と尖り 値とから特徴ベクトルを求めるためのコンピュータ(f)と、各歪尖り値を前記 メモリに存在する複数の予め設定された非均一量子化パターンから得られた範疇 値に置き換えることによって特徴ベクトルを量子化するためのコンピュータ(g )と、量子化ベクトルを使用して前記メモリ内の複数の信号識別コードリストを 格納する第一のデータベースにアクセスするためのコンピュータ(h)と、各信 号識別コードリストは複数の信号識別コードを格納でき、量子化ベクトルに対応 する信号識別コードリストを第一のデータベースから取出すためのコンピュータ (i)と、取出された信号識別コードリストに対応する相関信号を前記メモリ内 に存在する第二のデータベースから取出すためのコンピュータ(1)と、取出さ れた相関信号をコンピュータ処理された一次結合の中の一つに相関させるための コンピュータ(k)と、前記一つの一次結合との相関値が予め設定されたしきい 値より大きい場合前記相関信号の中の一つに類似するものとして放送情報を分類 するためのコンピュータ(1)とを備えたことを特徴とする放送信号分類装置。
JP03508688A 1990-05-02 1991-05-02 信号認識システムと方法 Expired - Fee Related JP3130926B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US07/517,835 US5210820A (en) 1990-05-02 1990-05-02 Signal recognition system and method
US517,835 1990-05-02

Publications (2)

Publication Number Publication Date
JPH05501166A true JPH05501166A (ja) 1993-03-04
JP3130926B2 JP3130926B2 (ja) 2001-01-31

Family

ID=24061421

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03508688A Expired - Fee Related JP3130926B2 (ja) 1990-05-02 1991-05-02 信号認識システムと方法

Country Status (9)

Country Link
US (1) US5210820A (ja)
EP (1) EP0480010B1 (ja)
JP (1) JP3130926B2 (ja)
AT (1) ATE142815T1 (ja)
CA (1) CA2041754C (ja)
DE (1) DE69122017T2 (ja)
ES (1) ES2091328T3 (ja)
HK (1) HK133697A (ja)
WO (1) WO1991017540A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008009442A (ja) * 2007-07-23 2008-01-17 Video Research:Kk 音声データ処理方法
JP2009529665A (ja) * 2006-03-09 2009-08-20 テールズ レーザ形状測定による識別方法

Families Citing this family (240)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2539274A1 (fr) * 1983-01-19 1984-07-20 Boussac Saint Freres Bsf Procede de fabrication de couches-culottes a jeter et couches-culottes obtenues
JP3277398B2 (ja) * 1992-04-15 2002-04-22 ソニー株式会社 有声音判別方法
US5745873A (en) * 1992-05-01 1998-04-28 Massachusetts Institute Of Technology Speech recognition using final decision based on tentative decisions
US5323337A (en) * 1992-08-04 1994-06-21 Loral Aerospace Corp. Signal detector employing mean energy and variance of energy content comparison for noise detection
JPH06110945A (ja) * 1992-09-29 1994-04-22 Fujitsu Ltd 音楽データベース作成装置及びその検索装置
GB9221678D0 (en) * 1992-10-15 1992-11-25 Taylor Nelson Group Limited Identifying a received programme stream
US7313251B2 (en) 1993-11-18 2007-12-25 Digimarc Corporation Method and system for managing and controlling electronic media
US5841978A (en) 1993-11-18 1998-11-24 Digimarc Corporation Network linking method using steganographically embedded data objects
US5748763A (en) 1993-11-18 1998-05-05 Digimarc Corporation Image steganography system featuring perceptually adaptive and globally scalable signal embedding
US5822436A (en) * 1996-04-25 1998-10-13 Digimarc Corporation Photographic products and methods employing embedded information
US5768426A (en) * 1993-11-18 1998-06-16 Digimarc Corporation Graphics processing system employing embedded code signals
US7515733B2 (en) * 1993-11-18 2009-04-07 Digimarc Corporation Methods and arrangements employing digital content items
JP2956473B2 (ja) * 1994-04-21 1999-10-04 日本電気株式会社 ベクトル量子化装置
US8094949B1 (en) 1994-10-21 2012-01-10 Digimarc Corporation Music methods and systems
US6560349B1 (en) * 1994-10-21 2003-05-06 Digimarc Corporation Audio monitoring using steganographic information
US7362775B1 (en) * 1996-07-02 2008-04-22 Wistaria Trading, Inc. Exchange mechanisms for digital information packages with bandwidth securitization, multichannel digital watermarks, and key management
EP0731446B1 (en) * 1995-03-08 2001-07-04 GENERALMUSIC S.p.A. A microprocessor device for selection and recognition of musical pieces
US7486799B2 (en) * 1995-05-08 2009-02-03 Digimarc Corporation Methods for monitoring audio and images on the internet
US6760463B2 (en) * 1995-05-08 2004-07-06 Digimarc Corporation Watermarking methods and media
US7805500B2 (en) * 1995-05-08 2010-09-28 Digimarc Corporation Network linking methods and apparatus
US7224819B2 (en) 1995-05-08 2007-05-29 Digimarc Corporation Integrating digital watermarks in multimedia content
US5613004A (en) * 1995-06-07 1997-03-18 The Dice Company Steganographic method and device
US6411725B1 (en) * 1995-07-27 2002-06-25 Digimarc Corporation Watermark enabled video objects
US6408331B1 (en) 1995-07-27 2002-06-18 Digimarc Corporation Computer linking methods using encoded graphics
US6577746B1 (en) 1999-12-28 2003-06-10 Digimarc Corporation Watermark-based object linking and embedding
US8429205B2 (en) * 1995-07-27 2013-04-23 Digimarc Corporation Associating data with media signals in media signal systems through auxiliary data steganographically embedded in the media signals
US6505160B1 (en) * 1995-07-27 2003-01-07 Digimarc Corporation Connected audio and other media objects
US7562392B1 (en) * 1999-05-19 2009-07-14 Digimarc Corporation Methods of interacting with audio and ambient music
US6965682B1 (en) 1999-05-19 2005-11-15 Digimarc Corp Data transmission by watermark proxy
US7171018B2 (en) * 1995-07-27 2007-01-30 Digimarc Corporation Portable devices and methods employing digital watermarking
US5712979A (en) * 1995-09-20 1998-01-27 Infonautics Corporation Method and apparatus for attaching navigational history information to universal resource locator links on a world wide web page
US5717860A (en) * 1995-09-20 1998-02-10 Infonautics Corporation Method and apparatus for tracking the navigation path of a user on the world wide web
US5819285A (en) * 1995-09-20 1998-10-06 Infonautics Corporation Apparatus for capturing, storing and processing co-marketing information associated with a user of an on-line computer service using the world-wide-web.
US5812769A (en) * 1995-09-20 1998-09-22 Infonautics Corporation Method and apparatus for redirecting a user to a new location on the world wide web using relative universal resource locators
JPH0990974A (ja) * 1995-09-25 1997-04-04 Nippon Telegr & Teleph Corp <Ntt> 信号処理方法
US6205249B1 (en) * 1998-04-02 2001-03-20 Scott A. Moskowitz Multiple transform utilization and applications for secure digital watermarking
US7664263B2 (en) 1998-03-24 2010-02-16 Moskowitz Scott A Method for combining transfer functions with predetermined key creation
US7095874B2 (en) 1996-07-02 2006-08-22 Wistaria Trading, Inc. Optimization methods for the insertion, protection, and detection of digital watermarks in digitized data
US7457962B2 (en) 1996-07-02 2008-11-25 Wistaria Trading, Inc Optimization methods for the insertion, protection, and detection of digital watermarks in digitized data
US7177429B2 (en) 2000-12-07 2007-02-13 Blue Spike, Inc. System and methods for permitting open access to data objects and for securing data within the data objects
US7346472B1 (en) * 2000-09-07 2008-03-18 Blue Spike, Inc. Method and device for monitoring and analyzing signals
US7159116B2 (en) 1999-12-07 2007-01-02 Blue Spike, Inc. Systems, methods and devices for trusted transactions
US5889868A (en) * 1996-07-02 1999-03-30 The Dice Company Optimization methods for the insertion, protection, and detection of digital watermarks in digitized data
US5892536A (en) * 1996-10-03 1999-04-06 Personal Audio Systems and methods for computer enhanced broadcast monitoring
US7055166B1 (en) 1996-10-03 2006-05-30 Gotuit Media Corp. Apparatus and methods for broadcast monitoring
US6088455A (en) * 1997-01-07 2000-07-11 Logan; James D. Methods and apparatus for selectively reproducing segments of broadcast programming
US5986692A (en) * 1996-10-03 1999-11-16 Logan; James D. Systems and methods for computer enhanced broadcast monitoring
US7751596B2 (en) * 1996-11-12 2010-07-06 Digimarc Corporation Methods and arrangements employing digital content items
US7730317B2 (en) 1996-12-20 2010-06-01 Wistaria Trading, Inc. Linear predictive coding implementation of digital watermarks
US6708146B1 (en) 1997-01-03 2004-03-16 Telecommunications Research Laboratories Voiceband signal classifier
JP3584458B2 (ja) * 1997-10-31 2004-11-04 ソニー株式会社 パターン認識装置およびパターン認識方法
US7689532B1 (en) 2000-07-20 2010-03-30 Digimarc Corporation Using embedded data with file sharing
US6263031B1 (en) * 1998-04-29 2001-07-17 Hughes Electronics Corp. Method and apparatus for signal burst classification
DE19821273B4 (de) * 1998-05-13 2006-10-05 Deutsche Telekom Ag Meßverfahren zur gehörrichtigen Qualitätsbewertung von codierten Audiosignalen
US7644282B2 (en) 1998-05-28 2010-01-05 Verance Corporation Pre-processed information embedding system
US7664264B2 (en) 1999-03-24 2010-02-16 Blue Spike, Inc. Utilizing data reduction in steganographic and cryptographic systems
US20070100757A1 (en) * 1999-05-19 2007-05-03 Rhoads Geoffrey B Content Protection Arrangements
US8752118B1 (en) 1999-05-19 2014-06-10 Digimarc Corporation Audio and video content-based methods
US8874244B2 (en) * 1999-05-19 2014-10-28 Digimarc Corporation Methods and systems employing digital content
US6895514B1 (en) * 1999-06-25 2005-05-17 Lucent Technologies Inc. Method and apparatus for achieving secure password access
GR1003625B (el) * 1999-07-08 2001-08-31 Μεθοδος χημικης αποθεσης συνθετων επικαλυψεων αγωγιμων πολυμερων σε επιφανειες κραματων αλουμινιου
US7475246B1 (en) 1999-08-04 2009-01-06 Blue Spike, Inc. Secure personal content server
JP3601371B2 (ja) 1999-09-27 2004-12-15 ヤマハ株式会社 波形生成方法及び装置
US6671407B1 (en) 1999-10-19 2003-12-30 Microsoft Corporation System and method for hashing digital images
CA2809775C (en) * 1999-10-27 2017-03-21 The Nielsen Company (Us), Llc Audio signature extraction and correlation
KR100364753B1 (ko) * 1999-11-19 2002-12-16 엘지전자 주식회사 칼라 히스토그램의 빈값 양자화 방법
EP1163795A1 (en) * 2000-01-13 2001-12-19 Koninklijke Philips Electronics N.V. Noise reduction
US6577346B1 (en) * 2000-01-24 2003-06-10 Webtv Networks, Inc. Recognizing a pattern in a video segment to identify the video segment
US6737957B1 (en) 2000-02-16 2004-05-18 Verance Corporation Remote control signaling using audio watermarks
US6834308B1 (en) 2000-02-17 2004-12-21 Audible Magic Corporation Method and apparatus for identifying media content presented on a media playing device
US6453252B1 (en) * 2000-05-15 2002-09-17 Creative Technology Ltd. Process for identifying audio content
US6970886B1 (en) * 2000-05-25 2005-11-29 Digimarc Corporation Consumer driven methods for associating content indentifiers with related web addresses
US7853664B1 (en) 2000-07-31 2010-12-14 Landmark Digital Services Llc Method and system for purchasing pre-recorded music
US6990453B2 (en) 2000-07-31 2006-01-24 Landmark Digital Services Llc System and methods for recognizing sound and music signals in high noise and distortion
US8205237B2 (en) 2000-09-14 2012-06-19 Cox Ingemar J Identifying works, using a sub-linear time search, such as an approximate nearest neighbor search, for initiating a work-based action, such as an action on the internet
US8010988B2 (en) * 2000-09-14 2011-08-30 Cox Ingemar J Using features extracted from an audio and/or video work to obtain information about the work
US7127615B2 (en) 2000-09-20 2006-10-24 Blue Spike, Inc. Security based on subliminal and supraliminal channels for data objects
FR2815760B1 (fr) * 2000-10-24 2003-01-24 Philippe Ecrement Procede de constitution d'un signal numerique representatif d'un signal sonore et procede de reconnaissance d'un signal sonore
US7277766B1 (en) 2000-10-24 2007-10-02 Moodlogic, Inc. Method and system for analyzing digital audio files
US7562012B1 (en) * 2000-11-03 2009-07-14 Audible Magic Corporation Method and apparatus for creating a unique audio signature
DE10058811A1 (de) * 2000-11-27 2002-06-13 Philips Corp Intellectual Pty Verfahren zur Identifizierung von Musikstücken
US20020072982A1 (en) 2000-12-12 2002-06-13 Shazam Entertainment Ltd. Method and system for interacting with a user in an experiential environment
DE10134471C2 (de) * 2001-02-28 2003-05-22 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Charakterisieren eines Signals und Verfahren und Vorrichtung zum Erzeugen eines indexierten Signals
DE10109648C2 (de) * 2001-02-28 2003-01-30 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Charakterisieren eines Signals und Verfahren und Vorrichtung zum Erzeugen eines indexierten Signals
US7359889B2 (en) 2001-03-02 2008-04-15 Landmark Digital Services Llc Method and apparatus for automatically creating database for use in automated media recognition system
TW582022B (en) * 2001-03-14 2004-04-01 Ibm A method and system for the automatic detection of similar or identical segments in audio recordings
EP1490767B1 (en) 2001-04-05 2014-06-11 Audible Magic Corporation Copyright detection and protection system and method
DE10117870B4 (de) * 2001-04-10 2005-06-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren und Vorrichtung zum Überführen eines Musiksignals in eine Noten-basierte Beschreibung und Verfahren und Vorrichtung zum Referenzieren eines Musiksignals in einer Datenbank
US7356188B2 (en) * 2001-04-24 2008-04-08 Microsoft Corporation Recognizer of text-based work
US6973574B2 (en) * 2001-04-24 2005-12-06 Microsoft Corp. Recognizer of audio-content in digital signals
US7020775B2 (en) 2001-04-24 2006-03-28 Microsoft Corporation Derivation and quantization of robust non-local characteristics for blind watermarking
US6996273B2 (en) 2001-04-24 2006-02-07 Microsoft Corporation Robust recognizer of perceptually similar content
US6975743B2 (en) * 2001-04-24 2005-12-13 Microsoft Corporation Robust and stealthy video watermarking into regions of successive frames
US7046819B2 (en) 2001-04-25 2006-05-16 Digimarc Corporation Encoded reference signal for digital watermarks
US20060212442A1 (en) * 2001-05-16 2006-09-21 Pandora Media, Inc. Methods of Presenting and Providing Content to a User
US7003515B1 (en) * 2001-05-16 2006-02-21 Pandora Media, Inc. Consumer item matching method and system
US7962482B2 (en) * 2001-05-16 2011-06-14 Pandora Media, Inc. Methods and systems for utilizing contextual feedback to generate and modify playlists
US20060206478A1 (en) * 2001-05-16 2006-09-14 Pandora Media, Inc. Playlist generating methods
US6993532B1 (en) 2001-05-30 2006-01-31 Microsoft Corporation Auto playlist generator
US6968337B2 (en) * 2001-07-10 2005-11-22 Audible Magic Corporation Method and apparatus for identifying an unknown work
US7529659B2 (en) * 2005-09-28 2009-05-05 Audible Magic Corporation Method and apparatus for identifying an unknown work
DE10133333C1 (de) * 2001-07-10 2002-12-05 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erzeugen eines Fingerabdrucks und Verfahren und Vorrichtung zum Identifizieren eines Audiosignals
US7877438B2 (en) * 2001-07-20 2011-01-25 Audible Magic Corporation Method and apparatus for identifying new media content
AU2002346116A1 (en) * 2001-07-20 2003-03-03 Gracenote, Inc. Automatic identification of sound recordings
US8972481B2 (en) * 2001-07-20 2015-03-03 Audible Magic, Inc. Playlist generation method and apparatus
US6724914B2 (en) * 2001-10-16 2004-04-20 Digimarc Corporation Progressive watermark decoding on a distributed computing platform
US20030135623A1 (en) * 2001-10-23 2003-07-17 Audible Magic, Inc. Method and apparatus for cache promotion
US7065544B2 (en) * 2001-11-29 2006-06-20 Hewlett-Packard Development Company, L.P. System and method for detecting repetitions in a multimedia stream
US6995309B2 (en) 2001-12-06 2006-02-07 Hewlett-Packard Development Company, L.P. System and method for music identification
US6714605B2 (en) * 2002-04-22 2004-03-30 Cognio, Inc. System and method for real-time spectrum analysis in a communication device
US6850735B2 (en) * 2002-04-22 2005-02-01 Cognio, Inc. System and method for signal classiciation of signals in a frequency band
US7287275B2 (en) 2002-04-17 2007-10-23 Moskowitz Scott A Methods, systems and devices for packet watermarking and efficient provisioning of bandwidth
US7254191B2 (en) * 2002-04-22 2007-08-07 Cognio, Inc. System and method for real-time spectrum analysis in a radio device
US7116943B2 (en) * 2002-04-22 2006-10-03 Cognio, Inc. System and method for classifying signals occuring in a frequency band
US7292656B2 (en) * 2002-04-22 2007-11-06 Cognio, Inc. Signal pulse detection scheme for use in real-time spectrum analysis
EP1504445B1 (en) * 2002-04-25 2008-08-20 Landmark Digital Services LLC Robust and invariant audio pattern matching
US7082394B2 (en) * 2002-06-25 2006-07-25 Microsoft Corporation Noise-robust feature extraction using multi-layer principal component analysis
US7006703B2 (en) * 2002-06-28 2006-02-28 Microsoft Corporation Content recognizer via probabilistic mirror distribution
US7095873B2 (en) 2002-06-28 2006-08-22 Microsoft Corporation Watermarking via quantization of statistics of overlapping regions
ATE455347T1 (de) * 2002-07-10 2010-01-15 Palm Inc Verfahren zum auffinden einer tonfolge
US20040091111A1 (en) * 2002-07-16 2004-05-13 Levy Kenneth L. Digital watermarking and fingerprinting applications
JP2005534051A (ja) 2002-07-22 2005-11-10 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 信号エンコーダのタイプ決定
US7171161B2 (en) * 2002-07-30 2007-01-30 Cognio, Inc. System and method for classifying signals using timing templates, power templates and other techniques
US8171567B1 (en) * 2002-09-04 2012-05-01 Tracer Detection Technology Corp. Authentication method and system
JP2006504986A (ja) 2002-10-15 2006-02-09 ベランス・コーポレイション メディア・モニタリング、管理および情報システム
DE20321797U1 (de) 2002-12-17 2010-06-10 Sony France S.A. Vorrichtung zum automatischen Erzeugen einer allgemeinen Extraktionsfunktion, die aus einem Eingabesignal berechenbar ist, z.B. einem Audiosignal, um daraus einen vorbestimmten globalen charakteristischen Wert seines Inhalts zu erzeugen, z.B. einen Deskriptor
EP1437711A1 (en) * 2002-12-17 2004-07-14 Sony France S.A. Method and apparatus for generating a function to extract a global characteristic value of a signal contents
US6958103B2 (en) * 2002-12-23 2005-10-25 Kimberly-Clark Worldwide, Inc. Entangled fabrics containing staple fibers
US8332326B2 (en) * 2003-02-01 2012-12-11 Audible Magic Corporation Method and apparatus to identify a work received by a processing system
EP2456104A1 (en) 2003-02-10 2012-05-23 Nielsen Media Research, Inc. Methods and apparatus to adaptively gather audience measurement data
US7606790B2 (en) 2003-03-03 2009-10-20 Digimarc Corporation Integrating and enhancing searching of media content and biometric databases
US20040208169A1 (en) * 2003-04-18 2004-10-21 Reznik Yuriy A. Digital audio signal compression method and apparatus
US7742926B2 (en) * 2003-04-18 2010-06-22 Realnetworks, Inc. Digital audio signal compression method and apparatus
WO2004095758A2 (en) * 2003-04-22 2004-11-04 Cognio, Inc. Signal classification methods for scanning receiver and other applications
US7349663B1 (en) * 2003-04-24 2008-03-25 Leave A Little Room Foundation Internet radio station and disc jockey system
US7573419B2 (en) * 2003-05-21 2009-08-11 Telefonaktiebolaget Lm Ericsson (Publ) Method and system for unambiguous angle resolution of a sparse wide-band antenna array
US9055239B2 (en) * 2003-10-08 2015-06-09 Verance Corporation Signal continuity assessment using embedded watermarks
US20070039018A1 (en) * 2005-08-09 2007-02-15 Verance Corporation Apparatus, systems and methods for broadcast advertising stewardship
US20060239501A1 (en) 2005-04-26 2006-10-26 Verance Corporation Security enhancements of digital watermarks for multi-media content
US7369677B2 (en) 2005-04-26 2008-05-06 Verance Corporation System reactions to the detection of embedded watermarks in a digital host content
US7831832B2 (en) * 2004-01-06 2010-11-09 Microsoft Corporation Digital goods representation based upon matrix invariances
US20050165690A1 (en) * 2004-01-23 2005-07-28 Microsoft Corporation Watermarking via quantization of rational statistics of regions
US7852259B2 (en) 2004-01-23 2010-12-14 Telefonaktiebolaget Lm Ericsson (Publ) Clutter filtering
EP1719273A4 (en) 2004-02-19 2009-07-15 Landmark Digital Services Llc METHOD AND DEVICE FOR IDENTIFYING THE RADIATION SOURCE
CA2563370A1 (en) 2004-04-19 2005-11-03 Landmark Digital Services Llc Method and system for content sampling and identification
US8688248B2 (en) * 2004-04-19 2014-04-01 Shazam Investments Limited Method and system for content sampling and identification
US7770014B2 (en) * 2004-04-30 2010-08-03 Microsoft Corporation Randomized signal transforms and their applications
JP2008504741A (ja) * 2004-06-24 2008-02-14 ランドマーク、ディジタル、サーヴィセズ、エルエルシー 2つのメディア・セグメントの重なりを特徴付ける方法
JP4358229B2 (ja) * 2004-07-09 2009-11-04 日本電信電話株式会社 信号検出システム、信号検出サーバ、信号検出方法及びプログラム
US8130746B2 (en) 2004-07-28 2012-03-06 Audible Magic Corporation System for distributing decoy content in a peer to peer network
US7567899B2 (en) * 2004-12-30 2009-07-28 All Media Guide, Llc Methods and apparatus for audio recognition
US7451078B2 (en) * 2004-12-30 2008-11-11 All Media Guide, Llc Methods and apparatus for identifying media objects
ES2349961T3 (es) * 2005-01-21 2011-01-13 Cugate Ag Método de generación de una huella para una señal útil.
CA2595634C (en) 2005-02-08 2014-12-30 Landmark Digital Services Llc Automatic identification of repeated material in audio signals
JP4332129B2 (ja) * 2005-04-20 2009-09-16 富士通株式会社 文書分類プログラム、文書分類方法および文書分類装置
US20060242198A1 (en) * 2005-04-22 2006-10-26 Microsoft Corporation Methods, computer-readable media, and data structures for building an authoritative database of digital audio identifier elements and identifying media items
US7647128B2 (en) * 2005-04-22 2010-01-12 Microsoft Corporation Methods, computer-readable media, and data structures for building an authoritative database of digital audio identifier elements and identifying media items
US20060270371A1 (en) * 2005-05-31 2006-11-30 Sugar Gary L Tracking short-term maximum power spectrum density for improved visibility of low duty cycle signals
CA2613145A1 (en) * 2005-06-24 2006-12-28 Monash University Speech analysis system
US8020004B2 (en) 2005-07-01 2011-09-13 Verance Corporation Forensic marking using a common customization function
US8781967B2 (en) * 2005-07-07 2014-07-15 Verance Corporation Watermarking in an encrypted domain
US20070076869A1 (en) * 2005-10-03 2007-04-05 Microsoft Corporation Digital goods representation based upon matrix invariants using non-negative matrix factorizations
US20070162761A1 (en) 2005-12-23 2007-07-12 Davis Bruce L Methods and Systems to Help Detect Identity Fraud
DE102006004202B4 (de) * 2006-01-27 2008-02-14 Nec Europe Ltd. Verfahren zum Schutz von SIP basierten Anwendungen
US7735101B2 (en) 2006-03-28 2010-06-08 Cisco Technology, Inc. System allowing users to embed comments at specific points in time into media presentation
US20070239675A1 (en) * 2006-03-29 2007-10-11 Microsoft Corporation Web search media service
MX2007015979A (es) 2006-03-31 2009-04-07 Nielsen Media Res Inc Metodos, sistemas y aparato para medicion de multiples fines.
WO2007134108A2 (en) * 2006-05-09 2007-11-22 Cognio, Inc. System and method for identifying wireless devices using pulse fingerprinting and sequence analysis
US7873514B2 (en) * 2006-08-11 2011-01-18 Ntt Docomo, Inc. Method for quantizing speech and audio through an efficient perceptually relevant search of multiple quantization patterns
US8239190B2 (en) * 2006-08-22 2012-08-07 Qualcomm Incorporated Time-warping frames of wideband vocoder
US8738749B2 (en) 2006-08-29 2014-05-27 Digimarc Corporation Content monitoring and host compliance evaluation
US8707459B2 (en) 2007-01-19 2014-04-22 Digimarc Corporation Determination of originality of content
EP2070231B1 (en) * 2006-10-03 2013-07-03 Shazam Entertainment, Ltd. Method for high throughput of identification of distributed broadcast content
US9179200B2 (en) 2007-03-14 2015-11-03 Digimarc Corporation Method and system for determining content treatment
US10242415B2 (en) 2006-12-20 2019-03-26 Digimarc Corporation Method and system for determining content treatment
GB2460773B (en) 2007-02-20 2010-10-27 Nielsen Co Methods and apparatus for characterizing media
US8453170B2 (en) * 2007-02-27 2013-05-28 Landmark Digital Services Llc System and method for monitoring and recognizing broadcast data
WO2008137385A2 (en) * 2007-05-02 2008-11-13 Nielsen Media Research, Inc. Methods and apparatus for generating signatures
US7840177B2 (en) * 2007-05-23 2010-11-23 Landmark Digital Services, Llc Device for monitoring multiple broadcast signals
US8006314B2 (en) 2007-07-27 2011-08-23 Audible Magic Corporation System for identifying content of digital data
US7917347B2 (en) * 2007-10-30 2011-03-29 International Business Machines Corporation Generating a worst case current waveform for testing of integrated circuit devices
CA2858944C (en) 2007-11-12 2017-08-22 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
US8457951B2 (en) 2008-01-29 2013-06-04 The Nielsen Company (Us), Llc Methods and apparatus for performing variable black length watermarking of media
CA2717723C (en) * 2008-03-05 2016-10-18 The Nielsen Company (Us), Llc Methods and apparatus for generating signatures
WO2009151578A2 (en) * 2008-06-09 2009-12-17 The Board Of Trustees Of The University Of Illinois Method and apparatus for blind signal recovery in noisy, reverberant environments
US8259938B2 (en) 2008-06-24 2012-09-04 Verance Corporation Efficient and secure forensic marking in compressed
US8199651B1 (en) 2009-03-16 2012-06-12 Audible Magic Corporation Method and system for modifying communication flows at a port level
US8712109B2 (en) * 2009-05-08 2014-04-29 Microsoft Corporation Pose-variant face recognition using multiscale local descriptors
JP5710604B2 (ja) 2009-05-21 2015-04-30 ディジマーク コーポレイション ウォーターマーキングとフィンガープリンティングとの組合せ
US9449090B2 (en) 2009-05-29 2016-09-20 Vizio Inscape Technologies, Llc Systems and methods for addressing a media database using distance associative hashing
US10949458B2 (en) * 2009-05-29 2021-03-16 Inscape Data, Inc. System and method for improving work load management in ACR television monitoring system
US8595781B2 (en) 2009-05-29 2013-11-26 Cognitive Media Networks, Inc. Methods for identifying video segments and displaying contextual targeted content on a connected television
US9094715B2 (en) 2009-05-29 2015-07-28 Cognitive Networks, Inc. Systems and methods for multi-broadcast differentiation
US8620967B2 (en) * 2009-06-11 2013-12-31 Rovi Technologies Corporation Managing metadata for occurrences of a recording
US8738354B2 (en) * 2009-06-19 2014-05-27 Microsoft Corporation Trans-lingual representation of text documents
US20110041154A1 (en) * 2009-08-14 2011-02-17 All Media Guide, Llc Content Recognition and Synchronization on a Television or Consumer Electronics Device
US20110078020A1 (en) * 2009-09-30 2011-03-31 Lajoie Dan Systems and methods for identifying popular audio assets
US8161071B2 (en) 2009-09-30 2012-04-17 United Video Properties, Inc. Systems and methods for audio asset storage and management
US8677400B2 (en) * 2009-09-30 2014-03-18 United Video Properties, Inc. Systems and methods for identifying audio content using an interactive media guidance application
US8521779B2 (en) 2009-10-09 2013-08-27 Adelphoi Limited Metadata record generation
US20110173185A1 (en) * 2010-01-13 2011-07-14 Rovi Technologies Corporation Multi-stage lookup for rolling audio recognition
US8886531B2 (en) * 2010-01-13 2014-11-11 Rovi Technologies Corporation Apparatus and method for generating an audio fingerprint and using a two-stage query
US9026034B2 (en) 2010-05-04 2015-05-05 Project Oda, Inc. Automatic detection of broadcast programming
CN102959544B (zh) 2010-05-04 2016-06-08 沙扎姆娱乐有限公司 用于同步媒体的方法和系统
EP2580750B1 (en) 2010-06-09 2014-05-14 Adelphoi Limited System and method for audio media recognition
US8838977B2 (en) 2010-09-16 2014-09-16 Verance Corporation Watermark extraction and content screening in a networked environment
WO2013012952A1 (en) 2011-07-18 2013-01-24 Viggle Inc System and method for tracking and rewarding media and entertainment usage including substanitally real time rewards
US9384729B2 (en) 2011-07-20 2016-07-05 Tata Consultancy Services Limited Method and system for detecting boundary of coarticulated units from isolated speech
US8615104B2 (en) 2011-11-03 2013-12-24 Verance Corporation Watermark extraction based on tentative watermarks
US8533481B2 (en) 2011-11-03 2013-09-10 Verance Corporation Extraction of embedded watermarks from a host content based on extrapolation techniques
US8923548B2 (en) 2011-11-03 2014-12-30 Verance Corporation Extraction of embedded watermarks from a host content using a plurality of tentative watermarks
US8682026B2 (en) 2011-11-03 2014-03-25 Verance Corporation Efficient extraction of embedded watermarks in the presence of host content distortions
US8745403B2 (en) 2011-11-23 2014-06-03 Verance Corporation Enhanced content management based on watermark extraction records
US9323902B2 (en) 2011-12-13 2016-04-26 Verance Corporation Conditional access using embedded watermarks
US9547753B2 (en) 2011-12-13 2017-01-17 Verance Corporation Coordinated watermarking
US9292894B2 (en) 2012-03-14 2016-03-22 Digimarc Corporation Content recognition and synchronization using local caching
WO2013184520A1 (en) 2012-06-04 2013-12-12 Stone Troy Christopher Methods and systems for identifying content types
US9282366B2 (en) 2012-08-13 2016-03-08 The Nielsen Company (Us), Llc Methods and apparatus to communicate audience measurement information
US9571606B2 (en) 2012-08-31 2017-02-14 Verance Corporation Social media viewing system
US8977374B1 (en) * 2012-09-12 2015-03-10 Google Inc. Geometric and acoustic joint learning
US8726304B2 (en) 2012-09-13 2014-05-13 Verance Corporation Time varying evaluation of multimedia content
US8869222B2 (en) 2012-09-13 2014-10-21 Verance Corporation Second screen content
US20140075469A1 (en) 2012-09-13 2014-03-13 Verance Corporation Content distribution including advertisements
US9081778B2 (en) 2012-09-25 2015-07-14 Audible Magic Corporation Using digital fingerprints to associate data with a work
WO2014153199A1 (en) 2013-03-14 2014-09-25 Verance Corporation Transactional video marking system
US9251549B2 (en) 2013-07-23 2016-02-02 Verance Corporation Watermark extractor enhancements based on payload ranking
US9208334B2 (en) 2013-10-25 2015-12-08 Verance Corporation Content management using multiple abstraction layers
US9955192B2 (en) 2013-12-23 2018-04-24 Inscape Data, Inc. Monitoring individual viewing of television events using tracking pixels and cookies
CN106170988A (zh) 2014-03-13 2016-11-30 凡瑞斯公司 使用嵌入式代码的交互式内容获取
US9699499B2 (en) 2014-04-30 2017-07-04 The Nielsen Company (Us), Llc Methods and apparatus to measure exposure to streaming media
US9905233B1 (en) 2014-08-07 2018-02-27 Digimarc Corporation Methods and apparatus for facilitating ambient content recognition using digital watermarks, and related arrangements
EP3251370A1 (en) 2015-01-30 2017-12-06 Inscape Data, Inc. Methods for identifying video segments and displaying option to view from an alternative source and/or on an alternative device
JP5956624B1 (ja) * 2015-02-02 2016-07-27 西日本高速道路エンジニアリング四国株式会社 異常音の検出方法及びその検出値を用いた構造物の異常判定方法、並びに、振動波の類似度検出方法及びその検出値を用いた音声認識方法
MX2017013128A (es) 2015-04-17 2018-01-26 Inscape Data Inc Sistemas y metodos para reducir densidad de los datos en grandes conjuntos de datos.
WO2016172363A1 (en) 2015-04-24 2016-10-27 Cyber Resonance Corporation Methods and systems for performing signal analysis to identify content types
CA3216076A1 (en) 2015-07-16 2017-01-19 Inscape Data, Inc. Detection of common media segments
US10080062B2 (en) 2015-07-16 2018-09-18 Inscape Data, Inc. Optimizing media fingerprint retention to improve system resource utilization
CN108351879B (zh) 2015-07-16 2022-02-18 构造数据有限责任公司 用于提高识别媒体段的效率的划分搜索索引的系统和方法
US10397749B1 (en) * 2017-11-09 2019-08-27 Sprint Communications Company L.P. Systems and methods for detection, identification, and use of environmental audio signatures
US11269635B1 (en) * 2019-10-21 2022-03-08 Accenture Global Solutions Limited Hardware efficient statistical moment computation

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3919479A (en) * 1972-09-21 1975-11-11 First National Bank Of Boston Broadcast signal identification system
DE2536640C3 (de) * 1975-08-16 1979-10-11 Philips Patentverwaltung Gmbh, 2000 Hamburg Anordnung zur Erkennung von Geräuschen
US4053710A (en) * 1976-03-01 1977-10-11 Ncr Corporation Automatic speaker verification systems employing moment invariants
JPS5525150A (en) * 1978-08-10 1980-02-22 Nec Corp Pattern recognition unit
US4450531A (en) * 1982-09-10 1984-05-22 Ensco, Inc. Broadcast signal recognition system and method
US4697209A (en) * 1984-04-26 1987-09-29 A. C. Nielsen Company Methods and apparatus for automatically identifying programs viewed or recorded
US4677466A (en) * 1985-07-29 1987-06-30 A. C. Nielsen Company Broadcast program identification method and apparatus
JPH067343B2 (ja) * 1987-02-23 1994-01-26 株式会社東芝 パタ−ン識別装置
US4843562A (en) * 1987-06-24 1989-06-27 Broadcast Data Systems Limited Partnership Broadcast information classification system and method

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009529665A (ja) * 2006-03-09 2009-08-20 テールズ レーザ形状測定による識別方法
JP2014016353A (ja) * 2006-03-09 2014-01-30 Thales レーザ形状測定による識別方法
JP2008009442A (ja) * 2007-07-23 2008-01-17 Video Research:Kk 音声データ処理方法

Also Published As

Publication number Publication date
WO1991017540A1 (en) 1991-11-14
ES2091328T3 (es) 1996-11-01
CA2041754A1 (en) 1991-11-03
HK133697A (en) 1997-10-24
EP0480010A1 (en) 1992-04-15
EP0480010B1 (en) 1996-09-11
JP3130926B2 (ja) 2001-01-31
US5210820A (en) 1993-05-11
DE69122017D1 (de) 1996-10-17
ATE142815T1 (de) 1996-09-15
CA2041754C (en) 2004-12-28
DE69122017T2 (de) 1997-04-10

Similar Documents

Publication Publication Date Title
JPH05501166A (ja) 信号認識システムと方法
US11837208B2 (en) Audio processing techniques for semantic audio recognition and report generation
US11087726B2 (en) Audio matching with semantic audio recognition and report generation
US9640156B2 (en) Audio matching with supplemental semantic audio recognition and report generation
KR960000152B1 (ko) 방송 정보 분류시스템 및 방법
US7184955B2 (en) System and method for indexing videos based on speaker distinction
US6570991B1 (en) Multi-feature speech/music discrimination system
CN101292280B (zh) 导出音频输入信号的一个特征集的方法
CN111279414B (zh) 用于声音场景分类的基于分段的特征提取
Carletti et al. Audio surveillance using a bag of aural words classifier
WO1995017054A1 (en) Adaptive system for broadcast program identification and reporting
CN110880329A (zh) 一种音频识别方法及设备、存储介质
Ramalingam et al. Gaussian mixture modeling using short time fourier transform features for audio fingerprinting
CN106971725B (zh) 一种具有优先级的声纹识方法和系统
Rahinj et al. Active Learning Based Audio Tampering Detection
Song An Automatic Commercial Search Application for TV Broadcasting Using Audio Fingerprinting
Szczepański et al. Music Information Retrieval. A case study of MIR in modern rock and metal music
Vozarikova et al. Acoustic Event Detection Based on MRMR Selected Feature Vectors
Grecu et al. MIREX 2010 POSTPROCESSING AUDIO DESCRIPTORS FOR IMPROVED AUDIO CLASSIFICATION
Ravindran et al. IMPROVING THE NOISE-ROBUSTNESS OF MEL-FREQUENCY CEPSTRAL COEFFICIENTS FOR SPEECH DISCRIMINATION
Liang et al. REHEARSAL AUDIO STREAM SEGMENTATION AND CLUSTERING

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees