JP5259910B2 - コンテンツ識別システム - Google Patents
コンテンツ識別システム Download PDFInfo
- Publication number
- JP5259910B2 JP5259910B2 JP2004221250A JP2004221250A JP5259910B2 JP 5259910 B2 JP5259910 B2 JP 5259910B2 JP 2004221250 A JP2004221250 A JP 2004221250A JP 2004221250 A JP2004221250 A JP 2004221250A JP 5259910 B2 JP5259910 B2 JP 5259910B2
- Authority
- JP
- Japan
- Prior art keywords
- media program
- segment
- frequency domain
- program
- segments
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000001914 filtration Methods 0.000 claims abstract 6
- 238000000034 method Methods 0.000 claims description 81
- 230000008569 process Effects 0.000 claims description 46
- 238000010606 normalization Methods 0.000 claims description 10
- 238000009499 grossing Methods 0.000 claims description 3
- 230000001131 transforming effect Effects 0.000 claims 1
- 230000006870 function Effects 0.000 description 16
- 238000012545 processing Methods 0.000 description 7
- 230000008859 change Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000002411 adverse Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 241001342895 Chorus Species 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- HAORKNGNJCEJBX-UHFFFAOYSA-N cyprodinil Chemical compound N=1C(C)=CC(C2CC2)=NC=1NC1=CC=CC=C1 HAORKNGNJCEJBX-UHFFFAOYSA-N 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/11—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information not detectable on the record carrier
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
Description
この説明では、図面の別の図内であっても、同じ番号を付した構成要素は同じ構成要素を意味している。
[x]は、現在のトライアンギュラ・フィルタの正規化値であり、
μは、直前のS秒のオーディオに対応するフレーム数を有するウィンドウにわたる、減少させた係数のすべてに関する平均であり、
Qは、直前のS秒のオーディオにおけるトライアンギュラ・フィルタ出力の数であり、
tは、現在の時刻であり、
σは、計算された標準偏差である。
Ntはそのメディア・プログラム内の総フレーム数であり、
Nsは1セグメントあたりのフレーム数(例えば、12)であり、
MIN_GAP_SECONDSはギャップの最小長さを秒単位で表したユーザ選択の値であり、そのプログラム・コンテンツが歌でありかつ各セグメントが約1秒の長さである場合に有用な値は5秒である。そのプログラム・コンテンツがコマーシャル向けなど比較的短い(例えば、30秒である)場合には、MIN_GAP_SECONDSに関して1秒が有用な値となりうる、
Ng=最小ギャップ1つあたりのフレーム数、すなわち、MIN_GAP_SECONDSにサンプリングレートを乗算しかつ1フレームあたりのサンプル数で割り算した値であり、
Nw=1つの検索ウィンドウ内のフレーム数である(実現者によって、2Ng+Nsとなるように選択される)。
上式において、
Sj_(Pi)は、識別しようとするメディア・プログラムに対応する可能性があるようなデータベース内の現在の候補プログラムPiの保存されている第j番目のセグメントであり、
S'jは、識別しようとするメディア・プログラムのうち、データベース内にある現在の候補プログラムPiの保存されている第j番目のセグメントと時間的に対応するセグメント(識別しようとするプログラムのうちのj=Zのセグメントがデータベース内にある現在の候補プログラムPiの主要セグメントに対応すると仮定する)であり、そして、
εj_は、データベース内にある現在の候補プログラムPiのセグメントjに関して実験的に計算されたしきい値(εj_を決定する方法については本明細書の以下でさらに記載することにする)である。
speed%は、再生速度変更の百分率(負の値は速度低下を意味し、正の数は速度上昇を意味している)であり、
Δは、実際の位置とそのデータベース内の指定により予測される位置との差(Δが0より大きいとは、識別しようとするメディア・プログラム内のセグメントに到達するための時間が、対応するメディア・プログラムをデータベース内に保存されているそのセグメントに関して処理した時点と比較してより長くなっているため速度低下を含意しており、またΔが0未満であるとは、識別しようとするメディア・プログラム内のセグメントに到達するための時間が、対応するメディア・プログラムをデータベース内に保存されているそのセグメントに関して処理した時点と比較してより短くなっているため、速度上昇を含意している)であり、そして、
ExpectedLocationは、そのデータベース内の指定により予測されるセグメントの位置である。
オーバーラップ・スコア=(tend−tbegin)/(P1の終了時刻−P1の開始時刻)
上式において、
tendは、min(P0、P1の終了時刻)であり、かつ
tbeginは、max(P0、P1の開始時刻)である。
さらに、データベース内に識別しようとするプログラムと十分な相関をもってマッチするメディアが見いだされない場合は、識別を不可能とさせることができる。
Claims (29)
- メディア・プログラムのコンテンツの認識に使用するための方法であって、
前記メディア・プログラムのブロックの各第1の周波数領域表現を複数のフィルタを用いてフィルタリングし、前記メディア・プログラムの前記ブロックの各々のそれぞれの第2の周波数領域表現であって、前記第1の周波数領域表現に対して周波数係数の数を減少させている第2の周波数領域表現を作成する工程と、
セグメントを形成させるように前記ブロックの前記第2の周波数領域表現の周波数係数をグループ分けする工程と、
複数の前記セグメントを選択する工程と、
選択された前記セグメントを記憶されたプログラムの特徴と比較して、前記メディア・プログラムを識別する工程と、
後続のメディア・プログラムのサブセットが最初のメディア・プログラムのサブセットとの類似性を示すかを決定する工程とを含む方法。 - セグメントを形成させるような前記第2の周波数領域の周波数係数の各グループ分けが前記メディア・プログラム内で時間的に連続するブロックを表している請求項1に記載の方法。
- 前記複数のフィルタが一度に1ブロックを処理する1つのグループに配置させており、前記第2の周波数領域表現のうち各ブロックに関するフィルタの前記グループによって生成される部分が1つのフレームを形成しており、かつ少なくとも2つのフレームが1つのセグメントを形成するようにグループ分けされている請求項1に記載の方法。
- 前記選択したセグメントは前記メディア・プログラムのうち時間的に連続していない部分に対応している請求項1に記載の方法。
- 前記複数のフィルタが少なくとも1つのトライアンギュラ・フィルタの組を含んでいる請求項1に記載の方法。
- 前記複数のフィルタが少なくとも1つの対数間隔トライアンギュラ・フィルタの組を含んでいる請求項1に記載の方法。
- 前記選択の工程で選択したセグメントは最も大きな最小セグメント・エネルギーを有するセグメントである請求項1に記載の方法。
- 前記選択の工程で選択したセグメントは、前記セグメントが互いに接近しすぎることを防止するように所定の制約に従って選択されている請求項1に記載の方法。
- 前記選択の工程で選択したセグメントは、ギャップによって分離させた所定の検索ウィンドウと時間的に対応する前記メディア・プログラムの部分を包含するように選択されている請求項1に記載の方法。
- 前記選択の工程で選択したセグメントは選択したセグメントにわたって最大のエントロピーを有する選択したセグメントを生じさせるようなセグメントである請求項1に記載の方法。
- 前記グループ分け工程の実行後に、前記第2の周波数領域表現において前記周波数係数を正規化する工程であって、セグメント単位で実行される規格化工程をさらに含む請求項1に記載の方法。
- 前記規格化工程は少なくとも1回の先行時間規格化を実行する工程を含む請求項11に記載の方法。
- 前記規格化工程は少なくとも1回のL2規格化を実行する工程を含む請求項11に記載の方法。
- 前記選択したセグメントを前記メディア・プログラムの識別子と関連付けしてデータベース内に保存する工程をさらに含む請求項1に記載の方法。
- 前記データベース内に前記選択したセグメントのタイミングを示す情報を保存する工程をさらに含む請求項14に記載の方法。
- 前記メディア・プログラムのブロックの前記第1の周波数領域表現が、
前記データベース内に保存させようとする前記メディア・プログラムのオーディオ表現をデジタル化する工程と、
デジタル化したオーディオ表現を所定のサンプル数からなるブロックに分割する工程と、
前記ブロックをフィルタを用いて平滑化する工程と、
前記平滑化したブロックが周波数係数によって表現されるように前記平滑化したブロックを周波数領域に変換する工程と、
によって作成されている請求項1に記載の方法。 - メディア・プログラムのコンテンツの認識に使用するための装置であって、
前記メディア・プログラムの第1の周波数領域表現を複数のフィルタを用いてフィルタリングし、前記メディア・プログラムの第2の周波数領域表現であって、前記第1の周波数領域表現に対して周波数係数の数を減少させている第2の周波数領域表現を作成するための手段と、
セグメントを形成させるように前記第2の周波数領域表現のそれぞれをグループ分けするための手段と、
複数の前記セグメントを選択するための手段と、
後続のメディア・プログラムのサブセットが最初のメディア・プログラムのサブセットとの類似性を示すかを決定するための手段とを備える装置。 - メディア・プログラムのコンテンツの認識に使用するための方法であって、
前記メディア・プログラムのブロックの各第1の周波数領域表現を複数のフィルタを用いてフィルタリングし、前記メディア・プログラムの前記ブロックの各々のそれぞれの第2の周波数領域表現であって、前記第1の周波数領域表現に対して周波数係数の数を減少させている第2の周波数領域表現を作成する工程と、
セグメントを形成させるように前記ブロックの前記第2の周波数領域表現の周波数係数をグループ分けする工程と、
マッチング・セグメントを探すように、メディア・プログラムのセグメントおよびそれぞれの対応するプログラム識別子をその内部に保存しているようなデータベースを検索する工程と、
後続のメディア・プログラムのサブセットが最初のメディア・プログラムのサブセットとの類似性を示すかを決定する工程とを含む方法。 - 前記検索工程の間に前記データベース内にマッチング・セグメントが発見できないときに前記メディア・プログラムが識別できないことを示す工程をさらに含む請求項18に記載の方法。
- 前記データベースは、その内部で識別された各それぞれのメディア・プログラムのセグメントのタイミングを示す情報を含んでおり、かつ前記グループ分け工程の間に生成された前記セグメントのタイミングが前記データベース内に保存されている前記セグメントのタイミングとマッチした場合にのみ前記検索工程の間にマッチを見いだすことができる請求項18に記載の方法。
- セグメント間での前記マッチングがセグメント間のユークリッド距離に基づいている請求項18に記載の方法。
- 前記検索工程の間に前記データベース内にマッチング・セグメントが発見できないときに、前記メディア・プログラムが最良マッチング・スコアを有する前記データベース内に保存されている識別子が示すメディア・プログラムであると識別する工程をさらに含む請求項18に記載の方法。
- 前記メディア・プログラムと前記識別工程の間に識別されたメディア・プログラムとの間の速度差を決定する工程をさらに含む請求項22に記載の方法。
- 前記フィルタリングの工程、グループ分けの工程、検索の工程および識別の工程を反復する工程と、
別のマッチがあったときに、前記識別されたプログラムが前記反復の前に決定したのと同じプログラムであるのかあるいは異なるプログラムであるのかを決定する工程と、
をさらに含む請求項22に記載の方法。 - 前記決定の工程がオーバーラップ・スコアに基づいている請求項25に記載の方法。
- オーバーラップ・スコアが、前記反復の前に決定した前記プログラムP0と、前記反復の間に決定した前記プログラムP1と、の間で次式、
オーバーラップ・スコア=(tend−tbegin)/(P1の終了時刻−P1の開始時刻)
上式において、
tendは、min(P0、P1の終了時刻)
tbeginは、max(P0、P1の開始時刻)
によって計算されている請求項26に記載の方法。 - メディア・プログラムのコンテンツの認識に使用するための装置であって、
前記メディア・プログラムの第1の周波数領域表現を複数のフィルタを用いてフィルタリングし、前記メディア・プログラムの第2の周波数領域表現であって、前記第1の周波数領域表現に対して周波数係数の数を減少させている第2の周波数領域表現を作成するための手段と、
セグメントを形成させるように前記第2の周波数領域表現のそれぞれをグループ分けするための手段と、
マッチング・セグメントを探すように、メディア・プログラムのセグメントおよびそれぞれの対応するプログラム識別子をその内部に保存しているようなデータベースを検索するための手段と、
後続のメディア・プログラムのサブセットが最初のメディア・プログラムのサブセットとの類似性を示すかを決定する手段とを備える装置。 - 前記メディア・プログラムの前記第1の周波数領域表現は、前記メディア・プログラムのそれぞれの時間領域セクションと対応する係数からなる複数のブロックを備えており、かつ前記メディア・プログラムの前記第2の周波数領域表現は、前記メディア・プログラムのそれぞれの時間領域セクションと対応する係数からなる複数のブロックを備えている請求項28に記載の装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/629486 | 2003-07-29 | ||
US10/629,486 US8918316B2 (en) | 2003-07-29 | 2003-07-29 | Content identification system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005049878A JP2005049878A (ja) | 2005-02-24 |
JP5259910B2 true JP5259910B2 (ja) | 2013-08-07 |
Family
ID=33552869
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004221250A Expired - Fee Related JP5259910B2 (ja) | 2003-07-29 | 2004-07-29 | コンテンツ識別システム |
Country Status (4)
Country | Link |
---|---|
US (2) | US8918316B2 (ja) |
EP (1) | EP1505603A1 (ja) |
JP (1) | JP5259910B2 (ja) |
CN (1) | CN100444159C (ja) |
Families Citing this family (51)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8239327B2 (en) * | 2005-11-02 | 2012-08-07 | Jump Technologies, Inc. | System and method for user logging of audio and video broadcast content |
US7685459B1 (en) | 2006-04-13 | 2010-03-23 | Symantec Operating Corporation | Parallel backup |
US7478113B1 (en) * | 2006-04-13 | 2009-01-13 | Symantec Operating Corporation | Boundaries |
RU2417514C2 (ru) | 2006-04-27 | 2011-04-27 | Долби Лэборетериз Лайсенсинг Корпорейшн | Регулировка усиления звука с использованием основанного на конкретной громкости обнаружения акустических событий |
US20080162670A1 (en) * | 2006-12-04 | 2008-07-03 | Swarmcast, Inc. | Automatic configuration of embedded media player |
US8312558B2 (en) | 2007-01-03 | 2012-11-13 | At&T Intellectual Property I, L.P. | System and method of managing protected video content |
US7827146B1 (en) | 2007-03-30 | 2010-11-02 | Symantec Operating Corporation | Storage system |
US9984369B2 (en) | 2007-12-19 | 2018-05-29 | At&T Intellectual Property I, L.P. | Systems and methods to identify target video content |
US8037256B2 (en) * | 2007-12-20 | 2011-10-11 | Advanced Micro Devices, Inc. | Programmable address processor for graphics applications |
CN101251881B (zh) * | 2008-04-07 | 2010-04-14 | 华为技术有限公司 | 一种内容识别的方法、系统和装置 |
US20100191689A1 (en) * | 2009-01-27 | 2010-07-29 | Google Inc. | Video content analysis for automatic demographics recognition of users and videos |
US10375451B2 (en) | 2009-05-29 | 2019-08-06 | Inscape Data, Inc. | Detection of common media segments |
US10949458B2 (en) | 2009-05-29 | 2021-03-16 | Inscape Data, Inc. | System and method for improving work load management in ACR television monitoring system |
US9094715B2 (en) | 2009-05-29 | 2015-07-28 | Cognitive Networks, Inc. | Systems and methods for multi-broadcast differentiation |
US10116972B2 (en) | 2009-05-29 | 2018-10-30 | Inscape Data, Inc. | Methods for identifying video segments and displaying option to view from an alternative source and/or on an alternative device |
US8595781B2 (en) | 2009-05-29 | 2013-11-26 | Cognitive Media Networks, Inc. | Methods for identifying video segments and displaying contextual targeted content on a connected television |
US9449090B2 (en) | 2009-05-29 | 2016-09-20 | Vizio Inscape Technologies, Llc | Systems and methods for addressing a media database using distance associative hashing |
US8311964B1 (en) | 2009-11-12 | 2012-11-13 | Symantec Corporation | Progressive sampling for deduplication indexing |
US8473463B1 (en) | 2010-03-02 | 2013-06-25 | Symantec Corporation | Method of avoiding duplicate backups in a computing system |
US10192138B2 (en) | 2010-05-27 | 2019-01-29 | Inscape Data, Inc. | Systems and methods for reducing data density in large datasets |
US9838753B2 (en) | 2013-12-23 | 2017-12-05 | Inscape Data, Inc. | Monitoring individual viewing of television events using tracking pixels and cookies |
US8370315B1 (en) | 2010-05-28 | 2013-02-05 | Symantec Corporation | System and method for high performance deduplication indexing |
US8983952B1 (en) | 2010-07-29 | 2015-03-17 | Symantec Corporation | System and method for partitioning backup data streams in a deduplication based storage system |
US8756197B1 (en) | 2010-08-13 | 2014-06-17 | Symantec Corporation | Generating data set views for backup restoration |
US8291170B1 (en) | 2010-08-19 | 2012-10-16 | Symantec Corporation | System and method for event driven backup data storage |
US8392376B2 (en) | 2010-09-03 | 2013-03-05 | Symantec Corporation | System and method for scalable reference management in a deduplication based storage system |
US8924993B1 (en) | 2010-11-11 | 2014-12-30 | Google Inc. | Video content analysis for automatic demographics recognition of users and videos |
US8396841B1 (en) | 2010-11-30 | 2013-03-12 | Symantec Corporation | Method and system of multi-level and multi-mode cloud-based deduplication |
US8392384B1 (en) | 2010-12-10 | 2013-03-05 | Symantec Corporation | Method and system of deduplication-based fingerprint index caching |
US8589640B2 (en) | 2011-10-14 | 2013-11-19 | Pure Storage, Inc. | Method for maintaining multiple fingerprint tables in a deduplicating storage system |
JP2014067292A (ja) * | 2012-09-26 | 2014-04-17 | Toshiba Corp | 情報処理装置及び情報処理方法 |
CN102984553A (zh) * | 2012-10-29 | 2013-03-20 | 北京海逸华清科技发展有限公司 | 音视频的检测识别方法及系统 |
US10275397B2 (en) | 2013-02-22 | 2019-04-30 | Veritas Technologies Llc | Deduplication storage system with efficient reference updating and space reclamation |
TWI527025B (zh) * | 2013-11-11 | 2016-03-21 | 財團法人資訊工業策進會 | 電腦系統、音訊比對方法及其電腦可讀取記錄媒體 |
US9955192B2 (en) | 2013-12-23 | 2018-04-24 | Inscape Data, Inc. | Monitoring individual viewing of television events using tracking pixels and cookies |
US9575680B1 (en) | 2014-08-22 | 2017-02-21 | Veritas Technologies Llc | Deduplication rehydration |
US10423495B1 (en) | 2014-09-08 | 2019-09-24 | Veritas Technologies Llc | Deduplication grouping |
BR112017011522A2 (pt) * | 2014-12-01 | 2018-05-15 | Inscape Data Inc | sistema, e, método |
AU2016211254B2 (en) | 2015-01-30 | 2019-09-19 | Inscape Data, Inc. | Methods for identifying video segments and displaying option to view from an alternative source and/or on an alternative device |
WO2016168556A1 (en) | 2015-04-17 | 2016-10-20 | Vizio Inscape Technologies, Llc | Systems and methods for reducing data density in large datasets |
EP3286757B1 (en) | 2015-04-24 | 2019-10-23 | Cyber Resonance Corporation | Methods and systems for performing signal analysis to identify content types |
AU2016291674B2 (en) | 2015-07-16 | 2021-08-26 | Inscape Data, Inc. | Systems and methods for partitioning search indexes for improved efficiency in identifying media segments |
WO2017011792A1 (en) | 2015-07-16 | 2017-01-19 | Vizio Inscape Technologies, Llc | Prediction of future views of video segments to optimize system resource utilization |
US10080062B2 (en) | 2015-07-16 | 2018-09-18 | Inscape Data, Inc. | Optimizing media fingerprint retention to improve system resource utilization |
EP3323245B1 (en) | 2015-07-16 | 2021-08-25 | Inscape Data, Inc. | Detection of common media segments |
CN105976828A (zh) * | 2016-04-19 | 2016-09-28 | 乐视控股(北京)有限公司 | 一种声音区分方法和终端 |
US10983984B2 (en) | 2017-04-06 | 2021-04-20 | Inscape Data, Inc. | Systems and methods for improving accuracy of device maps using media viewing data |
US10181332B1 (en) * | 2018-03-21 | 2019-01-15 | The Aerospace Corporation | System and method for detecting and identifying unmanned aircraft systems |
CN108447501B (zh) * | 2018-03-27 | 2020-08-18 | 中南大学 | 一种云存储环境下基于音频字的盗版视频检测方法与系统 |
CN108492836A (zh) * | 2018-03-29 | 2018-09-04 | 努比亚技术有限公司 | 一种基于语音的搜索方法、移动终端及存储介质 |
CN111863041B (zh) * | 2020-07-17 | 2021-08-31 | 东软集团股份有限公司 | 一种声音信号处理方法、装置及设备 |
Family Cites Families (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4677466A (en) | 1985-07-29 | 1987-06-30 | A. C. Nielsen Company | Broadcast program identification method and apparatus |
JP3102089B2 (ja) * | 1991-10-11 | 2000-10-23 | ブラザー工業株式会社 | 自動採譜装置 |
JPH08286693A (ja) * | 1995-04-13 | 1996-11-01 | Toshiba Corp | 情報処理装置 |
JP3666100B2 (ja) * | 1996-01-30 | 2005-06-29 | ヤマハ株式会社 | 楽音出力装置 |
TW429700B (en) * | 1997-02-26 | 2001-04-11 | Sony Corp | Information encoding method and apparatus, information decoding method and apparatus and information recording medium |
JP2001514400A (ja) * | 1997-08-21 | 2001-09-11 | シーメンス アクチエンゲゼルシヤフト | 音声ユニットを含んだ音声信号からの音声における音声ブロックに対する代表決定のための方法 |
US6201176B1 (en) * | 1998-05-07 | 2001-03-13 | Canon Kabushiki Kaisha | System and method for querying a music database |
US6711536B2 (en) * | 1998-10-20 | 2004-03-23 | Canon Kabushiki Kaisha | Speech processing apparatus and method |
US7181399B1 (en) * | 1999-05-19 | 2007-02-20 | At&T Corp. | Recognizing the numeric language in natural spoken dialogue |
US6321200B1 (en) | 1999-07-02 | 2001-11-20 | Mitsubish Electric Research Laboratories, Inc | Method for extracting features from a mixture of signals |
US20010044719A1 (en) * | 1999-07-02 | 2001-11-22 | Mitsubishi Electric Research Laboratories, Inc. | Method and system for recognizing, indexing, and searching acoustic signals |
JP4491700B2 (ja) * | 1999-08-26 | 2010-06-30 | ソニー株式会社 | 音響検索処理方法、音響情報検索装置、音響情報蓄積方法、音響情報蓄積装置および音響映像検索処理方法、音響映像情報検索装置、音響映像情報蓄積方法、音響映像情報蓄積装置 |
JP4438144B2 (ja) * | 1999-11-11 | 2010-03-24 | ソニー株式会社 | 信号分類方法及び装置、記述子生成方法及び装置、信号検索方法及び装置 |
US6633845B1 (en) * | 2000-04-07 | 2003-10-14 | Hewlett-Packard Development Company, L.P. | Music summarization system and method |
US6453252B1 (en) * | 2000-05-15 | 2002-09-17 | Creative Technology Ltd. | Process for identifying audio content |
US7065416B2 (en) * | 2001-08-29 | 2006-06-20 | Microsoft Corporation | System and methods for providing automatic classification of media entities according to melodic movement properties |
US6574594B2 (en) * | 2000-11-03 | 2003-06-03 | International Business Machines Corporation | System for monitoring broadcast audio content |
JP4027051B2 (ja) * | 2001-03-22 | 2007-12-26 | 松下電器産業株式会社 | 楽曲登録装置、楽曲登録方法、及びそのプログラムと記録媒体 |
US7103547B2 (en) * | 2001-05-07 | 2006-09-05 | Texas Instruments Incorporated | Implementing a high accuracy continuous speech recognizer on a fixed-point processor |
DE10123281C1 (de) * | 2001-05-14 | 2002-10-10 | Fraunhofer Ges Forschung | Vorrichtung und Verfahren zum Analysieren eines Audiosignals hinsichtlich von Rhythmusinformationen des Audiosignals unter Verwendung einer Autokorrelationsfunktion |
DE60236161D1 (de) * | 2001-07-20 | 2010-06-10 | Gracenote Inc | Automatische identifizierung von klangaufzeichnungen |
US7295977B2 (en) * | 2001-08-27 | 2007-11-13 | Nec Laboratories America, Inc. | Extracting classifying data in music from an audio bitstream |
US6907367B2 (en) * | 2001-08-31 | 2005-06-14 | The United States Of America As Represented By The Secretary Of The Navy | Time-series segmentation |
CN1172254C (zh) * | 2001-12-19 | 2004-10-20 | 中国科学院自动化研究所 | 掌上电脑非特定人语音识别方法 |
FR2834363B1 (fr) * | 2001-12-27 | 2004-02-27 | France Telecom | Procede de caracterisation d'un signal sonore |
CN1162838C (zh) * | 2002-07-12 | 2004-08-18 | 清华大学 | 抗噪声语音识别用语音增强-特征加权-对数谱相加方法 |
EP1403783A3 (en) * | 2002-09-24 | 2005-01-19 | Matsushita Electric Industrial Co., Ltd. | Audio signal feature extraction |
-
2003
- 2003-07-29 US US10/629,486 patent/US8918316B2/en active Active
-
2004
- 2004-07-16 EP EP04254282A patent/EP1505603A1/en not_active Ceased
- 2004-07-28 CN CNB2004100586813A patent/CN100444159C/zh not_active Expired - Fee Related
- 2004-07-29 JP JP2004221250A patent/JP5259910B2/ja not_active Expired - Fee Related
-
2014
- 2014-11-11 US US14/538,450 patent/US9336794B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
CN100444159C (zh) | 2008-12-17 |
EP1505603A1 (en) | 2005-02-09 |
US20050027766A1 (en) | 2005-02-03 |
US9336794B2 (en) | 2016-05-10 |
CN1604081A (zh) | 2005-04-06 |
JP2005049878A (ja) | 2005-02-24 |
US8918316B2 (en) | 2014-12-23 |
US20150134329A1 (en) | 2015-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5259910B2 (ja) | コンテンツ識別システム | |
JP5362178B2 (ja) | オーディオ信号からの特徴的な指紋の抽出とマッチング | |
CN110557589B (zh) | 用于整合记录的内容的系统和方法 | |
US7386357B2 (en) | System and method for generating an audio thumbnail of an audio track | |
KR101109303B1 (ko) | 오디오 복제 검출기 | |
US8065260B2 (en) | Device and method for analyzing an information signal | |
US6421645B1 (en) | Methods and apparatus for concurrent speech recognition, speaker segmentation and speaker classification | |
CN109493881B (zh) | 一种音频的标签化处理方法、装置和计算设备 | |
US7643994B2 (en) | Method for generating an audio signature based on time domain features | |
JP5142769B2 (ja) | 音声データ検索システム及び音声データの検索方法 | |
JP2000035796A (ja) | 音楽情報処理装置及び方法 | |
WO2016189307A1 (en) | Audio identification method | |
CN110399522B (zh) | 一种基于lstm与分层匹配的音乐哼唱检索方法及装置 | |
KR20170140188A (ko) | 오디오 컨텐츠 인식 방법 및 장치 | |
US9058384B2 (en) | System and method for identification of highly-variable vocalizations | |
CN115273891A (zh) | 一种基于相似度检测的音频自动剪错方法 | |
US7680654B2 (en) | Apparatus and method for segmentation of audio data into meta patterns | |
JP4132590B2 (ja) | 同時的な音声認識、スピーカ・セグメンテーション及びスピーカ分類のための方法及び装置 | |
CN111063360B (zh) | 一种声纹库的生成方法和装置 | |
CN112307253A (zh) | 一种基于预设录音标题自动生成语音文件的方法及系统 | |
Huijbregts et al. | Filtering the unknown: Speech activity detection in heterogeneous video collections | |
Kruspe et al. | Automatic speech/music discrimination for broadcast signals | |
JP2007060606A (ja) | ビデオの自動構造抽出・提供方式からなるコンピュータプログラム | |
CN114420096A (zh) | 语音交互方法及其装置、车辆和存储介质 | |
JP6344849B2 (ja) | 映像識別器学習装置、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070518 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100531 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20100831 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20100903 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101126 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20101126 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110523 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110926 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20111031 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20111228 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20120425 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20120501 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130425 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160502 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5259910 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |