JP2014520287A - オーディオ信号を用いたコンテンツ認識装置及び方法 - Google Patents
オーディオ信号を用いたコンテンツ認識装置及び方法 Download PDFInfo
- Publication number
- JP2014520287A JP2014520287A JP2014516896A JP2014516896A JP2014520287A JP 2014520287 A JP2014520287 A JP 2014520287A JP 2014516896 A JP2014516896 A JP 2014516896A JP 2014516896 A JP2014516896 A JP 2014516896A JP 2014520287 A JP2014520287 A JP 2014520287A
- Authority
- JP
- Japan
- Prior art keywords
- frame
- fingerprint
- audio signal
- matching
- content recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 82
- 230000005236 sound signal Effects 0.000 title claims abstract description 74
- 239000013598 vector Substances 0.000 claims abstract description 79
- 238000000605 extraction Methods 0.000 claims abstract description 43
- 239000000284 extract Substances 0.000 claims abstract description 7
- 238000010586 diagram Methods 0.000 description 11
- 108090000623 proteins and genes Proteins 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000010295 mobile communication Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 238000004904 shortening Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
- H04N21/4394—Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/683—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H60/00—Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
- H04H60/56—Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54
- H04H60/58—Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54 of audio
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/835—Generation of protective data, e.g. certificates
- H04N21/8358—Generation of protective data, e.g. certificates involving watermark
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/54—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for retrieval
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Library & Information Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Computer Security & Cryptography (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Collating Specific Patterns (AREA)
- Image Analysis (AREA)
Abstract
【解決手段】入力されるオーディオ信号に対し、前もって設定されたフレーム長さを持つフレームを形成し、それぞれのフレームに対するフレーム別特徴ベクターを生成することによりクエリーフィンガープリントを抽出するクエリーフィンガープリント抽出部;クエリーフィンガープリントと比較すべきレファレンスフィンガープリントとレファレンスフィンガープリントに対応するコンテンツ情報を保存するレファレンスフィンガープリントデータベース;及び前記クエリーフィンガープリントにマッチングされるレファレンスフィンガープリントを判別するフィンガープリントマッチング部を含み、前記クエリーフィンガープリント抽出部は、隣接したフレームの開始点間の間隔であるフレーム移動長さを一部区間で変動させながらフレームを形成する。
【選択図】図1
Description
Claims (22)
- オーディオ信号を用いたコンテンツ認識装置において、
入力されるオーディオ信号に対し、前もって設定されたフレーム長さを持つフレームを形成し、それぞれのフレームに対するフレーム別特徴ベクターを生成することによりクエリーフィンガープリントを抽出するクエリーフィンガープリント抽出部;
クエリーフィンガープリントと比較すべきレファレンスフィンガープリントとレファレンスフィンガープリントに対応するコンテンツ情報を保存するレファレンスフィンガープリントデータベース;及び
前記クエリーフィンガープリントにマッチングされるレファレンスフィンガープリントを判別するフィンガープリントマッチング部
を含み、
前記クエリーフィンガープリント抽出部は、隣接したフレームの開始点間の間隔であるフレーム移動長さを一部区間で変動させながらフレームを形成することを特徴とする、オーディオ信号を用いたコンテンツ認識装置。 - 前記フレーム移動長さは、隣接したフレームが互いに重なるようにフレーム長さより短いことを特徴とする、請求項1に記載のオーディオ信号を用いたコンテンツ認識装置。
- 前記クエリーフィンガープリント抽出部は、一部区間でのフレーム移動長さを前もって設定されたフレーム移動長さより短くしてフレームを形成することを特徴とする、請求項1に記載のオーディオ信号を用いたコンテンツ認識装置。
- 前記クエリーフィンガープリント抽出部は、前もって設定された時間区間に基づいて前記一部区間を決定することを特徴とする、請求項3に記載のオーディオ信号を用いたコンテンツ認識装置。
- 前記クエリーフィンガープリント抽出部は、信号対雑音比が臨界値より高い値を持つ時間区間を検出し、検出された時間区間に基づいて前記一部区間を決定することを特徴とする、請求項3に記載のオーディオ信号を用いたコンテンツ認識装置。
- 前記クエリーフィンガープリント抽出部は、前記決定された一部区間にあたるフレームのそれぞれに対してフレーム別特徴ベクターを生成することを特徴とする、請求項4または5に記載のオーディオ信号を用いたコンテンツ認識装置。
- 前記クエリーフィンガープリント抽出部は、前記決定された一部区間に含まれるフレームに対するフレーム別特徴ベクターを、前記一部区間の開始位置及び終了位置に相応するフレームのフレーム別特徴ベクターに基づいて生成することを特徴とする、請求項4または5に記載のオーディオ信号を用いたコンテンツ認識装置。
- 前記一部区間の開始位置に相応するフレームは前記開始位置を最後に含むフレームであり、
前記一部区間の終了位置に相応するフレームは前記終了位置を初めて含むフレームであることを特徴とする、請求項7に記載のオーディオ信号を用いたコンテンツ認識装置。 - 前記一部区間の開始位置及び終了位置に相応するフレームのフレーム別特徴ベクターを生成し、生成されたフレーム別特徴ベクターに基づいて線形補間法によって一部区間に含まれるフレームのフレーム別特徴ベクターを生成することを特徴とする、請求項8に記載のオーディオ信号を用いたコンテンツ認識装置。
- 前記一部区間の開始位置及び終了位置に相応するフレームのフレーム別特徴ベクターは二進数で形成され、前記二進数で形成されたフレーム別特徴ベクターのそれぞれのビットを比較し、相異なるビットに可能な二進数を配列することにより、一部区間に含まれるフレームのフレーム別特徴ベクターを生成することを特徴とする、請求項8に記載のオーディオ信号を用いたコンテンツ認識装置。
- 前記フィンガープリントマッチング部は、
前記クエリーフィンガープリントを構成するフレーム別特徴ベクターのいずれか一つとマッチングされるフレーム特徴ベクターが含まれたレファレンスフィンガープリントを判別し、判別されたレファレンスフィンガープリントの識別子をマッチング候補群に含めることにより1次マッチングを行う第1マッチング部;及び
前記マッチング候補群に含まれた識別子に相応するレファレンスフィンガープリントに対して2次マッチングを行う第2マッチング部;
を含むことを特徴とする、請求項1に記載のオーディオ信号を用いたコンテンツ認識装置。 - 前記第1マッチング部は、前記クエリーフィンガープリントを構成するフレーム別特徴ベクターのいずれか一つとハミング距離がスレショルド値以下のフレーム特徴ベクターが含まれたレファレンスフィンガープリントをマッチングされるレファレンスフィンガープリントとして判別することを特徴とする、請求項11に記載のオーディオ信号を用いたコンテンツ認識装置。
- 前記第1マッチング部は、前記クエリーフィンガープリントを構成するフレーム別特徴ベクターをレファレンスフィンガープリントのフレーム別特徴ベクターと順次比較し、マッチングされるフレームが検出された場合、以後のフレームに対する比較を省略し、次のレファレンスフィンガープリントに対する比較を行うことを特徴とする、請求項11に記載のオーディオ信号を用いたコンテンツ認識装置。
- 第2マッチング部は、
前記クエリーフィンガープリントを構成するフレーム別特徴ベクターの中で、前もって設定されたフレーム移動長さではないフレームを除いてフレーム別特徴ベクターを再構成し、再構成されたフレーム別特徴ベクターをレファレンスフィンガープリントと比較することを特徴とする、請求項11に記載のオーディオ信号を用いたコンテンツ認識装置。 - 前記フィンガープリントマッチング部によって判別されたレファレンスフィンガープリントに相応するコンテンツ情報を提供する認識結果提供部をさらに含むことを特徴とする、請求項1に記載のオーディオ信号を用いたコンテンツ認識装置。
- 前記オーディオ信号を用いたコンテンツ認識装置はクライアント端末機内に含まれることを特徴とする、請求項1に記載のオーディオ信号を用いたコンテンツ認識装置。
- 前記レファレンスフィンガープリントデータベースはレファレンスフィンガープリントサーバーからレファレンスフィンガープリント及びコンテンツ情報を受信して保存することを特徴とする、請求項16に記載のオーディオ信号を用いたコンテンツ認識装置。
- 使用者がオーディオ信号を入力することができるようにする使用者インターフェースを提供するインターフェース提供部をさらに含むことを特徴とする、請求項1に記載のオーディオ信号を用いたコンテンツ認識装置。
- 前記フィンガープリントマッチング部によって判別されたレファレンスフィンガープリントに相応するコンテンツ情報は前記レファレンスフィンガープリントサーバーに伝送されることを特徴とする、請求項17に記載のオーディオ信号を用いたコンテンツ認識装置。
- 前記クエリーフィンガープリント抽出部は、前もって設定された区間単位で該当の区間に含まれるフレームに対するフレーム別特徴ベクターを生成することにより区間別クエリーフィンガープリントを抽出し、前記フィンガープリントマッチング部は前記クエリーフィンガープリントにマッチングされるレファレンスフィンガープリントを判別し、
前記フィンガープリントマッチング部でマッチングされるレファレンスフィンガープリントが判別されるまでクエリーフィンガープリント抽出部が前記前もって設定された区間単位で区間別クエリーフィンガープリントを連続的に抽出することを特徴とする、請求項1に記載のオーディオ信号を用いたコンテンツ認識装置。 - オーディオ信号を用いたコンテンツ認識方法において、
入力されるオーディオ信号に対して前もって設定されたフレーム長さを持つフレームを形成し、それぞれのフレームに対するフレーム別特徴ベクターを生成することによりクエリーフィンガープリントを抽出する第1段階;及び
前記クエリーフィンガープリントにマッチングされるレファレンスフィンガープリントを判別する第2段階
を含み、
前記第1段階は、隣接したフレームの開始点間の間隔であるフレーム移動長さを一部区間で変動させながらフレームを形成することを特徴とする、オーディオ信号を用いたコンテンツ認識方法。 - 前記第2段階は、
前記クエリーフィンガープリントを構成するフレーム別特徴ベクターのいずれか一つとマッチングされるレファレンスフィンガープリントを判別し、判別されたレファレンスフィンガープリントの識別子をマッチング候補群に含めることにより1次マッチングを行う第2−1段階;及び
前記マッチング候補群に含まれた識別子に相応するレファレンスフィンガープリントに対して2次マッチングを行う第2−2段階
を含むことを特徴とする、請求項21に記載のオーディオ信号を用いたコンテンツ認識方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020120054659A KR101315970B1 (ko) | 2012-05-23 | 2012-05-23 | 오디오 신호를 이용한 콘텐츠 인식 장치 및 방법 |
KR10-2012-0054659 | 2012-05-23 | ||
PCT/KR2012/004537 WO2013176329A1 (ko) | 2012-05-23 | 2012-06-08 | 오디오 신호를 이용한 콘텐츠 인식 장치 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014520287A true JP2014520287A (ja) | 2014-08-21 |
JP5813221B2 JP5813221B2 (ja) | 2015-11-17 |
Family
ID=48670993
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014516896A Active JP5813221B2 (ja) | 2012-05-23 | 2012-06-08 | オーディオ信号を用いたコンテンツ認識装置及び方法 |
Country Status (7)
Country | Link |
---|---|
EP (1) | EP2685450B1 (ja) |
JP (1) | JP5813221B2 (ja) |
KR (1) | KR101315970B1 (ja) |
CN (1) | CN103548076B (ja) |
HK (1) | HK1175358A2 (ja) |
SG (1) | SG187583A1 (ja) |
WO (1) | WO2013176329A1 (ja) |
Families Citing this family (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2466242B (en) | 2008-12-15 | 2013-01-02 | Audio Analytic Ltd | Sound identification systems |
US9071868B2 (en) | 2009-05-29 | 2015-06-30 | Cognitive Networks, Inc. | Systems and methods for improving server and client performance in fingerprint ACR systems |
US9449090B2 (en) | 2009-05-29 | 2016-09-20 | Vizio Inscape Technologies, Llc | Systems and methods for addressing a media database using distance associative hashing |
US8595781B2 (en) | 2009-05-29 | 2013-11-26 | Cognitive Media Networks, Inc. | Methods for identifying video segments and displaying contextual targeted content on a connected television |
US10949458B2 (en) | 2009-05-29 | 2021-03-16 | Inscape Data, Inc. | System and method for improving work load management in ACR television monitoring system |
US10116972B2 (en) | 2009-05-29 | 2018-10-30 | Inscape Data, Inc. | Methods for identifying video segments and displaying option to view from an alternative source and/or on an alternative device |
KR101494309B1 (ko) | 2013-10-16 | 2015-02-23 | 강릉원주대학교산학협력단 | 디지털 컨텐츠를 위한 비대칭형 핑거프린트 정합 시스템 및 그 제공방법 |
US9955192B2 (en) | 2013-12-23 | 2018-04-24 | Inscape Data, Inc. | Monitoring individual viewing of television events using tracking pixels and cookies |
NL2012567B1 (en) * | 2014-04-04 | 2016-03-08 | Teletrax B V | Method and device for generating improved fingerprints. |
KR102255152B1 (ko) * | 2014-11-18 | 2021-05-24 | 삼성전자주식회사 | 가변적인 크기의 세그먼트를 전송하는 컨텐츠 처리 장치와 그 방법 및 그 방법을 실행하기 위한 컴퓨터 프로그램 |
WO2016089749A1 (en) | 2014-12-01 | 2016-06-09 | Hoarty W Leo | System and method for continuous media segment identification |
GB2534027B8 (en) * | 2014-12-30 | 2017-12-06 | Audio Analytic Ltd | Sound capturing and identifying devices |
AU2016211254B2 (en) | 2015-01-30 | 2019-09-19 | Inscape Data, Inc. | Methods for identifying video segments and displaying option to view from an alternative source and/or on an alternative device |
CA2982797C (en) | 2015-04-17 | 2023-03-14 | Inscape Data, Inc. | Systems and methods for reducing data density in large datasets |
KR102614021B1 (ko) * | 2015-04-27 | 2023-12-14 | 삼성전자주식회사 | 오디오 컨텐츠 인식 방법 및 장치 |
CA3216076A1 (en) | 2015-07-16 | 2017-01-19 | Inscape Data, Inc. | Detection of common media segments |
US10080062B2 (en) | 2015-07-16 | 2018-09-18 | Inscape Data, Inc. | Optimizing media fingerprint retention to improve system resource utilization |
BR112018000801A2 (pt) | 2015-07-16 | 2018-09-04 | Inscape Data Inc | sistema, e método |
KR101634609B1 (ko) * | 2015-07-17 | 2016-06-29 | 주식회사 디지워크 | 영상 음성 데이터 처리 방법 및 이를 실행하는 단말 장치 |
KR101970383B1 (ko) * | 2015-10-30 | 2019-04-18 | 주식회사 엘지유플러스 | 단말 및 단말의 컨텐츠 제작 방법 |
KR101647012B1 (ko) * | 2015-11-13 | 2016-08-23 | 주식회사 비글컴퍼니 | 오디오 신호의 배경 잡음 환경을 반영한 음악 검색 장치 및 방법 |
KR101981924B1 (ko) * | 2015-11-30 | 2019-08-30 | 한국전자통신연구원 | 미디어 콘텐츠 식별 방법 |
US20170372142A1 (en) * | 2016-06-27 | 2017-12-28 | Facebook, Inc. | Systems and methods for identifying matching content |
US20190020913A9 (en) * | 2016-06-27 | 2019-01-17 | Facebook, Inc. | Systems and methods for identifying matching content |
CN106910494B (zh) | 2016-06-28 | 2020-11-13 | 创新先进技术有限公司 | 一种音频识别方法和装置 |
WO2018157251A1 (en) | 2017-03-01 | 2018-09-07 | Soltare Inc. | Systems and methods for detection of a target sound |
CA3058975A1 (en) | 2017-04-06 | 2018-10-11 | Inscape Data, Inc. | Systems and methods for improving accuracy of device maps using media viewing data |
KR102037221B1 (ko) * | 2017-11-06 | 2019-10-29 | 주식회사 아이티밥 | 오디오 핑거프린트 매칭 방법 |
KR102037220B1 (ko) * | 2017-11-06 | 2019-10-29 | 주식회사 아이티밥 | 오디오 핑거프린트 매칭 시스템 |
KR102494591B1 (ko) | 2018-09-18 | 2023-02-03 | 삼성전자주식회사 | 전자 장치, 그 제어 방법 및 전자 시스템 |
CN111462736B (zh) * | 2019-01-17 | 2023-04-14 | 北京字节跳动网络技术有限公司 | 基于语音的图像生成方法、装置和电子设备 |
US11317128B1 (en) * | 2020-10-23 | 2022-04-26 | Synamedia Limited | Systems, methods, and devices for media content tamper protection and detection |
KR102611105B1 (ko) * | 2021-11-16 | 2023-12-07 | 한국전자통신연구원 | 콘텐츠 내 음악 식별 장치 및 방법 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003248494A (ja) * | 2002-02-25 | 2003-09-05 | Nippon Telegr & Teleph Corp <Ntt> | 音声信号検索方法,音声検索のための音声信号蓄積方法,音声信号検索装置,そのプログラムおよびそのプログラムの記録媒体 |
JP2004334160A (ja) * | 2002-09-24 | 2004-11-25 | Matsushita Electric Ind Co Ltd | 特徴量抽出装置 |
JP2006506659A (ja) * | 2002-11-01 | 2006-02-23 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | フィンガープリントのサーチおよびその改良 |
JP2006146261A (ja) * | 2001-08-08 | 2006-06-08 | Nippon Telegr & Teleph Corp <Ntt> | 音声処理方法及びそのプログラム |
JP2007065659A (ja) * | 2005-09-01 | 2007-03-15 | Seet Internet Ventures Inc | オーディオ信号からの特徴的な指紋の抽出とマッチング |
JP2007519986A (ja) * | 2003-11-18 | 2007-07-19 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 導出されたフィンガープリントのマッチングによるデータオブジェクトのマッチング |
JP2008503134A (ja) * | 2004-06-16 | 2008-01-31 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | ウォーターマーク検出のためのスケーリングファクターの探索方法及び装置 |
JP2009071492A (ja) * | 2007-09-12 | 2009-04-02 | Toshiba Corp | 信号処理装置及びその方法 |
WO2010140195A1 (ja) * | 2009-06-05 | 2010-12-09 | 株式会社 東芝 | 映像編集装置 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6990453B2 (en) * | 2000-07-31 | 2006-01-24 | Landmark Digital Services Llc | System and methods for recognizing sound and music signals in high noise and distortion |
JP3744464B2 (ja) | 2002-05-20 | 2006-02-08 | ソニー株式会社 | 信号記録再生装置及び方法、信号再生装置及び方法、並びにプログラム及び記録媒体 |
GB2391322B (en) * | 2002-07-31 | 2005-12-14 | British Broadcasting Corp | Signal comparison method and apparatus |
US20030191764A1 (en) * | 2002-08-06 | 2003-10-09 | Isaac Richards | System and method for acoustic fingerpringting |
JP4408205B2 (ja) * | 2003-05-16 | 2010-02-03 | 東芝テック株式会社 | 話者認識装置 |
KR20050073064A (ko) * | 2004-01-08 | 2005-07-13 | (주)뮤레카 | 오디오데이터 인식을 이용한 광고방법 |
KR100456408B1 (ko) | 2004-02-06 | 2004-11-10 | (주)뮤레카 | 오디오유전자 생성방법 및 오디오데이터 검색방법 |
KR100480315B1 (ko) * | 2004-06-03 | 2005-04-07 | (주)뮤레카 | 오디오 유전자 생성 및 검색을 이용한 저작권 관리시스템및 관리방법 |
GB0412654D0 (en) | 2004-06-07 | 2004-07-07 | Univ Cambridge Tech | Method of detection |
KR100692395B1 (ko) * | 2004-11-01 | 2007-03-09 | (주)뮤레카 | 오디오 유전자 생성을 통한 방송내용 분석시스템 및분석방법 |
KR101172404B1 (ko) | 2005-10-24 | 2012-08-08 | 삼성전자주식회사 | 금형장치와 금형용 히터 카트리지 |
KR100789382B1 (ko) | 2005-12-09 | 2007-12-28 | 한국전자통신연구원 | 지상파 dmb 비디오, 오디오, 부가 데이터의 제한수신 시스템 |
KR100773562B1 (ko) | 2006-03-06 | 2007-11-07 | 삼성전자주식회사 | 스테레오 신호 생성 방법 및 장치 |
KR100811835B1 (ko) * | 2006-10-25 | 2008-03-10 | 주식회사 에스원 | 동영상 특징량 추출방법 및 이를 이용한 내용 기반 동영상검색방법 |
KR101368762B1 (ko) | 2006-12-06 | 2014-02-28 | 엘아이지에이디피 주식회사 | 기판 테이블 및 이를 가진 기판 합착장치 |
KR100893123B1 (ko) * | 2007-05-07 | 2009-04-10 | (주)엔써즈 | 오디오 핑거프린트 데이터 생성 방법 및 장치 및 이를이용한 오디오 데이터 비교 방법 및 장치 |
KR100930869B1 (ko) | 2007-05-17 | 2009-12-10 | 주식회사 코난테크놀로지 | 오디오 식별을 통한 성인물 동영상 검열 시스템 및 방법 |
KR100888804B1 (ko) * | 2007-06-04 | 2009-03-13 | (주)엔써즈 | 동영상 데이터의 동일성 판단 및 동일 구간 검출 방법 및장치 |
-
2012
- 2012-05-23 KR KR1020120054659A patent/KR101315970B1/ko active IP Right Grant
- 2012-06-08 JP JP2014516896A patent/JP5813221B2/ja active Active
- 2012-06-08 SG SG2013005004A patent/SG187583A1/en unknown
- 2012-06-08 CN CN201280002116.8A patent/CN103548076B/zh active Active
- 2012-06-08 WO PCT/KR2012/004537 patent/WO2013176329A1/ko active Application Filing
- 2012-06-08 EP EP12844656.4A patent/EP2685450B1/en active Active
-
2013
- 2013-02-08 HK HK13101817.4A patent/HK1175358A2/xx not_active IP Right Cessation
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006146261A (ja) * | 2001-08-08 | 2006-06-08 | Nippon Telegr & Teleph Corp <Ntt> | 音声処理方法及びそのプログラム |
JP2003248494A (ja) * | 2002-02-25 | 2003-09-05 | Nippon Telegr & Teleph Corp <Ntt> | 音声信号検索方法,音声検索のための音声信号蓄積方法,音声信号検索装置,そのプログラムおよびそのプログラムの記録媒体 |
JP2004334160A (ja) * | 2002-09-24 | 2004-11-25 | Matsushita Electric Ind Co Ltd | 特徴量抽出装置 |
JP2006506659A (ja) * | 2002-11-01 | 2006-02-23 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | フィンガープリントのサーチおよびその改良 |
JP2007519986A (ja) * | 2003-11-18 | 2007-07-19 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 導出されたフィンガープリントのマッチングによるデータオブジェクトのマッチング |
JP2008503134A (ja) * | 2004-06-16 | 2008-01-31 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | ウォーターマーク検出のためのスケーリングファクターの探索方法及び装置 |
JP2007065659A (ja) * | 2005-09-01 | 2007-03-15 | Seet Internet Ventures Inc | オーディオ信号からの特徴的な指紋の抽出とマッチング |
JP2009071492A (ja) * | 2007-09-12 | 2009-04-02 | Toshiba Corp | 信号処理装置及びその方法 |
WO2010140195A1 (ja) * | 2009-06-05 | 2010-12-09 | 株式会社 東芝 | 映像編集装置 |
Also Published As
Publication number | Publication date |
---|---|
CN103548076B (zh) | 2015-11-25 |
EP2685450A4 (en) | 2015-11-11 |
JP5813221B2 (ja) | 2015-11-17 |
KR101315970B1 (ko) | 2013-10-08 |
EP2685450B1 (en) | 2020-04-22 |
SG187583A1 (en) | 2013-12-30 |
HK1175358A2 (en) | 2013-06-28 |
CN103548076A (zh) | 2014-01-29 |
WO2013176329A1 (ko) | 2013-11-28 |
EP2685450A1 (en) | 2014-01-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5813221B2 (ja) | オーディオ信号を用いたコンテンツ認識装置及び方法 | |
US8886635B2 (en) | Apparatus and method for recognizing content using audio signal | |
JP6916352B2 (ja) | 分類器モデル及びコンテキストパラメータを使用した遠隔メディア分類クエリに対する応答 | |
KR101625944B1 (ko) | 오디오 인식 방법 및 기기 | |
CN109460514B (zh) | 用于推送信息的方法和装置 | |
US9798513B1 (en) | Audio content fingerprinting based on two-dimensional constant Q-factor transform representation and robust audio identification for time-aligned applications | |
US8977067B1 (en) | Audio identification using wavelet-based signatures | |
US9373336B2 (en) | Method and device for audio recognition | |
KR102614021B1 (ko) | 오디오 컨텐츠 인식 방법 및 장치 | |
CN112399247B (zh) | 一种音频处理方法、音频处理设备及可读存储介质 | |
CN111161758A (zh) | 一种基于音频指纹的听歌识曲方法、系统及音频设备 | |
US9159328B1 (en) | Audio fingerprinting for advertisement detection | |
US20120296938A1 (en) | Query and Matching for Content Recognition | |
CN111415653B (zh) | 用于识别语音的方法和装置 | |
CN103854661A (zh) | 一种提取音乐特征的方法及装置 | |
CN112153460A (zh) | 一种视频的配乐方法、装置、电子设备和存储介质 | |
CN111428078B (zh) | 音频指纹编码方法、装置、计算机设备及存储介质 | |
CN113327628A (zh) | 音频处理方法、装置、可读介质和电子设备 | |
US10861436B1 (en) | Audio call classification and survey system | |
Medina et al. | Audio fingerprint parameterization for multimedia advertising identification | |
CN112784097B (zh) | 一种音频特征的生成方法、装置、计算机设备和存储介质 | |
Pisanò et al. | Audio-aware applications at the edge using in-browser WebAssembly and fingerprinting | |
KR101081459B1 (ko) | 고차원 이진 데이터 검색 장치 및 방법 | |
Krilavičius | Machine learning methods for content-based music recommendation systems | |
CN114581821A (zh) | 一种视频检测方法、系统及存储介质和服务器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140902 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20141128 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20141205 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20141226 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20150130 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150213 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150825 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150915 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5813221 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |