JP2005173569A - オーディオ信号の分類装置及び方法 - Google Patents
オーディオ信号の分類装置及び方法 Download PDFInfo
- Publication number
- JP2005173569A JP2005173569A JP2004329133A JP2004329133A JP2005173569A JP 2005173569 A JP2005173569 A JP 2005173569A JP 2004329133 A JP2004329133 A JP 2004329133A JP 2004329133 A JP2004329133 A JP 2004329133A JP 2005173569 A JP2005173569 A JP 2005173569A
- Authority
- JP
- Japan
- Prior art keywords
- audio
- class
- audio signal
- content
- classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 279
- 238000000034 method Methods 0.000 title claims abstract description 60
- 238000012549 training Methods 0.000 claims description 49
- 230000011218 segmentation Effects 0.000 claims description 30
- 238000003066 decision tree Methods 0.000 claims description 17
- 239000000203 mixture Substances 0.000 claims description 17
- 230000001537 neural effect Effects 0.000 claims description 17
- 238000012545 processing Methods 0.000 claims description 9
- 238000007476 Maximum Likelihood Methods 0.000 claims description 6
- 238000012417 linear regression Methods 0.000 claims description 6
- 230000007704 transition Effects 0.000 claims description 6
- 238000004458 analytical method Methods 0.000 description 19
- 230000000694 effects Effects 0.000 description 16
- 238000004364 calculation method Methods 0.000 description 13
- 238000013459 approach Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000001514 detection method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000015654 memory Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 235000020030 perry Nutrition 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B2220/00—Record carriers by type
- G11B2220/20—Disc-shaped record carriers
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Management Or Editing Of Information On Record Carriers (AREA)
Abstract
【解決手段】オーディオ信号分類装置1は、オーディオ信号クリッピング手段2と、得られたオーディオクリップを所定のオーディオクラスに分類するクラス判別手段3とを備える。上述の課題は、オーディオ信号分類装置1において、オーディオクリップに割り当てられた各オーディオクラスのオーディオクラス信頼値を算出するクラス判別手段3により解決される。オーディオクラス信頼値は、各オーディオクラスが、各オーディオクリップに含まれるオーディオ信号の種類を正しく特徴付けているか否かの尤度を示す。
【選択図】図1
Description
Claims (22)
- オーディオ信号分類装置(1)において、
オーディオ信号(11)をオーディオクリップに区分するオーディオ信号クリッピング手段(2)と、
上記オーディオクリップに含まれるオーディオ信号の音響特性を解析することにより、所定のオーディオクラス分類規則(35、36、37)に基づいて、上記オーディオ信号クリッピング手段(2)により得られた該オーディオクリップを所定のオーディオクラスに分類するクラス判別手段(3)とを備え、
上記各オーディオクラスについて所定のオーディオクラス分類規則が与えられ、該各オーディオクラスは、対応するオーディオクリップに含まれるオーディオ信号の種類を表し、
上記クラス判別手段(3)は、上記オーディオクリップに割り当てられた各オーディオクラスのオーディオクラス信頼値を算出し、該オーディオクラス信頼値は、各オーディオクラスが各オーディオクリップに含まれるオーディオ信号の種類を正しく特徴付けているか否かの尤度を示し、
上記クラス判別手段(3)は、高いオーディオクラス信頼値を有するオーディオクラスのオーディオクリップの音響特性を用いて、上記各オーディオクラス分類規則(35、36、37)をトレーニングすることを特徴とするオーディオ信号分類装置。 - 更に、上記クラス判別手段(3)により得られる結合オーディオクリップのオーディオクラスシーケンスを解析することにより、所定のコンテンツ分類規則(45、46、47)に基づいて、分類済みのオーディオ信号(12)を個々の結合オーディオクリップシーケンスにセグメント分割するセグメント分割手段(4)を備え、
上記セグメント分割手段(4)によりセグメント分割された各結合オーディオクリップシーケンスは、上記オーディオ信号に含まれるコンテンツに対応し、
上記セグメント分割手段(4)は、上記結合オーディオクリップシーケンスに割り当てられた各コンテンツのコンテンツ信頼値を算出し、該コンテンツ信頼値は、各コンテンツが各結合オーディオクリップシーケンスを正しく特徴付けているか否かの尤度を示し、
上記セグメント分割手段(4)は、高いコンテンツ信頼値を有する結合オーディオクリップシーケンスを用いて、上記各コンテンツ分類規則(45、46、47)をトレーニングすることを特徴とする請求項1に記載のオーディオ信号分類装置。 - 上記オーディオクラス分類規則(35、36、37、45、46、47)は、ニューロナルネットワークからなり、
上記ニューロナルネットワークで使用される重みが、該ニューロナルネットワークをトレーニングするように更新されることを特徴とする請求項1又は2に記載のオーディオ信号分類装置。 - 上記オーディオクラス分類規則(35、36、37、45、46、47)は、ガウス混合モデルからなり、
上記ガウス混合モデルで使用される最大尤度線形回帰変換及び/又は帰納的最大値のパラメータが、上記ガウス混合モデルをトレーニングするように調整されることを特徴とする請求項1乃至3のいずれか1項に記載のオーディオ信号分類装置。 - 上記オーディオクラス分類規則(35、36、37、45、46、47)は、決定木からなり、
上記決定木で使用される各リーフノードにおけるイベント継続時間に関する質問が、該決定木をトレーニングするように調整されることを特徴とする請求項1乃至4のいずれか1項に記載のオーディオ信号分類装置。 - 上記オーディオクラス分類規則(35、36、37、45、46、47)は、隠れマルコフモデルからなり、
上記隠れマルコフモデルで使用される、最終オーディオクラス数が与えられた場合の特定オーディオクラスの事前確率及び/又は遷移確率が、上記隠れマルコフモデルをトレーニングするように調整されることを特徴とする請求項1乃至5のいずれか1項に記載のオーディオ信号分類装置。 - 更に、上記オーディオ信号を個々の結合オーディオクリップシーケンスに手動でセグメント分割するとともに、対応するコンテンツを手動で割り当てるための第1のユーザ入力手段(5)を備え、
上記セグメント分割手段(4)は、上記手動でセグメント分割されたオーディオ信号を用いて、上記各コンテンツ分類規則(45、46、47)をトレーニングすることを特徴とする請求項1乃至6のいずれか1項に記載のオーディオ信号分類装置。 - 更に、上記オーディオクリップを対応するオーディオクラスに手動で分類するための第2のユーザ入力手段(6)を備え、
上記クラス判別手段(3)は、上記手動で分類されたオーディオクリップを用いて、上記各オーディオクラス分類規則(35、36、37)をトレーニングすることを特徴とする請求項1乃至7のいずれか1項に記載のオーディオ信号分類装置。 - 上記音響特性は、上記各オーディオ信号の帯域幅、及び/又は、セロクロス率、及び/又は、ボリューム、及び/又は、サブバンドエネルギ率、及び/又は、メルケプストラム成分、及び/又は、周波数重心、及び/又は、サブバンドエネルギ、及び/又は、ピッチ周期からなることを特徴とする請求項1乃至8のいずれか1項に記載のオーディオ信号分類装置。
- 無音、音声、音楽、喝采及び拍手のそれぞれについて、所定のオーディオクラス分類規則が与えられることを特徴とする請求項1乃至9のいずれか1項に記載のオーディオ信号分類装置。
- 上記オーディオ信号は、少なくともオーディオ信号と画像信号とにより構成されるビデオデータファイルの一部であることを特徴とする請求項1乃至10のいずれか1項に記載のオーディオ信号分類装置。
- 上記セグメント分割手段(4)は、上記オーディオ信号のコンテンツを解析することにより上記オーディオ信号における広告放送シーケンスを識別するとともに、該広告放送シーケンスの前及び/又は後の結合オーディオクリップシーケンスを用いて、上記各コンテンツ分類規則(45、46、47)をトレーニングすることを特徴とする請求項1乃至11のいずれか1項に記載のオーディオ信号分類装置。
- オーディオ信号分類方法において、
オーディオ信号(11)をオーディオクリップに区分するステップ(S1)と、
上記オーディオクリップに含まれるオーディオ信号の音響特性を解析することにより、所定のオーディオクラス分類規則(35、36、37)に基づいて、該オーディオクリップを所定のオーディオクラスに分類するステップであって、該各オーディオクラスについて所定のオーディオクラス分類規則が与えられ、各オーディオクラスは、対応するオーディオクリップに含まれるオーディオ信号の種類を表すステップ(S2)と、
上記オーディオクリップに割り当てられた各オーディオクラスのオーディオクラス信頼値を算出するステップであって、該オーディオクラス信頼値は、各オーディオクラスが各オーディオクリップに含まれるオーディオ信号の種類を正しく特徴付けているか否かの尤度を示すステップ(S4)と、
高いオーディオクラス信頼値を有するオーディオクラスのオーディオクリップの音響特性を用いて、上記各オーディオクラス分類規則(35、36、37)をトレーニングするステップ(S5)とを有するオーディオ信号分類方法。 - 更に、結合オーディオクリップのオーディオクラスシーケンスを解析することにより、所定のコンテンツ分類規則(45、46、47)に基づいて、分類済みのオーディオ信号(12)を個々の結合オーディオクリップシーケンスにセグメント分割するステップであって、該各結合オーディオクリップシーケンスは上記オーディオ信号に含まれるコンテンツに対応するステップ(S3)と、
上記結合オーディオクリップシーケンスに割り当てられた各コンテンツのコンテンツ信頼値を算出するステップであって、該コンテンツ信頼値は、各コンテンツが各結合オーディオクリップシーケンスを正しく特徴付けているか否かの尤度を示すステップ(S6)と、
高いコンテンツ信頼値を有する結合オーディオクリップシーケンスを用いて、上記各コンテンツ分類規則(45、46、47)をトレーニングするステップ(S7)とを有する請求項13に記載のオーディオ信号分類方法。 - 更に、上記分類規則(35、36、37、45、46、47)としてニューロナルネットワークを用いるステップと、
上記ニューロナルネットワークをトレーニングするように、該ニューロナルネットワークで使用される重みを更新するステップとを有する請求項13又は14に記載のオーディオ信号分類方法。 - 更に、上記分類規則(35、36、37、45、46、47)としてガウス混合モデルを用いるステップと、
上記ガウス混合モデルをトレーニングするように、該ガウス混合モデルで使用される最大尤度線形回帰変換及び/又は帰納的最大値のパラメータを適応させるステップとを有する請求項13、14又は15のいずれか1項に記載のオーディオ信号分類方法。 - 更に、上記分類規則(35、36、37、45、46、47)として決定木を用いるステップと、
上記決定木をトレーニングするように、該決定木で使用される各リーフノードにおけるイベント継続時間に関する質問を適応させるステップとを有する請求項13乃至16のいずれか1項に記載のオーディオ信号分類方法。 - 更に、上記分類規則(35、36、37、45、46、47)として隠れマルコフモデルを用いるステップと、
上記隠れマルコフモデルをトレーニングするように、該隠れマルコフモデルで使用される最終オーディオクラス数が与えられた場合の特定オーディオクラスの事前確率及び/又は遷移確率を適応させるステップとを有する請求項13乃至17のいずれか1項に記載のオーディオ信号分類方法。 - 更に、個々の結合オーディオクリップシーケンスに手動でセグメント分割されるとともに、対応するコンテンツに対して手動で割り当てられたオーディオ信号を用いて、上記各コンテンツ分類規則(45、46、47)をトレーニングするステップを有する請求項13乃至18のいずれか1項に記載のオーディオ信号分類方法。
- 更に、対応するオーディオクラスに手動で分類されたオーディオクリップを用いて、上記各オーディオクラス分類規則(35、36、37)をトレーニングするステップを有する請求項13乃至19のいずれか1項に記載のオーディオ信号分類方法。
- 更に、上記オーディオ信号のコンテンツを解析することにより、上記オーディオ信号における広告放送シーケンスを識別するステップと、
上記広告放送シーケンスの前及び/又は後の結合オーディオクリップシーケンスを用いて、上記各コンテンツ分類規則(45、46、47)をトレーニングするステップとを有する請求項13乃至20のいずれか1項に記載のオーディオ信号分類方法。 - 請求項13乃至21のいずれか1項に記載のオーディオ信号分類方法を実行できるような移動端末のデータ処理手段により処理される一連の状態要素からなるソフトウェア製品。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP03026046A EP1531478A1 (en) | 2003-11-12 | 2003-11-12 | Apparatus and method for classifying an audio signal |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005173569A true JP2005173569A (ja) | 2005-06-30 |
Family
ID=34429357
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004329133A Pending JP2005173569A (ja) | 2003-11-12 | 2004-11-12 | オーディオ信号の分類装置及び方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20050131688A1 (ja) |
EP (1) | EP1531478A1 (ja) |
JP (1) | JP2005173569A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007121456A (ja) * | 2005-10-25 | 2007-05-17 | Sony Corp | 情報処理装置、情報処理方法、およびプログラム |
WO2008126627A1 (ja) * | 2007-03-26 | 2008-10-23 | Nec Corporation | 音声分類装置、音声分類方法、および音声分類用プログラム |
US8581700B2 (en) | 2006-02-28 | 2013-11-12 | Panasonic Corporation | Wearable device |
JP2014511165A (ja) * | 2011-03-04 | 2014-05-12 | クゥアルコム・インコーポレイテッド | 類似のサウンド環境においてモバイルデバイスを識別するための方法および装置 |
JP2015049398A (ja) * | 2013-09-02 | 2015-03-16 | 本田技研工業株式会社 | 音響認識装置、音響認識方法、及び音響認識プログラム |
Families Citing this family (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10232916B4 (de) * | 2002-07-19 | 2008-08-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Charakterisieren eines Informationssignals |
DE60320414T2 (de) * | 2003-11-12 | 2009-05-20 | Sony Deutschland Gmbh | Vorrichtung und Verfahren zur automatischen Extraktion von wichtigen Ereignissen in Audiosignalen |
KR100571831B1 (ko) * | 2004-02-10 | 2006-04-17 | 삼성전자주식회사 | 음성 식별 장치 및 방법 |
US8938390B2 (en) * | 2007-01-23 | 2015-01-20 | Lena Foundation | System and method for expressive language and developmental disorder assessment |
US9355651B2 (en) | 2004-09-16 | 2016-05-31 | Lena Foundation | System and method for expressive language, developmental disorder, and emotion assessment |
US8078465B2 (en) * | 2007-01-23 | 2011-12-13 | Lena Foundation | System and method for detection and analysis of speech |
US9240188B2 (en) | 2004-09-16 | 2016-01-19 | Lena Foundation | System and method for expressive language, developmental disorder, and emotion assessment |
US10223934B2 (en) | 2004-09-16 | 2019-03-05 | Lena Foundation | Systems and methods for expressive language, developmental disorder, and emotion assessment, and contextual feedback |
US7634405B2 (en) * | 2005-01-24 | 2009-12-15 | Microsoft Corporation | Palette-based classifying and synthesizing of auditory information |
US8682654B2 (en) * | 2006-04-25 | 2014-03-25 | Cyberlink Corp. | Systems and methods for classifying sports video |
JP4239109B2 (ja) | 2006-10-20 | 2009-03-18 | ソニー株式会社 | 情報処理装置および方法、プログラム、並びに記録媒体 |
CN101165779B (zh) * | 2006-10-20 | 2010-06-02 | 索尼株式会社 | 信息处理装置和方法、程序及记录介质 |
WO2008091947A2 (en) * | 2007-01-23 | 2008-07-31 | Infoture, Inc. | System and method for detection and analysis of speech |
EP1975866A1 (en) | 2007-03-31 | 2008-10-01 | Sony Deutschland Gmbh | Method and system for recommending content items |
US20090071315A1 (en) * | 2007-05-04 | 2009-03-19 | Fortuna Joseph A | Music analysis and generation method |
GB2451419A (en) * | 2007-05-11 | 2009-02-04 | Audiosoft Ltd | Processing audio data |
EP2101501A1 (en) * | 2008-03-10 | 2009-09-16 | Sony Corporation | Method for recommendation of audio |
WO2010019831A1 (en) | 2008-08-14 | 2010-02-18 | 21Ct, Inc. | Hidden markov model for speech processing with training method |
JP2010152081A (ja) * | 2008-12-25 | 2010-07-08 | Toshiba Corp | 話者適応装置及びそのプログラム |
US8386251B2 (en) * | 2009-06-08 | 2013-02-26 | Microsoft Corporation | Progressive application of knowledge sources in multistage speech recognition |
US8233999B2 (en) * | 2009-08-28 | 2012-07-31 | Magix Ag | System and method for interactive visualization of music properties |
EP2561508A1 (en) * | 2010-04-22 | 2013-02-27 | Qualcomm Incorporated | Voice activity detection |
US8898058B2 (en) | 2010-10-25 | 2014-11-25 | Qualcomm Incorporated | Systems, methods, and apparatus for voice activity detection |
WO2012098425A1 (en) * | 2011-01-17 | 2012-07-26 | Nokia Corporation | An audio scene processing apparatus |
US9160837B2 (en) | 2011-06-29 | 2015-10-13 | Gracenote, Inc. | Interactive streaming content apparatus, systems and methods |
US20130006633A1 (en) * | 2011-07-01 | 2013-01-03 | Qualcomm Incorporated | Learning speech models for mobile device users |
US8965763B1 (en) * | 2012-02-02 | 2015-02-24 | Google Inc. | Discriminative language modeling for automatic speech recognition with a weak acoustic model and distributed training |
US8543398B1 (en) | 2012-02-29 | 2013-09-24 | Google Inc. | Training an automatic speech recognition system using compressed word frequencies |
US8374865B1 (en) | 2012-04-26 | 2013-02-12 | Google Inc. | Sampling training data for an automatic speech recognition system based on a benchmark classification distribution |
US8805684B1 (en) | 2012-05-31 | 2014-08-12 | Google Inc. | Distributed speaker adaptation |
US8571859B1 (en) | 2012-05-31 | 2013-10-29 | Google Inc. | Multi-stage speaker adaptation |
US8880398B1 (en) | 2012-07-13 | 2014-11-04 | Google Inc. | Localized speech recognition with offload |
JP6140579B2 (ja) * | 2012-09-05 | 2017-05-31 | 本田技研工業株式会社 | 音響処理装置、音響処理方法、及び音響処理プログラム |
US8484017B1 (en) * | 2012-09-10 | 2013-07-09 | Google Inc. | Identifying media content |
US20140074466A1 (en) | 2012-09-10 | 2014-03-13 | Google Inc. | Answering questions using environmental context |
US9123333B2 (en) | 2012-09-12 | 2015-09-01 | Google Inc. | Minimum bayesian risk methods for automatic speech recognition |
US20150310869A1 (en) * | 2012-12-13 | 2015-10-29 | Nokia Corporation | Apparatus aligning audio signals in a shared audio scene |
CN104078050A (zh) * | 2013-03-26 | 2014-10-01 | 杜比实验室特许公司 | 用于音频分类和音频处理的设备和方法 |
CN107093991B (zh) | 2013-03-26 | 2020-10-09 | 杜比实验室特许公司 | 基于目标响度的响度归一化方法和设备 |
US10381042B2 (en) * | 2014-11-14 | 2019-08-13 | Samsung Electronics Co., Ltd. | Method and system for generating multimedia clip |
US10068445B2 (en) * | 2015-06-24 | 2018-09-04 | Google Llc | Systems and methods of home-specific sound event detection |
US10585121B2 (en) * | 2016-09-12 | 2020-03-10 | Tektronix, Inc. | Recommending measurements based on detected waveform type |
US10529357B2 (en) | 2017-12-07 | 2020-01-07 | Lena Foundation | Systems and methods for automatic determination of infant cry and discrimination of cry from fussiness |
CN110189769B (zh) * | 2019-05-23 | 2021-11-19 | 复钧智能科技(苏州)有限公司 | 基于多个卷积神经网络模型结合的异常声音检测方法 |
CN113488055B (zh) * | 2020-04-28 | 2024-03-08 | 海信集团有限公司 | 一种智能交互方法、服务器及智能交互设备 |
WO2023154395A1 (en) * | 2022-02-14 | 2023-08-17 | Worcester Polytechnic Institute | Methods for verifying integrity and authenticity of a printed circuit board |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA1123955A (en) * | 1978-03-30 | 1982-05-18 | Tetsu Taguchi | Speech analysis and synthesis apparatus |
US5749066A (en) * | 1995-04-24 | 1998-05-05 | Ericsson Messaging Systems Inc. | Method and apparatus for developing a neural network for phoneme recognition |
US6185527B1 (en) * | 1999-01-19 | 2001-02-06 | International Business Machines Corporation | System and method for automatic audio content analysis for word spotting, indexing, classification and retrieval |
US6404925B1 (en) * | 1999-03-11 | 2002-06-11 | Fuji Xerox Co., Ltd. | Methods and apparatuses for segmenting an audio-visual recording using image similarity searching and audio speaker recognition |
DE19929462A1 (de) * | 1999-06-26 | 2001-02-22 | Philips Corp Intellectual Pty | Verfahren zum Training eines automatischen Spracherkenners |
US6925455B2 (en) * | 2000-12-12 | 2005-08-02 | Nec Corporation | Creating audio-centric, image-centric, and integrated audio-visual summaries |
DE60217484T2 (de) * | 2001-05-11 | 2007-10-25 | Koninklijke Philips Electronics N.V. | Schätzung der signalleistung in einem komprimierten audiosignal |
US6476308B1 (en) * | 2001-08-17 | 2002-11-05 | Hewlett-Packard Company | Method and apparatus for classifying a musical piece containing plural notes |
-
2003
- 2003-11-12 EP EP03026046A patent/EP1531478A1/en not_active Ceased
-
2004
- 2004-11-10 US US10/985,295 patent/US20050131688A1/en not_active Abandoned
- 2004-11-12 JP JP2004329133A patent/JP2005173569A/ja active Pending
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007121456A (ja) * | 2005-10-25 | 2007-05-17 | Sony Corp | 情報処理装置、情報処理方法、およびプログラム |
US7738982B2 (en) | 2005-10-25 | 2010-06-15 | Sony Corporation | Information processing apparatus, information processing method and program |
US8581700B2 (en) | 2006-02-28 | 2013-11-12 | Panasonic Corporation | Wearable device |
WO2008126627A1 (ja) * | 2007-03-26 | 2008-10-23 | Nec Corporation | 音声分類装置、音声分類方法、および音声分類用プログラム |
US8630853B2 (en) | 2007-03-26 | 2014-01-14 | Nec Corporation | Speech classification apparatus, speech classification method, and speech classification program |
JP2014511165A (ja) * | 2011-03-04 | 2014-05-12 | クゥアルコム・インコーポレイテッド | 類似のサウンド環境においてモバイルデバイスを識別するための方法および装置 |
US9143571B2 (en) | 2011-03-04 | 2015-09-22 | Qualcomm Incorporated | Method and apparatus for identifying mobile devices in similar sound environment |
JP2015049398A (ja) * | 2013-09-02 | 2015-03-16 | 本田技研工業株式会社 | 音響認識装置、音響認識方法、及び音響認識プログラム |
US9911436B2 (en) | 2013-09-02 | 2018-03-06 | Honda Motor Co., Ltd. | Sound recognition apparatus, sound recognition method, and sound recognition program |
Also Published As
Publication number | Publication date |
---|---|
US20050131688A1 (en) | 2005-06-16 |
EP1531478A1 (en) | 2005-05-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2005173569A (ja) | オーディオ信号の分類装置及び方法 | |
US8635065B2 (en) | Apparatus and method for automatic extraction of important events in audio signals | |
US6819863B2 (en) | System and method for locating program boundaries and commercial boundaries using audio categories | |
KR101109023B1 (ko) | 콘텐트 분석을 사용하여 뮤직 비디오를 요약하는 방법 및 장치 | |
EP1531626B1 (en) | Automatic summarisation for a television programme suggestion engine based on consumer preferences | |
JP4300697B2 (ja) | 信号処理装置及び方法 | |
US8068719B2 (en) | Systems and methods for detecting exciting scenes in sports video | |
JP2005322401A (ja) | メディア・セグメント・ライブラリを生成する方法、装置およびプログラム、および、カスタム・ストリーム生成方法およびカスタム・メディア・ストリーム発信システム | |
JP2007519987A (ja) | 内部及び外部オーディオビジュアルデータの統合解析システム及び方法 | |
KR20050014866A (ko) | 메가 화자 식별 (id) 시스템 및 이에 대응하는 방법 | |
WO2007004110A2 (en) | System and method for the alignment of intrinsic and extrinsic audio-visual information | |
JP2005532582A (ja) | 音響信号に音響クラスを割り当てる方法及び装置 | |
US7962330B2 (en) | Apparatus and method for automatic dissection of segmented audio signals | |
US20060224616A1 (en) | Information processing device and method thereof | |
JP3757719B2 (ja) | 音響データ分析方法及びその装置 | |
US7680654B2 (en) | Apparatus and method for segmentation of audio data into meta patterns | |
Iwan et al. | Temporal video segmentation: detecting the end-of-act in circus performance videos | |
CN101355673B (zh) | 信息处理装置和信息处理方法 | |
EP1542206A1 (en) | Apparatus and method for automatic classification of audio signals | |
JP2005167456A (ja) | Avコンテンツ興趣特徴抽出方法及びavコンテンツ興趣特徴抽出装置 | |
JP4884163B2 (ja) | 音声分類装置 | |
Jain et al. | Audio-Visual Contents Based Movies Characterization |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071112 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20081002 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20081106 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110201 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110628 |