JP2009288707A - 音声音楽判定装置、音声音楽判定方法及び音声音楽判定用プログラム - Google Patents
音声音楽判定装置、音声音楽判定方法及び音声音楽判定用プログラム Download PDFInfo
- Publication number
- JP2009288707A JP2009288707A JP2008143647A JP2008143647A JP2009288707A JP 2009288707 A JP2009288707 A JP 2009288707A JP 2008143647 A JP2008143647 A JP 2008143647A JP 2008143647 A JP2008143647 A JP 2008143647A JP 2009288707 A JP2009288707 A JP 2009288707A
- Authority
- JP
- Japan
- Prior art keywords
- music
- characteristic
- signal
- voice
- score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 230000005236 sound signal Effects 0.000 claims abstract description 88
- 230000002195 synergetic effect Effects 0.000 description 11
- 230000005540 biological transmission Effects 0.000 description 10
- 238000004891 communication Methods 0.000 description 7
- 239000000284 extract Substances 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 239000000470 constituent Substances 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 239000006185 dispersion Substances 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 230000007935 neutral effect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000010363 phase shift Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/031—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
- G10H2210/046—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for differentiation between music and non-music signals, based on the identification of musical parameters, e.g. based on tempo detection
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
【解決手段】入力オーディオ信号から音声と音楽とを判別するための各種の特徴パラメータを算出し、音声及び音楽判定用のしきい値と比較して、音声を示す特徴パラメータに音声特性スコア(Ss)を付与し、音楽を示す特徴パラメータに音楽特性スコア(Sm)を付与する。そして、音声特性スコア(Ss)の総和(Ssall)と音楽特性スコア(Sm)の総和(Small)との差分に基づいて、入力オーディオ信号が音声信号であるか音楽信号であるかを判定する。
【選択図】 図3
Description
Claims (8)
- 入力オーディオ信号から音声信号と音楽信号とを判別するための各種の特徴パラメータを算出する特徴パラメータ算出手段と、
前記特徴パラメータ算出手段で算出された各種の特徴パラメータを、それぞれ音声判定用のしきい値及び音楽判定用のしきい値と比較し、音声と判定された特徴パラメータに音声特性スコアを付与し、音楽と判定された特徴パラメータに音楽特性スコアを付与する音声音楽特性スコア算出手段と、
前記音声音楽特性スコア算出手段で算出された全ての音声特性スコアの総和と全ての音楽特性スコアの総和との差分に基づいて、前記入力オーディオ信号が音声信号であるか音楽信号であるかを判定する音声音楽判定手段とを具備することを特徴とする音声音楽判定装置。 - 前記特徴パラメータ算出手段は、前記入力オーディオ信号をそれぞれが複数のサブフレームでなる所定のフレーム単位に分割し、サブフレーム単位で前記入力オーディオ信号から音声信号と音楽信号とを判別するための判別情報を算出し、その判別情報に対してフレーム単位での統計量を求めることにより、前記特徴パラメータを生成することを特徴とする請求項1記載の音声音楽判定装置。
- 前記特徴パラメータ算出手段は、前記入力オーディオ信号に対して、パワー変動、零交差周波数、ステレオの左右信号のパワー比のいずれかを含む各種の特徴パラメータを算出することを特徴とする請求項1記載の音声音楽判定装置。
- 前記音声音楽特性スコア算出手段は、
前記音声と判定された特徴パラメータに対して、その特徴パラメータの特性に応じた重み付けを与えた音声特性スコアを付与し、
前記音楽と判定された特徴パラメータに対して、その特徴パラメータの特性に応じた重み付けを与えた音楽特性スコアを付与することを特徴とする請求項1記載の音声音楽判定装置。 - 前記音声音楽特性スコア算出手段は、
前記特徴パラメータ算出手段で算出された各種の特徴パラメータのうち、相互に関連性を有する特徴パラメータを含む組を取り出し、その組に含まれる全ての特徴パラメータが音声と判定されている場合には、さらに音声特性スコアを付与し、
前記特徴パラメータ算出手段で算出された各種の特徴パラメータのうち、相互に関連性を有する特徴パラメータを含む組を取り出し、その組に含まれる全ての特徴パラメータが音楽と判定されている場合には、さらに音楽特性スコアを付与することを特徴とする請求項1記載の音声音楽判定装置。 - 前記音声音楽判定手段は、前記音声音楽特性スコア算出手段で算出された全ての音声特性スコアの総和と全ての音楽特性スコアの総和との差分が、予め設定された所定の点数以上離れていない場合、最後に前記所定の点数以上離れたときの判定結果を継続して採用することを特徴とする請求項1記載の音声音楽判定装置。
- 入力オーディオ信号を特徴パラメータ算出手段に供給して、音声信号と音楽信号とを判別するための各種の特徴パラメータを算出する工程と、
算出された各種の特徴パラメータを音声音楽特性スコア算出手段に供給して、音声判定用のしきい値及び音楽判定用のしきい値とそれぞれ比較し、音声と判定された特徴パラメータに音声特性スコアを付与し、音楽と判定された特徴パラメータに音楽特性スコアを付与する工程と、
付与された全ての音声特性スコア及び音楽特性スコアを音声音楽判定手段に供給して、全ての音声特性スコアの総和と全ての音楽特性スコアの総和との差分に基づいて、前記入力オーディオ信号が音声信号であるか音楽信号であるかを判定する工程とを有することを特徴とする音声音楽判定方法。 - 入力オーディオ信号から音声信号と音楽信号とを判別するための各種の特徴パラメータを算出する処理を、コンピュータに実行させるための特徴パラメータ算出手段と、
前記特徴パラメータ算出手段で算出された各種の特徴パラメータを、それぞれ音声判定用のしきい値及び音楽判定用のしきい値と比較し、音声と判定された特徴パラメータに音声特性スコアを付与し、音楽と判定された特徴パラメータに音楽特性スコアを付与する処理を、コンピュータに実行させるための音声音楽特性スコア算出手段と、
前記音声音楽特性スコア算出手段で算出された全ての音声特性スコアの総和と全ての音楽特性スコアの総和との差分に基づいて、前記入力オーディオ信号が音声信号であるか音楽信号であるかを判定する処理を、コンピュータに実行させるための音声音楽判定手段とを具備することを特徴とする音声音楽判定用プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008143647A JP4327888B1 (ja) | 2008-05-30 | 2008-05-30 | 音声音楽判定装置、音声音楽判定方法及び音声音楽判定用プログラム |
US12/392,911 US7856354B2 (en) | 2008-05-30 | 2009-02-25 | Voice/music determining apparatus, voice/music determination method, and voice/music determination program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008143647A JP4327888B1 (ja) | 2008-05-30 | 2008-05-30 | 音声音楽判定装置、音声音楽判定方法及び音声音楽判定用プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP4327888B1 JP4327888B1 (ja) | 2009-09-09 |
JP2009288707A true JP2009288707A (ja) | 2009-12-10 |
Family
ID=41149096
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008143647A Expired - Fee Related JP4327888B1 (ja) | 2008-05-30 | 2008-05-30 | 音声音楽判定装置、音声音楽判定方法及び音声音楽判定用プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US7856354B2 (ja) |
JP (1) | JP4327888B1 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011078037A1 (ja) | 2009-12-21 | 2011-06-30 | 国立大学法人広島大学 | 老化マーカー、老化抑制物質の評価方法および癌抑制剤 |
US8099276B2 (en) | 2010-01-21 | 2012-01-17 | Kabushiki Kaisha Toshiba | Sound quality control device and sound quality control method |
JP2012032447A (ja) * | 2010-07-28 | 2012-02-16 | Toshiba Corp | 音質制御装置及び音質制御方法 |
JP2012063726A (ja) * | 2010-09-17 | 2012-03-29 | Toshiba Corp | 音質補正装置及び音声補正方法 |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4327886B1 (ja) * | 2008-05-30 | 2009-09-09 | 株式会社東芝 | 音質補正装置、音質補正方法及び音質補正用プログラム |
JP4327888B1 (ja) | 2008-05-30 | 2009-09-09 | 株式会社東芝 | 音声音楽判定装置、音声音楽判定方法及び音声音楽判定用プログラム |
JP4621792B2 (ja) * | 2009-06-30 | 2011-01-26 | 株式会社東芝 | 音質補正装置、音質補正方法及び音質補正用プログラム |
US8712771B2 (en) * | 2009-07-02 | 2014-04-29 | Alon Konchitsky | Automated difference recognition between speaking sounds and music |
US8340964B2 (en) * | 2009-07-02 | 2012-12-25 | Alon Konchitsky | Speech and music discriminator for multi-media application |
US8606569B2 (en) * | 2009-07-02 | 2013-12-10 | Alon Konchitsky | Automatic determination of multimedia and voice signals |
JP2011065093A (ja) * | 2009-09-18 | 2011-03-31 | Toshiba Corp | オーディオ信号補正装置及びオーディオ信号補正方法 |
US9263063B2 (en) * | 2010-02-25 | 2016-02-16 | Telefonaktiebolaget L M Ericsson (Publ) | Switching off DTX for music |
US9450812B2 (en) | 2014-03-14 | 2016-09-20 | Dechnia, LLC | Remote system configuration via modulated audio |
WO2016172363A1 (en) * | 2015-04-24 | 2016-10-27 | Cyber Resonance Corporation | Methods and systems for performing signal analysis to identify content types |
US11848019B2 (en) * | 2021-06-16 | 2023-12-19 | Hewlett-Packard Development Company, L.P. | Private speech filterings |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR940001861B1 (ko) * | 1991-04-12 | 1994-03-09 | 삼성전자 주식회사 | 오디오 대역신호의 음성/음악 판별장치 |
US5280562A (en) * | 1991-10-03 | 1994-01-18 | International Business Machines Corporation | Speech coding apparatus with single-dimension acoustic prototypes for a speech recognizer |
JP2835483B2 (ja) | 1993-06-23 | 1998-12-14 | 松下電器産業株式会社 | 音声判別装置と音響再生装置 |
JPH08185196A (ja) | 1994-12-28 | 1996-07-16 | Sony Corp | 音声区間検出装置 |
US5712953A (en) * | 1995-06-28 | 1998-01-27 | Electronic Data Systems Corporation | System and method for classification of audio or audio/video signals based on musical content |
JPH09160585A (ja) | 1995-12-05 | 1997-06-20 | Sony Corp | 音声認識装置および音声認識方法 |
US6570991B1 (en) * | 1996-12-18 | 2003-05-27 | Interval Research Corporation | Multi-feature speech/music discrimination system |
JPH10256857A (ja) | 1997-03-11 | 1998-09-25 | Toshiba Corp | 音質補正装置 |
JP3878482B2 (ja) * | 1999-11-24 | 2007-02-07 | 富士通株式会社 | 音声検出装置および音声検出方法 |
JP3588030B2 (ja) | 2000-03-16 | 2004-11-10 | 三菱電機株式会社 | 音声区間判定装置及び音声区間判定方法 |
US6990453B2 (en) * | 2000-07-31 | 2006-01-24 | Landmark Digital Services Llc | System and methods for recognizing sound and music signals in high noise and distortion |
EP1244094A1 (de) * | 2001-03-20 | 2002-09-25 | Swissqual AG | Verfahren und Vorrichtung zur Bestimmung eines Qualitätsmasses eines Audiosignals |
JP2003084790A (ja) * | 2001-09-17 | 2003-03-19 | Matsushita Electric Ind Co Ltd | 台詞成分強調装置 |
KR100880480B1 (ko) * | 2002-02-21 | 2009-01-28 | 엘지전자 주식회사 | 디지털 오디오 신호의 실시간 음악/음성 식별 방법 및시스템 |
JP4099576B2 (ja) | 2002-09-30 | 2008-06-11 | ソニー株式会社 | 情報識別装置及び方法、並びにプログラム及び記録媒体 |
ATE333694T1 (de) * | 2003-01-18 | 2006-08-15 | Psytechnics Ltd | Werkzeug zur nicht invasiven bestimmung der qualität eines sprachsignals |
JP2005266098A (ja) | 2004-03-17 | 2005-09-29 | Canon Inc | 音声信号セグメント方法、音声ピッチ検出方法及び音声区間検出処理方法 |
US7130795B2 (en) * | 2004-07-16 | 2006-10-31 | Mindspeed Technologies, Inc. | Music detection with low-complexity pitch correlation algorithm |
JP4486527B2 (ja) | 2005-03-07 | 2010-06-23 | 日本電信電話株式会社 | 音響信号分析装置およびその方法、プログラム、記録媒体 |
JP2007004000A (ja) | 2005-06-27 | 2007-01-11 | Tokyo Electric Power Co Inc:The | コールセンターにおけるオペレータ業務支援システム |
JP2007017620A (ja) | 2005-07-06 | 2007-01-25 | Kyoto Univ | 発話区間検出装置、そのためのコンピュータプログラム及び記録媒体 |
JP4327886B1 (ja) * | 2008-05-30 | 2009-09-09 | 株式会社東芝 | 音質補正装置、音質補正方法及び音質補正用プログラム |
JP4327888B1 (ja) | 2008-05-30 | 2009-09-09 | 株式会社東芝 | 音声音楽判定装置、音声音楽判定方法及び音声音楽判定用プログラム |
-
2008
- 2008-05-30 JP JP2008143647A patent/JP4327888B1/ja not_active Expired - Fee Related
-
2009
- 2009-02-25 US US12/392,911 patent/US7856354B2/en not_active Expired - Fee Related
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011078037A1 (ja) | 2009-12-21 | 2011-06-30 | 国立大学法人広島大学 | 老化マーカー、老化抑制物質の評価方法および癌抑制剤 |
US8099276B2 (en) | 2010-01-21 | 2012-01-17 | Kabushiki Kaisha Toshiba | Sound quality control device and sound quality control method |
JP2012032447A (ja) * | 2010-07-28 | 2012-02-16 | Toshiba Corp | 音質制御装置及び音質制御方法 |
JP2012063726A (ja) * | 2010-09-17 | 2012-03-29 | Toshiba Corp | 音質補正装置及び音声補正方法 |
Also Published As
Publication number | Publication date |
---|---|
US7856354B2 (en) | 2010-12-21 |
US20090299750A1 (en) | 2009-12-03 |
JP4327888B1 (ja) | 2009-09-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4327888B1 (ja) | 音声音楽判定装置、音声音楽判定方法及び音声音楽判定用プログラム | |
JP4364288B1 (ja) | 音声音楽判定装置、音声音楽判定方法及び音声音楽判定用プログラム | |
JP4439579B1 (ja) | 音質補正装置、音質補正方法及び音質補正用プログラム | |
JP4621792B2 (ja) | 音質補正装置、音質補正方法及び音質補正用プログラム | |
JP4327886B1 (ja) | 音質補正装置、音質補正方法及び音質補正用プログラム | |
CN114339297B (zh) | 音频处理方法、装置、电子设备和计算机可读存储介质 | |
US9756437B2 (en) | System and method for transmitting environmental acoustical information in digital audio signals | |
JPWO2018096954A1 (ja) | 再生装置、再生方法、情報処理装置、情報処理方法、およびプログラム | |
JP4837123B1 (ja) | 音質制御装置及び音質制御方法 | |
US8965181B2 (en) | Automatic announcer voice attenuation in a presentation of a broadcast event | |
JP2004048751A (ja) | 多チャンネル立体音響サウンドの生成方法及び装置 | |
JP4709928B1 (ja) | 音質補正装置及び音質補正方法 | |
JP5695896B2 (ja) | 音質制御装置、音質制御方法及び音質制御用プログラム | |
JP4534844B2 (ja) | デジタルサラウンドシステム、サーバ装置およびアンプ装置 | |
Zielinski et al. | Comparison of quality degradation effects caused by limitation of bandwidth and by down-mix algorithms in consumer multichannel audio delivery systems | |
JP4543107B2 (ja) | 映像音声再生装置および映像音声再生方法 | |
JP2009159307A (ja) | 再生装置、設定情報の設定方法、コンピュータプログラムおよび通信システム | |
Zacharov et al. | Subjective evaluation of virtual home theatre sound systems for loudspeakers and headphones | |
JP2011013290A (ja) | 演奏条件設定機能付きカラオケシステム | |
JP2017069705A (ja) | 受信装置、受信方法、放送システムおよびプログラム | |
Deshpande | Viewer preferences for adaptive playout | |
JP2004355685A (ja) | ディスク再生装置 | |
Wilson | Can We Get the Bass Right? | |
WO2008072887A1 (en) | Electrical system control method of a general-purpose which uses the control data which is included in audio -visual data of the computer | |
KR20160079339A (ko) | 음향 서비스 제공 방법 및 시스템, 그리고 음향 전송 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090519 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090611 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120619 Year of fee payment: 3 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4327888 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120619 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120619 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130619 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |