JP4364288B1 - 音声音楽判定装置、音声音楽判定方法及び音声音楽判定用プログラム - Google Patents
音声音楽判定装置、音声音楽判定方法及び音声音楽判定用プログラム Download PDFInfo
- Publication number
- JP4364288B1 JP4364288B1 JP2008174698A JP2008174698A JP4364288B1 JP 4364288 B1 JP4364288 B1 JP 4364288B1 JP 2008174698 A JP2008174698 A JP 2008174698A JP 2008174698 A JP2008174698 A JP 2008174698A JP 4364288 B1 JP4364288 B1 JP 4364288B1
- Authority
- JP
- Japan
- Prior art keywords
- music
- signal
- audio signal
- background sound
- score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/031—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
- G10H2210/046—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for differentiation between music and non-music signals, based on the identification of musical parameters, e.g. based on tempo detection
Abstract
【解決手段】入力オーディオ信号から音声と音楽とを判別するための各種の特徴パラメータを算出し、あらかじめ学習した音声・音楽用参照データのパラメータ値に基づく重み係数を付与し、音楽・音声信号の確度を表すスコアS1として算出する。同様に、入力オーディオ信号から音楽と背景音の重畳した音声信号とを判別するための各種の特徴パラメータを算出し、音楽・背景音用参照データのパラメータ値に基づく重み係数を付与し、音楽・背景音重畳音声信号の確度を表すスコアS2として算出する。
【選択図】 図3
Description
そして、音声音楽判定用特徴パラメータ算出部79は、ステップS5bで、パラメータ値算出部801により、入力オーディオ信号からサブフレーム単位でのパワーを算出し、ステップS5cで、パラメータ値算出部802により、入力オーディオ信号からサブフレーム単位での零交差周波数を算出し、ステップS5dで、パラメータ値算出部803により、入力オーディオ信号からサブフレーム単位でのLRパワー比を算出する。
ここで、(1)の各要素は抽出したn個の特徴パラメータに対応する。(2)式の−1、+1はそれぞれ音楽区間及び音声区間に対応し、使用する音声・音楽用参照データの正解信号種別となる区間をあらかじめ人手で2値のラベル付けする。また、(2)式より以下の線形識別関数を立てる。
k=1〜N(Nは参照データの入力フレーム数)に対し、ベクトルxを抽出し、(3)式の評価値と正解信号種別(2)式の誤差二乗和(4)式が最小となる正規方程式を解くことにより、各パラメータの重み付けされた係数βが決まる。
学習により決定した係数を用い、実際に識別するデータの評価値を(3)式より計算し、f(x)>0なら音声区間、f(x)<0なら音楽区間と判定する。また、このときのf(x)が上記のスコアS1に相当する。ここで、上記の学習において音楽・背景音用参照データに変え同様の手続きを行うことで、音楽信号と背景音重畳音声信号の識別に適した各パラメータに乗ずる重み係数が決定され、この係数を実際の識別データの各特徴パラメータ値に乗ずることでスコアS2を算出する。
Claims (7)
- 入力オーディオ信号から音声信号と音楽信号とを判別するための各種の特徴パラメータを算出する音声・音楽判定用特徴パラメータ算出手段と、
同様に入力オーディオ信号から背景音の重畳した音声信号と音楽信号とを判別するための各種の特徴パラメータを算出する音楽・背景音判定用特徴パラメータ算出手段と、
前記音声・音楽判定用特徴パラメータ算出手段で算出された各種の特徴パラメータに対し、それぞれあらかじめ学習した音声・音楽用参照データのパラメータ値に基づく重み係数を付与し、係数を乗じたパラメータ値の総和を音楽・音声信号の確度を表すスコアとして算出する音声・音楽信号特性スコア算出手段と、
前記音楽・背景音判定用特徴パラメータ算出手段で算出された各種の特徴パラメータに対し、それぞれあらかじめ学習した音楽・背景音用参照データのパラメータ値に基づく重み係数を付与し、係数を乗じたパラメータ値の総和を音楽・背景音重畳音声信号の確度を表すスコアとして算出する音楽・背景音信号特性スコア算出手段と、
前記音声・音楽信号特性スコア算出手段で算出されたスコアに基づいて、前記入力オーディオ信号が音声信号であるか音楽信号であるかを判定し、音楽信号であると判定された場合、前記音楽・背景音信号特性スコア算出手段で算出されたスコアに基づいて、前記入力オーディオ信号が背景音の重畳した音声信号か否かをさらに判定する音声音楽判定手段とを具備することを特徴とする音声音楽判定装置。 - 前記特徴パラメータ算出手段は、前記入力オーディオ信号をそれぞれが複数のサブフレームでなる所定のフレーム単位に分割し、サブフレーム単位で前記入力オーディオ信号から音声信号と音楽信号とを判別するための判別情報を算出し、その判別情報に対してフレーム単位での統計量を求めることにより、前記特徴パラメータを生成することを特徴とする請求項1記載の音声音楽判定装置。
- 前記音声・音楽判定用特徴パラメータ算出手段は、前記入力オーディオ信号に対して、音声信号であるか音楽信号であるかを判定する前段の判定処理に適した特徴パラメータとして、パワー変動、零交差周波数、ステレオの左右信号のパワー比等を算出し、
また、前記音楽・背景音判定用特徴パラメータ算出手段は、音楽信号であるか背景音重畳音声信号であるかを判定する後段の判定処理に適した特徴パラメータとして、楽曲の楽器音に相当する特定の周波数帯域成分のパワー集中度合い等を算出することを特徴とする請求項1記載の音声音楽判定装置。 - 前記音声音楽信号特性スコア算出手段は、
あらかじめ学習した音声・音楽用参照データのパラメータ値に基づく重み係数を付与し、係数を乗じたパラメータ値の総和を音楽・音声信号の確度を表すスコアとして算出し、
前記音楽・背景音信号特性スコア算出手段は、
あらかじめ学習した音楽・背景音用参照データのパラメータ値に基づく重み係数を付与し、係数を乗じたパラメータ値の総和を音楽・背景音重畳音声信号の確度を表すスコアとして算出することを特徴とする請求項1記載の音声音楽判定装置。 - 前記音声音楽判定手段は、前記音声音楽信号特性スコア算出手段で算出されたスコアに基づいて、前記入力オーディオ信号が音声信号であるか音楽信号であるかを判定し、前者であると判定すれば前記信号は音声信号であると判定し、また後者であると判定された場合に、前記信号が音声信号であるにも関わらず背景音重畳の影響で誤って音楽信号と判定されることを防ぐ目的で、前記音楽・背景音信号特性スコア算出手段で算出されたスコアに基づいて、前記入力オーディオ信号が背景音の重畳した音声信号であるか音楽信号であるかを判定する多段構成により信号種別を判定することを特徴とする請求項1記載の音声音楽判定装置。
- 入力オーディオ信号を音声・音楽判定用特徴パラメータ算出手段に供給して、音声信号と音楽信号とを判別するための各種の特徴パラメータを算出する工程と、
入力オーディオ信号を音楽・背景音判定用特徴パラメータ算出手段に供給して、音楽信号と背景音重畳音声信号とを判別するための各種の特徴パラメータを算出する工程と、
算出された各種の音声・音楽判定用特徴パラメータを音声音楽信号特性スコア算出手段に供給して、あらかじめ学習した音声・音楽用参照データのパラメータ値に基づく重み係数を付与し、係数を乗じたパラメータ値の総和を音楽・音声信号の確度を表すスコアとして算出する工程と、
算出された各種の音楽・背景音判定用特徴パラメータを音楽・背景音信号特性スコア算出手段に供給して、あらかじめ学習した音楽・背景音用参照データのパラメータ値に基づく重み係数を付与し、係数を乗じたパラメータ値の総和を音楽・背景音重畳音声信号の確度を表すスコアとして算出する工程と、
付与された音声・音楽信号特性スコア及び音楽・背景音信号特性スコアに基づいて、前記入力オーディオ信号が音声信号であるか音楽信号であるかを判定する工程と、
音楽信号であると判定された場合、前記スコアに基づいて前記入力オーディオ信号が背景音の重畳した音声信号か否かをさらに判定する工程と
を有することを特徴とする音声音楽判定方法。 - 入力オーディオ信号から音声信号と音楽信号とを判別するための各種の音声・音楽判定用特徴パラメータを算出する処理および、入力オーディオ信号から音楽信号と背景音重畳音声信号とを判別するための各種の音楽・背景音判定用特徴パラメータを算出する処理を、コンピュータに実行させるための特徴パラメータ算出手段と、
前記音声・音楽判定用特徴パラメータ算出手段で算出された各種の特徴パラメータに対し、あらかじめ学習した音声・音楽用参照データのパラメータ値に基づく重み係数を付与し、係数を乗じたパラメータ値の総和を音楽・音声信号の確度を表すスコアとして算出する処理および、
前記音楽・背景音判定用特徴パラメータ算出手段で算出された各種の特徴パラメータに対し、あらかじめ学習した音楽・背景音用参照データのパラメータ値に基づく重み係数を付与し、係数を乗じたパラメータ値の総和を音楽・背景音重畳音声信号の確度を表すスコアとして算出する音声・音楽特性スコア算出手段及び音楽・背景音特性スコア算出手段と、
付与されたスコアに基づいて、前記入力オーディオ信号が音声信号であるか音楽信号であるかを判定し、音楽信号であると判定された場合、前記スコアに基づいて前記入力オーディオ信号が背景音の重畳した音声信号か否かをさらに判定する音声音楽判定手段と、
をコンピュータに実行させることを特徴とする音声音楽判定用プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008174698A JP4364288B1 (ja) | 2008-07-03 | 2008-07-03 | 音声音楽判定装置、音声音楽判定方法及び音声音楽判定用プログラム |
US12/430,763 US7756704B2 (en) | 2008-07-03 | 2009-04-27 | Voice/music determining apparatus and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008174698A JP4364288B1 (ja) | 2008-07-03 | 2008-07-03 | 音声音楽判定装置、音声音楽判定方法及び音声音楽判定用プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP4364288B1 true JP4364288B1 (ja) | 2009-11-11 |
JP2010014960A JP2010014960A (ja) | 2010-01-21 |
Family
ID=41393562
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008174698A Expired - Fee Related JP4364288B1 (ja) | 2008-07-03 | 2008-07-03 | 音声音楽判定装置、音声音楽判定方法及び音声音楽判定用プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US7756704B2 (ja) |
JP (1) | JP4364288B1 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4439579B1 (ja) * | 2008-12-24 | 2010-03-24 | 株式会社東芝 | 音質補正装置、音質補正方法及び音質補正用プログラム |
JP4621792B2 (ja) * | 2009-06-30 | 2011-01-26 | 株式会社東芝 | 音質補正装置、音質補正方法及び音質補正用プログラム |
CN102044246B (zh) * | 2009-10-15 | 2012-05-23 | 华为技术有限公司 | 一种音频信号检测方法和装置 |
JP4869420B2 (ja) * | 2010-03-25 | 2012-02-08 | 株式会社東芝 | 音情報判定装置、及び音情報判定方法 |
JP4837123B1 (ja) | 2010-07-28 | 2011-12-14 | 株式会社東芝 | 音質制御装置及び音質制御方法 |
JP4937393B2 (ja) | 2010-09-17 | 2012-05-23 | 株式会社東芝 | 音質補正装置及び音声補正方法 |
US9092992B2 (en) | 2011-07-14 | 2015-07-28 | Playnote Limited | System and method for music education |
US9064503B2 (en) * | 2012-03-23 | 2015-06-23 | Dolby Laboratories Licensing Corporation | Hierarchical active voice detection |
WO2015097831A1 (ja) * | 2013-12-26 | 2015-07-02 | 株式会社東芝 | 電子機器、制御方法およびプログラム |
JP5984153B2 (ja) | 2014-09-22 | 2016-09-06 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 情報処理装置、プログラム、及び情報処理方法 |
US9972334B2 (en) | 2015-09-10 | 2018-05-15 | Qualcomm Incorporated | Decoder audio classification |
CN114927141B (zh) * | 2022-07-19 | 2022-10-25 | 中国人民解放军海军工程大学 | 异常水声信号的检测方法及系统 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2910417B2 (ja) | 1992-06-17 | 1999-06-23 | 松下電器産業株式会社 | 音声音楽判別装置 |
US6570991B1 (en) * | 1996-12-18 | 2003-05-27 | Interval Research Corporation | Multi-feature speech/music discrimination system |
JP3475317B2 (ja) | 1996-12-20 | 2003-12-08 | 日本電信電話株式会社 | 映像分類方法および装置 |
JP2000066691A (ja) | 1998-08-21 | 2000-03-03 | Kdd Corp | オーディオ情報分類装置 |
KR100880480B1 (ko) * | 2002-02-21 | 2009-01-28 | 엘지전자 주식회사 | 디지털 오디오 신호의 실시간 음악/음성 식별 방법 및시스템 |
JP4099576B2 (ja) | 2002-09-30 | 2008-06-11 | ソニー株式会社 | 情報識別装置及び方法、並びにプログラム及び記録媒体 |
JP3999674B2 (ja) | 2003-01-16 | 2007-10-31 | 日本電信電話株式会社 | 類似音声音楽検索装置,類似音声音楽検索プログラムおよびそのプログラムの記録媒体 |
US7120576B2 (en) * | 2004-07-16 | 2006-10-10 | Mindspeed Technologies, Inc. | Low-complexity music detection algorithm and system |
US7130795B2 (en) * | 2004-07-16 | 2006-10-31 | Mindspeed Technologies, Inc. | Music detection with low-complexity pitch correlation algorithm |
KR100631608B1 (ko) | 2004-11-25 | 2006-10-09 | 엘지전자 주식회사 | 음성 판별 방법 |
US20080033583A1 (en) * | 2006-08-03 | 2008-02-07 | Broadcom Corporation | Robust Speech/Music Classification for Audio Signals |
-
2008
- 2008-07-03 JP JP2008174698A patent/JP4364288B1/ja not_active Expired - Fee Related
-
2009
- 2009-04-27 US US12/430,763 patent/US7756704B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US7756704B2 (en) | 2010-07-13 |
JP2010014960A (ja) | 2010-01-21 |
US20100004928A1 (en) | 2010-01-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4364288B1 (ja) | 音声音楽判定装置、音声音楽判定方法及び音声音楽判定用プログラム | |
JP4327888B1 (ja) | 音声音楽判定装置、音声音楽判定方法及び音声音楽判定用プログラム | |
JP4439579B1 (ja) | 音質補正装置、音質補正方法及び音質補正用プログラム | |
JP4621792B2 (ja) | 音質補正装置、音質補正方法及び音質補正用プログラム | |
US7844452B2 (en) | Sound quality control apparatus, sound quality control method, and sound quality control program | |
JP4837123B1 (ja) | 音質制御装置及び音質制御方法 | |
US9756437B2 (en) | System and method for transmitting environmental acoustical information in digital audio signals | |
JP2011065093A (ja) | オーディオ信号補正装置及びオーディオ信号補正方法 | |
JP4709928B1 (ja) | 音質補正装置及び音質補正方法 | |
JP4937393B2 (ja) | 音質補正装置及び音声補正方法 | |
JP5695896B2 (ja) | 音質制御装置、音質制御方法及び音質制御用プログラム | |
JP4534844B2 (ja) | デジタルサラウンドシステム、サーバ装置およびアンプ装置 | |
US20180152739A1 (en) | Device-Based Audio-Format Selection | |
JP4760524B2 (ja) | コントロール機器、ルーティング検証方法およびルーティング検証プログラム | |
CN112309419B (zh) | 多路音频的降噪、输出方法及其系统 | |
CN113096674B (zh) | 一种音频处理方法、装置及电子设备 | |
JP3825589B2 (ja) | マルチメディア端末機器 | |
JP4886907B2 (ja) | オーディオ信号補正装置及びオーディオ信号補正方法 | |
CN108932953A (zh) | 一种音频均衡函数确定方法、音频均衡方法及设备 | |
JP2020118967A (ja) | 音声処理装置、データ処理方法及び記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090721 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090818 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120828 Year of fee payment: 3 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4364288 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120828 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130828 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |