JPH064088A - 音声音楽判別装置 - Google Patents

音声音楽判別装置

Info

Publication number
JPH064088A
JPH064088A JP4157717A JP15771792A JPH064088A JP H064088 A JPH064088 A JP H064088A JP 4157717 A JP4157717 A JP 4157717A JP 15771792 A JP15771792 A JP 15771792A JP H064088 A JPH064088 A JP H064088A
Authority
JP
Japan
Prior art keywords
voice
music
determination
voiced
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP4157717A
Other languages
English (en)
Other versions
JP2910417B2 (ja
Inventor
Takeshi Norimatsu
武志 則松
Yoshihisa Nakato
良久 中藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP4157717A priority Critical patent/JP2910417B2/ja
Publication of JPH064088A publication Critical patent/JPH064088A/ja
Application granted granted Critical
Publication of JP2910417B2 publication Critical patent/JP2910417B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Electrophonic Musical Instruments (AREA)

Abstract

(57)【要約】 【目的】 連続して入力されるモノラルあるいはステレ
オの音響信号に対して、音声主体であるか音楽主体であ
るかを短時間で正確に判別する。 【構成】 パワ−算出部1でフレ―ム毎にそのパワ−値
を算出し、有音無音判定部2でフレ―ム毎にそのパワ−
値から有音か無音かを判定し、判定部3において複数フ
レ―ム毎にその時間内における有音及び無音フレ―ム数
の存在比率により音声であるか、音楽であるかを判定
し、どちらとも決定できない場合は前回の複数フレ―ム
での判定結果を保持するようにする。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音響装置などの前処理
装置として使用される、連続して入力される信号が音声
であるかそれ以外(音楽等)であるかを自動的に判別す
る音声音楽判別装置に関する。
【0002】
【従来の技術】最近のステレオ装置、テレビ等には音の
効果音を創り出すサラウンド等の機能が搭載されてい
る。これらは音楽等のソースに対しては効果が大きい反
面、ニュース番組などの音声主体のものでは逆に明瞭感
が乏しくなってしまう。そこでテレビ、ラジオのソース
が音声主体のものかそれ以外かを自動的に判別すること
ができれば、その結果に応じて音場、周波数特性を最適
に制御することが可能になり大変聞き易くなる。
【0003】従来の音声音楽判別の方法では、入力信号
がステレオ信号であることを利用している。音楽ソース
の場合、左(L)チャンネルと右(R)チャンネルの信
号は互いに独立しており、2チャンネル間の相関が低
い。逆にニュース番組などの音声主体のソースはL信号
とR信号がほとんど同信号であり2チャンネル間の相関
が高い。そこで、L信号とR信号の振幅の差を計算し、
差の大きな時は音楽、小さな時は音声として判別するこ
とが可能である。また、L信号とR信号の相関値を計算
し、相関値の大きな場合は音声、小さな場合は音楽と判
定することもできる。
【0004】
【発明が解決しようとする課題】しかしながら上記の音
声音楽判別装置では、ステレオソースについては効果が
あるが、L信号とR信号の差がないモノラルのソースに
対しては判別が行えないといった欠点を有している。
【0005】本発明は上記従来の課題を解決するもので
あり、ソースがモノラル信号、ステレオ信号の区別な
く、精度良く音声か音楽かを判別することのできる音声
音楽判別装置を提供することを目的とするものである。
【0006】
【課題を解決するための手段】上記課題を解決するため
に本発明の音声音楽判別装置は、パワ−算出部と、フレ
―ム毎に有音であるか無音であるかをパワ−の閾値と比
較することにより判定する有音無音判定部と、複数フレ
―ム毎にその複数フレ―ム中に存在する有音判定フレ―
ム数と無音判定フレ―ム数をそれぞれについて定めた閾
値と比較することにより音声か音楽かを判定し、どちら
も満たさない場合は前回の判定結果をそのまま継続する
判別部とを備えたものである。
【0007】また本発明の音声音楽判別装置は、上記の
パワ−算出部、有音無音判定部を備え、複数フレ―ム単
位で判定される音声、音楽判定結果について前回の複数
フレ―ムの判定結果と同一の結果が続いた場合に判定結
果を出力し、それ以外の場合は前時点での判定結果を保
持するように構成したものである。
【0008】
【作用】本発明は上記に述べた構成により、入力信号に
対し、連続発声された音声中に必ず無音区間が存在する
が、音楽中にはほとんど存在しないことを利用して、一
定の複数フレ―ム間における有音無音の存在比率により
音声と音楽を判定することにより音声と音楽を高精度に
判別することができ、また判別の難しい場合は前回の判
定結果を保持して一定間隔で結果を出力することによ
り、全体の流れで優勢な側へ判定結果が固定され誤判定
の少ない音声音楽判別装置を提供することができる。
【0009】また本発明は、連続して同一の判定結果が
得られた場合にのみ音声音楽の判定結果を出力するよう
にしたことにより、より正確な判定が実現でき、スムー
ズな音声音楽の判定切り替えが可能な音声音楽判別装置
を提供することができる。
【0010】
【実施例】以下本発明の一実施例の音声音楽判別装置に
ついて図面を参照しながら説明する。
【0011】(図1)は本発明の一実施例の音声音楽判
別装置のブロック構成図である。(図1)において、1
は入力信号のパワ−を計算するパワ−算出部、2はパワ
−の閾値と比較することによりフレ―ムの入力信号が有
音であるか無音であるかを判定する有音無音判定部であ
る。3は判定部で、複数フレ―ム間における音声音楽の
判定を行い、前回の判定結果に基づいて現在フレ―ムに
おける判定結果を出力する。また(図2)は判定部3の
動作を説明するための要部フロ―チャ―トである。
【0012】次に、上記の一実施例における音声判別装
置の動作を(図1)を用いて詳細に説明する。ここでは
入力信号は音響機器、テレビ等を対象と考えステレオ信
号とする。入力されたステレオ信号のL信号、R信号は
ミキシングされ、L+Rとしてパワ−算出部1に入力さ
れる。パワ−算出部1では、一定時間(フレ―ム)間隔
毎にその区間の振幅の累積値あるいは平均値をそのフレ
―ムでのパワ−値として算出する。有音無音判定部2で
は得られたパワ−値を用いてフレ―ム毎の有音無音の判
定を下す。ここで現フレ―ムでのパワ−値をP、有音無
音判定の閾値をPtとすると、(数1)を満たすときに
有音と判定し、満たさない場合は無音と判定する。
【0013】
【数1】
【0014】また、有音無音の判定は、判定の閾値をP
t1、Pt2(但し、Pt2はPt1より大きいものとする。)
の2種類とし、(数2)を満たすとき無音と判定し、
(数3)を満たすとき有音と判定してもよい。
【0015】
【数2】
【0016】
【数3】
【0017】このフレ―ム毎の有音無音の判定結果を用
いて、判定部3でフレ―ムよりも大きな単位毎の音声音
楽の判別を行う。以下、(図2)のフロ―チャ―トに沿
って判定部3の動作を詳細に説明する。
【0018】以下、音声音楽判定をFフレ―ム毎に行う
ものとする。この判定の間隔Fは、連続して発声された
音声の場合の平均3、4音節が含まれるような値に設定
すればよい。実際には1秒から2秒の間の値に設定すれ
ば音声中に無音部分がほぼある割合で含まれるようにな
り、音声音楽判別の精度を上げることができる。
【0019】まず、有音無音判別部2の結果に基づきス
テップ21、22において無音であれば無音カウンター
をインクリメントし、有音であれば有音カウンターをイ
ンクリメントする。次にフレ―ム数のカウンターをイン
クリメントし(ステップ23)、ステップ24の判定で
Fフレ―ム分の有音無音判定が終了している場合は、フ
レ―ムカウンターをリセットする(ステップ25)。こ
こで音声判定のための閾値をLT、音楽判定のための閾
値をHTとする。
【0020】ステップ26では無音カウンター値とLT
を比較し、無音カウンターが大きい場合は現時点で入力
信号が音声であると判定し、ステップ27で判定フラグ
をオンにしてその情報を外部に出力する。無音状態が連
続している場合も無音を音声の一種と考え音声側に判定
している。ここで判定フラグは“1”の時は音声、
“0”の時は音楽とする。ステップ26で無音カウンタ
ー値の方が小さい場合は、ステップ28で有音カウンタ
ー値とHTを比較し、大きい場合は入力信号が音楽であ
ると判定し、ステップ29で判定フラグをオフにしてそ
の情報を外部に出力する。小さい場合は判定が難しいた
め、既に設定されているフラグの状態をそのまま保持す
る。以降次のフレ―ムの処理に進み同様の処理を繰り返
す。
【0021】なお判別部3は次のような方法によって構
成することもできる。(図3)は判定部3を別の方法で
実現した場合の動作を説明するための要部フロ―チャ―
トである。ここで、ステップ30からステップ35まで
の処理はそれぞれ(図2)のステップ20からステップ
25までの処理と同一であるので説明を省略する。また
前回のFフレ―ムでの判定で音声と判定された場合は音
声フラグがオンに、音楽と判定された場合は音楽フラグ
がオンになっているものとする。
【0022】まず、ステップ36で無音カウンターが閾
値LTより大きい場合はステップ37で前回の判定結果
が音声であったかを判定し、音声の場合はステップ38
で判定フラグをオンにし音声と判定する。前回の判定結
果が音声でなかった場合は音声フラグのみをオンにし判
定フラグは前回の状態を保持する。ステップ36の条件
を満たさない場合は、ステップ40で有音カウンター値
と閾値HTを比較する。この条件を満たすときはステッ
プ41で前回の判定結果が音楽であったかを判定し、音
楽の場合は判定フラグをオフにし音楽と判定する。前回
の判定結果が音楽でなかった場合はステップ43で音楽
フラグのみをオンにし、判定フラグの内容はそのまま保
持する。ステップ40の条件を満たさないときは音声フ
ラグ、音楽フラグともオフにし判定フラグの内容をその
まま保持する。これらの処理によりFフレ―ム毎の判定
結果が続けて音声あるいは音楽となった場合にのみ判定
フラグの内容が変更されることになる。
【0023】以上のように本実施例によれば、パワ−算
出部1で得られたフレ―ム毎のパワ−値から有音無音判
定部2でそのフレ―ムが有音か無音かを判定し、判定部
3でFフレ―ム毎に音声中の無音の出現頻度に基づき有
音、無音のそれぞれの存在比率により音声か音楽かを判
定し、どちらとも判定できない場合は前回のFフレ―ム
での結果を保持するように構成したことにより、連続し
て入力される信号に対して精度良く音声音楽が判定する
ことができ、しかも判定が難しい部分が存在しても全体
の流れで優勢な側に判定結果が固定されるため、音声音
楽の判定が短時間おきに変わるいわゆるチャタリングの
ような現象を防止することができる。
【0024】また判定部3を、Fフレ―ム毎の判定結果
が2回続けて音声か音楽に判定された場合に判定結果を
変更し、それ以外の場合は前の判定結果をそのまま保持
するようにしたことにより、音声音楽判定の精度がさら
に高くなりスムーズに判定の切り替えを行うことができ
る。
【0025】
【発明の効果】以上のように本発明によれば、フレ―ム
毎のパワ−を算出するパワ−算出部と、フレ―ム毎のパ
ワ−値と予め設定したパワ−閾値とを比較することによ
り有音か無音かを判定する有音無音判定部と、複数フレ
―ム毎に有音無音の出現比率からそれぞれの閾値と比較
することにより音声であるか音楽であるかを判定し、判
定の不確かな場合は前回の複数フレ―ムでの判定結果を
保持する判定部とを備えたことにより、短時間の遅れで
音声と音楽とを精度良く連続的に判定することができ、
判定の難しい部分が部分的に存在しても安定した判定結
果を出力することができる音声音楽判別装置を提供する
ことができる。
【0026】また、複数フレ―ム毎の判定で続けて音声
か音楽に判定された場合にのみ判定結果を変更し、それ
以外の場合は前回の判定時点での判定結果をそのまま保
持する判定部を備えることにより、判別精度をさらに向
上させることができスムーズな判定切り替えが行える音
声音楽判別装置を提供することができる。
【図面の簡単な説明】
【図1】本発明の一実施例の音声音楽判別装置のブロッ
ク構成図
【図2】本実施例の判定部の動作を説明するための要部
フロ―チャ―ト
【図3】本実施例の判定部の他の構成を説明するための
要部フロ―チャ―ト
【符号の説明】
1 パワ−算出部 2 有音無音判定部 3 判定部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】入力信号から一定時間(フレ―ム)毎の音
    響パワ−を算出するパワ−算出部と、フレ―ム毎に前記
    パワ−算出部で得られたパワ−値と予め定めた1つある
    いは2つの閾値とを比較することにより現フレ―ムが有
    音区間か無音区間かを判定する有音無音判定部と、複数
    フレ―ム毎にその複数フレ―ム内に含まれる前記有音無
    音判定部で無音区間と判定されたフレ―ムの個数が予め
    定めた無音判定のための閾値よりも大きいときに音声と
    判定し、有音区間と判定されたフレ―ムの個数が予め定
    めた有音判定の閾値よりも大きいときには音楽と判定
    し、音声とも音楽とも判定されなかった場合は前回の複
    数フレ―ムの判定結果をそのまま保持する判定部とを備
    えたことを特徴とする音声音楽判別装置。
  2. 【請求項2】入力信号から一定時間(フレ―ム)毎の音
    響パワ−を算出するパワ−算出部と、フレ―ム毎に前記
    パワ−算出部で得られたパワ−値と予め定めた1つある
    いは2つの閾値とを比較することにより現フレ―ムが有
    音区間か無音区間かを判定する有音無音判定部と、複数
    フレ―ム単位で無音区間と判定されたフレ―ム数が無音
    判定の閾値より大きいとき前回の複数フレ―ムでの判定
    結果が音声である場合に音声と判定し、音声以外の場合
    は前時点での判定結果を保持する音声判別手段と、複数
    フレ―ム単位で有音区間と判定されたフレ―ム数が有音
    判定のための閾値よりも大きいとき前回の複数フレ―ム
    での判定結果が音楽である場合のみ音楽と判定し、それ
    以外は前時点での判定結果を保持する音楽判別手段と、
    音声とも音楽とも判定されなかった場合は前時点での判
    定結果をそのまま保持する保持手段とを備えたことを特
    徴とする音声音楽判別装置。
JP4157717A 1992-06-17 1992-06-17 音声音楽判別装置 Expired - Fee Related JP2910417B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4157717A JP2910417B2 (ja) 1992-06-17 1992-06-17 音声音楽判別装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4157717A JP2910417B2 (ja) 1992-06-17 1992-06-17 音声音楽判別装置

Publications (2)

Publication Number Publication Date
JPH064088A true JPH064088A (ja) 1994-01-14
JP2910417B2 JP2910417B2 (ja) 1999-06-23

Family

ID=15655838

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4157717A Expired - Fee Related JP2910417B2 (ja) 1992-06-17 1992-06-17 音声音楽判別装置

Country Status (1)

Country Link
JP (1) JP2910417B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998027543A3 (en) * 1996-12-18 1998-10-08 Interval Research Corp Multi-feature speech/music discrimination system
KR100517567B1 (ko) * 1997-07-09 2005-12-14 소니 가부시끼 가이샤 신호식별장치,코드북절환장치,신호식별방법및코드북절환방법
WO2008012913A1 (en) 2006-07-28 2008-01-31 Panasonic Corporation Analog radio receiver
US7756704B2 (en) 2008-07-03 2010-07-13 Kabushiki Kaisha Toshiba Voice/music determining apparatus and method
JP2011013383A (ja) * 2009-06-30 2011-01-20 Toshiba Corp オーディオ信号補正装置及びオーディオ信号補正方法
JP2012032817A (ja) * 2010-07-30 2012-02-16 Samsung Electronics Co Ltd マーカー設定方法およびマーカー設定装置
US8438021B2 (en) 2009-10-15 2013-05-07 Huawei Technologies Co., Ltd. Signal classifying method and apparatus
JP2015102702A (ja) * 2013-11-26 2015-06-04 日本電信電話株式会社 発話区間抽出装置とその方法とプログラム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4348970B2 (ja) 2003-03-06 2009-10-21 ソニー株式会社 情報検出装置及び方法、並びにプログラム

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998027543A3 (en) * 1996-12-18 1998-10-08 Interval Research Corp Multi-feature speech/music discrimination system
US6570991B1 (en) 1996-12-18 2003-05-27 Interval Research Corporation Multi-feature speech/music discrimination system
KR100517567B1 (ko) * 1997-07-09 2005-12-14 소니 가부시끼 가이샤 신호식별장치,코드북절환장치,신호식별방법및코드북절환방법
WO2008012913A1 (en) 2006-07-28 2008-01-31 Panasonic Corporation Analog radio receiver
US7756704B2 (en) 2008-07-03 2010-07-13 Kabushiki Kaisha Toshiba Voice/music determining apparatus and method
JP2011013383A (ja) * 2009-06-30 2011-01-20 Toshiba Corp オーディオ信号補正装置及びオーディオ信号補正方法
US8438021B2 (en) 2009-10-15 2013-05-07 Huawei Technologies Co., Ltd. Signal classifying method and apparatus
JP2012032817A (ja) * 2010-07-30 2012-02-16 Samsung Electronics Co Ltd マーカー設定方法およびマーカー設定装置
JP2015102702A (ja) * 2013-11-26 2015-06-04 日本電信電話株式会社 発話区間抽出装置とその方法とプログラム

Also Published As

Publication number Publication date
JP2910417B2 (ja) 1999-06-23

Similar Documents

Publication Publication Date Title
KR100283421B1 (ko) 음성 속도 변환 방법 및 그 장치
US5878391A (en) Device for indicating a probability that a received signal is a speech signal
JP2835483B2 (ja) 音声判別装置と音響再生装置
JPH06332492A (ja) 音声検出方法および検出装置
JP5737808B2 (ja) 音響処理装置およびそのプログラム
JP2021511755A (ja) 音声認識オーディオシステムおよび方法
JP2910417B2 (ja) 音声音楽判別装置
SE470577B (sv) Förfarande och anordning för kodning och/eller avkodning av bakgrundsljud
JP2961952B2 (ja) 音楽音声判別装置
JPH07176178A (ja) 車載用オーディオ装置
CN110444194B (zh) 一种语音检测方法和装置
JPH05183997A (ja) 効果音付加自動判別装置
JP2905112B2 (ja) 環境音分析装置
JP3420831B2 (ja) 骨伝導音声のノイズ除去装置
JPH024095A (ja) 話者判定装置
JPH0736487A (ja) 音声信号処理装置
Song et al. Perceptual Characteristics of Chinese Speech Intelligibility in Simulated Reverberant Conditions
JPH02178699A (ja) 音声認識装置
JP3593183B2 (ja) 音声復号装置
JPH05344599A (ja) 効果音付加自動判別装置
JPH08202394A (ja) 音声検出器
JP4275054B2 (ja) 音声信号判別装置、音質調整装置、放送受信機、プログラム、及び記録媒体
JP2949925B2 (ja) 効果音付加判別装置
JPH06175693A (ja) 音声検出方法
JP2808928B2 (ja) 背景雑音電力検出器

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080409

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090409

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees