JPH10301594A - Sound detecting device - Google Patents

Sound detecting device

Info

Publication number
JPH10301594A
JPH10301594A JP9114055A JP11405597A JPH10301594A JP H10301594 A JPH10301594 A JP H10301594A JP 9114055 A JP9114055 A JP 9114055A JP 11405597 A JP11405597 A JP 11405597A JP H10301594 A JPH10301594 A JP H10301594A
Authority
JP
Japan
Prior art keywords
sound
component
frequency
unit
peak
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP9114055A
Other languages
Japanese (ja)
Inventor
Hideaki Kurihara
栗原秀明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP9114055A priority Critical patent/JPH10301594A/en
Publication of JPH10301594A publication Critical patent/JPH10301594A/en
Withdrawn legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To detect a musical component existing as a background of a voice signal in a sound detecting device detecting the presence of a sound. SOLUTION: A frequency conversion part 31 converts the input data 40 from a time area to a frequency area, and a normalization part 32 normalizes an output signal from this frequency conversion part 31, and a peak detection part 33 detects the peak frequency component of the output signal from this normalization part 32. Then, a sound candidate selection part 34 detects a basic wave component having a higher harmonic component from this peak frequency component, and a sound decision part 35 decides this input data 40 as the sound when this basic wave component is continued for a prescribed time or above.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【発明の属する技術分野】本発明は有音検出装置に関
し、特に音声の有無を検出する有音検出装置に関するも
のである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a sound detection device, and more particularly to a sound detection device for detecting the presence or absence of sound.

【0001】ディジタル回線の利用効率を上げる重要な
技術の一つとして、図6に示すように、PCM入力デー
タ40に音声が含まれるか否かを検出する。有音(音声
の有る音)の場合(“1”)は有音判定信号50に基づ
いて音声符号化部10がPCMデータ40を符号化し、
符号化データ60として回線に送出し、無音(音声の無
い音)の場合(“0”)は符号化を行わない有音検出装
置20が必要になっている。
As one of the important techniques for improving the utilization efficiency of a digital line, as shown in FIG. 6, it is detected whether or not voice is included in the PCM input data 40. In the case of a sound (a sound with sound) (“1”), the sound coding unit 10 codes the PCM data 40 based on the sound determination signal 50,
The encoded data 60 is transmitted to the line, and in the case of silence (sound without sound) (“0”), a sound detection device 20 that does not perform encoding is required.

【0002】[0002]

【従来の技術】図7は、上記の有音検出装置20の従来
例を示しており、パワー算出部21、線形予測分析部2
2、周波数成分抽出部23、ピッチ周期算出部24、及
び有音判別部25で構成されている。
2. Description of the Related Art FIG. 7 shows a conventional example of the sound detection device 20 described above.
2, a frequency component extracting unit 23, a pitch cycle calculating unit 24, and a sound discrimination unit 25.

【0003】PCM入力データ40は、パワー算出部2
1、線形予測分析部22、周波数成分抽出部23、及び
ピッチ周期算出部24の各入力端子に共通に入力され
る。パワー算出部21、線形予測分析部22、周波数成
分抽出部23、及びピッチ周期算出部24の各出力信号
は、有音判別部25に入力され、有音判別部25は、有
音検出時又は無音検出時にそれぞれ“1”又は“0”の
論理信号である有音判定信号50を出力する。
[0003] The PCM input data 40 is supplied to the power calculator 2.
1, are commonly input to input terminals of the linear prediction analysis unit 22, the frequency component extraction unit 23, and the pitch period calculation unit 24. Each output signal of the power calculation unit 21, the linear prediction analysis unit 22, the frequency component extraction unit 23, and the pitch cycle calculation unit 24 is input to the sound determination unit 25, and the sound determination unit 25 detects when a sound is detected or At the time of silence detection, a sound determination signal 50 which is a logical signal of "1" or "0" is output.

【0004】パワー算出部21は、ある一定期間(以
下、フレームと称する)のPCM入力データ40のサン
プルf(n)からパワーPを次式(1)により算出す
る。
The power calculator 21 calculates a power P from a sample f (n) of the PCM input data 40 for a certain period (hereinafter, referred to as a frame) according to the following equation (1).

【0005】[0005]

【数1】 ここで、Mはフレーム内のサンプル数である。(Equation 1) Here, M is the number of samples in the frame.

【0006】このパワーPを基準値TH_Pと比較し、
P>TH_Pの場合、音声が有ることを示す有音判定信
号を出力する。ここで、基準値TH_Pは、固定値ある
いは、適応的に可変の値である。
The power P is compared with a reference value TH_P,
If P> TH_P, a sound determination signal indicating that voice is present is output. Here, the reference value TH_P is a fixed value or a value that is adaptively variable.

【0007】線形予測分析部22は、音声の包絡線情報
を自己相関法等に基づき線形予測係数α(x)及び線形
反射係数r(x)を算出し、この線形反射係数r(x)
から予測残差Rを次式により算出する。
The linear prediction analysis unit 22 calculates a linear prediction coefficient α (x) and a linear reflection coefficient r (x) based on the envelope information of the speech based on an autocorrelation method or the like, and calculates the linear reflection coefficient r (x).
Is calculated from the following equation.

【0008】[0008]

【数2】 ここで、Lは反射係数の次数を示す。(Equation 2) Here, L indicates the order of the reflection coefficient.

【0009】この予測残差Rと基準値TH_Rとを比較
して、R<TH_Rの場合に、有音判定信号を出力す
る。この時の基準値TH_Rは、固定値あるいは適応的
に可変な値である。
The prediction residual R is compared with the reference value TH_R, and if R <TH_R, a sound determination signal is output. The reference value TH_R at this time is a fixed value or a value that is adaptively variable.

【0010】なお、参考文献として、エル・アール・ラ
ビナ(L.R.Rabiner)とアール・ダブリュー・シャファ(R.
W.Schafer)の著による“Digital Processing of Speech
Signals (音声信号のディジタル処理)”がある。
For reference, L. R. Rabina (LRRabiner) and R. W. Shafa (R.
W. Schafer), “Digital Processing of Speech
Signals (digital processing of audio signals).

【0011】周波数成分抽出部23は、音声の周波数情
報としてフレーム内の零交差数をカウントし、交差した
回数Fと基準値TH_FがF<TH_Fの場合は、有音
判定信号を出力する。この時の基準値TH_Fも、固定
値あるいは適応的に可変の値である。
The frequency component extraction unit 23 counts the number of zero crossings in the frame as the frequency information of the voice, and outputs a sound determination signal when the number of crossings F and the reference value TH_F satisfy F <TH_F. The reference value TH_F at this time is also a fixed value or an adaptively variable value.

【0012】ピッチ周期算出部24は、音声のピッチ情
報としてピッチ周期を算出し、このピッチ周期が所定の
範囲内にある場合に、有音判定信号を出力する。
The pitch cycle calculating section 24 calculates a pitch cycle as voice pitch information, and outputs a sound determination signal when the pitch cycle is within a predetermined range.

【0013】有音判定部25は、上記の4つの有音判定
信号を組合せ条件として有音であるか否かを判定し、有
音である時は“1”を、無音である時は“0”を有音判
定信号50として音声符号化部10(図6参照)に出力
する。
The sound determination unit 25 determines whether or not there is a sound by using the above four sound determination signals as a combination condition, and determines “1” when the sound is present and “1” when the sound is silent. “0” is output to the voice encoding unit 10 (see FIG. 6) as the voiced determination signal 50.

【0014】音声符号化部10は、有音である場合の
み、PCM入力データ40に対して音声符号化処理を行
い符号化データ60として回線に出力する。
The voice coding unit 10 performs voice coding processing on the PCM input data 40 only when there is a sound, and outputs the data as coded data 60 to the line.

【0015】この結果、回線の使用効率を向上させ、特
に携帯端末等では、消費電力を低減させることが有効に
なる。
As a result, it is effective to improve the use efficiency of the line, and particularly to reduce the power consumption in portable terminals and the like.

【0016】[0016]

【発明が解決しようとする課題】このような従来の有音
検出装置においては、音声のみに注目したパラメータを
使用しているため音声のみが入力されている場合は、有
効に音声の有音・無音検出が可能である。
In such a conventional sound detection device, a parameter that focuses only on the voice is used. Therefore, when only the voice is input, the voice sound / voice of the voice is effectively used. Silence detection is possible.

【0017】しかしながら、上記の従来例の構成では、
音声の背景にある低レベルの音楽成分は、音声が有音と
して検出される会話時は音声と共に伝送されるが、音声
が検出されない無音時には伝送が中断されてしまう。従
って、会話時のみ音楽成分が聞こえることとなり相手方
にとって違和感が大きく主観上の品質が大きく劣化して
しまう。
However, in the configuration of the above conventional example,
The low-level music component in the background of the voice is transmitted together with the voice during a conversation in which the voice is detected as a sound, but the transmission is interrupted in a silent time in which no voice is detected. Therefore, the music component can be heard only during the conversation, and the other party feels uncomfortable and the subjective quality is greatly deteriorated.

【0018】従って本発明は、音声の有無を検出する有
音検出装置において、音声信号の背景となる音楽成分を
検出することを課題とする。
Accordingly, an object of the present invention is to detect a music component which is a background of an audio signal in a sound detection device for detecting the presence or absence of audio.

【0019】[0019]

【課題を解決するための手段】上記の課題を解決するた
め、本発明に係る有音検出装置は、入力データを時間領
域から周波数領域に変換する周波数変換部と、該周波数
変換部の出力信号を正規化する正規化部と、該正規化部
の出力信号のピーク周波数成分を検出するピーク検出部
と、該ピーク周波数成分の中から高調波成分に対応した
基本波成分を検出する有音候補選択部と、該基本波成分
が所定時間以上続いたとき該入力データを有音と判定す
る有音判定部とを備えたことが特徴としている。
In order to solve the above-mentioned problems, a sound detection device according to the present invention comprises a frequency converter for converting input data from a time domain to a frequency domain, and an output signal of the frequency converter. A normalizing unit, a peak detecting unit for detecting a peak frequency component of an output signal of the normalizing unit, and a sound candidate for detecting a fundamental component corresponding to a harmonic component from the peak frequency component. It is characterized by comprising a selection unit and a sound determination unit that determines that the input data is sound when the fundamental wave component continues for a predetermined time or more.

【0020】すなわち、音楽、特に弦楽器や打楽器の音
には、基本波成分とその高調波成分が含まれ、さらに一
定時間以上連続するという特徴があることが知られてい
る。
That is, it is known that the sound of music, especially the sound of a stringed instrument or a percussion instrument, includes a fundamental component and its harmonic components, and further has a characteristic that it continues for a certain period of time.

【0021】そこで本発明においては、まず、周波数変
換部は、時間軸データである入力データを離散フーリエ
変換(または高速フーリエ変換)して周波数軸上のデー
タに変換する。このデータを正規化部は、後のデータ処
理を容易にするため正規化し、さらにこの正規化された
データからピーク検出部が、ピーク周波数成分を検出す
る。
Therefore, in the present invention, first, the frequency converter converts the input data, which is the time axis data, into discrete Fourier transform (or fast Fourier transform) into data on the frequency axis. The normalization unit normalizes this data to facilitate later data processing, and the peak detection unit detects a peak frequency component from the normalized data.

【0022】有音候補選択部は、検出されたピーク周波
数成分から音楽成分に対応した周波数候補として基本波
成分とその高調波成分の組を有音判定の候補として選択
し、背景雑音判定部35は、選択された候補が所定時間
以上続いた場合に有音と判定する。
The voiced candidate selection unit selects a set of a fundamental component and its harmonic component as a frequency candidate corresponding to a music component from the detected peak frequency components as a voice determination candidate, and a background noise determination unit 35. Is determined to be sound if the selected candidate continues for a predetermined time or longer.

【0023】この結果、入力データから楽器の音楽成分
を抽出して有音と判定することができる。
As a result, the music component of the musical instrument can be extracted from the input data and determined to be sound.

【0024】また、本発明では、上記のピーク検出部
が、高周波成分に対してより大きく重み付けして該ピー
ク周波数成分を検出することが可能である。
Further, according to the present invention, the peak detecting section can detect the peak frequency component by giving a higher weight to the high frequency component.

【0025】すなわち、ピーク検出部の入力データに周
波数が高くなればなるほど1より大きい係数を掛けるこ
とにより入力データのレベルが小さい高周波数成分を強
調してより安定したピーク検出を可能とすることができ
る。
That is, by multiplying the input data of the peak detection section by a coefficient larger as the frequency becomes higher, a high frequency component having a small level of the input data is emphasized to enable more stable peak detection. it can.

【0026】また、本発明では、上記のピーク検出部
が、しきい値以上の該ピーク周波数成分のみを検出する
ことも可能である。
Further, according to the present invention, the above-described peak detection section can detect only the peak frequency component equal to or higher than the threshold value.

【0027】すなわち、一定のレベル以上のピーク周波
数成分のみ検出することにより雑音に対して安定したピ
ーク検出をすることができる。
That is, by detecting only a peak frequency component equal to or higher than a certain level, a peak can be detected stably with respect to noise.

【0028】また、本発明では、上記の所定時間が音楽
成分であることを示す期間とすることもできる。
Further, in the present invention, the above-mentioned predetermined time may be a period indicating that it is a music component.

【0029】すなわち、音楽の周波数成分は、例えば1
00ms〜200ms以上は連続する特性を利用して、
有音判定の候補として選択された周波数成分が100m
s以上連続した場合に音楽成分が有ると判定すればよ
い。
That is, the frequency component of music is, for example, 1
Utilizing continuous characteristics for 00 ms to 200 ms or more,
The frequency component selected as a candidate for sound determination is 100 m
It is only necessary to determine that there is a music component when s or more are consecutive.

【0030】さらに、本発明では、上記の有音判定部の
出力信号が、音声符号化部に与えられて音声符号化の可
否を設定することも可能である。
Further, according to the present invention, the output signal of the above-mentioned sound determination section can be given to the voice coding section to set whether or not voice coding can be performed.

【0031】すなわち、有音判定部が音楽成分有りと判
定した場合、音声符号化部は入力データを符号化して出
力することができる。この結果、音声の途切れた時間に
おける背景音楽成分を中断無く通話回線に伝送して通話
品質の向上を図ることが可能となる。
That is, when the sound determination section determines that there is a music component, the voice encoding section can encode and output the input data. As a result, it is possible to improve the call quality by transmitting the background music component at the time when the sound is interrupted to the call line without interruption.

【0032】[0032]

【発明の実施の形態】図1は、本発明に係る有音検出装
置の構成例を示しており、図7と異なる点は、周波数変
換部31、正規化部32、ピーク検出部33、有音候補
選択部34、有音判定部35、及びOR回路36が追加
されていることである。
FIG. 1 shows an example of the configuration of a sound detection device according to the present invention. The difference from FIG. 7 is that a frequency conversion unit 31, a normalization unit 32, a peak detection unit 33, That is, a sound candidate selection unit 34, a sound determination unit 35, and an OR circuit 36 are added.

【0033】そして、PCM入力データ40が入力され
た周波数変換部31は、正規化部32、ピーク検出部3
3、有音候補選択部34及び有音判定部35と順次縦続
接続されている。
The frequency conversion unit 31 to which the PCM input data 40 has been input includes a normalization unit 32 and a peak detection unit 3.
3. The voice candidate selection unit 34 and the voice determination unit 35 are sequentially connected in cascade.

【0034】有音判別部25の出力信号である有音判定
信号51と、有音判定部35の出力信号である有音判定
信号52とが、OR回路36に入力され、このOR回路
36は、有音判定信号50を出力する。
A sound judgment signal 51, which is an output signal of the sound judgment unit 25, and a sound judgment signal 52, which is an output signal of the sound judgment unit 35, are input to an OR circuit 36. , And outputs a sound determination signal 50.

【0035】ここで、有音判定信号51は、入力データ
40に音声が含まれるか否かを示す論理信号であり、後
述するように、有音判定信号52は、入力データ40に
音楽成分が含まれるか否かを示す論理信号である。
Here, the sound determination signal 51 is a logical signal indicating whether or not a sound is included in the input data 40. As will be described later, the sound determination signal 52 includes a music component in the input data 40. It is a logic signal indicating whether or not it is included.

【0036】そして、有音判定信号50は、有音判定信
号51と有音判定信号52との論理和信号であり、音声
符号化部10(図6参照)の符号化処理動作を行うか否
かを設定する制御信号となる。
The sound determination signal 50 is a logical sum signal of the sound determination signal 51 and the sound determination signal 52, and determines whether or not to perform the coding processing operation of the voice coding unit 10 (see FIG. 6). It becomes a control signal for setting whether or not.

【0037】周波数変換部31は、入力データ40を時
間xの関数であるf(x)で表すと、この関数f(x)
を次式で示される離散フーリエ変換を行い、変換データ
F(n)を得る。
When the input data 40 is represented by f (x), which is a function of time x, the frequency conversion unit 31 uses this function f (x)
Is subjected to a discrete Fourier transform represented by the following equation to obtain transformed data F (n).

【0038】[0038]

【数3】 ここで、Mはフレーム内のサンプル数である。(Equation 3) Here, M is the number of samples in the frame.

【0039】例えば、Mが「2」のべき乗である場合に
は、高速フーリエ変換によれば処理速度は大幅に高める
ことができる。
For example, when M is a power of "2", the processing speed can be greatly increased by the fast Fourier transform.

【0040】そして、フーリエ変換後のデータF(n)
に次式の処理を行い、サンプルデータF'(n)を得
る。
Then, the data F (n) after the Fourier transform
Then, the following processing is performed to obtain sample data F ′ (n).

【0041】[0041]

【数4】 (Equation 4)

【0042】正規化部32は、次式で示されるサンプル
データF'(n)の最大値Fmaxを検出する。
The normalizing section 32 detects the maximum value Fmax of the sample data F '(n) represented by the following equation.

【0043】[0043]

【数5】 (Equation 5)

【0044】そして、最大値が1になるように正規化し
たサンプルデータF”(n)を次式により計算する。
Then, sample data F ″ (n) normalized so that the maximum value becomes 1 is calculated by the following equation.

【0045】[0045]

【数6】 (Equation 6)

【0046】図2は、上記のように正規化部32におい
て正規化されたF”(n)のグラフ例を示しており、縦
軸は正規化されたサンプル値であり、横軸は周波数であ
る。
FIG. 2 shows an example of a graph of F ″ (n) normalized by the normalization unit 32 as described above. The vertical axis represents the normalized sample value, and the horizontal axis represents the frequency. is there.

【0047】同図には、有効な周波数範囲として0〜M
(例えば、4kHz)が設定され、周波数Mの半分の周波
数Lmが示されている。また、サンプルデータF”
(n)は、特定の周波数成分〜でピークになる。こ
のピークの中の最大値である周波数成分によって正規
化されているためこの周波数成分の値は、「1」とな
っている。
FIG. 4 shows effective frequency ranges of 0 to M
(For example, 4 kHz), and a frequency Lm that is half of the frequency M is shown. Also, sample data F "
(N) peaks at a specific frequency component. The value of this frequency component is “1” because it is normalized by the frequency component that is the maximum value of the peaks.

【0048】ピーク検出部33は、F”(n)のピーク
周波数成分を検出する次の処理を行う。 (1)有効な周波数範囲の下限から、前サンプルより大
きくなるサンプル周波数位置MIN(図示せず)を検出
する。
The peak detector 33 performs the following processing for detecting the peak frequency component of F ″ (n). (1) From the lower limit of the effective frequency range, the sample frequency position MIN (shown in the figure) becomes larger than the previous sample. Zu) is detected.

【0049】(2)その後、該サンプルMINから順次
周波数の大きい方向においてサンプル毎に大きさを比較
し、前サンプル値より小さくなった場合には、前サンプ
ル番号を図示のようにピーク位置1として記憶する。 (3)その処理をサンプルMまで続ける。そのピーク位
置1〜9をピーク検出部33の出力とする。
(2) Thereafter, the size of each sample is sequentially compared in the direction of higher frequency from the sample MIN, and when the sample size is smaller than the previous sample value, the previous sample number is set to peak position 1 as shown in the figure. Remember. (3) Continue the process up to sample M. The peak positions 1 to 9 are set as the output of the peak detection unit 33.

【0050】さらに、各サンプルデータの大きさをしき
い値TH_MIN(同図参照)以上の値に制限すること
により、ピークの検出を容易にしても良い。さらに、図
3に示すように、高調波成分の検出を容易にするためサ
ンプルデータF”(n)の高周波成分を強調した後にピ
ーク検出することもできる。
Furthermore, peak detection may be facilitated by limiting the size of each sample data to a value equal to or greater than the threshold value TH_MIN (see FIG. 6). Furthermore, as shown in FIG. 3, peaks can be detected after emphasizing the high frequency components of the sample data F ″ (n) in order to facilitate the detection of higher harmonic components.

【0051】すなわち、図3はサンプルの高周波成分を
強調ための高周波強調係数のグラフ例を示しており、縦
軸はゲイン(重み)であり、横軸は周波数である。高周
波強調係数の周波数0における値は、“1”であり、周
波数が高くなるにつれて大きくなっている。
That is, FIG. 3 shows a graph example of a high-frequency emphasis coefficient for emphasizing a high-frequency component of a sample, in which the vertical axis represents gain (weight) and the horizontal axis represents frequency. The value of the high-frequency emphasis coefficient at frequency 0 is “1”, and increases as the frequency increases.

【0052】図4は、有音候補選択部34における基本
波成分候補を選択する手順を示しており、以下に順を追
って説明する。
FIG. 4 shows a procedure for selecting a fundamental wave component candidate in the sound candidate selection section 34, which will be described step by step.

【0053】まず、ピーク位置を示すカウンタiと、基
本波成分候補の数を示すカウンタjをクリアする(ステ
ップS10)。ただし、ピーク位置1に対応するカウン
タiの値は“0”である。
First, the counter i indicating the peak position and the counter j indicating the number of fundamental wave component candidates are cleared (step S10). However, the value of the counter i corresponding to the peak position 1 is “0”.

【0054】ピーク検出部33の出力の中から、検出可
能な最大周波数“M”の半分の周波数を“Lm”とする
(図2参照)。この周波数“Lm”以下のピーク周波数
成分を基本波成分候補とする(同S11)。
From the output of the peak detector 33, half of the maximum detectable frequency "M" is defined as "Lm" (see FIG. 2). The peak frequency component equal to or lower than the frequency "Lm" is set as a fundamental component candidate (S11).

【0055】その理由は、通話帯域においては4kHz程
度が検出可能周波数であるため、その半分の周波数であ
る2kHzまでにしか高調波成分を伴った基本波成分候補
のピーク位置は存在し得ないからである。
The reason is that the detectable frequency is about 4 kHz in the speech band, and the peak position of the fundamental wave component candidate with the harmonic component can exist only up to 2 kHz which is half the frequency. It is.

【0056】ピーク位置iで指定されピーク周波数成分
yを得る(同S12)。このピーク周波数成分yと周波
数“Lm”とを比較し、y<Lmであれば(同S13の
“<0”)、配列基本候補(j)にyを書き込み(同S
14)、配列である基本候補フラグ(j)を“1”にセ
ットし(同S15)、y≧LmであればステップS19
に進む。
The peak frequency component y specified by the peak position i is obtained (S12). The peak frequency component y is compared with the frequency “Lm”. If y <Lm (“<0” in S13), y is written into the array basic candidate (j) (S13).
14) The basic candidate flag (j), which is an array, is set to “1” (S15), and if y ≧ Lm, step S19.
Proceed to.

【0057】i,jをそれぞれ1だけインクリメントす
る(同S16,S17)。iとピークの数Cpeakを
比較し、i<CpeakであればステップS12に戻り
(同S18の“<”)、それ以外の場合は、基本候補数
Lstに“j”を書き込み(同S19)、処理を終え
る。
I and j are each incremented by 1 (S16 and S17). i is compared with the number Cpeak of peaks, and if i <Cpeak, the process returns to step S12 (“<” in S18); otherwise, “j” is written in the number Lst of basic candidates (S19). Finish the process.

【0058】この結果、基本波成分候補が配列基本候補
(j)に書き込まれ、この基本候補(j)に対応する基
本候補フラグ(j)が“1”に設定され、基本候補数レ
ジスタLstに基本波成分候補数が(図2のピーク〜
)設定される。
As a result, the basic wave component candidate is written into the array basic candidate (j), the basic candidate flag (j) corresponding to the basic candidate (j) is set to “1”, and the basic candidate number register Lst is set. The number of fundamental wave component candidates is
) Is set.

【0059】図5は、有音候補選択部34における高調
波成分を持つ基本波成分を検出する手順を示しており、
以下に順を追って説明する。
FIG. 5 shows a procedure for detecting a fundamental wave component having a harmonic component in the sound candidate selection unit 34.
The description will be given in order below.

【0060】まず、カウンタi,j,kをクリアする
(同図ステップS20)。レジスタLsrに基本候補数
Lstを入れる(同S21)。
First, the counters i, j, and k are cleared (step S20 in the figure). The number of basic candidates Lst is entered into the register Lsr (S21).

【0061】変数yに基本候補(i)の最初の基本候補
(0)に記憶されている基本波成分を取り出す(同S2
2)。変数yyに基本候補フラグ(0)から基本候補
(0)が基本波成分の候補であるか否かを示すフラグを
取り出す(同S23)。
The fundamental wave component stored in the first basic candidate (0) of the basic candidate (i) is taken out as the variable y (S2).
2). From the basic candidate flag (0), a flag indicating whether or not the basic candidate (0) is a candidate for a fundamental component is extracted from the variable yy (S23).

【0062】そして、フラグyyが“0”で有るか否か
を判定し(同S23)、yy=0であればステップS4
0に進み、iを“1”だけインクリメントして(同S4
0)、i<LsrであればステップS22に戻り次の基
本候補(1)が高調波成分を持っているか否かの判定に
移る。以下、基本波成分候補数だけの基本候補(i)に
対し同様の判定が行われる。
Then, it is determined whether or not the flag yy is "0" (S23). If yy = 0, the process proceeds to step S4.
0, i is incremented by “1” (S4
0), if i <Lsr, the flow returns to step S22 to determine whether or not the next basic candidate (1) has a harmonic component. Hereinafter, the same determination is performed for the basic candidates (i) as many as the number of fundamental wave component candidates.

【0063】一方、ステップS23においてyy≠0で
あれば、レジスタf0 とf1 を基本波成分yにオフセッ
トdを加算した値で初期設定し、検出する高調波の次数
をカウントするカウンタmを0に初期設定する(同S2
5)。
On the other hand, if yy ≠ 0 in step S23, the registers f 0 and f 1 are initialized with a value obtained by adding the offset d to the fundamental wave component y, and a counter m for counting the order of the harmonic to be detected is set. 0 (S2)
5).

【0064】なお、オフセットdは、時間領域から周波
数領域に変換するときに持たせたオフセット値であり、
このオフセットdをyに加えることにより実際の周波数
を得ている。
Note that the offset d is an offset value given when transforming from the time domain to the frequency domain.
The actual frequency is obtained by adding the offset d to y.

【0065】そして、レジスタf1 にレジスタf0 の値
を加えて、レジスタf1 の内容を基本波成分yの第2高
調波成分とする(同S26)。f1 と最大周波数Mにオ
フセットdを加えた値と比較し、f1 ≧(M+d)であ
れば(同S27)、f1 が処理対象の周波数以上である
と判断してステップS40に進む。
[0065] Then, by adding the value of register f 0 to the register f 1, the contents of register f 1 and second harmonic component of the fundamental wave component y (the S26). compared with the values obtained by adding an offset d to f 1 and the maximum frequency M, if f 1 ≧ (M + d) ( same S27), it is determined that f 1 is equal to or greater than the frequency to be processed advances to step S40.

【0066】一方、ステップS27においてf1 <(M
+d)であれば、レジスタxにf1からオフセットdを
引いた値を代入し(同S28)、検査する基本候補
(i)以後の基本候補を指定するカウンタnをi+1に
初期設定する(同S29)。
On the other hand, in step S27, f 1 <(M
If + d), and substitutes the value obtained by subtracting the offset d from f 1 to the register x (the S28), and initializes the counter n that specifies the basic candidate (i) subsequent basic candidates to check in i + 1 (same S29).

【0067】カウンタnによって指定される、基本候補
(0)の次の基本候補(1)とレジスタxの内容とを比
較し(同S30)、等しくない場合で、カウンタn≦基
本候補数Lstであれば(同S31)、カウンタnを
“1”だけインクリメントし(同S32)、ステップS
30に戻り次の基本候補(2)とxの比較を行う。
The basic candidate (1) next to the basic candidate (0) specified by the counter n is compared with the contents of the register x (S30), and if they are not equal, the counter n ≦ the basic candidate number Lst If there is (step S31), the counter n is incremented by "1" (step S32), and step S32 is executed.
Returning to step 30, the next basic candidate (2) is compared with x.

【0068】一方、レジスタxの内容と基本候補(1)
が等しい場合は、配列z(0)に基本波成分yを代入す
る(同S34)。そして、基本候補(1)は基本候補
(0)の高調波成分であるため基本候補フラグ(1)を
“0”にリセットして基本波成分の候補から除き(同S
35)、ステップS36の動作に進む。
On the other hand, the contents of the register x and the basic candidate (1)
Are equal, the fundamental wave component y is substituted into the array z (0) (S34). Then, since the basic candidate (1) is a harmonic component of the basic candidate (0), the basic candidate flag (1) is reset to “0” and removed from the candidates of the fundamental component (S
35), and proceed to the operation in step S36.

【0069】また、ステップS31でカウンタn>基本
候補数Lstである場合は、配列z(0)に高調波成分
が無なかったことを示す“0”を書き込んでステップS
36に進む(同S33)。
If it is determined in step S31 that counter n> basic candidate number Lst, "0" indicating that there is no harmonic component is written in array z (0), and step S31 is executed.
The process proceeds to S36 (S33).

【0070】ステップS36において、カウンタmを
“1”だけインクリメントして、カウンタmと予め設定
された検査すべき高調波成分の上限の次数に対応するC
searchとを比較して(同S37)、m<Csea
rchである場合は、ステップS26に戻りさらに高次
の高調波成分を探す。
In step S36, the counter m is incremented by "1", and the counter m and the C corresponding to the order of the preset upper limit of the harmonic component to be inspected are set.
Compared with search (S37), m <Csea
If it is rch, the process returns to step S26 to search for a higher-order harmonic component.

【0071】ステップS37において配列z(k)がm
<Csearchである場合は、z(k)が“0”であ
るか否かを判定する(同S38)。z(k)≠0であれ
ばkを“1”だけインクリメントし(同S39)、z
(k)=0あればz(k)の中に基本波成分の候補が入
っていないと判別してkはそのままで、次のステップS
40に進みiを1だけインクリメントする。
In step S37, the array z (k) is set to m
If <Csearch, it is determined whether or not z (k) is “0” (S38). If z (k) ≠ 0, k is incremented by “1” (S39), and z
If (k) = 0, it is determined that no fundamental wave component candidate is included in z (k), k is not changed, and the next step S
Proceed to 40 to increment i by one.

【0072】そして、iとLsrとを比較して、i<L
srであれば、ステップS22に戻り、それ以外では動
作を終了する(同S41)。
Then, i is compared with Lsr, and i <L
If it is sr, the process returns to step S22; otherwise, the operation ends (step S41).

【0073】上記の手順によれば、高調波成分を持つ基
本波成分を複数個検出することができる。したがって、
複数の楽器の音楽成分を検出することが可能となり、よ
り性能の良い音楽検出が可能となる。
According to the above procedure, a plurality of fundamental wave components having harmonic components can be detected. Therefore,
It is possible to detect music components of a plurality of musical instruments, and it is possible to detect music with better performance.

【0074】この結果、配列z(k)に高調波成分を持
つ基本波成分が記憶されることになる。
As a result, a fundamental wave component having a harmonic component is stored in the array z (k).

【0075】さらに、有音候補選択部34は、配列z
(k)に記憶された基本候補と同じ基本波成分が、前フ
レームで検出されて保持された基本候補群の中に有るか
否かを検索する。有る場合は、その候補の出現回数をカ
ウントアップし、全候補の処理後に、出現回数の最大値
検索を行う。
Further, the sound candidate selection section 34 selects the array z
A search is performed to determine whether or not the same fundamental wave component as the basic candidate stored in (k) exists in the basic candidate group detected and held in the previous frame. If there is, the number of appearances of the candidate is counted up, and after processing all candidates, the maximum value of the number of appearances is searched.

【0076】そして、高調波成分がある候補の連続出現
回数Cmax(図示せず)を有音判定部35に出力す
る。
Then, the continuous occurrence count Cmax (not shown) of the candidate having the harmonic component is output to the sound determination section 35.

【0077】有音判定部35は、音楽等の高調波の継続
時間が100msec以上はあることを利用して、連続
出現回数と時間換算で100msec以上になるフレー
ム数である基準値Csetとを比較し、Cmax≧Cs
etの条件を満足した場合には、有音と判定し有音判定
信号52を“1”として出力し、それ以外は無音として
“0”を出力する。
Using the fact that the continuation time of harmonics of music or the like is 100 msec or more, the sound existence determination unit 35 compares the number of continuous appearances with the reference value Cset which is the number of frames that become 100 msec or more in time conversion. And Cmax ≧ Cs
When the condition of et is satisfied, it is determined that there is sound, and the sound determination signal 52 is output as “1”, and otherwise, “0” is output as no sound.

【0078】この有音判定信号52と有音判定信号51
(図1参照)のいずれかが“1”であるとき、音声符号
化部10(図6参照)を動作せて符号化データ60を出
力させれば、音声が途切れた場合においても、背景音楽
は途切れること無く相手に伝わることとなる。
The sound determination signal 52 and the sound determination signal 51
If any one of (see FIG. 1) is “1”, the audio encoding unit 10 (see FIG. 6) is operated to output the encoded data 60. Will be transmitted to the other party without interruption.

【0079】この図5の手順を図2との対応で説明する
と次のようになる。まず、図5の処理に入る前に、ピー
ク位置1〜9(周波数成分〜)が既に検出されてお
り、基本候補(0)〜(4)の配列にピーク周波数成分
〜が書き込まれている。
The procedure of FIG. 5 will be described below with reference to FIG. First, before entering the process of FIG. 5, peak positions 1 to 9 (frequency components to) have already been detected, and peak frequency components to have been written in the array of basic candidates (0) to (4).

【0080】そして、基本候補(0)〜(4)に対応す
る基本候補フラグ(0)〜(4)には基本波成分候補で
あることを示す“1”が設定され、基本候補フラグ
(5)〜(9)には候補でないことを示す“0”が設定
されている。さらに、レジスタLstは、周波数の値が
Lm以下の基本波成分(周波数成分〜)が5個ある
ことを記憶している。
The basic candidate flags (0) to (4) corresponding to the basic candidates (0) to (4) are set to "1" indicating that they are fundamental wave component candidates, and the basic candidate flags (5) are set. ) To (9) are set with "0" indicating that they are not candidates. Further, the register Lst stores that there are five fundamental wave components (frequency components 〜) whose frequency values are equal to or less than Lm.

【0081】図5のステップS20〜S23を経由した
ステップS24において、最初の周波数成分に対応す
る基本候補フラグ(0)は“0”でないと判定され、ス
テップS25,S26に進む。このステップS26にお
いて周波数成分の第2次高調波成分が計算される。
In step S24 through steps S20 to S23 in FIG. 5, it is determined that the basic candidate flag (0) corresponding to the first frequency component is not "0", and the process proceeds to steps S25 and S26. In this step S26, the second harmonic component of the frequency component is calculated.

【0082】そして、ステップS30,S31,S3
2,S30,S34〜S37,S26〜S30のループ
LP(図示せず)を繰り返すことで周波数成分の第
2,3,4,6次高調波である周波数成分,,,
が検出される。
Then, steps S30, S31, S3
By repeating a loop LP (not shown) of S2, S30, S34 to S37, and S26 to S30, frequency components which are the second, third, fourth and sixth harmonics of the frequency component,.
Is detected.

【0083】ループLPのステップS34において、配
列z(0)に周波数成分が4回繰り返し書き込まれ
る。さらに、ステップS35において、周波数成分,
に対応する基本候補フラグ(2),(4)が“0”に
リセットされ、周波数成分,は基本波成分候補から
除かれる。
In step S34 of the loop LP, frequency components are repeatedly written into the array z (0) four times. Further, in step S35, the frequency component,
Are reset to "0", and the frequency components are excluded from the fundamental wave component candidates.

【0084】ループLPをステップS27またはステッ
プS37で抜けて、ステップS40でカウンタiが
“1”加算され、ステップS41,S22,S23,S
24のルートRT(図示せず)を通って、周波数成分
が高調波成分を持つか否かの検査が始まる。
The process exits the loop LP in step S27 or step S37, and the counter i is incremented by "1" in step S40, and steps S41, S22, S23 and S
Through a route RT (not shown) at 24, a check is started to determine whether the frequency component has a harmonic component.

【0085】周波数成分に対応する基本候補フラグ
(1)は“1”である。したがって周波数成分の場合
と同様にして、第2,3,4次高調波成分である周波数
成分,,が検出され、基本候補フラグ(4)がリ
セットされる(これは、既に周波数成分の検査のとき
にリセットされている)。そして、z(1)に周波数成
分が基本波成分の候補として書き込まれる。
The basic candidate flag (1) corresponding to the frequency component is “1”. Therefore, in the same manner as in the case of the frequency component, the frequency components, which are the second, third, and fourth harmonic components, are detected, and the basic candidate flag (4) is reset (this is the same as the frequency component inspection). When it is reset). Then, the frequency component is written to z (1) as a candidate for the fundamental component.

【0086】ループLPを抜けステップS40でカウン
タiが“1”加算されてルートRTを通って周波数成分
の検査が始まる。ステップS24において周波数成分
に対応する基本候補フラグ(2)は“0”にリセット
されているため基本候補でないと判断される。
After exiting from the loop LP, the counter i is incremented by "1" in step S40, and the inspection of the frequency component starts through the route RT. In step S24, since the basic candidate flag (2) corresponding to the frequency component has been reset to "0", it is determined that it is not a basic candidate.

【0087】そして、ステップS24から直接ステップ
S40に進みカウンタiが“1”だけ加算されてルート
RTを通って周波数成分の検査が始まる。この周波数
成分には、高調波成分がないため基本波成分の候補で
ないと判断される。
Then, the process proceeds directly from step S24 to step S40, where the counter i is incremented by "1", and the inspection of the frequency component starts through the route RT. Since this frequency component has no harmonic component, it is determined that the frequency component is not a candidate for a fundamental component.

【0088】周波数成分は周波数成分と同様に対応
する基本候補フラグ(4)が“0”にリセットされてい
るため基本候補でないと判断される。
Since the corresponding basic candidate flag (4) is reset to "0" in the same manner as the frequency component, it is determined that the frequency component is not a basic candidate.

【0089】そして、ステップS41において検査すべ
き回数Lsrを超えると処理を終了する。
When the number of times Lsr to be inspected is exceeded in step S41, the process is terminated.

【0090】この結果、配列z(0)とz(1)にそれ
ぞれ基本波成分の候補者として周波数成分とが登録
されることになる。
As a result, the frequency components are registered in the arrays z (0) and z (1) as candidates for the fundamental wave components.

【0091】[0091]

【発明の効果】以上説明したように、本発明に係る有音
検出装置によれば、周波数変換部が入力データを時間領
域から周波数領域に変換し、正規化部が該周波数変換部
の出力信号を正規化し、ピーク検出部が該正規化部の出
力信号のピーク周波数成分を検出し、有音候補選択部が
該ピーク周波数成分の中から高調波成分を持つ基本波成
分を検出し、有音判定部が該基本波成分が所定時間以上
続いたとき該入力データを有音と判定するように構成し
たので、音声信号の背景となる音楽成分を検出すること
が可能となる。
As described above, according to the sound detection device of the present invention, the frequency conversion unit converts the input data from the time domain to the frequency domain, and the normalization unit outputs the output signal of the frequency conversion unit. The peak detection unit detects the peak frequency component of the output signal of the normalization unit, the sound candidate selection unit detects the fundamental wave component having a harmonic component from the peak frequency components, Since the determination unit is configured to determine that the input data is sound when the fundamental wave component continues for a predetermined time or more, it is possible to detect a music component serving as a background of the audio signal.

【0092】また、該有音判定部の出力信号が音声符号
化部に与えられて音声符号化の可否を設定するように構
成出来るので、音声が途切れた場合においても、背景音
楽は途切れること無く相手に伝わることとなり違和感の
ない通話が可能となり、伝送する通話品質の向上に寄与
するところが大きい。
Further, since the output signal of the sound determination unit can be provided to the audio encoding unit to set the availability of audio encoding, the background music is not interrupted even if the audio is interrupted. The call is transmitted to the other party, and the call without discomfort is possible, which greatly contributes to the improvement of the quality of the transmitted call.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明に係る有音検出装置の実施例を示すブロ
ック図である。
FIG. 1 is a block diagram showing an embodiment of a sound detection device according to the present invention.

【図2】本発明に係る有音検出装置におけるピーク検出
部の動作を説明するためのグラフ図である。
FIG. 2 is a graph for explaining the operation of a peak detection unit in the sound detection device according to the present invention.

【図3】本発明に係る有音検出装置におけるピーク検出
部で用いられる重み関数例を示すグラフ図である。
FIG. 3 is a graph illustrating an example of a weighting function used in a peak detection unit in the sound detection device according to the present invention.

【図4】本発明に係る有音検出装置の有音候補選択部に
おける基本波成分候補選択の手順を示すフローチャート
図である。
FIG. 4 is a flowchart illustrating a procedure of selecting a fundamental component candidate in a sound candidate selection unit of the sound detection device according to the present invention.

【図5】本発明に係る有音検出装置の有音候補選択部に
おける高調波検出の手順を示すフローチャート図であ
る。
FIG. 5 is a flowchart illustrating a procedure of harmonic detection in a sound candidate selection unit of the sound detection device according to the present invention.

【図6】一般的な有音検出装置を用いた音声符号化装置
の構成例を示すブロック図である。
FIG. 6 is a block diagram illustrating a configuration example of a speech encoding device using a general sound presence detection device.

【図7】一般的な有音(音声)検出装置の構成を示すブ
ロック図である。
FIG. 7 is a block diagram illustrating a configuration of a general sound (voice) detection device.

【符号の説明】[Explanation of symbols]

10 音声符号化部 20 有音検出装置 21 パワー算出部 22 線形予測分析部 23 周波数成分抽出部 24 ピッチ周期算出部 25,35 有音判定部 31 周波数変換部 32 正規化部 33 ピーク検出部 34 有音候補選択部 40 PCM入力データ 50,51,52 有音判定信号 60 符号化データ 図中、同一符号は同一又は相当部分を示す。 DESCRIPTION OF SYMBOLS 10 Speech coding part 20 Sound existence detection device 21 Power calculation part 22 Linear prediction analysis part 23 Frequency component extraction part 24 Pitch period calculation part 25, 35 Sound existence judgment part 31 Frequency conversion part 32 Normalization part 33 Peak detection part 34 Existence Sound candidate selection unit 40 PCM input data 50, 51, 52 Voice determination signal 60 Encoded data In the drawings, the same reference numerals indicate the same or corresponding parts.

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】入力データを時間領域から周波数領域に変
換する周波数変換部と、 該周波数変換部の出力信号を正規化する正規化部と、 該正規化部の出力信号のピーク周波数成分を検出するピ
ーク検出部と、 該ピーク周波数成分の中から高調波成分を持つ基本波成
分を検出する有音候補選択部と、 該基本波成分が所定時間以上続いたとき該入力データを
有音と判定する有音判定部と、 を備えたことを特徴とする有音検出装置。
1. A frequency conversion unit for converting input data from a time domain to a frequency domain, a normalization unit for normalizing an output signal of the frequency conversion unit, and detecting a peak frequency component of an output signal of the normalization unit A voice detecting unit that detects a fundamental component having a harmonic component from the peak frequency component, and determines that the input data is a voice when the fundamental component continues for a predetermined time or more. A sound detection device, comprising:
【請求項2】請求項1において、 該ピーク検出部が、高周波成分に対してより大きく重み
付けして該ピーク周波数成分を検出することを特徴とし
た有音検出装置。
2. The sound detection device according to claim 1, wherein the peak detection section detects the peak frequency component by weighting the high frequency component more heavily.
【請求項3】請求項1又は2において、 該ピーク検出部が、しきい値以上の該ピーク周波数成分
のみを検出することを特徴とした有音検出装置。
3. The sound detection device according to claim 1, wherein the peak detection section detects only the peak frequency component equal to or higher than a threshold value.
【請求項4】請求項1において、 該所定時間が音楽成分であることを示す期間であること
を特徴とした有音検出装置。
4. The sound detection device according to claim 1, wherein the predetermined time is a period indicating a music component.
【請求項5】請求項1において、 該有音判定部の出力信号が音声符号化部に与えられて音
声符号化の可否を設定することを特徴とした有音検出装
置。
5. The sound detection device according to claim 1, wherein an output signal of the sound determination unit is supplied to a voice coding unit to set whether or not voice coding is possible.
JP9114055A 1997-05-01 1997-05-01 Sound detecting device Withdrawn JPH10301594A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9114055A JPH10301594A (en) 1997-05-01 1997-05-01 Sound detecting device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9114055A JPH10301594A (en) 1997-05-01 1997-05-01 Sound detecting device

Publications (1)

Publication Number Publication Date
JPH10301594A true JPH10301594A (en) 1998-11-13

Family

ID=14627911

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9114055A Withdrawn JPH10301594A (en) 1997-05-01 1997-05-01 Sound detecting device

Country Status (1)

Country Link
JP (1) JPH10301594A (en)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006287851A (en) * 2005-04-05 2006-10-19 Roland Corp Howl preventing device
JP2007122047A (en) * 2005-10-28 2007-05-17 Samsung Electronics Co Ltd Voice signal detection system and method
JP2007298607A (en) * 2006-04-28 2007-11-15 Victor Co Of Japan Ltd Device, method, and program for analyzing sound signal
JP2009501359A (en) * 2005-07-15 2009-01-15 サムスン エレクトロニクス カンパニー リミテッド Method and apparatus for extracting important frequency component of audio signal, and encoding and / or decoding method and apparatus for low bit rate audio signal using the same
JP2012133346A (en) * 2010-11-30 2012-07-12 Jvc Kenwood Corp Voice processing device and voice processing method
EP2544175A1 (en) 2011-04-19 2013-01-09 Sony Corporation Music section detecting apparatus and method, program, recording medium, and music signal detecting apparatus
CN105763293A (en) * 2014-12-19 2016-07-13 北京奇虎科技有限公司 Method and system for playing music in sound wave-based data transmission
JP2019105729A (en) * 2017-12-12 2019-06-27 株式会社テイクアンドシー Person evaluation device, program, and, method

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006287851A (en) * 2005-04-05 2006-10-19 Roland Corp Howl preventing device
JP2012198555A (en) * 2005-07-15 2012-10-18 Samsung Electronics Co Ltd Extraction method and device of important frequency components of audio signal, and encoding and/or decoding method and device of low bit rate audio signal utilizing extraction method
US8615391B2 (en) 2005-07-15 2013-12-24 Samsung Electronics Co., Ltd. Method and apparatus to extract important spectral component from audio signal and low bit-rate audio signal coding and/or decoding method and apparatus using the same
JP2009501359A (en) * 2005-07-15 2009-01-15 サムスン エレクトロニクス カンパニー リミテッド Method and apparatus for extracting important frequency component of audio signal, and encoding and / or decoding method and apparatus for low bit rate audio signal using the same
JP2007122047A (en) * 2005-10-28 2007-05-17 Samsung Electronics Co Ltd Voice signal detection system and method
US7739107B2 (en) 2005-10-28 2010-06-15 Samsung Electronics Co., Ltd. Voice signal detection system and method
JP4545729B2 (en) * 2005-10-28 2010-09-15 三星電子株式会社 Audio signal detection system and method
JP4735398B2 (en) * 2006-04-28 2011-07-27 日本ビクター株式会社 Acoustic signal analysis apparatus, acoustic signal analysis method, and acoustic signal analysis program
JP2007298607A (en) * 2006-04-28 2007-11-15 Victor Co Of Japan Ltd Device, method, and program for analyzing sound signal
JP2012133346A (en) * 2010-11-30 2012-07-12 Jvc Kenwood Corp Voice processing device and voice processing method
EP2544175A1 (en) 2011-04-19 2013-01-09 Sony Corporation Music section detecting apparatus and method, program, recording medium, and music signal detecting apparatus
US8901407B2 (en) 2011-04-19 2014-12-02 Sony Corporation Music section detecting apparatus and method, program, recording medium, and music signal detecting apparatus
CN105763293A (en) * 2014-12-19 2016-07-13 北京奇虎科技有限公司 Method and system for playing music in sound wave-based data transmission
CN105763293B (en) * 2014-12-19 2019-05-31 北京奇虎科技有限公司 The method and system of music are played in sonic transmissions data
JP2019105729A (en) * 2017-12-12 2019-06-27 株式会社テイクアンドシー Person evaluation device, program, and, method

Similar Documents

Publication Publication Date Title
US6202046B1 (en) Background noise/speech classification method
US5611019A (en) Method and an apparatus for speech detection for determining whether an input signal is speech or nonspeech
KR100770839B1 (en) Method and apparatus for estimating harmonic information, spectrum information and degree of voicing information of audio signal
US6785645B2 (en) Real-time speech and music classifier
KR100986957B1 (en) Systems, methods, and apparatus for detection of tonal components
US7027983B2 (en) System and method for generating an identification signal for electronic devices
US6687668B2 (en) Method for improvement of G.723.1 processing time and speech quality and for reduction of bit rate in CELP vocoder and CELP vococer using the same
US5774836A (en) System and method for performing pitch estimation and error checking on low estimated pitch values in a correlation based pitch estimator
KR20030064733A (en) Fast frequency-domain pitch estimation
JPH09212194A (en) Device and method for pitch extraction
JPH05346797A (en) Voiced sound discriminating method
EP1312075B1 (en) Method for noise robust classification in speech coding
US6243672B1 (en) Speech encoding/decoding method and apparatus using a pitch reliability measure
JPH04270398A (en) Voice encoding system
JP3478209B2 (en) Audio signal decoding method and apparatus, audio signal encoding and decoding method and apparatus, and recording medium
JP3402748B2 (en) Pitch period extraction device for audio signal
JPH10301594A (en) Sound detecting device
CN113271386B (en) Howling detection method and device, storage medium and electronic equipment
US8442817B2 (en) Apparatus and method for voice activity detection
US6470311B1 (en) Method and apparatus for determining pitch synchronous frames
JP4696418B2 (en) Information detection apparatus and method
EP1436805B1 (en) 2-phase pitch detection method and appartus
JP3418005B2 (en) Voice pitch detection device
JPH07199997A (en) Processing method of sound signal in processing system of sound signal and shortening method of processing time in itsprocessing
JPH0830299A (en) Voice coder

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20040706