JP2001285523A - Call discriminating device - Google Patents
Call discriminating deviceInfo
- Publication number
- JP2001285523A JP2001285523A JP2000089327A JP2000089327A JP2001285523A JP 2001285523 A JP2001285523 A JP 2001285523A JP 2000089327 A JP2000089327 A JP 2000089327A JP 2000089327 A JP2000089327 A JP 2000089327A JP 2001285523 A JP2001285523 A JP 2001285523A
- Authority
- JP
- Japan
- Prior art keywords
- call
- band
- frame
- discriminating
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Telephonic Communication Services (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】本発明は、電話回線あるいは
ISDN回線を介して伝送される呼の種別を判定する呼
判別装置に係り、特に、非制限ディジタル呼と音声帯域
呼とを判別する呼判別装置に関するものである。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a call discriminating apparatus for discriminating a type of a call transmitted through a telephone line or an ISDN line, and more particularly to a call discriminating apparatus for discriminating between an unrestricted digital call and a voice band call. It concerns the device.
【0002】[0002]
【従来の技術】電話回線あるいはISDN回線では、音
声、音声帯域データおよびG3ファクシミリ等による音
声帯域呼と、テレビ会議装置およびG4ファクシミリ装
置等による非制限ディジタル呼の両方が伝送される。音
声帯域呼と非制限ディジタル呼とでは、伝送方式や通話
信号の音響的性質が異なることから、例えば音声信号処
理装置や品質測定装置では、これらを区別して取り扱う
ことが必要となる場合がある。2. Description of the Related Art In a telephone line or an ISDN line, both voice, voice band data and voice band calls using G3 facsimile and the like, and unrestricted digital calls using video conference equipment and G4 facsimile equipment are transmitted. Since the transmission method and the acoustic characteristics of the speech signal are different between the voice band call and the unrestricted digital call, for example, in a voice signal processing device or a quality measurement device, it may be necessary to handle them differently.
【0003】音声帯域呼では、音声やモデム信号等のア
ナログ信号を音声帯域に帯域制限した後でA/D変換
し、PCM等の符号化則に従って伝送される。一方、非
制限ディジタル呼では、ディジタル情報がそのまま通話
チャネルのビットに割り当てられて伝送され、PCM等
の符号化則には従わない。In a voice band call, analog signals such as voice and modem signals are band-limited to a voice band, A / D converted, and transmitted according to a coding rule such as PCM. On the other hand, in an unrestricted digital call, digital information is directly allocated to bits of a communication channel and transmitted, and does not follow a coding rule such as PCM.
【0004】一般に、電話回線系の通信設備では、呼接
続に係る網管理情報や端末からのプロトコル情報等に基
づいて各通話ごとに呼種別およびサービス種別の情報を
管理している。このため、非制限ディジタル呼と音声帯
域呼との識別が必要となる場合には、これら通信設備の
もつ管理情報を利用し、識別対象である呼との対応付け
により識別が行われる。In general, telephone line communication equipment manages call type and service type information for each call based on network management information relating to call connection, protocol information from terminals, and the like. For this reason, when it is necessary to distinguish between an unrestricted digital call and a voice band call, the identification is performed by associating with the call to be identified using the management information of these communication facilities.
【0005】[0005]
【発明が解決しようとする課題】通信設備のもつ呼種別
およびサービス種別の管理情報を利用する従来の方式で
は、これらの情報を管理している設備との間で情報を交
換し合う機構が必要となり、音声帯域呼と非制限ディジ
タル呼の自動的判別を行う装置の構成が複雑になるとい
う問題があった。また、通話信号のみしか取得できず、
前記通信設備による呼種別等の管理情報が利用できない
場合には、音声帯域呼と非制限ディジタル呼の自動的な
識別が困難となるという問題があった。In the conventional system using the management information of the call type and the service type of the communication equipment, a mechanism for exchanging information with the equipment managing such information is required. As a result, there is a problem that the configuration of a device for automatically discriminating between voice band calls and unrestricted digital calls becomes complicated. Also, only the call signal can be obtained,
When management information such as a call type by the communication equipment cannot be used, there is a problem that it is difficult to automatically distinguish a voice band call from an unrestricted digital call.
【0006】本発明の目的は、上記した従来技術の課題
を解決し、電話回線あるいはISDN回線を介して伝送
される音声帯域呼と非制限ディジタル呼とを簡単な構成
で判別できる呼判別装置を提供することにある。An object of the present invention is to solve the above-mentioned problems of the prior art and to provide a call discriminating apparatus capable of discriminating a voice band call and an unrestricted digital call transmitted via a telephone line or an ISDN line with a simple configuration. To provide.
【0007】[0007]
【課題を解決するための手段】上記した目的を達成する
ために、本発明は、電話回線あるいはISDN回線を介
して伝送される呼の種別を判定する呼判別装置におい
て、通話信号を復号化する復号化手段と、復号化された
信号の周波数特性を検出する周波数特性検出手段と、前
記検出された周波数特性に基づいて、当該通話信号が非
制限ディジタル呼および音声帯域呼のいずれであるかを
判別する呼判別手段とを含むことを特徴とする。In order to achieve the above-mentioned object, the present invention provides a call discriminating apparatus for judging the type of a call transmitted through a telephone line or an ISDN line. Decoding means, frequency characteristic detecting means for detecting frequency characteristics of the decoded signal, and, based on the detected frequency characteristics, determining whether the call signal is an unrestricted digital call or a voice band call. And a call discriminating means for discriminating.
【0008】このような特徴において、符号化された非
制限ディジタル呼のフレームおよび音声帯域呼のフレー
ムを復号化し、その周波数特性を検出すれば、両者は特
に音声帯域(0.3〜3.4kHz)外において特異的
な性質を示す。したがって、それぞれの周波数特性を分
析すれば、当該呼が非制限ディジタル呼のフレームおよ
び音声帯域呼のフレームのいずれであるかを判定でき
る。In such a feature, if the encoded unrestricted digital call frame and the voice band call frame are decoded and their frequency characteristics are detected, both of them are particularly in the voice band (0.3 to 3.4 kHz). ) Shows specific properties outside. Therefore, by analyzing the respective frequency characteristics, it can be determined whether the call is a frame of an unrestricted digital call or a frame of a voice band call.
【0009】[0009]
【発明の実施の形態】本発明の実施形態を詳細に説明す
る前に、初めに、本発明の基本的な概念について説明す
る。なお、以下では信号がPCM符号化されて電話回線
へ送出される場合を例にして説明する。DESCRIPTION OF THE PREFERRED EMBODIMENTS Before describing the embodiments of the present invention in detail, first, the basic concept of the present invention will be described. In the following, a case where a signal is PCM-coded and transmitted to a telephone line will be described as an example.
【0010】音声帯域呼では、音声やモデム信号等のア
ナログ信号を、送信側ではA/D変換およびPCM符号
化して送出し、受信側ではPCM復号化する。アナログ
信号をA/D変換する際、サンプリング処理において発
生するエリアシングの影響を抑圧するため、帯域を音声
帯域(0.3〜3.4kHz)に制限する帯域制限が行
われる。このため、音声帯域呼の復号化後の周波数特性
は、図4に太実線で示したように、音声帯域外の低域お
よび高域の周波数領域でパワーが抑圧された固有の特性
を示す。In a voice band call, analog signals such as voice and modem signals are A / D-converted and PCM-encoded on the transmitting side and transmitted, and PCM-decoded on the receiving side. At the time of A / D conversion of an analog signal, a band is limited to a voice band (0.3 to 3.4 kHz) in order to suppress the influence of aliasing occurring in the sampling process. For this reason, the frequency characteristics after decoding of the voice band call show unique characteristics in which the power is suppressed in the low and high frequency regions outside the voice band, as shown by the thick solid line in FIG.
【0011】一方、非制限ディジタル呼では、ディジタ
ル情報がそのまま通話チャネルのビットに割り当てられ
て伝送されるため、帯域制限やPCM符号化が行われな
い。このため、非制限ディジタル信号をPCM復号化し
て得られる信号は、図4に細実線で示したように、本来
のディジタル情報のもつ音響的性質とは無関係な周波数
特性を示し、雑音やインパルス信号のように、音声帯域
外の周波数領域においても高いパワーを有する固有の特
性を示す。On the other hand, in an unrestricted digital call, digital information is directly allocated to bits of a communication channel and transmitted, so that band limitation and PCM encoding are not performed. Therefore, the signal obtained by PCM decoding the unrestricted digital signal has frequency characteristics unrelated to the acoustic characteristics of the original digital information as shown by the thin solid line in FIG. As shown in FIG. 7, the characteristic characteristic having a high power even in a frequency region outside the voice band is exhibited.
【0012】このように、各受信呼の通話信号をPCM
復号化すれば、その周波数特性が呼種別を代表すること
から、本発明では、上述の周波数特性の特異性に着目し
て呼種別を判別するようにした。Thus, the speech signal of each received call is
If decoded, the frequency characteristics represent the call type. Therefore, in the present invention, the call type is determined by focusing on the specificity of the frequency characteristics described above.
【0013】なお、音声帯域外の周波数帯域におけるパ
ワー比較では、音声帯域伝送での帯域制限の遮断特性が
緩やかとなる伝送系において、図5に示したように、低
域にパワーが集中する音声の場合に、音声帯域外へのパ
ワーの漏れ込みによる誤判定を引き起こす場合がある。
このため、通話信号の自己相関に基づく判定基準を用い
ることにより識別判定精度を改善するようにした。In the power comparison in a frequency band outside the voice band, as shown in FIG. 5, in a transmission system in which the cutoff characteristic of the band limitation in the voice band transmission becomes gentle, as shown in FIG. In such a case, an erroneous determination may be caused by leakage of power out of the voice band.
For this reason, the identification determination accuracy is improved by using a determination criterion based on the autocorrelation of the speech signal.
【0014】図2は、本発明の呼判別装置が適用される
品質測定装置40の構成を示した図であり、呼の種別が
非制限ディジタル呼および音声帯域呼のいずれであるか
を判別する呼判別部41と、音声帯域呼を対象に品質測
定を行う品質測定部42とを含む。FIG. 2 is a diagram showing a configuration of a quality measuring device 40 to which the call discriminating device of the present invention is applied, and discriminates whether the type of call is an unrestricted digital call or a voice band call. It includes a call determination unit 41 and a quality measurement unit 42 that performs quality measurement for a voice band call.
【0015】前記品質測定部42は、全ての呼のデータ
に対して品質測定を行い、その後、当該呼が呼判別部4
1により非制限ディジタル呼と判別されると測定を中止
し、音声帯域呼と判別されると測定を継続する。あるい
は、呼判別部41により音声帯域呼と判別された呼に対
してのみ、当該判別後から選択的に測定を開始するよう
にしても良い。The quality measuring section 42 measures the quality of all the call data, and thereafter, the call is
If the call is determined to be an unrestricted digital call by 1, the measurement is stopped, and if the call is determined to be a voice band call, the measurement is continued. Alternatively, the measurement may be selectively started only for a call determined as a voice band call by the call determination unit 41 after the determination.
【0016】図1は、前記呼判別部41の主要部の構成
を示した機能ブロック図であり、受信データを復号化す
る復号化ブロックAと、復号化された通話信号の周波数
特性を検出する周波数特性検出ブロックBと、前記周波
数特性の検出結果に基づいて呼の種別を判別する呼判別
ブロックCとを主要構成とし、さらに、有音フレームを
検出する有音検出器3と、相関判定ブロックDとを併設
している。FIG. 1 is a functional block diagram showing a configuration of a main part of the call discriminating section 41, which detects a decoding block A for decoding received data and a frequency characteristic of the decoded speech signal. A frequency characteristic detection block B and a call determination block C for determining a type of a call based on the detection result of the frequency characteristics are mainly configured. Further, a sound detector 3 for detecting a sound frame, and a correlation determination block D and are attached.
【0017】前記復号化ブロックAにおいて、復号化器
1は、電話回線あるいはISDN回線より伝送される通
話信号を復号化し、リニアデータとしてバッファ2に格
納する。バッファ2に格納されたリニアデータは一定の
フレームサイズごとに抽出され、このフレームを単位と
して各種の処理が繰り返し実行される。本実施例では、
フレームサイズを80サンプル(=10ms:サンプリ
ング周波数8kHz)に設定している。In the decoding block A, a decoder 1 decodes a speech signal transmitted from a telephone line or an ISDN line, and stores it in a buffer 2 as linear data. The linear data stored in the buffer 2 is extracted for each fixed frame size, and various processes are repeatedly executed for each frame. In this embodiment,
The frame size is set to 80 samples (= 10 ms: sampling frequency 8 kHz).
【0018】有音検出器3は、バッファ2から単一フレ
ーム区間のリニアデータx[j](j=0〜L−1)を
読み出して当該フレームの有音/無音を判定し、判定結
果をフレーム種別判定器(第1判定部)11および呼種
別判定器(第2判定部)12に通知する。ここで、x
[j]は当該フレームにおける第j番目のサンプルのリ
ニアデータ、Lはフレームサイズである。なお、有音検
出手法については、長時間平均パワーと短時間平均パワ
ーとの比較に基づく既知の手法を用いることができる。The sound detector 3 reads the linear data x [j] (j = 0 to L-1) of a single frame section from the buffer 2 to determine the presence / absence of sound in the frame and determines the result of the determination. A notification is sent to a frame type determiner (first determiner) 11 and a call type determiner (second determiner) 12. Where x
[J] is the linear data of the j-th sample in the frame, and L is the frame size. As the sound detection method, a known method based on a comparison between the long-term average power and the short-time average power can be used.
【0019】周波数特性検出ブロックBにおいて、FF
T処理器4は、前記有音検出器3が判定を行ったフレー
ムに対して、その周波数特性を分析するために高速フー
リエ変換(FFT)を行う。FFT処理器4は、分析対
象となるフレームを中央とし、その前後1フレームを併
せた計3フレーム分の240サンプルのリニアデータを
前記バッファ2より読み出す。さらに、総サンプル数が
256サンプルとなるように、その両端にリニア値0の
データを均等に追加した後、例えばハミング窓のような
窓関数を乗じてFFT処理を行う。さらに、次式1に基
づいて、当該フレームにおけるパワースペクトルSx
[k]を算出する。In the frequency characteristic detection block B, FF
The T processor 4 performs a fast Fourier transform (FFT) on the frame determined by the sound detector 3 in order to analyze its frequency characteristics. The FFT processor 4 reads out, from the buffer 2, 240 samples of linear data for a total of three frames including one frame before and after the frame to be analyzed as the center. Further, data having a linear value of 0 is uniformly added to both ends so that the total number of samples becomes 256, and then an FFT process is performed by multiplying by a window function such as a Hamming window. Further, based on the following equation 1, the power spectrum Sx in the frame is
[K] is calculated.
【0020】[0020]
【数1】 (Equation 1)
【0021】ここで、kは周波数サンプルであり、Xr
e[k],Xim[k]は、それぞれ第k番目の周波数
サンプルにおけるFFT処理結果の実数部および虚数
部、Sx[k] は第k番目の周波数サンプルにおけるパ
ワースペクトルである。Where k is a frequency sample and Xr
e [k] and Xim [k] are the real and imaginary parts of the FFT processing result at the k-th frequency sample, respectively, and Sx [k] is the power spectrum at the k-th frequency sample.
【0022】音声帯域外低域パワー計算器5−1および
音声帯域外高域パワー計算器5−2、ならびに第1帯域
パワー計算器6−1ないし第N帯域パワー計算器6−N
では、FFT処理器4により算出されたパワースペクト
ルに基づいて、予め指定された各周波数帯域ごとのパワ
ーを算出する。なお、本実施例では、表1および図6に
示したように、音声帯域内の周波数領域を6つの帯域に
分割している。Out-of-band low-band power calculator 5-1 and out-of-band high-band power calculator 5-2, and first-band power calculator 6-1 to N-th band power calculator 6-N
Then, based on the power spectrum calculated by the FFT processor 4, the power for each frequency band specified in advance is calculated. In this embodiment, as shown in Table 1 and FIG. 6, the frequency region in the audio band is divided into six bands.
【0023】[0023]
【表1】 [Table 1]
【0024】また、本実施例では、音声帯域外の低域部
(〜0.25kHz)と音声帯域内の第1帯域(0.2
5kHz〜)とが、隣接かつ連続した周波数サンプルと
なるように帯域を割り当てているが、音声帯域呼の帯域
抑圧不足等による音声帯域外低域部へのパワーの漏れ込
みの影響を抑圧するため、音声帯域外低域部と音声帯域
内第1帯域との間に隙間が生じるように帯域を割り当て
てもよい。Also, in this embodiment, the lower band (up to 0.25 kHz) outside the voice band and the first band (0.2
5 kHz) are allocated so that adjacent and continuous frequency samples are obtained. However, in order to suppress the influence of power leakage into the low-frequency portion outside the voice band due to insufficient band suppression of voice band calls. Alternatively, the band may be allocated so that a gap is generated between the low band outside the audio band and the first band within the audio band.
【0025】前記音声帯域外低域パワー計算器5−1お
よび音声帯域外高域パワー計算器5−2では、次式2、
3に従って、音声帯域外の低域および高域の各帯域パワ
ーが算出され、算出結果がフレーム種別判定器11に通
知される。The out-of-band low-band power calculator 5-1 and the out-of-band high-band power calculator 5-2 use the following equation (2).
According to 3, the respective band powers of the low band and the high band outside the audio band are calculated, and the calculation result is notified to the frame type determination unit 11.
【0026】[0026]
【数2】 (Equation 2)
【0027】[0027]
【数3】 (Equation 3)
【0028】ここで、PL は音声帯域外低域パワー、W
L は音声帯域外低域部の周波数サンプル数、PH は音声
帯域外高域パワー、WH は音声帯域外高域部の周波数サ
ンプル数、K0 は音声帯域外高域部における先頭の周波
数サンプル番号を表す。Here, PL is the low-frequency power outside the voice band, W
L is the number of frequency samples in the low band outside the audio band, PH is the high band power outside the audio band, WH is the number of frequency samples in the high band outside the audio band, and K0 is the first frequency sample number in the high band outside the audio band. Represent.
【0029】第1帯域平均パワー計算器6−1から第N
帯域平均パワー計算器6−Nでは、次式4に従って、音
声帯域内で6分割された各帯域のパワーを算出し、算出
結果を最大値検出器7に通知する。The first band average power calculator 6-1 to the Nth
The band average power calculator 6-N calculates the power of each of the six divided bands in the voice band according to the following equation 4, and notifies the maximum value detector 7 of the calculation result.
【0030】[0030]
【数4】 (Equation 4)
【0031】ここで、P[n]は音声帯域内の第n帯域
のパワー、Wは同帯域の周波数サンプル数、Kv は音声
帯域内の先頭周波数サンプル番号を表す。最大値検出器
7では、音声帯域内における第1帯域から第N帯域まで
のパワーが相互に比較され、最大の帯域パワーが音声帯
域内帯域パワー最大値Pmax としてフレーム種別判定器
11に通知される。Here, P [n] is the power of the n-th band in the voice band, W is the number of frequency samples in the same band, and Kv is the number of the first frequency sample in the voice band. In the maximum value detector 7, the powers from the first band to the Nth band in the audio band are compared with each other, and the maximum band power is notified to the frame type determination unit 11 as the maximum band power Pmax in the audio band. .
【0032】相関判定ブロックDにおいて、1次自己相
関計算器8および2次自己相関計算器9は、前記有音検
出器3が検出対象としたフレームのリニアデータを使用
して、次式5、6の計算式に基づいて、正規化した1 次
および2次の自己相関を計算し、計算結果を自己相関ス
レッショルド判定器10へ出力する。In the correlation determination block D, the first-order autocorrelation calculator 8 and the second-order autocorrelation calculator 9 use the linear data of the frame detected by the sound detector 3 to obtain the following equation 5, The normalized first and second order autocorrelation is calculated based on the calculation formula 6, and the calculation result is output to the autocorrelation threshold determiner 10.
【0033】[0033]
【数5】 (Equation 5)
【0034】[0034]
【数6】 (Equation 6)
【0035】但し、x[j]は処理対象フレームの第j
番目のサンプルにおけるリニアデータ値、Lはフレーム
サイズ、C1は1次の正規化自己相関値、C2は2次の
正規化自己相関値を表す。Here, x [j] is the j-th frame to be processed.
The linear data value in the second sample, L is the frame size, C1 is the primary normalized autocorrelation value, and C2 is the secondary normalized autocorrelation value.
【0036】自己相関スレッショルド判定器10は、次
式7に基づいて、1次および2次の正規化自己相関値の
絶対値の和と予め定められたスレッショルド値との比較
を行い、当該フレームにおける相関度合を判定する。次
式7が成立すると、当該フレームの相関が低いと判定し
て相関フラグ=1を、その他の場合には、相関が高いと
して相関フラグ=0を、それぞれフレーム種別判定器1
1に通知する。尚、本実施例ではスレッショルド値Thr
Crrが0.5に設定されている。The autocorrelation threshold determiner 10 compares the sum of the absolute values of the primary and secondary normalized autocorrelation values with a predetermined threshold value based on the following equation 7, and The degree of correlation is determined. When the following equation 7 is satisfied, the correlation flag of the frame is determined to be low, and the correlation flag is set to 1. In other cases, the correlation flag is set to 0 and the correlation flag is set to 0.
Notify 1. In this embodiment, the threshold value Thr
Crr is set to 0.5.
【0037】[0037]
【数7】 (Equation 7)
【0038】呼判別ブロックCにおいて、フレーム種別
判定器11は、以下にフローチャートを参照して詳述す
るように、有音検出器3による検出結果、最大値検出器
7による検出結果7と各パワー計算器5−1、5−2に
よる計算結果との比較結果、ならびに自己相関スレッシ
ョルド判定器10による判定結果に基づいて、各フレー
ムが音声帯域信号および非制限ディジタル信号のいずれ
であるかを判定する。呼種別判定器12は、前記フレー
ム種別判定器11による各フレームの判定結果に基づい
て、当該フレームの呼が音声帯域呼および非制限ディジ
タル呼のいずれであるかを判定する。In the call discrimination block C, the frame type discriminator 11 determines the detection result of the sound detector 3 and the detection result 7 of the maximum value detector 7 and each power, as will be described in detail below with reference to a flowchart. It is determined whether each frame is a voice band signal or an unrestricted digital signal based on a comparison result with the calculation results by the calculators 5-1 and 5-2 and a determination result by the autocorrelation threshold determiner 10. . The call type determiner 12 determines, based on the determination result of each frame by the frame type determiner 11, whether the call of the frame is a voice band call or an unrestricted digital call.
【0039】図3は、前記フレーム種別判定器11およ
び呼種別判定器12の動作を示したフローチャートであ
る。FIG. 3 is a flowchart showing the operation of the frame type judging unit 11 and the call type judging unit 12.
【0040】ステップS1では、フレーム種別判定器1
1において、判定対象のフレームを有音検出器3が有音
フレームと認識しているか否かが判定され、判定結果が
呼種別判定器12へ通知される。呼種別判定器12は、
有音フレームである旨の判定結果を受け取ると、ステッ
プS2において、有音フレームカウンタNaをインクリ
メントし、無音フレームである旨の判定結果を受け取る
と、ステップS1へ戻って次のフレームを判定する。In step S1, the frame type determining unit 1
In 1, it is determined whether the sound detector 3 recognizes the frame to be determined as a sound frame, and the determination result is notified to the call type determiner 12. The call type determiner 12
Upon receiving the determination result indicating that the frame is a voice frame, in step S2, the voice frame counter Na is incremented. When the determination result indicating that the frame is a silent frame is received, the process returns to step S1 to determine the next frame.
【0041】ステップS3では、有音と判定されたフレ
ームの音声帯域外低域パワーPL および音声帯域外高域
パワーPH が、フレーム種別判定器11において、それ
ぞれ前記最大値Pmax との関係において次式8、9のい
ずれかを満足するか否かが判定される。In step S3, the out-of-band low-band power PL and the out-of-band high-band power PH of the frame determined to have sound are determined by the frame type determiner 11 in relation to the maximum value Pmax by the following equation. It is determined whether any one of 8 and 9 is satisfied.
【0042】[0042]
【数8】 (Equation 8)
【0043】[0043]
【数9】 (Equation 9)
【0044】なお、αL 、αH は最大値Pmax に対する
低域パワーPL および高域パワーPH のマージンであ
り、本実施例では、パワー換算で3dB程度小さい値と
するため、αL =αH =0.5とした。It should be noted that αL and αH are margins of the low band power PL and the high band power PH with respect to the maximum value Pmax. In the present embodiment, αL = αH = 0.5 And
【0045】ここで、式8、9のいずれかが成立し、各
帯域外パワーPL ,PH のいずれかが最大値Pmax に対
して有意に小さくない、換言すれば、各帯域外パワーP
L ,PH が最大値Pmax と同等またはそれ以上であれ
ば、当該フレームを非制限ディジタルフレームと仮定し
てステップS4へ進む。ステップS4では、フレーム種
別判定器11において、自己相関スレッショルド判定器
10からの相関フラグが参照される。相関フラグの値が
1(相関が低い)であれば、当該フレームの通話信号を
真に非制限ディジタル信号であると判定してステップS
5へ進み、呼種別判定器12において、非制限ディジタ
ルフレームカウンタNdがインクリメントされる。ま
た、相関フラグの値が0(相関が高い)であれば、その
ままステップS1へ戻って次のフレームを処理する。Here, either of the equations 8 and 9 holds, and either of the out-of-band powers PL and PH is not significantly smaller than the maximum value Pmax, in other words, each of the out-of-band powers P
If L and PH are equal to or greater than the maximum value Pmax, the process proceeds to step S4 on the assumption that the frame is an unrestricted digital frame. In step S4, the frame type determiner 11 refers to the correlation flag from the autocorrelation threshold determiner 10. If the value of the correlation flag is 1 (the correlation is low), it is determined that the speech signal of the frame is a truly unrestricted digital signal, and step S
The call type determination unit 12 increments the unrestricted digital frame counter Nd. If the value of the correlation flag is 0 (the correlation is high), the process returns to step S1 to process the next frame.
【0046】ステップS6では、非制限ディジタル呼の
判定のために予め定められた所定の判定期間が終了した
か否かが判定される。この判定期間は、所定のフレーム
数の判定が終了するまで、あるいは判定対象の通話信号
の呼が完了するまでに設定することができる。In step S6, it is determined whether or not a predetermined determination period for determining an unrestricted digital call has ended. This determination period can be set until the determination of the predetermined number of frames is completed or until the call of the determination target speech signal is completed.
【0047】判定期間が終了すると、ステップS7で
は、呼種別判定器12において、前記有音検出器3にお
いて有音と判定されたフレーム数Naと、前記フレーム
種別判定器11において非制限ディジタル信号と判定さ
れたフレーム数Ndとが次式10を満足するか否かが判
定される。なお、ThrNは、非制限ディジタル呼の判
定スレッショルドであり、本実施例ではThrN=0.
9とした。When the determination period is over, in step S7, the call type determiner 12 determines the number Na of frames determined to be sound by the sound detector 3 and the frame type determiner 11 outputs the unlimited digital signal. It is determined whether or not the determined number of frames Nd satisfies Expression 10 below. Here, ThrN is a threshold for determining an unrestricted digital call, and in this embodiment, ThrN = 0.
It was set to 9.
【0048】[0048]
【数10】 (Equation 10)
【0049】式10が成立し、有音フレームの90%以
上が非制限ディジタルフレームであれば、ステップS8
において、当該呼が非制限ディジタル呼と判定される。
前記式10が成立しなければ、ステップS9において、
当該呼が音声帯域呼と判別される。If Equation 10 is satisfied and 90% or more of the sound frames are unrestricted digital frames, step S8
, The call is determined to be an unrestricted digital call.
If the expression 10 is not satisfied, in step S9,
The call is determined to be a voice band call.
【0050】なお、上記した実施形態では、非制限ディ
ジタル信号の識別における各帯域ごとのパワーの算出に
FFT(高速フーリエ変換)処理器4を用いたが、これ
を予め帯域分割されたフィルタバンクにより代用し、各
帯域ごとのパワーを算出してもよい。In the above-described embodiment, the FFT (Fast Fourier Transform) processor 4 is used to calculate the power for each band in discriminating the unrestricted digital signal. Alternatively, the power for each band may be calculated.
【0051】[0051]
【発明の効果】本発明によれば、受信呼が非制限ディジ
タル呼および音声帯域呼のいずれであるかを、通話信号
を復号化して得られた信号の周波数特性に基づいて判別
することができるので、簡単な構成で、かつ通話信号の
みに基づいて呼判別を行えるようになる。According to the present invention, it is possible to determine whether a received call is an unrestricted digital call or a voice band call based on the frequency characteristics of a signal obtained by decoding a speech signal. Therefore, it is possible to perform a call determination based on only a call signal with a simple configuration.
【図1】本発明の一実施形態の機能ブロック図である。FIG. 1 is a functional block diagram of an embodiment of the present invention.
【図2】本発明の呼判別装置を適用した品質測定装置の
ブロック図である。FIG. 2 is a block diagram of a quality measuring device to which the call discriminating device of the present invention is applied.
【図3】本発明の動作を示したフローチャートである。FIG. 3 is a flowchart showing the operation of the present invention.
【図4】非制限ディジタル呼および音声帯域呼の復号化
後の周波数特性を示した図である。FIG. 4 is a diagram showing frequency characteristics after decoding of an unrestricted digital call and a voice band call.
【図5】低域にパワーが集中した音声帯域呼の周波数特
性を示した図である。FIG. 5 is a diagram showing frequency characteristics of a voice band call in which power is concentrated in a low frequency band.
【図6】音声帯域を周波数分析する際の帯域分割例を示
した図である。FIG. 6 is a diagram illustrating an example of band division at the time of frequency analysis of an audio band.
1…復号化器、2…バッファ、3…有音検出器、4…F
FT処理器、5−1…音声帯域外低域パワー計算器、5
−2…音声帯域外高域パワー計算器、6−1〜N…第1
〜N帯域パワー計算器、7…最大値検出器、11…フレ
ーム種別判定器、12…呼種別判定器、40…品質測定
装置、41…呼判別部、42…品質測定部DESCRIPTION OF SYMBOLS 1 ... Decoder, 2 ... Buffer, 3 ... Sound detector, 4 ... F
FT processor, 5-1 ... Low band power calculator out of voice band, 5
-2: High-band power calculator out of voice band, 6-1 to N: First
~ N band power calculator, 7 ... Maximum value detector, 11 ... Frame type determiner, 12 ... Call type determiner, 40 ... Quality measuring device, 41 ... Call determining unit, 42 ... Quality measuring unit
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04Q 1/46 G10L 3/00 551A // G10L 101:02 7/08 A 101:14 9/08 301A (72)発明者 小田 稔周 埼玉県上福岡市大原2−1−15 株式会社 ケイディディ研究所内 Fターム(参考) 5D015 AA06 CC03 CC04 DD03 HH23 KK01 5K064 AA03 AA07 BA08 BA19 BB12 DB08 DB26 5K101 LL03 PP06 UU11 UU16 9A001 BB06 EE04 HH16 HH34 JJ12 KK56 ──────────────────────────────────────────────────続 き Continued on the front page (51) Int.Cl. 7 Identification symbol FI Theme coat ゛ (Reference) H04Q 1/46 G10L 3/00 551A // G10L 101: 02 7/08 A 101: 14 9/08 301A ( 72) Inventor Minoru Oda 2-1-15 Ohara, Kamifukuoka-shi, Saitama F-term in K.D. Laboratory (reference) 5D015 AA06 CC03 CC04 DD03 HH23 KK01 5K064 AA03 AA07 BA08 BA19 BB12 DB08 DB26 5K101 LL03 PP06 UU11 UU16 9A001 BB06 EE04 HH16 HH34 JJ12 KK56
Claims (6)
伝送される呼の種別を判定する呼判別装置において、 通話信号を復号化する復号化手段と、 復号化された信号の周波数特性を検出する周波数特性検
出手段と、 前記検出された周波数特性に基づいて、当該通話信号が
非制限ディジタル呼および音声帯域呼のいずれであるか
を判別する呼判別手段とを含むことを特徴とする呼判別
装置。1. A call discriminating apparatus for determining a type of a call transmitted via a telephone line or an ISDN line, a decoding means for decoding a call signal, and a frequency for detecting a frequency characteristic of the decoded signal. A call discriminating apparatus comprising: a characteristic detecting unit; and a call discriminating unit that discriminates, based on the detected frequency characteristics, whether the call signal is an unrestricted digital call or a voice band call.
た信号の周波数特性をフレーム単位で検出し、 前記呼判別手段は、 前記検出された周波数特性に基づいて、各フレームが非
制限ディジタル呼のフレームであるか否かを判別する第
1判別部と、 非制限ディジタル呼のフレームと判別されたフレーム数
の割合が所定値よりも高いときに、これを非制限ディジ
タル呼と判別する第2判別部とを含むことを特徴とする
請求項1に記載の呼判別装置。2. The frequency characteristic detecting means detects a frequency characteristic of a decoded signal on a frame-by-frame basis, and the call determining means determines that each frame is an unrestricted digital call based on the detected frequency characteristic. A first discriminating unit for discriminating whether or not the frame is a non-restricted digital call, and a second discriminating unit for discriminating this as an unrestricted digital call when a ratio of the number of frames determined to be a non-restricted digital call is higher than a predetermined value. The call discriminating apparatus according to claim 1, further comprising a discriminating unit.
の帯域パワーを計算する音声帯域外パワー計算手段と、 音声帯域内の各帯域のパワーをそれぞれ計算する複数の
帯域内パワー計算手段と、 前記各帯域内パワー計算手段により計算された各帯域パ
ワーの最大値を検出する最大値検出手段とを具備し、 前記呼判別手段は、前記帯域外パワーが前記最大値に対
して有意に小さくないフレームを非制限ディジタル呼の
フレームと判定することを特徴とする請求項1または2
に記載の呼判別装置。3. The frequency characteristic detecting means includes: an out-of-band power calculating means for calculating a band power outside a voice band for each frame of a decoded speech signal; and a power of each band in a voice band. A plurality of in-band power calculating means for respectively calculating; and a maximum value detecting means for detecting a maximum value of each band power calculated by each of the in-band power calculating means. 3. The frame according to claim 1, wherein a frame whose power is not significantly smaller than said maximum value is determined as a frame of an unrestricted digital call.
A call discriminating apparatus according to claim 1.
帯域外の低域および高域の各帯域パワーをそれぞれ計算
することを特徴とする請求項3に記載の呼判別装置。4. The call discriminating apparatus according to claim 3, wherein said out-of-voice-band power calculating means calculates respective low-band and high-band powers outside the voice band.
単位で有音検出を行う有音検出手段をさらに具備し、 前記呼判別手段は、有音フレームに対してのみ呼判別を
行うことを特徴とする請求項1ないし4のいずれかに記
載の呼判別装置。5. A speech detection means for detecting speech in the decoded signal in frame units, wherein the call discrimination means performs call discrimination only for speech frames. The call discriminating apparatus according to any one of claims 1 to 4, wherein
の1次および2次の正規化自己相関を計算する自己相関
計算手段と、 前記各自己相関を所定の基準値と比較する比較手段とを
さらに具備し、 前記呼判別手段は、自己相関が所定の基準値よりも低い
フレームを非制限ディジタル呼のフレームと判定するこ
とを特徴とする請求項1ないし5のいずれかに記載の呼
判別装置。6. An autocorrelation calculating means for calculating a first-order and a second-order normalized autocorrelation for each frame of a decoded signal, and a comparing means for comparing each of the autocorrelations with a predetermined reference value. The call discriminating means according to any one of claims 1 to 5, wherein the call discriminating means determines a frame whose autocorrelation is lower than a predetermined reference value as a frame of an unrestricted digital call. apparatus.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000089327A JP2001285523A (en) | 2000-03-28 | 2000-03-28 | Call discriminating device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000089327A JP2001285523A (en) | 2000-03-28 | 2000-03-28 | Call discriminating device |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2001285523A true JP2001285523A (en) | 2001-10-12 |
Family
ID=18605098
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000089327A Pending JP2001285523A (en) | 2000-03-28 | 2000-03-28 | Call discriminating device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2001285523A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010277023A (en) * | 2009-06-01 | 2010-12-09 | Nippon Hoso Kyokai <Nhk> | Telephone voice section detector and program of the same |
CN105513589A (en) * | 2015-12-18 | 2016-04-20 | 百度在线网络技术(北京)有限公司 | Speech recognition method and speech recognition device |
JP2019184867A (en) * | 2018-04-12 | 2019-10-24 | 富士通株式会社 | Coded sound determination program, coded sound determination method, and coded sound determination device |
-
2000
- 2000-03-28 JP JP2000089327A patent/JP2001285523A/en active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010277023A (en) * | 2009-06-01 | 2010-12-09 | Nippon Hoso Kyokai <Nhk> | Telephone voice section detector and program of the same |
CN105513589A (en) * | 2015-12-18 | 2016-04-20 | 百度在线网络技术(北京)有限公司 | Speech recognition method and speech recognition device |
CN105513589B (en) * | 2015-12-18 | 2020-04-28 | 百度在线网络技术(北京)有限公司 | Speech recognition method and device |
JP2019184867A (en) * | 2018-04-12 | 2019-10-24 | 富士通株式会社 | Coded sound determination program, coded sound determination method, and coded sound determination device |
JP7056340B2 (en) | 2018-04-12 | 2022-04-19 | 富士通株式会社 | Coded sound determination program, coded sound determination method, and coded sound determination device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2450369C2 (en) | Multichannel audio signal encoding apparatus and method | |
US6188981B1 (en) | Method and apparatus for detecting voice activity in a speech signal | |
JP4955696B2 (en) | Echo detection | |
JPH0226901B2 (en) | ||
JP2009539132A (en) | Linear predictive coding of audio signals | |
WO1995012879A1 (en) | Discriminating between stationary and non-stationary signals | |
Sakhnov et al. | Approach for Energy-Based Voice Detector with Adaptive Scaling Factor. | |
KR20190111134A (en) | Methods and devices for improving call quality in noisy environments | |
US9984698B2 (en) | Optimized partial mixing of audio streams encoded by sub-band encoding | |
US7318030B2 (en) | Method and apparatus to perform voice activity detection | |
CN102137194A (en) | Call detection method and device | |
EP2198424B1 (en) | A method and an apparatus for processing a signal | |
EP0653091B1 (en) | Discriminating between stationary and non-stationary signals | |
CN112767955B (en) | Audio encoding method and device, storage medium and electronic equipment | |
SE470577B (en) | Method and apparatus for encoding and / or decoding background noise | |
JP2001285523A (en) | Call discriminating device | |
WO2021000724A1 (en) | Stereo coding method and device, and stereo decoding method and device | |
CN112951251A (en) | LC3 audio mixing method, device and storage medium | |
JP4113481B2 (en) | Voice quality objective evaluation apparatus and voice quality objective evaluation method | |
US10242683B2 (en) | Optimized mixing of audio streams encoded by sub-band encoding | |
US20240029745A1 (en) | Spatial audio parameter encoding and associated decoding | |
EP4396814A1 (en) | Silence descriptor using spatial parameters | |
Abareghi et al. | Improved ITU-P. 563 non-intrusive speech quality assessment method for covering VOIP conditions | |
Hatamian | Enhanced speech activity detection for mobile telephony | |
US20240021208A1 (en) | Method and device for classification of uncorrelated stereo content, cross-talk detection, and stereo mode selection in a sound codec |