KR100347752B1 - Apparatus and Method for objective speech quality measure in a Mobile Communication System - Google Patents

Apparatus and Method for objective speech quality measure in a Mobile Communication System Download PDF

Info

Publication number
KR100347752B1
KR100347752B1 KR1020000003478A KR20000003478A KR100347752B1 KR 100347752 B1 KR100347752 B1 KR 100347752B1 KR 1020000003478 A KR1020000003478 A KR 1020000003478A KR 20000003478 A KR20000003478 A KR 20000003478A KR 100347752 B1 KR100347752 B1 KR 100347752B1
Authority
KR
South Korea
Prior art keywords
bark
signal
sound quality
spectrum
speech
Prior art date
Application number
KR1020000003478A
Other languages
Korean (ko)
Other versions
KR20010076069A (en
Inventor
윤대희
윤종진
박상욱
Original Assignee
주식회사 하이닉스반도체
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 하이닉스반도체 filed Critical 주식회사 하이닉스반도체
Priority to KR1020000003478A priority Critical patent/KR100347752B1/en
Publication of KR20010076069A publication Critical patent/KR20010076069A/en
Application granted granted Critical
Publication of KR100347752B1 publication Critical patent/KR100347752B1/en

Links

Classifications

    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63BAPPARATUS FOR PHYSICAL TRAINING, GYMNASTICS, SWIMMING, CLIMBING, OR FENCING; BALL GAMES; TRAINING EQUIPMENT
    • A63B53/00Golf clubs
    • A63B53/04Heads
    • A63B53/06Heads adjustable
    • A63B53/065Heads adjustable for putters
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63BAPPARATUS FOR PHYSICAL TRAINING, GYMNASTICS, SWIMMING, CLIMBING, OR FENCING; BALL GAMES; TRAINING EQUIPMENT
    • A63B53/00Golf clubs
    • A63B53/007Putters
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63BAPPARATUS FOR PHYSICAL TRAINING, GYMNASTICS, SWIMMING, CLIMBING, OR FENCING; BALL GAMES; TRAINING EQUIPMENT
    • A63B53/00Golf clubs
    • A63B53/04Heads
    • A63B53/0441Heads with visual indicators for aligning the golf club
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63BAPPARATUS FOR PHYSICAL TRAINING, GYMNASTICS, SWIMMING, CLIMBING, OR FENCING; BALL GAMES; TRAINING EQUIPMENT
    • A63B60/00Details or accessories of golf clubs, bats, rackets or the like
    • A63B60/02Ballast means for adjusting the centre of mass
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63BAPPARATUS FOR PHYSICAL TRAINING, GYMNASTICS, SWIMMING, CLIMBING, OR FENCING; BALL GAMES; TRAINING EQUIPMENT
    • A63B53/00Golf clubs
    • A63B53/04Heads
    • A63B2053/0491Heads with added weights, e.g. changeable, replaceable
    • A63B2053/0495Heads with added weights, e.g. changeable, replaceable moving on impact, slidable, spring or otherwise elastically biased

Abstract

본 발명은 인간의 청각적 특징을 반영하여 바크 코히어런스 함수(Bark Coherence Function)를 정의하고, 이를 이용하여 주관적 음질과 상관 관계가 높은 객관적 음질 평가가 가능토록 한 이동통신 시스템에서 객관적 음질 평가장치 및 그 방법에 관한 것으로서, 이러한 본 발명은, 셀룰러 시스템으로 입력되는 음성 신호의 바크 스펙트럼을 산출하고, 상기 셀룰러 시스템에서 출력되는 음성 신호의 바크 스펙트럼을 산출하며, 상기 입력 및 출력 음성 신호의 상호 바크 스펙트럼을 산출한다. 그런 후 산출한 두 개의 바크 스펙트럼과 상호 바크 스펙트럼을 바크 코히어런스 함수에 대입하여 바크 코히어런스 함수를 계산하고, 계산된 결과치를 바크 잡음 대 신호비로 변환하여 얻어진 결과치를 객관적 음질 평가치로 출력한다.The present invention defines the Bark Coherence Function by reflecting the human auditory characteristics, and by using this objective objective sound quality evaluation device in the mobile communication system to enable the objective sound quality evaluation having a high correlation with the subjective sound quality And a method thereof, wherein the present invention calculates a bark spectrum of a voice signal input into a cellular system, calculates a bark spectrum of a voice signal output from the cellular system, and mutual barks of the input and output voice signals. Calculate the spectrum. Then, Bark coherence function is calculated by substituting the calculated Bark and Cross Bark spectra into the Bark coherence function, and the calculated result is converted into the Bark noise-to-signal ratio. .

Description

이동통신 시스템에서 객관적 음질 평가 장치 및 그 방법{Apparatus and Method for objective speech quality measure in a Mobile Communication System}Apparatus and Method for objective speech quality measure in a Mobile Communication System}

본 발명은 이동통신 시스템에서 객관적 음질 평가(objective speech quality measure)에 관한 것으로, 특히 인간의 청각적 특징을 반영하여 바크 코히어런스 함수(Bark Coherence Function)를 정의하고, 이를 이용하여 주관적 음질과 상관 관계가 높은 객관적 음질 평가가 가능토록 한 이동통신 시스템에서 객관적 음질 평가장치 및 그 방법에 관한 것이다.TECHNICAL FIELD The present invention relates to an objective speech quality measure in a mobile communication system. In particular, the present invention defines a Bark Coherence Function reflecting human auditory characteristics and correlates subjective sound quality with the subject. The present invention relates to an objective sound quality evaluation apparatus and a method in a mobile communication system capable of highly objective sound quality evaluation.

시간과 장소에 구애받지 않고 자유로운 통신을 하고자하는 인간의 욕구에 부합하여 최근 몇 년간 이동 전화가 널리 보편화되었다. 이러한 이동 전화의 품질을 결정하는 가장 중요한 요소는 통화 성공률과 통화 품질이며, 특히 통화 품질, 즉 음질은 사용자의 청각에 따른 주관에 의해 결정된다. 그러므로 이동 전화망의 설치 및 유지, 보수를 위해서는 지속적인 음질 평가가 반드시 필요하다.In line with the human desire to communicate freely regardless of time and place, mobile phones have become widespread in recent years. The most important factors for determining the quality of such a mobile phone are the call success rate and the call quality, and in particular, the call quality, that is, the sound quality, is determined by subjectivity according to the user's hearing. Therefore, continuous sound quality evaluation is essential for the installation, maintenance and repair of mobile telephone networks.

현재 이동 전화망을 통해 전송되는 음성 신호는 음성 부호화기로 압축된 디지털 신호들로 표현되며, 이 신호들이 재생되는 음성 신호의 음질에서 차지하는 중요도는 크게 차이가 있다. 따라서 이동 전화망의 음질은 음성 신호의 특성을 고려한 방법으로 평가하여야 한다.Currently, the voice signals transmitted through the mobile telephone network are represented as digital signals compressed by the voice coder, and the importance of these signals in the sound quality of the reproduced voice signals varies greatly. Therefore, the sound quality of mobile telephone network should be evaluated by considering the characteristics of voice signal.

음질 평가는 기본적으로 여러 사용자의 반복 청취실험을 통한 주관적 음질 평가 방법에 의해 이루어질 수 있다. 그러나 이 방법은 이용자의 체감 음질과 직접적인 관계가 있다는 장점에도 불구하고, 다양한 환경에서 반복해서 수행하기에는 많은 시간과 노력 및 비용이 소모되므로 적합하지 않다. 따라서 주관적 음질과 상관 관계가 높은 객관적 척도로 주관적 음질을 예측하는 것이 바람직하다.The sound quality evaluation may be basically performed by a subjective sound quality evaluation method through repeated listening experiments of various users. However, this method is not suitable because it takes a lot of time, effort, and cost to perform it repeatedly in various environments despite the advantage that it is directly related to the user's haptic sound quality. Therefore, it is desirable to predict the subjective sound quality on an objective scale having a high correlation with the subjective sound quality.

한편, 음질 평가는 평가하고자 하는 음성 신호를 음질 평가 실험자가 직접 듣고 주관적 판단에 따라 음질을 평가하는 주관적 음질 평가 방법과 계산에 의한 원 음성 신호와 왜곡 음성 신호의 대수적 차이를 이용하는 객관적 음질 평가 방법이 있다.On the other hand, sound quality evaluation includes a subjective sound quality evaluation method in which a sound quality evaluation experimenter directly listens to a sound signal to be evaluated and evaluates sound quality according to subjective judgment, and an objective sound quality evaluation method using an algebraic difference between the original sound signal and the distorted sound signal by calculation. have.

먼저, 주관적 음질 평가 방법은, 양방향 청취에 의한 대화식 평가법과 단방향 청취에 의한 청취법으로 대별된다. 이중 대화식 평가법은 완벽한 통신 시스템이 완성된 단계에서만이 이루어질 수 있으며, 음성 부호화기의 개발 단계나 이동 전화망의 설치 단계 등에서는 적용이 불가능하다. 따라서 수행이 용이한 청취식 평가법이 보편적으로 사용된다.First, the subjective sound quality evaluation method is roughly classified into an interactive evaluation method by two-way listening and a listening method by one-way listening. The dual interactive evaluation method can be performed only when the complete communication system is completed, and cannot be applied during the development stage of the speech coder or the installation stage of the mobile telephone network. Therefore, audible evaluation that is easy to perform is commonly used.

청취식 평가법에는 왜곡된 음성 신호만을 듣고 평가를 내리는 절대 음질 평가법(ACR : Absolute Category Rating), 원 음성 신호와 왜곡된 음성 신호를 듣고왜곡 정도를 평가하는 왜곡 음질 평가법(DCR : Degradation Category Rating)과 두 개의 왜곡된 음성 신호를 듣고 비교하는 비교 음질 평가법(CCR : Comparison Category Rating)이 있다.Listening evaluation methods include Absolute Category Rating (ACR), which listens only to distorted speech signals and evaluates them, Degradation Category Rating (DCR), which listens to the original and distorted speech signals and evaluates the degree of distortion. There is a comparison category rating (CCR) that listens and compares two distorted speech signals.

그 중에서 실제 전화 이용 환경과 가장 유사하게 비교 음성 신호 없이 음질 평가를 실시하는 절대 음질 평가법은, MOS(Mean Opinion Score) 평가방법을 이용한다. 상기 MOS 평가방법은 실험자가 왜곡된 음성 신호를 들은 후 음성 신호의 왜곡 정도를 아래의 [표1]과 같이 5단계로 평가하는 방법이다.Among them, the MOS (Mean Opinion Score) evaluation method is used for the absolute sound quality evaluation method which evaluates the sound quality without the comparison voice signal most similarly to the actual telephone usage environment. The MOS evaluation method is a method in which the experimenter hears the distorted speech signal and evaluates the distortion degree of the speech signal in five steps as shown in [Table 1] below.

MOS 평가 등급MOS rating RateRate Speech QualitySpeech Quality Level of DistortionLevel of Distortion 55 ExcellentExcellent ImperceptibleImperceptible 44 GoodGood Just perceptible but not annoyingJust perceptible but not annoying 33 FairFair Perceptible and slightlyPerceptible and slightly 22 PoorPoor Annoying but not objetionableAnnoying but not objetionable 1One BadBad Very annoying and objectionableVery annoying and objectionable

그러나 이러한 주관적 음질 평가 방법은 주지한 바와 같이, 사람에 의해서 직접적으로 평가되므로 실제 사용자의 체감 음질을 가장 잘 표현할 수 있다는 장점이 있는 반면에, 시간과 비용이 많이 소요되는 단점이 있다.However, as the subjective sound quality evaluation method is well-known, it is directly assessed by a person, and thus has the advantage of expressing the actual sound quality of a real user best, but it has a disadvantage of requiring time and cost.

이러한 주관적 음질 평가 방법의 단점을 개선하기 위해서, 근래 각광받고 있는 음질 평가 방법이 객관적 음질 평가 방법이다.In order to improve the shortcomings of the subjective sound quality evaluation method, the sound quality evaluation method that has been in the spotlight recently is an objective sound quality evaluation method.

객관적 음질 평가 방법은, 평가가 이루어지는 영역에 따라 시간 영역에서의 평가, 주파수 영역에서의 평가 및 심리 음향 영역에서의 평가로 분류할 수 있다.The objective sound quality evaluation method can be classified into an evaluation in the time domain, an evaluation in the frequency domain, and an evaluation in the psychoacoustic domain according to the evaluation region.

먼저 시간 영역에서의 객관적 음질 평가는 신호 대 잡음비(SNR : Signal toNoise Ratio), 구간별 신호대 잡음비(SegSNR : Segmental SNR)가 있다. 이 방법들은 원 음성 신호와 왜곡된 음성 신호간의 자승 평균 오차를 이용하는 방법으로, 32Kbps이상의 전송률을 갖는 파형 부호화기의 성능 평가에 적합하다.First, objective sound quality evaluation in the time domain includes signal-to-noise ratio (SNR) and segment-to-noise ratio (SegSNR). These methods use the squared mean error between the original speech signal and the distorted speech signal, and are suitable for the performance evaluation of waveform encoders having a bit rate of 32 Kbps or more.

주파수 영역에서의 객관적 음질 평가는 스펙트랄 거리(SD : Spectral Distance), 대수적 스펙트랄 거리(LSD : Log Spectral Distance) 등이 있다. 이러한 방법 중 LPC-CD는 음성 신호의 포락선 성분의 차이를 계산하며, 16 ~ 32 Kbps의 전송률을 갖는 음성 부호화기의 성능 평가에 적합하다.Objective sound quality evaluation in the frequency domain includes spectral distance (SD) and algebraic spectral distance (LSD). Among these methods, LPC-CD calculates the difference between the envelope components of speech signals and is suitable for the performance evaluation of speech coders with 16 to 32 Kbps data rates.

심리 음향 영역에서의 객관적 음질 평가는 원 음성 신호와 왜곡된 음성 신호에 인간의 청각적 특성을 반영한 심리 음향 모델을 이용하여 두 음성 신호의 왜곡정도를 측정하는 방법으로, BSD(Bark Spectral Distortion), PLP-CD(Perceptual Linear Predictive-Cepstum Distance), MNB(Measuring Normalizing Blocks), PSQM(Perceptual Speech Quality Measure) 등이 있다. 특히 PSQM과 MNB는 ITU-T의 권고안으로 PSQM은 4Kbps 이상의 음성 부호화기의 성능 평가에, MNB는 비트 에러, 프레임 삭제가 발생하는 음성 부호화기의 성능 평가에 적합하다.In the psychoacoustic field, objective sound quality evaluation is a method of measuring distortion of two speech signals by using a psychoacoustic model that reflects the human auditory characteristics of the original speech signal and the distorted speech signal. BSD (Bark Spectral Distortion), Perceptual Linear Predictive-Cepstum Distance (PLP-CD), Measuring Normalizing Blocks (NBN), Perceptual Speech Quality Measure (PSQM), and the like. In particular, PSQM and MNB are recommended by ITU-T, and PSQM is suitable for performance evaluation of speech coders of 4Kbps or more, and MNB is suitable for performance evaluation of speech coders with bit errors and frame deletions.

상기 심리 음향 영역에서의 객관적 음질 평가 방법중 PSQM, MNB를 좀 더 구체적으로 살펴 보면, ITU-T(International Telecommunication Union - Teeelecommunication)에서는 개관적 음질 평가법으로 Rec.P.861에서 PSQM을, Rec.P.861 Appendix Ⅱ에서 MNB를 권고하고 있다. 상기 PSQM은 4kbps이상 CELPCode Excited Linear Prediction) 음성 부호화기의 객관적 음질 평가에 적당하며, MNB는 음성 부호화기 음성 패킷의 프레임 삭제와 ATM(Asynchronous Transfer Mode)의 셀손실 등이 발생할 때 적당하다. PSQM과 MNB는 원음과 왜곡음 스펙트럼을 인간의 청각적 특성을 이용하여 심리 음향 영역으로 천이 시킨 후 그 차이로서 음성이 왜곡된 정도를 나타낸다.PSQM, MNB of the objective sound quality evaluation method in the psychoacoustic domain in more detail, ITU-T (International Telecommunication Union-Teeelecommunication) In PSCM in Rec.P.861 as an objective sound quality evaluation method, Rec.P .861 Appendix II recommends MNB. The PSQM is suitable for the objective sound quality evaluation of the CELPCode Excited Linear Prediction (CLP) speech coder of 4 kbps or more, and the MNB is suitable for frame deletion of the speech coder speech packet and cell loss of Asynchronous Transfer Mode (ATM). PSQM and MNB transform the original and distortion spectrums into the psychoacoustic region by using the human auditory characteristics.

두 방법은 모두 음성 부호화기를 대상으로 개발되었으므로 실제 이동 전화나 패킷 음성 전송 시스템의 음질을 평가할 때 성능이 저하된다. 실제 음성 전달 시스템은 디지털 시스템과 더불어 아날로그 시스템으로 이루어진다. 유선 전화 등의 아날로그 시스템은 선형왜곡을 일으키는데, 이것은 주관적 음질에는 영향을 거의 주지 않으나, 객관적 음질에는 영향을 미쳐 객관적 음질평가 시스템의 성능을 저하시킨다.Both methods have been developed for speech coders, so performance is degraded when evaluating the sound quality of a real mobile phone or packet voice transmission system. The actual voice delivery system consists of an analog system in addition to a digital system. Analog systems, such as landline telephones, cause linear distortion, which has little effect on subjective sound quality, but affects the objective sound quality and degrades the performance of the objective sound quality evaluation system.

첨부한 도면 도 1은 CDMA PCS 시스템을 통과한 음성의 MOS와 PSQM의 분포를 나타낸 도면으로, 도 1a는 MOS 분포도이고, 도 1b는 PSQM 분포도이다.1 is a diagram illustrating a distribution of MOS and PSQM of speech that has passed through a CDMA PCS system. FIG. 1A is a MOS distribution diagram, and FIG. 1B is a PSQM distribution diagram.

각 음성 데이터는 A군과 B군의 두 군으로 나뉘어 지는데, 이 두 군중 A 군은 사설 교환기를 거쳐 저주파 영역이 약간 감소되는 특성을 가진 음성들로 이루어져 있다. 두 군의 MOS 분포도가 서로 비슷함으로 보아 서로 통과 대역이 다른 아날로그 시스템을 통과한 음성들이 비슷한 음질을 지니고 있음을 알 수 있다.Each voice data is divided into two groups, Group A and Group B. These two crowds, Group A, are composed of voices with a slightly reduced low frequency range through a private exchange. The two groups have similar MOS distributions, indicating that voices passing through analog systems with different passbands have similar sound quality.

그러나 주관적 음질과 상관 관계가 높다고 알려진 객관적 음질 평가 척도인 PSQM은 스펙트럼의 차이를 구하므로 저주파 영역에서 스펙트럼 거리가 많아져, 서로 다른 분포를 보인다. A군의 데이터로 회귀분석을 하여 B군의 데이터를 평가한다면 일치된 결과를 얻을 수 없다. 예를 들어, A군에서 PSQM값이 4.5로 비교적 작아 음질이 양호하다고 생각되는 음성을 B군에서 훈련된 회귀 함수로 주관적 음질을 예측하게 되면, B군에서는 4.5의 값이 음질이 나쁜 영역에 속하게 되므로 잘못된 예측을 하게 된다.However, the PSQM, an objective sound quality evaluation measure known to have a high correlation with subjective sound quality, obtains a difference in spectrum, and thus has a different spectral distance in the low frequency region, resulting in a different distribution. If you evaluate the data in group B by regression analysis with group A data, you will not get a consistent result. For example, in group A, if the PSQM value is 4.5 and relatively low in voice quality, the subjective sound quality is predicted by the regression function trained in group B. In group B, the value of 4.5 belongs to the region with poor sound quality. As a result, the prediction is wrong.

따라서 본 발명은 상기와 같은 종래 객관적 음질 평가시 발생하는 제반 문제점을 해결하기 위해서 제안된 것으로서,Therefore, the present invention is proposed to solve all the problems that occur in the conventional objective sound quality evaluation as described above,

본 발명의 목적은, 인간의 청각적 특징을 반영하여 바크 코히어런스 함수(Bark Coherence Function)를 정의하고, 이를 이용하여 주관적 음질과 상관 관계가 높은 객관적 음질 평가가 가능토록 한 이동통신 시스템에서 객관적 음질 평가장치 및 그 방법을 제공하는 데 있다.An object of the present invention is to define the Bark Coherence Function by reflecting the human auditory characteristics, and to use it to objectively evaluate the objective sound quality having a high correlation with the subjective sound quality. The present invention provides a sound quality evaluation device and method thereof.

상기와 같은 목적을 달성하기 위한 본 발명은,The present invention for achieving the above object,

아날로그 시스템에서 발생하는 선형 왜곡의 영향을 극복하기 위하여 바크 코히어런스 함수(BCF : Bark Coherence Function)를 정의하고, 셀룰러 시스템의 입력 신호와 출력 신호 각각에 대해서 바크 스펙트럼과 상호 바크 스펙트럼을 구한 후, 상기 바크 코히어런스 함수에 상기 바크 스펙트럼과 상호 바크 스펙트럼을 적용하여 바크 코히어런스 함수를 구한다. 그런 후 얻어진 결과치를 바크 신호 대 잡음비로 변환하여 음질 평가치를 산출함으로써, 선형왜곡의 영향을 극복할 수 있으며, 주관적 음질과 상관 관계가 높은 객관적 음질 평가가 가능하다.To overcome the effects of linear distortion in analog systems, we define a Bark Coherence Function (BCF), calculate the Bark spectrum and the cross-bark spectrum for each of the input and output signals of the cellular system. The Bark coherence function is obtained by applying the Bark spectrum and the mutual Bark spectrum to the Bark coherence function. Then, the resultant value is converted to the Bark signal-to-noise ratio to calculate the sound quality evaluation value, thereby overcoming the influence of linear distortion, and objective sound quality evaluation having a high correlation with the subjective sound quality is possible.

도 1은 종래 CDMA PCS 시스템을 통과한 음성의 MOS와 PSQM의 분포를 나타낸 도면으로서, 도 1a는 MOS의 분포도이고, 도 1b는 PSQM의 분포도이며,1 is a diagram illustrating the distribution of MOS and PSQM of voice that has passed through a conventional CDMA PCS system, FIG. 1A is a distribution diagram of MOS, and FIG. 1B is a distribution diagram of PSQM.

도 2는 본 발명에 의한 이동통신 시스템에서 객관적 음질 평가 장치를 보인 블록도이고,2 is a block diagram showing an objective sound quality evaluation apparatus in a mobile communication system according to the present invention,

도 3은 본 발명에 의한 이동통신 시스템에서 객관적 음질 평가 방법을 보인 흐름도이고,3 is a flowchart illustrating an objective sound quality evaluation method in a mobile communication system according to the present invention;

도 4는 도 3의 음성 신호의 바크 스펙트럼 산출과정을 보인 흐름도이고,4 is a flowchart illustrating a bark spectrum calculation process of the audio signal of FIG. 3;

도 5는 도 3의 음성 신호의 상호 바크 스펙트럼 산출과정을 보인 흐름도이고,5 is a flowchart illustrating a process of calculating a cross bark spectrum of the voice signal of FIG. 3;

도 6은 본 발명에 적용된 심리 가중 필터의 특성도이고,6 is a characteristic diagram of a psychological weighting filter applied to the present invention,

도 7은 본 발명에 의한 BCF 분포와 종래 MOS 분포를 비교한 도면으로써, 도 7a는 종래 MOS 분포도이고, 도 7b는 본 발명에 의한 BCF 분포도이고,7 is a view comparing the BCF distribution according to the present invention and the conventional MOS distribution, Figure 7a is a conventional MOS distribution, Figure 7b is a BCF distribution according to the present invention,

도 8은 종래 객관적 음질 평가 방법에 적용된 PSQM의 상관 계수와 본 발명에 의한 BCF의 상관 계수를 비교한 도면이다.8 is a diagram comparing the correlation coefficient of the PSQM applied to the conventional objective sound quality evaluation method and the correlation coefficient of the BCF according to the present invention.

<도면의 주요 부분에 대한 부호의 설명><Explanation of symbols for the main parts of the drawings>

10 : 셀룰러 시스템10: cellular system

20, 30 : 제 1 및 제 2 바크 스펙트럼 산출부20, 30: first and second bark spectrum calculation unit

40 : 상호 바크 스펙트럼 산출부40: mutual bark spectrum calculation unit

50 : 바크 코히어런스 함수 계산부50: Bark coherence function calculation unit

60 : 바크 잡음 대 신호비 계산부60: Bark noise to signal ratio calculation unit

이하 상기와 같은 기술적 사상에 따른 본 발명의 바람직한 실시 예를 첨부한 도면에 의거 상세히 설명하면 다음과 같다.Hereinafter, a preferred embodiment of the present invention according to the technical spirit as described above will be described in detail with reference to the accompanying drawings.

일반적으로, Magnitude-Squared Coherence(MSC)는 주파수 영역에서 두 신호간의 상관 관계를 나타내며 아래의 [수학식1]과 같이 정의된다.In general, Magnitude-Squared Coherence (MSC) represents a correlation between two signals in the frequency domain and is defined as in Equation 1 below.

여기서 Sxy(f)는 입력 음성 신호 x(n)과 출력 음성 신호 y(n) 사이의 상호 스펙트럼, Sxx(f)와 Syy(f)는 각각 입력 음성 신호 x(n)과 출력 음성 신호 y(n)의 오토 스펙트럼이다. 잡음이 없는 이상적인 환경에서는 1의 값을 가지며, 반대로 잡음만이 존재하는 경우 MSC는 0값을 갖는다. 이러한 MSC는 객관적 음질 평가, 시스템 확인 및 응답, 전달 경로 추정, 지연 측정 등의 다양한 분야에 사용된다.Where S xy (f) is the cross spectrum between the input speech signal x (n) and the output speech signal y (n), and S xx (f) and S yy (f) are the input speech signal x (n) and output speech, respectively. Auto spectrum of the signal y (n). In an ideal environment without noise Has a value of 1, on the contrary, if there is only noise, the MSC has a value of zero. These MSCs are used in various fields such as objective sound quality evaluation, system identification and response, propagation path estimation, and delay measurement.

심리 음향을 사용하면 물리적인 소리의 세기와는 달리 인간이 귀에서 직접 느끼는 소리 영역에서 MSC를 사용할 수 있다. 심리 음향 영역에서 정의하는 MSC인 BCF는 인간의 심리 음향 특성인, 임계 대역 스펙트럼 분해능(Critical-band spectral resolution), 등감 곡선 보정(Equal-loudness preemphasis), 주관적 소리세기(Intensity-loudness power law) 특성을 이용한다.Psychoacoustics allows you to use MSC in the sound domain where the human feels directly in the ear, unlike the strength of physical sounds. BCF, an MSC defined in the psychoacoustic domain, is characterized by the critical psycho-acoustic characteristics of critical-band spectral resolution, equal-loudness preemphasis, and intensity-loudness power law. Use

즉, 잡음에 의해서 톤이 마스킹되는 마스킹 특성을 반영한 것이 임계대역 스펙트럼 분해능이다. 임계 대역 필터는 비선형적인 바크 주파수에 따라 로그 스케일로 증가하는 통과 대역 폭을 갖는 여러 개의 필터로 이루어진다. 인간의 귀는 각 주파수에 따라 민감도가 틀리다. 즉, 인간의 주파수 분해능은 고주파 영역 보다 저주파 영역에 민감하다. 예를 들어, 100Hz의 톤이 1000Hz톤과 같은 크기로 들리려면 35dB 더 큰 세기(intensity)를 가져야 한다. 이러한 특성은 등감 곡선으로 이미 잘 알려져 있으며 이를 이용한 것이 상기 등감 곡선 보정이다. 등감 곡선 보정후 소리의 세기는 폰(Phone)으로 표현되는 데, 이는 1Khz의 톤과 같은 크기로 들리도록 보정되었음을 의미한다. 그리고 주관적 소리 보정은 청각 세기의 비선형성을 반영한다. 이것은 두 배의 크기로 느끼기 위해 필요한 소리 세기가 폰 단위에서 항상 일정하지 않고, 세기 레벨(loudness level)에 따라 달라짐을 나타낸다. 폰 단위는 실제적인 주관적 세기 레벨을 의미하는 손(sone) 단위로 변환되어진다. 이러한 세가지 특성을 이용하여 음성의 스펙트럼을 변환시킨 것이 바크 스펙트럼이다.That is, the critical band spectral resolution reflects the masking characteristic of the tone masked by noise. The threshold band filter consists of several filters with a passband width that increases on a logarithmic scale with a nonlinear Bark frequency. The human ear has different sensitivity at each frequency. In other words, human frequency resolution is more sensitive to low frequency region than high frequency region. For example, a 100 Hz tone must have 35 dB greater intensity to sound the same as a 1000 Hz tone. This property is already well known as the equal curve and using this is the equal curve correction. The intensity of the sound after the equalization curve is expressed as a phone, which means that the sound is corrected to be the same size as the tone of 1 kHz. Subjective sound correction reflects the nonlinearity of auditory intensity. This indicates that the loudness needed to feel doubled is not always constant at the phone level, but depends on the loudness level. The pawn unit is converted into a unit of son, which represents the actual subjective intensity level. The Bark spectrum is the transformation of the spectrum of speech using these three characteristics.

본 발명은 상기와 같은 일반적인 바크 스펙트럼 함수를 정의하고 이를 이용하여 객관적 음질 평가를 위한 음질 평가치를 추출한다.The present invention defines the general Bark spectral function as described above and extracts the sound quality evaluation value for the objective sound quality evaluation.

<실시예1>Example 1

첨부한 도면 도 2는 본 발명에 의한 객관적 음질 평가 장치의 구성을 보인 블록도이다.2 is a block diagram showing the configuration of an objective sound quality evaluation apparatus according to the present invention.

여기서, 참조부호 10은 실험용 셀룰러 시스템을 나타내고, 참조부호 20은 상기 셀룰러 시스템(10)에 입력되는 음성 신호의 바크 스펙트럼을 구하는 제 1 바크 스펙트럼 산출부를 나타내고, 참조부호 30은 상기 셀룰러 시스템(10)에서 출력되는 음성 신호의 바크 스펙트럼을 구하는 제 2 바크 스펙트럼 산출부를 나타내고, 참조부호 40은 상기 셀룰러 시스템(10)으로 입력되는 음성 신호와 상기 셀룰러 시스템(10)에서 출력되는 음성 신호의 상호 바크 스펙트럼을 구하는 상호 바크 스펙트럼 산출부를 나타내며, 참조부호 50은 상기 제 1 및 제2 바크 스펙트럼 산출부(20)(30)에서 얻어지는 각각의 바크 스펙트럼과 상기 상호 바크 스펙트럼 산출부(40)에서 얻어지는 상호 바크 스펙트럼을 바크 코히어런스 함수에 대입하여 바크 코히어런스 함수를 계산하는 바크 코히어런스 함수 계산부를 나타내고, 참조부호 60은 상기 바크 코히어런스 함수 계산부(50)에서 출력되는 신호를 바크 잡음 대 신호비로 변환하여 그 결과치를 객관적 음질 평가치로 출력하는 바크 잡음 대 신호비 계산부를 나타낸다.Here, reference numeral 10 denotes an experimental cellular system, reference numeral 20 denotes a first bark spectrum calculator for obtaining a bark spectrum of an audio signal input to the cellular system 10, and reference numeral 30 denotes the cellular system 10. Represents a second Bark spectrum calculation unit for calculating the Bark spectrum of the audio signal output from the reference signal, and reference numeral 40 denotes a cross bark spectrum of the voice signal input to the cellular system 10 and the voice signal output from the cellular system 10. A cross bark spectrum calculation unit to be obtained is represented, and reference numeral 50 denotes each bark spectrum obtained from the first and second bark spectrum calculation units 20 and 30 and the cross bark spectrum obtained from the cross bark spectrum calculation unit 40. Bark Coher to compute the Bark Coherence function by assigning it to the Bark Coherence function A reference function calculation unit 60 denotes a bark noise-to-signal ratio calculation unit for converting the signal output from the bark coherence function calculation unit 50 into a bark noise-to-signal ratio and outputting the result as an objective sound quality evaluation value. .

이와 같이 구성되는 본 발명에 의한 이동통신 시스템에서 객관적 음질 평가 장치는, 먼저 셀룰러 시스템(10)은 입력되는 음성 신호(x(n))를 일반적인 음성 처리 방법과 동일한 방법으로 처리한 후 출력하게 된다. 여기서 출력되는 음성 신호(y(n))는 선형 왜곡된 음성 신호이다.In the mobile communication system according to the present invention configured as described above, the objective sound quality evaluation device first outputs the cellular system 10 after processing the input voice signal x (n) in the same manner as a general voice processing method. . The voice signal y (n) output here is a linearly distorted voice signal.

다음으로, 제 1 바크 스펙트럼 산출부(20)는 상기 셀룰러 시스템(10)으로 입력되는 음성 신호(x(n))의 바크 스펙트럼을 산출한다. 즉, 입력 신호에 윈도우 함수를 씌우고, 그 윈도우 함수내의 신호를 고속 푸리에 변환(FFT)하고, 그 후 음성의 파워 스펙트럼을 구한다. 그리고 구해진 파워 스펙트럼을 심리 가중 필터로 필터링한다. 여기서 심리 가중 필터링은 도 6과 같은 주파수 영역의 심리 가중 필터의 가중 합으로 구한다. 그리고 심리 가중 필터는 인간의 심리 음향 특성중 임계 대역 스펙트럼 분해능과 등감 곡선 보정의 특성을 고려한 것이다. 이렇게 해서 얻어지는 신호의 주관적 소리 세기를 보정한 후 그 결과치를 입력 음성 신호에 대한 바크 스펙트럼(Lxx(i))으로 출력한다. 여기서 계산 결과인 바크 스펙트럼은 인간의 청각영역에서 느끼는 음성의 스펙트럼을 의미한다.Next, the first bark spectrum calculator 20 calculates a bark spectrum of the voice signal x (n) input to the cellular system 10. That is, a window function is put on the input signal, fast Fourier transform (FFT) of the signal in the window function, and then the power power spectrum of the voice is obtained. The obtained power spectrum is then filtered using a psychometric weighting filter. Here, the psychological weighting filtering is obtained by the weighted sum of the psychological weighting filters in the frequency domain as shown in FIG. The psychometric weighting filter takes into account the characteristics of critical band spectral resolution and equality curve correction among human psychoacoustic characteristics. The subjective loudness of the signal thus obtained is corrected and then the result is output as the bark spectrum L xx (i) for the input speech signal. The Bark spectrum, which is the result of the calculation, refers to the spectrum of speech felt in the human auditory region.

아울러, 제 2 바크 스펙트럼 산출부(30)는 상기 셀룰러 시스템(10)에서 출력되는 음성 신호(y(n))의 바크 스펙트럼을 산출한다. 즉, 출력 음성 신호에 윈도우 함수를 씌우고, 그 윈도우 함수내의 신호를 고속 푸리에 변환(FFT)하고, 그 후 음성의 파워 스펙트럼을 구한다. 그리고 구해진 파워 스펙트럼을 심리 가중 필터로 필터링한다. 그렇게 해서 얻어지는 신호의 주관적 소리 세기를 보정한 후 그 결과치를 출력 음성 신호에 대한 바크 스펙트럼(Lyy(i))으로 출력한다.In addition, the second bark spectrum calculator 30 calculates a bark spectrum of the voice signal y (n) output from the cellular system 10. That is, a window function is put on the output speech signal, fast Fourier transform (FFT) of the signal in the window function, and then the power spectrum of the speech is obtained. The obtained power spectrum is then filtered using a psychometric weighting filter. The subjective loudness of the signal thus obtained is corrected and then the result is output as the bark spectrum L yy (i) for the output speech signal.

또한, 상호 바크 스펙트럼 산출부(40)는 상기 입력 음성 신호(x(n))와 출력 음성 신호(y(n))의 상호 바크 스펙트럼을 산출한다. 즉, 두 입력 신호[x(n),y(n)]에 각각 윈도우 함수를 씌우고, 그 윈도우 함수내의 신호를 각각 고속 푸리에 변환한다. 그런 후 두 음성 신호의 상호 파워 스펙트럼을 구한다. 이후 얻어진 신호를 심리 가중 필터로 필터링하고, 이후 필터링된 신호의 주관적 소리 세기를 보정한 후 그 결과치를 상호 바크 스펙트럼(Lxy(i))으로 출력한다.In addition, the mutual bark spectrum calculator 40 calculates the mutual bark spectrum of the input voice signal x (n) and the output voice signal y (n). That is, a window function is applied to the two input signals x (n) and y (n), respectively, and the signals in the window function are fast Fourier transformed, respectively. Then the cross power spectrum of the two speech signals is obtained. The obtained signal is then filtered with a psychometric weighting filter, and then the subjective loudness of the filtered signal is corrected and the result is output as a cross-bark spectrum (L xy (i)).

이에 따라 바크 코히어런스 함수 계산부(50)는 상기 제 1 및 제 2 바크 스펙트럼 산출부(20)(30)에서 각각 출력되는 바크 스펙트럼(Lxx(i), Lyy(i))과 상기 상호 바크 스펙트럼 산출부(40)에서 출력되는 상호 바크 스펙트럼(Lxy(i))을 아래와 같은[수학식2], 즉 바크 코히어런스 함수(BCF(i))에 대입하여 바크 코히어런스 함수를 구하게 된다.Accordingly, the bark coherence function calculation unit 50 may include the bark spectra L xx (i) and L yy (i) output from the first and second bark spectrum calculation units 20 and 30, respectively. The bark coherence function is substituted by substituting the cross bark spectrum L xy (i) output from the cross bark spectrum calculation unit 40 into the following equation (2), that is, the bark coherence function BCF (i). Will be obtained.

여기서 i는 바크 주파수를 의미한다.Where i represents the Bark frequency.

다음으로, 바크 잡음 대 신호비 계산부(60)는 상기 바크 코히어런스 함수 게산부(50)에서 얻어지는 결과치를 사용하여 바크 잡음 대 신호비(Bark Distortion to Signal Ratio : BDSR)를 구하고, 그 결과치를 객관적 음질 평가치로 출력한다.Next, the bark noise-to-signal ratio calculation unit 60 calculates a bark noise to signal ratio (BDSR) using the result obtained from the bark coherence function calculating unit 50, and the result value. Is output as an objective sound quality evaluation value.

여기서, BDSR은 심리 음향에서 원음에 대한 왜곡음의 왜곡정도를 나타내며, 아래의 [수학식3]과 같다.Here, BDSR represents the distortion degree of the distorted sound with respect to the original sound in psychoacoustic sound, as shown in Equation 3 below.

도 7은 본 발명에 의한 BCF 분포와 종래 MOS 분포를 비교한 도면으로써, 도 7a는 종래 MOS 분포도이고, 도 7b는 본 발명에 의한 BCF 분포도이다. 도 1과는 달리 서로 특성이 다른 PSTN 채널을 통과한 A군과 B군의 BCF값의 분포가 서로 비슷함을 알 수 있다. 즉, BCF에는 심리 음향 영역에서 MSC를 이용하므로, 평균 유클리디언 거리를 이용하는 기존의 다른 객관적 음질평가와는 달리 주관적 음질에 영향을 주지 않는 아날로그 시스템의 영향을 받지 않는다.7 is a view comparing the BCF distribution according to the present invention and the conventional MOS distribution, FIG. 7A is a conventional MOS distribution, and FIG. 7B is a BCF distribution according to the present invention. Unlike FIG. 1, it can be seen that the distributions of BCF values of group A and group B that pass through the PSTN channel having different characteristics are similar to each other. In other words, the BCF uses the MSC in the psychoacoustic domain, so unlike the conventional objective sound quality evaluation using the average Euclidean distance, the BCF is not affected by the analog system which does not affect the subjective sound quality.

도 8은 종래 객관적 음질 평가 방법에 적용된 PSQM의 상관 계수와 본 발명에 의한 BCF의 상관 계수를 비교한 도면이다.8 is a diagram comparing the correlation coefficient of the PSQM applied to the conventional objective sound quality evaluation method and the correlation coefficient of the BCF according to the present invention.

제안된 BCF의 성능을 평가하기 위하여 도 1에서 사용된 음성 데이터와 회귀분석을 하였다. 객관적 음질 평가의 성능은 실제 주관적 음질평가 결과와 예측된 주관적 음질과의 피어슨 상관계수로 평가된다.In order to evaluate the performance of the proposed BCF, the speech data and the regression analysis used in FIG. The performance of the objective sound quality evaluation is evaluated by the Pearson's correlation coefficient between the actual subjective sound quality evaluation result and the predicted subjective sound quality.

ITU-T 표준안인 PSQM의 경우 A군과 B군에 대해서 개별적으로는 높은 상관계수값을 가지나 A군과 B군에 섞이는 경우 매우 낮은 상관계수 값을 갖는다. BCF는 선형왜곡의 영향을 받지 않으므로 모든 경우에 대하여 높은 상관계수 값을 갖는다. 그러므로 BCF가 셀룰러 시스템을 통과한 실제 데이터의 음질을 평가하는 데 적합함을 알 수 있다.PSQM, an ITU-T standard, has a high correlation coefficient for group A and B separately, but a very low correlation coefficient for group A and B. Since BCF is not affected by linear distortion, it has a high correlation coefficient in all cases. Therefore, it can be seen that BCF is suitable for evaluating the sound quality of the actual data passing through the cellular system.

<실시예2>Example 2

첨부한 도면 도 3은 본 발명에 의한 이동통신 시스템에서 객관적 음질 평가 방법을 보인 흐름도이다.3 is a flowchart illustrating an objective sound quality evaluation method in a mobile communication system according to the present invention.

이에 도시된 바와 같이, 입력 음성 신호의 바크 스펙트럼을 산출하는 단계(S10)와, 출력 음성 신호의 바크 스펙트럼을 산출하는 단계(S20)와, 상기 입력 및 출력 음성 신호의 상호 바크 스펙트럼을 산출하는 단계(S30)와, 상기 산출한 두 개의 바크 스펙트럼과 상호 바크 스펙트럼을 바크 코히어런스 함수에 대입하여 바크 코히어런스 함수를 구하는 단계(S40)와, 상기 단계(S40)에서 구해진 결과치를 바크 잡음 대 신호비로 변환하여 얻어진 결과치를 객관적 음질 평가치로 출력하는 단계(S50)로 이루어진다.As shown therein, calculating the bark spectrum of the input voice signal (S10), calculating the bark spectrum of the output voice signal (S20), and calculating the mutual bark spectrum of the input and output voice signals. (S30) and calculating the Bark coherence function by substituting the calculated two Bark spectra and the mutual Bark spectra into the Bark coherence function (S40), and the resultant values obtained in the step S40 vs. Bark noise And outputting the result value obtained by converting the signal ratio as an objective sound quality evaluation value (S50).

이와 같이 이루어지는 객관적 음질 평가 방법은, 먼저 단계 S10에서 셀룰러 시스템으로 입력되는 음성 신호의 바크 스펙트럼을 산출한다. 여기서 입력되는 음성 신호의 바크 스펙트럼 산출은, 도 4에 도시된 바와 같이 단계 S11에서 입력 음성신호에 윈도우 함수를 씌우고, 단계 S12에서 상기 윈도우 함수내의 신호를 고속 푸리에 변환(FFT)하여 음성의 파워 스펙트럼을 구한다. 그리고 단계 S13에서 상기 음성의 파워 스펙트럼을 심리 가중 필터링하여 객관적 라우디니스 영역으로 변환하고, 단계 S14에서 라우디니스 보정을 통하여 최종적인 입력 음성 신호의 바크 스펙트럼을 산출한다.The objective sound quality evaluation method thus obtained first calculates the bark spectrum of the voice signal input to the cellular system in step S10. The bark spectrum calculation of the input voice signal is performed by applying a window function to the input voice signal in step S11 as shown in FIG. 4, and performing fast Fourier transform (FFT) on the signal in the window function in step S12. Obtain In step S13, the power spectrum of the voice is psychometric weighted and converted into an objective luminance region, and in step S14, the bark spectrum of the final input voice signal is calculated through the luminance correction.

다음으로, 단계 S12에서 상기 셀룰러 시스템에서 출력되는 왜곡된 출력 음성 신호의 바크 스펙트럼을 산출한다. 여기서 출력되는 음성신호의 바크 스펙트럼 산출은 도 4에 도시된 입력 음성 신호의 바크 스펙트럼 산출과 동일한 방법으로 출력 음성 신호의 바크 스펙트럼을 산출한다. 즉, 출력 음성신호에 윈도우 함수를 씌우고, 상기 윈도우 함수내의 신호를 고속 푸리에 변환(FFT)하여 음성의 파워 스펙트럼을 구한다. 그리고 구해진 음성의 파워 스펙트럼을 심리 가중 필터링하여 객관적 라우디니스 영역으로 변환하고, 라우디니스 보정을 통하여 최종적인 출력 음성 신호의 바크 스펙트럼을 산출한다.Next, a bark spectrum of the distorted output speech signal output from the cellular system is calculated in step S12. The calculation of the bark spectrum of the audio signal output here calculates the bark spectrum of the output audio signal in the same manner as the calculation of the bark spectrum of the input audio signal shown in FIG. 4. That is, a window function is put on the output voice signal, and the signal in the window function is fast Fourier transformed (FFT) to obtain a power spectrum of the voice. The power spectrum of the obtained speech is psychometric weighted and converted into an objective luminance region, and the bark spectrum of the final output speech signal is calculated through the luminance correction.

다음으로, 단계 S30에서 상기 입력 음성 신호 및 출력 음성 신호의 상호 바크 스펙트럼을 산출한다. 즉, 도 5에 도시된 바와 같이 상호 바크 스펙트럼 산출은, 단계 S31에서 상기 두 신호에 각각 윈도우 함수를 씌우고, 단계 S32에서 상기 윈도우 함수내의 신호를 고속 푸리에 변환한 후 음성의 상호 파워 스펙트럼을 구한다. 그리고 단계 S33에서 심리 가중 필터링을 수행하여 객관적 라우디니스 영역으로 변환하고, 단계 S34에서 주관적 소리 세기 보정을 통하여 최종적인 입력 및 출력 음성 신호의 상호 바크 스펙트럼을 산출한다.Next, in step S30, the mutual bark spectrum of the input speech signal and the output speech signal is calculated. That is, as shown in FIG. 5, the cross-bark spectrum calculation obtains a cross power spectrum of speech after fast Fourier transforming the signals in the window function in step S31, respectively, and in step S32. In step S33, psychometric weighting is performed to convert to the objective luminance region, and in step S34, the mutual bark spectrum of the final input and output voice signals is calculated through subjective sound intensity correction.

다음으로, 단계 S40에서 상기 산출한 두 개의 바크 스펙트럼과 상호 바크 스펙트럼을 주지한 [수학식2]인 바크 코히어런스 함수에 대입하여 바크 코히어런스 함수를 계산하고, 단계 S50에서 상기 계산하여 얻어진 결과치를 바크 잡음 대 신호비로 변환하여 음질 평가치를 출력한다.Next, the Bark coherence function is calculated by substituting the two Bark spectra and the cross Bark spectrum calculated in step S40 into the Bark coherence function of Equation 2, which is obtained. The resulting value is converted to the Bark noise-to-signal ratio to output a sound quality estimate.

이상에서 상술한 본 발명 " 이동통신 시스템에서 객관적 음질 평가 장치 및 그 방법"에 따르면, 아날로그 환경에 상관없이 주관적 음질과 높은 상관관계를 가지는 객관적 음질 평가가 가능한 이점이 있으며, 아울러 시스템 구축 및 고객만족을 위한 서비스 제공을 위해 계속적인 음질평가가 필요한 부분에 적용할 경우 정확한 음질 평가가 가능할 뿐만 아니라 음질 평가에 소요되는 시간 및 비용을 절감할 수 있는 이점이 있다.According to the above-described "objective sound quality evaluation apparatus and method in the mobile communication system", the objective sound quality evaluation having a high correlation with the subjective sound quality regardless of the analog environment is possible, and the system construction and customer satisfaction When applied to the part that needs continuous sound quality evaluation to provide a service for not only accurate sound quality evaluation, but also has the advantage of reducing the time and cost required for sound quality evaluation.

Claims (12)

삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 이동통신 시스템에서 객관적 음질 평가 방법에 있어서,In the objective sound quality evaluation method in a mobile communication system, 입력 음성신호에 윈도우 함수를 씌우는 단계, 상기 윈도우 함수내의 신호를 고속 푸리에 변환(FFT)하고 음성의 파워 스펙트럼을 구하는 단계, 상기 음성의 파워 스펙트럼을 심리 가중 필터링하여 객관적 라우디니스 영역으로 변환하는 단계, 상기 심리 가중 필터링이 수행된 신호를 라우디니스 보정하는 단계를 수행하여 최종적인 입력 음성 신호의 바크 스펙트럼을 산출하는 제 1 과정과;Applying a window function to an input speech signal, performing fast Fourier transform (FFT) on the signal in the window function, obtaining a power spectrum of the speech, and psychometric weighting the power spectrum of the speech to an objective luminance region A first step of calculating a bark spectrum of a final input speech signal by performing a luminance correction of the signal on which the psychological weight filtering has been performed; 출력 음성신호에 윈도우 함수를 씌우는 단계, 상기 윈도우 함수내의 신호를 고속 푸리에 변환(FFT)하고 음성의 파워 스펙트럼을 구하는 단계, 상기 음성의 파워 스펙트럼을 심리 가중 필터링하여 객관적 라우디니스 영역으로 변환하는 단계, 상기 심리 가중 필터링이 수행된 신호를 라우디니스 보정하는 단계를 수행하여 최종적인 출력 음성 신호의 바크 스펙트럼을 산출하는 제 2 과정과;Applying a window function to an output speech signal, performing fast Fourier transform (FFT) on the signal in the window function, obtaining a power spectrum of the speech, and psychometric weighting the power spectrum of the speech to an objective luminance region A second step of calculating a bark spectrum of a final output speech signal by performing a luminance correction of the signal on which the psychometric weighting filtering has been performed; 상기 입력/출력 음성 신호에 각각 윈도우 함수를 씌우는 단계, 상기 윈도우 함수내의 신호를 고속 푸리에 변환한 후 음성의 상호 파워 스펙트럼을 구하는 단계, 상기 음성의 상호 파워 스펙트럼을 심리 가중 필터링하여 객관적 라우디니스 영역으로 변환하는 단계, 상기 심리 가중 필터링이 수행된 신호를 라우디니스 보정하는 단계를 수행하여 최종적인 입력 및 출력 음성 신호의 상호 바크 스펙트럼을 산출하는 제 3 과정과;Applying a window function to the input / output speech signal, obtaining a cross power spectrum of the speech after fast Fourier transforming the signal within the window function, and psychometric weighting filtering the cross power spectrum of the speech A third step of calculating a cross-bark spectrum of a final input and output speech signal by performing a step of converting to and performing a luminance correction on the signal on which the psycho-weighted filtering is performed; 상기 산출한 두 개의 바크 스펙트럼과 상호 바크 스펙트럼을 바크 코히어런스 함수에 대입하여 바크 코히어런스 함수를 구하는 제 4 과정과;A fourth step of obtaining the Bark coherence function by substituting the calculated Bark and mutual Bark spectra into the Bark coherence function; 상기 제 4 과정에서 구해진 결과치를 바크 잡음 대 신호비로 변환하여 얻어진 결과치를 객관적 음질 평가치로 출력하는 제 5 과정을 포함하여 이루어짐을 특징으로 하는 이동통신 시스템에서 객관적 음질 평가 방법.And a fifth process of converting the resultant value obtained in the fourth process into a bark noise-to-signal ratio and outputting the resultant value as an objective sound quality evaluation value. 삭제delete 삭제delete 삭제delete 제 7 항에 있어서, 상기 제 4 과정의 바크 코히어런스 함수 계산은, 상기 제 1 및 제 2 과정에서 얻어지는 각각의 바크 스펙트럼과 상기 제 3 과정에서 얻어지는 상호 바크 스펙트럼을 아래의 바크 코히어런스 함수에 대입하여 바크 코히어런스 함수를 계산하는 것을 특징으로 하는 이동통신 시스템에서 객관적 음질 평가 방법.The Bark coherence function of claim 4, wherein the Bark coherence function calculation of the fourth process comprises: a Bark coherence function of each of the Bark spectra obtained in the first and second processes and the cross Bark spectrum obtained in the third process. An objective sound quality estimation method in a mobile communication system, comprising calculating a Bark coherence function by substituting for. 여기서 Lxy(i)는 상호 바크 스펙트럼, Lxx(i)는 입력 음성 신호의 바크 스펙트럼, Lyy(i)는 출력 음성신호의 바크 스펙트럼, i는 바크 주파수를 각각 나타낸다.Where L xy (i) is the cross-bark spectrum, L xx (i) is the bark spectrum of the input voice signal, L yy (i) is the bark spectrum of the output voice signal, and i is the bark frequency. 제 7 항에 있어서, 상기 제 5 과정의 바크 잡음 대 신호비 계산은, 상기 제 4 과정에서 얻어지는 신호를 아래와 같은 바크 잡음 대 신호비 계산 수학식으로 변환하고, 그 결과치를 객관적 음질 평가치로 출력하는 것을 특징으로 하는 이동통신 시스템에서 객관적 음질 평가 방법.The method of claim 7, wherein the Bark noise-to-signal ratio calculation of the fifth process comprises converting a signal obtained in the fourth process into a Bark noise-to-signal ratio calculation equation as follows and outputting the result as an objective sound quality evaluation value. Objective sound quality evaluation method in a mobile communication system, characterized in that. 여기서, i는 바크 주파수를 나타내고, BCF는 바크 코히어런스 함수에 의해 계산된 값을 나타낸다.Where i represents the Bark frequency and BCF represents the value calculated by the Bark coherence function.
KR1020000003478A 2000-01-25 2000-01-25 Apparatus and Method for objective speech quality measure in a Mobile Communication System KR100347752B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020000003478A KR100347752B1 (en) 2000-01-25 2000-01-25 Apparatus and Method for objective speech quality measure in a Mobile Communication System

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020000003478A KR100347752B1 (en) 2000-01-25 2000-01-25 Apparatus and Method for objective speech quality measure in a Mobile Communication System

Publications (2)

Publication Number Publication Date
KR20010076069A KR20010076069A (en) 2001-08-11
KR100347752B1 true KR100347752B1 (en) 2002-08-09

Family

ID=19641294

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020000003478A KR100347752B1 (en) 2000-01-25 2000-01-25 Apparatus and Method for objective speech quality measure in a Mobile Communication System

Country Status (1)

Country Link
KR (1) KR100347752B1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100729555B1 (en) * 2005-10-31 2007-06-19 연세대학교 산학협력단 Method for Objective Speech Quality Assessment

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0748596A (en) * 1993-01-27 1995-02-21 Rhone Poulenc Chim Solid cleaning composition containing at least one biodegradable non-moisture-absorptive polycarboxylic acid polymer
JPH0784596A (en) * 1993-09-13 1995-03-31 Nippon Telegr & Teleph Corp <Ntt> Method for evaluating quality of encoded speech
KR960702146A (en) * 1994-02-17 1996-03-28 안쏘니 제이.살리, 주니어 METHOD AND APPARATUS FOR GROUP ENCODING SIGNALS
US5864794A (en) * 1994-03-18 1999-01-26 Mitsubishi Denki Kabushiki Kaisha Signal encoding and decoding system using auditory parameters and bark spectrum
KR19990077753A (en) * 1998-03-11 1999-10-25 마츠시타 덴끼 산교 가부시키가이샤 Audio signal coding apparatus, audio signal decoding apparatus, and audio signal coding and decoding apparatus

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0748596A (en) * 1993-01-27 1995-02-21 Rhone Poulenc Chim Solid cleaning composition containing at least one biodegradable non-moisture-absorptive polycarboxylic acid polymer
JPH0784596A (en) * 1993-09-13 1995-03-31 Nippon Telegr & Teleph Corp <Ntt> Method for evaluating quality of encoded speech
KR960702146A (en) * 1994-02-17 1996-03-28 안쏘니 제이.살리, 주니어 METHOD AND APPARATUS FOR GROUP ENCODING SIGNALS
US5864794A (en) * 1994-03-18 1999-01-26 Mitsubishi Denki Kabushiki Kaisha Signal encoding and decoding system using auditory parameters and bark spectrum
KR19990077753A (en) * 1998-03-11 1999-10-25 마츠시타 덴끼 산교 가부시키가이샤 Audio signal coding apparatus, audio signal decoding apparatus, and audio signal coding and decoding apparatus

Also Published As

Publication number Publication date
KR20010076069A (en) 2001-08-11

Similar Documents

Publication Publication Date Title
Beerends et al. Perceptual evaluation of speech quality (pesq) the new itu standard for end-to-end speech quality assessment part ii: psychoacoustic model
Voran Objective estimation of perceived speech quality. i. development of the measuring normalizing block technique
CA2334906C (en) Method for executing automatic evaluation of transmission quality of audio signals
Rix Perceptual speech quality assessment-a review
Thorpe et al. Performance of current perceptual objective speech quality measures
Kim et al. ANIQUE+: A new American national standard for non‐intrusive estimation of narrowband speech quality
Rix et al. PESQ-the new ITU standard for end-to-end speech quality assessment
Zhang et al. A new method of objective speech quality assessment in communication system
Möller et al. Telephone speech quality prediction: towards network planning and monitoring models for modern network scenarios
KR100347752B1 (en) Apparatus and Method for objective speech quality measure in a Mobile Communication System
Holub et al. A dependence between average call duration and voice transmission quality: measurement and applications
KR100333049B1 (en) Method for testing voice quality in a mobile communication system using perceptual linear predictive-cepstrum mean substraction
KR100323231B1 (en) Method for prediction subjective speech quality using objective speech quality measure
Goldstein et al. Perceptual speech quality assessment in acoustic and binaural applications
Mahdi Voice quality measurement in modern telecommunication networks
Somek et al. Speech quality assessment
Möller Telephone transmission impact on synthesized speech: quality assessment and prediction
Rix et al. Perceptual SpeechQuality Assessment from Narrowband Telephony to Wideband Audio
Singh et al. Non-Intrusive Speech Quality with Different Time Scale
Aburas et al. Symbian Based Perceptual Evaluation of Speech Quality for Telecommunication Networks
Côté et al. Analysis of a quality prediction model for wideband speech quality, the WB-PESQ
Takahashi QoE Assessment and Management of VoIP Services
Ipswich PESQ: An Introduction White Paper
Mahdi Advances in Perceptual Speech Quality Assessment
Liu et al. Performance evaluation and accuracy upgrading of pesq in chinese environment

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20060721

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee