KR20150031287A - 오디오 스트림 품질 평가 방법 및 장치 - Google Patents

오디오 스트림 품질 평가 방법 및 장치 Download PDF

Info

Publication number
KR20150031287A
KR20150031287A KR20157000892A KR20157000892A KR20150031287A KR 20150031287 A KR20150031287 A KR 20150031287A KR 20157000892 A KR20157000892 A KR 20157000892A KR 20157000892 A KR20157000892 A KR 20157000892A KR 20150031287 A KR20150031287 A KR 20150031287A
Authority
KR
South Korea
Prior art keywords
audio
audio data
silent
evaluated
information
Prior art date
Application number
KR20157000892A
Other languages
English (en)
Inventor
샨 가오
리나 선
푸정 양
Original Assignee
후아웨이 테크놀러지 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 후아웨이 테크놀러지 컴퍼니 리미티드 filed Critical 후아웨이 테크놀러지 컴퍼니 리미티드
Publication of KR20150031287A publication Critical patent/KR20150031287A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/508Network service management, e.g. ensuring proper service fulfilment according to agreements based on type of value added network service under agreement
    • H04L41/509Network service management, e.g. ensuring proper service fulfilment according to agreements based on type of value added network service under agreement wherein the managed service relates to media content delivery, e.g. audio, video or TV
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/69Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/5061Network service management, e.g. ensuring proper service fulfilment according to agreements characterised by the interaction between service providers and their network customers, e.g. customer relationship management
    • H04L41/5067Customer-centric QoS measurements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0823Errors, e.g. transmission errors
    • H04L43/0829Packet loss

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

본 발명의 실시예는 오디오 스트림 품질 평가 방법 및 장치를 제공하며, 상기 오디오 스트림 품질 평가 방법은, 평가될 오디오 스트림 내의 비무음(non-silence) 오디오 데이터 패킷을 결정하는 단계 - 상기 평가될 오디오 스트림은 하나 이상의 비무음 오디오 데이터 패킷을 포함하고, 각각의 비무음 오디오 데이터 패킷은 하나 이상의 비무음 오디오 프레임을 포함함 -; 및 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷을 평가하여 오디오 품질 평가 정보를 생성하는 단계를 포함한다. 본 발명의 실시예에 의해 제공되는 오디오 스트림 품질 평가 방법 및 장치는 오디오 품질의 평가 시에 무음 부분의 영향을 회피할 수 있으므로, 오디오 스트림 평가의 정확도를 향상시킨다.

Description

오디오 스트림 품질 평가 방법 및 장치 {METHOD AND APPARATUS FOR EVALUATING QUALITY OF AUDIO STREAM}
본 발명의 실시예는 네트워크 오디오 기술에 관한 것으로, 특히 오디오 스트림 품질 평가 방법 및 장치에 관한 것이다.
최근, 디지털 네트워크 및 초대규모 집적회로 기술의 급속한 발전은 다양한 오디오 처리 기술 및 오디오 전송 기술의 끊임없는 출현을 낳았다. 오디오에 대한 통신 사용자 및 소비자의 주관적 느낌은 궁극적으로 오디오 품질에 의존하기 때문에, 오디오 및 비디오 품질의 평가는 점점 중요한 연구 주제가 되고 있다. 네트워크 오디오 송신 기술은 중요한 애플리케이션이 되었으며, 점점 더 많은 오디오 통신 임무를 맡게 되었다. 오디오 전송 과정에서, 복수의 네트워크 인자로 인해, 오디오에 패킷 손실이 발생하고 결과적으로 오디오 품질에 영향을 미친다. 네트워크 오디오 품질의 정확하고 신뢰성 있는 측정 및 평가는 네트워크 측정과 네트워크 계획 및 설계에서 매우 중요한 문제이다.
종래기술에서, 오디오 품질을 평가하는 방법은 일반적으로 오디오 스트림의 섹션 내의 모든 오디오 데이터 패킷의 전송 상태에 따라 수행되고, 평가 결과는 부정확하다.
본 발명의 실시예는 오디오 스트림 품질 평가의 정확도를 향상시키기 위해, 오디오 스트림 품질을 평가하는 방법 및 장치를 제공한다.
제1 측면에 따르면, 본 발명의 실시예는,
평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷(non-silence audio data packet)을 결정하는 단계 - 상기 평가될 오디오 스트림은 하나 이상의 비무음 오디오 데이터 패킷을 포함하고, 각각의 비무음 오디오 데이터 패킷은 하나 이상의 비무음 오디오 프레임을 포함함 -; 및
상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷을 평가하여 오디오 품질 평가 정보를 생성하는 단계를 포함하는 오디오 스트림 품질 평가 방법을 제공한다.
제1 가능한 구현 방식에서, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷을 평가하여 오디오 품질 평가 정보를 생성하는 단계는,
상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 비트 레이트(bit rate)을 결정하고, 상기 비트 레이트에 따라 코드 압축 품질 정보(code compression quality information)를 취득하는 단계; 및
상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실 상태 정보(packet loss status information)를 결정하고, 상기 코드 압축 품질 정보 및 상기 패킷 손실 상태 정보에 따라 상기 오디오 품질 평가 정보를 생성하는 단계를 포함한다.
제1 측면의 제1 가능한 구현 방식을 참조하여, 제2 가능한 구현 방식에서, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 비트 레이트를 결정하는 것은 구체적으로,
상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷에 포함된 모든 비무음 오디오 프레임의 비트의 합과 상기 모든 비무음 오디오 프레임의 시간 길이의 합을 결정하고, 상기 비트의 합과 상기 시간 길이의 합에 따라 상기 비트 레이트를 생성하는 것이다.
제1 측면의 상기 제1 또는 제2 구현 방식을 참조하여, 제3 가능한 구현 방식에서, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실 상태 정보를 결정하고, 상기 코드 압축 품질 정보 및 상기 패킷 손실 상태 정보에 따라 상기 오디오 품질 평가 정보를 생성하는 단계는 구체적으로,
상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실률(packet loss rate)을 결정하고, 상기 코드 압축 품질 정보 및 상기 패킷 손실률에 따라 상기 오디오 품질 평가 정보를 생성하는 단계이다.
제1 측면의 제3 가능한 구현 방식을 참조하여, 제4 가능한 구현 방식에서, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실률을 결정하는 것은 구체적으로,
상기 평가될 오디오 스트림 내의 손실된 오디오 데이터 패킷의 총수와 손실된 무음 오디오 데이터 패킷의 수를 결정하고, 상기 손실된 오디오 데이터 패킷의 총수와 상기 손실된 무음 오디오 데이터 패킷의 수에 따라 손실된 비무음 오디오 데이터 패킷의 수를 결정하고, 상기 손실된 비무음 오디오 데이터 패킷의 수와 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 수에 따라 상기 패킷 손실률을 생성하는 것이다.
제1 측면의 제3 가능한 구현 방식을 참조하여, 제5 가능한 구현 방식에서, 상기 코드 압축 품질 정보 및 상기 패킷 손실률에 따라 상기 오디오 품질 평가 정보를 생성하는 단계는 구체적으로,
하기 식:
Figure pct00001
을 적용하여 상기 오디오 품질 평가 품질 Q를 계산하는 단계이고, 상기 식에서, Qc는 상기 코드 압축 품질 정보이고, PLR은 상기 패킷 손실률이며, a1 a2 는 각각 미리 설정된 계수이다.
제1 측면의 제1 또는 제2 가능한 구현 방식을 참조하여, 제6 가능한 구현 방식에서, 상기 패킷 손실 상태 정보는 손실 빈도(loss frequency)이고;
상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실 상태 정보를 결정하고, 상기 코드 압축 품질 정보 및 상기 패킷 손실 상태 정보에 따라 상기 오디오 품질 평가 정보를 생성하는 단계는 구체적으로,
상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 손실 빈도를 결정하고, 상기 코드 압축 품질 정보 및 상기 손실 빈도에 따라 상기 오디오 품질 평가 정보를 생성하는 단계이다.
제1 측면의 제6 가능한 구현 방식을 참조하여, 제7 가능한 구현 방식에서, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 손실 빈도를 결정하는 것은 구체적으로,
상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 손실 횟수를 결정하고, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷에 포함된 모든 비무음 오디오 프레임의 시간 길이의 합을 결정하고, 상기 손실 횟수와 상기 모든 비무음 오디오 프레임의 시간 길이의 합에 따라 상기 손실 빈도를 생성하는 것이다.
제1 측면의 제6 가능한 구현 방식을 참조하여, 제8 가능한 구현 방식에서, 상기 코드 압축 품질 정보 및 상기 손실 빈도에 따라 상기 오디오 품질 평가 정보를 생성하는 단계는 구체적으로,
하기 식:
Figure pct00002
을 적용하여 상기 오디오 품질 평가 정보 Q를 계산하는 단계이고, 상기 식에서, Qc는 상기 코드 압축 품질 정보이고, LR은 상기 손실 빈도이며, a3 a4는 각각 미리 설정된 계수이다.
제1 측면의 제1 또는 제2 가능한 구현 방식을 참조하여, 제9 가능한 구현 방식에서, 상기 패킷 손실 상태 정보는 평균 손실 길이이고;
상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실 상태 정보를 결정하고, 상기 코드 압축 품질 정보 및 상기 패킷 손실 상태 정보에 따라 상기 오디오 품질 평가 정보를 생성하는 단계는 구체적으로,
상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 평균 손실 길이를 결정하고, 상기 코드 압축 품질 정보 및 상기 평균 손실 길이에 따라 상기 오디오 품질 평가 정보를 생성하는 단계이다.
제1 측면의 제9 가능한 구현 방식을 참조하여, 제10 가능한 구현 방식에서, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 평균 손실 길이를 결정하는 것은 구체적으로,
상기 평가될 오디오 스트림 내의 손실된 비무음 오디오 데이터 패킷을 결정하고, 상기 손실된 비무음 오디오 데이터 패킷의 시간 길이의 합을 결정하고, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 손실 횟수를 결정하고, 상기 시간 길이의 합과 상기 손실 횟수에 따라 상기 평균 손실 길이를 생성하는 것이다.
제1 측면의 제9 가능한 구현 방식을 참조하여, 제11 가능한 구현 방식에서, 상기 코드 압축 품질 정보 및 상기 평균 손실 길이에 따라 상기 오디오 품질 평가 정보를 생성하는 단계는 구체적으로,
하기 식:
Figure pct00003
을 적용하여 상기 오디오 품질 평가 정보 Q를 계산하는 단계이고, 상기 식에서, Qc는 상기 코드 압축 품질 정보이고, LD은 상기 평균 손실 길이이며, a5 a6은 각각 미리 설정된 계수이다.
제2 측면에 따르면, 본 발명의 실시예는,
평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷을 결정하도록 구성된 비무음 결정 유닛 - 상기 평가될 오디오 스트림은 하나 이상의 비무음 오디오 데이터 패킷을 포함하고, 각각의 비무음 오디오 데이터 패킷은 하나 이상의 비무음 오디오 프레임을 포함함 -; 및
상기 비무음 결정 유닛과 연결되고, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷을 평가하여 오디오 품질 평가 정보를 생성하도록 구성된 평가 유닛을 포함하는 오디오 스트림 품질 평가 장치를 제공한다.
제1 가능한 구현 방식에서, 상기 평가 유닛은,
상기 비무음 결정 유닛과 연결되고, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 비트 레이트를 결정하고, 상기 비트 레이트에 따라 코드 압축 품질 정보를 취득하도록 구성된 취득 서브유닛; 및
상기 취득 서브유닛과 연결되고, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실 상태 정보를 결정하고, 상기 코드 압축 품질 정보 및 상기 패킷 손실 상태 정보에 따라 상기 오디오 품질 평가 정보를 생성하도록 구성된 평가 서브유닛을 포함한다.
상기 제2 측면의 제1 가능한 구현 방식을 참조하여, 제2 가능한 구현 방식에서, 상기 취득 서브유닛은, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷에 포함된 모든 비무음 오디오 프레임의 비트의 합과 상기 모든 비무음 오디오 프레임의 시간 길이의 합을 결정하고, 상기 비트의 합과 상기 시간 길이의 합에 따라 상기 비트 레이트를 생성하도록 더 구성되어 있다.
상기 제2 측면의 제1 또는 제2 가능한 구현 방식을 참조하여, 제3 가능한 구현 방식에서, 상기 패킷 손실 상태 정보는 패킷 손실률이고;
상기 평가 서브유닛은, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실률을 결정하고, 상기 코드 압축 품질 정보 및 상기 패킷 손실률에 따라 상기 오디오 품질 평가 정보를 생성하도록 더 구성되어 있다.
상기 제2 측면의 제3 가능한 구현 방식을 참조하여, 제4 가능한 구현 방식에서, 상기 평가 서브유닛은, 상기 평가될 오디오 스트림 내의 손실된 오디오 데이터 패킷의 총수와 손실된 무음 오디오 데이터 패킷의 수를 결정하고, 상기 손실된 오디오 데이터 패킷의 총수와 상기 손실된 무음 오디오 데이터 패킷의 수에 따라 손실된 비무음 오디오 데이터 패킷의 수를 결정하고, 상기 손실된 비무음 오디오 데이터 패킷의 수와 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 수에 따라 상기 패킷 손실률을 생성하도록 더 구성되어 있다.
상기 제2 측면의 제3 가능한 구현 방식을 참조하여, 제5 가능한 구현 방식에서, 상기 평가 서브유닛은, 하기 식:
Figure pct00004
을 적용하여 상기 오디오 품질 평가 품질 Q를 계산하도록 더 구성되어 있고, 상기 식에서, Qc는 상기 코드 압축 품질 정보이고, PLR은 상기 패킷 손실률이며, a1 a2는 각각 미리 설정된 계수이다.
상기 제2 측면의 제1 또는 제2 가능한 구현 방식을 참조하여, 제6 가능한 구현 방식에서, 상기 패킷 손실 상태 정보는 손실 빈도이고;
상기 평가 서브유닛은, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 손실 빈도를 결정하고, 상기 코드 압축 품질 정보 및 상기 손실 빈도에 따라 상기 오디오 품질 평가 정보를 생성하도록 더 구성되어 있다.
상기 제2 측면의 제6 가능한 구현 방식을 참조하여, 제7 가능한 구현 방식에서, 상기 평가 서브유닛은, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 손실 횟수를 결정하고, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷에 포함된 모든 비무음 오디오 프레임의 시간 길이의 합을 결정하고, 상기 손실 횟수와 상기 모든 비무음 오디오 프레임의 시간 길이의 합에 따라 상기 손실 빈도를 생성하도록 더 구성되어 있다.
상기 제2 측면의 제6 가능한 구현 방식을 참조하여, 제8 가능한 구현 방식에서, 상기 평가 서브유닛은, 하기 식:
Figure pct00005
을 적용하여 상기 오디오 품질 평가 정보 Q를 계산하도록 더 구성되어 있고, 상기 식에서, Qc는 상기 코드 압축 품질 정보이고, LR은 상기 손실 빈도이며, a3 a4는 각각 미리 설정된 계수이다.
상기 제2 측면의 제1 또는 제2 가능한 구현 방식을 참조하여, 제9 가능한 구현 방식에서, 상기 패킷 손실 상태 정보는 평균 손실 길이이고;
상기 평가 서브유닛은, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 평균 손실 길이를 결정하고, 상기 코드 압축 품질 정보 및 상기 평균 손실 길이에 따라 상기 오디오 품질 평가 정보를 생성하도록 더 구성되어 있다.
상기 제2 측면의 제9 가능한 구현 방식을 참조하여, 제10 가능한 구현 방식에서, 상기 평가 서브유닛은, 상기 평가될 오디오 스트림 내의 손실된 비무음 오디오 데이터 패킷을 결정하고, 상기 손실된 비무음 오디오 데이터 패킷의 시간 길이의 합을 결정하고, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 손실 횟수를 결정하고, 상기 시간 길이의 합과 상기 손실 횟수에 따라 상기 평균 손실 길이를 생성하도록 더 구성되어 있다.
상기 제2 측면의 제9 가능한 구현 방식을 참조하여, 제11 가능한 구현 방식에서, 상기 평가 서브유닛은, 하기 식:
Figure pct00006
을 적용하여 상기 오디오 품질 평가 정보 Q를 계산하도록 더 구성되어 있고,
상기 식에서, Qc는 상기 코드 압축 품질 정보이고, LD은 상기 평균 손실 길이이며, a5 a6은 각각 미리 설정된 계수이다.
전술한 기술적 방안으로부터, 본 발명의 실시예에 따른 오디오 스트림 품질 평가 방법 및 장치에서, 오디오 스트림 품질 평가 장치는, 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷을 결정하고, 평가될 오디오 스트림은 하나 이상의 비무음 오디오 데이터 패킷을 포함하고, 각각의 비무음 오디오 데이터 패킷은 하나 이상의 비무음 오디오 프레임을 포함하며; 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷을 평가하여 오디오 품질 평가 정보를 생성한다. 무음 오디오 데이터 패킷이 어떠한 유용한 정보도 포함하지 않기 때문에, 오디오 스트림 품질 평가는 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷에 대해서만 수행되고, 이로써 무음 부분이 오디오 품질의 평가에 미치는 영향을 회피할 수 있으므로, 오디오 스트림 품질 평가의 정확성을 향상시킨다.
본 발명의 실시예에서의 기술적 방안 또는 종래기술을 더욱 명확하게 설명하기 위해, 이하에 본 발명의 실시예 또는 종래기술의 설명에 필요한 첨부도면을 간단하게 소개한다. 명백히, 아래의 설명에서의 첨부도면은 단지 본 발명의 일부 실시예를 보여줄 뿐이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진자(이하, 당업자라고 함)라면 여전히 창의적인 노력 없이 이들 첨부도면에 따라 다른 도면을 도출할 수 있을 것이다.
도 1은 본 발명의 실시예에 따른 오디오 스트림 품질 평가 방법의 흐름도이다.
도 2는 본 발명의 실시예에 따른 다른 오디오 스트림 품질 평가 방법의 흐름도이다.
도 3은 본 발명의 실시예에 따른 오디오 스트림 품질 평가 장치의 개략 구성도이다.
도 4는 본 발명의 실시예에 따른 다른 오디오 스트림 품질 평가 장치의 개략 구성도이다.
본 발명의 실시예의 목적, 기술적 방안, 및 이점을 더욱 분명하게 하기 위해, 이하에 본 발명의 실시예에서의 첨부도면을 참조하여 본 발명의 실시예에서의 기술적 방안을 명확하고 완전하게 설명한다. 명백히, 설명된 실시예는 본 발명의 모든 실시예가 아니라 단지 일부 실시예일 뿐이다. 당업자가 본 발명의 실시예에 기초하여 창의적인 노력 없이 얻은 모든 다른 실시예는 본 발명의 보호 범위에 속한다.
도 1은 본 발명의 일 실시예에 따른 오디오 스트림 품질 평가 방법의 흐름도이다. 도 1에 도시된 바와 같이, 본 발명의 본 실시예에 따른 오디오 스트림 품질 평가 방법은 구체적으로 오디오 스트림의, 특히 네트워크 오디오 스트림의 품질을 평가하는 프로세스에 적용될 수 있다. 네트워크 오디오 스트림은 구체적으로 네트워크를 통해 전송되는 오디오 스트림이다. 본 발명의 본 실시예에 따른 오디오 스트림 품질 평가 방법은 오디오 스트림 품질 평가 장치에 의해 실행될 수 있으며, 오디오 스트림 품질 평가 장치는 소프트웨어 및/또는 하드웨어 방식으로 구현될 수 있다.
본 발명의 본 실시예에 따른 오디오 스트림 품질 평가 방법은, 이하의 단계를 포함한다:
단계 10: 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷을 결정하며, 평가될 오디오 스트림은 하나 이상의 비무음 오디오 데이터 패킷을 포함하고, 각각의 비무음 오디오 데이터 패킷은 하나 이상의 비무음 오디오 프레임을 포함한다.
단계 20: 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷을 평가하여 오디오 품질 평가 정보를 생성한다.
구체적으로, 오디오 스트림의 부분에 대해 품질 평가가 수행되는 경우, 그 오디오 스트림의 부분이 평가될 오디오 스트림이고, 평가될 오디오 스트림은 구체적으로 미리 설정된 음성 코딩 표준(speech coding standard)을 따르는 오디오 스트림이며, 미리 설정된 음성 코딩 표준은 적응형 멀티레이트(Adaptive Multi-Rate, 약칭하여 AMR) 코딩 표준, 고급 오디오 코딩(Advanced Audio Coding, 약칭하여 AAC) 표준, 또는 고효율 고급 오디오(High Efficiency Advanced Audio Coding, 약칭하여 HEAAC) 표준, 등일 수 있다. 평가될 오디오 스트림은 복수의 오디오 데이터 패킷을 포함하고, 각각의 오디오 데이터 패킷은 패킷 헤더(packet header)와 오디오 페이로드(audio payload)를 포함하고, 오디오 페이로드는 하나 이상의 오디오 프레임을 포함한다. 평가될 오디오 스트림 내의 오디오 패킷 데이터 각각은 동일한 수의 오디오 프레임을 포함한다.
오디오 스트림은 종종 무음 부분(silence part), 예를 들면, 대화의 간격(talk interval)을 가지므로, 오디오 데이터 패킷은 두 가지 유형: 비무음 오디오 데이터 패킷 및 무음 오디오 데이터 패킷으로 분류될 수 있다. 오디오 데이터 패킷 내의 오디오 프레임이 모두 무음 오디오 프레임인 경우, 그 오디오 패킷은 무음 오디오 데이터 패킷이고; 오디오 데이터 패킷 내에 하나 이상의 비무음 오디오 프레임이 존재하는 경우, 그 오디오 패킷은 하나 이상의 비무음 오디오 데이터 패킷이다. 무음 프레임은 어떠한 유용한 정보도 포함하지 않고, 무음 프레임의 손실은 오디오 스트림 품질에 영향도 미치지 않기 때문에, 평가될 오디오 스트림 내의 오디오 데이터 패킷이 모두 무음 오디오 데이터 패킷인 경우, 그 평가될 오디오 스트림에 대해서는 품질 평가를 수행하지 않는다.
실제 애플리케이션의 프로세스에서, 상이한 음성 코딩 표준에 의해 처리되는, 오디오 스트림 내의 비무음 오디오 프레임의 압축 바이트 수는 상이하다. 예를 들어, 표 1은 AMR 코딩 표준이 사용되는 경우 상이한 코딩 방식에서의 비무음 오디오 프레임 각각의 압축 바이트 수를 나열하고 있다. 또, 무음 오디오 프레임의 길이가 비무음 오디오 프레임의 길이보다 훨씬 적기 때문에, 오디오 데이터 패킷이 비무음 오디오 데이터 패킷인지 무음 오디오 데이터 패킷인지는 오디오 데이터 패킷 내의 오디오 페이로드의 길이에 따라 결정될 수 있다.
Figure pct00007
평가될 오디오 스트림 내의 모든 비무음 오디오 데이터 패킷을 평가하여 오디오 품질 평가 정보를 생성한다. 평가될 오디오 스트림 내의 비무음 부분의 오디오 품질의 평가는 구체적으로 G.1070 오디오 품질 평가 방법을 사용하여 구현될 수 있고, 다른 오디오 품질 평가 방법을 사용하여 구현될 수도 있다.
본 발명의 본 실시예에 따른 오디오 스트림 품질 평가 방법에서, 오디오 스트림 품질 평가 장치는 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷을 결정하며, 평가될 오디오 스트림은 하나 이상의 비무음 오디오 데이터 패킷을 포함하고, 각각의 비무음 오디오 데이터 패킷은 하나 이상의 비무음 오디오 프레임을 포함하며; 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷을 평가하여 오디오 품질 평가 정보를 생성한다. 무음 오디오 데이터 패킷은 어떠한 유용한 정보도 포함하지 않기 때문에, 오디오 스트림 품질 평가는 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷에 대해서만 수행되고, 이로써 무음 부분이 오디오 품질의 평가에 미치는 영향을 회피할 수 있으므로, 오디오 스트림 품질 평가의 정확성을 향상시킨다.
도 2는 본 발명의 실시예에 따른 다른 오디오 스트림 품질 평가 방법의 흐름도이다. 도 2에 도시된 바와 같이, 본 실시예서, 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷을 평가하여 오디오 품질 평가 정보를 생성하는 단계 20은 구체적으로, 이하 단계를 포함할 수 있다:
단계 201: 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 비트 레이트를 결정하고, 비트 레이트에 따라 코드 압축 품질 정보를 취득한다.
단계 202: 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실 상태 정보를 결정하고, 코드 압축 품질 정보 및 패킷 손실 상태 정보에 따라 오디오 품질 평가 정보를 생성한다.
구체적으로, 코드 압축 품질 정보는 상이한 음성 코딩 표준에 따라 변화한다. 코드 압축 품질 정보는 음성 코딩 표준에 따라 코드 압축 품질의 상태를 반영할 수 있고, 오디오 전송 과정에서 오디오 스트림 내의 오디오 데이터 패킷이 손실되지 않은 경우 오디오 품질의 상태를 반영할 수도 있다. 비트 레이트와 코드 압축 품질 정보 사이의 대응관계는 실험 데이터에 따라 미리 설정될 수 있다. 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 비트 레이트를 결정하고, 그 비트 레이트에 대응하는 코드 압축 품질 정보가 취득된다.
평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실 상태 정보는 구체적으로 패킷 손실률, 손실 빈도 또는 평균 손실 길이와 같은 정보를 포함할 수 있다. 비무음 오디오 데이터 패킷의 패킷 손실 상태 정보는 비무음 오디오 데이터 패킷의 패킷 손실 상황(packet loss condition)을 나타내는 데 사용된다. 평가될 오디오 스트림의 오디오 품질을 평가하는 프로세스에서는, 비무음 오디오 데이터 패킷의 패킷 손실 상황만 고려되며, 이로써 무음 오디오 데이터 패킷의 손실이 오디오 품질 평가에 영향을 미치는 것을 회피할 수 있으므로, 오디오 품질 평가의 정확성을 향상시킨다.
본 실시예에서, 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 비트 레이트를 결정하는 단계 201은 구체적으로,
평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷에 포함된 모든 비무음 오디오 프레임의 비트의 합과, 모든 비무음 오디오 프레임의 시간 길이의 합을 결정하고, 비트의 합과 시간 길이의 합에 따라 비트 레이트를 생성하는 단계일 수 있다.
구체적으로, 오디오 데이터 패킷의 패킷 헤더 부분에 포함된 정보는 미리 설정된 음성 코딩 표준에 따라 고정되어 있으며, 오디오 데이터 패킷의 패킷 헤더는 일반적으로, 실시간 전송 프로토콜(Real-time Transport Protocol, 약칭하여 RTP) 헤더, 사용자 데이터그램 프로토콜(User Datagram Protocol, 약칭하여 UDP) 헤더, 및 인터넷 프로토콜(Internet Protocol, 약칭하여 IP) 헤더를 포함한다. 미리 설정된 음성 코딩 표준이 브로드캐스트 도메인에 적용 가능한 음성 코딩 표준이면, 오디오 데이터 패킷의 패킷 헤더는 전송 스트림h(Transport Stream, 약칭하여 TS)헤더를 더 포함할 수 있다. RTP 헤더, UDP 헤더, IP 헤더, 및 TS 헤더의 길이는 고정되어 있고, 패킷 헤더의 길이는 RTP 헤더, UDP 헤더, IP 헤더, 및 TS 헤더의 길이에 따라 결정될 수 있다. 오디오 데이터 패킷 내의 오디오 페이로드의 유효 길이는 오디오 데이터 패킷의 총 길이에서 패킷 헤더의 길이를 감산하여 취득될 수 있다. 각각의 비무음 오디오 데이터 패킷의 경우, 오디오 페이로드에 포함된 오디오 프레임의 수가 일정하고 비무음 오디오 프레임의 길이가 일정하기 때문에, 비무음 오디오 프레임의 수 및 비트를 결정할 수 있다. 비무음 오디오 데이터 패킷의 시간 길이는 비무음 오디오 데이터 패킷 내의 패킷 헤드의 타임스탬프(timestamp)에 따라 결정될 수 있고, 또한, 비무음 오디오 데이터 패킷 내의 비무음 오디오 프레임의 시간 길이가 결정될 수 있다. 따라서, 비트 레이트 R은 하기 식:
Figure pct00008
을 적용하여 계산되며, 상기 식에서 M은 평가될 오디오 스트림의 비무음 오디오 프레임의 수이고, Bi는 i번째 비무음 오디오 프레임의 비트 수이며, Durationi 는 i번째 비무음 오디오 프레임의 시간 길이이다.
본 실시예에서, 패킷 손실 상태 정보는 패킷 손실률이다. 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실 상태 정보를 결정하고, 코드 압축 품질 정보 및 패킷 손실 상태 정보에 따라 오디오 품질 평가 정보를 생성하는 단계 202는 구체적으로,
평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실률을 결정하고, 코드 압축 품질 정보 및 패킷 손실률에 따라 오디오 품질 평가 정보를 생성하는 단계일 수 있다.
본 실시예에서, 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실률을 결정하는 것은 구체적으로,
평가될 오디오 스트림 내의 손실된 오디오 데이터 패킷의 총수와 손실된 무음 오디오 데이터 패킷의 수를 결정하고, 손실된 오디오 데이터 패킷의 총수와 손실된 무음 오디오 데이터 패킷의 수에 따라 손실된 비무음 오디오 데이터 패킷의 수를 결정하고, 손실된 비무음 오디오 데이터 패킷의 수와 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 수에 따라 패킷 손실률을 생성하는 것일 수 있다.
구체적으로, 오디오 데이터 패킷의 패킷 헤더 내의 RTP 헤더는 일련번호 필드를 구비하여 오디오 데이터 패킷의 시퀀스를 나타내고, 손실된 오디오 데이터 패킷의 총수는 평가될 오디오 스트림 내의 오디오 데이터 패킷 각각의 RTP 헤더의 일련번호 필드에 따라 결정될 수 있다. 손실된 오디오 데이터 패킷에 인접한 두 개의 오디오 데이터 패킷이 모두 무음 오디오 데이터 패킷이면, 손실된 오디오 데이터 패킷은 무음 오디오 데이터 패킷이다. 예를 들어, 평가될 오디오 스트림의 오디오 데이터 패킷의 일련번호는 각각 1, 2, 3, 5, 및 6이다. 그러면, 일련번호 4인 오디오 데이터 패킷이 손실된 것으로 결정될 수 있다. 일련번호 3 및 일련번호 5인 오디오 데이터 패킷이 모두 무음 오디오 데이터 패킷이면, 일련번호 4인 손실된 오디오 데이터 패킷도 무음 오디오 데이터 패킷이므로, 손실된 무음 오디오 데이터 패킷의 수를 결정할 수 있다. 분실된 비무음 오디오 데이터 패킷의 수는 손실된 오디오 데이터 패킷의 총수에서 손실된 무음 오디오 데이터 패킷의 수를 감산하여 취득된다.
패킷 손실률 PLR은 하기 식:
Figure pct00009
을 적용하여 계산되며, 상기 식에서 N1은 손실된 비무음 오디오 데이터 패킷의 수이고, N2는 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 수이다.
본 실시예에서, 코드 압축 품질 정보 및 패킷 손실률에 따라 오디오 품질 평가 정보를 생성하는 것은 구체적으로,
하기 식:
Figure pct00010
을 적용하여 오디오 품질 평가 품질 Q를 계산하는 것일 수 있으며, 상기 식에서, Qc는 코드 압축 품질 정보이고, PLR은 패킷 손실률이며, a1 a2 는 각각 미리 설정된 계수이다.
구체적으로, a1 a2 는 미리 설정된 계수이며, 트레이닝 데이터베이스를 트레이닝하여 취득될 수 있다.
본 실시예에서, 패킷 손실 상태 정보는 손실 빈도이다. 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실 상태 정보를 결정하고, 코드 압축 품질 정보 및 패킷 손실 상태 정보에 따라 오디오 품질 평가 정보를 생성하는 단계 202는 구체적으로,
평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 손실 빈도를 결정하고, 코드 압축 품질 정보 및 손실 빈도에 따라 오디오 품질 평가 정보를 생성하는 단계일 수 있다.
본 실시예에서, 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 손실 빈도를 결정하는 것은 구체적으로,
평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 손실 횟수를 결정하고, 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷에 포함된 모든 비무음 오디오 프레임의 시간 길이의 합을 결정하고, 손실 횟수와 모든 비무음 오디오 프레임의 시간 길이의 합에 따라 손실 빈도를 생성하는 것일 수 있다.
구체적으로, 비무음 오디오 데이터 패킷의 손실 횟수는 평가될 오디오 스트림에 포함된 비무음 오디오 데이터 패킷의 패킷 손실 이벤트의 발생 총 횟수이고, 연속적인 패킷 손실은 하나의 패킷 손실 이벤트에 속한다. 예를 들어, 일련번호 1, 2, 3, 6, 8, 및 9인 오디오 데이터 패킷이 모든 비무음 오디오 데이터 패킷이고, 손실된 비무음 오디오 데이터 패킷의 일련번호는 각각 4, 5, 및 7이다. 손실된 비무음 오디오 데이터 패킷의 수가 3이더라도, 일련번호 4와 5인 비무음 오디오 데이터 패킷은 연속하는 오디오 데이터 패킷이므로, 비무음 오디오 데이터 패킷의 손실 횟수는 2이다.
손실 빈도 LR은 하기 식:
Figure pct00011
을 적용하여 계산되며, 상기 식에서 N3은 비무음 오디오 데이터 패킷의 손실 횟수이고, M은 평가될 오디오 스트림 내의 비무음 오디오 프레임의 수이며, Durationi는 i번째 비무음 오디오 프레임의 시간 길이다.
본 실시예에서, 코드 압축 품질 정보 및 손실 빈도에 따라 오디오 품질 평가 정보를 생성하는 것은 구체적으로,
하기 식:
Figure pct00012
을 적용하여 오디오 품질 평가 정보 Q를 계산하는 것일 수 있으며, 상기 식에서, Qc는 코드 압축 품질 정보이고, LR은 손실 빈도이며, a3 및 a4는 각각 미리 설정된 계수이다.
구체적으로, a3 및 a4는 미리 설정된 계수이고, 트레이닝 데이터베이스(training database)를 트레이닝하여 취득될 수 있다.
본 실시예에서, 패킷 손실 상태 정보는 평균 손실 길이이고; 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실 상태 정보를 결정하고, 코드 압축 품질 정보 및 패킷 손실 상태 정보에 따라 오디오 품질 평가 정보를 생성하는 단계는 구체적으로,
평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 평균 손실 길이를 결정하고, 코드 압축 품질 정보 및 평균 손실 길이에 따라 오디오 품질 평가 정보를 생성하는 단계일 수 있다.
본 실시예에서, 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 평균 손실 길이를 결정하는 것은 구체적으로,
평가될 오디오 스트림 내의 손실된 비무음 오디오 데이터 패킷을 결정하고, 손실된 비무음 오디오 데이터 패킷의 시간 길이의 합을 결정하고, 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 손실 횟수를 결정하고, 시간 길이의 합과 손실 횟수에 따라 상기 평균 손실 길이를 생성하는 것일 수 있다.
구체적으로, 오디오 데이터 패킷의 패킷 헤더 내의 RTP 헤더는 일련번호 필드를 구비하여 오디오 데이터 패킷의 시퀀스를 나타내고, 손실된 오디오 데이터 패킷은 평가될 오디오 스트림 내의 오디오 데이터 패킷 각각의 RTP 헤더의 일련번호 필드에 따라 결정될 수 있다. 손실된 오디오 데이터 패킷에 인접한 두 개의 오디오 데이터 패킷이 모두 무음 오디오 데이터 패킷이면, 손실된 오디오 데이터 패킷은 무음 오디오 데이터 패킷이다. 손실된 비무음 오디오 데이터 패킷은 손실된 무음 오디오 데이터 패킷을 결정함으로써 결정된다. 손실된 비무음 오디오 데이터 패킷의 시간 길이의 합은 평가될 오디오 스트림 내의 오디오 데이터 패킷의 RTP 헤더의 타임스탬프에 따라 결정될 수 있다.
비무음 오디오 데이터 패킷의 손실 횟수는 평가될 오디오 스트림에 포함된 비무음 오디오 데이터 패킷의 패킷 손실 이벤트의 발생 총 횟수이고, 연속적인 패킷 손실은 하나의 패킷 손실 이벤트에 속한다. 예를 들어, 각각 일련번호 1, 2, 3, 6, 8, 및 9인 오디오 데이터 패킷이 모든 비무음 오디오 데이터 패킷이고, 손실된 비무음 오디오 데이터 패킷의 일련번호는 각각 4, 5, 및 7이다. 손실된 비무음 오디오 데이터 패킷의 수가 3이더라도, 일련번호 4와 5인 비무음 오디오 데이터 패킷은 연속하는 오디오 데이터 패킷이므로, 비무음 오디오 데이터 패킷의 손실 횟수는 2이다.
평균 손실 길이 LD는 하기 식:
Figure pct00013
을 적용하여 계산되며, 상기 식에서, T1은 손실된 비무음 오디오 데이터 패킷의 시간 길이의 합이고, N3은 손실된 비무음 오디오 데이터 패킷의 손실 횟수이다.
본 실시예에서, 코드 압축 품질 정보 및 평균 손실 길이에 따라 오디오 품질 평가 정보를 생성하는 것은 구체적으로,
하기 식:
Figure pct00014
을 적용하여 오디오 품질 평가 정보 Q를 계산하는 것일 수 있고, 상기 식에서, Qc는 코드 압축 품질 정보이고, LD은 평균 손실 길이이며, a5 a6은 각각 미리 설정된 계수이다.
구체적으로, a5 a6은 미리 설정된 계수이며, 트레이닝 데이터베이스를 트레이닝하여 취득될 수 있다.
실제 애플리케이션의 프로세스에서는, 비무음 오디오 데이터 패킷의 패킷 손실 상태 정보는 비무음 오디오 데이터 패킷의 패킷 손실 상황을 반영할 수 있는 다른 정보를 더 포함할 수 있으며, 본 실시예에서 이에 한정되는 것은 아니다. 따라서, 코드 압축 품질 정보 및 패킷 손실 상태 정보에 따라 오디오 품질 평가 정보를 생성하는 방식은 다른 방식일 수도 있으며, 본 실시예에서 이에 한정되는 것은 아니다.
예를 들어, 비무음 오디오 데이터 패킷의 패킷 손실 상태 정보는 손실 빈도 및 손실 길이를 포함할 수 있다. 손실 빈도 및 손실 길이는 전술한 실시예에서 제공된 방법을 사용하여 취득될 수 있으며, 다른 방식으로 취득될 수도 있다. 예를 들어, 손실 빈도
Figure pct00015
, 여기서 N3은 비무음 오디오 데이터 패킷의 손실 횟수이고, T1은 손실된 비무음 오디오 데이터 패킷의 시간 길이의 합이다. 손실 길이
Figure pct00016
, 여기서 N1은 손실된 비무음 오디오 데이터 패킷의 수이고, N3은 비무음 오디오 데이터 패킷의 손실 횟수이다.
오디오 품질 평가 정보 Q는 하기 식:
Figure pct00017
을 적용하여 계산되며, 상기 식에서 Qc는 코드 압축 품질 정보이고, a11, a12, a13 및 a14는 미리 설정된 계수이며 트레이닝 데이터베스를 트레이닝하여 취득될 수 있다. 예를 들어, AAC 비트 스트림의 모델 파라미터에서, a11=0.5145, a12 =106658, a13=5.0921, 및 a14=0.0560.
도 3은 본 발명의 실시예에 따른 오디오 스트림 품질 평가 장치의 개략 구성도이다. 도 3에 도시된 바와 같이, 본 실시예에 따른 오디오 스트림 품질 평가 장치는 본 발명의 임의의 실시예에 따른 오디오 스트림 품질 평가 방법의 단계들을 구현할 수 있으므로, 여기서 더 이상 설명하지 않는다. 본 실시예에 따른 오디오 스트림 품질 평가 장치는 구체적으로, 비무음 결정 유닛(11) 및 평가 유닛(12)을 포함한다. 상기 비무음 결정 유닛(11)은 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷을 결정하도록 구성되어 있고, 평가될 오디오 스트림은 하나 이상의 비무음 오디오 데이터 패킷을 포함하고, 각각의 비무음 오디오 데이터 패킷은 하나 이상의 비무음 오디오 프레임을 포함한다. 평가 유닛(12)은 비무음 결정 유닛(11)과 연결되고, 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷을 평가하여 오디오 품질 평가 정보를 생성하도록 구성되어 있다.
본 실시예에 따른 오디오 스트림 품질 평가 장치에서, 비무음 결정 유닛(11)은 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷을 결정하며, 평가될 오디오 스트림은 하나 이상의 비무음 오디오 데이터 패킷을 포함하고, 각각의 비무음 오디오 데이터 패킷은 하나 이상의 비무음 오디오 프레임을 포함하며; 평가 유닛(12)은 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷을 평가하여 오디오 품질 평가 정보를 생성한다. 무음 오디오 데이터 패킷은 어떠한 유용한 정보도 포함하지 않기 때문에, 오디오 스트림 품질 평가는 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷에 대해서만 수행되고, 이로써 무음 부분이 오디오 품질의 평가에 미치는 영향을 회피할 수 있으므로, 오디오 스트림 품질 평가의 정확성을 향상시킨다.
도 4는 본 발명의 실시예에 따른 다른 오디오 스트림 품질 평가 장치의 개략 구성도이다. 도 4에 도시된 바와 같이, 본 실시예에서, 평가 유닛(12)은 구체적으로 취득 서브유닛(21) 및 평가 서브유닛(22)을 포함할 수 있다. 취득 서브유닛(21)은 비무음 결정 유닛(11)과 연결되고, 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 비트 레이트를 결정하고, 비트 레이트에 따라 코드 압축 품질 정보를 취득하도록 구성되어 있다. 평가 서브유닛(22)은 취득 서브유닛(21)과 연결되고, 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실 상태 정보를 결정하고, 코드 압축 품질 정보 및 패킷 손실 상태 정보에 따라 오디오 품질 평가 정보를 생성하도록 구성되어 있다.
평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실 상태 정보는 구체적으로 패킷 손실률, 손실 빈도 또는 평균 손실 길이와 같은 정보를 포함할 수 있다. 비무음 오디오 데이터 패킷의 패킷 손실 상태 정보는 비무음 오디오 데이터 패킷의 패킷 손실 상황을 나타내는 데 사용된다. 평가될 오디오 스트림의 오디오 품질을 평가하는 프로세스에서는, 비무음 오디오 데이터 패킷의 패킷 손실 상황만 고려되며, 이로써 무음 오디오 데이터 패킷의 손실이 오디오 품질 평가에 영향을 미치는 것을 회피할 수 있으므로, 오디오 품질 평가의 정확성을 향상시킨다.
본 실시예에서, 취득 서브유닛(21)은, 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷에 포함된 모든 비무음 오디오 프레임의 비트의 합과 그 모든 비무음 오디오 프레임의 시간 길이의 합을 결정하고, 비트의 합과 시간 길이의 합에 따라 비트 레이트를 생성하도록 더 구성되어 있다.
본 실시예에서, 패킷 손실 상태 정보는 패킷 손실률이고; 평가 서브유닛은(22), 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실률을 결정하고, 코드 압축 품질 정보 및 패킷 손실률에 따라 오디오 품질 평가 정보를 생성하도록 더 구성되어 있다.
본 실시예에서, 평가 서브유닛(22)은, 평가될 오디오 스트림 내의 손실된 오디오 데이터 패킷의 총수와 손실된 무음 오디오 데이터 패킷의 수를 결정하고, 손실된 오디오 데이터 패킷의 총수와 손실된 무음 오디오 데이터 패킷의 수에 따라 손실된 비무음 오디오 데이터 패킷의 수를 결정하고, 손실된 비무음 오디오 데이터 패킷의 수와 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 수에 따라 패킷 손실률을 생성하도록 더 구성되어 있다.
본 실시예에서, 평가 서브유닛(22)은, 하기 식:
Figure pct00018
을 적용하여 오디오 품질 평가 품질 Q를 계산하도록 더 구성되어 있고, 상기 식에서, Qc는 코드 압축 품질 정보이고, PLR은 패킷 손실률이며, a1 a2는 각각 미리 설정된 계수이다.
본 실시예에서, 패킷 손실 상태 정보는 손실 빈도이고; 평가 서브유닛(22)은, 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 손실 빈도를 결정하고, 코드 압축 품질 정보 및 손실 빈도에 따라 오디오 품질 평가 정보를 생성하도록 더 구성되어 있다.
본 실시예에서, 평가 서브유닛(22)은, 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 손실 횟수를 결정하고, 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷에 포함된 모든 비무음 오디오 프레임의 시간 길이의 합을 결정하고, 손실 횟수와 모든 비무음 오디오 프레임의 시간 길이의 합에 따라 손실 빈도를 생성하도록 더 구성되어 있다.
본 실시예에서, 평가 서브유닛(22)은, 하기 식:
을 적용하여 오디오 품질 평가 정보 Q를 계산하도록 더 구성되어 있고, 상기 식에서, Qc는 코드 압축 품질 정보이고, LR은 손실 빈도이며, a3 a4는 각각 미리 설정된 계수이다.
본 실시예에서,패킷 손실 상태 정보는 평균 손실 길이이고; 평가 서브유닛(22)은, 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 평균 손실 길이를 결정하고, 코드 압축 품질 정보 및 평균 손실 길이에 따라 오디오 품질 평가 정보를 생성하도록 더 구성되어 있다.
본 실시예에서, 평가 서브유닛(22)은, 평가될 오디오 스트림 내의 손실된 비무음 오디오 데이터 패킷을 결정하고, 손실된 비무음 오디오 데이터 패킷의 시간 길이의 합을 결정하고, 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 손실 횟수를 결정하고, 시간 길이의 합과 손실 횟수에 따라 균 손실 길이를 생성하도록 더 구성되어 있다.
본 실시예에서, 평가 서브유닛(22)은, 하기 식:
Figure pct00020
을 적용하여 오디오 품질 평가 정보 Q를 계산하도록 더 구성되어 있고, 상기 식에서, Qc는 코드 압축 품질 정보이고, LD은 평균 손실 길이이며, a5 a6은 각각 미리 설정된 계수이다.
본 발명의 본 실시예에 따른 오디오 스트림 품질 평가 방법 및 장치에서, 무음 오디오 데이터 패킷은 어떠한 유용한 정보도 포함하지 않기 때문에, 오디오 스트림 품질 평가는 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷에 대해서만 수행되고, 이로써 무음 부분이 오디오 품질의 평가에 미치는 영향을 회피할 수 있으므로, 오디오 스트림 품질 평가의 정확성을 향상시킨다. 또, 본 발명의 본 실시예에 따른 오디오 스트림 품질 평가 방법 및 장치는, 계산 복잡도가 낮고, 페이로드 암호화와 함께 오디오 스트림에 적용 가능하며, 네트워크 오디오 스트림 및 멀티미디어 스트림의 품질의 평가 및 모니터링에 폭넓게 적용될 수 있다.
당업자는 방법 실시예의 단계 중 일부 또는 전부를 관련 하드웨어에 명령하는 프로그램으로 구현할 수 있다는 것을 이해할 수 있을 것이다. 상기 프로그램은 컴퓨터로 판독 가능한 매체에 저장될 수 있다. 프로그램이 실행될 때, 방법 실시예의 단계들이 수행된다. 상기 저장 매체는 ROM, RAM, 자기 디스크, 또는 광 디스크와 같은, 프로그램 코드를 저장할 수 있는 임의 매체를 포함한다.
끝으로, 전술한 실시예는 본 발명의 기술적 방안을 설명하기 위한 것일 뿐이며, 본 발명의 한정하려는 것은 아님에 유의하여야 한다. 본 발명을 전술한 실시예를 참조하여 상세하게 설명하였지만, 당업자는 본 발명의 실시예의 기술적 방안의 범위를 벗어나지 않으면서 전술한 실시예에서 설명한 기술적 방안을 수정하거나 그 기술적 특징의 일부에 대한 동등한 대체를 할 수 있다는 이해하여야 한다.

Claims (24)

  1. 평가될 오디오 스트림 내의 비무음(non-silence) 오디오 데이터 패킷을 결정하는 단계 - 상기 평가될 오디오 스트림은 하나 이상의 비무음 오디오 데이터 패킷을 포함하고, 각각의 비무음 오디오 데이터 패킷은 하나 이상의 비무음 오디오 프레임을 포함함 -; 및
    상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷을 평가하여 오디오 품질 평가 정보를 생성하는 단계
    를 포함하는 오디오 스트림 품질 평가 방법.
  2. 제1항에 있어서,
    상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷을 평가하여 오디오 품질 평가 정보를 생성하는 단계는,
    상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 비트 레이트를 결정하고, 상기 비트 레이트에 따라 코드 압축 품질 정보를 취득하는 단계; 및
    상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실 상태 정보를 결정하고, 상기 코드 압축 품질 정보 및 상기 패킷 손실 상태 정보에 따라 상기 오디오 품질 평가 정보를 생성하는 단계를 포함하는, 오디오 스트림 품질 평가 방법.
  3. 제2항에 있어서,
    상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 비트 레이트를 결정하는 것은,
    상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷에 포함된 모든 비무음 오디오 프레임의 비트의 합과 상기 모든 비무음 오디오 프레임의 시간 길이의 합을 결정하고, 상기 비트의 합과 상기 시간 길이의 합에 따라 상기 비트 레이트를 생성하는 단계를 포함하는, 오디오 스트림 품질 평가 방법.
  4. 제2항 또는 제3항에 있어서,
    상기 패킷 손실 상태 정보는 패킷 손실률이고;
    상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실 상태 정보를 결정하고, 상기 코드 압축 품질 정보 및 상기 패킷 손실 상태 정보에 따라 상기 오디오 품질 평가 정보를 생성하는 단계는,
    상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실률을 결정하고, 상기 코드 압축 품질 정보 및 상기 패킷 손실률에 따라 상기 오디오 품질 평가 정보를 생성하는 단계를 포함하는, 오디오 스트림 품질 평가 방법.
  5. 제4항에 있어서,
    상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실률을 결정하는 것은,
    상기 평가될 오디오 스트림 내의 손실된 오디오 데이터 패킷의 총수와 손실된 무음 오디오 데이터 패킷의 수를 결정하고, 상기 손실된 오디오 데이터 패킷의 총수와 상기 손실된 무음 오디오 데이터 패킷의 수에 따라 손실된 비무음 오디오 데이터 패킷의 수를 결정하고, 상기 손실된 비무음 오디오 데이터 패킷의 수와 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 수에 따라 상기 패킷 손실률을 생성하는 것인, 오디오 스트림 품질 평가 방법.
  6. 제4항에 있어서,
    상기 코드 압축 품질 정보 및 상기 패킷 손실률에 따라 상기 오디오 품질 평가 정보를 생성하는 단계는,
    하기 식:
    Figure pct00021

    을 적용하여 상기 오디오 품질 평가 품질 Q를 계산하는 단계이고,
    상기 식에서, Qc는 상기 코드 압축 품질 정보이고, PLR은 상기 패킷 손실률이며, a1 a2 는 각각 미리 설정된 계수인, 오디오 스트림 품질 평가 방법.
  7. 제2항 또는 제3항에 있어서,
    상기 패킷 손실 상태 정보는 손실 빈도이고;
    상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실 상태 정보를 결정하고, 상기 코드 압축 품질 정보 및 상기 패킷 손실 상태 정보에 따라 상기 오디오 품질 평가 정보를 생성하는 단계는,
    상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 손실 빈도를 결정하고, 상기 코드 압축 품질 정보 및 상기 손실 빈도에 따라 상기 오디오 품질 평가 정보를 생성하는 단계인, 오디오 스트림 품질 평가 방법.
  8. 제7항에 있어서,
    상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 손실 빈도를 결정하는 것은,
    상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 손실 횟수를 결정하고, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷에 포함된 모든 비무음 오디오 프레임의 시간 길이의 합을 결정하고, 상기 손실 횟수와 상기 모든 비무음 오디오 프레임의 시간 길이의 합에 따라 상기 손실 빈도를 생성하는 것인, 오디오 스트림 품질 평가 방법.
  9. 제7항에 있어서,
    상기 코드 압축 품질 정보 및 상기 손실 빈도에 따라 상기 오디오 품질 평가 정보를 생성하는 단계는,
    하기 식:
    Figure pct00022

    을 적용하여 상기 오디오 품질 평가 정보 Q를 계산하는 단계이고,
    상기 식에서, Qc는 상기 코드 압축 품질 정보이고, LR은 상기 손실 빈도이며, a3 a4는 각각 미리 설정된 계수인, 오디오 스트림 품질 평가 방법.
  10. 제2항 또는 제3항에 있어서,
    상기 패킷 손실 상태 정보는 평균 손실 길이이고;
    상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실 상태 정보를 결정하고, 상기 코드 압축 품질 정보 및 상기 패킷 손실 상태 정보에 따라 상기 오디오 품질 평가 정보를 생성하는 단계는,
    상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 평균 손실 길이를 결정하고, 상기 코드 압축 품질 정보 및 상기 평균 손실 길이에 따라 상기 오디오 품질 평가 정보를 생성하는 단계인, 오디오 스트림 품질 평가 방법.
  11. 제10항에 있어서,
    상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 평균 손실 길이를 결정하는 것은,
    상기 평가될 오디오 스트림 내의 손실된 비무음 오디오 데이터 패킷을 결정하고, 상기 손실된 비무음 오디오 데이터 패킷의 시간 길이의 합을 결정하고,
    상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 손실 횟수를 결정하고, 상기 시간 길이의 합과 상기 손실 횟수에 따라 상기 평균 손실 길이를 생성하는 것인, 오디오 스트림 품질 평가 방법.
  12. 제10항에 있어서,
    상기 코드 압축 품질 정보 및 상기 평균 손실 길이에 따라 상기 오디오 품질 평가 정보를 생성하는 단계는,
    하기 식:
    Figure pct00023

    을 적용하여 상기 오디오 품질 평가 정보 Q를 계산하는 단계이고,
    상기 식에서, Qc는 상기 코드 압축 품질 정보이고, LD은 상기 평균 손실 길이이며, a5 a6은 각각 미리 설정된 계수인, 오디오 스트림 품질 평가 방법.
  13. 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷을 결정하도록 구성된 비무음 결정 유닛 - 상기 평가될 오디오 스트림은 하나 이상의 비무음 오디오 데이터 패킷을 포함하고, 각각의 비무음 오디오 데이터 패킷은 하나 이상의 비무음 오디오 프레임을 포함함 -; 및
    상기 비무음 결정 유닛과 연결되고, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷을 평가하여 오디오 품질 평가 정보를 생성하도록 구성된 평가 유닛
    을 포함하는 오디오 스트림 품질 평가 장치.
  14. 제13항에 있어서,
    상기 평가 유닛은,
    상기 비무음 결정 유닛과 연결되고, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 비트 레이트를 결정하고, 상기 비트 레이트에 따라 코드 압축 품질 정보를 취득하도록 구성된 취득 서브유닛; 및
    상기 취득 서브유닛과 연결되고, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실 상태 정보를 결정하고, 상기 코드 압축 품질 정보 및 상기 패킷 손실 상태 정보에 따라 상기 오디오 품질 평가 정보를 생성하도록 구성된 평가 서브유닛을 포함하는, 오디오 스트림 품질 평가 장치.
  15. 제14항에 있어서,
    상기 취득 서브유닛은, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷에 포함된 모든 비무음 오디오 프레임의 비트의 합과 상기 모든 비무음 오디오 프레임의 시간 길이의 합을 결정하고, 상기 비트의 합과 상기 시간 길이의 합에 따라 상기 비트 레이트를 생성하도록 더 구성되어 있는, 오디오 스트림 품질 평가 장치.
  16. 제14항 또는 제15항에 있어서,
    상기 패킷 손실 상태 정보는 패킷 손실률이고;
    상기 평가 서브유닛은,
    상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실률을 결정하고, 상기 코드 압축 품질 정보 및 상기 패킷 손실률에 따라 상기 오디오 품질 평가 정보를 생성하도록 더 구성되어 있는, 오디오 스트림 품질 평가 장치.
  17. 제16항에 있어서,
    상기 평가 서브유닛은, 상기 평가될 오디오 스트림에서 손실된 오디오 데이터 패킷의 총수와 손실된 무음 오디오 데이터 패킷의 수를 결정하고, 상기 손실된 오디오 데이터 패킷의 총수와 상기 손실된 무음 오디오 데이터 패킷의 수에 따라 손실된 비무음 오디오 데이터 패킷의 수를 결정하고, 상기 손실된 비무음 오디오 데이터 패킷의 수와 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 수에 따라 상기 패킷 손실률을 생성하도록 더 구성되어 있는, 오디오 스트림 품질 평가 장치.
  18. 제16항에 있어서,
    상기 평가 서브유닛은, 하기 식:
    Figure pct00024

    을 적용하여 상기 오디오 품질 평가 품질 Q를 계산하도록 더 구성되어 있고,
    상기 식에서, Qc는 상기 코드 압축 품질 정보이고, PLR은 상기 패킷 손실률이며, a1 a2는 각각 미리 설정된 계수인, 오디오 스트림 품질 평가 장치.
  19. 제14항 또는 제15항에 있어서,
    상기 패킷 손실 상태 정보는 손실 빈도이고;
    상기 평가 서브유닛은, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 손실 빈도를 결정하고, 상기 코드 압축 품질 정보 및 상기 손실 빈도에 따라 상기 오디오 품질 평가 정보를 생성하도록 더 구성되어 있는, 오디오 스트림 품질 평가 장치.
  20. 제19항에 있어서,
    상기 평가 서브유닛은, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 손실 횟수를 결정하고, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷에 포함된 모든 비무음 오디오 프레임의 시간 길이의 합을 결정하고, 상기 손실 횟수와 상기 모든 비무음 오디오 프레임의 시간 길이의 합에 따라 상기 손실 빈도를 생성하도록 더 구성되어 있는, 오디오 스트림 품질 평가 장치.
  21. 제19항에 있어서,
    상기 평가 서브유닛은, 하기 식:
    Figure pct00025

    을 적용하여 상기 오디오 품질 평가 정보 Q를 계산하도록 더 구성되어 있고,
    상기 식에서, Qc는 상기 코드 압축 품질 정보이고, LR은 상기 손실 빈도이며, a3 a4는 각각 미리 설정된 계수인, 오디오 스트림 품질 평가 장치.
  22. 제14항 또는 제15항에 있어서,
    상기 패킷 손실 상태 정보는 평균 손실 길이이고;
    상기 평가 서브유닛은, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 평균 손실 길이를 결정하고, 상기 코드 압축 품질 정보 및 상기 평균 손실 길이에 따라 상기 오디오 품질 평가 정보를 생성하도록 더 구성되어 있는, 오디오 스트림 품질 평가 장치.
  23. 제22항에 있어서,
    상기 평가 서브유닛은, 상기 평가될 오디오 스트림 내의 손실된 비무음 오디오 데이터 패킷을 결정하고, 상기 손실된 비무음 오디오 데이터 패킷의 시간 길이의 합을 결정하고, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 손실 횟수를 결정하고, 상기 시간 길이의 합과 상기 손실 횟수에 따라 상기 평균 손실 길이를 생성하도록 더 구성되어 있는, 오디오 스트림 품질 평가 장치.
  24. 제22항에 있어서,
    상기 평가 서브유닛은, 하기 식:
    Figure pct00026

    을 적용하여 상기 오디오 품질 평가 정보 Q를 계산하도록 더 구성되어 있고,
    상기 식에서, Qc는 상기 코드 압축 품질 정보이고, LD은 상기 평균 손실 길이이며, a5 a6은 각각 미리 설정된 계수인, 오디오 스트림 품질 평가 장치.
KR20157000892A 2012-08-21 2013-08-08 오디오 스트림 품질 평가 방법 및 장치 KR20150031287A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201210298856.2A CN103632679A (zh) 2012-08-21 2012-08-21 音频流质量评估方法及装置
CN201210298856.2 2012-08-21
PCT/CN2013/081071 WO2014029275A1 (zh) 2012-08-21 2013-08-08 音频流质量评估方法及装置

Publications (1)

Publication Number Publication Date
KR20150031287A true KR20150031287A (ko) 2015-03-23

Family

ID=50149417

Family Applications (1)

Application Number Title Priority Date Filing Date
KR20157000892A KR20150031287A (ko) 2012-08-21 2013-08-08 오디오 스트림 품질 평가 방법 및 장치

Country Status (5)

Country Link
US (1) US20150117653A1 (ko)
EP (1) EP2852099A4 (ko)
KR (1) KR20150031287A (ko)
CN (1) CN103632679A (ko)
WO (1) WO2014029275A1 (ko)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105100508B (zh) * 2014-05-05 2018-03-09 华为技术有限公司 一种网络语音质量评估方法、装置和系统
CN105989853B (zh) * 2015-02-28 2020-08-18 科大讯飞股份有限公司 一种音频质量评测方法及系统
US10008214B2 (en) * 2015-09-11 2018-06-26 Electronics And Telecommunications Research Institute USAC audio signal encoding/decoding apparatus and method for digital radio services
CN105845138A (zh) * 2016-03-25 2016-08-10 乐视控股(北京)有限公司 语音信号处理方法及装置
JP6586044B2 (ja) * 2016-05-13 2019-10-02 日本電信電話株式会社 音声品質推定装置、音声品質推定方法及びプログラム
CN108305628B (zh) * 2017-06-27 2020-10-02 腾讯科技(深圳)有限公司 语音识别方法、装置、计算机设备和存储介质
CN107818795B (zh) * 2017-11-15 2020-11-17 苏州驰声信息科技有限公司 一种英语口语的测评方法及装置
CN109410921B (zh) * 2018-09-30 2021-09-07 秒针信息技术有限公司 一种通过声音进行质量评估的方法及装置
US11144535B2 (en) * 2018-11-30 2021-10-12 The Boeing Company On-board vehicle recorder system monitor
CN112767955B (zh) * 2020-07-22 2024-01-23 腾讯科技(深圳)有限公司 音频编码方法及装置、存储介质、电子设备
CN113808618B (zh) * 2021-09-06 2024-04-16 广州世音联软件科技有限公司 音频质量评估方法及其装置、设备、介质、产品
CN113808617B (zh) * 2021-09-06 2024-04-16 广州世音联软件科技有限公司 音频数据排查方法及其装置、设备、介质、产品

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005026901A (ja) * 2003-06-30 2005-01-27 Nec Engineering Ltd VoIPネットワークにおける音声品質評価システムおよび方法
CN100347988C (zh) * 2003-10-24 2007-11-07 武汉大学 一种宽频带语音质量客观评价方法
WO2007045273A1 (en) * 2005-10-17 2007-04-26 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for estimating speech quality
JP4294673B2 (ja) * 2006-10-05 2009-07-15 日本電信電話株式会社 パケット品質評価システムおよび方法
RU2517393C2 (ru) * 2008-06-11 2014-05-27 Ниппон Телеграф Энд Телефон Корпорейшн Способ оценки качества аудиосигнала, устройство и считываемый компьютером записываемый носитель, записывающий программу
CN102448083B (zh) * 2010-10-12 2016-01-20 中兴通讯股份有限公司 一种无线通信语音质量评价装置、系统及方法

Also Published As

Publication number Publication date
US20150117653A1 (en) 2015-04-30
EP2852099A4 (en) 2015-06-17
CN103632679A (zh) 2014-03-12
EP2852099A1 (en) 2015-03-25
WO2014029275A1 (zh) 2014-02-27

Similar Documents

Publication Publication Date Title
KR20150031287A (ko) 오디오 스트림 품질 평가 방법 및 장치
US7583613B2 (en) Method of monitoring the quality of a realtime communication
EP1763173A2 (en) Transmission quality monitoring for multimedia streams
CN103957216B (zh) 基于音频信号特性分类的无参考音频质量评价方法和系统
US8868222B2 (en) Audio quality estimation method, audio quality estimation apparatus, and computer readable recording medium recording a program
US10284712B2 (en) Voice quality evaluation method, apparatus, and system
US11748643B2 (en) System and method for machine learning based QoE prediction of voice/video services in wireless networks
CN104038846A (zh) 缓存状态估计方法及设备
Markovski et al. Simulation and analysis of packet loss in user datagram protocol transfers
JP4460506B2 (ja) ユーザ体感品質推定装置、方法、およびプログラム
Lakaniemi et al. Subjective VoIP speech quality evaluation based on network measurements
US9203708B2 (en) Estimating user-perceived quality of an encoded stream
Cinar et al. Improved jitter buffer management for WebRTC
JP5335867B2 (ja) 基本GoP長を用いた映像品質推定装置及び方法及びプログラム
Sulovic et al. Dynamic codec selection algorithm for VoIP
Assem et al. Online estimation of VVoIP Quality-of-Experience via network emulation
JP4327685B2 (ja) ユーザ体感品質監視方法、ユーザ体感品質監視装置、推定モデルの生成方法および推定モデルの生成装置
US20200162603A1 (en) Methods and Devices for Improvements Relating to Voice Quality Estimation
JP3668144B2 (ja) パケット通信音声シミュレーション装置および方法
Sun et al. Voip quality of experience (QoE)
Orosz et al. A no-reference voice quality estimation method for Opus-based VoIP services
Orosz et al. VoicePerf: A Quality Estimation Approach for No-reference IP Voice Traffic
Rabassa et al. New speech traffic background simulation models for realistic VoIP network planning
Radnosrati et al. The choice of VoIP codec for mobile devices
Jung et al. Improving wireless VoIP quality by using adaptive packet coding

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application