KR20150031287A

KR20150031287A - 오디오 스트림 품질 평가 방법 및 장치

Info

Publication number: KR20150031287A
Application number: KR20157000892A
Authority: KR
Inventors: 샨 가오; 리나 선; 푸정 양
Original assignee: 후아웨이 테크놀러지 컴퍼니 리미티드
Priority date: 2012-08-21
Filing date: 2013-08-08
Publication date: 2015-03-23
Also published as: US20150117653A1; EP2852099A4; CN103632679A; EP2852099A1; WO2014029275A1

Abstract

본 발명의 실시예는 오디오 스트림 품질 평가 방법 및 장치를 제공하며, 상기 오디오 스트림 품질 평가 방법은, 평가될 오디오 스트림 내의 비무음(non-silence) 오디오 데이터 패킷을 결정하는 단계 - 상기 평가될 오디오 스트림은 하나 이상의 비무음 오디오 데이터 패킷을 포함하고, 각각의 비무음 오디오 데이터 패킷은 하나 이상의 비무음 오디오 프레임을 포함함 -; 및 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷을 평가하여 오디오 품질 평가 정보를 생성하는 단계를 포함한다. 본 발명의 실시예에 의해 제공되는 오디오 스트림 품질 평가 방법 및 장치는 오디오 품질의 평가 시에 무음 부분의 영향을 회피할 수 있으므로, 오디오 스트림 평가의 정확도를 향상시킨다.

Description

오디오 스트림 품질 평가 방법 및 장치 {METHOD AND APPARATUS FOR EVALUATING QUALITY OF AUDIO STREAM}

본 발명의 실시예는 네트워크 오디오 기술에 관한 것으로, 특히 오디오 스트림 품질 평가 방법 및 장치에 관한 것이다.

최근, 디지털 네트워크 및 초대규모 집적회로 기술의 급속한 발전은 다양한 오디오 처리 기술 및 오디오 전송 기술의 끊임없는 출현을 낳았다. 오디오에 대한 통신 사용자 및 소비자의 주관적 느낌은 궁극적으로 오디오 품질에 의존하기 때문에, 오디오 및 비디오 품질의 평가는 점점 중요한 연구 주제가 되고 있다. 네트워크 오디오 송신 기술은 중요한 애플리케이션이 되었으며, 점점 더 많은 오디오 통신 임무를 맡게 되었다. 오디오 전송 과정에서, 복수의 네트워크 인자로 인해, 오디오에 패킷 손실이 발생하고 결과적으로 오디오 품질에 영향을 미친다. 네트워크 오디오 품질의 정확하고 신뢰성 있는 측정 및 평가는 네트워크 측정과 네트워크 계획 및 설계에서 매우 중요한 문제이다.

종래기술에서, 오디오 품질을 평가하는 방법은 일반적으로 오디오 스트림의 섹션 내의 모든 오디오 데이터 패킷의 전송 상태에 따라 수행되고, 평가 결과는 부정확하다.

본 발명의 실시예는 오디오 스트림 품질 평가의 정확도를 향상시키기 위해, 오디오 스트림 품질을 평가하는 방법 및 장치를 제공한다.

제1 측면에 따르면, 본 발명의 실시예는,

평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷(non-silence audio data packet)을 결정하는 단계 - 상기 평가될 오디오 스트림은 하나 이상의 비무음 오디오 데이터 패킷을 포함하고, 각각의 비무음 오디오 데이터 패킷은 하나 이상의 비무음 오디오 프레임을 포함함 -; 및

상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷을 평가하여 오디오 품질 평가 정보를 생성하는 단계를 포함하는 오디오 스트림 품질 평가 방법을 제공한다.

제1 가능한 구현 방식에서, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷을 평가하여 오디오 품질 평가 정보를 생성하는 단계는,

상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 비트 레이트(bit rate)을 결정하고, 상기 비트 레이트에 따라 코드 압축 품질 정보(code compression quality information)를 취득하는 단계; 및

상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실 상태 정보(packet loss status information)를 결정하고, 상기 코드 압축 품질 정보 및 상기 패킷 손실 상태 정보에 따라 상기 오디오 품질 평가 정보를 생성하는 단계를 포함한다.

제1 측면의 제1 가능한 구현 방식을 참조하여, 제2 가능한 구현 방식에서, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 비트 레이트를 결정하는 것은 구체적으로,

상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷에 포함된 모든 비무음 오디오 프레임의 비트의 합과 상기 모든 비무음 오디오 프레임의 시간 길이의 합을 결정하고, 상기 비트의 합과 상기 시간 길이의 합에 따라 상기 비트 레이트를 생성하는 것이다.

제1 측면의 상기 제1 또는 제2 구현 방식을 참조하여, 제3 가능한 구현 방식에서, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실 상태 정보를 결정하고, 상기 코드 압축 품질 정보 및 상기 패킷 손실 상태 정보에 따라 상기 오디오 품질 평가 정보를 생성하는 단계는 구체적으로,

상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실률(packet loss rate)을 결정하고, 상기 코드 압축 품질 정보 및 상기 패킷 손실률에 따라 상기 오디오 품질 평가 정보를 생성하는 단계이다.

제1 측면의 제3 가능한 구현 방식을 참조하여, 제4 가능한 구현 방식에서, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실률을 결정하는 것은 구체적으로,

상기 평가될 오디오 스트림 내의 손실된 오디오 데이터 패킷의 총수와 손실된 무음 오디오 데이터 패킷의 수를 결정하고, 상기 손실된 오디오 데이터 패킷의 총수와 상기 손실된 무음 오디오 데이터 패킷의 수에 따라 손실된 비무음 오디오 데이터 패킷의 수를 결정하고, 상기 손실된 비무음 오디오 데이터 패킷의 수와 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 수에 따라 상기 패킷 손실률을 생성하는 것이다.

제1 측면의 제3 가능한 구현 방식을 참조하여, 제5 가능한 구현 방식에서, 상기 코드 압축 품질 정보 및 상기 패킷 손실률에 따라 상기 오디오 품질 평가 정보를 생성하는 단계는 구체적으로,

하기 식:

을 적용하여 상기 오디오 품질 평가 품질 Q를 계산하는 단계이고, 상기 식에서, Q_c는 상기 코드 압축 품질 정보이고, PLR은 상기 패킷 손실률이며, a₁ 및a₂ 는 각각 미리 설정된 계수이다.

제1 측면의 제1 또는 제2 가능한 구현 방식을 참조하여, 제6 가능한 구현 방식에서, 상기 패킷 손실 상태 정보는 손실 빈도(loss frequency)이고;

상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실 상태 정보를 결정하고, 상기 코드 압축 품질 정보 및 상기 패킷 손실 상태 정보에 따라 상기 오디오 품질 평가 정보를 생성하는 단계는 구체적으로,

상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 손실 빈도를 결정하고, 상기 코드 압축 품질 정보 및 상기 손실 빈도에 따라 상기 오디오 품질 평가 정보를 생성하는 단계이다.

제1 측면의 제6 가능한 구현 방식을 참조하여, 제7 가능한 구현 방식에서, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 손실 빈도를 결정하는 것은 구체적으로,

상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 손실 횟수를 결정하고, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷에 포함된 모든 비무음 오디오 프레임의 시간 길이의 합을 결정하고, 상기 손실 횟수와 상기 모든 비무음 오디오 프레임의 시간 길이의 합에 따라 상기 손실 빈도를 생성하는 것이다.

제1 측면의 제6 가능한 구현 방식을 참조하여, 제8 가능한 구현 방식에서, 상기 코드 압축 품질 정보 및 상기 손실 빈도에 따라 상기 오디오 품질 평가 정보를 생성하는 단계는 구체적으로,

하기 식:

을 적용하여 상기 오디오 품질 평가 정보 Q를 계산하는 단계이고, 상기 식에서, Q_c는 상기 코드 압축 품질 정보이고, LR은 상기 손실 빈도이며, a₃ 및a₄는 각각 미리 설정된 계수이다.

제1 측면의 제1 또는 제2 가능한 구현 방식을 참조하여, 제9 가능한 구현 방식에서, 상기 패킷 손실 상태 정보는 평균 손실 길이이고;

상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 평균 손실 길이를 결정하고, 상기 코드 압축 품질 정보 및 상기 평균 손실 길이에 따라 상기 오디오 품질 평가 정보를 생성하는 단계이다.

제1 측면의 제9 가능한 구현 방식을 참조하여, 제10 가능한 구현 방식에서, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 평균 손실 길이를 결정하는 것은 구체적으로,

상기 평가될 오디오 스트림 내의 손실된 비무음 오디오 데이터 패킷을 결정하고, 상기 손실된 비무음 오디오 데이터 패킷의 시간 길이의 합을 결정하고, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 손실 횟수를 결정하고, 상기 시간 길이의 합과 상기 손실 횟수에 따라 상기 평균 손실 길이를 생성하는 것이다.

제1 측면의 제9 가능한 구현 방식을 참조하여, 제11 가능한 구현 방식에서, 상기 코드 압축 품질 정보 및 상기 평균 손실 길이에 따라 상기 오디오 품질 평가 정보를 생성하는 단계는 구체적으로,

하기 식:

을 적용하여 상기 오디오 품질 평가 정보 Q를 계산하는 단계이고, 상기 식에서, Q_c는 상기 코드 압축 품질 정보이고, LD은 상기 평균 손실 길이이며, a₅ 및a₆은 각각 미리 설정된 계수이다.

제2 측면에 따르면, 본 발명의 실시예는,

평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷을 결정하도록 구성된 비무음 결정 유닛 - 상기 평가될 오디오 스트림은 하나 이상의 비무음 오디오 데이터 패킷을 포함하고, 각각의 비무음 오디오 데이터 패킷은 하나 이상의 비무음 오디오 프레임을 포함함 -; 및

상기 비무음 결정 유닛과 연결되고, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷을 평가하여 오디오 품질 평가 정보를 생성하도록 구성된 평가 유닛을 포함하는 오디오 스트림 품질 평가 장치를 제공한다.

제1 가능한 구현 방식에서, 상기 평가 유닛은,

상기 비무음 결정 유닛과 연결되고, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 비트 레이트를 결정하고, 상기 비트 레이트에 따라 코드 압축 품질 정보를 취득하도록 구성된 취득 서브유닛; 및

상기 취득 서브유닛과 연결되고, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실 상태 정보를 결정하고, 상기 코드 압축 품질 정보 및 상기 패킷 손실 상태 정보에 따라 상기 오디오 품질 평가 정보를 생성하도록 구성된 평가 서브유닛을 포함한다.

상기 제2 측면의 제1 가능한 구현 방식을 참조하여, 제2 가능한 구현 방식에서, 상기 취득 서브유닛은, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷에 포함된 모든 비무음 오디오 프레임의 비트의 합과 상기 모든 비무음 오디오 프레임의 시간 길이의 합을 결정하고, 상기 비트의 합과 상기 시간 길이의 합에 따라 상기 비트 레이트를 생성하도록 더 구성되어 있다.

상기 제2 측면의 제1 또는 제2 가능한 구현 방식을 참조하여, 제3 가능한 구현 방식에서, 상기 패킷 손실 상태 정보는 패킷 손실률이고;

상기 평가 서브유닛은, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실률을 결정하고, 상기 코드 압축 품질 정보 및 상기 패킷 손실률에 따라 상기 오디오 품질 평가 정보를 생성하도록 더 구성되어 있다.

상기 제2 측면의 제3 가능한 구현 방식을 참조하여, 제4 가능한 구현 방식에서, 상기 평가 서브유닛은, 상기 평가될 오디오 스트림 내의 손실된 오디오 데이터 패킷의 총수와 손실된 무음 오디오 데이터 패킷의 수를 결정하고, 상기 손실된 오디오 데이터 패킷의 총수와 상기 손실된 무음 오디오 데이터 패킷의 수에 따라 손실된 비무음 오디오 데이터 패킷의 수를 결정하고, 상기 손실된 비무음 오디오 데이터 패킷의 수와 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 수에 따라 상기 패킷 손실률을 생성하도록 더 구성되어 있다.

상기 제2 측면의 제3 가능한 구현 방식을 참조하여, 제5 가능한 구현 방식에서, 상기 평가 서브유닛은, 하기 식:

을 적용하여 상기 오디오 품질 평가 품질 Q를 계산하도록 더 구성되어 있고, 상기 식에서, Q_c는 상기 코드 압축 품질 정보이고, PLR은 상기 패킷 손실률이며, a₁ 및a₂는 각각 미리 설정된 계수이다.

상기 제2 측면의 제1 또는 제2 가능한 구현 방식을 참조하여, 제6 가능한 구현 방식에서, 상기 패킷 손실 상태 정보는 손실 빈도이고;

상기 평가 서브유닛은, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 손실 빈도를 결정하고, 상기 코드 압축 품질 정보 및 상기 손실 빈도에 따라 상기 오디오 품질 평가 정보를 생성하도록 더 구성되어 있다.

상기 제2 측면의 제6 가능한 구현 방식을 참조하여, 제7 가능한 구현 방식에서, 상기 평가 서브유닛은, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 손실 횟수를 결정하고, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷에 포함된 모든 비무음 오디오 프레임의 시간 길이의 합을 결정하고, 상기 손실 횟수와 상기 모든 비무음 오디오 프레임의 시간 길이의 합에 따라 상기 손실 빈도를 생성하도록 더 구성되어 있다.

상기 제2 측면의 제6 가능한 구현 방식을 참조하여, 제8 가능한 구현 방식에서, 상기 평가 서브유닛은, 하기 식:

을 적용하여 상기 오디오 품질 평가 정보 Q를 계산하도록 더 구성되어 있고, 상기 식에서, Q_c는 상기 코드 압축 품질 정보이고, LR은 상기 손실 빈도이며, a₃ 및a₄는 각각 미리 설정된 계수이다.

상기 제2 측면의 제1 또는 제2 가능한 구현 방식을 참조하여, 제9 가능한 구현 방식에서, 상기 패킷 손실 상태 정보는 평균 손실 길이이고;

상기 평가 서브유닛은, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 평균 손실 길이를 결정하고, 상기 코드 압축 품질 정보 및 상기 평균 손실 길이에 따라 상기 오디오 품질 평가 정보를 생성하도록 더 구성되어 있다.

상기 제2 측면의 제9 가능한 구현 방식을 참조하여, 제10 가능한 구현 방식에서, 상기 평가 서브유닛은, 상기 평가될 오디오 스트림 내의 손실된 비무음 오디오 데이터 패킷을 결정하고, 상기 손실된 비무음 오디오 데이터 패킷의 시간 길이의 합을 결정하고, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 손실 횟수를 결정하고, 상기 시간 길이의 합과 상기 손실 횟수에 따라 상기 평균 손실 길이를 생성하도록 더 구성되어 있다.

상기 제2 측면의 제9 가능한 구현 방식을 참조하여, 제11 가능한 구현 방식에서, 상기 평가 서브유닛은, 하기 식:

을 적용하여 상기 오디오 품질 평가 정보 Q를 계산하도록 더 구성되어 있고,

상기 식에서, Q_c는 상기 코드 압축 품질 정보이고, LD은 상기 평균 손실 길이이며, a₅ 및a₆은 각각 미리 설정된 계수이다.

전술한 기술적 방안으로부터, 본 발명의 실시예에 따른 오디오 스트림 품질 평가 방법 및 장치에서, 오디오 스트림 품질 평가 장치는, 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷을 결정하고, 평가될 오디오 스트림은 하나 이상의 비무음 오디오 데이터 패킷을 포함하고, 각각의 비무음 오디오 데이터 패킷은 하나 이상의 비무음 오디오 프레임을 포함하며; 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷을 평가하여 오디오 품질 평가 정보를 생성한다. 무음 오디오 데이터 패킷이 어떠한 유용한 정보도 포함하지 않기 때문에, 오디오 스트림 품질 평가는 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷에 대해서만 수행되고, 이로써 무음 부분이 오디오 품질의 평가에 미치는 영향을 회피할 수 있으므로, 오디오 스트림 품질 평가의 정확성을 향상시킨다.

본 발명의 실시예에서의 기술적 방안 또는 종래기술을 더욱 명확하게 설명하기 위해, 이하에 본 발명의 실시예 또는 종래기술의 설명에 필요한 첨부도면을 간단하게 소개한다. 명백히, 아래의 설명에서의 첨부도면은 단지 본 발명의 일부 실시예를 보여줄 뿐이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진자(이하, 당업자라고 함)라면 여전히 창의적인 노력 없이 이들 첨부도면에 따라 다른 도면을 도출할 수 있을 것이다.
도 1은 본 발명의 실시예에 따른 오디오 스트림 품질 평가 방법의 흐름도이다.
도 2는 본 발명의 실시예에 따른 다른 오디오 스트림 품질 평가 방법의 흐름도이다.
도 3은 본 발명의 실시예에 따른 오디오 스트림 품질 평가 장치의 개략 구성도이다.
도 4는 본 발명의 실시예에 따른 다른 오디오 스트림 품질 평가 장치의 개략 구성도이다.

본 발명의 실시예의 목적, 기술적 방안, 및 이점을 더욱 분명하게 하기 위해, 이하에 본 발명의 실시예에서의 첨부도면을 참조하여 본 발명의 실시예에서의 기술적 방안을 명확하고 완전하게 설명한다. 명백히, 설명된 실시예는 본 발명의 모든 실시예가 아니라 단지 일부 실시예일 뿐이다. 당업자가 본 발명의 실시예에 기초하여 창의적인 노력 없이 얻은 모든 다른 실시예는 본 발명의 보호 범위에 속한다.

도 1은 본 발명의 일 실시예에 따른 오디오 스트림 품질 평가 방법의 흐름도이다. 도 1에 도시된 바와 같이, 본 발명의 본 실시예에 따른 오디오 스트림 품질 평가 방법은 구체적으로 오디오 스트림의, 특히 네트워크 오디오 스트림의 품질을 평가하는 프로세스에 적용될 수 있다. 네트워크 오디오 스트림은 구체적으로 네트워크를 통해 전송되는 오디오 스트림이다. 본 발명의 본 실시예에 따른 오디오 스트림 품질 평가 방법은 오디오 스트림 품질 평가 장치에 의해 실행될 수 있으며, 오디오 스트림 품질 평가 장치는 소프트웨어 및/또는 하드웨어 방식으로 구현될 수 있다.

본 발명의 본 실시예에 따른 오디오 스트림 품질 평가 방법은, 이하의 단계를 포함한다:

단계 10: 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷을 결정하며, 평가될 오디오 스트림은 하나 이상의 비무음 오디오 데이터 패킷을 포함하고, 각각의 비무음 오디오 데이터 패킷은 하나 이상의 비무음 오디오 프레임을 포함한다.

단계 20: 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷을 평가하여 오디오 품질 평가 정보를 생성한다.

구체적으로, 오디오 스트림의 부분에 대해 품질 평가가 수행되는 경우, 그 오디오 스트림의 부분이 평가될 오디오 스트림이고, 평가될 오디오 스트림은 구체적으로 미리 설정된 음성 코딩 표준(speech coding standard)을 따르는 오디오 스트림이며, 미리 설정된 음성 코딩 표준은 적응형 멀티레이트(Adaptive Multi-Rate, 약칭하여 AMR) 코딩 표준, 고급 오디오 코딩(Advanced Audio Coding, 약칭하여 AAC) 표준, 또는 고효율 고급 오디오(High Efficiency Advanced Audio Coding, 약칭하여 HEAAC) 표준, 등일 수 있다. 평가될 오디오 스트림은 복수의 오디오 데이터 패킷을 포함하고, 각각의 오디오 데이터 패킷은 패킷 헤더(packet header)와 오디오 페이로드(audio payload)를 포함하고, 오디오 페이로드는 하나 이상의 오디오 프레임을 포함한다. 평가될 오디오 스트림 내의 오디오 패킷 데이터 각각은 동일한 수의 오디오 프레임을 포함한다.

오디오 스트림은 종종 무음 부분(silence part), 예를 들면, 대화의 간격(talk interval)을 가지므로, 오디오 데이터 패킷은 두 가지 유형: 비무음 오디오 데이터 패킷 및 무음 오디오 데이터 패킷으로 분류될 수 있다. 오디오 데이터 패킷 내의 오디오 프레임이 모두 무음 오디오 프레임인 경우, 그 오디오 패킷은 무음 오디오 데이터 패킷이고; 오디오 데이터 패킷 내에 하나 이상의 비무음 오디오 프레임이 존재하는 경우, 그 오디오 패킷은 하나 이상의 비무음 오디오 데이터 패킷이다. 무음 프레임은 어떠한 유용한 정보도 포함하지 않고, 무음 프레임의 손실은 오디오 스트림 품질에 영향도 미치지 않기 때문에, 평가될 오디오 스트림 내의 오디오 데이터 패킷이 모두 무음 오디오 데이터 패킷인 경우, 그 평가될 오디오 스트림에 대해서는 품질 평가를 수행하지 않는다.

실제 애플리케이션의 프로세스에서, 상이한 음성 코딩 표준에 의해 처리되는, 오디오 스트림 내의 비무음 오디오 프레임의 압축 바이트 수는 상이하다. 예를 들어, 표 1은 AMR 코딩 표준이 사용되는 경우 상이한 코딩 방식에서의 비무음 오디오 프레임 각각의 압축 바이트 수를 나열하고 있다. 또, 무음 오디오 프레임의 길이가 비무음 오디오 프레임의 길이보다 훨씬 적기 때문에, 오디오 데이터 패킷이 비무음 오디오 데이터 패킷인지 무음 오디오 데이터 패킷인지는 오디오 데이터 패킷 내의 오디오 페이로드의 길이에 따라 결정될 수 있다.

평가될 오디오 스트림 내의 모든 비무음 오디오 데이터 패킷을 평가하여 오디오 품질 평가 정보를 생성한다. 평가될 오디오 스트림 내의 비무음 부분의 오디오 품질의 평가는 구체적으로 G.1070 오디오 품질 평가 방법을 사용하여 구현될 수 있고, 다른 오디오 품질 평가 방법을 사용하여 구현될 수도 있다.

본 발명의 본 실시예에 따른 오디오 스트림 품질 평가 방법에서, 오디오 스트림 품질 평가 장치는 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷을 결정하며, 평가될 오디오 스트림은 하나 이상의 비무음 오디오 데이터 패킷을 포함하고, 각각의 비무음 오디오 데이터 패킷은 하나 이상의 비무음 오디오 프레임을 포함하며; 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷을 평가하여 오디오 품질 평가 정보를 생성한다. 무음 오디오 데이터 패킷은 어떠한 유용한 정보도 포함하지 않기 때문에, 오디오 스트림 품질 평가는 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷에 대해서만 수행되고, 이로써 무음 부분이 오디오 품질의 평가에 미치는 영향을 회피할 수 있으므로, 오디오 스트림 품질 평가의 정확성을 향상시킨다.

도 2는 본 발명의 실시예에 따른 다른 오디오 스트림 품질 평가 방법의 흐름도이다. 도 2에 도시된 바와 같이, 본 실시예서, 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷을 평가하여 오디오 품질 평가 정보를 생성하는 단계 20은 구체적으로, 이하 단계를 포함할 수 있다:

단계 201: 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 비트 레이트를 결정하고, 비트 레이트에 따라 코드 압축 품질 정보를 취득한다.

단계 202: 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실 상태 정보를 결정하고, 코드 압축 품질 정보 및 패킷 손실 상태 정보에 따라 오디오 품질 평가 정보를 생성한다.

구체적으로, 코드 압축 품질 정보는 상이한 음성 코딩 표준에 따라 변화한다. 코드 압축 품질 정보는 음성 코딩 표준에 따라 코드 압축 품질의 상태를 반영할 수 있고, 오디오 전송 과정에서 오디오 스트림 내의 오디오 데이터 패킷이 손실되지 않은 경우 오디오 품질의 상태를 반영할 수도 있다. 비트 레이트와 코드 압축 품질 정보 사이의 대응관계는 실험 데이터에 따라 미리 설정될 수 있다. 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 비트 레이트를 결정하고, 그 비트 레이트에 대응하는 코드 압축 품질 정보가 취득된다.

평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실 상태 정보는 구체적으로 패킷 손실률, 손실 빈도 또는 평균 손실 길이와 같은 정보를 포함할 수 있다. 비무음 오디오 데이터 패킷의 패킷 손실 상태 정보는 비무음 오디오 데이터 패킷의 패킷 손실 상황(packet loss condition)을 나타내는 데 사용된다. 평가될 오디오 스트림의 오디오 품질을 평가하는 프로세스에서는, 비무음 오디오 데이터 패킷의 패킷 손실 상황만 고려되며, 이로써 무음 오디오 데이터 패킷의 손실이 오디오 품질 평가에 영향을 미치는 것을 회피할 수 있으므로, 오디오 품질 평가의 정확성을 향상시킨다.

본 실시예에서, 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 비트 레이트를 결정하는 단계 201은 구체적으로,

평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷에 포함된 모든 비무음 오디오 프레임의 비트의 합과, 모든 비무음 오디오 프레임의 시간 길이의 합을 결정하고, 비트의 합과 시간 길이의 합에 따라 비트 레이트를 생성하는 단계일 수 있다.

구체적으로, 오디오 데이터 패킷의 패킷 헤더 부분에 포함된 정보는 미리 설정된 음성 코딩 표준에 따라 고정되어 있으며, 오디오 데이터 패킷의 패킷 헤더는 일반적으로, 실시간 전송 프로토콜(Real-time Transport Protocol, 약칭하여 RTP) 헤더, 사용자 데이터그램 프로토콜(User Datagram Protocol, 약칭하여 UDP) 헤더, 및 인터넷 프로토콜(Internet Protocol, 약칭하여 IP) 헤더를 포함한다. 미리 설정된 음성 코딩 표준이 브로드캐스트 도메인에 적용 가능한 음성 코딩 표준이면, 오디오 데이터 패킷의 패킷 헤더는 전송 스트림h(Transport Stream, 약칭하여 TS)헤더를 더 포함할 수 있다. RTP 헤더, UDP 헤더, IP 헤더, 및 TS 헤더의 길이는 고정되어 있고, 패킷 헤더의 길이는 RTP 헤더, UDP 헤더, IP 헤더, 및 TS 헤더의 길이에 따라 결정될 수 있다. 오디오 데이터 패킷 내의 오디오 페이로드의 유효 길이는 오디오 데이터 패킷의 총 길이에서 패킷 헤더의 길이를 감산하여 취득될 수 있다. 각각의 비무음 오디오 데이터 패킷의 경우, 오디오 페이로드에 포함된 오디오 프레임의 수가 일정하고 비무음 오디오 프레임의 길이가 일정하기 때문에, 비무음 오디오 프레임의 수 및 비트를 결정할 수 있다. 비무음 오디오 데이터 패킷의 시간 길이는 비무음 오디오 데이터 패킷 내의 패킷 헤드의 타임스탬프(timestamp)에 따라 결정될 수 있고, 또한, 비무음 오디오 데이터 패킷 내의 비무음 오디오 프레임의 시간 길이가 결정될 수 있다. 따라서, 비트 레이트 R은 하기 식:

을 적용하여 계산되며, 상기 식에서 M은 평가될 오디오 스트림의 비무음 오디오 프레임의 수이고, B_i는 i번째 비무음 오디오 프레임의 비트 수이며, Duration_i 는 i번째 비무음 오디오 프레임의 시간 길이이다.

본 실시예에서, 패킷 손실 상태 정보는 패킷 손실률이다. 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실 상태 정보를 결정하고, 코드 압축 품질 정보 및 패킷 손실 상태 정보에 따라 오디오 품질 평가 정보를 생성하는 단계 202는 구체적으로,

평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실률을 결정하고, 코드 압축 품질 정보 및 패킷 손실률에 따라 오디오 품질 평가 정보를 생성하는 단계일 수 있다.

본 실시예에서, 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실률을 결정하는 것은 구체적으로,

평가될 오디오 스트림 내의 손실된 오디오 데이터 패킷의 총수와 손실된 무음 오디오 데이터 패킷의 수를 결정하고, 손실된 오디오 데이터 패킷의 총수와 손실된 무음 오디오 데이터 패킷의 수에 따라 손실된 비무음 오디오 데이터 패킷의 수를 결정하고, 손실된 비무음 오디오 데이터 패킷의 수와 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 수에 따라 패킷 손실률을 생성하는 것일 수 있다.

구체적으로, 오디오 데이터 패킷의 패킷 헤더 내의 RTP 헤더는 일련번호 필드를 구비하여 오디오 데이터 패킷의 시퀀스를 나타내고, 손실된 오디오 데이터 패킷의 총수는 평가될 오디오 스트림 내의 오디오 데이터 패킷 각각의 RTP 헤더의 일련번호 필드에 따라 결정될 수 있다. 손실된 오디오 데이터 패킷에 인접한 두 개의 오디오 데이터 패킷이 모두 무음 오디오 데이터 패킷이면, 손실된 오디오 데이터 패킷은 무음 오디오 데이터 패킷이다. 예를 들어, 평가될 오디오 스트림의 오디오 데이터 패킷의 일련번호는 각각 1, 2, 3, 5, 및 6이다. 그러면, 일련번호 4인 오디오 데이터 패킷이 손실된 것으로 결정될 수 있다. 일련번호 3 및 일련번호 5인 오디오 데이터 패킷이 모두 무음 오디오 데이터 패킷이면, 일련번호 4인 손실된 오디오 데이터 패킷도 무음 오디오 데이터 패킷이므로, 손실된 무음 오디오 데이터 패킷의 수를 결정할 수 있다. 분실된 비무음 오디오 데이터 패킷의 수는 손실된 오디오 데이터 패킷의 총수에서 손실된 무음 오디오 데이터 패킷의 수를 감산하여 취득된다.

패킷 손실률 PLR은 하기 식:

을 적용하여 계산되며, 상기 식에서 N1은 손실된 비무음 오디오 데이터 패킷의 수이고, N2는 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 수이다.

본 실시예에서, 코드 압축 품질 정보 및 패킷 손실률에 따라 오디오 품질 평가 정보를 생성하는 것은 구체적으로,

하기 식:

을 적용하여 오디오 품질 평가 품질 Q를 계산하는 것일 수 있으며, 상기 식에서, Q_c는 코드 압축 품질 정보이고, PLR은 패킷 손실률이며, a₁ 및a₂ 는 각각 미리 설정된 계수이다.

구체적으로, a₁ 및a₂ 는 미리 설정된 계수이며, 트레이닝 데이터베이스를 트레이닝하여 취득될 수 있다.

본 실시예에서, 패킷 손실 상태 정보는 손실 빈도이다. 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실 상태 정보를 결정하고, 코드 압축 품질 정보 및 패킷 손실 상태 정보에 따라 오디오 품질 평가 정보를 생성하는 단계 202는 구체적으로,

평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 손실 빈도를 결정하고, 코드 압축 품질 정보 및 손실 빈도에 따라 오디오 품질 평가 정보를 생성하는 단계일 수 있다.

본 실시예에서, 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 손실 빈도를 결정하는 것은 구체적으로,

평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 손실 횟수를 결정하고, 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷에 포함된 모든 비무음 오디오 프레임의 시간 길이의 합을 결정하고, 손실 횟수와 모든 비무음 오디오 프레임의 시간 길이의 합에 따라 손실 빈도를 생성하는 것일 수 있다.

구체적으로, 비무음 오디오 데이터 패킷의 손실 횟수는 평가될 오디오 스트림에 포함된 비무음 오디오 데이터 패킷의 패킷 손실 이벤트의 발생 총 횟수이고, 연속적인 패킷 손실은 하나의 패킷 손실 이벤트에 속한다. 예를 들어, 일련번호 1, 2, 3, 6, 8, 및 9인 오디오 데이터 패킷이 모든 비무음 오디오 데이터 패킷이고, 손실된 비무음 오디오 데이터 패킷의 일련번호는 각각 4, 5, 및 7이다. 손실된 비무음 오디오 데이터 패킷의 수가 3이더라도, 일련번호 4와 5인 비무음 오디오 데이터 패킷은 연속하는 오디오 데이터 패킷이므로, 비무음 오디오 데이터 패킷의 손실 횟수는 2이다.

손실 빈도 LR은 하기 식:

을 적용하여 계산되며, 상기 식에서 N3은 비무음 오디오 데이터 패킷의 손실 횟수이고, M은 평가될 오디오 스트림 내의 비무음 오디오 프레임의 수이며, Duration_i는 i번째 비무음 오디오 프레임의 시간 길이다.

본 실시예에서, 코드 압축 품질 정보 및 손실 빈도에 따라 오디오 품질 평가 정보를 생성하는 것은 구체적으로,

하기 식:

을 적용하여 오디오 품질 평가 정보 Q를 계산하는 것일 수 있으며, 상기 식에서, Q_c는 코드 압축 품질 정보이고, LR은 손실 빈도이며, a₃ 및 a₄는 각각 미리 설정된 계수이다.

구체적으로, a₃ 및 a₄는 미리 설정된 계수이고, 트레이닝 데이터베이스(training database)를 트레이닝하여 취득될 수 있다.

본 실시예에서, 패킷 손실 상태 정보는 평균 손실 길이이고; 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실 상태 정보를 결정하고, 코드 압축 품질 정보 및 패킷 손실 상태 정보에 따라 오디오 품질 평가 정보를 생성하는 단계는 구체적으로,

평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 평균 손실 길이를 결정하고, 코드 압축 품질 정보 및 평균 손실 길이에 따라 오디오 품질 평가 정보를 생성하는 단계일 수 있다.

본 실시예에서, 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 평균 손실 길이를 결정하는 것은 구체적으로,

평가될 오디오 스트림 내의 손실된 비무음 오디오 데이터 패킷을 결정하고, 손실된 비무음 오디오 데이터 패킷의 시간 길이의 합을 결정하고, 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 손실 횟수를 결정하고, 시간 길이의 합과 손실 횟수에 따라 상기 평균 손실 길이를 생성하는 것일 수 있다.

구체적으로, 오디오 데이터 패킷의 패킷 헤더 내의 RTP 헤더는 일련번호 필드를 구비하여 오디오 데이터 패킷의 시퀀스를 나타내고, 손실된 오디오 데이터 패킷은 평가될 오디오 스트림 내의 오디오 데이터 패킷 각각의 RTP 헤더의 일련번호 필드에 따라 결정될 수 있다. 손실된 오디오 데이터 패킷에 인접한 두 개의 오디오 데이터 패킷이 모두 무음 오디오 데이터 패킷이면, 손실된 오디오 데이터 패킷은 무음 오디오 데이터 패킷이다. 손실된 비무음 오디오 데이터 패킷은 손실된 무음 오디오 데이터 패킷을 결정함으로써 결정된다. 손실된 비무음 오디오 데이터 패킷의 시간 길이의 합은 평가될 오디오 스트림 내의 오디오 데이터 패킷의 RTP 헤더의 타임스탬프에 따라 결정될 수 있다.

비무음 오디오 데이터 패킷의 손실 횟수는 평가될 오디오 스트림에 포함된 비무음 오디오 데이터 패킷의 패킷 손실 이벤트의 발생 총 횟수이고, 연속적인 패킷 손실은 하나의 패킷 손실 이벤트에 속한다. 예를 들어, 각각 일련번호 1, 2, 3, 6, 8, 및 9인 오디오 데이터 패킷이 모든 비무음 오디오 데이터 패킷이고, 손실된 비무음 오디오 데이터 패킷의 일련번호는 각각 4, 5, 및 7이다. 손실된 비무음 오디오 데이터 패킷의 수가 3이더라도, 일련번호 4와 5인 비무음 오디오 데이터 패킷은 연속하는 오디오 데이터 패킷이므로, 비무음 오디오 데이터 패킷의 손실 횟수는 2이다.

평균 손실 길이 LD는 하기 식:

을 적용하여 계산되며, 상기 식에서, T1은 손실된 비무음 오디오 데이터 패킷의 시간 길이의 합이고, N3은 손실된 비무음 오디오 데이터 패킷의 손실 횟수이다.

본 실시예에서, 코드 압축 품질 정보 및 평균 손실 길이에 따라 오디오 품질 평가 정보를 생성하는 것은 구체적으로,

하기 식:

을 적용하여 오디오 품질 평가 정보 Q를 계산하는 것일 수 있고, 상기 식에서, Q_c는 코드 압축 품질 정보이고, LD은 평균 손실 길이이며, a₅ 및a₆은 각각 미리 설정된 계수이다.

구체적으로, a₅ 및a₆은 미리 설정된 계수이며, 트레이닝 데이터베이스를 트레이닝하여 취득될 수 있다.

실제 애플리케이션의 프로세스에서는, 비무음 오디오 데이터 패킷의 패킷 손실 상태 정보는 비무음 오디오 데이터 패킷의 패킷 손실 상황을 반영할 수 있는 다른 정보를 더 포함할 수 있으며, 본 실시예에서 이에 한정되는 것은 아니다. 따라서, 코드 압축 품질 정보 및 패킷 손실 상태 정보에 따라 오디오 품질 평가 정보를 생성하는 방식은 다른 방식일 수도 있으며, 본 실시예에서 이에 한정되는 것은 아니다.

예를 들어, 비무음 오디오 데이터 패킷의 패킷 손실 상태 정보는 손실 빈도 및 손실 길이를 포함할 수 있다. 손실 빈도 및 손실 길이는 전술한 실시예에서 제공된 방법을 사용하여 취득될 수 있으며, 다른 방식으로 취득될 수도 있다. 예를 들어, 손실 빈도

, 여기서 N3은 비무음 오디오 데이터 패킷의 손실 횟수이고, T1은 손실된 비무음 오디오 데이터 패킷의 시간 길이의 합이다. 손실 길이

, 여기서 N1은 손실된 비무음 오디오 데이터 패킷의 수이고, N3은 비무음 오디오 데이터 패킷의 손실 횟수이다.

오디오 품질 평가 정보 Q는 하기 식:

을 적용하여 계산되며, 상기 식에서 Q_c는 코드 압축 품질 정보이고, a₁₁, a₁₂, a₁₃및 a₁₄는 미리 설정된 계수이며 트레이닝 데이터베스를 트레이닝하여 취득될 수 있다. 예를 들어, AAC 비트 스트림의 모델 파라미터에서, a₁₁=0.5145, a₁₂ =106658, a₁₃=5.0921, 및 a₁₄=0.0560.

도 3은 본 발명의 실시예에 따른 오디오 스트림 품질 평가 장치의 개략 구성도이다. 도 3에 도시된 바와 같이, 본 실시예에 따른 오디오 스트림 품질 평가 장치는 본 발명의 임의의 실시예에 따른 오디오 스트림 품질 평가 방법의 단계들을 구현할 수 있으므로, 여기서 더 이상 설명하지 않는다. 본 실시예에 따른 오디오 스트림 품질 평가 장치는 구체적으로, 비무음 결정 유닛(11) 및 평가 유닛(12)을 포함한다. 상기 비무음 결정 유닛(11)은 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷을 결정하도록 구성되어 있고, 평가될 오디오 스트림은 하나 이상의 비무음 오디오 데이터 패킷을 포함하고, 각각의 비무음 오디오 데이터 패킷은 하나 이상의 비무음 오디오 프레임을 포함한다. 평가 유닛(12)은 비무음 결정 유닛(11)과 연결되고, 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷을 평가하여 오디오 품질 평가 정보를 생성하도록 구성되어 있다.

본 실시예에 따른 오디오 스트림 품질 평가 장치에서, 비무음 결정 유닛(11)은 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷을 결정하며, 평가될 오디오 스트림은 하나 이상의 비무음 오디오 데이터 패킷을 포함하고, 각각의 비무음 오디오 데이터 패킷은 하나 이상의 비무음 오디오 프레임을 포함하며; 평가 유닛(12)은 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷을 평가하여 오디오 품질 평가 정보를 생성한다. 무음 오디오 데이터 패킷은 어떠한 유용한 정보도 포함하지 않기 때문에, 오디오 스트림 품질 평가는 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷에 대해서만 수행되고, 이로써 무음 부분이 오디오 품질의 평가에 미치는 영향을 회피할 수 있으므로, 오디오 스트림 품질 평가의 정확성을 향상시킨다.

도 4는 본 발명의 실시예에 따른 다른 오디오 스트림 품질 평가 장치의 개략 구성도이다. 도 4에 도시된 바와 같이, 본 실시예에서, 평가 유닛(12)은 구체적으로 취득 서브유닛(21) 및 평가 서브유닛(22)을 포함할 수 있다. 취득 서브유닛(21)은 비무음 결정 유닛(11)과 연결되고, 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 비트 레이트를 결정하고, 비트 레이트에 따라 코드 압축 품질 정보를 취득하도록 구성되어 있다. 평가 서브유닛(22)은 취득 서브유닛(21)과 연결되고, 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실 상태 정보를 결정하고, 코드 압축 품질 정보 및 패킷 손실 상태 정보에 따라 오디오 품질 평가 정보를 생성하도록 구성되어 있다.

평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실 상태 정보는 구체적으로 패킷 손실률, 손실 빈도 또는 평균 손실 길이와 같은 정보를 포함할 수 있다. 비무음 오디오 데이터 패킷의 패킷 손실 상태 정보는 비무음 오디오 데이터 패킷의 패킷 손실 상황을 나타내는 데 사용된다. 평가될 오디오 스트림의 오디오 품질을 평가하는 프로세스에서는, 비무음 오디오 데이터 패킷의 패킷 손실 상황만 고려되며, 이로써 무음 오디오 데이터 패킷의 손실이 오디오 품질 평가에 영향을 미치는 것을 회피할 수 있으므로, 오디오 품질 평가의 정확성을 향상시킨다.

본 실시예에서, 취득 서브유닛(21)은, 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷에 포함된 모든 비무음 오디오 프레임의 비트의 합과 그 모든 비무음 오디오 프레임의 시간 길이의 합을 결정하고, 비트의 합과 시간 길이의 합에 따라 비트 레이트를 생성하도록 더 구성되어 있다.

본 실시예에서, 패킷 손실 상태 정보는 패킷 손실률이고; 평가 서브유닛은(22), 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실률을 결정하고, 코드 압축 품질 정보 및 패킷 손실률에 따라 오디오 품질 평가 정보를 생성하도록 더 구성되어 있다.

본 실시예에서, 평가 서브유닛(22)은, 평가될 오디오 스트림 내의 손실된 오디오 데이터 패킷의 총수와 손실된 무음 오디오 데이터 패킷의 수를 결정하고, 손실된 오디오 데이터 패킷의 총수와 손실된 무음 오디오 데이터 패킷의 수에 따라 손실된 비무음 오디오 데이터 패킷의 수를 결정하고, 손실된 비무음 오디오 데이터 패킷의 수와 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 수에 따라 패킷 손실률을 생성하도록 더 구성되어 있다.

본 실시예에서, 평가 서브유닛(22)은, 하기 식:

을 적용하여 오디오 품질 평가 품질 Q를 계산하도록 더 구성되어 있고, 상기 식에서, Q_c는 코드 압축 품질 정보이고, PLR은 패킷 손실률이며, a₁ 및a₂는 각각 미리 설정된 계수이다.

본 실시예에서, 패킷 손실 상태 정보는 손실 빈도이고; 평가 서브유닛(22)은, 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 손실 빈도를 결정하고, 코드 압축 품질 정보 및 손실 빈도에 따라 오디오 품질 평가 정보를 생성하도록 더 구성되어 있다.

본 실시예에서, 평가 서브유닛(22)은, 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 손실 횟수를 결정하고, 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷에 포함된 모든 비무음 오디오 프레임의 시간 길이의 합을 결정하고, 손실 횟수와 모든 비무음 오디오 프레임의 시간 길이의 합에 따라 손실 빈도를 생성하도록 더 구성되어 있다.

본 실시예에서, 평가 서브유닛(22)은, 하기 식:

을 적용하여 오디오 품질 평가 정보 Q를 계산하도록 더 구성되어 있고, 상기 식에서, Q_c는 코드 압축 품질 정보이고, LR은 손실 빈도이며, a₃ 및a₄는 각각 미리 설정된 계수이다.

본 실시예에서,패킷 손실 상태 정보는 평균 손실 길이이고; 평가 서브유닛(22)은, 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 평균 손실 길이를 결정하고, 코드 압축 품질 정보 및 평균 손실 길이에 따라 오디오 품질 평가 정보를 생성하도록 더 구성되어 있다.

본 실시예에서, 평가 서브유닛(22)은, 평가될 오디오 스트림 내의 손실된 비무음 오디오 데이터 패킷을 결정하고, 손실된 비무음 오디오 데이터 패킷의 시간 길이의 합을 결정하고, 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 손실 횟수를 결정하고, 시간 길이의 합과 손실 횟수에 따라 균 손실 길이를 생성하도록 더 구성되어 있다.

본 실시예에서, 평가 서브유닛(22)은, 하기 식:

을 적용하여 오디오 품질 평가 정보 Q를 계산하도록 더 구성되어 있고, 상기 식에서, Q_c는 코드 압축 품질 정보이고, LD은 평균 손실 길이이며, a₅ 및a₆은 각각 미리 설정된 계수이다.

본 발명의 본 실시예에 따른 오디오 스트림 품질 평가 방법 및 장치에서, 무음 오디오 데이터 패킷은 어떠한 유용한 정보도 포함하지 않기 때문에, 오디오 스트림 품질 평가는 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷에 대해서만 수행되고, 이로써 무음 부분이 오디오 품질의 평가에 미치는 영향을 회피할 수 있으므로, 오디오 스트림 품질 평가의 정확성을 향상시킨다. 또, 본 발명의 본 실시예에 따른 오디오 스트림 품질 평가 방법 및 장치는, 계산 복잡도가 낮고, 페이로드 암호화와 함께 오디오 스트림에 적용 가능하며, 네트워크 오디오 스트림 및 멀티미디어 스트림의 품질의 평가 및 모니터링에 폭넓게 적용될 수 있다.

당업자는 방법 실시예의 단계 중 일부 또는 전부를 관련 하드웨어에 명령하는 프로그램으로 구현할 수 있다는 것을 이해할 수 있을 것이다. 상기 프로그램은 컴퓨터로 판독 가능한 매체에 저장될 수 있다. 프로그램이 실행될 때, 방법 실시예의 단계들이 수행된다. 상기 저장 매체는 ROM, RAM, 자기 디스크, 또는 광 디스크와 같은, 프로그램 코드를 저장할 수 있는 임의 매체를 포함한다.

끝으로, 전술한 실시예는 본 발명의 기술적 방안을 설명하기 위한 것일 뿐이며, 본 발명의 한정하려는 것은 아님에 유의하여야 한다. 본 발명을 전술한 실시예를 참조하여 상세하게 설명하였지만, 당업자는 본 발명의 실시예의 기술적 방안의 범위를 벗어나지 않으면서 전술한 실시예에서 설명한 기술적 방안을 수정하거나 그 기술적 특징의 일부에 대한 동등한 대체를 할 수 있다는 이해하여야 한다.

Claims

평가될 오디오 스트림 내의 비무음(non-silence) 오디오 데이터 패킷을 결정하는 단계 - 상기 평가될 오디오 스트림은 하나 이상의 비무음 오디오 데이터 패킷을 포함하고, 각각의 비무음 오디오 데이터 패킷은 하나 이상의 비무음 오디오 프레임을 포함함 -; 및
상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷을 평가하여 오디오 품질 평가 정보를 생성하는 단계
를 포함하는 오디오 스트림 품질 평가 방법.
제1항에 있어서,
상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷을 평가하여 오디오 품질 평가 정보를 생성하는 단계는,
상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 비트 레이트를 결정하고, 상기 비트 레이트에 따라 코드 압축 품질 정보를 취득하는 단계; 및
상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실 상태 정보를 결정하고, 상기 코드 압축 품질 정보 및 상기 패킷 손실 상태 정보에 따라 상기 오디오 품질 평가 정보를 생성하는 단계를 포함하는, 오디오 스트림 품질 평가 방법.
제2항에 있어서,
상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 비트 레이트를 결정하는 것은,
상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷에 포함된 모든 비무음 오디오 프레임의 비트의 합과 상기 모든 비무음 오디오 프레임의 시간 길이의 합을 결정하고, 상기 비트의 합과 상기 시간 길이의 합에 따라 상기 비트 레이트를 생성하는 단계를 포함하는, 오디오 스트림 품질 평가 방법.
제2항 또는 제3항에 있어서,
상기 패킷 손실 상태 정보는 패킷 손실률이고;
상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실 상태 정보를 결정하고, 상기 코드 압축 품질 정보 및 상기 패킷 손실 상태 정보에 따라 상기 오디오 품질 평가 정보를 생성하는 단계는,
상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실률을 결정하고, 상기 코드 압축 품질 정보 및 상기 패킷 손실률에 따라 상기 오디오 품질 평가 정보를 생성하는 단계를 포함하는, 오디오 스트림 품질 평가 방법.
제4항에 있어서,
상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실률을 결정하는 것은,
상기 평가될 오디오 스트림 내의 손실된 오디오 데이터 패킷의 총수와 손실된 무음 오디오 데이터 패킷의 수를 결정하고, 상기 손실된 오디오 데이터 패킷의 총수와 상기 손실된 무음 오디오 데이터 패킷의 수에 따라 손실된 비무음 오디오 데이터 패킷의 수를 결정하고, 상기 손실된 비무음 오디오 데이터 패킷의 수와 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 수에 따라 상기 패킷 손실률을 생성하는 것인, 오디오 스트림 품질 평가 방법.
제4항에 있어서,
상기 코드 압축 품질 정보 및 상기 패킷 손실률에 따라 상기 오디오 품질 평가 정보를 생성하는 단계는,
하기 식:

을 적용하여 상기 오디오 품질 평가 품질 Q를 계산하는 단계이고,
상기 식에서, Q_c는 상기 코드 압축 품질 정보이고, PLR은 상기 패킷 손실률이며, a₁ 및a₂ 는 각각 미리 설정된 계수인, 오디오 스트림 품질 평가 방법.
제2항 또는 제3항에 있어서,
상기 패킷 손실 상태 정보는 손실 빈도이고;
상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실 상태 정보를 결정하고, 상기 코드 압축 품질 정보 및 상기 패킷 손실 상태 정보에 따라 상기 오디오 품질 평가 정보를 생성하는 단계는,
상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 손실 빈도를 결정하고, 상기 코드 압축 품질 정보 및 상기 손실 빈도에 따라 상기 오디오 품질 평가 정보를 생성하는 단계인, 오디오 스트림 품질 평가 방법.
제7항에 있어서,
상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 손실 빈도를 결정하는 것은,
상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 손실 횟수를 결정하고, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷에 포함된 모든 비무음 오디오 프레임의 시간 길이의 합을 결정하고, 상기 손실 횟수와 상기 모든 비무음 오디오 프레임의 시간 길이의 합에 따라 상기 손실 빈도를 생성하는 것인, 오디오 스트림 품질 평가 방법.
제7항에 있어서,
상기 코드 압축 품질 정보 및 상기 손실 빈도에 따라 상기 오디오 품질 평가 정보를 생성하는 단계는,
하기 식:

을 적용하여 상기 오디오 품질 평가 정보 Q를 계산하는 단계이고,
상기 식에서, Q_c는 상기 코드 압축 품질 정보이고, LR은 상기 손실 빈도이며, a₃ 및a₄는 각각 미리 설정된 계수인, 오디오 스트림 품질 평가 방법.
제2항 또는 제3항에 있어서,
상기 패킷 손실 상태 정보는 평균 손실 길이이고;
상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실 상태 정보를 결정하고, 상기 코드 압축 품질 정보 및 상기 패킷 손실 상태 정보에 따라 상기 오디오 품질 평가 정보를 생성하는 단계는,
상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 평균 손실 길이를 결정하고, 상기 코드 압축 품질 정보 및 상기 평균 손실 길이에 따라 상기 오디오 품질 평가 정보를 생성하는 단계인, 오디오 스트림 품질 평가 방법.
제10항에 있어서,
상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 평균 손실 길이를 결정하는 것은,
상기 평가될 오디오 스트림 내의 손실된 비무음 오디오 데이터 패킷을 결정하고, 상기 손실된 비무음 오디오 데이터 패킷의 시간 길이의 합을 결정하고,
상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 손실 횟수를 결정하고, 상기 시간 길이의 합과 상기 손실 횟수에 따라 상기 평균 손실 길이를 생성하는 것인, 오디오 스트림 품질 평가 방법.
제10항에 있어서,
상기 코드 압축 품질 정보 및 상기 평균 손실 길이에 따라 상기 오디오 품질 평가 정보를 생성하는 단계는,
하기 식:

을 적용하여 상기 오디오 품질 평가 정보 Q를 계산하는 단계이고,
상기 식에서, Q_c는 상기 코드 압축 품질 정보이고, LD은 상기 평균 손실 길이이며, a₅ 및a₆은 각각 미리 설정된 계수인, 오디오 스트림 품질 평가 방법.
평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷을 결정하도록 구성된 비무음 결정 유닛 - 상기 평가될 오디오 스트림은 하나 이상의 비무음 오디오 데이터 패킷을 포함하고, 각각의 비무음 오디오 데이터 패킷은 하나 이상의 비무음 오디오 프레임을 포함함 -; 및
상기 비무음 결정 유닛과 연결되고, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷을 평가하여 오디오 품질 평가 정보를 생성하도록 구성된 평가 유닛
을 포함하는 오디오 스트림 품질 평가 장치.
제13항에 있어서,
상기 평가 유닛은,
상기 비무음 결정 유닛과 연결되고, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 비트 레이트를 결정하고, 상기 비트 레이트에 따라 코드 압축 품질 정보를 취득하도록 구성된 취득 서브유닛; 및
상기 취득 서브유닛과 연결되고, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실 상태 정보를 결정하고, 상기 코드 압축 품질 정보 및 상기 패킷 손실 상태 정보에 따라 상기 오디오 품질 평가 정보를 생성하도록 구성된 평가 서브유닛을 포함하는, 오디오 스트림 품질 평가 장치.
제14항에 있어서,
상기 취득 서브유닛은, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷에 포함된 모든 비무음 오디오 프레임의 비트의 합과 상기 모든 비무음 오디오 프레임의 시간 길이의 합을 결정하고, 상기 비트의 합과 상기 시간 길이의 합에 따라 상기 비트 레이트를 생성하도록 더 구성되어 있는, 오디오 스트림 품질 평가 장치.
제14항 또는 제15항에 있어서,
상기 패킷 손실 상태 정보는 패킷 손실률이고;
상기 평가 서브유닛은,
상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 패킷 손실률을 결정하고, 상기 코드 압축 품질 정보 및 상기 패킷 손실률에 따라 상기 오디오 품질 평가 정보를 생성하도록 더 구성되어 있는, 오디오 스트림 품질 평가 장치.
제16항에 있어서,
상기 평가 서브유닛은, 상기 평가될 오디오 스트림에서 손실된 오디오 데이터 패킷의 총수와 손실된 무음 오디오 데이터 패킷의 수를 결정하고, 상기 손실된 오디오 데이터 패킷의 총수와 상기 손실된 무음 오디오 데이터 패킷의 수에 따라 손실된 비무음 오디오 데이터 패킷의 수를 결정하고, 상기 손실된 비무음 오디오 데이터 패킷의 수와 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 수에 따라 상기 패킷 손실률을 생성하도록 더 구성되어 있는, 오디오 스트림 품질 평가 장치.
제16항에 있어서,
상기 평가 서브유닛은, 하기 식:

을 적용하여 상기 오디오 품질 평가 품질 Q를 계산하도록 더 구성되어 있고,
상기 식에서, Q_c는 상기 코드 압축 품질 정보이고, PLR은 상기 패킷 손실률이며, a₁ 및a₂는 각각 미리 설정된 계수인, 오디오 스트림 품질 평가 장치.
제14항 또는 제15항에 있어서,
상기 패킷 손실 상태 정보는 손실 빈도이고;
상기 평가 서브유닛은, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 손실 빈도를 결정하고, 상기 코드 압축 품질 정보 및 상기 손실 빈도에 따라 상기 오디오 품질 평가 정보를 생성하도록 더 구성되어 있는, 오디오 스트림 품질 평가 장치.
제19항에 있어서,
상기 평가 서브유닛은, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 손실 횟수를 결정하고, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷에 포함된 모든 비무음 오디오 프레임의 시간 길이의 합을 결정하고, 상기 손실 횟수와 상기 모든 비무음 오디오 프레임의 시간 길이의 합에 따라 상기 손실 빈도를 생성하도록 더 구성되어 있는, 오디오 스트림 품질 평가 장치.
제19항에 있어서,
상기 평가 서브유닛은, 하기 식:

을 적용하여 상기 오디오 품질 평가 정보 Q를 계산하도록 더 구성되어 있고,
상기 식에서, Q_c는 상기 코드 압축 품질 정보이고, LR은 상기 손실 빈도이며, a₃ 및a₄는 각각 미리 설정된 계수인, 오디오 스트림 품질 평가 장치.
제14항 또는 제15항에 있어서,
상기 패킷 손실 상태 정보는 평균 손실 길이이고;
상기 평가 서브유닛은, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 평균 손실 길이를 결정하고, 상기 코드 압축 품질 정보 및 상기 평균 손실 길이에 따라 상기 오디오 품질 평가 정보를 생성하도록 더 구성되어 있는, 오디오 스트림 품질 평가 장치.
제22항에 있어서,
상기 평가 서브유닛은, 상기 평가될 오디오 스트림 내의 손실된 비무음 오디오 데이터 패킷을 결정하고, 상기 손실된 비무음 오디오 데이터 패킷의 시간 길이의 합을 결정하고, 상기 평가될 오디오 스트림 내의 비무음 오디오 데이터 패킷의 손실 횟수를 결정하고, 상기 시간 길이의 합과 상기 손실 횟수에 따라 상기 평균 손실 길이를 생성하도록 더 구성되어 있는, 오디오 스트림 품질 평가 장치.
제22항에 있어서,
상기 평가 서브유닛은, 하기 식:

을 적용하여 상기 오디오 품질 평가 정보 Q를 계산하도록 더 구성되어 있고,
상기 식에서, Q_c는 상기 코드 압축 품질 정보이고, LD은 상기 평균 손실 길이이며, a₅ 및a₆은 각각 미리 설정된 계수인, 오디오 스트림 품질 평가 장치.