KR20070085403A - 단 대 단 VoIP 매체 지연을 관리하는 방법 및 장치 - Google Patents

단 대 단 VoIP 매체 지연을 관리하는 방법 및 장치 Download PDF

Info

Publication number
KR20070085403A
KR20070085403A KR1020077011374A KR20077011374A KR20070085403A KR 20070085403 A KR20070085403 A KR 20070085403A KR 1020077011374 A KR1020077011374 A KR 1020077011374A KR 20077011374 A KR20077011374 A KR 20077011374A KR 20070085403 A KR20070085403 A KR 20070085403A
Authority
KR
South Korea
Prior art keywords
playout
frames
delay
vocoder
time
Prior art date
Application number
KR1020077011374A
Other languages
English (en)
Other versions
KR100902456B1 (ko
Inventor
에릭 씨. 로젠
Original Assignee
콸콤 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 콸콤 인코포레이티드 filed Critical 콸콤 인코포레이티드
Publication of KR20070085403A publication Critical patent/KR20070085403A/ko
Application granted granted Critical
Publication of KR100902456B1 publication Critical patent/KR100902456B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04JMULTIPLEX COMMUNICATION
    • H04J3/00Time-division multiplex systems
    • H04J3/02Details
    • H04J3/06Synchronising arrangements
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/66Arrangements for connecting between networks having differing types of switching systems, e.g. gateways
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04JMULTIPLEX COMMUNICATION
    • H04J3/00Time-division multiplex systems
    • H04J3/02Details
    • H04J3/06Synchronising arrangements
    • H04J3/062Synchronisation of signals having the same nominal but fluctuating bit rates, e.g. using buffers
    • H04J3/0632Synchronisation of packets and cells, e.g. transmission of voice via a packet network, circuit emulation service [CES]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04JMULTIPLEX COMMUNICATION
    • H04J3/00Time-division multiplex systems
    • H04J3/02Details
    • H04J3/06Synchronising arrangements
    • H04J3/0635Clock or time synchronisation in a network
    • H04J3/0682Clock or time synchronisation in a network by delay compensation, e.g. by compensation of propagation delay or variations thereof, by ranging

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Telephonic Communication Services (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Communication Control (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

본 발명은, 통신 네트워크에서 하나 이상의 데이터 프레임을 프로세싱하고, 제1 샘플링 시간에 따라 하나 이상의 데이터 프레임을 샘플링하고, 상기 샘플링된 하나 이상의 데이터 프레임을 인터폴레이팅하고, 상기 하나 이상의 데이터 프레임을 이용하여 적시에 예정된 길이를 갖는 플레이아웃 파형을 형성하는 것을 포함하는, 적응력있게 통신 지연을 관리하는 방법 및 장치에 관한 것이다. 상기 하나 이상의 데이터 프레임은 하나 이상의 보코더 프레임일 수 있으며, 하나 이상의 보코더 프레임의 플레이아웃 시간은 상기 최초 샘플링 시간과 상이하다.

Description

단 대 단 VoIP 매체 지연을 관리하는 방법 및 장치{METHOD AND APPARATUS FOR MANAGING END-TO-END VOICE OVER INTERNET PROTOCOL MEDIA LATENCY}
본 발명은 통상적으로 보코더, 음성 프로세싱, 전화통신, 및 데이터 통신에 관한 것이다. 특히, 본 발명은 그룹 통신 네트워크에서 사용자가 겪는 지연을 감소시키고, 단 대 단 VoIP(voice over internet protocol) 매체 지연을 관리하는 방법 및 장치에 관한 것이다.
VoIP 폰 콜은 인터넷과 같은 데이터 네트워크를 통해 전송되는 폰 콜이다. 인터넷 프로토콜은 음성 콜 데이터가 데이터 네트워크 상에서 데이터의 다른 타입들 사이에서 배치 또는 슬롯팅되게 한다. 데이터 네트워크의 소정의 예는 공용 네트워크, 기업 인트라넷, 엑스트라넷 또는 다른 타입의 데이터 네트워크이다.
전통적인 전화 통신 시스템에 비해 VoIP 폰 콜과 관련한 많은 장점(예를 들어, 코스트, 성능 및 콜 관리)이 존재한다. 폰 콜은 통상의 회로 스위치 전화 통신에 비해 일반적으로 현저히 저렴한데, 이는 폰 콜의 가격이 데이터 네트워크에 대한 가입의 전체 가격의 통상적으로 일부(종종 사용에 무관하게 정액 요금으로 책정됨)이기 때문이다. 부가적으로, 많은 관리 기관은 VoIP 콜을 음성 폰 콜이 아닌 전체 정보 서비스 패키지의 일부로 현재 분류하고 있어서, 추가의 전화 통신과 관 련한 많은 다양한 타입의 세금을 감면하고 있다.
어떤 것이 하나의 단일화된 네트워크로서 개별 음성 네트워크 및 개별 데이터 네트워크가 될지를 관리하는 것과 관련한 장점이 있다. 인터넷 폰은 기본적으로 네트워크 컴퓨터 또는 컴퓨팅 장치이며, 결국 컴퓨터와 같이 관리될 수 있는데, 이동, 변경 및 업그레이드와 작은 작용이 중앙적으로 관리되고 이러한 작용은 원격으로 관리될 수 있다. 끝으로, VoIP 시스템은 새로운 또는 현재 데이터 네트워크 서비스와 용이하게 통합될 수 있다. 예를 들어, VoIP는 통합 메시징, 음성 메일, 번호 이동성, 발신자 번호 표시(caller ID), 웹 액세스 및 관리 및 다른 특징을 지원할 수 있다.
통상의 회로 스위치 전화 통신은 회로(가상, 물리적, 무선 또는 유선)가 예상가능하고 관리가능하며 신뢰가능한 스트림에서 음성을 전달한다는 내재적 보증 또는 적어도 높은 개연적 예상에 기초한다.
전술한 동일한 내재적 보장 및 예상은 또한 디지털 회로 스위치 전화 통신을 위해 확실한 가정을 유지한다. 비록 음성 데이터가 통상적으로 보코더 프레임으로 불려지는 정보의 개별 청으로 디지털화되고 패키지화되더라도, 이러한 프레임들이 화자로부터 청자로 취해지는 회로 경로는 음성 데이터를 나타내는 보코더 프레임의 연속하고 신뢰가능한 스트림을 제공한다.
보코더는 통신 네트워크를 통한 전송을 위해 음성을 합성하고 아날로그 파형을 디지털 신호로 변환하기 위해 사용된 장치이다. 보코더는 또한 디지털화된 음성 신호를 전송하기 위해 대역폭 요구를 감소시키도록 사용된다. 보코더는 인간의 음성 생성을 나타내는 모델과 관련한 파라미터들을 추출 및 조작함으로써 유성화된 음성을 압축하기 위한 다양한 기술을 이용한다.
통상적으로 보코더는 엔코더 및 디코더로 구성되는데, 엔코더는 관련 파라미터를 추출하기 위해 인입 음성을 분석하며, 디코더는 전송 채널을 통해 수신하는 관련 파라미터를 이용하여 음성을 재합성한다. 음성은 시간 또는 분석 프레임의 블록으로 분할되며, 이 동안 파라미터가 계산된다. 이어 파라미터는 각각의 새로운 프레임을 위해 업데이트된다.
음성 품질에 대한 가변의, 늦거나 소실된 보코더 프레임 전달의 영향을 완화시키기 위해 사용되는 VoIP 기반 애플리케이션은 현존 인터페이스에 의해 보코더로 제공된 성능에 의해 제한된다. 이러한 현존 인터페이스는 회로 기반 채널의 요구 및 특징을 중심으로 통상적으로 설계된다. VoIP 애플리케이션이 기반하는 패킷 데이터 채널은 화자와 청자 상이의 경로를 이동하는 데이터그램에 대해 기본적으로 상이한 환경을 제공한다. 이러한 차이점을 해결하기 위한 알고리즘이 존재하지만, 더 우수한 전략이 보코더에 대한 새로운 인터페이스 및 성능의 유용성에 의해 가능하게 된다.
비록 사용된 회로 경로가 완벽하거나 최적이지 않아도, 회로 경로에 의해 이러한 데이터 스트림에 도입된 소정의 에러는 예상 가능한 형태로 보코더 프레임에 영향을 미친다. 회로를 가로질러 이동하는 데이터의 소정의 주어진 프레임의 경우, 이하의 3개의 경우 중 하나가 가장 유망하게 적용될 것이다. 1. 프레임은 고정된 단 대 단 지연 이후 변경되지 않고 이동; 또는 2. 프레임은 고정된 단 대 단 지연 이후 하나 이상의 비트 에러를 갖고 이동; 또는 3. 프레임이 소실되고, 스트림에서 다음 보코더 프레임이 도달하기 전에 (예를 들어, 시간에서) 정보의 갭을 남길 것이다. 전술한 (3)의 경우는 특별한 경우, 또는 경우(2)의 변경일 수 있으며, 여기서 프레임에서의 모든 비트는 잠재적으로 회로를 이동시킨 후의 에러 상태이다.
통신 회로의 하나의 기본적인 특징은 통신 회로가 회로를 이동하는 모든 프레임에 고정된 단 대 단 지연을 유도한다는 것이며, 여기서 프레임은 아날로그 또는 디지털 형태이다. 그 결과, 통상의 음성 애플리케이션에 대해 개발된 보코더는 화자로부터 청자로의 경로에서 발생할 수도 있는 잠재적인 에러를 처리하도록 설계된다. 사용된 타입에 의존하여, 이러한 보코더들 중 일부는, A. 보코더 프레임 그 자체에 포함된 에러 보정 또는 다른 코딩 기술을 통해 프레임으로 도입된 비트 에러에 대한 보상; 또는 B. 더 높은 계층이 소거 조건을 보코더로 시그널링하게 함으로써 소실 프레임에 대한 보상을 하여, 사용되고 있는 보코더 타입에 의해 특정하게 지원된 다항식 또는 다른 예측 타입의 알고리즘을 이용하여 시간 갭에 대한 인터폴레이팅하는 보코더를 초래할 수 있다.
통상의 회로 경로에서 에러에 대처하는 이러한 보상 메카니즘은 양방향(쌍방향) 회로 기반 통신에 대해 잘 적용된다. 통상적으로, 이러한 애플리케이션에서의 음성 품질은 에러가 회로에 도입됨에 따라 적절하게 감소된다.
VoIP 또는 VoIP 기반 통신 시스템에서, 하나 이상의 보코더 프레임은 IP 데이터그램에서 패킷화되고 패킷 네트워크를 통해 데이터의 개별 청크로서 전송된다. URL 또는 소켓과 같은 신뢰 가능한 채널을 통해 통신하는 클라이언트 및 서버는 이들 사이에 전용 단 대 단 채널 또는 최소한 전용 채널의 동작 일루젼(illusion)을 갖는다.
회로 스위치형 네트워크에서, 클라이언트 및 서버는 접속을 설정하고, 데이터를 전송하고, 접속을 차단함으로써 통신한다. 채널을 통해 전송된 모든 데이터는 데이터가 전송된 동일한 순서로 수신된다. 이러한 데이터 배향(orientation)은 채널에 의해 보증된다. 대조적으로, 데이터그램을 통해 통신하는 애플리케이션은 완전히 독립적인 정보의 패킷을 전송 및 수신한다. 이러한 클라이언트 및 서버는 전용 단 대 단 채널을 갖지 않으며 필요로 하지 않는다. 목적지로의 데이터그램의 전달은 보장되지 않으며, 수신측에서의 데이터그램의 도달 순서도 보장되지 않는다.
데이터그램은 도달, 도달 시간 및 콘텐츠가 보장되지 않는 네트워크를 통해 전송된 독립적인, 자국 중심 메시지이다. 데이터그램 기반 시스템에서, 각각의 패킷에 대한 어드레싱 정보의 부가는 데이터그램이 네트워크를 횡단함에 따라 노드 단위 기반으로 패킷 데이터 네트워크가 각각의 데이터그램을 독립적으로 라우팅하게한다. 이는 예정된 경로를 따라 데이터(예를 들어, 보코더 프레임)를 전달하고 결론적으로 고정된 예상가능한 지연을 갖는 회로 스위치 네트워크와 비교된다.
일반적으로, 지연은 네트워크를 통해 정보 또는 데이터를 획득하는데 있어서 경험되는 대기 시간 또는 시간 지연을 의미한다. 지연은 많은 다양한 방식에서 초래된다. 예를 들어, 지연은 전파 지연으로부터 발생할 수 있다. 전파 지연은 (예를 들어, 소정의 전화선 거리를 통해) 정보가 정보 발생으로부터 정보 종료까지의 거리를 진행하는데 걸리는 시간의 길이이다. 패킷 기반 시스템에서, 전파 지연이 존재할 수 있으며, 여기서 지연은 소정의 매체를 통해 패킷을 전송하는데 걸리는 시간의 길이로부터 발생할 수 있다. 통신 환경에서, 매체는 전송을 수행하는 대부분 도관 또는 링크이다. 전송 매체의 소정의 예는 동축 케이블, 구리선, 무선파, 도파관 및 광섬유를 포함한다. 전송 지연은 통상적으로 매체의 크기 및 데이터 패킷의 크기에 의해 결정된다. 지연의 다른 소스는 프로세싱 지연이며, 이는 라우트 룩업과 같이 다양한 태스크를 수행하고, 헤더를 변경 및 관리하고, 데이터 및 다른 스위칭 태스크의 캡슐화를 변경하기 위한 네트워크 장치에 의해 요구되는 시간이다.
이러한 환경에서, 회로 스위치 전화통신 시스템과 데이터그램 기반 시스템 사이의 기본적인 하나의 차이는 데이터그램 기반 시스템의 음성 프레임이 인터넷 프로토콜(IP) 헤더로 캡슐화될 뿐만 아니라, 이들이 패킷 데이터 네트워크를 진행함에 따라 가변 링크 특성(예를 들어, 에러 확률, 정체)을 나타내기 쉽거나 나타낸다는 것이다.
이러한 특성의 결과로서, VoIP 애플리케이션에서 보코더 패킷은 다른 프레임과 비교할 때 VoIP 데이터그램 전송의 시퀀스에서 단 대 단 지연을 빠르게 또는 늦게 변화시기면서 청자에게 도달할 수 있다. 통상의 패킷 네트워크는 손상된 데이 터그램을 폐기하지만, 그렇지 않을 경우, 패킷 네트워크는 최선 노력 방식으로 전송한다. 예를 들어, 소정의 패킷은 소실될 수 있으며 자신의 최종 목적지에 도달하지 않는다. 다른 패킷들은 너무 늦게 도달할 수 있으며 유용하지 않을 수 있다.
비디오 전화 통신 애플리케이션과 같은 VoIP 애플리케이션 및 다른 IP 기반 매체 스트리밍 애플리케이션에 대한 하나의 문제는 음성 플레이아웃이 제1 매체 데이터그램이 청자에 의해 수신될 때까지 시작할 수 없다는 것이다. 만일 이러한 데이터그램이 특징적이지 않게 지연되면 (또는 만일 전송된 제1 매체 데이터그램이 소실되어 결국 수신기가 성공적으로 전송하기 위해 연속한 데이터그램을 대기해야 할 경우), 큰 초기 단 대 단 지연이 매체 스트림으로 초기에 도입된다.
결론적으로, 많은 경우, VoIP 애플리케이션은 이하의 두 경우를 설명할 필요가 있다. VoIP 애플리케이션은 시퀀스로부터 도달하는 패킷을 포함하여, 가변 지연 및 변화하는 도달간 시간 또는 지터를 갖고 도달하는 패킷을 처리할 필요가 있다. VoIP 애플리케이션은 소실되거나, 애플리케이션 계층에서 관심있거나 유용하기에는 너무 늦게 도달하는 패킷을 처리할 필요가 있다.
도달간 시간의 가변성을 처리하는 한 방법은 고정된 기간의 시간에 대해 수신된 보코더 프레임을 버퍼링함으로써 수신기에서 수신된 지터를 제거하는 것이다. 이러한 버퍼링 방식은 소정의 또는 모든 보코더 프레임에 대한 플레이아웃을 지연을 희생하고 회로 경로의 고정된 단 대 단 지연을 효율적으로 시뮬레이션한다. 다양한 알고리즘이 통상적으로 플레이아웃 임계치 또는 워터마크로 알려진, 도입된 지연을 결정하기 위해 존재한다.
그러나 만일 고정된 지연이 사용되면, 지연은 통상적으로 화자와 청자 사이에서 패킷 네트워크에 대한 최대 예상 단 대 단 지연에 대한 통상적으로 비례한다. 그 결과, 이러한 접근은 동일한 화자와 청자 사이의 회로 경로에 비교하여 VoIP 단 대 단 매체 지연을 현저히 증가시키는 경향이 있다.
고정된 지연은 종종 패킷 데이터 네트워크에 의해 지연된 보코더 프레임이 이들의 플레이아웃 시간이 도달하기 전에 도달할 수 있도록 매체 플레이아웃으로 도입된다. 도입된 지연이 길수록, 소정의 보코더 프레임은 자신의 플레이아웃 시간이 도달하기 전에 도달할 가능성이 더 많다. 그러나 더 긴 지연은 더 긴 단 대 단 매체 지연에 기여하고, 이는 차례로 인식된 음성 품질 및 애플리케이션의 일반적인 유용성을 떨어뜨린다.
보코더 프레임을 전달하는 늦거나 소실된 패킷에 대해 보상하는 방법이 있다. 일 방법은 소실되거나 늦게 도달할 보코더 프레임을 플레이하기 위한 시간이 도달할 때 보코더로 소거 이벤트를 시그널링하는 것이다. 다른 방식은 소실된 패킷을 단순히 무시하고 소실된 프레임을 대신하여 다음의 이용가능한 보코더 프레임을 플레이하는 것이다. 후자의 방법은 소실된 프레임 이벤트에 대한 지식이 이용가능하지 않거나 계층 제출 프레임에서 플레이아웃을 위해 보코더에 알려진 때 사용된다. 이런 전략은 또한 데이터 전송을 재개할 기회로서 소실된 데이터를 이용함으로써 VoIP 스트림에서 시간에 대해 구축될 수 있는 단 대 단 매체 지연을 셰딩 또는 시간 압축하는데 사용될 수 있다. 어떤 보코더 프레임을 무시하는 것이 최적인지를 결정하기 위해 패킷-데이터 네트워크에 대한 기대는 음성 품질에 대한 현저 한 악영향을 미칠 수 있다.
결론적으로, 소정의 패킷 데이터 네트워크의 장기간 성능 통계에 기초한 임계치를 선택하는 것은 특정 네트워크 또는 네트워크 경로가 평균이상으로 또는 앞서 획득된 통계보다 더욱 우수하게 실행될 때, 음성 플레이 아웃을 불필요하게 지연하는 경향이 있다. 적시에 특정 포인트에서 실제 또는 예상 링크 성능에 기초한 임계치를 선택하는 것이 대안이다. 예를 들어, 경험적 단 대 단 지연의 실행 평균은 수신기에 의해 도표화 및 유지될 수 있으며, 매체 플레이아웃을 시작하기 위한 임계치로서 사용되는 소정의 상황이다.
그러나 실행 평균의 품질이 실질적으로 이를 결정하기 위해 사용된 샘플의 수와 비례하기 때문에, 이러한 평균 지연은 단지 연속한 토크 스퍼트(반양방향 통신) 또는 토크 스트림(양방향 통신)에 대해 사용될 수 있다. 대략적인 추정은 실행 평균을 컴파일링하는데 사용된 프레임의 수를 한정함으로써 나타날 수 있다. 극단적으로, 지연은 실질적으로 이러한 방식과 관련한 제한이 있더라도 제1 수신 패킷을 검사함으로써 나타날 수 있다.
만일 화자 및 청자가 조절된 시간 소스를 가지면(예를 들어, 코드 분할 다중 접속(CDMA) 시스템), 화자와 청자 사이에서 단 대 단 네트워크에서 정확하고 정밀한 결정이 행해질 수 있다. 만일 충분히 큰 샘플 크기에서 평균되면, 이러한 지연은 단 대 단 네트워크 지연의 고정된 컴포넌트를 나타내며, 매체 플레이아웃을 초기화하기 위해 사용된 워터마크로부터 제거될 수 있다. 결과는 예상된 지터를 제거하는데 요구되는 지연만을 나타내는 임계치이다.
따라서, 단 대 단 VoIP 매체 지연을 적절하게 관리하기 위한 메카니즘을 제공하고 음성 품질에 대해 가변의 늦거나 손실된 보코더 프레임 전달의 효과를 완화시키기는 것이 바람직하다.
본 명세서에 사용된 "포함"이라는 용어는 특징, 구성, 단계를 설명하기 위해 사용되지만, 이러한 용어의 사용은 하나 이상의 다른 특징, 구성, 단계의 부가 또는 존재를 배제하는 것은 아니다.
일 실시예는 통신 지연을 적절하게 관리하는 방법이다. 이는 통신 네트워크에서 단 대 단 매체 지연을 모니터링하는 단계; 단 대 단 매체 지연의 현재 값을 측정하는 단계; 단 대 단 지연의 측정된 현재 값을 예정된 매체 지연 값과 비교하는 단계; 및 측정된 단 대 단 지연의 현재 값이 예정된 매체 지연 값보다 큰 경우 데이터를 폐기하는 단계를 포함한다. 일 특징에서, 폐기 단계는 매체 플레이아웃 버퍼의 프레임에서 현재 깊이를 결정하는 단계를 더 포함한다. 다른 특징에서, 매체 플레이아웃 버퍼는 통신 네트워크 내의 수신기 위치에 위치된다. 다른 특징에서, 폐기 단계는 매체 스트림의 프레임의 총 수와 관련한 매체 스트림에서 목표 프레임의 비율을 계산하는 단계를 더 포함한다.
다른 실시예는 통신 네트워크에서 하나 이상의 데이터 프레임을 프로세싱하는 단계; 제1 샘플링 시간에 따라 하나 이상의 데이터 프레임을 샘플링하는 단계; 샘플링된 하나 이상의 데이터 프레임들을 인터폴레이팅하는 단계; 및 하나 이상의 데이터 프레임을 이용하여 플레이아웃 파형을 형성하는 단계를 포함하는, 적절하게 통신 지연을 관리하는 방법이며, 여기서 플레이아웃 파형은 적시에 예정된 길이를 갖는다. 일 특징에서 하나 이상의 데이터 프레임은 하나 이상의 보코더 프레임을 포함하며, 하나 이상의 보코더 프레임의 플레이아웃 시간은 제1 샘플링 시간과 상이하다. 다른 특징에서, 하나 이상의 보코더 프레임의 플레이아웃 시간은 제1 샘플링 시간보다 더 짧은 시간 기간이다. 다른 특징에서, 피치 보존 변환은 하나 이상의 보코더 프레임에 적용된다. 다른 특징에서, 피치 보존 변환은 하나 이상의 보코더 프레임의 플레이아웃 시간을 압축한다. 다른 특징에서, 피치 보존 변환은 하나 이상의 보코더 프레임의 플레이아웃 시간을 확장한다. 다른 특징에서, 큐에 저장된 하나 이상의 보코더 프레임이 저장되거나 모니터링된다. 다른 특징에서, 하나 이상의 보코더 프레임을 저장하는 큐는 플레이아웃 큐 버퍼이다. 또 다른 특징은 플레이아웃 큐 버퍼에 저장된 다수의 보코더 프레임을 모니터링하는 단계; 플레이아웃 큐 버퍼의 저장 용량 깊이를 확인하는 단계; 및 플레이아웃 큐 버퍼의 정도가 매체 스트림에서 예상된 지터를 차단하기에 충분한지를 결정하는 단계를 포함한다. 다른 특징에서 만일 플레이아웃 큐 버퍼의 깊이가 너무 얕아서 매체 스트림에서 예상된 지터를 차단할 수 없다면, 지연은 플레이아웃 파형으로 포함된다. 다른 특징에서, 지연은 플레이아웃 파형의 길이를 확장함으로써 변경된다. 다른 특징에서, 지연은 플레이아웃 파형의 길이를 압축함으로써 변경된다. 다른 특징은 피치 보존 변환을 하나 이상의 보코더 프레임에 적용한다. 다른 특징은 주파수 대 시간 도메인 변환을 하나 이상의 보코더 프레임에 적용한다. 다른 특징은 지연을 감소시키기 위해 시간 압축 알고리즘을 이용한다. 다른 특징은 지연이 예정된 값을 초과하는 경우, 지연을 감소시키기 위해 시간 압축 알고리즘을 이용한다.
다른 실시예는 통신 네트워크에서 단 대 단 매체 지연을 모니터링하는 수단; 단 대 단 지연의 현재 값을 측정하는 수단; 측정된 단 대 단 지연의 현재 값을 예정된 매체 지연 값과 비교하는 수단; 및 단 대 단 지연의 측정된 현재 값이 예정된 매체 지연 값보다 더 큰 경우 데이터를 폐기하는 수단을 포함한다. 일 특징에서, 폐기하는 수단은 매체 플레이아웃 버퍼의 프레임의 현재 깊이를 결정하는 것을 더 포함한다. 다른 특징에서, 매체 플레이아웃 버퍼는 통신 네트워크 내에서 수신기 위치에 위치된다. 다른 특징에서, 폐기하는 수단은 매체 스트림에서 프레임의 전체 수와 관련한 매체 프레임의 목표된 프레임의 비율을 계산하는 것을 더 포함한다.
다른 실시예는 통신 네트워크에서 하나 이상의 데이터 프레임을 프로세싱하는 수단; 제1 샘플링 시간에 따라 하나 이상의 데이터프레임을 샘플링하는 수단; 샘플링된 하나 이상의 데이터 프레임을 인터폴레이팅하는 수단; 및 하나 이상의 데이터 프레임을 이용하여 플레이아웃 파형을 형성하는 수단을 포함하며, 여기서 플레이아웃 파형은 적시에 예정된 길이를 갖는다. 일 특징에서, 하나 이상의 데이터 프레임은 하나 이상의 보코더 프레임을 포함하며, 하나 이상의 보코더 프레임의 플레이아웃 시간은 제1 샘플링 시간과 상이하다. 다른 특징에서, 하나 이상의 보코더 프레임의 플레이아웃 시간은 제1 샘플링 시간보다 더 짧은 시간 기간이다. 다른 특징은 피치 보존 변환을 하나 이상의 보코더 프레임에 적용시키는 것을 포함한다. 다른 특징은 주파수 대 시간 도메인 변환을 하나 이상의 보코더 프레임에 적용하는 것을 포함한다. 다른 특징에서, 피치 보존 변환은 하나 이상의 보코더 프레임의 플레이아웃 시간을 압축한다. 다른 특징에서, 피치 보존 변환은 하나 이상의 보코더 프레임의 플레이아웃 시간을 확장시킨다. 또다른 특징은 큐에 저장된 하나 이상의 보코더 프레임을 저장 및 모니터링한다. 다른 특징에서, 하나 이상의 보코더 프레임을 저장하는 큐는 플레이아웃 큐 버퍼이다. 다른 특징에서, 플레이아웃 큐 버퍼에 저장된 다수의 보코더 프레임을 저장하는 수단; 플레이아웃 큐 버퍼의 저장 용량 깊이를 확인하는 수단; 플레이아웃 큐 버퍼가 매체 스트림에서 예상 지터를 차단하기에 충분한지를 결정하는 수단이 존재한다. 다른 특징에서, 만일 플레이아웃 큐 버퍼의 깊이가 너무 낮아서 매체 스트림에서 예상 지터를 차단하지 못하는 것으로 결정되면, 지연은 플레이아웃 파형으로 유도된다. 다른 특징에서, 지연은 플레이아웃 파형의 길이를 확장함으로써 변경된다. 다른 특징에서, 지연은 플레이아웃 파형의 길이를 압축함으로써 변경된다. 다른 특징은 피치 보존 변환을 하나 이상의 보코더 프레임에 적용한다. 다른 특징은 주파수 대 시간 도메인 변환을 하나 이상의 보코더 프레임에 적용한다. 다른 특징은 지연이 예정된 값을 초과하는 경우, 지연을 감소시키기 위해 시간 압축 알고리즘을 이용한다.
다른 실시예에서, 통신 장치는 통신 네트워크에서 하나 이상의 데이터 프레임을 프로세싱하는 단계; 제1 샘플링이 시간에 따라 하나 이상의 데이터 프레임을 샘플링하는 단계; 샘플링된 하나 이상의 데이터 프레임을 인터폴레이팅하는 단계; 하나 이상의 데이터 프레임을 이용하여 플레이아웃 파형을 형성하는 단계를 포함하여, 적합하게 통신 지연을 관리하는 방법을 이용하는 컴퓨터 판독가능 매체를 포함하며, 여기서 플레이아웃 파형은 적시에 예정된 길이를 갖는다. 일 특징에서, 하나 이상의 데이터 프레임은 하나 이상의 보코더 프레임을 포함하며, 하나 이상의 보코더 프레임의 플레이아웃 시간은 제1 샘플링 시간과 상이하다. 다른 특징에서, 하나 이상의 보코더 프레임의 플레이아웃 시간은 제1 샘플링 시간보다 더 짧은 시간 기간이다. 다른 특징에서, 피치 보존 변환은 하나 이상의 보코더 프레임에 적용된다. 다른 특징에서, 주파수 대 시간 도메인 변환은 하나 이상의 보코더 프레임에 적용된다. 다른 특징에서, 피치 보존 변한은 하나 이상의 보코더 프레임의 플레이아웃 시간을 압축한다. 다른 특징에서, 피치 보존 변환은 하나 이상의 보코더 프레임의 플레이아웃 시간을 확장한다. 다른 특징에서, 큐에 저장된 하나 이상의 보코더 프레임이 저장되고 모니터링된다. 다른 특징에서, 하나 이상의 보코더 프레임을 저장하는 큐는 플레이아웃 큐 버퍼이다. 다른 특징은 플레이아웃 큐 버퍼에 저장된 다수의 보코더 프레임을 모니터링하는 단계; 플레이아웃 큐 버퍼의 저장 용량 깊이를 확인하는 단계; 및 플레이아웃 큐 버퍼의 깊이가 매체 스트림에서 예상 지터를 차단하기에 충분한지를 결정하는 단계를 포함한다. 다른 특징에서, 만일 플레이아웃 큐 버퍼의 깊이가 너무 낮아서 매체 스트림에서 예상 지터를 차단할 수 없다면, 지연은 플레이아웃 파형으로 포함된다. 다른 특징에서, 지연은 플레이아웃 파형의 길이를 확장함으로써 변경된다. 다른 특징에서, 지연은 플레이아웃 파형의 길이를 압축함으로써 변경된다. 다른 특징에서, 피치 보존 변환은 하나 이상의 보코더 프레임에 적용된다. 다른 특징에서, 주파수 대 시간 도메인 변환은 하나 이상의 보코더 프레임에 적용된다. 다른 특징에서, 시간 압축 알고리즘은 지연이 예정된 값을 초과하는 경우, 지연을 감소시키기 위해 사용된다.
본 발명의 특징 및 장점은 첨부한 도면과 관련한 상세한 설명에 의해 더욱 용이하게 이해될 것이다.
도1은 통신 네트워크의 예를 도시한다.
도2는 일 실시예에 따라 적절하게 통신 지연을 관리하는 동작을 설명한 흐름도이다.
도3은 일 실시예에 따라 데이터 프레임 인터폴레이팅의 연산을 설명한 흐름도이다.
도4는 일 실시예에 따라 예상 지터를 차단하기에 충분한 버퍼 깊이의 결정을 설명한 흐름도이다.
"예"라는 용어는 "예증, 실례, 사용례"를 의미하기 위해 사용된다. "예"로서 설명된 소정의 실시예는 다른 실시예에 비해 반드시 바람직하거나 장점을 갖는 것으로 한정되는 것은 아니다.
본 발명의 일 실시예가 상세히 설명되기 전에, 본 발명은 상세한 구성에 대한 적용 및 이하의 설명되거나 도면에서 설명되는 구성 요소에 한정되는 것은 아니라는 것을 이해해야 한다. 본 발명은 다른 실시예에서 구현되고 다양한 방식으로 실시될 수 있다. 또한, 사용된 표현 및 용어는 설명 및 이해를 위한 것이며 한정하기 위한 것은 아니라는 것을 이해해야 한다.
도1은 예로든 통신 네트워크(100)를 설명한다. 통신 네트워크(100)는 각각이 기지국(BS)에 연결된 하나 이상의 통신 타워(106) 및 통신 장치(102)를 갖는 서비스 사용자를 포함한다. 통신 장치(102)는 셀룰러 폰, 페이저, 개인 휴대 정보 단말기(PDA), 랩톱 컴퓨터, 또는 다른 휴대용, 고정형 또는 데이터 통신을 지원하는 이동형 통신 장치일 수 있다.
각각의 사용자에 의해 입력된 명령 및 데이터는 디지털 데이터로서 통신 타워(106)로 전달된다. 통신 장치(102)를 이용하는 사용자와 통신 타워(106) 사이의 통신은 상이한 기술 및 프로토콜에 기초할 수 있다. 예를 들어, 코드 분할 다중 ㅈ접속(CDMA), 시분할 다중 접속(TDMA), 주파수 분할 다중 접속(FDMA), 이동 통신용 글로벌 시스템(GSM), 또는 다른 타입의 통신 프로토콜이 무선 통신 네트워크 또는 데이터 통신 네트워크에 사용될 수도 있다. 각각의 사용자로부터의 데이터는 통신 타워(106)로부터 기지국(BS)(110)으로 전송되고 이동 전화 교환국(MSC)으로 전달되는데, 이는 공중 전화 교환망(PSTN)(118) 및 인터넷(120)에 연결될 수도 있다. MSC(114)는 통신 네트워크(110)에서 PTT 특성을 지원하는 서버(116)에 접속될 수도 있다. 서버는 각각의 통신 그룹의 멤버를 리스팅하는 테이블을 저장하는 것 외에 PTT 특성을 지원하는 애플리케이션을 포함한다. 선택적으로, 서버(116)는 MSC(114)의 일부일 수도 있다.
도2에 설명된 실시예에서, (도1에 설명된 예와 같이) 통신 네트워크를 통해 전송된 데이터에 존재하는 지연은 관찰되고 모니터링(200)된다. 데이터(예를 들어, 패킷, 데이터 프레임, 데이터그램, 보코더 프레임 등)의 소정의 일부와 관련하 여, 정보의 특정 부분과 관련한 지연의 현재 값이 결정(202)된다. 지연은 특정 구현 제안이 소정의 애플리케이션에 대해 유용하거나 요구되는 소정의 증가 또는 일시적 기간에서 측정될 수 있다. 측정된 지연 값이 결정된 후, 측정된 지연 값은 예정된 지연 값(204)과 비교된다. 일 실시예에서, 예정된 지연 값은 측정된 지연과 비교되는 수용가능한, 임계치 레벨을 나타낸다.
만일 지연(204)의 측정된 현재 값이 예정된 지연 값보다 더 크면, 데이터가 폐기(206)된다. 데이터의 폐기는 통신 네트워크의 지연을 개선한다. 폐기될 매체의 양을 결정하는 것은 포함된 통신 네트워크, 네트워크를 통과하는 매체의 타입 및 그 크기, 요구되는 품질 레벨(예를 들어, 음성 품질) 및 다른 이러한 가변 및 시스템 파라미터와 같은 몇몇 팩터에 의존한다. 폐기될 매체의 양은 전술한 팩터에 기초하거나, 폐기된 매체는 최종 사용자에 대한 수용가능한 결과를 탐색하는 동안 반복 방식으로 실행될 수 있다. 이는 통신 조건 및 연산 파라미터를 변경시키는 것에 기초하여 적절하게 프로세스를 관리하는 방법의 성능에 기여한다. 이어, 단계(206)에서 매체를 폐기할 때, 방법은 단계(200)에서의 지연 모니터링으로 복귀하며 반복적 방식으로 계속된다.
초기 지연으로부터 복구를 위한 일 방법은 수신기에서 보코더 프레임을 폐기하는 것이며, 각각의 프레임은 통상적으로 음성의 20ms를 나타낸다. 정보를 제거함으로써 단 대 단 매체 지연을 감소시키는 이러한 프로세스는 지연 셰딩의 형태이다. 아이디어는 수용가능한 레벨의 지연을 지원하기 위해 정보를 제거하는 것인 반면, 여전히 의도된 통신 콘텐츠를 식별하기 위한 충분한 정보를 유지한다. 8kHz 샘플링 가설을 중심으로 설계된 보코더는 통상적으로 프레임당 20ms의 스피치를 나타내도록 일반적으로 설계된다. 이러한 특정 값은 또한 IETF의 실시간 프로토콜(RFC 1889)에 의해 표준화된다. 기술 분야의 당업자는 본 발명의 사상을 벗어나지 않고, 상이한 샘플링 방식, 데이터 프레임의 크기, 가정 등이 사용될 수 있다는 것을 이해해야 한다.
지연을 관리하는 다른 방식은 화자에서(예를 들어, 전송 전) 보코더 프레임을 폐기하는 것이다. 이러한 방식은 대역폭을 절약하는 부가의 장점을 갖는데, 이는 더 적은 데이터가 통신 네트워크에 전송을 위해 입력되기 때문이다. 그러나 이러한 방식은 매체 품질 백채널을 이용하지 않는(즉, 매체 수신 통계와 관련한 피드백을 제공하기 위해 실시간 참조 프로토콜(RTCP) 또는 유사 프로토콜을 사용하지 않는) 반양방향 VoIP 애플리케이션에 대해 실용적인 것으로 고려된다. 기술 분야의 당업자는 VoIP 애플리케이션 외에, 다른 데이터 애플리케이션이 청구된 본원 발명의 사상을 벗어나지 않고 사용될 수 있음을 이해할 것이다.
플레이아웃할 프레임과 폐기할 프레임을 선택하는 것은 고려해야할 하나의 팩터인데, 이는 고도로 압축된 보코더 스트림으로부터 소정의 정보를 폐기하는 것이 음성 품질을 감소시키거나 악영향을 미치기 때문이다. CDMA 핸드셋[예를 들어, 콸콤 코드 여기 선형 예측(QCELP), 확장형 가변율 코딩(EVRC), 선택가능한 모드 보코더(SMV) 등]에 의해 사용된 소정의 가변율 보코더의 경우, 소정의 보코더 프레임은 다른 것보다 더 많은 임계 정보를 포함한다. 예를 들어, 8분의 1의 손실(또는 레이트 1/8로도 불림) 보코더 프레임으로 인해 인식된 음성 품질에 대한 영향이 전 체 레이트(또는 레이트 1로도 불림) 또는 2분의 1 레이트(또는 레이트 1/2로도 불림) 보코더 프레임으로 인한 영향보다 더 적은 것은 통상적으로 사실이다. 결론적으로, 폐기된 정보 및 사용된 보코더의 특성 및 영향은 무었을 얼마나 폐기할 지를 결정하는데 있어서의 고려사항이다.
지연 셰딩의 다른 형태는 청자에서 플레이아웃을 위해 준비된 바와 같이 8분의 1 레이트 프레임들을 주기적으로 폐기하는 것이다. 프레임이 폐기를 위해 식별되는 레이트는 (a) 현재의 단 대 단 매체 지연, (b) 청자에서 매체 플레이아웃 버퍼의 (프레임에서의) 현재의 깊이, 및 (c) 매체 스트림에서의 프레임의 전체 수와 관련하여 목표될 수 있는 프레임의 비율을 포함하는, 몇몇 팩터에 의존한다.
그러나 모든 8분의 1 레이트 프레임들이 동일한 것은 아니며, 비록 8분의 1 레이트프레임이 통상적으로 적시에 음성 스트리의 더 적은 임계 세그먼트를 코딩할 지라도, 단순히 20ms 세그먼트를 폐기하는 것은 디코딩된 스피치에서 현저한 가공물을 유도할 수 있다.
이러한 방식의 예는 의사 코드 형태로 이하에 개설된다.
Figure 112007036715373-PCT00001
바로 직전에 설명된 의사 코드 및 명세서에 제시된 소정의 다른 의사 코드는 이해와 설명을 위해 제공되는 것으로, 어떠한 방식으로든 본 발명의 사상을 한정하지 않음을 주의해야 한다. 더욱이, N분의1 레이트 프레임이 본 발명의 사상을 벗어나지 않고 사용될 수 있지만, 전술한 경우의 예는 8분의1 레이트 보코더 프레임을 사용하였음을 주의해야 한다.
전술한 의사 코드에서 일 가정은 이러한 방식이 단일 보코더 프레임을 실질적으로 플레이아웃: vocoder_play_frame()을 위해 보코더로 전송하기 위한 인터페이스만-통상의 회로 스위치 애플리케이션을 위해 순수하게 설계된 보코더가 제공하도록 요구되는 최소 인터페이스를 가정한다는 것이다.
출력 파형에서 상당한 매체 가공물을 도입할 가능성이 적은, 실시간으로 초기 매체 지연 딜레이로부터 복구하는 다른 방식은 변환 알고리즘을 이용하여 보코더 프레임을 생성하기 위해 최초에 사용된 파형보다 더 짧은 파형을 생성하도록 하나 이상의 연속적인 보코더 프레임을 이용하는 것이다. 더 짧은 파형을 생성하기 위해 사용될 수도 있는 변환 알고리즘의 소정의 예는 피치 보존 또는 등가의 주파수 대 시간 도메인 변환 등이다.
도3에 도시된 실시예에서, 하나 이상의 연속적인 보코더 프레임을 나타내는 데이터 프레임과 같은 데이터 프레임이 프로세싱(300)된다. 프로세싱은 특정 데이터프레임에 포함된 데이터 콘텐츠 및 데이터의 타입을 결정하는 것을 포함한다. 이어 데이터 프레임은 샘플링(302)되고, 인터폴레이팅(304)된다. 이는 데이터프레임이 특정 샘플링 방식에 따라 조사되게 함으로써 원하는 데이터프레임이 예정된 샘플링 표준에 따라 보여지게 하고 결국 예정된 인터폴레이션 표준에 따라 인터폴레이팅되게 한다. 인터폴레이션은 다른 값에 기초하여 값을 추정하는 방식이다. 예를 들어, 현재 데이터프레임이 재구성된 현재의 데이터프레임에 도달하기 위해 과거의 데이터프레임과 미래의 데이터프레임 사이에서 비교된다. 당업자에게 잘 열려진 차 샘플링 및 인터폴레이팅 기술은 본 발명의 사상을 벗어나지 않고 사용될 수 있다.
도3에서, 샘플링(302) 및 인터폴레이션(306) 이후에 예정된 길이(306)를 갖는 파형이 형성된다. 예를 들어, 지연을 감소시키기 위해, 보코더 프레임으로부터 생성된 최종 파형은 보코더 프레임을 생성하기 위해 최초에 사용된 파형보다 더 짧은 파형을 갖는 파형이다. 앞서 설명한 바와 같이, 피치 보존 또는 등가의 주파수 대 시간 도메인 변환은 더 짧은 파형을 생성하기 위해 사용될 수 있는 파형의 두 타입이다. 따라서, 단계(306)에서 예정된 길이를 갖는 파형을 형성할 때, 방법은 단계(300)에서 지연을 모니터링하기 위해 복귀하고 반복적 방식으로 계속된다.
VoIP 스트림의 초기 매체 플레이아웃이 음성 스트림으로 가공물 1000ms 딜레이를 도입하는 포인트로 딜레이되는 다른 예를 생각해보자. 또한, 이러한 특정 VoIP 애플리케이션에서, 매체는 데이터그램당 5개의 보코더 프레임으로서 번들링된다고 가정한다. 기술 분야의 당업자는 음성 스트림으로 도입된 가공물 딜레이의 양 및 데이터그램당 번들링된 보코더 프레임의 상이한 양을 나타내는 다른 값이 본 발명의 사상을 벗어나지 않고 사용될 수 있음을 이해해야 한다. 각각의 보코더 프레임을 독립적으로 보코더로 제출하고, 가능하게는 전술한 바와 같은 지연을 셰딩 하기 위해 스트림에서 소정의 8분의 1 레이트 프레임을 폐기하기보다는, 모든 5개의 보코더 프레임은 대응하는 100ms 입력보다 더 짧은 파형을 생성하기 위한 명령으로 그룹으로서 보코더로 제출될 수 있다.
임의의 거의 임의의 시간 파형이 보코더 프레임 데이터 그 자체에 의해 제공된 주파수 도메인 정보로부터 생성되게 하는 피치 보존 변환이 존재한다. 다양한 애플리케이션 계층 인터페이스가 한정될 수도 있고 실시간 VoIP 스트림에서 지연을 압축 및 셰딩하기 위해 보코더에 대해 실행되리 수도 있다.
일 예에서, 번들링된 매체를 수신하고 데이터의 5개의 프레임에 대해 셰딩하는 소정의 지연 없이 각각의 프레임을 개별적으로 제출하는 의사 코드는 이하와 같다.
Figure 112007036715373-PCT00002
그러나 만일 프레임당 20ms의 샘플링 레이트에 의해 생성된 것과 대응하는 파형보다 더 짧은 파형을 인터폴레이팅하는 명령으로 보코더에 하나 이상의 프레임을 제출하는 성능이 이용가능하면, 이하와 유사한 알고리즘의 예가 실행될 수 있 다.
Figure 112007036715373-PCT00003
이 경우, 새로운 보코더 인터페이스, vocoder_play_variable()이 요구된다. 이러한 인터페이스는 하나 이상의 보코더 프레임을 선택하고 이들을 적시에 예정된 길이를 갖는 플레이아웃 파형으로 인터폴레이팅한다. 이러한 보코더 프레임의 플레이아웃 시간은 (예를 들어, 피치 보존 변환의 사용을 통해) 원래의 샘플링 시간 보다 더 짧을 수 있기 때문에, 지연은 단순히 8분의 1 프레임을 드롭핑하는 것보다 더욱 적절하게 셰딩될 수 있다. 전술한 의사 코드의 예에서, 실시간 경험된 매체 지연이 예정된 한계를 초과할 때마다, 5개의 보코더 프레임의 번들은 매체 지연을 제어하기 위해 원래의 100ms 샘플링 기간(그러나 90ms 이하는 아님)으로부터 단축된다.
다른 알고리즘은 패킷 에러 레이트, 수신된 프레임 통계, 및 현재의 매체 버퍼 깊이와 같은 다른 정보를 이용할 수도 있다. 이러한 정보는 단독으로 또는 조합하여 사용될 수 있다. 적절하게 매체 지연을 셰딩하는 능력은 VoIP 애플리케이션의 선택적인 성능을 강화시킨다. 전술한 바와 같이, 근본적인 보코더에 의해 제공된 인터페이스 및 설계 특징은 어떻게 적절한 지연이 셰딩되는지를 결정한다. 하나 이상의 보코더 프레임의 가변 인터폴레이션을 지원하기 위해 인터페이스를 추가하는 것은 애플리케이션 계층에서 더욱 적절한 지연 셰딩 알고리즘을 구현하는데 사용될 수 있다.
지연 셰딩을 지원하는 것 외에, 새로운 인터페이스 vocoder_play_variable()은 VoIP 기반 애플리케이션에서 매체 언더런 이벤트의 발생을 완하시키기 위해 사용될 수 있다. 매체 언더런 이벤트는 다음 보코더 프레임을 플레이할 시간일 때, 패킷 손실, 네트워크 폭주, 또는 다른 팩터의 결과로서, 보코더 프레임이 청자에서 이용불가능할 경우 발생한다. 이를 설명하는 다른 방식은 청자가 너무 이르게 청취할 보코더 프레임을 소모한다는 것이다. 언더런 이벤트는 매체 지연이 높거나 낮은 때 발생하며; 문제는 통상적으로 서로 독립적이다.
일반적으로, VoIP 애플리케이션은 수신된 보코더 프레임의 도달간 딜레이에서의 지터를 제거하기 위해 인공적으로 작은 양의 단 대 단 매체 지연을 청자에서의 플레이아웃 스트림으로 도입한다. 이러한 작은 지연은 일반적으로 바람직한데, 이는 소정의 보코더 프레임이 예상보다 더 늦게 도달한다는 사실을 차단하는데 사용될 수 있기 때문이다.
실질적으로, 수신된 보코더 프레임의 도달 레이트에서 모든 가변성을 숨길 지연을 도입하는 것은 바람직하지 않다. 사실, 이러한 방식은 최악의 경우의 연산에 대해 시스템을 사이즈화한다. 이는 바람직하지 않게 초기의 큰 단 대 단 매체 지연을 도입시킨다. 소정의 늦은 도달 이벤트가 용인(그리고 늦은 도달 프레임은 무시됨)되어야 한다. 극단의 경우, 청자의 플레이아웃 버퍼는 도달할 새로운 프레임을 대기하는 동안 유출되어 언더런 조건을 발생시킨다.
이러한 언더런은 적어도 두 개의 기본적인 이유로 매체 품질을 저하시킨다. 첫 번째, 이는 매체 플레이아웃 파형에서 가공물 갭을 유도한다. 통상의 보코더 인터페이스의 경우, 도달할 새로운 매체를 대기하면서, 보코더는 언더런을 용인하고 소거 프레임(또는 등가물)을 플레이할 수밖에 없다. 두 번째, 만일 늦은 매체가 언더런 이후에 도달하면, 플레이아웃 파형을 더욱 저하시키는 늦은 매체는 드롭되어야 하며, 만일 늦은 매체가 플레이되면, 단 대 단 지연에서의 증가는 용인되어야 한다. 그리고, 만일 늦은 매체가 청자에게 도달하지 않지만, 오히려 늦은 패킷이 네트워크에서 손실(그러나 늦은 매체는 스케줄상에서 도달함)되면, 매체 품질은 플레이아웃 스트림으로부터 손실되는 프레임의 결과로서 악영향을 받는다.
그러나 플레이아웃에 대해 하나 이상의 보코더 프레임에 의해 생성된 파형의 적시의 길이를 제어하는 능력은 매체 품질에 대해 언더런 이벤트의 영향을 제어하기 위해 사용될 수 있다.
도4는 예상 지터를 차폐하기에 충분한 버퍼 깊이가 어떻게 결정되는지를 보여주는 실시예의 흐름도이다. 청자의 플레이아웃 큐에 저장된보코더 프레임의 수 를 모니터링(도4의 400)함으로써, 애플리케이션은 이러한 플레이아웃 버퍼의 깊이가 너무 낮아서 매체 스트림(도4의 402)에서 예상 지터를 차단하지 못할 때를 결정할 수 있다.
이어, 모니터링(400)된 보코더 프레임의 수에 기초하고, 버퍼 깊이가 예상 지터(402)를 차단하기에 충분한 지를 결정하여, 지연은 조절(도4의 404)될 수 있다. 이러한 조절은 원하는 표준에 따라 실행된다. 예를 들어, 일 실시예에서, 조절은 원하는 출력 또는 레벨의 품질에 기초할 수 있다. 이러한 시점에서, 애플리케이션은 생성된 파형의 길이를 확장함으로써 이용가능한 보코더 프레임을 이용하여 지연을 플레이아웃 파형으로 인공적으로 도입하도록 선택할 수 있다. 파형의 길이를 확장하는 것은 지연을 프로세스로 도입할 것이라는 것은 명확할 것이다. 또한, 피치 보존 변환의 애플리케이션은 이러한 상황에서 유용하다. 만일 매체 지연이 너무 크게 되면, 이는 시간 압축과 같은 상이한 방법으로 감소될 수 있다. 더욱이, 이러한 경우, 만일 지연된 매체가 이를 폐기하도록 강도되는 것보다 늦게 도달하면, 이러한 보코더 프레임의 정보는 비록 축소된 파형이라도, 더 우수한 품질을 생성하기 위해 사용될 수 있다.
이하의 의사 코드는, 매체 스트림으로부터의 손실 또는 딜레이된 프레임의 효과를 완화시키면서, 매체 지연이 이유없이 커지는 것을 제어하기 위해 시간 압축 및 시간 확장을 이용하는 다른 예의 플레이아웃 전략을 개설한다.
Figure 112007036715373-PCT00004
무선 서비스 제공자의 컴퓨터 장치 또는 무선 통신 장치상에서 실행가능한 방법을 고려하여, 상기 방법은 컴퓨터 판독가능 매체에 상주하는 프로그램에 의해 실행될 수 있으며, 여기서 프로그램은 서버 또는 상기 방법을 실행할 수 있는 컴퓨터를 갖는 다른 컴퓨터를 조정한다. 컴퓨터 판독가능 매체는 서버의 메모리이거나, 접속된 데이터 베이스에 있을 수 있다. 더욱이, 컴퓨터 판독가능 매체는 자기 디스크 또는 테이프, 광 디스크, 하드 디스크, 플래시 메모리, 또는 기술 분야에 알려진 다른 저장 매체와 같은 무선 통신 장치 컴퓨터 플랫폼으로 로딩가능한 2차 저장 매체에 존재할 수 있다.
기술 분야의 당업자는 설명된 방법 및 소정의 관련된 알고리즘이 범용 컴퓨터 상에서 실행하는 코드로부터 전용 회로, 및 이들의 소정의 조합에 걸쳐, 소정의 형태로 구현될 수 있다는 것을 이해할 것이다. 설명된 도2-4의 환경에서, 상기 방법은 기계 판독가능 명령의 시퀀스를 실행하기 위해 무선 통신 장치 또는 서버(또는 소정의 다른 장치 및 장치들의 조합)와 같은 (도1에 도시된 네트워크 같은) 무선 네트워크의 일부를 동작시킴으로써 구현될 수도 있다. 명령은 다양한 타입의 신호 포함 또는 데이터 저장 제1, 제2, 제3 또는 다른 레벨의 저장 매체에 상주할 수 있다. 예를 들어, 매체는 무선 네트워크의 컴포넌트에 의해 액세스 가능한 RAM(미도시) 또는 그 내부에 상주할 수도 있다. RAM, 디스켓, 또는 다른 2차 저장 매체에 포함되든지, 명령은 직접 액세스 저장 장치(DASD)[예를 들어, 통상의 하드 디스크 또는 저가형 디스크(RAID) 어레이의 리던던트 어레이], 자기 테이프, 전자 판독 전용 메모리(예를 들어, ROM, EPROM, 또는 EEPROM), 플래시 메모리 카드, 광 저장 장치(예를 들어, CD-ROM, WORM, DVD, 디지털 광 테이프), 페이퍼 "펀치" 카드, 또는 디지털 및 아날로그 전송 데이터를 포함하는 다른 적절한 데이터 저장 매체와 같은 다양한 기계 판독 가능 데이터 저장 매체에 저장될 수 있다.
또한, 소정의 설명된 회로, 논리 블록 다이어그램, 모듈 및 설명된 다양한 실시예와 관련한 알고리즘 단계는 하드웨어, 소프트웨어, 펌웨어, 또는 소정의 이들 조합으로 구현될 수도 있다. 하드웨어, 소프트웨어 및 펌웨어의 상호 호환을 명확하게 설명하기 위해, 다양한 회로, 논리 블록 다이어그램, 모듈 및 알고리즘 단계가 이들의 기능과 관련하여 일반적으로 설명된다. 어떻게 기능이 하드웨어, 소프트웨어 및 펌웨어에서 구현되는지에 대한 결정은 특정 애플리케이션 및 전체 시스템의 설계 제한에 의존한다. 설명된 기능 및 동작은 각각의 특정 애플리케이션에 대한 다양한 방식으로 구현될 수도 있지만, 이러한 구현 결정은 본 발명의 사상을 벗어나서 설명되지 않는다.
기술 분야의 당업자는, 비록 본 발명의 실시예가 설명되었지만, 다른 다양한 구현 및 관련된 알고리즘이 본 발명의 사상을 벗어나지 않고 가능하다는 것을 이해할 것이다. 본 발명의 사상은 전술한 설명보다는 첨부한 청구항에 의해 주어진다. 모든 변경 및 등가 변형은 본 발명의 사상 내에 있다.

Claims (56)

  1. 통신 지연을 적응력있게 관리하는 방법으로서,
    통신 네트워크에서 단 대 단 매체 지연을 모니터링하는 단계;
    단 대 단 매체 지연의 현재 값을 측정하는 단계;
    상기 측정된 단 대 단 지연의 현재 값을 예정된 매체 지연 값과 비교하는 단계; 및
    상기 단 대 단 지연의 측정된 현재 값이 상기 예정된 매체 지연 값보다 큰 경우 데이터를 폐기하는 단계를 포함하는,
    통신 지연 관리 방법.
  2. 제1항에 있어서,
    상기 폐기 단계는 매체 플레이아웃 버퍼의 프레임들에서 현재 깊이를 결정하는 단계를 더 포함하는 것을 특징으로 하는 통신 지연 관리 방법.
  3. 제2항에 있어서,
    상기 데이터 플레이아웃 버퍼는 상기 통신 네트워크 내의 수신기 위치에 배치되는 것을 특징으로 하는 통신 지연 관리 방법.
  4. 제2항에 있어서,
    상기 폐기 단계는 상기 매체 스트림에서 프레임들의 전체 수와 관련하여 매체 스트림에서 목표된 프레임들의 비율을 계산하는 단계를 더 포함하는 것을 특징으로 하는 통신 지연 관리 방법.
  5. 통신 지연을 적응력있게 관리하는 방법으로서,
    통신 네트워크에서 하나 이상의 데이터 프레임을 프로세싱하는 단계;
    제1 샘플링 시간에 따라 하나 이상의 데이터 프레임을 샘플링하는 단계;
    상기 샘플링된 하나 이상의 데이터 프레임을 인터폴레이팅하는 단계; 및
    상기 하나 이상의 데이터 프레임을 이용하여 플레이아웃 파형을 형성하는 단계를 포함하며, 상기 플레이아웃 파형은 적시에 예정된 길이를 갖는,
    통신 지연 관리 방법.
  6. 제5항에 있어서,
    상기 하나 이상의 데이터 프레임은 하나 이상의 보코더 프레임을 포함하며, 하나 이상의 보코더 프레임의 플레이아웃 시간은 상기 제1 샘플링 시간과 상이한 것을 특징으로 하는 통신 지연 관리 방법.
  7. 제5항에 있어서,
    상기 하나 이상의 보코더 프레임의 플레이아웃 시간은 상기 제1 샘플링 시간보다 더 짧은 시간 기간인 것을 특징으로 하는 통신 지연 관리 방법.
  8. 제6에 있어서,
    피치 보존 변환을 상기 하나 이상의 보코더 프레임에 적용하는 단계를 더 포함하는 것을 특징으로 하는 통신 지연 관리 방법.
  9. 제6항에 있어서,
    주파수 대 시간 도메인 변환을 상기 하나 이상의 보코더 프레임에 적용하는 단계를 더 포함하는 것을 특징으로 하는 통신 지연 관리 방법.
  10. 제6항에 있어서,
    상기 피치 보존 변환은 상기 하나 이상의 보코더 프레임의 상기 플레이아웃 시간을 압축하는 것을 특징으로 하는 통신 지연 관리 방법.
  11. 제6항에 있어서,
    상기 피치 보존 변환은 상기 하나 이상의 보코더 프레임의 플레이아웃 시간을 확장하는 것을 특징으로 하는 통신 지연 관리 방법.
  12. 제6항에 있어서,
    큐에 저장된 상기 하나 이상의 보코더 프레임을 저장 및 모니터링하는 단계를 더 포함하는 것을 특징으로 하는 통신 지연 관리 방법.
  13. 제12항에 있어서,
    상기 하나 이상의 보코더 프레임을 저장하는 상기 큐는 플레이아웃 큐 버퍼인 것을 특징으로 하는 통신 지연 관리 방법.
  14. 제13항에 있어서,
    상기 플레이아웃 큐 버퍼에 저장된 다수의 보코더 프레임을 모니터링하는 단계;
    상기 플레이아웃 큐 버퍼의 저장 성능 깊이를 확인하는 단계; 및
    상기 플레이아웃 큐 버퍼의 깊이가 매체 스트림에서 예상 지터를 차단할 정도로 충분한 지를 결정하는 단계를 더 포함하는 것을 특징으로 하는 통신 지연 관리 방법.
  15. 제14항에 있어서,
    상기 플레이아웃 큐 버퍼의 깊이가 너무 낮아서 상기 매체 스트림에서 상기 예상 지터를 차단할 수 없는 것으로 결정된 경우, 지연이 상기 플레이아웃 파형으로 도입되는 것을 특징으로 하는 통신 지연 관리 방법.
  16. 제15항에 있어서,
    상기 지연은 상기 플레이아웃 파형의 길이를 확장함으로써 변경되는 것을 특 징으로 하는 통신 지연 관리 방법.
  17. 제15항에 있어서,
    상기 지연은 상기 플레이아웃 파형의 길이를 압축함으로써 변경되는 것을 특징으로 하는 통신 지연 관리 방법.
  18. 제14항에 있어서,
    피치 보존 변환을 상기 하나 이상의 보코더 프레임에 적용하는 단계를 더 포함하는 것을 특징으로 하는 통신 지연 관리 방법.
  19. 제14항에 있어서,
    주파수 대 시간 도메인 변환을 상기 하나 이상의 보코더 프레임에 적용하는 단계를 더 포함하는 것을 특징으로 하는 통신 지연 관리 방법.
  20. 제15항에 있어서,
    만일 상기 지연이 예정된 값을 초과하면, 상기 지연을 감소시키기 위해 시간 압축 알고리즘을 이용하는 단계를 더 포함하는 것을 특징으로 하는 통신 지연 관리 방법.
  21. 통신 지연을 적응력있게 관리하는 장치로서,
    통신 네트워크에서 단 대 단 매체 지연을 모니터링하는 수단;
    단 대 단 매체 지연의 현재 값을 측정하는 수단;
    상기 측정된 단 대 단 지연의 현재 값을 예정된 매체 지연 값과 비교하는 수단; 및
    상기 단 대 단 지연의 측정된 현재 값이 상기 예정된 매체 지연 값보다 큰 경우 데이터를 폐기하는 수단을 포함하는,
    통신 지연 관리 장치.
  22. 제21항에 있어서,
    상기 폐기 수단은 매체 플레이아웃 버퍼의 프레임들에서 현재 깊이를 결정하는 것을 더 포함하는 것을 특징으로 하는 통신 지연 관리 장치.
  23. 제22항에 있어서,
    상기 데이터 플레이아웃 버퍼는 상기 통신 네트워크 내의 청자 위치에 배치되는 것을 특징으로 하는 통신 지연 관리 장치.
  24. 제21항에 있어서,
    상기 폐기 수단은 상기 매체 스트림에서 프레임들의 전체 수와 관련하여 매체 스트림에서 목표된 프레임들의 비율을 계산하는 것을 더 포함하는 것을 특징으로 하는 통신 지연 관리 장치.
  25. 통신 지연을 적응력있게 관리하는 장치로서,
    통신 네트워크에서 하나 이상의 데이터 프레임을 프로세싱하는 수단;
    제1 샘플링 시간에 따라 하나 이상의 데이터 프레임을 샘플링하는 수단;
    상기 샘플링된 하나 이상의 데이터 프레임을 인터폴레이팅하는 수단; 및
    상기 하나 이상의 데이터 프레임을 이용하여 플레이아웃 파형을 형성하는 수단을 포함하며, 상기 플레이아웃 파형은 적시에 예정된 길이를 갖는,
    통신 지연 관리 장치.
  26. 제25항에 있어서,
    상기 하나 이상의 데이터 프레임은 하나 이상의 보코더 프레임을 포함하며, 하나 이상의 보코더 프레임의 플레이아웃 시간은 상기 제1 샘플링 시간과 상이한 것을 특징으로 하는 통신 지연 관리 장치.
  27. 제25항에 있어서,
    상기 하나 이상의 보코더 프레임의 플레이아웃 시간은 상기 제1 샘플링 시간보다 더 짧은 시간 기간인 것을 특징으로 하는 통신 지연 관리 장치.
  28. 제26에 있어서,
    피치 보존 변환을 상기 하나 이상의 보코더 프레임에 적용하는 것을 더 포함 하는 것을 특징으로 하는 통신 지연 관리 장치.
  29. 제26항에 있어서,
    주파수 대 시간 도메인 변환을 상기 하나 이상의 보코더 프레임에 적용하는 것을 더 포함하는 것을 특징으로 하는 통신 지연 관리 장치.
  30. 제26항에 있어서,
    상기 피치 보존 변환은 상기 하나 이상의 보코더 프레임의 상기 플레이아웃 시간을 압축하는 것을 특징으로 하는 통신 지연 관리 장치.
  31. 제26항에 있어서,
    상기 피치 보존 변환은 상기 하나 이상의 보코더 프레임의 플레이아웃 시간을 확장하는 것을 특징으로 하는 통신 지연 관리 장치.
  32. 제26항에 있어서,
    큐에 저장된 상기 하나 이상의 보코더 프레임을 저장 및 모니터링하는 것을 더 포함하는 것을 특징으로 하는 통신 지연 관리 장치.
  33. 제32항에 있어서,
    상기 하나 이상의 보코더 프레임을 저장하는 상기 큐는 플레이아웃 큐 버퍼 인 것을 특징으로 하는 통신 지연 관리 장치.
  34. 제33항에 있어서,
    상기 플레이아웃 큐 버퍼에 저장된 다수의 보코더 프레임을 모니터링하는 수단;
    상기 플레이아웃 큐 버퍼의 저장 성능 깊이를 확인하는 수단; 및
    상기 플레이아웃 큐 버퍼의 깊이가 매체 스트림에서 예상 지터를 차단할 정도로 충분한 지를 결정하는 수단을 더 포함하는 것을 특징으로 하는 통신 지연 관리 장치.
  35. 제34항에 있어서,
    상기 플레이아웃 큐 버퍼의 깊이가 너무 낮아서 상기 매체 스트림에서 상기 예상 지터를 차단할 수 없는 것으로 결정된 경우, 지연이 상기 플레이아웃 파형으로 도입되는 것을 특징으로 하는 통신 지연 관리 장치.
  36. 제35항에 있어서,
    상기 지연은 상기 플레이아웃 파형의 길이를 확장함으로써 변경되는 것을 특징으로 하는 통신 지연 관리 장치.
  37. 제35항에 있어서,
    상기 지연은 상기 플레이아웃 파형의 길이를 압축함으로써 변경되는 것을 특징으로 하는 통신 지연 관리 장치.
  38. 제34항에 있어서,
    피치 보존 변환을 상기 하나 이상의 보코더 프레임에 적용하는 것을 더 포함하는 것을 특징으로 하는 통신 지연 관리 장치.
  39. 제34항에 있어서,
    주파수 대 시간 도메인 변환을 상기 하나 이상의 보코더 프레임에 적용하는 것을 더 포함하는 것을 특징으로 하는 통신 지연 관리 장치.
  40. 제35항에 있어서,
    만일 상기 지연이 예정된 값을 초과하면, 상기 지연을 감소시키기 위해 시간 압축 알고리즘을 이용하는 것을 더 포함하는 것을 특징으로 하는 통신 지연 관리 장치.
  41. 통신 지연을 적응력있게 관리하기 위한 방법을 실행하기 위해, 컴퓨터 장치에 의해 실행될 때, 명령들을 포함하는 컴퓨터 프로그램이 저장되는 컴퓨터 판독가능 매체로서, 상기 명령들은,
    통신 네트워크에서 하나 이상의 데이터 프레임을 프로세싱하고;
    제1 샘플링 시간에 따라 하나 이상의 데이터 프레임을 샘플링하고;
    상기 샘플링된 하나 이상의 데이터 프레임을 인터폴레이팅하고; 및
    상기 하나 이상의 데이터 프레임을 이용하여 플레이아웃 파형을 형성하는 것을 포함하며, 상기 플레이아웃 파형은 적시에 예정된 길이를 갖는,
    컴퓨터 판독가능 매체.
  42. 제41항에 있어서,
    상기 하나 이상의 데이터 프레임은 하나 이상의 보코더 프레임을 포함하며, 하나 이상의 보코더 프레임의 플레이아웃 시간은 상기 제1 샘플링 시간과 상이한 것을 특징으로 하는 컴퓨터 판독가능 매체.
  43. 제41항에 있어서,
    상기 하나 이상의 보코더 프레임의 플레이아웃 시간은 상기 제1 샘플링 시간보다 더 짧은 시간 기간인 것을 특징으로 하는 컴퓨터 판독가능 매체.
  44. 제42에 있어서,
    피치 보존 변환을 상기 하나 이상의 보코더 프레임에 적용하는 것을 더 포함하는 것을 특징으로 하는 컴퓨터 판독가능 매체.
  45. 제42항에 있어서,
    주파수 대 시간 도메인 변환을 상기 하나 이상의 보코더 프레임에 적용하는 것을 더 포함하는 것을 특징으로 하는 컴퓨터 판독가능 매체.
  46. 제42항에 있어서,
    상기 피치 보존 변환은 상기 하나 이상의 보코더 프레임의 상기 플레이아웃 시간을 압축하는 것을 특징으로 하는 컴퓨터 판독가능 매체.
  47. 제42항에 있어서,
    상기 피치 보존 변환은 상기 하나 이상의 보코더 프레임의 플레이아웃 시간을 확장하는 것을 특징으로 하는 컴퓨터 판독가능 매체.
  48. 제42항에 있어서,
    큐에 저장된 상기 하나 이상의 보코더 프레임을 저장 및 모니터링하는 것을 더 포함하는 것을 특징으로 하는 컴퓨터 판독가능 매체.
  49. 제48항에 있어서,
    상기 하나 이상의 보코더 프레임을 저장하는 상기 큐는 플레이아웃 큐 버퍼인 것을 특징으로 하는 컴퓨터 판독가능 매체.
  50. 제49항에 있어서,
    상기 플레이아웃 큐 버퍼에 저장된 다수의 보코더 프레임을 모니터링하고;
    상기 플레이아웃 큐 버퍼의 저장 성능 깊이를 확인하고; 및
    상기 플레이아웃 큐 버퍼의 깊이가 매체 스트림에서 예상 지터를 차단할 정도로 충분한 지를 결정하는 것을 더 포함하는 것을 특징으로 하는 컴퓨터 판독가능 매체.
  51. 제50항에 있어서,
    상기 플레이아웃 큐 버퍼의 깊이가 너무 낮아서 상기 매체 스트림에서 상기 예상 지터를 차단할 수 없는 것으로 결정된 경우, 지연이 상기 플레이아웃 파형으로 도입되는 것을 특징으로 하는 컴퓨터 판독가능 매체.
  52. 제51항에 있어서,
    상기 지연은 상기 플레이아웃 파형의 길이를 확장함으로써 변경되는 것을 특징으로 하는 컴퓨터 판독가능 매체.
  53. 제51항에 있어서,
    상기 지연은 상기 플레이아웃 파형의 길이를 압축함으로써 변경되는 것을 특징으로 하는 컴퓨터 판독가능 매체.
  54. 제50항에 있어서,
    피치 보존 변환을 상기 하나 이상의 보코더 프레임에 적용하는 것을 더 포함하는 것을 특징으로 하는 컴퓨터 판독가능 매체.
  55. 제50항에 있어서,
    주파수 대 시간 도메인 변환을 상기 하나 이상의 보코더 프레임에 적용하는 것을 더 포함하는 것을 특징으로 하는 컴퓨터 판독가능 매체.
  56. 제51항에 있어서,
    만일 상기 지연이 예정된 값을 초과하면, 상기 지연을 감소시키기 위해 시간 압축 알고리즘을 이용하는 것을 더 포함하는 것을 특징으로 하는 컴퓨터 판독가능 매체.
KR1020077011374A 2004-10-20 2005-10-19 단 대 단 VoIP 매체 지연을 관리하는 방법 및 장치 KR100902456B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/969,496 US7924711B2 (en) 2004-10-20 2004-10-20 Method and apparatus to adaptively manage end-to-end voice over internet protocol (VolP) media latency
US10/969,496 2004-10-20

Publications (2)

Publication Number Publication Date
KR20070085403A true KR20070085403A (ko) 2007-08-27
KR100902456B1 KR100902456B1 (ko) 2009-06-11

Family

ID=35873262

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020077011374A KR100902456B1 (ko) 2004-10-20 2005-10-19 단 대 단 VoIP 매체 지연을 관리하는 방법 및 장치

Country Status (14)

Country Link
US (1) US7924711B2 (ko)
EP (1) EP1805919A1 (ko)
JP (1) JP4504429B2 (ko)
KR (1) KR100902456B1 (ko)
CN (1) CN101080888B (ko)
AR (1) AR052318A1 (ko)
BR (1) BRPI0516987A (ko)
CA (1) CA2584818A1 (ko)
IL (1) IL182729A0 (ko)
MX (1) MX2007004824A (ko)
PE (1) PE20060897A1 (ko)
RU (1) RU2007118671A (ko)
TW (1) TW200637267A (ko)
WO (1) WO2006044930A1 (ko)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0420549D0 (en) * 2004-09-15 2004-10-20 Nokia Corp A method and entity for monitoring traffic
US8204740B2 (en) * 2006-02-06 2012-06-19 Telefonaktiebolaget Lm Ericsson (Publ) Variable frame offset coding
US8111720B2 (en) * 2007-01-09 2012-02-07 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus to indicate maximum scheduling delay for jitter buffer implementations
WO2009099365A1 (en) * 2008-02-05 2009-08-13 Telefonaktiebolaget L M Ericsson (Publ) Transmitting circuit switched data over hspa
CN104378075B (zh) 2008-12-24 2017-05-31 杜比实验室特许公司 频域中的音频信号响度确定和修改
US9412390B1 (en) * 2010-04-12 2016-08-09 Smule, Inc. Automatic estimation of latency for synchronization of recordings in vocal capture applications
JP5939489B2 (ja) 2011-03-10 2016-06-22 マーベル ワールド トレード リミテッド 非任意ネットワークに用いるデータブロックシステム
KR20120116137A (ko) * 2011-04-12 2012-10-22 한국전자통신연구원 음성 통신 장치 및 그 방법
US8838787B2 (en) * 2011-11-30 2014-09-16 Harman International Industries, Incorporated System for optimizing latency in an AVB network
US9219693B2 (en) 2012-02-22 2015-12-22 Marvell World Trade Ltd. Network devices with time aware medium access controller
US9882823B2 (en) 2012-03-08 2018-01-30 Marvell World Trade Ltd. Systems and methods for blocking transmission of a frame in a network device
US9960872B2 (en) 2012-03-08 2018-05-01 Marvell International Ltd. Systems and methods for performing a soft-block of a queue based on a size of a remaining period of a guard band
US8937974B1 (en) * 2012-05-02 2015-01-20 Marvell International Ltd. System and method for determining a margin of latency within a device
JP6047944B2 (ja) * 2012-06-26 2016-12-21 セイコーエプソン株式会社 受信装置及び相関積算処理方法
EP2896170B1 (en) 2012-09-11 2023-03-08 Marvell Asia Pte, Ltd. Method and apparatus for transmitting packets in accordance with ieee 802.1 qbv
US9191329B2 (en) * 2013-01-24 2015-11-17 Comcast Cable Communications, Llc Network latency optimization
US9330169B2 (en) * 2013-03-15 2016-05-03 Bose Corporation Audio systems and related devices and methods
US11146901B2 (en) 2013-03-15 2021-10-12 Smule, Inc. Crowd-sourced device latency estimation for synchronization of recordings in vocal capture applications
US10284985B1 (en) 2013-03-15 2019-05-07 Smule, Inc. Crowd-sourced device latency estimation for synchronization of recordings in vocal capture applications
WO2015013435A1 (en) * 2013-07-23 2015-01-29 Coco Communications Corp. Systems and methods for push-to-talk voice communication over voice over internet protocol networks
US9531921B2 (en) * 2013-08-30 2016-12-27 Audionow Ip Holdings, Llc System and method for video and secondary audio source synchronization
US9787742B2 (en) * 2014-09-29 2017-10-10 Intel Corporation Optimizing synchronization of audio and network tasks in voice over packet switched networks
CN105898541B (zh) 2014-11-12 2019-11-26 恩智浦美国有限公司 降低多媒体系统中等待时间的方法和装置
US11736405B2 (en) 2015-08-31 2023-08-22 Comcast Cable Communications, Llc Network packet latency management
US11234157B2 (en) * 2019-04-08 2022-01-25 T-Mobile Usa, Inc. Network latency aware mobile edge computing routing

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS54153503A (en) 1978-05-25 1979-12-03 Fujitsu Ltd Processing system for delayed information frame
JPS59190757A (ja) 1983-04-13 1984-10-29 Nippon Telegr & Teleph Corp <Ntt> パケツト通信方式
US4569042A (en) * 1983-12-23 1986-02-04 At&T Bell Laboratories Time measurements in a transmission path
JPH01120928A (ja) 1987-11-05 1989-05-12 Fujitsu Ltd 即時パケット転送制御方式
JPH022757A (ja) 1988-06-16 1990-01-08 Nippon Telegr & Teleph Corp <Ntt> パケット転送方式
US5721720A (en) 1994-12-28 1998-02-24 Kabushiki Kaisha Toshiba Optical recording medium recording pixel data as a compressed unit data block
US5623483A (en) 1995-05-11 1997-04-22 Lucent Technologies Inc. Synchronization system for networked multimedia streams
US5699481A (en) 1995-05-18 1997-12-16 Rockwell International Corporation Timing recovery scheme for packet speech in multiplexing environment of voice with data applications
US6115387A (en) * 1997-02-14 2000-09-05 Advanced Micro Devices, Inc. Method and apparatus for controlling initiation of transmission of data as a function of received data
US6115357A (en) * 1997-07-01 2000-09-05 Packeteer, Inc. Method for pacing data flow in a packet-based network
US6072809A (en) * 1997-08-14 2000-06-06 Lucent Technologies, Inc. Statistical method for dynamically controlling the playback delay of network multimedia streams
US6912224B1 (en) * 1997-11-02 2005-06-28 International Business Machines Corporation Adaptive playout buffer and method for improved data communication
JP3412524B2 (ja) 1998-07-29 2003-06-03 日本電信電話株式会社 Atmセル送信装置とatmセル受信装置およびatmセル送受信システム
US6665728B1 (en) * 1998-12-30 2003-12-16 Intel Corporation Establishing optimal latency in streaming data applications that use data packets
JP4074019B2 (ja) 1999-01-11 2008-04-09 三菱電機株式会社 多重化装置
US6512761B1 (en) * 1999-02-02 2003-01-28 3Com Corporation System for adjusting billing for real-time media transmissions based on delay
US6519223B1 (en) * 1999-04-06 2003-02-11 Telefonaktiebolaget L M Ericsson (Publ) System and method for implementing a semi reliable retransmission protocol
US6658027B1 (en) * 1999-08-16 2003-12-02 Nortel Networks Limited Jitter buffer management
US7272361B2 (en) 1999-12-24 2007-09-18 Ntt Docomo, Inc. Method and device for transmitting burst signal in mobile communication system, information distribution method, and information distribution controller
SG97830A1 (en) * 2000-01-07 2003-08-20 Matsushita Electric Ind Co Ltd Time based multimedia objects streaming apparatus and method
JP3986729B2 (ja) * 2000-05-26 2007-10-03 富士通株式会社 遅延揺らぎ吸収制御方法およびその方法を利用する多重化装置
SE518941C2 (sv) * 2000-05-31 2002-12-10 Ericsson Telefon Ab L M Anordning och förfarande relaterande till kommunikation av tal
JP4149143B2 (ja) * 2001-06-13 2008-09-10 富士通株式会社 移動通信システムのシグナリング通信方法
US7035210B2 (en) * 2001-07-12 2006-04-25 Telefonaktiebolaget Lm Ericsson (Publ) Media stream delay monitoring for node
US6999921B2 (en) * 2001-12-13 2006-02-14 Motorola, Inc. Audio overhang reduction by silent frame deletion in wireless calls
US7113514B2 (en) * 2002-02-13 2006-09-26 Motorola, Inc. Apparatus and method for implementing a packet based teleconference bridge
US7450593B2 (en) * 2003-06-23 2008-11-11 Intel Corporation Clock difference compensation for a network
US20050198681A1 (en) * 2004-03-08 2005-09-08 Sharp Laboratories Of America, Inc. Playout buffer management to minimize startup delay
WO2006109138A1 (en) * 2005-04-11 2006-10-19 Nokia Corporation A method and apparatus for dynamic time-warping of speech
US7447983B2 (en) * 2005-05-13 2008-11-04 Verizon Services Corp. Systems and methods for decoding forward error correcting codes
US7894489B2 (en) * 2005-06-10 2011-02-22 Symmetricom, Inc. Adaptive play-out buffers and adaptive clock operation in packet networks

Also Published As

Publication number Publication date
KR100902456B1 (ko) 2009-06-11
CN101080888B (zh) 2012-10-17
CN101080888A (zh) 2007-11-28
CA2584818A1 (en) 2006-04-27
TW200637267A (en) 2006-10-16
RU2007118671A (ru) 2008-11-27
PE20060897A1 (es) 2006-09-04
AR052318A1 (es) 2007-03-14
EP1805919A1 (en) 2007-07-11
US20060083163A1 (en) 2006-04-20
MX2007004824A (es) 2007-07-05
IL182729A0 (en) 2007-07-24
BRPI0516987A (pt) 2008-09-30
JP4504429B2 (ja) 2010-07-14
JP2008517560A (ja) 2008-05-22
US7924711B2 (en) 2011-04-12
WO2006044930A1 (en) 2006-04-27

Similar Documents

Publication Publication Date Title
KR100902456B1 (ko) 단 대 단 VoIP 매체 지연을 관리하는 방법 및 장치
US7324444B1 (en) Adaptive playout scheduling for multimedia communication
Liang et al. Adaptive playout scheduling using time-scale modification in packet voice communications
JP5591897B2 (ja) 適応デジッタバッファの方法及び装置
US10454811B2 (en) Apparatus and method for de-jitter buffer delay adjustment
AU2008330261B2 (en) Play-out delay estimation
JP5632486B2 (ja) 通信ネットワークにおいて伝送をスケジューリングする方法、対応する通信ノード及びコンピュータプログラム製品
US7450601B2 (en) Method and communication apparatus for controlling a jitter buffer
US7920492B1 (en) Devices, softwares and methods for redundantly encoding a data stream for network transmission with adjustable redundant-coding delay
EP2140637B1 (en) Method of transmitting data in a communication system
US8898060B2 (en) Source code adaption based on communication link quality and source coding delay
US7450593B2 (en) Clock difference compensation for a network
CN103229544B (zh) 源信号自适应帧聚合
US7444281B2 (en) Method and communication apparatus generation packets after sample rate conversion of speech stream
Siddique et al. VoIP call capacity over wireless mesh networks
Nihei et al. A QoE indicator and a transmission control method for VoIP on mobile networks considering delay spikes
Muyambo De-Jitter Control Methods in Ad-Hoc Networks
Praestholm et al. Packet voice rate adaptation through perceptual frame discarding
Jelassi et al. A Self-tuned Quality-Aware De-jittering Buffer Scheme of Packetized Voice Conversations
Maheswari et al. Receiver based packet loss replacement technique for high quality VoIP streams

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130531

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20140529

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20160330

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20170330

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20180329

Year of fee payment: 10