KR20050006264A - 디지털 네트워크 시스템에서 단말기 장치의 송신을제어하는 방법 - Google Patents

디지털 네트워크 시스템에서 단말기 장치의 송신을제어하는 방법 Download PDF

Info

Publication number
KR20050006264A
KR20050006264A KR10-2004-7018794A KR20047018794A KR20050006264A KR 20050006264 A KR20050006264 A KR 20050006264A KR 20047018794 A KR20047018794 A KR 20047018794A KR 20050006264 A KR20050006264 A KR 20050006264A
Authority
KR
South Korea
Prior art keywords
transmission
terminal device
function
audio signal
vre
Prior art date
Application number
KR10-2004-7018794A
Other languages
English (en)
Inventor
킨누넨킴모
란타니바미카
레흐티매키마티
Original Assignee
노키아 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 노키아 코포레이션 filed Critical 노키아 코포레이션
Publication of KR20050006264A publication Critical patent/KR20050006264A/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/66Arrangements for connecting between networks having differing types of switching systems, e.g. gateways
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/38Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
    • H04B1/40Circuits
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/06Selective distribution of broadcast services, e.g. multimedia broadcast multicast service [MBMS]; Services to user groups; One-way selective calling services
    • H04W4/10Push-to-Talk [PTT] or Push-On-Call services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W76/00Connection management
    • H04W76/40Connection management for selective distribution or broadcast
    • H04W76/45Connection management for selective distribution or broadcast for Push-to-Talk [PTT] or Push-to-Talk over cellular [PoC] services

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Telephonic Communication Services (AREA)

Abstract

본 발명은 디지털 네트워크 시스템(27)에서 단말기 장치(10)의 송신을 제어하는 방법에 관한 것이다. 상기 단말기 장치(10)는 적어도 상기 네트워크 시스템으로 수행될 송신을 활성화하기 위한 푸쉬-투-토크(Push-to-Talk: PTT) 기능을 포함하고, 상기 PTT 기능의 음성 제어를 위한 상기 단말기 장치(10)는, 활성화/부동태화(passivated)되는 것으로, 음성 인식 엔진(Voice Recognition Engine: VRE) 기능(23)에 의하여 구현되는 음성 작동 송신(Voice Operated Transmission: VOX) 특징도 포함한다. 상기 방법은, 오디오 신호로부터 정해진 키워드를 탐색하기 위해 상기 VRE 기능(23)이 사용되는 단계(406, 407); 상기 정해진 키워드가 상기 오디오 신호로부터 인식되는 단계(408); 송신하기 위한 차례(a turn to transmit)가 상기 네트워크 시스템(27)으로부터 요구되는 단계(409); 송신하기 위한 차례가 상기 네트워크 시스템(27)으로부터 수신되는 단계(412); 상기 송신이 연결되고 송신하기로 주어진 차례가 표시되는 단계(413, 414); 상기 송신이 수행되는 단계(415); 및 상기 송신이 부동태화되는 단계(419)에 의하여 수행되고, 상기 VOX 특징에서 상기 VRE 기능(23) 이전에 상기 오디오 신호는 단말기 장치(10)에 연결하여 배치된 음성 활동 검출(Voice Activity Detection: VAD) 기능(22)에 의하여 모니터되고, 이로써 상기 단말기 장치(10)에서 상기 VOX 특징이 활성화될 때(401, 402), 상기 부분적 단계들(406-419) 전에, 단말기 장치(10)로 들어오는 오디오 신호가, 정해진 기준에 따른 신호 형식을 찾기 위해 그것을 탐색하는 VAD 기능(22)으로 처리되는 단계(404, 405); 및 상기 정해진 기준에 따른 신호 형식이 상기 오디오 신호에서 검출된 때, 상기 VRE 기능은 정해진 키워드를 찾기 위해 활성화되는 단계(405, 406)들이 수행되는 것을 포함한다.

Description

디지털 네트워크 시스템에서 단말기 장치의 송신을 제어하는 방법{Method in a digital network system for controlling the transmission of terminal equipment}
예를 들어, 지상 공용 통신(TErrestrial Trunked RAdio: TETRA) 시스템과 같은 디지털 무선 네트워크 시스템에서, 반복신(semiduplex) 통신은 시스템 용량의 관점에서 통신의 효율적인 모드를 나타낸다. 시스템 용량에 있어서 일반적인 애로사항은 제한된 대역폭 및 시스템의 프로세싱의 성능이다. 반복신 통신을 수행하기 위하여서는, 하나의 다운링크 트래픽 채널만이 송수신 기지국으로부터 상기 단말기 장치로 브로드캐스팅하기 위하여 필요할 뿐이고, 하나의 업링크 채널이 송신 단말기 장치를 위하여 필요하다. 채널 상에서의 통신은 이른바 브로드캐스트들에 의하고, TETRA 스위칭 센터는 이것을, 메시지가 그것들 중 하나만을 위하여 의도된 것이라 할지라도, 단말기 장치의 모든 부분들에게 전송한다. 업링크 트래픽을 배열하기 위한 트렁킹의 확정된 방법이 일반적으로 요구되는데, 이는 단말기 장치의 송신들을 구성하기 위하여 사용된다.
그러나, 시스템에서 한 번에 단지 하나의 송신 통화 상대(party)만이 존재하여야 한다는 것이 반복신 통신에서의 요구 조건이다. 이러한 요구 조건은 단말기 장치의 PTT(Push-to-Talk) 스위치에서 충족되는 것이 일반적인데, 사용자는 송신하고자 할 때 그것을 눌러야 한다. PTT 스위치를 누르게 되면 송신할 차례에 대한 요구가 만들어지고, 이것을 기반으로 하여 TETRA 스위칭 센터의 트렁킹 시스템은 한번에 하나의 통화 상대에 그의 토킹(talking) 차례 표시 알고리즘을 기반으로 하여 토크 할 차례를 부여한다.
그룹 및 직접적인 사적 호출들(개인용 반복신)에 있어서 모두, TETRA 시스템에 있어서도 반드시, 예를 들어 허가(authorities)에 의하여 사용되는 반복신 통신에서 사용되는 모든 통화 상대들은 그것들의 토크 할 차례 이전에 송신할 차례를 요구하여 획득한다. 전통적으로, 이러한 것은 단말기 장치의 PTT 스위치를 사용하여 구현되어 왔다. 그러나, 이러한 방법은 본질적으로 통신하는 동안 단말기 장치의 사용자의 활동성을 제한한다. 왜냐하면, 사용자는 PTT 스위치를 누르기 위하여 한 손을 사용하여야 하기 때문이다.
사무실 및 야외 조건들 모두에 있어서 여러 실제 상황들이 존재하는데, 양 손 모두가 자유스러운 것이 효과적인 경우가 있을 것이다. 그와 같은 상황들의 예들로는 모터바이크 또는 자동차와 같은 차량들에서 수행되는 통신을 들 수 있고, 나아가 예를 들어, 전기 기술자가 그의 전기 설비에 대하여 코멘트를 하는 경우에 있어, 전기 기술자는 그 설비 또는 그와 같은 다른 계측을 해결하기 위하여 그의 양손을 모두 사용할 필요가 있을 경우가 이에 해당할 것이다.
더욱이, 양손이 모두 자유스러워야 하는 유사한 종류의 상황들이 PoC(Push-to-talk over Cellular) 특징/서비스를 지원하는 단말기 장치와 관련하여서도 발생한다. 그것이 그처럼 알려진 종류의 듀플렉스 무선 서비스로서 구현되는 것은 PoC특징의 특유한 것이다. 단말기 장치의 사용자는 실질적으로 말하여서, 그 자신의 그룹과 지속적인 커넥션을 형성할 수 있는데, 이럼에도 불구하고, 커넥션의 관리 유지는 송신 채널을 항상 바쁘게 만드는 것은 아니다.
PoC 특징을 사용할 때, 사용자는 그의 단말기 장치의 이어폰에서 송신 키를 누르고, 즉시 송신될 메시지를 말할 수 있다. 송신 시간에 있어서 예를 들어, 패킷 커넥션(GPRS와 같은)과 같은 데이터 통신 네트워크에 연결되는, 사용자로서 동일한 그룹에 속하는 그와 같은 모든 통화 상대들은 상기 메시지를 듣게 될 것이다. 또한 PoC 특징은 적어도 두 개의 송신 모드들을 지원한다. 첫 번째 모드에서, 상기 통화 상대들 중 하나는 그 외 다른 통화 상대들에게 그룹 호출을 보낼 수 있는 반면에, 두 번째 모드에 있어서는 상기 통화 상대들 중 하나는 일정한 다른 통화 상대에게 직접 호출을 보낼 수 있다.
상기에서 언급된 트래픽 상황들에 더하여, PoC 특징을 사용하는 경우 양손을 자유롭게 사용하는 것이 필요한 상황들이 발생할 수 있는데, 예를 들어 네트워크 게임들을 할 때가 그러하다. 이에 의하여 플레이어들은 게임이 진행되는 동안 다른 통화 상대들과 코멘트를 주고 받을 수 있다. 종래 기술의 수준에 따르면, 송신을 수행하기 위하여 수동 커넥션이 형성되어야 한다. 또 다른 문제점으로는 그룹 호출이 이루어질 때, 사용자는 또 다른 일정한 통화 상대와 사적인 통신을 쉽게 수행할 수 없다는 것이다.
VOX 기능, 즉, 음성 작동 송신은 반복신 통신에서 사용되는 단말기 장치의 일정한 아날로그 사설 이동 라디오(Private Mobile Radio: PMR) 부분들과 구별되는특징이다. 이러한 것들에서, VOX 특징은 수동으로 PTT 스위치를 누르지 않고 토크할 차례를 요구하게 하는 것이다.
음성 활동 검출(Voice Activity Detection: VAD)의 사용은 불연속 송신(Discontinuous Transmission: DTX)의 구현과 구별된다. 이로써, 호출 중에 마이크로폰 신호에서 VAD로 음성이 검출되지 않을 때, 이러한 조용한 순간들에 상응하여 단말기 장치는 전체 업링크 버스트(bursts)를 송신하기 위하여 사용되지 않는다. 이러한 기능은 송신 전력의 지속 시간을 아껴서, 단말기 장치의 효과적인 작동 시간을 연장한다.
요즈음 이동국 단말기 장치의 일정한 유형들은 토크 검출 특징을 갖추고 있다. 이러한 것들에 있어, 사용자는, 예를 들어 호출될 통화 상대의 이름 "찰리"와 같이, 사용자가 정한 명령을 말하여 상기 단말기 장치를 제어할 수 있다. 상기 명령의 결과에 있어, 상기 단말기 장치는 호출될 토크 상대(찰리)의 가입자 식별번호(identity)를 활성화한다. 사용자의 선택에 따라, 상기 명령에 의해 활성화된 상기 가입자 식별번호는 키를 누르는 것에 의하여 긍정 응답될(acknowledged) 수 있거나, 또한 단말기 장치는 사용자의 통화 상대에 대한 어떠한 행동 없이도 상기 명령에 의하여 활성화된 통화 상태의 가입자 식별번호를 호출할 수 있다.
예를 들어, 프로세서가 오디오 데이터를 처리하는 것과 같은 활동 중인 오디오부들이 지속적으로 전류 소비를 하기 때문에, 프로그램-기반 솔루션을 기반으로 하는 그와 같은 VOX 기능을 이동 단말기 장치에서 구현하는 것은 매우 불리하다. 이는 들어오는 오디오 신호를 끊임없이 대면하여 토크 또는 개별적 워드들을 검출한다.
VOX를 구현하는 수많은 방법들이 제안되어 왔지만, 이러한 것들은 예를 들어, 집적 부가(integrated additional) VOX 회로들 또는 별도의 회로 다이어그램들과 같은 하드웨어-레벨 솔루션들을 기반으로 하는 것이 일반적이었다. 이러한 유형의 솔루션들의 약점들로는 컴포넌트 비용들이 증가되는 것, 컴포넌트들에 의해 필요한 부가적인 공간이 증가되는 것, 또한 명백하게도 단말기 장치의 보다 큰 대기(standby) 공간의 전류 소비가 증가되는 것이다. 예를 들어, 상기-언급된 지속적인 오디오 모니터링과 같은 것으로서 소프트웨어-기반으로 한 구현들도 알려져 있다. 또한, 증가된 전류 소비는 이동 단말기 장치에 있어서 이들의 사용을 제한한다. 그러나, 이러한 솔루션들은, 예를 들어 자동차 설비 시리즈(car installation series)에 있어서 그 기능을 수행하는데, 여기서 전류 소비는 그처럼 주된 문제점이 아니다.
종래 기술과 관련하여, PCT 공개 공보 WO-96/11529 및 미국 특허 공개 공보 5,912,882에 대한 참조가 이루어진다. 공개 공보 WO-96/11529는 음성 인식 기능을 사용하여 무선 전화의 송신을 활성화하는 내용을 담고 있다. 여기서, 단말기 장치는 오디오 데이터 상의 키워드들에 관한 끊임없는 인식을 수행한다. 그러나, 송신 커넥션을 활성화하기 위해서 단어들에 관한 인식을 기반으로 하는 음성 인식(VRE) 기능의 사용에는 상당한 전력이 소비되고, 이것은 이동 단말기 장치의 부품들과 특히 관련된 실제 문제점이다.
미국 특허 공개 공보 5,912,882는 PSTN 네트워크에서의 사설 통신 시스템의구현을 제시한다. 이것은 음성 제어에 의한 PTT 설비의 활성화에 관해 기재하고 있다. 그러나, 이것은 진정한 디지털 네트워크 시스템이 아니고, 신호는 무선 네트워크(CDMA)로부터 전화 네트워크(PSTN)으로 이동하는 동안 DA 변환을 거친다. 그러나, 음성 인식에 의한 PTT기능의 활성화는 실제 상황들에서는 전혀 기능을 수행하지 않을 것이다. 왜냐하면 원칙적으로 송신은 음성 또는 일반적으로 예를 들어, 토크와 같은 것으로 인식 가능한 모든 오디오 신호에 의하여 활성화되기 때문이다. 부가적으로, PTT를 부동태화하는 것은 중지(pause)를 검출하는 것에 의해 수행되는데, 이는 미리 정한 지속 기간에 해당한다.
모든 것을 고려하여 볼 때, 이동 단말기 장치에서 종래 기술의 솔루션들을 가지고 기능을 수행하는 것 그리고 특히 신뢰할 만하고 효율적인 VOX 기능을 수행하는 것은 어려운 일이다. 예를 들어, 상기 단말기 장치가 트렁킹 시스템에 토크 차례를 요구해야 하는 디지털 트렁킹 시스템의 경우에는 특히 그러하다.
본 발명은 디지털 네트워크 시스템에서 단말기 장치의 송신을 제어하기 위한 방법에 관한 것으로, 이러한 단말기 장치는 적어도 상기 네트워크 시스템으로 수행될 송신을 활성화하기 위한 푸쉬-투-토크(Push-to-Talk: PTT) 기능을 포함하고, 또한 상기 PTT 기능의 음성 제어를 위한 상기 단말기 장치(10)는, 활성화/부동태화(passivated)되는 것으로, 음성 인식 엔진(Voice Recognition Engine: VRE) 기능(23)에 의하여 구현되는 음성 작동 송신(Voice Operated Transmission: VOX) 특징도 포함하며,
상기 방법은,
오디오 신호로부터 정해진 키워드를 탐색하기 위해 상기 VRE 기능이 사용되는 단계,
상기 정해진 키워드가 상기 오디오 신호로부터 인식되는 단계,
송신하기 위한 차례(a turn to transmit)가 상기 네트워크 시스템으로부터 요구되는 단계,
송신하기 위한 차례가 상기 네트워크 시스템으로부터 수신되는 단계,
상기 송신이 연결되고 송신하기로 주어진 차례가 표시되는 단계,
상기 송신이 수행되는 단계, 및
상기 송신이 부동태화되는 단계에 의하여 발생된다.
또한 본 발명은 셀룰러 상의 푸쉬-투-토크(Push-to-talk over Cellular: PoC) 스피치 서비스들 시스템들에서 적용될 것이다.
도 1은 단말기 장치의 기능부의 예를 도시한다.
도 2는 본 발명에 따른 방법의 어플리케이션의 예를 도시한다.
도 3a 및 도 3b는 본 발명에 따른 방법의 일 구현예의 예를 도시하는 흐름도이다.
도 4a 및 도 4b는 본 발명에 따른 방법의 또 다른 구현예의 예를 도시하는 흐름도이다.
도 5는 본 발명에 따른 방법의 어플리케이션의 또 다른 예를 도시한다.
본 발명의 목적은 디지털 네트워크 시스템에서 단말기 장치의 송신을 제어하는 방법으로서, 본질적으로 보다 유익하고, 보다 사용하기 편리하며, 보다 신뢰할만한 방법을 제공하는 것이다. 본 발명에 따른 방법의 특유한 특징은 청구항 1항에서 제시된다.
본 발명에 따른 방법은 현존하는 VAD(음성 활동 검출) 및 VRE(음성 인식 엔진) 알고리즘들을 사용하는 단말기 장치의 모든 부품들에 본 발명의 가장 간단한 형태로 VOX 특징을 구현하는 것을 가능하게 한다. 오디오 신호의 검출하는데 있어,그리고 하나 이상의 키워드들을 위해 이것을 탐색하는 데 있어, 단말기 장치는 본 발명의 방법에 따라 사용되는 것이 바람직하다. VRE 기능은, 사용되는 네트워크 시스템에 따라, 오디오 DSP(디지털 신호 프로세싱) 알고리즘들에 의해 간단히 구현될 수 있고, 오디오 신호에서 토크할 차례에 대한 요구를 검출하는데 사용될 수 있고, 또한 송신을 활성화하는 키워드들을 검출하는데 일반적으로 사용될 수 있다.
특징의 활성화는 특별한 UI(사용자 인터페이스) 개념과 함께 수행될 수 있으므로, 그것의 유연한 온/오프 스위칭을 가능하게 한다. 실제로, 이것은 단말기 장치의 사용자가 먼저 일정한 방식으로 VOX 특징을 활성화해야 하는 것을 의미하는데, 여기서 그러한 특징은, 예를 들어 정해진 시간 주기 동안, UI에서 사용자가 선택한 것에 따라 또는 논리적 시퀀스로 활성화된다.
본 발명에 따른 방법은 반복신 트래픽에서 단말기 장치의 유용성을 본질적으로 향상시킨다. TETRA와 같은 트렁킹 시스템들에서는 유리한 점이 있다. 모든-IP-기반 시스템들을 위해 디자인된 VoIP(인터넷 프로토콜 상에서의 음성) 전문적 토크 서비스들의 일 구현예에 해당하는 PoC(셀룰러 상의 푸쉬-투-토크) 그룹 통신에서 역시 당해 특징으로 인한 유리한 점이 얻어진다. 그들의 목적들 중 하나는 예를 들어, GPRS 시스템을 통하여 IP 패킷들로 송신하는 토크를 제어하는 것이다.
단말기 장치에 어떠한 부가적인 장치 또는 컴포넌트들을 설치하지 않고 완전히 소프트웨어 기반으로 구현된 경우에는, VAD 및 VRE 기능들이 결합된 것으로서 VOX 특징은 상당히 가변 비용들을 감소시키고, 단말기 장치의 인쇄 회로 보드의 크기를 감소시키며, 특히 기본적인 전류 소비를 감소시킨다. 이러한 방법에 따라 구현될 경우에, 이러한 특징은 현존하고 알려진 제품 플랫폼들 상에서 유익하게 구현될 수 있다. 왜냐하면, 그것들의 오디오부들은 필요한 VAD 및 VRE 기능들을 포함하는 것이 일반적이기 때문이다. 소프트웨어-기반의 솔루션 및 사용자 인터페이스 개념은, 예를 들어 그것의 온/오프 특징 및 사용자들의 필요에 따른 부동태화 및 활성화 설정과 같은 기능에 관한 설정들을 구성하는데 있어 수많은 가능성을 제공한다.
일 구현예에 따르면, 본 발명에 따른 방법은 예를 들어, 상기-언급된 PoC 그룹 통신에서도 사용될 수 있을 것이다. 이로써, 이러한 개념은 예를 들어 토크할 차례들의 할당 및 토크의 유형들에 관하여 트렁킹 시스템들과 차이날 수 있다. PoC 그룹 통신에서, 본 발명에 따른 방법은, 수신자의 결합된 선택에 대해, 상기 송신의 활성화뿐만 아니라, 어플리케이션의 부가적인 형식으로 이용될 수 있다.
본 발명에 따른 방법으로 달성된 다른 부가적인 이점들은 상세한 설명으로에서 나타나는 반면, 특유한 특징들은 첨부되는 청구항들에서 나타난다.
이하에서 제시될 구현예들로 제한되지 않는 본 발명에 따른 방법은 첨부하는 도면들을 참조하여 보다 상세하게 설명될 것이다.
도 1은 본 발명에 따른 방법을 구현하는 디지털 단말기 장치(10)의 기능적인 부분들의 예를 도시한다. 단말기 장치(10)의 프로세서 유닛(18)과 연결하여 송신기-수신기 회로(19)가 배치되고, 그 중에서 특히, 이와 연결하여 송신을 수행하고 수신하기 위해서 안테나(25)가 연결된다. 더욱이, 프로세서 유닛(18)과 연결되는 것으로서, 있음직한 SIM(가입자 식별번호 모듈) 카드(16) 뿐만 아니라 스위치들 그리고 단말기 장치(10)의 키보드(11), 네비게이션 및 선택 키들(15)이 있다. 그 중에서도 특히, 송신할 차례에 대한, 발생 가능한 요구를 제어하고, 송신을 제어하는 PTT(푸쉬-투-토크) 스위치(26) 역시 상기 스위치들에 해당된다.
단말기 장치(10)는 프로세서 유닛(18)과 연결하여 배치되는 디스플레이 제어기(13)와 다시 연결하여 배치되는 LCD 디스플레이(21)를 포함할 수 있다. 더욱이, 프로세서 유닛(18)과 연결하여 배치되는 것으로는, 있음직한 부저(buzzer)(20b)뿐만 아니라 그처럼 알려진 종류로서 스피커 및 마이크로폰 수단(12, 20a)과 연결하여 배치되는 오디오부(14)뿐만 아니라, 갱신가능한 롬 메모리(17b) 및 램 메모리(17a)가 있다. 도 1에서 도시된 단말기 장치(10)의 기능적인 부분들은 예시에 의한 대략적인 방식으로 도시되었음에 유의해야 한다. 단말기 장치(10)는 예를 들어, 그것의 유형에 따라, 서로 다른 수많은 방식으로 구현될 수 있지만, 이러한 것들은당업계에서 숙련된 자들에 있어서는 명백한 것이다.
본 발명에 따른 방법에 있어서는, 예를 들어 단말기 장치(10)의 오디오부(14)에 알고리즘 모듈(22) 즉, 음성 검출이, VAD(음성 활동 검출)를 구현하는 소프트웨어 서브-섹션으로서 배치되는 것이 본질적이다. 보다 발전된 구현예에 따르면, 오디오부(14)의 기능은 서브-섹션으로서, VAD 모듈(22) 외에, VRE(음성 인식 엔진) 기능(23) 즉, 음성 인식을 포함하는 DSP 모듈도 포함한다.
다음에는 본 발명에 관한 유익한 구현예가 도 2, 도 3a 및 도 3b를 참조하여 설명될 것이다. 도 2는 본 발명에 따른 방법의 어플리케이션에 관해 개략적으로 도시한 것이다. 예를 들어 야외에서 순찰중인 경찰관 또는 그와 같은 권위, 기업 또는 공공 교통국을 대표하는 사람들에 해당할 수 있는 사용자들 A, B 및 C는 도 1에서 도시된 기능에 따른 단말기 장치(10)를 가지고 있다. 일 구현예에 따르면, 단말기 장치(10)의 부품들은 TETRA(지상 트렁킹 무선)(27)과 같은 디지털 트렁킹 시스템을 기반으로 하는 네트워크 시스템에서 작동하도록 만들어진다. 트렁킹 시스템에 있어서는, 단말기 장치(10)가 송신할 차례를 상기 트렁킹 시스템에 요구할 때, 시스템의 스위칭 및 관리 기반구조(Switching and Management Infrastructure: SwMI)는 정해진 기준에 따라 송신할 차례를 배당하는 것이 일반적이다. 그와 같은 기준으로는, 예를 들어, 요구 순서에 있어, 사용자들 A, B, C의 우선권 레벨 및 그들의 단말기 장치(10) 송신의 활성화 유형(예를 들어, 긴급 전화 대 일상 토크 차례)가 있을 수 있다.
도 3a 및 도 3b는 트렁킹 시스템에 있어 본 발명에 따른 방법의 유익한 구현예를 도시하는 흐름도이다. 사용자들 A, B, C는 온/오프 설정을 가지는 그들의 TETRA 단말기 장치(10)의 사용자 인터페이스 UI에서, 예를 들어, 수동으로, VOX 특징을 활성화시킨다(301). 이러한 조치 후에, 단말기 장치(10)는 PTT 스위치를 잠시동안(지속 주기 < 500 ms) 눌러서 그룹 메시지를 활성화시킨다(302). VOX 특징이 활성화되는 즉시, 신호 톤 또는 신호 발광과 같은 다른 통보(303)가, 예를 들어, 단말기 장치의 부저(20b)와 함께 주어진다.
본 발명의 방법에 따라 구현된 VOX 특징이 활성화되면, 오디오 경로는 항상 열려 있다. 마이크로폰(20a)을 통과하여 도착하는 오디오 신호는 VAD 알고리즘으로 알려진 방식으로 인터럽트 없이 처리되는데(304), 이는 정해진 기준에 따르는 신호 형식에 대하여, 예를 들어, 단말기 장치 사용자의 있음직한 토크와 같은 오디오 신호를 탐색하는데 사용된다(305). 만일 필요하다면, 예를 들어, 강한 배경 잡음들에 의해 연결되는 잘못된 송신들을 피하기 위하여, 마이크로폰(20a) 및 VAD 모듈(22)의 민감도가 조절될 수 있다. 본 발명의 방법에 따라, VAD 기능(22)은 마이크로폰(20a)을 수단으로 하여 도착하는 오디오 신호에서 토크의 초기 지점을 찾기 위하여 사용된다. VAD 모듈(22)과 연결하여 적응된 VAD 알고리즘을 사용하면, 마이크로폰(20a)을 통과하여 도착하는 오디오 신호에 있어서 신호 레벨의 어떠한 발생도 검출된다. 상기 신호 레벨의 발생은 토크에 해당할 수 있다. VAD 기능(22)으로는 잡음으로부터 토크 또는 개별적인 단어들을 구별하는 것이 가능하지 않다.
VAD 기능(22)만을 기반으로 하는 첫 번째 구현예에서는, 사용자가 송신할 차례에 대한 요구를 활성화시킬 수 있는 사용자의 A, B, C 첫 번째 단어는 송신하기로 된 실제 토크 외의 다른 것이어야 한다. 송신될 그의 말 이전에, 사용자 A, B, C는, 예를 들어, "VOX" 또는 다른 어떤 단어 또는 소리를 내야한다. 이로써, VAD(22) 있음직한 송신을 검출하고 네트워크 시스템의 스위칭 센터(28)로 송신할 차례에 대한 요구를 송신한다(306). 스위칭 센터(28)에 배치된 SwMI는 송신할 차례에 대한 요구를 처리하고(307), 만일 그 시간에 사용자들 A, B, C에 의해 형성된 그룹에서 트래픽이 없다면, 일반적으로는 항상 즉시, SwMI는 요구하는 단말기 장치(10)로 송신할 차례를 부여한다(308). 만일 그룹에서 많은 트래픽이 존재하면, 예를 들어, 요구를 보내는 사용자 A, B, C의 우선권 레벨에 따라 사용자들은 송신할 그들의 차례를 기다려야 한다. 단말기 장치(10)는 송신 허가를 수신하고(309), 이어지는 부분적인 단계들(310-317)은 이하에서 보다 상세하게 설명될 것이다.
VAD 기능(22)을 기반으로 하는 일 구현예에서, 사용자 A, B, C는 VOX 특징을 활성화시키는 명령 "VOX"를 말한 후, 즉시 그가 송신하고자 하는 메시지를 말하면, 단어들이 메시지의 시작부분에서 생략될 수 있다. 이러한 것을 피하는 방법은 마이크로폰 토크를 버퍼하기 위하여 보다 많은 메모리 공간을 준비하는 것이다. 그러나, 이러한 경우에는 보다 긴 토크 지연들이 발생되고, 이는 수십 밀리 초들보다 적지 않을 것이다. 강한 배경 잡음들에 의해 활성화된 송신들은 VAD 기능만을 기반으로 하는 솔루션들에 있어 현저한 단점이다.
본 발명에 따른 방법을 구현하는 또 다른 유익한 방법이 도 4a 및 도 4b에서 도시된다. 이는 상기에서 제안된 VAD 기능(22)을 사용하고, VRE 기능(23), 즉 단어 인식과 연결된다. 사용자들 A, B, C는 온/오프 설정을 가지는 그들의 TETRA 단말기장치(10) 부품의 사용자 인터페이스 UI에서, 예를 들어, 수동으로, VOX 특징을 활성화시킨다(401). 이러한 조치 후에, 단말기 장치(10)는 PTT 스위치를 잠시동안(지속 주기 < 500 ms) 눌러서 그룹 메시지를 활성화시킨다(402). VOX 특징이 활성화되는 즉시, 신호 사운드 또는 큐 발광(cue light) 신호와 같은 다른 통보(403)가, 예를 들어, 단말기 장치(10)의 부저(20b)를 사용하여 주어진다.
본 발명의 방법에 따라 구현된 VOX 특징이 활성화되면, 오디오 경로는 항상 열려 있다. 마이크로폰(20a)을 통과하여 도착하는 오디오 신호는 VAD 알고리즘으로 알려진 방식으로 인터럽트 없이 처리되는데(404), 이러한 알고리즘은, 예를 들어, 단말기 장치 사용자의 있음직한 토크와 같은, 정해진 기준에 따르는 신호 형식을 탐색하는데 사용된다(405). 필요한 경우에는, 예를 들어, 강한 배경 잡음들에 의해 작동하는 잘못된 송신들을 피하기 위하여, 마이크로폰(20a) 및 VAD 모듈(22)의 민감도가 조절될 수 있다. 따라서, 본 발명의 방법에 따라, VAD 기능(22)은 마이크로폰(20a)을 수단으로 하여 도착하는 오디오 신호에서 토크의 초기 지점을 찾기 위하여 사용된다. VAD 모듈(22)과 연결하여 적응된 VAD 알고리즘은 마이크로폰(20a)을 통과하여 도착하는 오디오 신호에 있어서 신호 레벨의 발생을 검출한다. 상기 신호 레벨의 발생은 토크에 해당할 수 있다. VAD 기능(22)으로는 사운드에 있는 토크 또는 개별적인 단어들을 구별하는데 사용될 수 없다.
VAD 기능(22)이 사용자 A, B, C에 의해 마이크로폰(20a)으로 들어갈 것으로 의도된 있음직한 신호를 오디오 신호(1˚)에서 검출할 때, 단말기 장치(10)의 음성 인식 기능 VRE(23)은 활성화된다(406).
음성 인식(23)에 있어서, 마이크로폰(20a)을 통하여 들어오는 토크에서, 예를 들어, "VOX"를 말하는 것 또는 그 외 본래 미리 정한 키워드를 탐색이 수행된다(408). 정해진 키워드가 정해진 시간 주기 내에 발견되지 않는 경우에, 절차는 음성으로 이해될 수 있는 오디오 경로 상의 그와 같은 어떤 신호가 존재하는지를 알아내기 위하여, 예를 들어, 단계(405)로 되돌아 갈 수 있다. 만일 존재한다면, 절차는 루트(2˚)에 따라 단계(407)로 바로 이동한다.
음성 인식(23)이 정확한 키워드를 발견한 후에, 단말기 장치(10)는, 요즈음 행해지는 것처럼, PTT 스위치(26)를 밑으로 누르는 것에 대응하여, 트렁킹 시스템의 SwMI(34)으로 송신할 차례에 대한 요구를 송신할 것이다(409).
SwMI(34)는 송신할 차례들에 대한 요구들을 처리하고(410), 요구하는 단말기 장치(10)로 차례차례 송신할 차례를 부여한다(411). 단말기 장치(10)가 SwMI(34)으로부터 주어진 송신할 차례를 수신한 때(412), 송신이 작동되고(413), 이는, 예를 들어, TX 부여 톤과 함께 표시된다(414). 사용자 A, B, C는 송신할 메시지를 마이크로폰(20a)로 말하고, 단말기 장치(10)는 알려진 방식으로 그것을 데이터 통신 네트워크(28)에 송신한다(415).
본 발명의 일 구현예에 따르면, 송신의 부동태화는 송신 동안 VAD 알고리즘(22)이 오디오 신호를 처리하기 위해 사용되는 방식으로 검출될 것이다(313). 만일, 예를 들어, 미리 정한 길이(예를 들어, 1-2초)와 같은 충분히 긴 시간동안 토크가 중지하는 것이(314) 검출된다면, 송신은 PTT 스위치(26)을 해제하는 때와 같은 상응하는 방식으로 부동태화된다(316). 그 후, 절차는, 예를 들어, 사용자의 행동 또는 VOX 특징에 관한 설정에 따라 단계(304)로 되돌아간다(317).
VRE 기능(23)으로 식별 가능한 하나 이상의 특별한 키워드들은 송신을 제어하기 위한 보다 발전된 구현예를 구성한다. 이로써 오디오 신호는 송신하는 동안 VAD 또는 VRE 기능(23)으로 처리된다(416). 이러한 처리과정에서, 예를 들어, 키워드에 해당할 수 있는 정해진 종료 기준을 오디오 신호에서 탐색한다(417). 그와 같은 종료 기준의 또 다른 예로는 토크에서 정해진 길이만큼의 중지가 있는 경우를 들 수 있는데, 왜냐하면 확률 계산을 기반으로 하는 음성 인식은 어떻게 해서든 실패할 가능성이 항상 존재하기 때문이다. 정해진 키워드 또는 정해진 길이만큼의 중지가 발견될 때, 송신의 부동태화는 표시되고(418), VRE 및 송신은 부동태화된다(419). 그 후 절차는 단계(404)로 이동하게 된다(420).
키워드들을 사용하여 사용자들 A, B 및 C는 토크가 네트워크 시스템(27)으로 송신될 때와, 송신되지 않을 때를 제어할 수 있다. 키워드의 그와 같은 사용의 예로는 "Vox(중지) 보충 군대가 여기 필요하다, 오버!"를 들 수 있다. 이에 의해 수신자들은 문장 "보충 군대가 여기 필요하다, 오버!"을 듣게 된다. 그런데, 단어 Vox 외에, 단어 오버 역시 음성 인식(23)과 연결하여 배치된 데이터베이스 dB에 설정되어 있다. 데이터베이스 dB는, 예를 들어, 단말기 장치(10)의 메모리 수단(17a)에 저장될 수 있다. VRE 기능(23)이 토크 신호에서 단어 오버를 발견하면, 그 의도가 송신을 종료하겠다는 것으로 추단할 수 있게 된다.
오디오 경로는 사용자에 의해 정해진 시간 동안 또는 활성화된 그룹 콜이 종료될 때까지 VOX 특징에 대해 계속 열려 있을 수 있다. 그에 따라 전력 소비를 최소화하기 위하여 VAD 및 VRE 기능들은 닫히게 된다.
사용자들 A, B, C는, 예를 들어, PTT 스위치(26)를 잠시동안 눌러서 VOX 특징의 부동태화를 수행할 수 있다. 이에 의하여 이러한 특징은 즉시 부동태화된다. 또한 이는, 예를 들어, 톤 신호로 또는 다른 적당한 방식으로 사용자 A, B, C에게 표시된다.
필요한 경우, VOX 특징은 임시적으로 취소될 수도 있다. 유익한 구현예에 따르면, 사용자들 A, B, C는 긴 시간 동안 PTT 스위치(26)를 누르고 있는 것을 통해 취소기능을 수행할 수 있다. 이에 의하여 PTT 스위치(26)와 함께 수행되는 송신이 VOX 특징 대신에 사용될 것이다. 송신 후에, PTT 스위치(26)는 알려진 방식으로 해제되는데, 이에 의하여 본 발명에 따른 VOX 특징은 다시 한번 활성화된다.
사용자들 A, B, C는 데이터베이스 dB에 키워드들을 저장할 수도 있고, 메모리 용량 및 음성 인식(23)에 의해 설정된 한계 내에서 단말기 장치(10)에 프로그램할 수도 있다. 키워드들을 프로그램할 때, 단말기 장치(10)의 사용자 A, B, C는 음성 인식을 가르치고, 그가 가르친 명령들에 상응하는 기능들을 정한다. 구현의 방식은 스피커와 관계없이 또는 종속하여 이루어질 수 있다.
알고리즘 레벨에서, 본 발명에 따른 방법의 구현은, 예를 들어, 시간 레벨에서 발생하는 VAD 기능(22) 관점에서 배치될 수 있다. 이로써, 오디오 신호의 발생이 검출되는데, 이러한 발생은 충분히 뚜렷해야 한다. 또한, 주파수 레벨에서 토크 스펙트럼의 인식을 이용하는 것이 가능하다. 이로써, 오디오 신호는 토크를 닮아야 하는데, 이러한 신호는 일반적으로 100 Hz - 1.5 kHz의 범위 내에 존재한다. 이로써, 기능 관점에서의 하나의 중요한 기준은 신호에서의 배경 잡음과 토크를 구별하는 것이다.
도 5는 또 다른 어플리케이션 예를 도시하는데, 여기서 본 발명에 따른 방법이 역시 사용될 수 있다. 여기서, 예를 들어, GPRS 송신 모드를 지원하는 네트워크 시스템(32.1, 32.2)은 모든-IP 기반구조(31.1, 31.2, 33)와 연결하여 연결되어 있다. 이로써, 단말기 장치(10')는, 예를 들어, PoC 그룹 통신 특징/서비스를 지원한다. 단말기 장치(10')의 VOX 특징의 활성화가, 예를 들어, 이러한 목적을 위해 예비된 스위치를 사용하여 수행된다. 또한, 적어도 상기에서 제시된 두 가지 방식들(VAD, VAD 및 VRE)로 본 발명에 따른 방법을 구현하는 것은 PoC 그룹 통신에서도 가능하다.
구현의 첫 번째 방식에서는, PoC 기능을 장착한 단말기 장치(10')는 특별한 HF(핸즈 프리) 모드로 배치된다. 이로써, 본 발명의 방법에 따라 구현된 VOX 특징은 활성화되고, 사용자 A', B', C'가 무언가를 말할 때, 단말기 장치(10')는 언제나 PoC 토크 메시지 패킷을 송신한다. 패킷들의 버퍼링 및 수신자들로의 송신의 타이밍/시퀀싱은 PoC 서버(31.1, 31.2)에 의해 제어된다. 송신의 인식은 기본 모델의 VAD 모듈로 구현되는 것이 바람직한데, 이것은 토크로서 해석될 수 있는 신호에서 토크의 시작점 및 종료점을 검출하며, 접점(tangent)을 누르고 해제하는 대신에 이러한 것을 기반으로 하여 송신이 제어된다.
구현의 두 번째 방식에 있어서, PoC 기능과 연결하여 VOX 특징을 구현하는 것은 상기에서 설명한 방식으로 VAD 기능 및 VRE 기능 모두를 기반으로 하고 있다.이러한 경우에, PoC 기능을 가지는 단말기 장치(10')는 특정 HF(핸즈 프리) 탄젠트 키워드 모드를 수행한다. 이로써, 사람 A', B', C'가 패스워드를 말하고 문장을 말할 때, 단말기 장치(10')는 언제나 PoC 기능에서 토크 메시지 패킷을 송신한다. 또한, 이것은 상기에서 제시된 기본 모델의 VAD 및 VRE 모듈들로 구현될 수도 있는데, 여기서 VAD 모듈은 문장의 시작점과 종료점을 검출하고, VRE 모듈은 키워드를 인식하고, 송신은 접점을 누르고/해제하는 것에 의하지 않고, VAD 모듈에 의해 검출된 문장의 시작점 및 종료점들에 따라 제어된다.
또 다른 유익한 구현예에 있어서, 사용자 A', B', C'는 PoC 단말기 장치(10')에 여러 개의 키워드들을 저장할 수 있다. 이로써, 사용자 A', B', C'는 그의 그룹으로부터 그와 같은 개별적인 사용자들을 선택하여, 예를 들어, 수신자로 여겨지도록 의도된 사용자에 상응하는 식별자로서 저장된 키워드를 단지 말하는 것에 의해 그들에게 송신한다. 이러한 방식으로 사용자는 그가 선택한 일정한 사용자에게만 직접 사적인 메시지들을 송신할 수 있다. 상기 설명된 것과 같은 특징은 물론 손으로 메뉴 선택을 하는 것에 의해 활성화될 수도 있으나, 일정한 조건에서는 토크에 의하여 이를 행하는 것이 보다 자연스럽다.
더욱이, 구현예에 따르면, 사용자는 두 개의 부분들로 구성된 키워드를 사용할 수도 있는데, 이것은 당해 방법의 구별 능력을 향상시킨다. 예를 들어, 키워드로서 사용될 때, "챗 질(chat Jill)"은 단지 "질(Jill)"만을 키워드로서 사용하는 것보다 더 나은 조합에 해당한다. 예를 들어, "그룹"이라는 단어는 전체 그룹을 가리키는 키워드로서 저장될 수 있다. 서로 다른 조합들은 이러한 방법에서 사용되는것이 바람직하다. 예를 들어, 그와 같은 조합들로는 그룹 호출이 활성화될 때 탄젠트를 누르고, 송신의 수신자를 선택하기 위하여 이름과 같은 키워드를 말하는 것이 이에 해당할 수 있다.
PoC 시스템에서 VAD 및 VRE 모듈들을 사용할 때, 시스템에 사용되는 IP 패킷(RTP(실시간 전송 프로토콜) 패킷들이 일반적으로 사용됨)에 비표준 부가적 필드가 부가된다. 이러한 부가적 필드는 PoC 서버(31.1)에 의해 인지되고, 이것은 부가적인 필드에서 언급되는 수신자들에게만 메시지를 중계한다.
만일 VRE 모듈이 그것의 데이터베이스에서 수신하는 통화 상대를 찾으면, 정해진 형식의 확인이 주어지고, 이것은 음성의 성공적인 선택을 나타낸다. 예를 들어, 이러한 확인으로는 사용자에 대한 키워드의 반복 또는 짧은 경적 음이 이에 해당할 수 있다. 이러한 확인이 들려진 후에(또는 그 전에, 이로써 이러한 확인은 송신될 문장의 종료 후에 주어질 수도 있다), 사용자는 송신하기 원하는 메시지를 말할 것이다.
특히, 단말기 장치의 전력 소비 절감은 본 발명에 따른 방법에 의해 달성된다. 예를 들어, 잡음이 있는 환경에서 키워드들만을 기반으로 하는 인식을 사용하는 단말기 장치는 오디오 경로 상의 신호를 끊임없이 처리해야 하는데, 이것은 반드시 토크일 필요는 없다. 본 발명에 따른 방법에 있어서, 키워드 식별에 관하여 이렇게 본질적으로 계속되는 프로세스는, 토크 형식의 바람직한 주파수 영역에 존재하는, 그와 같은 사운드가 오디오 경로에서 검출되기까지는 수행되지 않음에 따라, 이로써 기본적 전력 소비에 있어서 현저한 절약이 달성된다.
상기 상세한 설명 및 그것에 관련된 도면들은 단지 본 발명에 따른 방법을 예시하는 것이라는 점을 이해해야 할 것이다. 본 방법의 절차적인 구현은 수많은 서로 다른 방식들로 구현 가능한데, 이러한 것들은 당업계에서 숙련된 사람에게는 명백한 것이다. 따라서, 본 발명은 앞서 설명된 내용에서 제시된 구현예들 또는 청구항들에서 정의된 것들에 의해 제한되는 것이 아니고, 첨부하는 청구항들에서 정의된 본 발명의 사상의 범위 내에 존재하는, 본 발명에 관한 수많은 변이들과 변형들은 당업계의 숙련된 사람들에게 있어 명백할 것이다.

Claims (8)

  1. 디지털 네트워크 시스템(27)에서 단말기 장치(10)의 송신을 제어하는 방법에 있어서,
    상기 단말기 장치(10)는 적어도 상기 네트워크 시스템으로 수행될 송신을 활성화하기 위한 푸쉬-투-토크(Push-to-Talk: PTT) 기능을 포함하고,
    상기 PTT 기능의 음성 제어를 위한 상기 단말기 장치(10)는, 활성화/부동태화(passivated)되는 것으로, 음성 인식 엔진(Voice Recognition Engine: VRE) 기능(23)에 의하여 구현되는 음성 작동 송신(Voice Operated Transmission: VOX) 특징도 포함하며,
    상기 방법은,
    오디오 신호로부터 정해진 키워드를 탐색하기 위해 상기 VRE 기능(23)이 사용되는 단계(406, 407);
    상기 정해진 키워드가 상기 오디오 신호로부터 인식되는 단계(408);
    송신하기 위한 차례(a turn to transmit)가 상기 네트워크 시스템(27)으로부터 요구되는 단계(409);
    송신하기 위한 차례가 상기 네트워크 시스템(27)으로부터 수신되는 단계(412);
    상기 송신이 연결되고 송신하기로 주어진 차례가 표시되는 단계(413, 414);
    상기 송신이 수행되는 단계(415); 및
    상기 송신이 부동태화되는 단계(419)에 의하여 수행되고,
    상기 VOX 특징에서 상기 VRE 기능(23) 이전에 상기 오디오 신호는 단말기 장치(10)에 연결하여 배치된 음성 활동 검출(Voice Activity Detection: VAD) 기능(22)에 의하여 모니터되고, 이로써 상기 단말기 장치(10)에서 상기 VOX 특징이 활성화될 때(401, 402), 상기 부분적 단계들(406-419) 전에,
    단말기 장치(10)로 들어오는 오디오 신호가, 정해진 기준에 따른 신호 형식을 찾기 위해 오디오 신호를 탐색하는 VAD 기능(22)으로 처리되는 단계(404, 405); 및
    상기 정해진 기준에 따른 신호 형식이 상기 오디오 신호에서 검출된 때, 상기 VRE 기능은 정해진 키워드를 찾기 위해 활성화되는 단계(405, 406)들이 수행되는 것을 포함하는 것을 특징으로 하는 방법.
  2. 제1항에 있어서,
    송신이 수행되는 동안 상기 오디오 신호는 VAD 기능(22)으로 처리되는 단계(416);
    정해진 길이만큼의 중지가 있는지에 대해 상기 오디오 신호가 탐색되는 단계(417); 및
    상기 정해진 길이만큼의 중지가 상기 오디오 신호에서 발견되고, 이로써 송신의 종료를 나타내기로 정해진 신호가 표시되고(418), 상기 송신이 부동태화되는 단계(419)를 포함하는 것을 특징으로 하는 방법.
  3. 제1항 내지 제2항에 있어서,
    송신이 수행되는 동안 상기 오디오 신호는 VRE 기능(23)으로 처리되는 단계(416);
    정해진 종료 기준이 있는지에 대해 상기 오디오 신호가 탐색되는 단계(417); 및
    상기 정해진 종료 기준이 상기 오디오 신호에서 발견되고, 이로써 송신의 종료를 나타내기로 정해진 신호가 표시되고(418), 상기 송신이 부동태화되는 단계(419)를 포함하는 것을 특징으로 하는 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서,
    상기 VOX 특징은 정해진 시간 주기 동안 또는 활성화 그룹 호출이 종료될 때까지 작동하고, 이에 의하여 상기 VAD 및 VRE 기능들(22, 23)이 부동태화되는 것을 특징으로 하는 방법.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 VOX 특징은 정해진 방법으로 일시적으로 취소될 수 있는 것을 특징으로 하는 방법.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서,
    VRE 기능(23)을 위하여 특별한 데이터베이스(dB)가 단말기 장치의 메모리 수단(17a)에 배치되고, 사용자가 송신을 활성화하고 부동태화할 키워드들을 상기 데이터베이스에 저장하는 것을 특징으로 하는 방법.
  7. 디지털 네트워크 시스템(32.1, 32.2)에서 단말기 장치(10')의 송신을 제어하는 방법에 있어서,
    상기 네트워크 시스템(32.1, 32.2)은 서버가 구비된 모든-IP 기반 구조(31.1, 31.2, 33)와 연결하여 배치되고,
    상기 단말기 장치(10')는 셀룰러 상의 푸쉬-투-토크(Push-to-talk over Cellular: PoC) 특징/서비스를 지원하도록 배치되고,
    상기 단말기 장치(10')는 적어도 상기 네트워크 시스템으로 수행될 송신을 활성화하기 위한 PTT(Push-to-Talk) 기능을 포함하고,
    상기 PTT 기능의 음성 제어를 위한 상기 단말기 장치(10')는 , 활성화/부동태화되는 것으로, VRE(Voice Recognition Engine) 기능(23)에 의하여 구현되는 VOX(Voice Operated Transmission) 특징도 포함하며,
    상기 PTT 기능으로 송신을 수행하는 동안,
    상기 방법은,
    오디오 신호로부터 정해진 키워드를 탐색하기 위해 상기 VRE 기능(23)이 사용되는 단계(406, 407);
    상기 정해진 키워드가 상기 오디오 신호로부터 인식되는 단계(408);
    상기 송신이 활성화되는 단계(415); 및
    상기 송신이 부동태화되는 단계(419)에 의하여 수행되고,
    상기 VOX 특징에서 상기 VRE 기능(23) 이전에 상기 오디오 신호는 단말기 장치(10')에 연결하여 배치된 VAD(Voice Activity Detection) 기능(22)에 의하여 모니터되고,
    이로써 상기 단말기 장치(10')에서 상기 VOX 특징이 활성화될 때(401, 402), 상기 부분적 단계들(406-419) 전에,
    단말기 장치로 들어오는 오디오 신호가, 정해진 기준에 따른 신호 형식을 찾기 위해 오디오 신호를 탐색하는 VAD 기능(22)으로 처리되는 단계(404, 405); 및
    상기 정해진 기준에 따른 신호 형식이 상기 오디오 신호에서 검출되고, 상기 부분적 단계들(406-419)을 수행하여 상기 단말기 장치(10)의 상기 송신이 활성화되는 단계가 수행되는 것을 포함하는 것을 특징으로 하는 방법.
  8. 제7항에 있어서,
    송신을 활성화하기 위한 목적 외에, 송신의 수신자(A', B', C', D')를 선택하기 위해 키워드들이 사용되는 것을 특징으로 하는 방법.
KR10-2004-7018794A 2002-05-29 2003-05-26 디지털 네트워크 시스템에서 단말기 장치의 송신을제어하는 방법 KR20050006264A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FI20025028A FI114358B (fi) 2002-05-29 2002-05-29 Menetelmä digitaalisessa verkkojärjestelmässä päätelaitteen lähetyksen ohjaamiseksi
FI20025028 2002-05-29
PCT/FI2003/000400 WO2003100372A1 (en) 2002-05-29 2003-05-26 Method in a digital network system for controlling the transmission of terminal equipment

Publications (1)

Publication Number Publication Date
KR20050006264A true KR20050006264A (ko) 2005-01-15

Family

ID=8565198

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2004-7018794A KR20050006264A (ko) 2002-05-29 2003-05-26 디지털 네트워크 시스템에서 단말기 장치의 송신을제어하는 방법

Country Status (7)

Country Link
US (1) US20050203998A1 (ko)
EP (1) EP1509756A1 (ko)
KR (1) KR20050006264A (ko)
CN (1) CN100361117C (ko)
AU (1) AU2003233821A1 (ko)
FI (1) FI114358B (ko)
WO (1) WO2003100372A1 (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100711719B1 (ko) * 2005-08-25 2007-04-25 엘지전자 주식회사 피티티 단말기의 음성 전송 제어 장치 및 그 방법
KR100810222B1 (ko) * 2005-02-01 2008-03-07 삼성전자주식회사 셀룰러 기반의 푸쉬 투 토크에서 전 이중 통화 제공 방법및 시스템
KR101158573B1 (ko) * 2005-03-22 2012-06-22 삼성전자주식회사 푸쉬투토크 오버 셀룰러 망의 클라이언트 의견 수렴 방법및 그 시스템
KR20180062127A (ko) * 2016-11-30 2018-06-08 영남대학교 산학협력단 음성인식을 통한 다자간 무선 통신 장치 및 그 방법

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050059484A1 (en) * 2003-09-16 2005-03-17 Merit Industries, Inc. Amusement device having time-based operating modes
GB0328035D0 (en) * 2003-12-03 2004-01-07 British Telecomm Communications method and system
US20050209858A1 (en) * 2004-03-16 2005-09-22 Robert Zak Apparatus and method for voice activated communication
US7295853B2 (en) * 2004-06-30 2007-11-13 Research In Motion Limited Methods and apparatus for the immediate acceptance and queuing of voice data for PTT communications
DE602004005690T2 (de) * 2004-06-30 2007-12-27 Research In Motion Ltd., Waterloo Verfahren und Vorrichtung zur direkten Annahme und Warteschlangenbildung von Sprachdaten für Drücken-zum-Sprechen-Kommunikation
GB2417859A (en) * 2004-08-18 2006-03-08 Vodafone Plc Half duplex communication mode for devices in cellular telecommunication system
JP2006101048A (ja) * 2004-09-29 2006-04-13 Nec Corp Ptt通信システム、携帯端末装置及びそれらに用いる会話開始方法並びにそのプログラム
EP1643708A1 (en) * 2004-09-30 2006-04-05 Siemens Aktiengesellschaft Method and system for using a Push-to-Talk connection in communication conferences managed by at least one non human participant
JP2006197041A (ja) * 2005-01-12 2006-07-27 Nec Corp PoCシステム、PoC携帯端末及びそれらに用いるポインタ表示方法並びにそのプログラム
WO2006137005A1 (en) * 2005-06-24 2006-12-28 Koninklijke Philips Electronics N.V. Method and apparatus for semi-duplex communication in wireless communication system
US8041376B2 (en) 2005-07-15 2011-10-18 Research In Motion Limited Methods and apparatus for providing PTT data buffering support indications from mobile devices and PTT data buffering control by wireless networks
EP1905256B1 (en) 2005-07-15 2013-05-15 Research In Motion Limited Methods and apparatus for providing ptt data buffering support indications from mobile devices and ptt data buffering control by wireless networks
US7996228B2 (en) * 2005-12-22 2011-08-09 Microsoft Corporation Voice initiated network operations
US20080045256A1 (en) * 2006-08-16 2008-02-21 Microsoft Corporation Eyes-free push-to-talk communication
JP2009049821A (ja) * 2007-08-21 2009-03-05 Aruze Corp Ip電話システム
PL2160050T3 (pl) * 2008-09-02 2013-05-31 Rohill Tech B V Międzysystemowa łączność przyciskowa typu naciśnij-i-mów o szybkim działaniu
US9203900B2 (en) 2011-09-23 2015-12-01 Netapp, Inc. Storage area network attached clustered storage system
US8683170B1 (en) 2011-09-23 2014-03-25 Netapp, Inc. Consistent distributed storage communication protocol semantics in a clustered storage system
US9204263B2 (en) * 2012-05-23 2015-12-01 Mark A. Lindner Systems and methods for establishing a group communication based on motion of a mobile device
US9392421B2 (en) 2012-05-23 2016-07-12 Qualcomm Incorporated Systems and methods for group communication using a mobile device with mode depending on user proximity or device position
US9560099B2 (en) 2012-05-23 2017-01-31 Qualcomm Incorporated Systems and methods for group communication using a mobile device using motion and voice activate controls
US8996059B2 (en) 2012-07-19 2015-03-31 Kirusa, Inc. Adaptive communication mode for recording a media message
US9704486B2 (en) 2012-12-11 2017-07-11 Amazon Technologies, Inc. Speech recognition power management
CN105096936A (zh) * 2014-05-15 2015-11-25 哈尔滨海能达科技有限公司 一种即时按键通话业务控制方法和装置
US10902722B2 (en) * 2017-05-11 2021-01-26 Motorola Solutions, Inc. Method for providing incident specific information at a vehicle computer
CN109413593A (zh) * 2017-08-17 2019-03-01 成都鼎桥通信技术有限公司 一种系统间集群语音互通对接方法
US10477294B1 (en) * 2018-01-30 2019-11-12 Amazon Technologies, Inc. Multi-device audio capture
US10516934B1 (en) 2018-09-26 2019-12-24 Amazon Technologies, Inc. Beamforming using an in-ear audio device
US11482225B2 (en) 2020-09-15 2022-10-25 Motorola Solutions, Inc. System and method for concurrent operation of voice operated switch and voice control with wake word
JP7407249B1 (ja) * 2022-08-12 2023-12-28 八重洲無線株式会社 無線通信機における送受信切り替え方法及び無線通信機

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1996011529A1 (en) * 1994-10-06 1996-04-18 Rotunda Thomas J Jr Voice activated transmitter switch
US5889764A (en) * 1995-08-31 1999-03-30 Intel Corporation Low-latency multi-party audio chat
US5912882A (en) * 1996-02-01 1999-06-15 Qualcomm Incorporated Method and apparatus for providing a private communication system in a public switched telephone network
US6993004B2 (en) * 1998-10-29 2006-01-31 Sound Starts, Inc. Method and apparatus for practicing IP telephony from an Internet-capable radio
US6360093B1 (en) * 1999-02-05 2002-03-19 Qualcomm, Incorporated Wireless push-to-talk internet broadcast
WO2001031636A2 (en) * 1999-10-25 2001-05-03 Lernout & Hauspie Speech Products N.V. Speech recognition on gsm encoded data
US7072833B2 (en) * 2000-06-02 2006-07-04 Canon Kabushiki Kaisha Speech processing system
US7035790B2 (en) * 2000-06-02 2006-04-25 Canon Kabushiki Kaisha Speech processing system
JP4201470B2 (ja) * 2000-09-12 2008-12-24 パイオニア株式会社 音声認識システム
US20020173333A1 (en) * 2001-05-18 2002-11-21 Buchholz Dale R. Method and apparatus for processing barge-in requests
US6885856B2 (en) * 2002-01-10 2005-04-26 Chang-Sheng, Inc. Telephone bridging method

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100810222B1 (ko) * 2005-02-01 2008-03-07 삼성전자주식회사 셀룰러 기반의 푸쉬 투 토크에서 전 이중 통화 제공 방법및 시스템
KR101158573B1 (ko) * 2005-03-22 2012-06-22 삼성전자주식회사 푸쉬투토크 오버 셀룰러 망의 클라이언트 의견 수렴 방법및 그 시스템
KR100711719B1 (ko) * 2005-08-25 2007-04-25 엘지전자 주식회사 피티티 단말기의 음성 전송 제어 장치 및 그 방법
KR20180062127A (ko) * 2016-11-30 2018-06-08 영남대학교 산학협력단 음성인식을 통한 다자간 무선 통신 장치 및 그 방법

Also Published As

Publication number Publication date
EP1509756A1 (en) 2005-03-02
FI20025028A (fi) 2003-11-30
CN1656366A (zh) 2005-08-17
US20050203998A1 (en) 2005-09-15
AU2003233821A1 (en) 2003-12-12
FI20025028A0 (fi) 2002-05-29
FI114358B (fi) 2004-09-30
WO2003100372A1 (en) 2003-12-04
CN100361117C (zh) 2008-01-09

Similar Documents

Publication Publication Date Title
KR20050006264A (ko) 디지털 네트워크 시스템에서 단말기 장치의 송신을제어하는 방법
KR100652645B1 (ko) 푸시 투 토크형 이동 통신 단말기의 음성 검출 및 인식을이용한 발언권 관리 장치와 방법
US7099291B2 (en) Dispatch call origination and set up in a CDMA mobile communication system
CN100539763C (zh) 控制来自移动车辆的无线通信的方法
US7957772B2 (en) Apparatus and method for delayed answering of an incoming call
KR100916730B1 (ko) 푸쉬투토크 시스템에서 경보 톤을 송신하고 플레이하는시스템 및 방법
US20040228292A1 (en) Method and apparatus for providing full duplex dispatch
US6922571B1 (en) Mobile telephone system configured to confirm receiver speed conditions
KR20040045898A (ko) 무선 디스패치 시스템에서 발언 요청을 큐잉 하는 시스템및 방법
KR20020027544A (ko) 셀룰러 전화의 네트워크 기반 뮤팅 방법 및 시스템
US7764972B2 (en) Heterogeneous device chat room system and method
KR20080094099A (ko) 무선 디바이스를 호출할 때 조기 통지를 제공하는 시스템 및 방법
US20070281725A1 (en) Device and method for silent push-to-talk call pacing
JP2007535842A (ja) 音声起動通信のための装置および方法
KR20070086497A (ko) 핸즈프리 푸시투토크 라디오
KR20010100324A (ko) 이동 통신망을 이용한 목적지 도착 알람 방법 및 시스템
US20040192368A1 (en) Method and mobile communication device for receiving a dispatch call
US20060089180A1 (en) Mobile communication terminal
JPH06177831A (ja) 加入者通信ユニットおよび該加入者通信ユニットを動作させる方法
WO1992004798A1 (en) Method and apparatus for selective transfer of calls in personal communicators
EP1145452B1 (en) Full-duplex radio-communication device with half-duplex functionality
US20060116110A1 (en) Wireless connection method and system
KR101165125B1 (ko) 휴대 전화기, 알림 방법 및 프로그램
KR100605832B1 (ko) Ptt 휴대용 단말기의 수신상태 알림방법
WO2008137274A2 (en) Method and apparatus for silently fetching information

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
NORF Unpaid initial registration fee