KR20190024361A

KR20190024361A - 푸시투톡 통신 서비스 운용 방법 및 이를 이용하는 시스템

Info

Publication number: KR20190024361A
Application number: KR1020170111288A
Authority: KR
Inventors: 박규철
Original assignee: (주)인스파이어모바일
Priority date: 2017-08-31
Filing date: 2017-08-31
Publication date: 2019-03-08
Also published as: KR102040370B1; WO2019045250A1

Abstract

푸시투톡(push to talk, PTT) 서비스 애플리케이션에서 음성 인식 기반의 텍스트 제공 및 텍스트를 음성 데이터로 전환하여 제공하는 서비스 운용 방법과 이를 이용하는 시스템이 개시된다. 푸시투톡 통신 서비스 운용 방법은, 음성 인식이 가능한 푸시투톡 서비스 앱을 탑재한 사용자 단말기에서 구현되는 PTT 통신 서비스 운용 방법으로서, 사용자 단말기로부터 네트워크를 통해 수신한 음성 데이터 즉 입력되는 음성을 음성 인식 기술을 통해 텍스트로 변환하여 수신자에게 전달하는 단계, 텍스트를 포함한 텍스트 데이터를 음성 합성 기술을 통해 음성으로 변환하여 음성으로 출력하는 단계, 송수신된 음성 또는 텍스트 내용을 대화형 사용자 인터페이스를 적용하는 단계를 포함하며, 사용자 단말기는 사용자 입력이나 미리 지정된 입력에 따라 이전에 전달된 음성 및 음성 인식으로 변환된 텍스트를 스피커와 디스플레이 화면으로 출력하여 사용자가 해당 콘텐츠를 확인하도록 동작한다.

Description

푸시투톡 통신 서비스 운용 방법 및 이를 이용하는 시스템{MANAGEMENT METHOD FOR MANAGING PUSH TO TALK SERVICE AND SYSTEM USING THE SAME}

본 발명은 푸시투톡(push to talk) 서비스 애플리케이션에서 음성 인식 기반의 텍스트 제공 및 텍스트를 음성 데이터로 전환하여 제공하는 서비스 운용 방법과 이를 이용하는 시스템에 관한 것이다.

푸시투톡(push to talk, PTT) 통신은 상대방에게 음성을 전송하기 위한 버튼을 가압한 상태에서 상대방에게 음성을 전송하고, 버튼을 가압하지 않은 상태에서는 상대방으로부터 음성을 수신하는 양방향 통신 시스템으로서 일대일 또는 일대다수가 간단한 의사소통을 수행할 수 있는 통신 시스템이다.

인터넷 프로토콜(internet protocol, IP) 기반 PTT 통신은 Wi-Fi, 2G, 3G, LTE 및 위성 등 다양한 무선통신 환경에서 이동통신 데이터망을 이용해 이동통신 단말기의 음성 서비스망을 이용하지 않고도 무전기처럼 음성을 송수신할 수 있다.

이러한 PTT 통신 기술은 유통, 운송, 물류, 공항, 공장, 건설현장 등에서 임무 하달, 상황 전파 등을 목적으로 기존 산업 현장에서의 협업을 위해 활용되고 있다.

그러나, 국내 조선소, 자동차 공장, 건설 현장 등과 같이 환경이 열악한 곳에서 PPT 통신을 사용하는 경우, 사용자 주변 잡음이 매우 강하면, 발신자의 음성이 명확히 전달되지 않고 수신자가 발신자의 음성일 제대로 알아듣기 어렵다.

또한, PTT 통신 시, 발신자와 수신자간 의사전달의 매체가 음성이기 때문에 수신자가 다른 업무에 몰두하는 상황 등과 같이 수신자의 현재 상태와는 상관없이 발성자의 음성은 수신자 단말로 바로 전달되기 때문에 수신자가 발신자의 중요 전달 음성을 놓치는 경우도 빈번히 발생한다.

상기와 같은 문제점을 개선하기 위한 본 발명의 목적은, 환경이 열악하여 음성 통신이 용이하지 않은 장소에서도 정확한 정보의 전달이 이루어질 수 있고, 모바일 기기 음성 기술과 무선통신 방법을 채용하여 음성의 내용을 시각적으로 보조하는 기능을 제공할 수 있는 푸시투톡(push to talk, PTT) 통신 서비스 운용 방법을 제공하는데 있다.

본 발명의 다른 목적은, 실시간으로 전달되는 음성 데이터를 텍스트와 함께 대화 창 기반으로 순서대로 보여줌으로써 수신자가 발신자의 중요 전달사항을 놓치지 않도록 할 수 있는 푸시투톡 통신 서비스 운용 방법을 제공하는데 있다.

본 발명의 또 다른 목적은 음성 인식이 가능한 푸시투톡 서비스 애플리케이션(application)을 통해 사용자 단말에서 음성 통신시, 음성을 이용한 의사소통을 시각적으로 보조할 수 있는 푸시투톡 통신 서비스 운용 방법을 제공하는데 있다.

본 발명의 또 다른 목적은 상술한 푸시투톡 통신 서비스 운용 방법을 이용하는 시스템을 제공하는데 있다.

상기 기술적 과제를 해결하기 위한 본 발명의 일 측면에 따른 푸시투톡(push to talk, PTT) 통신 서비스 운용 방법은, 음성 인식이 가능한 푸시투톡(PTT) 서비스 앱을 탑재한 사용자 단말기에서 구현되는 PTT 통신 서비스 운용 방법으로서, 사용자 단말기로부터 네트워크를 통해 수신한 음성 데이터 즉 입력되는 음성을 음성 인식 기술을 통해 텍스트로 변환하여 수신자에게 전달하는 단계; 상기 텍스트를 포함한 텍스트 데이터를 음성 합성 기술을 통해 음성으로 변환하여 음성으로 출력하는 단계; 송수신된 음성 또는 텍스트 내용을 대화형 사용자 인터페이스(user interface, UI)를 적용하는 단계를 포함하며, 사용자 단말기는 사용자 입력이나 미리 지정된 입력에 따라 이전에 전달된 음성 및 음성 인식으로 변환된 텍스트를 스피커와 디스플레이 화면으로 출력하여 사용자가 해당 콘텐츠를 확인하도록 동작할 수 있다.

상기 기술적 과제를 해결하기 위한 본 발명의 다른 측면에 따른 푸시투톡 통신 서비스 운용 방법은, 제1 사용자 단말이 네트워크를 통해 제2 사용자 단말과 통신 채널을 설정하는 단계; 및 푸시투톡(push to talk) 서비스 애플리케이션의 대화형 텍스트 창에서 텍스트 대화 통신을 지원하는 중에 TTS(text to speech) 입력을 감지하는 단계; 및 상기 TTS 입력에 따라 상기 대화형 텍스트 창에서 제1 또는 제2 사용자 단말에서 입력되는 텍스트 데이터를 음성 데이터로 변환하기 위한 TTS 요청 신호를 생성하는 단계를 포함한다.

일실시예에서, 상기 TTS 요청 신호는 이 신호를 생성한 상기 제1 또는 제2 사용자 단말에 탑재된 서비스 애플리케이션의 TTS 매니저에게 전달될 수 있다. 또한, 구현에 따라서, 상기 TTS 요청 신호는 해당 텍스트 데이터와 함께 이 신호를 생성한 상기 제1 또는 제2 사용자 단말과 네트워크를 통해 연결되는 음성 합성 지원 장치에 전달될 수 있다. 상기의 TTS 매니저 또는 음성 합성 지원 장치는 TTS 요청 신호에 따라 텍스트 데이터를 음성 데이터로 변환하여 생성한 사용자 단말의 상대방 단말에 전송될 수 있다.

상기 기술적 과제를 해결하기 위한 본 발명의 또 다른 측면에 따른 푸시투톡 통신 서비스 운용 방법은, 제1 사용자 단말이 네트워크를 통해 제2 사용자 단말과 통신 채널을 설정하는 단계; 및 푸시투톡(push to talk) 서비스 애플리케이션의 대화형 텍스트 창에서 텍스트 대화 통신을 지원하는 중에 비밀(secret) 대화 설정 입력을 감지하는 단계; 및 상기 비밀 대화 설정 입력에 따라 상기 대화형 텍스트 창에서 발신측 사용자 단말은 음성 송신 모드로 모드 전환되는 단계를 포함하며, 여기서 수신측 사용자 단말은 발신측 사용자 단말로부터의 상기 비밀 대화 설정 입력에 대응하는 모드 전환 요청 신호에 따라 텍스트 수신모드로 작동모드를 전환한다.

일실시예에서, 상기 발신측 사용자 단말에 탑재되는 서비스 애플리케이션이나 상기 제1 및 제2 사용자 단말들과 네트워크를 통해 연결되는 음성 인식 지원 장치는 상기 비밀 대화 설정 입력에 대응하는 신호에 따라 상기 발신측 사용자 단말의 음성 데이터를 텍스트 데이터로 변환하여 수신측 사용자 단말에 제공할 수 있다. 여기서, 음성 데이터는 수신자가 나중에 확인할 수 있도록 상기 텍스트 데이터와 함께 혹은 별도로 수신측 사용자 단말에 전송될 수 있다.

상기 기술적 과제를 해결하기 위한 본 발명의 또 다른 측면에 따른 푸시투톡 통신 서비스 운용 방법을 이용하는 시스템은, 사용자 단말이나 상대방 단말에 탑재되는 음성 인식이 가능한 푸시투톡 서비스 애플리케이션을 포함하는 시스템으로서, 발신측 단말기는 음성을 전송하기 위한 버튼을 가압한 상태에서 음성 신호를 스피치투텍스트(speech to text, STT) 기능으로 문자로 변환하는 제1 기능부; 음성과 함께 변환된 텍스트를 다중으로 동시에 전송하는 제2 기능부; 및 음성으로 발신된 내용은 같이 전달한 문자와 맵핑되어 키워드 검색을 통해 전달한 PTT 음성 내용을 다시 확인할 수 있도록 지원하는 제3 기능부를 포함한다. 또한, 수신측 무선 단말기는 수신된 음성과 더불어 수신된 텍스트를 화면에 대화창 형태로 제공하는 제4 기능부; 음성이 수신되지 않은 경우 텍스트투스피치(text to speech, TTS) 기능으로 기수신된 텍스트를 실시간 음성으로 변환하여 출력하는 제5 기능부; 및 음성으로 수신된 내용은 같이 전달된 텍스트와 맵핑되어 키워드 검색을 통해 전달된 PTT 음성 내용을 다시 확인할 수 있도록 지원하는 제6 기능부를 포함한다.

일실시예에서, 발신측 단말기는 푸시투톡 서비스 어플리케이션을 탑재하는 모바일 단말 또는 무선 단말기로서, 음성을 전송하기 위한 버튼이 가압된 상태에서 음성 발신 서비스를 수행하는 제 1모드, 음성 발신과 더불어 음성 기반으로 변환된 텍스트 전송 서비스를 수행하는 제 2 모드 및 텍스트만 전달하는 제 3모드 중 어느 하나의 모드로 동작하고, 음성인식 서비스가 실행되지 않은 경우에 상기 제 1모드 및 상기 제 3모드 중 어느 하나를 수행할 수 있다.

일실시예에서, 수신측 단말기는 푸시투톡 서비스 어플리케이션을 탑재하는 모바일 단말 또는 무선 단말기로서, 음성을 전송하기 위한 버튼을 미가압한 상태에서 음성 수신 서비스를 수행하는 제 1모드, 음성 수신과 더불어 수신된 텍스트를 화면에 대화창 형태로 시각적으로 보여주는 제 2모드, 텍스트만 전달되었을 경우 텍스트를 대화 창 형태로 보여주는 제 3모드 및 텍스트를 음성으로 변환하여 들려주는 제 4모드 중 어느 하나의 모드로 동작하고, 음성 합성 서비스가 실행되지 않는 경우에는 상기 제 1모드 및 상기 제 3모드 중 어느 하나를 수행할 수 있다.

일실시예에서, 상기 서비스 어플리케이션은 송수신된 음성과 음성을 기반으로 변환된 텍스트를 하나의 그룹으로 맵핑하고 키워드를 통해 송수신된 문자 내역을 찾는 기능을 제공하고 검색된 문자와 연관된 음성 대화내용을 출력하여 사용자가 확인할 수 있도록 지원하는 기능을 포함할 수 있다.

상기 기술적 과제를 해결하기 위한 본 발명의 또 다른 측면에 따른 푸시투톡 통신 서비스 운용 방법을 이용하는 시스템은, 사용자 단말과 네트워크를 통해 연결되는 서버를 포함하는 시스템으로서, 네트워크를 통해 접근한 제1 사용자 단말 또는 제2 사용자 단말로부터 PTT 서비스 애플리케이션에 대한 다운로드 요청 신호를 수신하는 단계; 및 상기 다운로드 요청 신호에 응하여 상기 PTT 서비스 애플리케이션을 상기 제1 사용자 단말 또는 상기 제2 사용자 단말에 제공하는 단계를 포함한다. 여기서, PTT 서비스 애플리케이션은 대화형 텍스트 창을 제공한다.

일실시예에서, 상기 PTT 서비스 애플리케이션은 대화형 텍스트 창의 사용자 인터페이스를 통해 활성되는 비밀 대화 요청 또는 미리 설정된 요청에 따라 발신측 사용자 단말의 작동 모드를 음성 입력 모드로 제어할 수 있다.

일실시예에서, 상기 PTT 서비스 애플리케이션은 대화형 텍스트 창의 사용자 인터페이스를 통해 활성되는 비밀 대화 요청 또는 미리 설정된 요청에 따라 수신측 사용자 단말의 작동 모드를 텍스트 출력 모드로 제어할 수 있다.

일실시예에서, 상기 PTT 서비스 애플리케이션은 대화형 텍스트 창의 다른 사용자 인터페이스를 통해 활성되는 TTS 요청에 따라 발신측 사용자 단말의 텍스트 데이터를 자동으로 음성 데이터로 변환하여 수신측 사용자 단말에 전송할 수 있다.

일실시예에서, 상기 푸시투톡 통신 서비스 운용 방법을 이용하는 시스템은, 모바일 단말, 퍼스널 컴퓨터 또는 데스크탑 컴퓨터를 포함할 수 있다.

상기의 푸시투톡 통신 서비스 운용 방법 및 이를 이용하는 시스템을 사용하는 경우에는, 음성 인식이 가능한 푸시투톡(push to talk, PTT) 서비스 애플리케이션(application)을 통해 사용자 단말이 상대방 단말과 음성 통신을 수행할 때, 음성에 기초한 텍스트 등과 같이 의사소통을 시각적으로 보조받을 수 있다.

또한, 본 발명에 의하면, 음성 인식이 가능한 푸시투톡 서비스 애플리케이션을 탑재하여 상술한 푸시투톡 통신 서비스 운용 방법을 이용하는 시스템으로서 모바일 단말, 퍼스널 컴퓨터 등의 각종 사용자 단말이나 상대방 단말을 제공할 수 있고, 이에 의해 단일 서비스 애플리케이션의 설치만으로 다양한 사용자, 다양한 환경에 용이하게 적용할 수 있는 음성 인식 지원 푸시투톡 서비스를 제공할 수 있다.

또한, 본 발명에 의하면, 소음이 심하여 음성 수신이 어려운 수신자의 환경에서도 발신자의 실시간 전달 내용을 명확히 인지할 수 있도록 하는 대체 방안을 제공할 수 있다.

또한, 본 발명에 의하면, 일정 시간이 경과 된 후에도 PTT 통신의 음성 내용을 키워드 검색을 통해 수신자 단말에서 확인하는 것이 가능하다.

더불어, 보안이 요구되거나 PTT 음성 통신이 힘든 수신자 상황에서는 발신 측의 음성이 텍스트만으로도 전달되기 때문에 상황에 맞게 PTT 통신 서비스의 작동 모드를 설정하는 것이 가능하다. 이것은 다양한 사용 환경에 대한 적응력을 높여 사용자 편의성을 크게 향상시킬 수 있다. 또한, 상황에 맞는 PPT 통신 서비스의 작동 모드르 제공함으로써 실질적으로 데이터망 측면에서 망 부하를 감소시킬 수 있는 장점이 있다.

도 1은 본 발명의 실시예에 따른 푸시투톡(PTT) 통신 서비스 운용 시스템의 구성을 개략적으로 나타낸 도면이다.
도 2는 도 1의 시스템에 채용가능한 송신측 단말기 및 수신측 단말기의 구성을 보다 상세히 나타낸 도면이다.
도 3은 본 발명의 실시예에 따른 송신측 단말기의 제어부 구성을 보다 상세히 나타낸 도면이다.
도 4는 본 발명의 실시예에 따른 수신측 단말기의 제어부 구성을 보다 상세히 나타낸 도면이다.
도 5는 본 발명의 다른 실시예에 따른 푸시투톡 통신 서비스 운용 방법에 대한 흐름도이다.
도 6은 본 발명의 또 다른 실시예에 따른 푸시투폭 통신 서비스 운용 방법을 이용하는 시스템의 디스플레이 화면에 대한 예시도이다.

이하에서는 본 발명의 실시예들을 첨부 도면을 참조하여 상세히 설명한다. 실시예를 설명함에 있어 본 발명이 속하는 기술 분야에 잘 알려져 있고 본 발명과 직접적인 관련이 없는 기술 내용에 대해서는 설명을 생략한다.

하기의 실시예는 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지며 사전에 정의된 용어와 같이 일반적으로 사용되는 용어는 관련 기술의 문맥상의 의미와 일치하는 것으로 해석되어야 한다. 하기의 실시예는 본 발명의 사상이 충분히 전달될 수 있도록 하기 위해 예로서 제공되는 것으로 본 발명은 이하 설명되는 실시예에 한정되지 않고 다른 형태로 구체화될 수 있다.

도 1은 본 발명의 실시예에 따른 푸시투톡(PTT) 통신 서비스 운용 시스템의 구성을 개략적으로 나타낸 도면이다.

도 1에 보여지는 바와 같이, 본 실시예의 PTT 통신 서비스 시스템은, 모바일 단말기가 PTT(Push To Talk) 통신 서비스를 기반으로 외부 단말기와 PTT 통신을 수행하기 위한 구성을 구비한다. 즉, PTT 통신 서비스 운용 시스템은 PPT 통신 시스템(100), 송신측 단말기(200), 수신측 단말기(300), 음성 인식 지원 장치(400) 및 음성 합성 지원 장치(500)를 포함할 수 있다. 음성 인식 지원 장치(400)는 음성 처리 지원 장치로 지칭될 수 있다. 또한, 별도의 서버 및 그 기능적 측면에서 음성 인식 지원 장치(400)는 제1 서버로 지칭되는 음성 합성 지원 장치(500)는 제2 서버로 지칭될 수 있다.

본 실시예의 PTT 통신 서비스 운용 시스템에서, 송신측 단말기(200)는 사용자에 의해 음성을 송신하기 위한 버튼이 가압되거나 활성화된 상태에서 가압 신호 혹은 활성화 신호에 따라 사용자의 음성 신호를 수신측 단말기(300)로 송신한다. PTT 통신 서비스가 운용되는 동안, 단말기에 기 설정된 동작 모드나 사용자의 선택에 따라 음성 인식 지원 장치(400)가 운용되어 발신측 단말기에서 송신되는 데이터의 부가적인 정보가 생성될 수 있다. 이에 의하면, 사용자 환경에 맞는 통신 부가 서비스가 운용될 수 있다.

또한, 수신측 단말기(300)는 PTT 통신 서비스가 운용되는 동안, 단말기에 기 설정된 동작 모드나 사용자의 선택에 따라 음성 합성 지원 장치(500)를 운용하여 수신되는 텍스트 데이터를 음성 데이터로 변환하고 변환된 음성 데이터를 스피커를 통해 출력할 수 있다. 이에 의하면, 사용자 환경에 맞는 통신 부가 서비스가 운용될 수 있다.

여기서 부가 서비스는 사용자로부터의 음성 신호를 텍스트로 전달하는 서비스 또는 수신된 텍스트를 음성으로 전환하여 출력하는 서비스 중 하나가 될 수 있다.

좀더 구체적으로 설명하면, 송신측 단말기(200)가 수신측 단말기(300)와 데이터 통신 채널을 형성하면, PTT 통신 서비스 운용 시스템은 각 단말기에서 기 설정된 설정 모드 혹은 사용자 설정에 따라 음성 인식 지원 장치(400) 및 음성 합성 지원 장치(500) 중 적어도 하나를 운용할 수 있다.

예를 들어, 송신측 단말기(200)는 사용자에 의해 음성을 송신하기 위한 버튼이 가압되어 가압신호가 생성되었을 때, 사용자로부터의 음성 신호를 인식하여 텍스트를 생성하는 STT(speech to text) 서비스를 운용할 수 있다. 이 경우 송신측 단말기(200)는 수집된 음성 데이터를 PTT 통신 시스템(네트워크에 대응함)을 통해 수신측 단말기(300)로 전달함과 동시에 음성 인식 지원 장치(400)에서 음성 인식을 수행하여 텍스트로 변환할 수 있다. 이는 PTT 통신 서비스의 특징을 가능한 위배하지 않는 범위내에서 부가서비스를 제공하기 위함이다.

또한, 수신측 단말기(300)는 수신된 텍스트를 음성으로 변환하는 TTS(text to speech) 서비스를 운용할 수 있다. 이 경우 수신측 단말기(300)는 수신된 텍스트를 표시부(340)에 출력하거나 음성 합성 지원 장치(500)를 통해 음성 데이터로 변환하여 스피커(330)로 출력할 수 있다.

음성 인식 지원 장치(400)는 송신측 단말기(200)의 요청에 따라 송신측 단말기(200)가 제공한 음성 데이터를 인식하고, 인식된 음성을 텍스트로 변환하여 송신측 단말기(200)에 제공하는 구성이다. 이러한 음성 인식 지원 장치(400)는 송신측 단말기(200)와 무선 통신 예를 들면 와이파이나 근거리 무선통신을 통하여 접속할 수 있는 별도의 서버 형태로 구현되거나, 이동 통신시스템이나 인터넷 네트워크를 통해 접속할 수 있는 별도의 서버 형태로 구현되거나, 발신측 또는 수신측 사용자 단말기에서 내부적으로 구동되는 서비스 애플리케이션 형태로 구현될 수 있다.

음성 합성 지원 장치(500)는 수신측 단말기(300)의 TTS 서비스 지원을 위하여 전달된 텍스트를 인식하고, 인식된 텍스트를 음성 데이터로 변환하여 수신측 단말기(300)에 제공하는 구성이다. 이러한 음성 합성 지원 장치(500)는 수신측 단말기(300)와 와이파이나 근거리 무선통신 방식으로 접속할 수 있는 별도의 서버 형태로 구현되거나 이동 통신시스템이나 인터넷 네트워크를 통해 접속할 수 있는 별도의 서버 형태로 구현되거나 혹은 단말기 내부적으로 구동되는 형태로 구현될 수 있다.

위에서 설명한 바와 같이 본 실시예에 따른 PTT 통신 서비스 운용 시스템은 음성 인식 기능을 이용하여 음성 신호에 대하여 텍스트로 변환하여 제공하고, 음성 합성 기능을 이용하여 텍스트를 음성으로 변환하여 제공함으로써 단말기 사용자들의 상황에 따라 보다 적절한 통신 서비스 환경을 이용하도록 지원할 수 있다.

이하의 설명에서는 송신측 단말기(200)와 수신측 단말기(300)의 구성을 각기 구분되는 구성들로 도시하고 그에 대하여 설명하지만 본 발명이 이에 한정되는 것은 아니다. 즉 송신측 단말기(200)는 수신측 단말기(300)와 PTT통신 서비스를 이용하는 과정에서 수신측 단말기 역할을 수행할 수 있으며, 또한 수신측 단말기(300)는 송신측 단말기 역할을 수행할 수도 있다. 결과적으로 이하에서 설명하는 송신측 단말기(200) 및 수신측 단말기(300)의 구성은 하나의 PTT통신 단말기에 통합된 형태로 장착될 수 있을 것이다.

이에 따라 송신측 단말기(200)의 구성은 수신측 단말기(300)가 송신 기능을 수행하는 동안 가질 수 있는 구성으로 이해될 수 있으며, 또한 수신측 단말기(300)의 구성은 송신측 단말기(200)가 수신 기능을 수행하는 동안 가질 수 있는 구성으로 이해될 수 있을 것이다.

도 2는 도 1의 시스템에 채용가능한 송신측 단말기 및 수신측 단말기의 구성을 보다 상세히 나타낸 도면이다.

도 2를 참조하면, 송신측 단말기(200)는 음성 인식 지원 장치(400)을 이용하여 음성 신호를 텍스트로 전환하고 이를 수신측 단말기(300)에 전송할 수 있다.

본 실시예에 따른 PTT 통신 서비스 운용을 지원하기 위하여 송신측 단말기(200)는 입력부(210), 마이크(220), 표시부(240), 통신부(250) 및 제어부(260) 의 구성을 포함할 수 있다.

이와 같은 구성을 가지는 본 발명의 송신측 단말기(200)는 음성 인식 지원 장치(400)을 운용하여 사용자로부터 입력된 음성 신호에 대하여 텍스트로 전환한 후 이를 수신측 단말기(300)에 전송하는 STT(Speech To Text) 서비스를 지원한다. 이를 위하여 송신측 단말기(200)는 단말기 설정에 따라 마이크(220)가 수집하는 음성 신호를 음성 인식하여 텍스트로 변환하도록 제어할 수 있다.

송신측 입력부(210)는 송신측 단말기(200) 운용에 필요한 다양한 입력 신호를 생성하는 구성이다. 입력부(210)는 사용자의 의해 음성을 송신하기 위한 버튼 형태로 형성되거나 터치맵으로 제공될 수 있다. 생성된 입력 신호는 제어부(260)에 전달되어 해당 입력 신호에 따른 기능 지원을 수행할 수 있다.

송신측 마이크(220)는 송신측 단말기(200)의 기능 운용에 따라 활성화되어 주변 오디오 신호 특히 음성 신호를 수집하는 구성이다. 송신측 마이크(220)가 수집한 음성 신호는 송신측 제어부(260)에 전달되며, 송신측 제어부(260)의 제어에 따라 음성 인식되어 텍스트로 변환되어 수신측 단말기(200)에 전달될 수 있다.

송신측 표시부(240)는 송신측 단말기(200) 운용에 필요한 다양한 화면 인터페이스를 제공하는 구성이다. 송신측 표시부(240)는 수신측 단말기(300)와의 통신 서비스 종류에 따라 각각의 화면을 제공할 수 있다. 예를 들면 송신측 표시부(240)는 음성 송신 상태를 나타내는 화면, 텍스트 서비스 지원 화면 또는 음성 인식으로 생성된 텍스트를 출력하는 화면 중 하나를 각 서비스 운용에 따라 개별적으로 출력할 수 있다.

송신측 통신부(250)는 통신 시스템(100)을 통하여 수신측 단말기(300)와 데이터 통신 채널을 형성 할 수 있다. 이러한 통신부(250)는 송신측 단말기(200)의 기기 특성에 따라 다양한 형태의 통신 방식을 지원하는 통신 모듈로 구성될 수 있다. 예를 들어, 통신부(250)는 2G, 3G, LTE(long term evolution) 등을 지원하는 이동통신 모듈, 와이 파이 등을 지원하는 통신 모듈 등 다양한 통신 모듈로 구성될 수 있다. 특히 통신부(250)는 사용자 입력에 따라 수신측 단말기(300)와 본 실시 예에 따른 음성 인식 기반의 텍스트 송신을 위한 데이터 통신 채널을 형성할 수 있다.

송신측 제어부(260)는 본 실시예에 따른 송신측 단말기(200) 운용에 필요한 신호 제어를 지원하는 구성이다. 특히 송신측 제어부(260)는 본 실시예의 통신 서비스 운용 지원을 위한 신호 제어 및 데이터 전달을 제어할 수 있다. 이를 위하여 송신측 제어부(260)는 도 3에 도시된 바와 같은 구성을 포함할 수 있다.

도 3은 본 발명의 실시예에 따른 송신측 단말기의 제어부 구성을 보다 상세히 나타낸 도면이다.

도 3을 참조하면, 송신측 제어부(260)는 음성 처리부(261), 텍스트 처리부(262), STT매니저(263) 및 미디어 동기화 처리부(266)를 포함할 수 있다.

송신측 음성 처리부(261)는 송신측 마이크(220)가 수집한 음성 신호를 처리하여 음성 데이터를 생성하는 구성이다. 예를 들어, 송신측 음성 처리부(261)는 음성 신호 처리를 위한 인코딩부가 될 수 있다. 송신측 음성 처리부(261)가 처리한 음성 데이터는 STT매니저(263)에 전달 될 수 있다.

송신측 텍스트 처리부(262)는 송신측 입력부(210) 및 입력 기능의 송신측 표시부(240)로부터 입력되는 신호를 문자로 전환하는 구성이다.

STT 매니저(263)는 송신측 단말기(200)의 음성 인식 기능을 제어하는 구성이다. 이러한 STT매니저(263)는 제어에 따라 음성 처리부(261)가 전달한 음성 데이터의 음성 인식을 수행하여 텍스트로 전환하도록 제어할 수 있다. 이때 STT매니저(263)는 음성처리부(261)가 제공하는 음성 데이터를 실시간으로 음성 인식 지원 장치에 전달한다. STT매니저(263)가 처리한 테스트는 네트워크 지원부(265)에 전달된다.

송신측 네트워크 지원부(265)는 송신측 통신부(250)의 활성화 제어, 송신측 통신부(250)를 통한 수신측 단말기(300)와의 PTT통신 서비스 채널 형성 등을 지원할 수 있다. PTT통신 서비스 채널 연결 이후 음성 처리부(261)에서 전달하는 음성 데이터, STT매니저(263)가 전달하는 텍스트 데이터 중 적어도 하나를 송신측 통신부(250)을 통해 수신측 단말기(300)에 전달 할 수 있다.

송신측 미디어 동기화 처리부(266)는 음성 신호가 수집된 타임스탬프 정보를 음성 처리부(261)로부터 전달받아 음성 인식 지원 장치(400)를 통해 전달된 텍스트에 포함시켜 수신측 단말기(300)에 전달할 수 있다.

상술한 바와 같이 본 발명의 실시 예에 따른 송신측 단말기(200)는 단말기 설정에 따라 STT 서비스를 운용할 수 있다.

다시 도 2를 참조하면, 수신측 단말기(300)는 송신측 단말기(200)의 통신 서비스 연결 요청 및 단말기에 설정된 모드에 따라 해당 통신 서비스를 연결하도록 지원한다.

수신측 입력부(310)는 수신측 단말기(300)운용에 필요한 다양한 입력 신호를 생성하는 구성이다. 입력부(310)는 버튼 형태로 형성되거나 터치맵으로 제공될 수 있다. 생성된 입력 신호는 제어부(360)에 전달되어 해당 입력 신호에 따른 기능 지원을 수행할 수 있다.

수신측 스피커(330)는 수신측 단말기(300)의 오디오 신호의 출력을 지원하는 구성으로 수신측 통신부(350)가 수신한 오디오 신호의 출력 등을 지원할 수 있다. 수신측 스피커(330)는 수신측 제어부(360)의 제어에 따라 활성화되어 오디오 신호의 출력을 지원할 수 있으며 특히 수신측 단말기(300)의 설정에 따라 TTS서비스 지원 중인 경우 송신측 단말기(200)로부터 수신된 텍스트에 대해 음성 신호를 출력할 수 있다.

수신측 표시부(340)는 수신측 단말기(300) 운용에 필요한 다양한 화면 인터페이스를 제공하는 구성이다. 수신측 표시부(340)는 송신측 단말기(200)와의 통신 서비스 종류에 따라 각각의 화면을 제공할 수 있다. 예를 들면 수신측 표시부(340)는 음성 수신 상태를 나타내는 화면, 텍스트 서비스 지원 화면 또는 수신된 텍스트를 출력하는 화면 중 하나를 각 서비스 운용에 따라 개별적으로 출력할 수 있다.

수신측 통신부(350)는 송신측 단말기(200)의 송신측 통신부(250)와 통신채널을 형성할 수 있으며 이를 위해 수신측 통신부(350)는 송신측 통신부(250)와 통신 채널 형성이 가능한 통신 모듈로 구성된다.

수신측 제어부(360)는 본 발명의 실시 예에 따른 수신측 단말기(300) 운용에 필요한 신호 제어를 지원하는 구성이다. 특히 수신측 제어부(360)는 본 실시예의 통신 서비스 운용 지원을 위한 신호 제어 및 데이터 전달을 제어할 수 있다.

도 4는 본 발명의 실시예에 따른 수신측 단말기의 제어부 구성을 보다 상세히 나타낸 도면이다.

도 4를 참조하면, 수신측 제어부(360)는 수신측 음성 처리부(361), 수신측 텍스트 처리부(362), TTS매니저(364), 네트워크 지원부(365) 및 미디어 동기화 처리부(366)를 포함할 수 있다.

수신측 음성 처리부(361)는 PTT통신시스템을 통해 전달된 음성 신호를 처리하여 음성 출력하는 구성이다.

수신측 텍스트 처리부(362)는 PTT통신 시스템을 통해 전달된 텍스트를 수신측 표시부(340)로 전달하거나 TTS매니저(364)로 전달하여 음성 합성 기능을 수행할 수 있다.

TTS 매니저(364)는 수신측 단말기(300)의 음성 합성 기능을 제어하는 구성이다. 이러한 TTS 매니저(364)는 제어에 따라 수신측 텍스트 처리부(362)가 전달한 텍스트 데이터를 음성 합성 지원 장치(500)를 통해 음성으로 전환하도록 제어할 수 있다. 이때 TTS 매니저(364)는 수신측 텍스트 처리부(362)가 제공하는 텍스트 데이터를 실시간으로 음성 합성 지원 장치(500)에 전달한다.

수신측 네트워크 지원부(365)는 수신측 통신부(350)의 활성화 제어, 수신측 통신부(350)을 통한 송신측 단말기(200)와의 PTT통신 서비스 채널 형성 등을 지원할 수 있다. PTT통신 서비스 채널 연결 이후 수신측 통신부(350)을 통해 전달된 음성 및 텍스트 데이터 중 적어도 하나를 음성 처리부(361) 또는 텍스트 처리부(362)로 전달할 수 있다.

수신측 미디어 동기화 처리부(366)는 송신측 단말기(200)로부터 전달된 텍스트 데이터에서 추출한 타임스탬프 정보를 이용해 음성 데이터의 타임 스탬프와 맞도록 텍스트 데이터를 배치할 수 있다.

상술한 바와 같이 본 실시예에 따른 PTT 통신 서비스 운용 시스템은 송신측 단말기(200)가 음성 인식 지원 장치(400)를 이용하여 음성 인식을 통한 텍스트를 생성한 후 이를 수신측 단말기(300)에 전송하고, 수신측 단말기(300)는 음성 합성 지원 장치(500)을 이용하여 텍스트를 음성으로 변환하여 출력할 수 있다.

또한, 송신측 단말기 및 수신측 단말기는 PTT 통신을 위한 서비스 채널이 형성된 상태에서 텍스트 송수신을 지원하기 위해 별도의 채널을 형성할 수 있다.

또한, 송신측 단말기는 음성 인식 기반의 텍스트를 제공하는 STT(Speech To Text) 서비스 운용에 따라 생성된 텍스트를 음성 통화 서비스 지원을 위해 전송되는 음성 데이터와 함께 수신측 단말기에 전송할 수 있다.

또한, 송신측 단말기는 상기 생성된 텍스트 데이터에 해당하는 음성 신호가 수집되는 타임 스탬프 정보를 이용하여 텍스트와 음성 데이터의 동기화를 수행할 수 있다.

또한, 수신측 단말기는 수신된 텍스트 데이터에 해당하는 수신된 음성 데이터의 타임스탬프 정보를 송신측 단말기가 전송하는 데이터로부터 추출할 수 있다.

또한, 수신측 단말기는 추출된 타임스탬프 정보를 이용하여 수신된 음성에 맞도록 텍스트 데이터를 화면에 배치할 수 있다.

한편, 본 발명은 위에서 언급한 바와 같이 상술한 구성으로 한정되지 않는다. 음성 인식 지원 장치와 음성 합성 지원 장치는 음성 인식 기능과 음성 합성 기능을 구비하는 단일 서버 시스템으로 구현되거나, 발신측 단말기에 대응하는 제1 사용자 단말 및/또는 수신측 단말기에 대응하는 제2 사용자 단말에 서비스 애플리케이션 형태로 탑재되도록 구현될 수 있다. 이때, 서비스 애플리케이션은 음성 인식 기능과 음성 합성 기능을 구비할 수 있다.

다음으로, 본 발명의 다른 실시예에 따른 푸시투톡 통신 서비스 운용 방법의 다양한 양태에 대하여 설명하기로 한다.

도 5는 본 발명의 다른 실시예에 따른 푸시투톡 통신 서비스 운용 방법에 대한 흐름도이다. 도 6은 본 발명의 또 다른 실시예에 따른 푸시투폭 통신 서비스 운용 방법을 이용하는 시스템의 디스플레이 화면에 대한 예시도이다.

본 실시예에 따른 푸시투톡 통신 서비스 운용 방법은, 제1 사용자 단말(20), 제2 사용자 단말(30), 음성 인식 지원 장치(400) 및 음성 합성 지원 장치(500)를 포함하는 PTT 통신 서비스 시스템에서 구현될 수 있다.

제1 사용자 단말(20)은 송신측 단말기에 대응하고 제2 사용자 단말(30)은 수신측 단말기에 대응할 수 있으나, 이에 한정되지 않으며, 제1 사용자 단말(20)은 네트워크를 통해 신호 및 데이터의 송수신이 가능한 제1 모바일 단말이나 제1 컴퓨팅 장치에 대응하고, 제2 사용자 단말(30)은 제2 모바일 단말이나 네트워크를 통해 신호 및 데이터의 송수신이 가능한 제2 컴퓨팅 장치에 대응할 수 있다.

또한, 푸시투톡(push to talk, PTT) 통신 서비스 이용을 위해 제1 사용자 단말(20)과 제2 사용자 단말(30)은 어느 한쪽의 요청과 적어도 다른 한쪽의 응답에 따라 통신 채널을 설정할 수 있다. 그리고, 통신 채널의 설정 시에 PTT 통신 서비스를 지원하는 음성 인식 지원 장치와 음성 합성 지원 장치에 대한 정보나 주소가 공유될 수 있다. 이 경우, 음성 인식 지원 장치와 음성 합성 지원 장치는 각각 제1 서버와 제2 서버로 지칭될 수 있다. 제1 서버와 제2 서버는 음성 인식부와 음성 합성부를 구비하는 단일 서버 시스템(600)으로 구현될 수 있다.

한편, 제1 서버 및 제2 서버에 대한 정보나 주소에 대한 공유 과정은 음성 인식 지원 장치와 음성 합성 지원 장치가 서비스 애플리케이션의 일부 기능 형태 혹은 소프트웨어 모듈 형태로 구현되어 사용자 단말에 탑재되는 경우에 생략될 수 있다.

도 5를 참조하면, 제1 사용자 단말(20)에서 PTT 송신 버튼이 활성화되면(S51), 제1 사용자 단말(20)은 마이크로 입력되는 음성 데이터를 PTT 통신 서비스(이하 간략히 PTT 서비스라고 한다)를 위해 설정된 통신 채널을 통해 제1 사용자 단말(30)로 전송할 수 있다(S53).

PTT 송신 버튼은 제1 사용자 단말(20)의 적어도 하나의 특정 하드웨어 버튼일 수 있다. 또한, PTT 송신 버튼은 제1 사용자 단말(20)에 탑재된 PTT 서비스를 위한 서비스 애플리케이션의 사용자 인터페이스에서 제공되는 버튼일 수 있다. 사용자 인터페이스에서 제공하는 버튼은 그래픽 사용자 인터페이스를 포함하나, 이에 한정되지 않고, 음성 인식이나, 화면 영상 처리에 의해 인식되는 가상 버튼을 포함할 수 있다.

한편, 제2 사용자 단말(30)은 제1 사용자 단말(20)로부터 받은 음성 데이터를 스피커를 통해 음성 출력할 수 있다(S55). 또한, 제2 사용자 단말(30)은 음성 데이터에 대한 텍스트 변환을 음성 인식 지원 장치(400)에 요청할 수 있다(S57). 이러한 STT 요청은 제2 사용자 단말(30)의 사용 환경이나 사용자 설정이나 실시간사용자 입력 명령에 따라 수행될 수 있다. STT 요청 메시지에는 음성 데이터가 포함되거나 음성 데이터의 식별 정보가 포함될 수 있다.

전술한 경우, 음성 인식 지원 장치(400)는 STT 요청에 따라 하여 부가정보를 생성할 수 있다(S59). 여기서 부가정보 생성은 음성 데이터를 텍스트 데이터로 변환하는 것을 포함할 수 있다. 변환된 텍스트 데이터는 다시 제2 사용자 단말(30)로 전송될 수 있다(S61). 제2 사용자 단말(30)은 전송받은 텍스트 데이터를 PTT 서비스 애플리케이션의 화면이나 문자 메시지 혹은 멀티미디어 메시지를 표시하는 화면 상에 출력할 수 있다(S63).

한편, 음성 인식 지원 장치(400)는 제1 사용자 단말(20)의 음성 데이터를 모니터링하고, 제1 사용자 단말(20)에 대응하는 사용자 설정에 따라 음성 데이터를 자동으로 저장하거나 텍스트 데이터로 변환하고, 변환된 텍스트 데이터를 현재 데이터 채널이 설정 등록되어 있거나 미리 설정된 위치나 주소의 제2 사용자 단말(30)에 제공할 수 있다.

또한, 제1 사용자 단말(20)은 도 6에 도시한 바와 같이 푸시투톡(push to talk, PTT) 서비스 애플리케이션(50)의 대화형 텍스트 창(60)을 통해 제2 사용자 단말(30)의 사용자와 문자 메시지(70)를 주고받으며 대화할 수 있다. 대화형 텍스트 창(60)에는 문자 입력창(80), 전송 버튼(86) 및 키보드(90) 등의 사용자 인터페이스 혹은 입출력 인터페이스가 구비될 수 있다. 그리고 제2 사용자 단말(30)도 PTT 서비스 애플리케이션을 통해 자신의 문자 메시지와 제1 사용자 단말(20)로부터 전송된 문자 메시지를 대화형 텍스트 창에 출력할 수 있다.

다시 도 5를 참조하면, 대화형 텍스트 창에서 PTT 텍스트 전송 입력이 감지되는 경우(S71), 제1 사용자 단말(20) 또는 PTT 서비스 애플리케이션(간단히 서비스 애플리케이션이라고도 한다)은 텍스트 데이터를 포함한 문자 메시지를 데이터 통신망을 통해 제2 사용자 단말(30)에 전송할 수 있다(S73).

문자 메시지는 텍스트 데이터를 음성 데이터로 변환하도록 요청하는 TTS 요청 메시지를 포함할 수 있다. TTS 요청은 도 6에 도시한 바와 같이 대화형 텍스트 창(60)에 배치되는 TTS 버튼(82)을 통해 토글 방식 또는 온/오프 방식으로 입력될 수 있다.

이 경우, 음성 합성 지원 장치(500)는 데이터 통신망을 포함하는 TTS 통신 시스템 상에서 서비스 사용자의 텍스트 데이터 또는 이를 포함하는 문자 메시지를 실시간 모니터링하고, TTS 요청 메시지에 따라 해당 텍스트 데이터나 문자 메시지에 포함된 텍스트 데이터를 음성 데이터로 변환하여 제2 사용자 단말(30)에 전송할 수 있다(S75, S77).

한편, 음성 합성 지원 장치(500)가 소프트웨어 모듈 형태로 제1 사용자 단말(20)에 탑재되는 경우, 제1 사용자 단말(20)의 TTS 매니저(도 4의 364 참조)는 해당 명령을 인식하고 해당 명령에 대응하여 미리 설정된 처리 과정에 따라 자체 탑재된 TTS 모듈을 이용하거나 외부의 음성 합성 지원 장치와 연동하여 텍스트를 음성으로 변환하고, 음성 데이터를 제2 사용자 단말(30)에 전송할 수 있다.

일례로, 제1 사용자 단말이 네트워크를 통해 제2 사용자 단말과 통신 채널을 설정하고, 푸시투톡(push to talk) 서비스 애플리케이션은 대화형 텍스트 창에서 텍스트 대화 통신을 지원하는 중에 TTS(text to speech) 입력을 감지하고, 감지된 TTS 입력/명령에 따라 대화형 텍스트 창에서 사용자 단말에서 입력되는 텍스트 데이터를 음성 데이터로 변환하기 위한 TTS 요청 신호를 생성할 수 있다.

생성된 TTS 요청 신호는 이 신호를 생성한 사용자 단말에 탑재된 서비스 애플리케이션의 TTS 매니저에게 전달될 수 있다. 또한, 구현에 따라서, 생성된 TTS 요청 신호는 해당 텍스트 데이터와 함께 이 신호를 생성한 사용자 단말과 네트워크를 통해 연결되는 음성 합성 지원 장치에 전달될 수 있다. 이 경우, TTS 매니저 또는 음성 합성 지원 장치는 TTS 요청 신호에 따라 텍스트 데이터를 음성 데이터로 변환하고, 변환된 음성 데이터가 사용자 단말의 상대방 단말에 전송되도록 동작할 수 있다.

또한, 본 실시예에 따른 푸시투톡 통신 서비스 운용 방법은, 제1 사용자 단말이 네트워크를 통해 제2 사용자 단말과 통신 채널을 설정한 후, 푸시투톡(push to talk) 서비스 애플리케이션의 대화형 텍스트 창에서 텍스트 대화 통신을 지원하는 중에 비밀(secret) 대화 설정 입력을 감지할 수 있다.

비밀 대화 설정 입력은 도 6에 도시한 바와 같이 대화형 텍스트 창(60)에 배치되는 소정 버튼(S, 84)을 통해 토글 방식 또는 활성/비활성 방식으로 생성되거나 중지될 수 있다.

전술한 경우, 비밀 대화 설정 입력에 따라 대화형 텍스트 창에서 제1 사용자 단말(20) 또는 발신측 사용자 단말은 음성 송신 모드로 모드 전환되고, 제2 사용자 단말(30) 또는 수신측 사용자 단말은 발신측 사용자 단말로부터의 비밀 대화 설정 입력에 대응하는 모드 전환 요청 신호에 따라 텍스트 수신 모드로 작동모드를 전환할 수 있다.

이때, 발신측 사용자 단말에 탑재되는 서비스 애플리케이션이나 제1 또는 제2 사용자 단말과 네트워크를 통해 연결되는 음성 인식 지원 장치는 TTS 요청에 대응하는 신호에 따라 발신측 사용자 단말의 텍스트 데이터를 음성 데이터로 변환하여 수신측 사용자 단말에 제공할 수 있다. 여기서, 텍스트 데이터는 수신측 사용자 단말의 사용자가 나중에 확인할 수 있도록 음성 데이터와 함께 혹은 별도로 수신측 사용자 단말로 전송될 수 있다.

한편, TTS 요청을 포함하는 문자 메시지가 음성 합성 지원 장치(500)에 감지되면, 음성 합성 지원 장치(500)는 문자 메시지에 대한 더미 메시지를 제2 사용자 단말(30)에 제공할 수 있다(S81). 더미 메시지는 텍스트 메시지가 없고 텍스트 메시지가 전달된 기록을 표시하는 정보와 텍스트 메시지가 저장되는 위치 정보를 포함할 수 있다. 이러한 더미 메시지를 이용하면, 제2 사용자 단말(30)의 사용자는 TTS 요청이 종료된 후 등과 같은 나중 시점에서 해당 텍스트 데이터를 요청하는 신호를 음성 합성 지원 장치(500) 등에 전송할 수 있다(S83).

이상에서 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 상기의 상세한 설명은 모든 면에서 제한적으로 해석되어서는 아니되고 예시적인 것으로 고려되어야 한다. 본 발명의 범위는 첨부된 청구항의 합리적 해석에 의해 결정되어야 한다.

200: 송신측 단말기 300: 수신측 단말기
210,310: 입력부 220: 마이크
330: 스피커 240,340: 표시부
250,350: 통신부 260,360: 제어부
261,361: 음성처리부 262,362: 텍스트 처리부
263: STT매니저 364: TTS매니저
265,365: 네트워크 지원부 266,366: 미디어 동기화 처리부
400: 음성 인식 지원 시스템 500: 음성 합성 지원 시스템

Claims

푸시투톡(push to talk, PTT) 통신 서비스를 수행하는 모바일 단말기를 포함하는 서비스 운용 시스템으로서,
음성을 송신할 수 있는 버튼이 가압된 상태에서 기 설정이나 사용자의 설정 모드에 따라 사용자 입력 음성 데이터를 텍스트로 변환한 후 변환된 텍스트 데이터를 전송하는 송신측 단말기;
상기 송신측 단말기의 요청에 의해 PTT 통신 서비스가 연결된 이후 수신된 텍스트 데이터를 기 설정 또는 사용자의 설정한 모드에 따라 음성으로 변환한 후 출력하는 수신측 단말기; 및
사용자로부터 입력된 음성 데이터를 텍스트 데이터로 변환하거나 수신된 텍스트 데이터를 음성 데이터로 변환하여 출력하는 음성 인식 지원 장치;
를 포함하는 푸시투톡 통신 서비스 운용 시스템.
제 1항에 있어서,
상기 송신측 단말기 및 상기 수신측 단말기는 PTT통신을 위한 서비스 채널이 형성된 상태에서 텍스트 송수신을 지원하기 위해 별도의 채널을 형성하는 것을 특징으로 하는 푸시투톡 통신 서비스 운용 시스템.
제 2항에 있어서,
상기 송신측 단말기는 상기 음성 인식 기반의 텍스트를 제공하는 STT(Speech To Text)서비스 운용에 따라 생성된 텍스트를 상기 음성 통화 서비스 지원을 위해 전송되는 음성 데이터와 함께 상기 수신측 단말기에 전송하는 것을 특징으로 하는 푸시투톡 통신 서비스 운용 시스템.
제 3항에 있어서,
상기 송신측 단말기는 상기 생성된 데이터에 해당하는 음성 신호가 수집되는 타임 스탬프 정보를 이용하여 상기 텍스트와 상기 영상 데이터의 동기화를 수행하는 것을 특징으로 하는 푸시투톡 통신 서비스 운용 시스템.
제 1항에 있어서,
상기 수신측 단말기는 수신된 텍스트 데이터에 해당하는 수신된 음성 데이터의 타임스탬프 정보를 상기 송신측 단말기가 전송하는 데이터로부터 추출하는 푸시투톡 통신 서비스 운용 시스템.
제 5항에 있어서,
상기 수신측 단말기는 추출된 타임스탬프 정보를 이용하여 수신된 음성에 맞도록 텍스트 데이터를 화면에 배치하는 푸시투톡 통신 서비스 운용 시스템.