WO2016047818A1

WO2016047818A1 - 멀티 코덱, 멀티 채널 기반의 동시통역 서비스 제공 시스템 및 방법

Info

Publication number: WO2016047818A1
Application number: PCT/KR2014/008819
Authority: WO
Inventors: 송재훈; 양석훈; 김민교
Original assignee: (주)두드림
Priority date: 2014-09-23
Filing date: 2014-09-23
Publication date: 2016-03-31

Abstract

본 발명은 기존의 동시통역 시스템을 운영하고 있는 국제 회의장, 전시장 및 세미나 외에도 중/소 규모의 동시통역이 필요한 회의장에서 고가의 동시통역 시스템을 보완 및 대체 할 수 있는 시스템 및 방법을 제공하는데 있다. 본 발명의 실시예에 의하면, 오디오, 비디오, 이미지, 텍스트 데이터를 혼합하고 분할하는 다중화(Muxing)와 역다중화(Demuxing)기술을 이용하여 동시통역 언어별로 채널 구성이 가능하고, 통역사의 음성과 함께 이미지, 텍스트 기반의 실시간 번역 정보와 회의 안내 정보를 제공하여 국제회의 참석자들에게 다양한 부가서비스를 제공할 수 있다.

Description

멀티 코덱, 멀티 채널 기반의 동시통역 서비스 제공 시스템 및 방법

본 발명은 동시통역 서비스 제공 시스템에 관한 것으로, 보다 상세하게는 멀티 코덱, 멀티 채널을 기반으로 음성, 이미지, 텍스트를 스트리밍 서비스하기 위한 동시통역 서비스 제공 시스템 및 방법에 관한 것이다.

다국 언어로 진행되는 국제 회의장, 전시장 및 세미나 등에서는 둘 이상의 동시통역사가 강연자의 강연 내용을 통역하여 이를 통역 마이크를 통하여 음성 신호를 입력하면, 이를 전용 수신기를 통하여 강연 참가자들이 통역사가 통역한 음성을 청취하는 방식으로 동시통역 서비스가 이루어지고 있다.

즉, 현재 동시통역 서비스 환경에서는 강연회에 참석한 모든 참가자에게 일일이 동시통역 수신기를 지급하는 형태로 운영되고 있다. 그러나 동시통역 수신기 자체의 단가가 비싸고 종류도 다양하여, 참석자들은 매번 동시통역 수신기의 작동방법을 숙지해야 하며, 또한 참석자들이 많은 경우에는 동시통역 수신기가 부족하여 일부 참석자들은 동시통역 서비스를 받지 못하는 등 불편함이 있다.

반면, 스마트폰은 음성통화 기능 외에 무선인터넷 애플리케이션을 통해 엔터테인먼트, 컴퓨팅, 카메라, 텔레매틱스, 방송 등 다양한 기능을 제공하여 단순 휴대폰이 아닌 멀티미디어 기기로 활용되고 있다.

따라서, 이러한 스마트폰 사용의 환경적 변화에 대응하여 기존의 동시통역 시스템을 보완 및 대체할 수 있는 서비스의 도입이 필요하다.

본 발명은 기존의 동시통역 시스템을 운영하고 있는 국제 회의장, 전시장 및 세미나 외에도 중/소 규모의 동시통역이 필요한 회의장에서 고가의 동시통역 시스템을 보완 및 대체 할 수 있는 시스템 및 방법을 제공하는데 있다.

또한 본 발명은 오디오, 비디오, 이미지, 텍스트 데이터를 혼합하고 분할하는 다중화(Muxing)와 역다중화(Demuxing)기술을 이용하여 동시통역 언어별로 채널 구성이 가능하고, 통역사의 음성과 함께 이미지, 텍스트 기반의 실시간 번역 정보와 회의 안내 정보를 제공하여 국제회의 참석자들에게 다양한 부가서비스를 제공할 수 있는 시스템 및 방법을 제공하는데 있다.

또한 본 발명은 음성 다중화(Muxing) 및 역다중화(Demuxing) 기술을 이용함으로써 동시통역 언어의 수에 제한이 없게 되고, 다수의 동시통역 음성을 다중화(Muxing)하여 스트리밍 서비스함으로써 스트리밍 서버의 입장에서 언어별 스트리밍 서비스를 제공하는 것보다 월등한 시스템 성능 향상을 가져올 수 있으며, 최근 고사양의 스마트폰 보급이 활성화되고 상황에서 서버의 부하를 청취자의 스마트폰 측으로 분산함으로써 스트리밍 서비스 성능을 향상시킬 수 있는 시스템 및 방법을 제공하는데 있다.

본 발명의 일 측면에 따르면, 통역사의 마이크로부터 수신된 아날로그 음성을 디지털 음성으로 변환하고, 각 통역 음성을 텍스트로 실시간 입력하고, 각 언어별 컨퍼런스 안내 정보를 이미지 및 텍스트 중 적어도 하나를 이용하여 편집하는 동시통역 서비스 정보 인코딩부; 상기 동시통역 서비스 정보 인코딩부에 의해 처리된 다국어의 통역 서비스 데이터를 다중화(Muxing)하는 멀티 채널 다중화부; 상기 멀티 채널 다중화부에 의해 다중화된 멀티 채널 통역 서비스 데이터 스트림을 세션 연결된 사용자 단말에 전송하는 스트리밍 서버; 상기 사용자 단말로부터 멀티 채널 데이터 스트림 및 청취 선택 언어를 수신하고, 수신된 멀티 채널 통역 서비스 데이터 스트림으로부터 상기 청취 선택 언어에 해당하는 디지털 데이터를 추출하는 멀티 채널 역다중화부; 및 상기 멀티 채널 역다중화부에 의해 추출된 디지털 음성 데이터를 아날로그 음성으로 변환하고, 실시간 번역 텍스트 및 컨퍼런스 안내 정보 데이터를 추출하고 분석하여 화면에 표출하는 동시통역 서비스 정보 디코딩부를 포함하는 동시통역 서비스 제공 시스템이 제공된다.

또한 본 발명의 다른 측면에 따르면, (a) 각기 다른 언어로 통역하는 각각의 통역사의 마이크로부터 수신된 각각의 아날로그 음성을 디지털 음성으로 각각 인코딩하고, 텍스트 기반의 번역 정보 입력 및 컨퍼런스 정보를 편집하여 저장하는 단계; (b) 인코딩된 각 국의 통역 서비스 데이터를 다중화 처리하는 단계; (c) 다중화 처리된 멀티 채널 서비스 데이터 스트림을 세션 연결된 사용자 단말로 전송하는 단계; (d) 상기 사용자 단말로부터 수신된 멀티 채널 서비스 데이터 스트림을 역다중화 처리하여, 상기 사용자 단말에 의해 선택된 청취 선택 언어에 상응하는 디지털 음성 데이터와 번역 텍스트 데이터, 컨퍼런스 채널 정보 데이터를 추출하는 단계; 및 (e) 상기 추출된 디지털 음성 데이터를 아날로그 음성으로 디코딩하고, 번역 텍스트 정보와 컨퍼런스 정보를 화면에 표출하는 단계를 포함하는 동시통역 서비스 제공 방법이 제공된다.

본 발명의 실시예에 의하면, 기존의 동시통역 환경에서 지급되었던 동시통역 수신기 대신 자신이 소유하고 있는 스마트폰을 이용하여 어플리케이션 설치를 통해 동시통역 음성을 청취할 수 있고, 청취 언어 선택이 자유로우며, 선택된 언어에 대한 이미지 및 텍스트 기반의 정보를 음성과 함께 볼 수 있다.

또한 본 발명의 실시예에 의하면, 동시통역 음성 뿐만아니라 이미지, 텍스트 데이터 정보를 각 채널별로 서비스가 가능하기 때문에 컨퍼런스 정보 등의 다양한 부가서비스를 언어별로 제공할 수 있다.

또한 본 발명의 실시예에 의하면, 기존의 고가의 동시통역 운영 시스템 대신 저가의 중/소규모의 시스템 및 방법을 제공함으로써, 동시통역 시스템 운영비의 절감 효과를 가져올 수 있다.

이에 따라, 국제회의 등에서 언어소통에 불편을 겪고 있는 잠재적 수요자의 수가 헤아릴 수 없이 많으므로 사용자의 요구수준을 만족시킬 수 있으며, 세계화 시대에 요구되는 궁극적인 획기적 통역 서비스 기술 실현을 통해 새로운 국제컨퍼런스 관련 MICE 산업에 새로운 블루오션을 창출할 수 있다.

또한 세계화(Globalization)가 가속화 되고 있는 상황에서 통역 서비스 기술의 개발은 언어장벽의 해소를 통하여 보다 다양한 분야의 사람들이 국제협력 등 활동을 할 수 있게 되며, 한류의 확산, 외국인의 국내활동 기반 강화, 국제 무역의 확대, 관광산업의 진흥 등 국제화를 통하여 국제사회에서의 우리나라의 위상을 높이고 국가 경쟁력을 강화시킬 수 있다.

도 1은 본 발명의 실시예에 따른 동시통역 서비스 제공 시스템 및 방법에 대한 전체 구성도.

도 2는 마이크의 아날로그 음성을 디지털 음성으로 변환하고, 실시간 번역정보 입력 및 컨퍼런스 안내 정보를 편집하고 저장하기 위한 동시통역 서비스 정보 인코딩부의 일 구성도.

도 3은 언어별 통역 서비스 정보를 다중화하여 하나의 전송 스트림으로 다중화하기 위한 멀티 채널 다중화부의 일 구성도.

도 4는 다중화된 멀티 채널 통역 서비스 데이터 스트림을 스마트폰 단말에 서비스하기 위한 스트리밍 서버부의 일 구성도.

도 5는 스마트폰 단말에서 수신 받은 멀티 채널 통역 서비스 데이터 스트림 중에서 청취하고자하는 특정 채널 정보만을 추출하는 멀티 채널 역다중화부의 일 구성도.

도 6은 디지털 음성을 아날로그 음성으로 변환하여 디코딩하고, 번역 정보, 컨퍼런스 정보를 화면에 표출하는 동시통역 서비스 정보 디코딩부의 일 구성도.

본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 이를 상세한 설명을 통해 상세히 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.

본 발명을 설명함에 있어서, 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 본 명세서의 설명 과정에서 이용되는 숫자(예를 들어, 제1, 제2 등)는 하나의 구성요소를 다른 구성요소와 구분하기 위한 식별기호에 불과하다.

또한, 본 명세서에서, 일 구성요소가 다른 구성요소와 "연결된다" 거나 "접속된다" 등으로 언급된 때에는, 상기 일 구성요소가 상기 다른 구성요소와 직접 연결되거나 또는 직접 접속될 수도 있지만, 특별히 반대되는 기재가 존재하지 않는 이상, 중간에 또 다른 구성요소를 매개하여 연결되거나 또는 접속될 수도 있다고 이해되어야 할 것이다.

또한 이하 설명할 도면들에 기재된 구성요소들은 각각의 구성요소가 갖는 기능에 초점을 맞춰 구분된 것에 불과하다. 따라서, 2개 이상의 구성요소가 하나의 구성요소로 통합 구현될 수도 있으며, 1개의 구성요소가 보다 세분화된 복수의 구성요소로 분리 구현될 수도 있음은 물론이다. 이러한 이유로, 특정 구성이 본 발명의 실시예에서의 적어도 하나의 구성요소와 동일한 기능을 수행한다면, 각 구성요소로의 구분 및 그 명칭과 무관하게, 해당 구성요소들과 동일한 구성인 것으로 해석되어야 할 것이다.

본 발명은 다국 언어로 진행되는 국제 회의장, 전시장 및 세미나 등에서 최소 둘 이상의 동시통역사가 동시통역 서비스를 제공하는 시스템 설치 비용의 감소와 사용자 편의성을 제공하기 위한 방법에 관한 것으로, 본 발명을 위해서는 통역사의 마이크로 출력되는 아날로그 음성을 디지털 음성으로 변환하고, 실시간 번역 텍스트 데이터, 컨퍼런스 안내 정보 등의 이미지, 텍스트 기반 데이터를 인코딩하는 기술과, 각 언어 별 음성 및 정보 데이터를 하나의 스트림으로 다중화(Muxing)하는 전송 스트리밍(Transport Streaming) 기술, 수신 단말에서 청취하고자 하는 특정 언어 채널만을 추출하는 역다중화(Demuxing) 기술, 그리고 디지털 음성을 다시 아날로그 음성으로 변환하여 스피커로 출력하고, 번역 텍스트, 컨퍼런스 안내정보 데이터를 디코딩하여 브라우저로 표출하는 기술이 전제된다.

이러한 데이터의 혼합에 대한 규격이 MPEG2-TS 표준이며, 각 데이터(오디오+비디오+이미지+텍스트) 별로 서비스 채널을 구성이 가능하고, 서버 시스템의 Muxer와 단말 시스템의 Demuxer를 구성하여 각 언어별로 멀티코덱, 멀티채널 기반으로 음성과 데이터를 혼합하여 서비스가 가능해진다. 즉, 본 발명에 의하면, 오디오, 비디오, 이미지, 텍스트 기반 다채널 구성이 가능해짐으로 인해 각 언어별로 동시통역사의 음성과 함께 실시간 번역 내용, 회의 안내 정보(이미지, 텍스트) 등의 다양한 데이터 서비스를 제공할 수 있다.

이하, 첨부된 도면들을 참조하여 본 발명의 실시예에 관하여 상세히 설명하기로 한다.

[도 1의 설명]

도 1은 멀티코덱, 멀티 채널 기반으로 음성, 이미지, 텍스트를 채널별로 스트리밍 서비스하기 위한 통시통역 서비스 제공 시스템 및 방법에 대한 전체 구성도이다.

도 1을 참조하면, 본 발명의 실시예에 따른 동시통역 서비스 제공 시스템은, 동시통역 서비스 정보 인코딩부(100), 멀티 채널 다중화부(200), 스트리밍 서버(300), 멀티 채널 역다중화부(400), 동시통역 서비스 정보 디코딩부(500)를 포함한다.

동시통역 정보 인코딩부(100)는 통역사의 마이크로부터 전달되는 아날로그 음성을 디지털 음성으로 인코딩하고, 각 언어별 실시간 번역 텍스트 정보와, 이미지, 텍스트 기반의 각 언어별 컨퍼런스 안내 정보를 입력 받아 인코딩하여 패킷으로 변환한다.

여기서, 컨퍼런스 안내 정보는, 해당 컨퍼런스와 관련된 일정, 현재 진행 중인 강연과 관련된 정보(예를 들어, 강연자 약력, 저서, 주요 활동 등의 강연자 정보, 강연 내용에 포함된 레퍼런스 또는/및 참조자료에 관한 정보 및 이미지 파일 등), 네트워킹 가능한 참석자 정보 등을 포함할 수 있다.

멀티 채널 다중화부(200)는 각 언어별 인코딩된 채널 데이터(음성, 실시간 번역 텍스트, 컨퍼런스 안내 정보)를 다중화(Muxing)한다.

스트리밍 서버부(300)는 그 다중화된 통역 서비스 데이터 스트림을 사용자 단말(예를 들어, 회의 참석자 또는 청취자가 사용하는 단말)에 서비스한다.

그리고 멀티 채널 역다중화부(400)는 사용자 단말로부터 수신받은 통역 서비스 데이터 스트림에서 특정 언어 채널만을 선택하여 해당 채널의 통역 음성, 번역 텍스트, 컨퍼런스 안내 정보를 추출하여 음성은 디코딩하여 스피커로 출력하고, 번역 정보와 컨퍼런스 안내 정보는 화면 구성을 통해 사용자 화면에 표출하는 기능을 수행한다.

또한 동시통역 서비스 정보 디코딩부(500)는 사용자에 의해 선택된 채널에 대한 통역 음성, 번역 텍스트, 컨퍼런스 안내 정보를 언어 음성을 아날로그로 변환 출력하는 역할을 수행한다.

이하, 본 발명의 실시예에 따른 동시통역 서비스 제공 시스템과 관련된 각 구성요소들에 대해서, 도 2 내지 도 6을 참조하여 그 세부 구성을 보다 구체적으로 설명한다.

[도 2 - 동시통역 서비스 인코딩부의 설명]

도 2는 마이크의 아날로그 음성을 디지털 음성으로 변환하고, 각 언어별 텍스트 기반의 번역 정보와 각 언어별 컨퍼런스 안내 정보를 데이터화하기 위한 인코딩부의 일 구성도이다.

일 실시예에 의할 때, 본 발명에 적용될 동시통역 서비스 인코딩부(100)는 도 2에 도시한 바와 같이, 크게 각 언어별 동시통역 음성 인코딩부(110), 각 언어별 실시간 번역 정보 인코딩부(120), 각 언어별 컨퍼런스 안내 정보 인코딩부(130)을 포함할 수 있다.

여기서, 각 언어별 동시통역 음성 인코딩부(110)는 아날로그 음성 버퍼(112), 코덱 선택기(113), 코덱 처리부(115), 인코딩 음성 버퍼(116)를 포함할 수 있다.

아날로그 음성 버퍼(112)는 통역사의 마이크로부터 출력되는 아날로그 음성이 저장되는 음성 저장소이며, 코덱 선택기(113)는 MPEG2, AAC, MP3 등 다양한 코덱 중에서 아날로그 음성을 디지털 음성으로 변환하기 위한 코덱을 선택하는 역할을 수행한다. 여기서, 오디오 코덱은 시스템 관리자에 의해 설정된 설정 값에 의해 선택이 이루어질 수 있다. 또한, 본 발명에서 오디오 코덱은 전술한 MPEG2, AAC, MP3에 한정되는 것이 아니며, 음성 신호의 인코딩에 이용될 수 있는 오디오 코덱은 별다른 제한 없이 모두 이용 가능할 것임은 물론이다.

코덱 처리부(115)는 코덱 선택기 값에 따라 선택된 코덱을 이용하여, 통역사의 아날로그 음성을 디지털 음성으로 변환하는 역할을 수행한다. 여기서, 인코딩 음성 버퍼(116)는 변환된 디지털 음성(즉, 코덱 처리부(115)에 의해 처리된 인코딩된 음성)이 저장되는 음성 저장소이다.

그리고 각 언어별 실시간 번역 정보 인코딩부(120)는 번역 텍스트 실시간 입력부(121)와 유효한 텍스트만을 추출하여 패킷화하기 위한 텍스트 패킷화부(123), 패킷화된 데이터를 저장하기 위한 번역 정보 인코딩 데이터 버퍼(124)를 포함할 수 있다.

여기서, 번역 텍스트 실시간 입력부(121)는 강사의 말을 실시간으로 번역하여 입력 프로그램을 이용하여 번역된 텍스트를 입력하며, 텍스트 패킷화부(123)는 입력된 텍스트 중에 스트리밍 전송하기에 부적합한 데이터를 필터링하여 유효한 데이터만을 추출하며, 스트리밍 서비스를 위한 데이터 패킷을 생성하여 인코딩 버퍼(124)에 저장한다

그리고 각 언어별 컨퍼런스 안내 정보 인코딩부(130)는 컨퍼런스 정보 입력부(131), 텍스트 입력부(132), 이미지 편집부(133), 안내정보를 일정 주기로 전송하기 위한 스케쥴러(134), 안내정보를 스트리밍 서비스하기 위한 데이터로 처리하기 위한 채널 정보 패킷화부(135), 패킷화된 데이터를 저장하기 위한 컨퍼런스 정보 인코딩 데이터 버퍼(136)를 포함할 수 있다.

여기서, 컨퍼런스 정보 입력부(131)은 텍스트 기반의 안내 정보를 편집하기 위한 텍스트 입력부(132)와 이미지 기반의 안내 정보를 편집하기 위한 이미지 편집부(133)로 구성될 수 있다. 이때, 컨포런스 정보는 실시간 데이터가 아니므로 단말 시스템 입장에서는 한번만 데이터를 받으면 되기 때문에 지속적으로 데이터를 전송할 필요가 없으므로, 네트워크 부하를 고려하여 스케쥴러(134)에서 일정 주기 단위로 안내 정보 전송을 위한 채널 정보 패킷화(135) 작업을 수행하여 컨퍼런스 정보 인코딩 데이터 버퍼(136)로 저장할 수 있다.

[도 3 - 멀티 채널 다중화부의 설명]

도 3은 각 언어별 통역 음성과 번역 정보, 컨퍼런스 안내 정보를 다중화하여 하나의 전송 스트림으로 다중화하기 위한 멀티 채널 다중화부의 일 구성도이다.

본 발명의 실시예에서, 멀티 채널 다중화부(200)는 도 3에 도시한 바와 같이, 각 언어별(즉, 채널 별)로 동시통역 서비스 정보 인코딩부(100)를 통해 처리된 음성 데이터를 저장하는 디지털 채널 데이터 버퍼 저장소(201, 202, 203, 204)와, 시간 단위로 각 채널 데이터를 다중화하기 위한 타이머(206)와, 타이머에 의한 각 언어별 채널 데이터를 선택하기 위한 채널 선택부(205)와, 그 각 채널을 다중화(Muxing)하기 위한 채널 다중화 처리부(207)와, 다중화(Muxing) 처리된 채널 데이터가 저장되는 멀티채널 통역 서비스 데이터 스트림(Transport Stream) 버퍼(208)를 포함할 수 있다.

여기서, 디지털 채널 데이터 버퍼 저장소(201, 202, 203, 204)는 각 언어별로 각각 저장소를 가지고 있으며, 인코딩 처리된 디지털 채널 데이터가 저장된다. 타이머(206)는 각 언어별 음성을 다중화(Muxing)하기 위한 주기를 설정하기 위한 값이 설정되어 있으며, 채널 선택부(205)는 타이머 값에 따라 각 언어별 음성 데이터를 일정 부분씩 추출하여 채널 다중화 처리부(207)에 제공하는 역할을 수행한다.

그리고 채널 다중화 처리부(207)는 채널 선택부(205)를 통해 입력된 통역음성, 번역 정보, 컨퍼런스 안내 정보를 포함하는 채널 데이터를 전송 스트림(Transport Stream) 규격에 맞도록 다중화(Muxing) 처리하며, 처리된 결과를 멀티 채널 통역 서비스 데이터 스트림 버퍼 저장소(208)에 저장한다. 여기서, 전송 스트림(Transport Stream)은 MPEG2-TS 표준 규격을 따를 수 있다.

[도 4 - 스트리밍 서버부의 설명]

도 4는 다중화된 멀티 채널 통역 서비스 데이터 스트림을 스마트폰 단말에 서비스하기 위한 스트리밍 서버부의 일 구성도이다.

도 4에서는 멀티 채널 통역 서비스 데이터 스트림 버퍼(208)를 멀티 채널 다중화부(200) 외부에 존재하는 것과 같이 도시하였지만, 이는 도 4의 설명의 편의를 위한 것일 뿐, 멀티 채널 통역 서비스 데이터 스트림 버퍼(208)는 도 3에 도시된 바와 같이 멀티 채널 다중화부(200) 내에 존재하는 구성요소임을 먼저 명확히 한다.

스트리밍 서버부(300)는 멀티 채널 다중화부(200)에서 처리된 멀티 채널 통역 서비스 데이터 스트림 버퍼(208)에 있는 음성 데이터를 스트리밍 서버(300)에 접속한 각 스마트폰 단말(예를 들어, 회의 참석자 또는 청취자가 사용하는 스마트폰 단말일 수 있음)에 전송 스트림(Transport Stream)을 전달하는 역할을 한다. 이와 같이 본 명세서에서는 그 설명의 편의를 위해, 스마트폰 단말의 경우를 중심으로 설명하지만, 회의 참석자 또는 청취자 등이 사용하는 사용자 단말은 반드시 스마트폰에 한정되어야 할 필요는 없음은 물론이다. 이하, 스트리밍 서버(300)의 구성례를 상세히 설명한다.

본 발명의 실시예에서, 스트리밍 서버부(300)는 도 4에 도시한 바와 같이, 각 스마트폰 단말의 접속 및 세션을 관리하기 위한 세션 관리자(301)와, 스마트폰 단말과 통신을 담당할 세션 연결부(302)와, 각 세션별로 전송 스트림(Transport Stream) 전송을 위한 세션 버퍼(303)를 포함할 수 있다.

여기서, 세션 관리자(301)는 스마트폰 단말의 접속 여부를 체크하며, 접속이 이루어졌을 시에 새로운 세션을 단말에 할당한다. 또한 세션 관리자(301)는, 세션 연결부(302)에 스마트폰 단말과의 데이터 통신 역할을 전담시키고, 다시 스마트폰 단말의 접속을 계속해서 체크한다.

그리고 세션 연결부(302)는, 스마트폰 단말의 세션 연결부(304)와 실질적 데이터 통신 업무를 담당하며, 단말 세션 연결부(304)의 데이터 요청 시에 멀티 채널 스트림 버퍼(208)에 있는 음성 데이터를 세션 버퍼(303)에 복사하여 단말에 전송하며, 단말의 세션 연결부(304)는 수신 받은 음성 데이터를 단말의 수신 버퍼(305)에 저장한다.

즉, 본 발명의 실시예에서, 스트리밍 서버(300)는, 세션 연결된 스마트폰 단말 측에서 데이터 요청하였을 경우, 멀티 채널 다중화부(200)의 멀티 채널 음성 스트림 버퍼(208)에 저장된 음성 스트림을, 그 데이터 요청한 스마트폰 단말로 전송하여 주는 역할을 수행하는 것이다.

[도 5 - 멀티 채널 역다중화부의 설명]

도 5는 스마트폰 단말에서 수신 받은 멀티 채널 통역 서비스 데이터 스트림 중에서 청취하고자하는 특정 채널 정보만을 추출하는 멀티 채널 역다중화부의 일 구성도이다.

본 발명의 실시예에서, 멀티 채널 역다중화부(400)는 도 5에 도시한 바와 같이, 사용자가 청취하고 싶은 언어를 설정할 수 있는 채널 선택부(401)와, 멀티 채널 음성 스트림에서 사용자가 선택한 채널 부분의 데이터만 추출하는 채널 추출부(402)와, 추출된 특정 언어의 데이터가 저장될 음성 채널 버퍼(403, 404, 405, 406)를 포함할 수 있다.

여기서, 채널 선택은, 스마트폰 사용자가 자신이 청취하고자 하는 특정 언어를 응용 프로그램을 통해 선택하면, 그 채널 입력 값이 채널 선택부(401)에 설정되는 방식 등에 의해 이루어질 수 있다. 이 경우, 채널 추출부(402)는 채널 선택부(401)에 설정된 값을 참조하여 단말 수신 버퍼(305)에서 설정된 음성 언어만을 추출하여 음성 채널 버퍼(403, 404, 405, 406)에 저장한다.

즉, 본 발명의 실시예에서, 멀티 채널 역다중화부(400)는, 스마트폰 단말로부터 그 단말 수신 버퍼에 저장된 멀티 채널의 통역 서비스 데이터 스트림과 채널 입력(즉, 언어 선택)을 수신한 경우, 멀티 채널 음성 스트림을 사용자에 의해 입력(선택)된 언어(즉, 채널)에 근거하여 역다중화하는 역할을 수행하는 것이다.

그리고 멀티 채널 역다중화부(400)는, 상기 청취 선택 언어에 상응하여 음성 부분을 추출하는 음성 데이터 추출부(407), 상기 청취 선택 언어에 상응하여 번역 텍스트 부분을 추출하는 번역 데이터 추출부(408), 상기 청취 선택 언어에 상응하여 컨퍼런스 안내 정보 부분을 추출하는 채널 정보 데이터 추출부(409)를 포함할 수 있다. 또한 각 추출부들에 대응하여, 추출된 음성 데이터가 저장되는 음성 데이터 버퍼(410), 추출된 번역 정보가 저장되는 번역 정보 버퍼(411), 추출된 컨퍼런스 안내 정보가 저장되는 채널 정보 데이터 버퍼(412)를 포함할 수 있다.

[도 6 - 동시통역 서비스 정보 디코딩부의 설명]

도 6은 디지털 채널 정보를 각 데이터별로 추출하며 통역 음성을 아날로그 음성으로 디코딩하고, 패킷화된 번역 정보를 디코딩하여 번역 텍스트 정보를 추출하고, 패킷회된 컨퍼런스 안내 정보를 디코딩하여 컨퍼런스 안내를 위한 텍스트와 이미지 정보를 추출하고 화면에 표출하는 동시통역 디코딩부의 일 구성도이다.

본 발명의 실시예에서, 동시통역 서비스 정보 디코딩부(500)는 도 6에 도시한 바와 같이, 멀티 채널 역다중화부(400)에서 추출된 특정 채널 버퍼에 있는 통역 음성 데이터를 디코딩하기 위한 각 언어별 동시통역 음성 디코딩부(510)와 각 언어별 실시간 번역 정보 디코딩부(520), 각 언어별 컨퍼런스 안내 정보 디코딩부(530)를 포함한다.

여기서 각 언어별 동시통역 음성 디코딩부(510)는 코덱 처리부(511), 디코딩 코덱 선택을 위한 코덱 선택기(513), 디코딩된 아날로그 음성을 저장할 아날로그 음성 버퍼(514)를 포함할 수 있다.

여기서, 코덱 선택기(513)는 음성 채널 버퍼(410)에 있는 코덱 정보를 확인하여 해당하는 코덱을 설정하며, 코덱 처리부(511)는 설정 코덱을 이용하여 음성 채널 언어를 디코딩한 후 아날로그 음성 버퍼(514)로 저장하여, 스피커로 음성이 출력되도록 한다.

즉, 본 발명의 실시예에서, 각 언어별 동시통역 음성 디코딩부(510)는, 멀티 채널 역다중화부(400)의 각 음성 데이터 버퍼(410)에 저장된 언어 음성 데이터를 대응된 코덱(즉, 앞서 해당 언어의 음성 신호가 인코딩되었을 때의 오디오 코덱에 상응하는 코덱)으로 디코딩하는 역할을 수행하는 것이다. 따라서 동시통역 음성 디코딩부(510)를 거치면, 채널(즉, 언어) 별로 아날로그 음성(즉, 원래의 통역사의 음성)이 복원되게 된다. 이와 같이 복원된 아날로그 음성은 그 채널 별로 해당 채널을 선택한 사용자의 스마트폰 단말의 스피커를 통해 출력될 수 있는 것이다.

또한 각 언어별 실시간 번역 정보 디코딩부(520)는 수신 받은 번역 데이터 버퍼에 있는 패킷을 분석하는 번역 정보 패킷 분석부(521), 분석 후 번역 텍스트 정보를 추출하는 번역 정보 추출부(522), 추출된 텍스트 데이터를 화면에 표출하기 위한 번역 정보 화면 표출부(523), 화면에 표출되는 내용을 실시간으로 변경하기 위한 화면 업데이트 처리부(524)를 포함한다.

여기서 번역 정보 패킷 분석부(521)은 멀티 채널 역다중화기(400)을 통해 생성된 번역 정보 데이터 버퍼(411)에 있는 데이터를 패킷단위로 분석하며, 번역 정보 추출부(522)에서 실제 번역된 텍스트 데이터를 추출해낸다. 이 추출된 데이터는 번역 정보 화면 표출부(523)를 통해 화면에 표출되며, 화면 업데이트 처리부(524)에서 패킷을 도달할때마다 실시간으로 화면에 출력되는 번역 정보를 업데이트 하도록한다.

또한 각 언어별 컨퍼런스 안내 정보 디코딩부(530)는 채널 정보 데이터 버퍼(412)에 있는 데이터를 분석하는 채널 정보 패킷 분석부(531), 이미지 정보 추출부(532), 텍스트 정보 추출부(533), 채널 정보 화면 표출부(534)를 포함한다.

여기서, 채널 정보 패킷 분석부(531)는 멀티 채널 역다중화기(400)을 통해 생성된 채널 정보 데이터 버퍼(412)에 있는 컨퍼런스 안내 패킷 데이터를 분석하고 이미지 정보 추출부(532)와 텍스트 정보 추출부(533)에서 각각 이미지 안내 정보와 텍스트 안내 정보를 추출한다. 추출된 이미지, 텍스트 정보는 채널 정보 화면 표출부(534)를 통해 이미지와 텍스트를 조합한 화면 구성으로 단말 시스템 화면에 표출된다.

본 발명의 멀티코덱, 멀티 채널 기반으로 음성, 이미지, 텍스트를 채널별로 스트리밍 서비스하기 위한 통시통역 제공 시스템 및 방법은 전술한 실시예에 국한되지 않고 본 발명의 기술 사상이 허용하는 범위에서 다양하게 변형하여 실시할 수가 있다. 즉, 이상에서는 본 발명의 실시예를 참조하여 설명하였지만, 해당 기술 분야에서 통상의 지식을 가진 자라면 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 쉽게 이해할 수 있을 것이다.

Claims

통역사의 마이크로부터 수신된 아날로그 음성을 디지털 음성으로 변환하고, 각 통역 음성을 텍스트로 실시간 입력하고, 각 언어별 컨퍼런스 안내 정보를 이미지 및 텍스트 중 적어도 하나를 이용하여 편집하는 동시통역 서비스 정보 인코딩부;

상기 동시통역 서비스 정보 인코딩부에 의해 처리된 다국어의 통역 서비스 데이터를 다중화(Muxing)하는 멀티 채널 다중화부;

상기 멀티 채널 다중화부에 의해 다중화된 멀티 채널 통역 서비스 데이터 스트림을 세션 연결된 사용자 단말에 전송하는 스트리밍 서버;

상기 사용자 단말로부터 멀티 채널 데이터 스트림 및 청취 선택 언어를 수신하고, 수신된 멀티 채널 통역 서비스 데이터 스트림으로부터 상기 청취 선택 언어에 해당하는 디지털 데이터를 추출하는 멀티 채널 역다중화부; 및

상기 멀티 채널 역다중화부에 의해 추출된 디지털 음성 데이터를 아날로그 음성으로 변환하고, 실시간 번역 텍스트 및 컨퍼런스 안내 정보 데이터를 추출하고 분석하여 화면에 표출하는 동시통역 서비스 정보 디코딩부

를 포함하는 동시통역 서비스 제공 시스템.
제1항에 있어서, 상기 동시통역 서비스 정보 인코딩부는,

상기 통역사의 마이크로부터 출력되는 아날로그 음성이 저장되는 아날로그 음성 버퍼;

미리 저장된 복수개의 코덱 중 상기 아날로그 음성을 디지털 음성으로 변환하기 위한 코덱을 선택하는 코덱 선택기;

상기 코덱 선택기에 의해 선택된 코덱을 이용하여, 상기 통역사의 아날로그 음성을 디지털 음성으로 변환하는 코덱 처리부;

상기 변환된 디지털 음성이 저장되는 인코딩 음성 버퍼;

해당 언어의 통역사 음성을 텍스트 기반으로 실시간 입력하는 번역 텍스트 실시간 입력부;

입력된 텍스트를 필터링하여 유효한 데이터만을 추출하고 패킷화하여 저장하는 번역 정보 인코딩 버퍼;

각 언어별 텍스트 기반의 컨퍼런스 안내 정보를 입력하는 텍스트 입력부;

이미지 기반의 컨퍼런스 안내 정보를 편집하기 위한 이미지 편집부;

상기 텍스트 입력부와 상기 이미지 편집부에서 처리된 데이터를 패킷화하여 저장하기 위한 채널 데이터 버퍼; 및

입력되는 데이터를 일정 주기로 전송하기 위한 스케쥴러를 포함하는, 동시통역 서비스 제공 시스템.
제1항에 있어서, 상기 멀티 채널 다중화부는,

각 언어별로 상기 멀티 코덱 인코딩부를 통해 처리된 디지털 음성을 저장하는 디지털 채널 데이터 버퍼 저장소;

미리 지정된 시간 단위로 각 언어별 통역 음성, 번역 텍스트, 컨퍼런스 안내 정보 데이터를 다중화하기 위한 주기를 설정하고 있는 타이머;

상기 타이머에 설정된 주기 값에 따라 각 언어별 통역 음성과 번역 텍스트, 컨퍼런스 안내 정보를 선택하는 채널 선택부;

각 채널의 디지털 데이터를 다중화(Muxing)하는 채널 다중화 처리부; 및

상기 다중화(Muxing) 처리된 데이터가 저장되는 멀티 채널 통역 서비스 데이터 스트림 버퍼를 포함하는, 동시통역 서비스 제공 시스템.
제1항에 있어서, 상기 스트리밍 서버는,

음성, 이미지, 텍스트 기반의 통역 서비스 정보를 제공받고자 하는 각 사용자의 사용자 단말과의 접속 및 세션을 관리하기 위한 세션 관리자;

상기 사용자 단말과 통신을 담당하는 세션 연결부; 및

각 세션 별로 전송 스트림(Transport Stream) 전송을 위한 세션 버퍼를 포함하는, 동시통역 서비스 제공 시스템.
제1항에 있어서, 상기 멀티 채널 역다중화부는,

상기 사용자 단말로부터 수신된 상기 청취 선택 언어가 설정되는 채널 선택부;

상기 사용자 단말로부터 수신된 멀티 채널 데이터 스트림에서 상기 사용자가 선택한 언어에 상응하는 채널의 데이터를 추출하는 채널 추출부;

상기 청취 선택 언어에 상응하여 음성 부분을 추출하는 음성 데이터 추출부;

상기 청취 선택 언어에 상응하여 번역 텍스트 부분을 추출하는 번역 데이터 추출부;

상기 청취 선택 언어에 상응하여 컨퍼런스 안내 정보 부분을 추출하는 채널 정보 데이터 추출부;

추출된 음성 데이터가 저장되는 음성 데이터 버퍼;

추출된 번역 정보가 저장되는 번역 정보 버퍼; 및

추출된 컨퍼런스 안내 정보가 저장되는 채널 정보 데이터 버퍼를 포함하는, 동시통역 서비스 제공 시스템.
제1항에 있어서, 상기 동시통역 서비스 정보 디코딩부는,

상기 멀티 채널 역다중화부에서 추출된 특정 채널 버퍼에 있는 데이터를 디코딩하기 위한 코덱 처리부;

디코딩 코덱 선택을 위한 코덱 선택기;

디코딩된 아날로그 음성을 저장할 아날로그 음성 버퍼;

멀티 채널 역다중화부에 의해 추출된 실시간 번역 텍스트 정보를 수집하는 번역 정보 추출부;

상기 멀티 채널 역다중화부에 의해 추출된 컨퍼런스 채널 정보를 수집하는 채널 정보 추출부;

번역 정보를 화면에 표출하기 위한 번역 정보 화면 표출부; 및

컨퍼런스 안내 정보를 화면에 표출하기 위한 채널 정보 화면 표출부를 포함하는, 동시통역 서비스 제공 시스템.
동시통역 서비스 제공 시스템을 통한 동시통역 서비스 제공 방법으로서,

(a) 각기 다른 언어로 통역하는 각각의 통역사의 마이크로부터 수신된 각각의 아날로그 음성을 디지털 음성으로 각각 인코딩하고, 텍스트 기반의 번역 정보 입력 및 컨퍼런스 안내 정보를 편집하여 저장하는 단계;

(b) 인코딩된 통역 음성, 번역 정보, 컨퍼런스 안내 정보에 관한 데이터를 다중화 처리하는 단계;

(c) 다중화 처리된 멀티 채널 서비스 데이터 스트림을 세션 연결된 사용자 단말로 전송하는 단계;

(d) 상기 사용자 단말로부터 수신된 멀티 채널 서비스 데이터 스트림을 역다중화 처리하여, 상기 사용자 단말에 의해 선택된 청취 선택 언어에 상응하는 디지털 음성 데이터와 번역 텍스트 데이터, 컨퍼런스 안내 정보 데이터를 추출하는 단계; 및

(e) 상기 추출된 디지털 음성 데이터를 아날로그 음성으로 디코딩하고, 번역 텍스트 정보와 컨퍼런스 안내 정보를 화면에 표출하는 단계

를 포함하는 동시통역 서비스 제공 방법.
제7항에 있어서, 상기 (c) 단계는,

상기 사용자 단말과의 접속 및 세션을 설정하는 단계 및

상기 사용자 단말로부터 데이터 전송 요청이 수신되는 경우, 연결된 세션을 이용하여 상기 멀티 채널 서비스 데이터 스트림을 상기 사용자 단말로 전송하는 단계를 포함하는, 동시통역 서비스 제공 방법.
제7항에 있어서, 상기 (d) 단계는,

상기 사용자 단말로부터 상기 청취 선택 언어를 수신하는 단계;

상기 사용자 단말로부터 멀티 채널 서비스 데이터 스트림을 수신하는 단계; 및

상기 수신된 청취 선택 언어 및 멀티 채널 서비스 데이터 스트림에 근거하여, 상기 청취 선택 언어에 상응하는 디지털 음성 및 번역 정보, 컨퍼런스 안내 정보에 관한 데이터를 각각 추출하는 단계를 포함하는, 동시통역 서비스 제공 방법.