KR102312798B1 - 강의통역 서비스장치 및 그 장치의 구동방법 - Google Patents

강의통역 서비스장치 및 그 장치의 구동방법 Download PDF

Info

Publication number
KR102312798B1
KR102312798B1 KR1020190044718A KR20190044718A KR102312798B1 KR 102312798 B1 KR102312798 B1 KR 102312798B1 KR 1020190044718 A KR1020190044718 A KR 1020190044718A KR 20190044718 A KR20190044718 A KR 20190044718A KR 102312798 B1 KR102312798 B1 KR 102312798B1
Authority
KR
South Korea
Prior art keywords
lecture
data
interpretation
interpretation service
instructor
Prior art date
Application number
KR1020190044718A
Other languages
English (en)
Other versions
KR20200122015A (ko
Inventor
신종우
Original Assignee
신한대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 신한대학교 산학협력단 filed Critical 신한대학교 산학협력단
Priority to KR1020190044718A priority Critical patent/KR102312798B1/ko
Publication of KR20200122015A publication Critical patent/KR20200122015A/ko
Application granted granted Critical
Publication of KR102312798B1 publication Critical patent/KR102312798B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/02Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Educational Administration (AREA)
  • Tourism & Hospitality (AREA)
  • Educational Technology (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • General Business, Economics & Management (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)

Abstract

본 발명은 강의통역 서비스장치 및 그 장치의 구동방법에 관한 것으로서, 본 발명의 실시예에 따른 강의통역 서비스장치는, 강의를 진행하는 교수자의 교수자별 강의 특성이 반영된 강의 데이터를 저장하는 저장부, 및 강의에 참석한 학습자가 지정 교수자의 강의에 대한 통역을 요청할 때, (기)저장한 지정 교수자의 강의 데이터를 근거로 통역 서비스를 제공하는 제어부를 포함할 수 있다.

Description

강의통역 서비스장치 및 그 장치의 구동방법{Apparatus for Lecture Interpretated Service and Driving Method Thereof}
본 발명은 강의통역 서비스장치 및 그 장치의 구동방법에 관한 것으로서, 더 상세하게는 가령 전문영역에서 빈번하게 발생하는 통역 오류를 개선하려는 강의통역 서비스장치 및 그 장치의 구동방법에 관한 것이다.
최근 들어 음성인식 기술의 향상으로 인해 스마트폰을 이용한 자동통역 기능이 널리 사용되고 있으며, 많은 어플리케이션들이 다국어 서비스를 지원하고 있다. 특히, 향상된 음성인식 성능과 다국어 지원은 자동통역에 대한 기대를 높이고 있으며, 아주 일상적인 대화에 있어서 사용자들에게 충분히 만족할 만한 기술이 제공되어지고 있다. 한편, 가령 타국 대학교에서는 다양한 국가에서 유학을 온 학생들이 많이 있으나 이러한 학생들에게 학교 수업을 들을 수 있을 정도의 외국어 실력을 요구하기에는 많은 시간을 필요로 한다. 따라서, 이러한 상황에서 가령 모국어(예: 한국어) 교육만을 진행하는 경우 실제 전공과목에 대한 학습이 제대로 이루어지 못하는 문제가 빈번하다.
그런데, 기존의 통역기의 경우 일상 대화 수준에서의 통역은 가능하나 강의 등과 같은 특수한 상황에서의 실제 통역은 강의 내용의 전문영역에 따라 통역에 상당한 오류가 발생하고 있어 실제 사용에 어려움이 많다.
한국등록특허공보 제10-1959439호(2019.03.12.) 한국공개특허공보 제10-2019-0015081호(2019.02.13.)
본 발명의 실시예는 가령 전문영역에서 빈번하게 발생하는 통역 오류를 개선하려는 강의통역 서비스장치 및 그 장치의 구동방법을 제공함에 그 목적이 있다.
본 발명의 실시예에 따른 강의통역 서비스장치는, 강의를 진행하는 교수자의 교수자별 강의 특성이 반영된 강의 데이터를 저장하는 저장부, 및 강의에 참석한 학습자가 지정 교수자의 강의에 대한 통역을 요청할 때, 상기 저장한 지정 교수자의 강의 데이터를 근거로 통역 서비스를 제공하는 제어부를 포함한다.
상기 제어부는, 상기 지정 교수자의 과목이 추가로 선택되면, 상기 선택된 과목의 강의 데이터를 근거로 상기 통역 서비스를 제공할 수 있다.
상기 제어부는, 상기 강의 데이터로서 교수자가 사용하는 전문용어, 상기 전문용어의 발음, 기준값 이상으로 사용하는 문구 및 대화체 중 적어도 하나를 상기 저장부에 저장시킬 수 있다.
상기 제어부는, 상기 통역 서비스의 요청이 있을 때 상기 지정 교수자의 음성을 취득하여 상기 취득한 음성의 인식 결과를 근거로 상기 지정 교수자를 판단해 상기 통역 서비스를 제공할 수 있다.
상기 강의통역 서비스장치는, 상기 교수자의 단말장치로부터 강의가 녹화된 음성 파일을 수신하는 통신 인터페이스부를 더 포함하며, 상기 제어부는, 상기 수신한 음성 파일을 분석해 상기 강의 데이터를 생성하며, 상기 생성한 강의 데이터를 지정 시간 간격으로 학습하여 학습 결과를 근거로 상기 통역 서비스를 제공할 수 있다.
또한, 본 발명의 실시예에 따른 강의통역 서비스장치의 구동방법은, 저장부 및 제어부를 포함하는 강의통역 서비스장치의 구동방법으로서, 강의를 진행하는 교수자의 교수자별 강의 특성이 반영된 강의 데이터를 상기 저장부에 저장하는 단계, 및 강의에 참석한 학습자가 지정 교수자의 강의에 대한 통역을 요청할 때, 상기 제어부가, 상기 저장한 지정 교수자의 강의 데이터를 근거로 통역 서비스를 제공하는 단계를 포함한다.
상기 제공하는 단계는, 상기 지정 교수자의 과목이 추가로 선택되면, 상기 선택된 과목의 강의 데이터를 근거로 상기 통역 서비스를 제공할 수 있다.
상기 저장하는 단계는, 상기 강의 데이터로서 교수자가 사용하는 전문용어, 상기 전문용어의 발음, 기준값 이상으로 사용하는 문구 및 대화체 중 적어도 하나를 상기 저장부에 저장시킬 수 있다.
상기 제공하는 단계는, 상기 통역 서비스의 요청이 있을 때 상기 지정 교수자의 음성을 취득하여 상기 취득한 음성의 인식 결과를 근거로 상기 지정 교수자를 판단해 상기 통역 서비스를 제공할 수 있다.
상기 구동방법은, 상기 교수자의 단말장치로부터 강의가 녹화된 음성 파일을 수신하는 단계를 더 포함하며, 상기 제공하는 단계는 상기 수신한 음성 파일을 분석해 상기 강의 데이터를 생성하며, 상기 생성한 강의 데이터를 지정 시간 간격으로 학습하여 학습 결과를 근거로 상기 통역 서비스를 제공할 수 있다.
본 발명의 실시예에 따르면, 가령, 교수자의 음성발화 패턴 등의 특성 관련 데이터를 기저장한 후 이를 근거로 통역 서비스를 제공하므로, 전문영역 특히 대학 강의에서의 통역 오류는 획기적으로 줄어들게 될 것이다.
가령 타국에서 유학하는 유학생의 경우 대학 강의에서 교수자에게 특화된 통역 서비스를 이용하게 됨으로써 학업에 많은 도움이 될 것이고, 그 결과 학업 능률도 고양될 것이다. 교수자가 사용하는 전문용어나 교수자의 설명에 대한 정확한 통역이 이루어지므로 학습자의 이해도는 당연히 높아지게 될 것이다.
도 1은 본 발명의 실시예에 따른 강의통역 서비스시스템을 나타내는 도면,
도 2는 도 1의 강의통역 서비스를 설명하기 위한 도면,
도 3은 도 1의 강의통역 서비스장치의 세부 구조를 예시한 블록다이어그램, 그리고
도 4는 본 발명의 실시예에 따른 강의통역 서비스장치의 구동과정을 나타내는 흐름도이다.
이하, 도면을 참조하여 본 발명의 실시예에 대하여 상세히 설명한다.
도 1은 본 발명의 실시예에 따른 강의통역 서비스시스템을 나타내는 도면이며, 도 2는 도 1의 강의통역서비스를 설명하기 위한 도면이다.
도 1에 도시된 바와 같이, 본 발명의 실시예에 따른 강의통역 서비스시스템(90)은 교수자 단말장치(100), 학습자 단말장치(110), 통신망(120) 및 강의통역 서비스장치(130)의 일부 또는 전부를 포함한다.
여기서, "일부 또는 전부를 포함한다"는 것은 통신망(120)과 같은 일부 구성요소가 생략되어 단말장치(100, 110)와 강의통역 서비스장치(130)가 다이렉트 통신(예: P2P 통신)을 수행하거나, 강의통역 서비스장치(130)의 일부 또는 전부가 통신망(120) 내의 네트워크장치(예: 무선교환장치 등)에 통합되어 구성될 수 있는 것 등을 의미하는 것으로서, 발명의 충분한 이해를 돕기 위하여 전부 포함하는 것으로 설명한다.
교수자 단말장치(100)는 랩탑컴퓨터, 태블릿PC, 스마트폰, 마이크로폰 등의 단말장치를 포함하며, 본 발명의 실시예에 따른 통역 서비스를 위해 음성 파일 등의 강의 데이터를 제공하기 위한 전용 단말장치를 포함할 수 있다. 물론 여기서 강의 데이터는 신호 처리된 데이터(예: 가공된 데이터)를 포함할 수 있다. 가령, 교수자는 교수자 단말장치(100)를 통해 자신의 강의 과목에 대하여 통역 서비스가 제공될 수 있도록 강의 데이터를 제공한다. 이를 위하여 교수자는 강의 중에 교수자 단말장치(100)를 동작시킬 수 있다. 예컨대, 강의가 시작되는 초기에 어플리케이션(이하, 앱)을 실행하여 강의통역 서비스장치(130)에 접속한 후, 자신의 강의 내용, 더 정확하게는 강의에 대한 음성 파일이 강의 데이터로 활용되도록 강의통역 서비스장치(130)로 제공할 수 있다.
가령, 교수자 단말장치(100)를 사용하는 교수자는 강의통역 서비스장치(130)의 서비스 초기에는 강의 데이터의 확보를 위하여 많은 시간동안 강의 데이터를 제공할 수 있다. 물론, 교수자의 전문 용어의 사용이나, 전문용어의 발음, 또 자주 사용하는 문구나 대화체(예: 사투리) 등을 통해 교수자의 특성 가령 강의 패턴이 파악되어 강의통역 서비스장치(130)는 이를 근거로 통역 서비스를 제공하고, 강의 데이터가 점점 더 확보되는 경우에는 지속적인 학습, 가령 딥러닝을 통해 서비스의 품질을 높여갈 수 있을 것이다.
예를 들어, 교수자 단말장치(100)를 통해 교수자가 한 학기 동안의 특정 과목의 수업을 진행하게 될 때, 초기 1개월 정도의 수업에서 취득하는 강의 데이터를 근거로 타국의 학생들, 즉 유학생들에게 통역 서비스가 제공되도록 하기보다는 한해 전 수업에서 1년 동안 확보된 데이터를 근거로 통역 서비스를 제공하도록 하는 것이 통역 서비스의 정확도 측면에서는 더 좋을 것이다. 이와 같이, 교수자 단말장치(100)는 유학생 등에게 자신의 지정 과목 수업에 대한 정확한 내용 전달이 이루어지도록 하기 위해 서비스 목적에 부합한 강의 데이터를 제공한다고 볼 수 있다.
물론 본 발명의 실시예에서는 설명의 이해를 돕기 위하여 대학의 교수자와 학습자를 예로 들어 설명하지만, 다양하게 응용되어 적용될 수 있다. 예를 들어, 업무상 빈번히 만나는 외국의 바이어(buyer)들을 상대하거나, 해외 대리인들과 간헐적인 워크샵을 진행하거나, 해외에서 학회의 학술세미나 등을 진행하게 되는 경우에도, 지명도가 높은 인물이나 유명인사의 경우에는 해당 인물의 언어 구사 스타일을 파악하여 이를 근거로 통역 서비스가 제공되도록 할 수 있다. 따라서, 본 발명의 실시예에서는 서비스를 학습에 특별히 한정하지는 않을 것이다. 가령, 교수자 단말장치(100)가 아니라 하더라도, 인물의 음성을 취득하기 위하여 강당 등에 설치되어 있는 주변의 마이크로폰 등을 이용할 수 있을 것이다.
학습자 단말장치(110)는 통역 서비스를 제공할 수 있는 다양한 장치를 포함한다. 교수자 단말장치(100)와 마찬가지로 랩탑컴퓨터, 태블릿PC나 스마트폰, 나아가 해당 장치들에 연동하는 인공지능(AI) 스피커 등을 더 포함할 수 있다. 물론 통역 서비스를 제공하는 전용 단말을 더 포함할 수 있다. 예를 들어, 타국에서 유학하는 유학생들은 전공 과목의 수업에 참여하기 위하여 학습자 단말장치(110)를 통역기로서 사용할 수 있다. 이를 위하여, 학습자 단말장치(110)는 제품 출고시에 본 발명의 실시예에 따른 프로그램을 디폴트(default)로 포함하여 출시되거나 강의통역 서비스장치(130)에 접속하여 앱 등을 다운로드받아 실행시킬 수 있다.
학습자 단말장치(110)는 가령 앱의 실행에 따라 특정 과목의 수업에서의 교수자에 대한 통역 서비스를 제공할 수 있다. 물론 학습자 단말장치(110)는 강의통역 서비스장치(130)에 접속하여 스트리밍으로 서비스가 이루어질 수 있지만, 학습자 단말장치(110) 내의 프로그램을 통해 통역 서비스가 이루어질 수도 있을 것이다. 시스템 설계자의 의도에 따라 다양하게 설정될 수 있다. 예를 들어, 학습자 단말장치(110)의 자원(예: HW, SW 자원)은 강의통역 서비스장치(130)에 비하여 성능이 낮을 수 있다. 따라서, 정확하고 신속한 데이터 처리 등을 위해서는 강의통역 서비스장치(130)에서 이루어지는 것이 좋다. 반면, 일시적으로 통신망(120)이 불통되거나 부하가 발생하는 경우에는 서비스가 중단될 수 있다. 따라서, 이의 경우에는 통신망(120)의 상태에 따라 서비스 동작 주체가 변환되도록 할 수도 있다. 이와 같이 다양한 설계가 가능하므로, 본 발명의 실시예에서는 어느 하나의 방식에 특별히 한정하지는 않을 것이다.
통역 서비스를 요청할 때, 학습자는 강의 과목이나 교수자에 대한 기초적인 정보를 입력할 수 있지만, 앱의 실행과 함께 학습자 단말장치(110)는 자동으로 교수자의 음성을 마이크로폰을 통해 수신한 후 수신한 음성을 분석하여 분석 결과를 통해 해당 교수자를 판별하여 바로 통역 서비스를 진행할 수도 있다. 또한, 초기의 강의 내용을 수집하고 이를 분석하여 어떤 과목의 수업이 진행되는지 판단할 수도 있다. 이와 같이, 특정 과목의 교수자를 인식하여 통역 서비스를 진행하는 방식도 다양할 수 있으므로, 가령 교수자가 판단되면 이를 근거로 어떠한 과목의 수업인지를 학습자에게 물어 선택을 받는 것도 가능하다. 따라서, 본 발명의 실시예에서는 어느 하나의 방식에 특별히 한정하지는 않을 것이다.
학습자 단말장치(110)의 마이크로폰을 통해 수집되는 교수자의 강의 음성을 통역 프로그램을 통해 통역을 수행하여 다시 학습자 단말장치(110)의 스피커와 같은 음성출력부로 출력한다. 물론 음성출력부는 스피커일 수 있지만, 이어폰이나 헤드폰 등의 잭을 연결하기 위한 사용자 인터페이스 즉 연결부를 포함한다. 또한, 학습자 단말장치(110)는 별도의 통역 프로그램을 포함하지 않는다 하더라도 앱을 통해 수업시간 동안 수신되는 교수자의 음성신호를 실시간으로 강의통역 서비스장치(130)로 전송하고, 이를 통해 통역 서비스를 제공받는 것도 얼마든지 가능하므로, 본 발명의 실시예에서는 어느 하나의 방식에 특별히 한정하지는 않을 것이다.
통신망(120)은 유무선 통신망을 모두 포함한다. 가령 통신망(120)으로서 유무선 인터넷망이 이용되거나 연동될 수 있다. 여기서 유선망은 케이블망이나 공중 전화망(PSTN)과 같은 인터넷망을 포함하는 것이고, 무선 통신망은 CDMA, WCDMA, GSM, EPC(Evolved Packet Core), LTE(Long Term Evolution), 와이브로(Wibro) 망 등을 포함하는 의미이다. 물론 본 발명의 실시예에 따른 통신망(120)은 이에 한정되는 것이 아니며, 향후 구현될 차세대 이동통신 시스템의 접속망으로서 가령 클라우드 컴퓨팅 환경하의 클라우드 컴퓨팅망, 5G망 등에 사용될 수 있다. 가령, 통신망(120)이 유선 통신망인 경우 통신망(120) 내의 액세스포인트는 전화국의 교환국 등에 접속할 수 있지만, 무선 통신망인 경우에는 통신사에서 운용하는 SGSN 또는 GGSN(Gateway GPRS Support Node)에 접속하여 데이터를 처리하거나, BTS(Base Station Transmission), NodeB, e-NodeB 등의 다양한 중계기에 접속하여 데이터를 처리할 수 있다.
통신망(120)은 액세스포인트를 포함할 수 있다. 여기서의 액세스포인트는 건물 내에 많이 설치되는 펨토(femto) 또는 피코(pico) 기지국과 같은 소형 기지국을 포함한다. 여기서, 펨토 또는 피코 기지국은 소형 기지국의 분류상 단말장치(100, 110)를 최대 몇 대까지 접속할 수 있느냐에 따라 구분된다. 물론 액세스포인트는 단말장치(100, 110))와 지그비 및 와이파이 등의 근거리 통신을 수행하기 위한 근거리 통신모듈을 포함한다. 액세스포인트는 무선통신을 위하여 TCP/IP 혹은 RTSP(Real-Time Streaming Protocol)를 이용할 수 있다. 여기서, 근거리 통신은 와이파이 이외에 블루투스, 지그비, 적외선, UHF(Ultra High Frequency) 및 VHF(Very High Frequency)와 같은 RF(Radio Frequency) 및 초광대역 통신(UWB) 등의 다양한 규격으로 수행될 수 있다. 이에 따라 액세스포인트는 데이터 패킷의 위치를 추출하고, 추출된 위치에 대한 최상의 통신 경로를 지정하며, 지정된 통신 경로를 따라 데이터 패킷을 다음 장치, 예컨대 강의통역 서비스장치(130)로 전달할 수 있다. 액세스포인트는 일반적인 네트워크 환경에서 여러 회선을 공유할 수 있으며, 예컨대 라우터(router), 리피터(repeater) 및 중계기 등이 포함된다.
강의통역 서비스장치(130)는 사용자 기반의 통역 서비스를 제공한다. 여기서 "사용자 기반"이란 특히 강의를 업으로 하거나, 유명 인사의 경우를 의미할 수 있다. 이의 경우에 더욱 유용하게 활용될 수 있다. 강의통역 서비스장치(130)는 물론 도 1에서는 대학을 예로 들어 교수자 단말장치(100)를 통해 통역 서비스를 위한 강의 데이터를 수집하는 것을 설명하였지만, 유명 인사의 경우에는 과거에 이루어진 강의 영상을 통해 강의 데이터를 수집하여 해당 유명 인사나 강사의 강의 패턴 또는 스타일을 파악하고 이를 기초로 통역 서비스를 제공할 수도 있다.
예를 들어, 도 2에서 볼 수 있는 바와 같이, 강의통역 서비스장치(130)는 DB(130a)상에 교수자 A, B, C별로, 또 해당 교수자들의 과목별로 강의 데이터를 구분하여 저장하고, 해당 강의 데이터를 근거로 강의통역 서비스를 제공할 수 있다. 앞서 언급한 대로, 통역 서비스를 제공하기 위하여 강의통역 서비스장치(130)는 통역이 이루어져야 할 대상에 대한 데이터를 다양한 방법으로 수집하여 저장한 후 이를 근거로 통역 서비스를 제공함으로써 통역의 오류를 줄일 수 있게 되는 것이다.
다시 말해, 도 1의 학습자 단말장치(110)로부터 가령 도 2의 교수자 A의 a과목에 대한 지정이 있거나, 또는 음성인식을 통해 이를 인지한 경우라면, 강의통역 서비스장치(130)는 해당 정보를 기반으로 통역 서비스를 제공한다. 가령, 전공학과 교수들의 과목에 따른 전문용어, 전문용어의 발음, 자주 사용하는 문구 및 대화체 등을 학습하도록 하여 특정 수업의 통역을 위한 자료 즉 데이터를 획득한 후, 특정 과목에 대한 강의 진행시 학습자 단말장치(110)와 연결되어 가령 기존의 통역 모듈에 사전 학습된 특정 과목의 학습 모듈을 결합하여 강의 내용을 실시간으로 통역하도록 하는 것이다. 그 결과 전문 용어 및 특정 교수의 설명에 대한 유학생들의 이해도를 높일 수 있게 될 것이다.
강의통역 서비스장치(130)는 앞서 언급한 대로 교수자 단말장치(100)를 통해서만 강의 데이터를 생성하기 위한 자료 혹은 데이터를 수집하는 것이 아니라, 검색 포탈에 등록되어 있는 다양한 동영상 등을 통해 특정 인물의 강의 패턴 혹은 스타일을 파악할 수 있고, 이와 같이 다양한 경로를 통해 빅데이터를 생성하고, 또 생성한 빅데이터를 활용해 딥러닝 동작을 수행함으로써 사용자 기반의 통역 서비스를 제공함으로써 통역의 정확도를 높일 수 있게 된다. 예를 들어, 일부에 통역 오류가 있다 하더라도, 오류를 딥러닝을 통해 수정하여 추후에는 오류를 발생시키지 않도록 함으로써 통역의 정확도를 높여 유학생들이나 유명인사의 강의를 청취하는 관객들이 특정 인물의 강의 내용을 정확히 이해하는 데 도움을 줄 수 있다.
최근의 음성인식 기술은 말뭉치를 통해 문장을 파악하고 이와 같은 방식으로 자연어 수준의 언어를 처리하는 기술까지 달하고 있으므로, 사용자(예: 교수자)별로 특성을 반영해 넣음으로써 좀더 높은 퀄리티의 통역 서비스를 제공할 수 있게 될 것이다. 사람마다 지적 수준(intellectual standard)에 따라 구사하는 단어는 다를 수 있으며, 또 지방색이 반영되어 사투리를 구사할 수도 있는 등 동일한 단어나 문장을 발화하더라도 미세한 차이가 있기 마련이다. 이와 같이 강의통역 서비스장치(130)는 사용자들마다 미세하게 다른 언어 구사력을 판단하여 해당 데이터들을 DB(130a)에 DB화하고 이를 근거로 서비스를 제공한다. 예를 들어, 특정 사용자가 자주 구사하는 단어 "컨텐츠"는 DB(130a)의 "콘텐츠"라는 단어의 카테고리에 기록하고 이를 근거로 통역 서비스를 진행할 수 있을 것이다.
도 3은 도 1의 강의통역 서비스장치의 세부 구조를 예시한 블록다이어그램이다.
설명의 편의상 도 3을 도 1과 함께 참조하면, 본 발명의 실시예에 따른 강의통역 서비스장치(130)는 통신 인터페이스부(300), 제어부(310), 사용자기반 통역처리부(320) 및 저장부(330)의 일부 또는 전부를 포함한다.
여기서, "일부 또는 전부를 포함한다"는 것은 저장부(330)와 같은 일부 구성요소가 생략되어 구성되거나, 사용자기반 통역처리부(320)와 같은 일부 구성요소가 제어부(310)와 같은 다른 구성요소에 통합되어 구성될 수 있는 것 등을 의미하는 것으로서, 발명의 충분한 이해를 돕기 위하여 전부 포함하는 것으로 설명한다.
통신 인터페이스부(300)는 도 1의 통신망(120)을 경유하여 교수자 단말장치(100) 및 학습자 단말장치(110)와 통신을 수행한다. 통신을 수행하는 과정에서 통신 인터페이스부(300)는 변/복조, 인코딩/디코딩, 먹싱/디먹싱, 스케일링, 암호화/복호화 등의 다양한 동작을 더 수행할 수 있다. 이는 당업자에게 자명하므로 더 이상의 설명은 생략한다. 다만, 스케일링은 음성신호의 잡음을 제거하거나 증폭하는 등의 음성처리 동작을 포함할 수 있다.
통신 인터페이스부(300)는 제어부(310)의 제어하에 교수자 단말장치(100)와 통신을 수행하여 교수자의 강의 내용을 녹화한 음성 파일을 수신하여 전달할 수 있다. 또한, 통신 인터페이스부(300)는 교수자 단말장치(100)가 아니라 하더라도, 검색포털 사이트에서 해당 교수자의 녹화 동영상 등이 있는 경우에는 외부 장치와 통신을 수행하여 관련 동영상을 취득하여 제어부(310)로 전달할 수 있다. 해당 녹화 동영상은 교수자의 성명과 소속에 대한 부가 정보를 포함하고 있을 것이므로, 이를 활용하는 것이다.
나아가, 통신 인터페이스부(300)는 학습자 단말장치(110)의 요청이 있는 경우 통역 서비스를 위한 앱을 제공하거나, 앱의 실행에 따른 통역 서비스를 제공할 수 있다. 예를 들어, 학습자 단말장치(110)는 통역 서비스를 위한 앱이 실행될 때, 마이크로폰을 자동으로 턴온시켜 강의실에서 이루어지는 교수자의 수업에 대한 음성을 취득할 수 있다. 그리고, 취득한 음성신호를 도 1의 강의통역 서비스장치(130)로 전송함으로써 통신 인터페이스부(300)는 이를 수신할 수 있다.
그리고, 통신 인터페이스부(300)는 사용자기반 통역처리부(320)에서 제공하는 통역 서비스를 제어부(310)의 제어하에 학습자 단말장치(110)로 전송함으로써 학습자 단말장치(110)의 음성출력부를 통해 통역이 제공되도록 한다. 물론 여기서의 통역 서비스는 교수자의 강의 데이터, 더 정확하게는 교수자의 언어 구사 패턴 또는 음성발화 패턴 등을 근거로 제공되는 통역 서비스라 볼 수 있다.
제어부(310)는 강의통역 서비스장치(130)를 구성하는 통신 인터페이스부(300), 사용자기반 통역처리부(320) 및 저장부(330)의 전반적인 제어 동작을 담당한다. 가령 제어부(310)는 도 1의 통신망(120)을 경유하여 통역 서비스를 제공하기 위하여 사용자기반 통역처리부(320)를 실행시킨다. 예를 들어, 학습자 단말장치(110)의 앱을 통해 음성인식 결과가 제공되면 이를 근거로 지정 교수자를 판단하고, 해당 교수자에 매칭되는 데이터를 근거로 통역 서비스를 제공하는 것이다.
제어부(310)는 통역 서비스를 진행하는 과정에서 처리되는 다양한 정보나 데이터를 저장부(330)에 임시 저장한 후, 사용자기반 통역처리부(320)로 제공할 수 있다. 가령, 다수의 학습자로부터 서비스 요청이 있는 경우, 저장부(330)에 해당 쿼리(query)를 임시 저장한 후 순서대로 통역 서비스를 진행하게 되는 것이다.
한편, 도 3의 제어부(310)는 본 발명의 다른 실시예로서 CPU와 메모리를 포함할 수 있다. CPU와 메모리는 원칩화하여 형성될 수 있다. 여기서, CPU는 제어회로, 연산부(ALU), 명령어해석부 및 레지스트리 등을 포함하며, 메모리는 램을 포함할 수 있다. 제어회로는 제어동작을 담당하고, 연산부는 2진 비트정보를 연산하며, 명령어해석부는 제어회로가 인식 가능하도록 기계어의 해석동작을 담당하며, 가령 고급 언어를 기계어로 변환하는 동작을 수행하며, 레지스트리는 소프트웨어적인 데이터 저장에 관여한다. 명령어해석부와 관련한 소프트웨어는 크게 고급언어 프로그램, 고급언어를 기계어로 변환하는 프로그램(예: 인터프리터, 컴파일러 등), 기계어 프로그램을 포함할 수 있고, CPU는 해당 프로그램들과 연동할 수 있다. CPU는 시스템의 구동 초기에 가령 도 3의 사용자기반 통역처리부(320)에 저장되어 있는 프로그램을 복사하여 메모리에 로딩한 후 이를 실행시켜 데이터 처리 속도를 빠르게 증가시킬 수 있다.
사용자기반 통역처리부(320)는 통역 서비스를 위한 프로그램 가령 앱을 실행하여 서비스를 진행할 수 있고, 또 학습자 단말장치(110)로부터 제공되는 정보를 통해 지정 교수자나 특정 인물의 통역 서비스를 진행한다. 물론 수신되는 정보는 학습자가 직접 선택하여 제공하는 정보이거나 음성인식 결과일 수 있다. 따라서, 사용자기반 통역처리부(320)는 특정 인물에게 특화된 통역 서비스를 제공한다. 예를 들어, 한국 대학의 특정 교수자의 음성신호를 분석하여 해당 교수자의 특성을 고려한 통역 서비스를 제공하고, 한국어의 경우 영어로 통역 서비스를 제공할 수 있다. 물론 그러한 변환되는 언어는 학습자가 선택함으로써 가능할 수 있다.
예를 들어, 사용자기반 통역처리부(320)는 특정 교수자의 강의 데이터나 언어구사 패턴을 분석한 결과, 특정 전문 용어를 자주 사용하거나, 사투리를 많이 구사하는 경우라면 이에 대한 데이터를 이미 확보하고 있으므로 이를 근거로 정확한 단어를 찾아 이를 근거로 통역 서비스를 제공하는 것이다. 물론 이는 특정인에 대하여 지속적으로 데이터를 수집하여 확보하고 있는 빅데이터를 근거로 통역 서비스를 제공하므로, 그만큼 정확도가 높아지게 된다.
사용자기반 통역처리부(320)는 특정인의 음성신호가 수신되면, 이를 인식하는 동작을 수행할 수 있다. 음성신호를 인식한 후, 인식결과를 텍스트화하며, 이의 과정에서 문장 기반으로, 가령 문장은 단문, 중문, 복문, 혼합문을 포함할 수 있는데, 이러한 문장을 텍스트화하고, 텍스트화한 문장은 DB(130a)에서 그에 매칭되는 선택 언어를 검색하여 이를 다시 음성으로 변환하여 학습자 단말장치(110)로 제공하게 된다. 예를 들어, "이번 강의에서는 틀니에 대하여 살펴보겠습니다"라는 문장에 대한 통역 서비스를 제공할 때, 이의 음성신호를 분석하여, 물론 음성과 함께 텍스트가 함께 제공되는 경우라면 음성신호를 분리하지 않고, 해당 텍스트를 바로 이용할 수 있지만, 통상 TV 방송의 경우에는 자막에 대한 정보가 제공되므로 이를 이용하는 것이 가능할 수 있지만, 본 발명의 실시예에서는 이러한 상황보다는 현장에서 직접 이루어지는 통역이므로, 음성신호를 수신하여 수신한 음성신호를 분석하여 한국어 문장을 판단하고, 그 텍스트화된 문장을 다시 DB(130a)로부터 검색하여 해당 문장에 매칭되는 영어 등의 언어를 찾게 된다. 그 다음, 해당 언어의 음성신호를, 또는 한국어 문장을 바로 영어 문장으로 변환하면서 해당 변환된 영어 문장의 음성신호를 학습자 단말장치(110)로 전송하게 되는 것이다.
저장부(330)는 제어부(310)의 제어하에 처리되는 다양한 정보나 데이터를 저장한다. 정보는 단순한 제어명령이나 응답명령이라면 데이터는 실질적인 정보가 담긴 음성파일 등의 음성신호를 의미할 수 있다. 데이터포맷상에 부가정보가 실질 데이터가 함께 포함되어 전송되는 경우, 이는 멀티플렉서에 의해 분리되어 제어부(310)의 제어하에 저장부(330)에 저장될 수 있다. 그리고, 분리된 실질 음성신호는 사용자기반 통역처리부(320)로 제공되어 인식결과에 따른 통역 서비스가 제공될 수 있을 것이다.
도 4는 본 발명의 실시예에 따른 강의통역 서비스장치의 구동과정을 나타내는 흐름도이다.
설명의 편의상 도 4를 도 1과 함께 참조하면, 본 발명의 실시예에 따른 강의통역 서비스장치(130)는 강의를 진행하는 교수자의 교수자별 강의 특성이 반영된 강의 데이터를 저장부에 저장한다(S400). 여기서, 강의 데이터는 강의를 진행하는 과정에서 교수자가 사용하는 전문용어, 전문용어의 발음, 자주 사용하는 문구 및 대화체 등에 대한 정보를 포함할 수 있다.
또한, 강의통역 서비스장치(130)는 강의에 참석한 학습자가 지정 교수자의 강의에 대한 통역을 요청할 때, 지정 교수자의 기저장된 강의 데이터를 근거로 통역 서비스를 제공한다(S410).
이와 같이, 본 발명의 실시예에 따른 강의통역 서비스장치(130)는 특히 학술용어가 많이 사용되는 대학과 같은 공간에서 가령 대학 교수 등에 대한 개개인의 특성을 알 수 있는 데이터를 근거로 통역 서비스를 제공함으로써 오류의 가능성을 가급적 배제시켜, 나아가서는 딥러닝과 같은 동작을 병행함으로써 거의 오류가 배제되는 통역 서비스를 제공할 수 있게 되는 것이다.
상기한 내용 이외에도 강의통역 서비스장치(130)는 다양한 동작을 수행할 수 있지만, 자세한 내용은 앞서 충분히 설명하였으므로 그 내용들로 대신하고자 한다.
한편, 본 발명의 실시예를 구성하는 모든 구성 요소들이 하나로 결합하거나 결합하여 동작하는 것으로 설명되었다고 해서, 본 발명이 반드시 이러한 실시 예에 한정되는 것은 아니다. 즉, 본 발명의 목적 범위 안에서라면, 그 모든 구성 요소들이 하나 이상으로 선택적으로 결합하여 동작할 수도 있다. 또한, 그 모든 구성요소들이 각각 하나의 독립적인 하드웨어로 구현될 수 있지만, 각 구성 요소들의 그 일부 또는 전부가 선택적으로 조합되어 하나 또는 복수 개의 하드웨어에서 조합된 일부 또는 전부의 기능을 수행하는 프로그램 모듈을 갖는 컴퓨터 프로그램으로서 구현될 수도 있다. 그 컴퓨터 프로그램을 구성하는 코드들 및 코드 세그먼트들은 본 발명의 기술 분야의 당업자에 의해 용이하게 추론될 수 있을 것이다. 이러한 컴퓨터 프로그램은 컴퓨터가 읽을 수 있는 비일시적 저장매체(non-transitory computer readable media)에 저장되어 컴퓨터에 의하여 읽혀지고 실행됨으로써, 본 발명의 실시 예를 구현할 수 있다.
여기서 비일시적 판독 가능 기록매체란, 레지스터, 캐시(cache), 메모리 등과 같이 짧은 순간 동안 데이터를 저장하는 매체가 아니라, 반영구적으로 데이터를 저장하며, 기기에 의해 판독(reading)이 가능한 매체를 의미한다. 구체적으로, 상술한 프로그램들은 CD, DVD, 하드 디스크, 블루레이 디스크, USB, 메모리 카드, ROM 등과 같은 비일시적 판독가능 기록매체에 저장되어 제공될 수 있다.
이상에서는 본 발명의 바람직한 실시 예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시 예에 한정되지 아니하며, 청구범위에 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어서는 안 될 것이다.
100: 교수자 단말장치 110: 학습자 단말장치
120: 통신망 130: 강의통역 서비스장치
300: 통신 인터페이스부 310: 제어부
320: 사용자기반 통역처리부 330: 저장부

Claims (6)

  1. 검색 포탈과 통신을 수행하는 강의통역 서비스장치로서,
    강의를 진행하는 교수자 A, B, C별로, 그리고 상기 교수자들의 과목별로 강의 특성이 반영된 강의 데이터를 저장하는 저장부; 및
    강의에 참석한 학습자가 지정 교수자의 강의에 대한 통역을 요청할 때, 상기 저장한 지정 교수자의 강의 데이터를 근거로 통역 서비스를 제공하는 제어부;를 포함하되,
    상기 제어부는,
    상기 강의 데이터로서 A, B, C 교수자의 과목에 따른 사용하는 전문용어, 상기 전문용어의 발음, 기준값 이상으로 사용하는 문구 및 사투리를 포함하는 대화체를 사용하고,
    상기 제어부는,
    특정 교수자의 강의 데이터나 언어구사 패턴을 분석한 결과, 특정 전문 용어를 기준값 이상으로 사용하거나, 사투리를 기준값 이상으로 구사하는 경우라면 이미 확보하고 있는 데이터를 근거로 단어를 찾아 상기 찾은 단어를 근거로 통역 서비스를 제공하며,
    상기 제어부는,
    상기 교수자의 단말장치로부터 상기 강의 데이터의 생성을 위한 자료 혹은 데이터를 수집하는 것 이외에 상기 검색 포탈에 등록되어 있는 동영상을 통해 특정 인물의 강의 패턴 혹은 스타일을 파악하여 빅데이터를 생성하고, 생성한 빅데이터를 활용해 딥러닝을 수행하여 상기 통역 서비스를 제공하는 강의통역 서비스장치.
  2. 제1항에 있어서,
    상기 제어부는, 상기 지정 교수자의 과목이 추가로 선택되면, 상기 선택된 과목의 강의 데이터를 근거로 상기 통역 서비스를 제공하는 강의통역 서비스장치.
  3. 삭제
  4. 제1항에 있어서,
    상기 제어부는, 상기 통역 서비스의 요청이 있을 때 상기 지정 교수자의 음성을 취득하여 상기 취득한 음성의 인식 결과를 근거로 상기 지정 교수자를 판단해 상기 통역 서비스를 제공하는 강의통역 서비스장치.
  5. 제1항에 있어서,
    상기 교수자의 단말장치로부터 강의가 녹화된 음성 파일을 수신하는 통신 인터페이스부;를 더 포함하며,
    상기 제어부는, 상기 수신한 음성 파일을 분석해 상기 강의 데이터를 생성하며, 상기 생성한 강의 데이터를 지정 시간 간격으로 학습하여 학습 결과를 근거로 상기 통역 서비스를 제공하는 강의통역 서비스장치.
  6. 저장부 및 제어부를 포함하며, 검색 포탈과 통신을 수행하는 강의통역 서비스장치의 구동방법으로서,
    강의를 진행하는 교수자 A, B, C별로, 그리고 상기 교수자들의 과목별로 강의 특성이 반영된 강의 데이터를 상기 저장부에 저장하는 단계; 및
    강의에 참석한 학습자가 지정 교수자의 강의에 대한 통역을 요청할 때, 상기 제어부가, 상기 저장한 지정 교수자의 강의 데이터를 근거로 통역 서비스를 제공하는 단계;를 포함하되,
    상기 강의 데이터로서 A, B, C 교수자의 과목에 따른 사용하는 전문용어, 상기 전문용어의 발음, 기준값 이상으로 사용하는 문구 및 사투리를 포함하는 대화체를 사용하는 단계;
    특정 교수자의 강의 데이터나 언어구사 패턴을 분석한 결과, 특정 전문 용어를 기준값 이상으로 사용하거나, 사투리를 기준값 이상으로 구사하는 경우라면 이미 확보하고 있는 데이터를 근거로 단어를 찾아 상기 찾은 단어를 근거로 통역 서비스를 제공하는 단계; 및
    상기 교수자의 단말장치로부터 상기 강의 데이터의 생성을 위한 자료 혹은 데이터를 수집하는 것 이외에 상기 검색 포탈에 등록되어 있는 동영상을 통해 특정 인물의 강의 패턴 혹은 스타일을 파악하여 빅데이터를 생성하고, 생성한 빅데이터를 활용해 딥러닝을 수행하여 상기 통역 서비스를 제공하는 단계;를
    더 포함하는 강의통역 서비스장치의 구동방법.
KR1020190044718A 2019-04-17 2019-04-17 강의통역 서비스장치 및 그 장치의 구동방법 KR102312798B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190044718A KR102312798B1 (ko) 2019-04-17 2019-04-17 강의통역 서비스장치 및 그 장치의 구동방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190044718A KR102312798B1 (ko) 2019-04-17 2019-04-17 강의통역 서비스장치 및 그 장치의 구동방법

Publications (2)

Publication Number Publication Date
KR20200122015A KR20200122015A (ko) 2020-10-27
KR102312798B1 true KR102312798B1 (ko) 2021-10-13

Family

ID=73136451

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190044718A KR102312798B1 (ko) 2019-04-17 2019-04-17 강의통역 서비스장치 및 그 장치의 구동방법

Country Status (1)

Country Link
KR (1) KR102312798B1 (ko)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109300469A (zh) * 2018-09-05 2019-02-01 满金坝(深圳)科技有限公司 基于机器学习的同声传译方法及装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140120560A (ko) * 2013-04-03 2014-10-14 삼성전자주식회사 통역 장치 제어 방법, 통역 서버의 제어 방법, 통역 시스템의 제어 방법 및 사용자 단말
KR20160106363A (ko) * 2015-03-02 2016-09-12 한국전자통신연구원 스마트 강의 시스템 및 방법
KR102158739B1 (ko) 2017-08-03 2020-09-22 한국전자통신연구원 자동통역 시스템, 디바이스 및 방법
KR101959439B1 (ko) 2017-09-12 2019-03-18 (주)한컴인터프리 통역방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109300469A (zh) * 2018-09-05 2019-02-01 满金坝(深圳)科技有限公司 基于机器学习的同声传译方法及装置

Also Published As

Publication number Publication date
KR20200122015A (ko) 2020-10-27

Similar Documents

Publication Publication Date Title
US20230377577A1 (en) System, apparatus, and method for processing natural language, and non-transitory computer readable recording medium
JP7122341B2 (ja) 翻訳品質を評価するための方法と装置
CN108388638B (zh) 语义解析方法、装置、设备及存储介质
CN109801527B (zh) 用于输出信息的方法和装置
CN109448704A (zh) 语音解码图的构建方法、装置、服务器和存储介质
CN105590627A (zh) 图像显示装置、用于驱动图像显示装置的方法和计算机可读记录介质
KR20200027331A (ko) 음성 합성 장치
KR102219943B1 (ko) 스마트 마이크 제어 서버 및 시스템
KR102282784B1 (ko) 문제생성장치 및 그 장치의 구동방법
KR100593589B1 (ko) 음성인식을 이용한 다국어 통역/학습 장치 및 방법
CN111354362A (zh) 用于辅助听障者交流的方法和装置
CN110111778A (zh) 一种语音处理方法、装置、存储介质及电子设备
KR102312798B1 (ko) 강의통역 서비스장치 및 그 장치의 구동방법
KR102357313B1 (ko) 비디오 콘텐츠에 포함된 오디오 데이터를 기반으로 색인어를 설정하는 전자 장치의 콘텐츠 인덱싱 방법
CN107316644A (zh) 用于信息交互的方法及装置
KR102105882B1 (ko) 학습서비스제공장치 및 그 장치의 구동방법
KR102233155B1 (ko) 음성인식기술을 이용한 학습서비스장치 및 그 장치의 구동방법
KR102098377B1 (ko) 퍼즐 게임으로 어순을 학습하는 외국어 학습 서비스 제공 방법
KR102107447B1 (ko) 선택적 음성 모델의 적용에 기초한 번역 기능을 제공하는 텍스트 음성 변환 장치 및 그 동작 방법
KR102207006B1 (ko) 글로벌 소셜 외국어 학습 제공 방법, 이를 수행하는 글로벌 소셜 외국어 학습 제공 서버, 및 이를 저장하는 기록매체
KR101957043B1 (ko) 동시통역 수업 교수자를 위한 수업 보조방법 및 이를 수행하기 위한 기록매체
CN112951274A (zh) 语音相似度确定方法及设备、程序产品
KR20200011160A (ko) 음성 인식 기술을 이용한 지능형 끝말잇기 단어 학습 방법
KR20180068655A (ko) 음성 신호에 기초한 문자 생성 장치 및 방법
WO2021134592A1 (zh) 语音处理方法、装置、设备以及存储介质

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant