KR20230027925A - 그래프 기반 구어에서 수어로의 번역 방법 및 장치 - Google Patents

그래프 기반 구어에서 수어로의 번역 방법 및 장치 Download PDF

Info

Publication number
KR20230027925A
KR20230027925A KR1020210110234A KR20210110234A KR20230027925A KR 20230027925 A KR20230027925 A KR 20230027925A KR 1020210110234 A KR1020210110234 A KR 1020210110234A KR 20210110234 A KR20210110234 A KR 20210110234A KR 20230027925 A KR20230027925 A KR 20230027925A
Authority
KR
South Korea
Prior art keywords
korean
sign language
sentence
graph
translation
Prior art date
Application number
KR1020210110234A
Other languages
English (en)
Inventor
최지훈
안충현
이한규
박종철
김정호
황의준
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020210110234A priority Critical patent/KR20230027925A/ko
Publication of KR20230027925A publication Critical patent/KR20230027925A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B21/00Teaching, or communicating with, the blind, deaf or mute
    • G09B21/009Teaching or communicating with deaf persons

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Machine Translation (AREA)

Abstract

그래프 기반 구어에서 수어로의 번역 방법 및 장치가 개시된다. 다양한 실시예에 따른 수어 번역 방법은 수어로 번역할 한국어 문장을 수신하는 동작과, 상기 한국어 문장을 분석하여 한국 수어 번역에 필요한 정보를 추출하는 동작과, 상기 추출된 정보를 상기 한국어 문장에 대응하는 한국어 그래프로 변환하는 동작과, 상기 한국어 문장 및 상기 한국어 그래프를 한국 수어 스크립트로 번역하는 동작과, 상기 한국 수어 스크립트를 수어 번역을 요청한 단말로 전송하는 동작을 포함할 수 있다.

Description

그래프 기반 구어에서 수어로의 번역 방법 및 장치{METHOD AND DEVICE FOR TRANSLATING FROM SPOKEN LANGUAGE TO SIGN LANGUAGE BASED ON A GRAPH}
아래 개시는 그래프 기반 구어에서 수어로의 번역 방법 및 장치에 관한 것이다.
인공신경망 기반의 번역 기술은 최근 매우 빠르게 성장하고 있다. 이는 매년 더 자연스러운 표현을 생성해내고, 그에 따라 번역 품질 또한 상승하고 있다.
번역 기술 중 구어(spoken language) 간 번역에서는 인공신경망 기반의 기계 번역 연구가 매우 활발히 되고 있으나, 구어에서 수어(sign language), 또는 그 반대 방향의 번역은 아직 진행된 연구가 부족하다.
수어는 농인에게 의사를 전달하고자 할 때 사용되는 대표적인 방식의 하나로 제스처를 통해 의사를 전달하는 방법을 말한다. 수어는 독자적인 문법을 갖고, 정해진 의미를 갖는 제스처를 연속적으로 수행하여 문장을 표현한다. 수어의 문법은 음성과 문자로 표현되는 음성 언어(vocal language 또는 speech language)의 문법과 다르다.
더욱이, 수어는 공간 언어(spatial language)의 특성을 가지어, 손 뿐만 아니라 얼굴(예: 눈, 눈썹, 입, 응시 방향 등), 상체와 같은 비수지 요소(non-manual components)으로도 표현되는 다중채널 언어(multi-channel language)이므로, 이러한 특성으로 인해 구어-수어 간 번역에는 특징적인 어려움이 존재한다.
위에서 설명한 배경기술은 발명자가 본원의 개시 내용을 도출하는 과정에서 보유하거나 습득한 것으로서, 반드시 본 출원 전에 일반 공중에 공개된 공지기술이라고 할 수는 없다.
비수지 표현이 수지 표현에 종속되어 예측되기 때문에 같은 단어인 경우 상황에 따라 다르게 표현될 수 없을 수 있다. 한국수어에 대한 글로스(예: 수어 단어를 표제어로 나타내어 기록하는 방식) 기반의 기계 번역 방식은 공간 언어로서의 특성(예: 수위(손 위치) 할당, 수위에 맞는 시선)을 살린 번역을 제공할 수 없을 수 있다. 이에, 자연스러운 한국수어 문장을 번역하는 기술일 필요할 수 있다.
다양한 실시예들은 구어(예: 한국어)에서 수어(예: 한국수어)로 기계 번역시, 수지 표현(예: 수위, 수형(손 모양), 수향(손 방향)) 및 비수지 표현(예: 문형, 감정, 시선을 통한 주체 대상 설정)을 독립적이되, 문맥에 맞게 동기화함으로써 자연스러운 한국수어 문장을 번역하는 기술을 제공할 수 있다.
또한, 다양한 실시예들은 주체, 대상 간의 관계 정보를 통해 수위 정보, 수위에 맞는 시선 정보를 생성함으로써 수어의 공간언어적 특성을 표현하는 기술을 제공할 수 있다.
다만, 기술적 과제는 상술한 기술적 과제들로 한정되는 것은 아니며, 또 다른 기술적 과제들이 존재할 수 있다.
다양한 실시예에 따른 수어 번역 방법은 수어로 번역할 한국어 문장을 수신하는 동작과, 상기 한국어 문장을 분석하여 한국 수어 번역에 필요한 정보를 추출하는 동작과, 상기 추출된 정보를 상기 한국어 문장에 대응하는 한국어 그래프로 변환하는 동작과, 상기 한국어 문장 및 상기 한국어 그래프를 한국 수어 스크립트로 번역하는 동작과, 상기 한국 수어 스크립트를 수어 번역을 요청한 단말로 전송하는 동작을 포함할 수 있다.
다양한 실시예에 따르면, 상기 한국어 그래프는, 상기 한국어 문장을 복원하기 위한 것으로, 추상 의미 표상(abstract meaning representation)의 형태로 축약 표현된 것일 수 있다.
다양한 실시예에 따르면, 상기 추출하는 동작은, 감정 분석 동작, 의존 구문 분석 동작, 문형 분석 동작, 및 어휘 분석 동작 중에서 하나 이상을 상기 한국어 문장에 대해 병렬적으로 수행하는 동작을 포함할 수 있다.
다양한 실시예에 따르면, 상기 번역하는 동작은, 상기 한국어 그래프에 기초하여 공간 정보 생성 동작, 수어 어순 번역 동작, 및 수어 스크립트 생성 동작을 순차적으로 수행하여 상기 한국어 그래프를 상기 한국 수어 스크립트로 번역하는 동작을 포함할 수 있다.
다양한 실시예에 따르면, 병렬적으로 수신되는 한국어 문장마다 상기 추출하는 동작, 상기 변환하는 동작, 및 상기 번역하는 동작이 수행되는 것일 수 있다.
다양한 실시예에 따른 구어를 수어로 번역하는 장치는 인스트럭션들을 포함하는 메모리와, 상기 메모리와 전기적으로 연결되고, 상기 인스트럭션들을 실행하기 위한 프로세서를 포함하고, 상기 프로세서에 의해 상기 인스트럭션들이 실행될 때, 상기 프로세서는, 수어로 번역할 한국어 문장을 수신하고, 상기 한국어 문장을 분석하여 한국 수어 번역에 필요한 정보를 추출하고, 상기 추출된 정보를 상기 한국어 문장에 대응하는 한국어 그래프로 변환하고, 상기 한국어 문장 및 상기 한국어 그래프를 한국 수어 스크립트로 번역하고, 상기 한국 수어 스크립트를 수어 번역을 요청한 단말로 전송할 수 있다.
다양한 실시예에 따르면, 상기 한국어 그래프는, 상기 한국어 문장을 복원하기 위한 것으로, 추상 의미 표상(abstract meaning representation)의 형태로 축약 표현된 것일 수 있다.
다양한 실시예에 따르면, 상기 프로세서는, 감정 분석 동작, 의존 구문 분석 동작, 문형 분석 동작, 및 어휘 분석 동작 중에서 하나 이상을 상기 한국어 문장에 대해 병렬적으로 수행할 수 있다.
다양한 실시예에 따르면, 상기 프로세서는, 상기 한국어 그래프에 기초하여 공간 정보 생성 동작, 수어 어순 번역 동작, 및 수어 스크립트 생성 동작을 순차적으로 수행하여 상기 한국어 그래프를 상기 한국 수어 스크립트로 번역할 수 있다.
도 1은 다양한 실시예에 따른 수어 번역 시스템을 나타낸다.
도 2는 다양한 실시예에 따른 수어 번역 동작의 흐름도의 일 예를 나타낸다.
도 3은 다양한 실시예에 따른 수어 번역 동작을 상세하게 설명하기 위한 도면이다.
도 4는 다양한 실시예에 따른 한국어 문장이 한국 수어 스크립트로 번역되는 예들을 나타낸다.
도 5는 다양한 실시예에 따른 수어 번역 장치의 개략적인 블록도를 나타낸다.
도 6은 다양한 실시예에 따른 단말 장치의 개략적인 블록도를 나타낸다.
실시예들에 대한 특정한 구조적 또는 기능적 설명들은 단지 예시를 위한 목적으로 개시된 것으로서, 다양한 형태로 변경되어 구현될 수 있다. 따라서, 실제 구현되는 형태는 개시된 특정 실시예로만 한정되는 것이 아니며, 본 명세서의 범위는 실시예들로 설명한 기술적 사상에 포함되는 변경, 균등물, 또는 대체물을 포함한다.
제1 또는 제2 등의 용어를 다양한 구성요소들을 설명하는데 사용될 수 있지만, 이런 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 해석되어야 한다. 예를 들어, 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소는 제1 구성요소로도 명명될 수 있다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다.
단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 설명된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함으로 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 해당 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 갖는 것으로 해석되어야 하며, 본 명세서에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이하, 실시예들을 첨부된 도면들을 참조하여 상세하게 설명한다. 첨부 도면을 참조하여 설명함에 있어, 도면 부호에 관계없이 동일한 구성 요소는 동일한 참조 부호를 부여하고, 이에 대한 중복되는 설명은 생략하기로 한다.
도 1은 다양한 실시예에 따른 수어 번역 시스템을 나타낸다.
도 1을 참조하면, 다양한 실시예에 따르면, 수어 번역 시스템(10)은 수어 번역을 요청하는 단말 장치(100) 및 수어 번역 서버(200)(예: 수어 번역 서버 장치)를 포함할 수 있다. 단말 장치(100)가 수어로 번역을 요청할 하나 이상의 한국어 문장을 수어 번역 서버(300)로 전송하면, 수어 번역 서버(300)는 한국어 문장을 분석하여 한국어 문장에 대응하는 한국 수어 스크립트를 생성할 수 있다. 단말 장치(100)는 수어 번역 서버(300)로부터 한국 수어 스크립트를 수신하고, 한국 수어 스크립트에 기초하여 수어 영상을 생성(예: 출력, 재생)할 수 있다.
다양한 실시예에 따르면, 단말 장치(100)는 PC(Personal Computer), 데이터 서버, 또는 휴대용 장치로 구현될 수 있다. 휴대용 전자 장치는 랩탑(laptop) 컴퓨터, 이동 전화기, 스마트 폰(smart phone), 태블릿(tablet) PC, 모바일 인터넷 디바이스(mobile internet device(MID)), PDA(personal digital assistant), EDA(enterprise digital assistant), 디지털 스틸 카메라(digital still camera), 디지털 비디오 카메라(digital video camera), PMP(portable multimedia player), PND(personal navigation device 또는 portable navigation device), 휴대용 게임 콘솔(handheld game console), e-북(e-book), 스마트 디바이스(smart device)으로 구현될 수 있다. 이때, 스마트 디바이스는 스마트 워치(smart watch) 또는 스마트 밴드(smart band)로 구현될 수 있다.
다양한 실시예에 따르면, 단말 장치(100)는 문장 발신 모듈(110), 스크립트 수신 모듈(130), 및 스크립트 재생 모듈(150)을 포함할 수 있다. 수어 번역 서버(200)는 문장 수신 모듈(210), 수어 번역 모듈(230), 및 스크립트 발신 모듈(250)을 포함할 수 있다. 문장 발신 모듈(110)은 수어로 번역을 요청할 하나 이상의 한국어 문장을 수어 번역 서버(200)로 전송할 수 있다. 문장 수신 모듈(210)은 단말 장치(100)로부터 전송된 한국어 문장을 수신할 수 있다. 수어 번역 모듈(230)은 한국어 문장을 분석하여 한국어
Figure pat00001
한국 수어로 번역을 수행함으로써 한국어 문장에 대응하는 한국 수어 스크립트를 생성할 수 있다. 스크립트 발신 모듈(250)은 한국 수어 스크립트를 단말 장치(100)로 전송할 수 있다. 스크립트 수신 모듈(130)은 수어 번역 서버(200)로부터 전송된 한국 수어 스크립트를 수신할 수 있다. 스크립트 재생 모듈(150)은 한국 수어 스크립트를 플레이어(예: 아바타 기반 수어 애니메이션 플레이어)를 통해 수어 영상(예: 수어 애니메이션)을 생성할 수 있다. 또한, 스크립트 재생 모듈(150)은 GAN(generative adversarial network) 기반 모델을 이용하여 실사기반의 수어 영상을 생성할 수 있다.
도 2는 다양한 실시예에 따른 수어 번역 동작의 흐름도의 일 예를 나타낸다.
도 2는 한국어에서 한국 수어로의 기계 번역에 대한 수어 번역 동작을 설명하기 위한 것일 수 있다.
동작 271에서, 수어 번역 서버(200)는 단말 장치(100)로부터 수어로 번역할 한국어 문장을 수신할 수 있다. 수어 번역 서버(200)는 하나 이상의 한국어 문장을 병렬적으로 수신하고, 처리할 수 있다.
동작 272에서, 수어 번역 서버(200)는 한국어 문장을 분석하여 한국어 문장에서 한국 수어 번역에 필요한 정보를 추출할 수 있다. 수어 번역 서버(200)는 한국어 문장에 대해 감정 분석(예: 감정 분석 동작), 의존 구문 분석(예: 의존 구문 분석 동작), 문형 분석(예: 문형 분석 동작), 및 어휘 분석(예: 어휘 분석 동작)을 병렬적으로 수행할 수 있다. 감정 분석을 통해 추출된 정보는 감정에 대한 정보를 포함하고, 의존 구문 분석을 통해 추출된 정보는 주체/대상, 행동/상태, 및 수동/능동에 대한 정보를 포함하고, 문형 분석을 통해 추출된 정보는 문형에 대한 정보를 포함하고, 어휘 분석을 통해 분석된 정보는 어휘에 대한 정보를 포함할 수 있다. 수어 번역 서버(200)는 각 분석을 통해 추출된 정보를 분석된 정보로 병합할 수 있다.
동작 273에서, 수어 번역 서버(200)는 분석된 정보를 한국어 그래프로 변환할 수 있다. 한국어 그래프는 한국어 문장에 대응되는 것으로, 한국어 문장을 소실하지 않고 복원할 수 있다. 한국어 그래프는 의존 구문 분석 결과 또는 추상 의미 표상(AMR(abstract meaning representation))의 형태로도 축약 표현될 수 있다.
동작 274에서, 수어 번역 서버(200)는 한국어 문장 및 한국어 그래프를 한국 수어 스크립트로 번역할 수 있다. 예를 들어, 수어 번역 서버(200)는 한국 수어 스크립트로 번역하기 위해 공간 정보 생성 동작, 수어 어순 번역 동작, 및 수어 스크립트 생성 동작을 순차적으로 수행할 수 있다.
동작 275에서, 수어 번역 서버(200)는 한국 수어 스크립트를 수어 번역을 요청한 단말 장치(100)로 전송할 수 있다.
수어 번역 서버(200)는 하나 이상의 한국어 문장을 병렬적으로 수신하고, 수신된 한국어 문장마다 동작 272 내지 동작 275를 수행(예: 병렬 수행)할 수 있다.
도 3은 다양한 실시예에 따른 수어 번역 동작을 상세하게 설명하기 위한 도면이다.
동작 310에서, 수어 번역 서버(200)는 수어로 번역할 한국어 문장(311)을 수신할 수 있다.
동작 320에서, 수어 번역 서버(200)는 한국어 문장을 분석하여 한국어 문장에서 한국 수어 번역에 필요한 정보를 추출할 수 있다. 동작 320에서, 한국어 문장을 분석하는 동작은 감정 분석 동작(321), 의존 구문 분석 동작(322), 문형 분석 동작(323), 및 어휘 분석 동작(324)을 포함할 수 있다. 수어 번역 서버(200)는 감정 분석 동작(321), 의존 구문 분석 동작(322), 문형 분석 동작(323), 및 어휘 분석 동작(324)를 병렬적으로 수행하고 각 분석(321~324)를 통해 추출된 정보를 분석된 정보(325)로 병합할 수 있다.
감정 분석 동작(321)은 한국어 문장(311)에서 나타나는 감정을 7개의 감정 범주(예: 기쁨, 슬픔, 분노, 두려움, 경멸, 놀람, 중립)로 분류할 수 있다. 분류된 감정 범주는 감정 분석 동작(321)을 통해 추출된 정보로 출력될 수 있다.
의존 구문 분석 동작(322)은 한국어 문장(311)의 문장 구조를 분석하여 주체/대상, 주체 및 대상에 대한 행동/상태, 및 행동/상태의 능동/수동 관계 정보를 추론(예: 추출)할 수 있다. 의존 구문 분석 동작(322)을 통해 추출된(또는 추론된) 정보(예: 주체/대상, 주체 및 대상에 대한 행동/상태, 및 행동/상태의 능동/수동 관계 정보)는 한국어 그래프(331)를 생성(예: 구축)하는 데 있어 핵심적인 구성이 될 수 있다.
문형 분석 동작(323)은 한국어 문장(311)의 문장을 분석하여 한국어 문장(311)을 평서문, 의문문, 명령문, 청유문 및 감탄문의 5가지 형으로 구분할 수 있다. 구분된 문형(또는 문형 정보)는 문형 분석 동작(323)을 통해 추출된 정보로 출력될 수 있다.
어휘 분석 동작(324)은 한국어 문장(311)을 분석하여 한국어 문장(311)에서 사용된 한국어 단어들의 동음이의어/다의어 정보를 추출할 수 있다. 어휘 분석 동작(324)을 통해 추출된 정보는 한국 수어 단어가 동음이의어/다의어일 때 의미를 구분하는 용도로 사용될 수 있다.
동작 330에서, 수어 번역 서버(200)는 분석된 정보(325)를 한국어 그래프(331)로 변환할 수 있다. 한국어 그래프(331)는 의존 구문 분석 결과 또는 추상 의미 표상(AMR(abstract meaning representation))의 형태로도 축약 표현될 수 있다. 한국어 그래프(331)는 주체 및 대상, 주체 및 대상에 대한 행동/상태, 및 행동/상태의 능동/수동 관계 정보, 감정 등의 정보를 포함할 수 있다. 또한, 한국어 그래프(331)는 그래프 합성곱 신경망(GCN(craph convolutional network)) 과 같은 구조를 통해 임베딩 및 학습할 수 있다.
동작 340에서, 수어 번역 서버(200)는 공간 정보 생성 동작(341), 수어 어순 번역 동작(342), 및 수어 스크립트 생성 동작(343)을 순차적으로 수행하여 한국어 문장(311) 및 한국어 그래프(331)를 한국 수어 스크립트(344)로 번역할 수 있다.
공간 정보 생성 동작(341)은 한국어 그래프(331)에 포함된 주체, 대상, 행동, 및 상태 정보에 기초하여 공간 정보(예: 수형, 수위, 수향, 시선 정보)를 생성할 수 있다. 공간 정보는 수지 정보(예: 수형, 수위, 수향) 및 비수지 정보(예: 시선 정보)를 포함할 수 있다. 예를 들어, 한국어 문장 “엄마가 나를 가르치다”(예: 도 4의 한국어 문장(410))는 도 4에 도시된 한국어 그래프(411)와 같이 변환될 수 있으며, 도 4의 한국어 그래프(411)는 412과 같이 수지 정보(예: 수형, 수위, 수향) 및 비수지 정보(예: 시선)를 포함하는 한국 수어 스크립트(412)로 생성될 수 있다.
수어 어순 번역 동작(342)는 한국어 그래프(331)를 한국 수어의 어순에 맞게 번역할 수 있다. 이 때, 한국 수어의 어순은 공간 정보 생성 동작(341)이 개입될 경우, 구어(spoken language)와 달리 어순이 문장을 구성하는 중요한 의미가 아닐 수 있다. 예를 들어, 한국어 문장 “엄마가 나를 가르치다”(예: 도 4의 한국어 문장(410))와 “(내가) 엄마를 가르치다”(예: 도 4의 한국어 문장(420))는 한국 수어 스크립트(예: 도 4의 한국 수어 스크립트(412, 422))로 번역 시 동일한 어순을 가지면서 수향과 눈썹의 움직임을 통해 의미가 구분될 수 있다. 즉, 수어 어순 번역 동작(342)은 공간 정보 생성 동작(341) 이후 한국 수어의 어순에 맞게 번역하도록 수행되는 것이 적절할 수 있다. 또한, 수어 어순 번역 동작(342)은 트랜스포머(Transformer)와 같은 인코더-디코더(encoder-decoder) 구조의 모델을 이용하여 어순을 결정할 수 있다.
수어 스크립트 생성 동작(343)은 공간 정보 외의 비수지 정보(예: 눈썹, 상체 움직임, 감정 등)를 생성할 수 있다.
상술한 공간 정보 생성 동작(341), 수어 어순 번역 동작(342), 및 수어 스크립트 생성 동작(343)이 순차적으로 수행되어 한국어 그래프(331)가 한국 수어 스크립트(344)로 번역될 수 있다.
도 4는 다양한 실시예에 따른 한국어 문장이 한국 수어 스크립트로 번역되는 예들을 나타낸다.
도 4를 참조하면, 한국어 문장 “엄마가 나를 가르치다”(410)은 한국어 그래프(411)로 변환되고, 한국어 문장 “(내가) 엄마를 가르치다”(420)은 한국어 그래프(421)로 변환될 수 있다. 한국어 그래프(411, 421)는 다층 언어 및/또는 공간 언어의 특성을 가지는 한국 수어 스크립트(412, 422) 형태로 번역될 수 있다. 한국어 문장(410, 420)으로부터 주체, 대상, 행동, 상태 등을 파악하여 한국어 그래프(411, 421)로 변환하는 것이 한국 수어 번역에 유리한 정보를 생성할 수 있음을 확인할 수 있다.
도 1 내지 도 4를 참조하여 설명한 다양한 실시예에 따른 수어 번역은 한국 수어 표현을 생서함에 있어서 수지 표현에 독립적이면서도 동기화된 비수지 표현을 생성함으로써 더 자연스러운 수지 및 비수지 표현을 할 수 있다. 또한, 다양한 실시예에 따른 수어 번역은 그래프 기반의 번역 방법으로 한국 수어의 다층 언어 및 공간 언어로서의 특성을 잘 나타낼 수 있어 글로스 기반 기계 번역 방식보다 우수할 수 있다.
도 5는 다양한 실시예에 따른 수어 번역 장치의 개략적인 블록도를 나타낸다.
도 5를 참조하면, 다양한 실시예에 따르면, 수어 번역 장치(500)는 도 1 내지 도 4을 참조하여 설명한 수어 번역 서버(200)와 실질적으로 동일할 수 있다. 수어 번역 장치(500)는 메모리(510), 및 프로세서(530)를 포함할 수 있다.
다양한 실시예에 따르면, 메모리(510)는 프로세서(530)에 의해 실행가능한 인스트럭션들(예: 프로그램)을 저장할 수 있다. 예를 들어, 인스트럭션들은 프로세서(530)의 동작 및/또는 프로세서(330)의 각 구성의 동작을 실행하기 위한 인스트럭션들을 포함할 수 있다.
다양한 실시예에 따르면, 메모리(510)는 휘발성 메모리 장치 또는 불휘발성 메모리 장치로 구현될 수 있다. 휘발성 메모리 장치는 DRAM(dynamic random access memory), SRAM(static random access memory), T-RAM(thyristor RAM), Z-RAM(zero capacitor RAM), 또는 TTRAM(Twin Transistor RAM)으로 구현될 수 있다. 불휘발성 메모리 장치는 EEPROM(Electrically Erasable Programmable Read-Only Memory), 플래시(flash) 메모리, MRAM(Magnetic RAM), 스핀전달토크 MRAM(Spin-Transfer Torque(STT)-MRAM), Conductive Bridging RAM(CBRAM), FeRAM(Ferroelectric RAM), PRAM(Phase change RAM), 저항 메모리(Resistive RAM(RRAM)), 나노 튜브 RRAM(Nanotube RRAM), 폴리머 RAM(Polymer RAM(PoRAM)), 나노 부유 게이트 메모리(Nano Floating Gate Memory(NFGM)), 홀로그래픽 메모리(holographic memory), 분자 전자 메모리 소자(Molecular Electronic Memory Device), 및/또는 절연 저항 변화 메모리(Insulator Resistance Change Memory)로 구현될 수 있다.
다양한 실시예에 따르면, 프로세서(530)는 메모리(510)에 저장된 컴퓨터로 읽을 수 있는 코드(예를 들어, 소프트웨어) 및 프로세서(530)에 의해 유발된 인스트럭션(instruction)들을 실행할 수 있다. 프로세서(530)는 목적하는 동작들(desired operations)을 실행시키기 위한 물리적인 구조를 갖는 회로를 가지는 하드웨어로 구현된 데이터 처리 장치일 수 있다. 목적하는 동작들은 예를 들어, 프로그램에 포함된 코드(code) 또는 인스트럭션들(instructions)을 포함할 수 있다. 하드웨어로 구현된 데이터 처리 장치는 예를 들어, 마이크로프로세서(microprocessor), 중앙 처리 장치(central processing unit), 프로세서 코어(processor core), 멀티-코어 프로세서(multi-core processor), 멀티프로세서(multiprocessor), ASIC(Application-Specific Integrated Circuit), FPGA(Field Programmable Gate Array)를 포함할 수 있다.
다양한 실시예에 따르면, 프로세서(530)에 의해 수행되는 동작은 도 1 내지 도 4을 참조하여 설명한 수어 번역 서버(200)의 동작과 실질적으로 동일하다. 이에, 상세한 설명은 생략하도록 한다.
도 6은 다양한 실시예에 따른 단말 장치의 개략적인 블록도를 나타낸다.
도 6을 참조하면, 다양한 실시예에 따르면, 단말 장치(600)는 도 1 내지 도 4을 참조하여 설명한 단말 장치(100)와 실질적으로 동일할 수 있다. 단말 장치(600)는 메모리(610), 및 프로세서(630)를 포함할 수 있다.
다양한 실시예에 따르면, 메모리(610)는 프로세서(630)에 의해 실행가능한 인스트럭션들(예: 프로그램)을 저장할 수 있다. 예를 들어, 인스트럭션들은 프로세서(630)의 동작 및/또는 프로세서(630)의 각 구성의 동작을 실행하기 위한 인스트럭션들을 포함할 수 있다.
다양한 실시예에 따르면, 메모리(610)는 휘발성 메모리 장치 또는 불휘발성 메모리 장치로 구현될 수 있다. 휘발성 메모리 장치는 DRAM(dynamic random access memory), SRAM(static random access memory), T-RAM(thyristor RAM), Z-RAM(zero capacitor RAM), 또는 TTRAM(Twin Transistor RAM)으로 구현될 수 있다. 불휘발성 메모리 장치는 EEPROM(Electrically Erasable Programmable Read-Only Memory), 플래시(flash) 메모리, MRAM(Magnetic RAM), 스핀전달토크 MRAM(Spin-Transfer Torque(STT)-MRAM), Conductive Bridging RAM(CBRAM), FeRAM(Ferroelectric RAM), PRAM(Phase change RAM), 저항 메모리(Resistive RAM(RRAM)), 나노 튜브 RRAM(Nanotube RRAM), 폴리머 RAM(Polymer RAM(PoRAM)), 나노 부유 게이트 메모리(Nano Floating Gate Memory(NFGM)), 홀로그래픽 메모리(holographic memory), 분자 전자 메모리 소자(Molecular Electronic Memory Device), 및/또는 절연 저항 변화 메모리(Insulator Resistance Change Memory)로 구현될 수 있다.
다양한 실시예에 따르면, 프로세서(630)는 메모리(610)에 저장된 컴퓨터로 읽을 수 있는 코드(예를 들어, 소프트웨어) 및 프로세서(530)에 의해 유발된 인스트럭션(instruction)들을 실행할 수 있다. 프로세서(630)는 목적하는 동작들(desired operations)을 실행시키기 위한 물리적인 구조를 갖는 회로를 가지는 하드웨어로 구현된 데이터 처리 장치일 수 있다. 목적하는 동작들은 예를 들어, 프로그램에 포함된 코드(code) 또는 인스트럭션들(instructions)을 포함할 수 있다. 하드웨어로 구현된 데이터 처리 장치는 예를 들어, 마이크로프로세서(microprocessor), 중앙 처리 장치(central processing unit), 프로세서 코어(processor core), 멀티-코어 프로세서(multi-core processor), 멀티프로세서(multiprocessor), ASIC(Application-Specific Integrated Circuit), FPGA(Field Programmable Gate Array)를 포함할 수 있다.
다양한 실시예에 따르면, 프로세서(630)에 의해 수행되는 동작은 도 1 내지 도 4을 참조하여 설명한 단말 장치(100)의 동작과 실질적으로 동일하다. 이에, 상세한 설명은 생략하도록 한다.
이상에서 설명된 실시예들은 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치, 방법 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 컨트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 저장할 수 있으며 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.
위에서 설명한 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 또는 복수의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 실시예들이 비록 한정된 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 이를 기초로 다양한 기술적 수정 및 변형을 적용할 수 있다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.

Claims (1)

  1. 수어로 번역할 한국어 문장을 수신하는 동작;
    상기 한국어 문장을 분석하여 한국 수어 번역에 필요한 정보를 추출하는 동작;
    상기 추출된 정보를 상기 한국어 문장에 대응하는 한국어 그래프로 변환하는 동작;
    상기 한국어 문장 및 상기 한국어 그래프를 한국 수어 스크립트로 번역하는 동작; 및
    상기 한국 수어 스크립트를 수어 번역을 요청한 단말로 전송하는 동작
    을 포함하는, 수어 번역 방법.
KR1020210110234A 2021-08-20 2021-08-20 그래프 기반 구어에서 수어로의 번역 방법 및 장치 KR20230027925A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210110234A KR20230027925A (ko) 2021-08-20 2021-08-20 그래프 기반 구어에서 수어로의 번역 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210110234A KR20230027925A (ko) 2021-08-20 2021-08-20 그래프 기반 구어에서 수어로의 번역 방법 및 장치

Publications (1)

Publication Number Publication Date
KR20230027925A true KR20230027925A (ko) 2023-02-28

Family

ID=85326861

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210110234A KR20230027925A (ko) 2021-08-20 2021-08-20 그래프 기반 구어에서 수어로의 번역 방법 및 장치

Country Status (1)

Country Link
KR (1) KR20230027925A (ko)

Similar Documents

Publication Publication Date Title
US10679148B2 (en) Implicit bridging of machine learning tasks
US10635977B2 (en) Multi-task learning using knowledge distillation
CN109388793B (zh) 实体标注方法、意图识别方法及对应装置、计算机存储介质
JP7429734B2 (ja) マルチモーダルデータ連合学習モデルトレーニング方法及び装置
JP7066349B2 (ja) 翻訳方法、翻訳装置及びコンピュータプログラム
US11093707B2 (en) Adversarial training data augmentation data for text classifiers
CN110888966B (zh) 自然语言问答
US9805718B2 (en) Clarifying natural language input using targeted questions
US9330084B1 (en) Automatically generating question-answer pairs during content ingestion by a question answering computing system
US20170286397A1 (en) Predictive Embeddings
KR20210075825A (ko) 시맨틱 표현 모델의 처리 방법, 장치, 전자 기기 및 저장 매체
US11189269B2 (en) Adversarial training data augmentation for generating related responses
JP2021157802A (ja) テキスト生成モデルのトレーニング方法、装置及び電子機器
US20180189272A1 (en) Apparatus and method for sentence abstraction
CN110175336B (zh) 翻译方法、装置和电子设备
JP2021152963A (ja) 語義特徴の生成方法、モデルトレーニング方法、装置、機器、媒体及びプログラム
JP2021197133A (ja) 意味マッチング方法、装置、電子機器、記憶媒体及びコンピュータプログラム
Tang Intelligent Mobile Projects with TensorFlow: Build 10+ Artificial Intelligence Apps Using TensorFlow Mobile and Lite for IOS, Android, and Raspberry Pi
JPWO2020240709A1 (ja) 対話処理装置、学習装置、対話処理方法、学習方法及びプログラム
CN111695325B (zh) 用于自然语言处理的基于解析树的向量化
JP2021117989A (ja) 言語生成方法、装置及び電子機器
JP2023007373A (ja) 意図識別モデルの訓練及び意図識別の方法及び装置
Park et al. Natural language generation using dependency tree decoding for spoken dialog systems
CN113051910B (zh) 一种用于预测人物角色情绪的方法和装置
CN112668347A (zh) 文本翻译方法、装置、设备及计算机可读存储介质

Legal Events

Date Code Title Description
A201 Request for examination