KR100954262B1 - 멀티미디어파일의 가사 또는 자막 재생 시 어학 학습기 알고리즘 구현 및 그 방법 - Google Patents

멀티미디어파일의 가사 또는 자막 재생 시 어학 학습기 알고리즘 구현 및 그 방법 Download PDF

Info

Publication number
KR100954262B1
KR100954262B1 KR1020090019653A KR20090019653A KR100954262B1 KR 100954262 B1 KR100954262 B1 KR 100954262B1 KR 1020090019653 A KR1020090019653 A KR 1020090019653A KR 20090019653 A KR20090019653 A KR 20090019653A KR 100954262 B1 KR100954262 B1 KR 100954262B1
Authority
KR
South Korea
Prior art keywords
word
electronic dictionary
character
text
multimedia file
Prior art date
Application number
KR1020090019653A
Other languages
English (en)
Other versions
KR20090035669A (ko
Inventor
안성준
안대영
Original Assignee
아몬드 테크놀로지
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 아몬드 테크놀로지 filed Critical 아몬드 테크놀로지
Priority to KR1020090019653A priority Critical patent/KR100954262B1/ko
Publication of KR20090035669A publication Critical patent/KR20090035669A/ko
Application granted granted Critical
Publication of KR100954262B1 publication Critical patent/KR100954262B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B19/00Teaching not covered by other main groups of this subclass
    • G09B19/06Foreign languages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/685Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using automatically derived transcript of audio data, e.g. lyrics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • User Interface Of Digital Computer (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 멀티미디어파일 재생기에 있어서 음악 또는 영화 파일 재생 시 같이 재생되는 가사 또는 자막(이하 텍스트)에서 사용자가 해당하는 단어 또는 문장의 뜻을 찾고자 요청하는 경우 사용하기 쉬운 유저인터페이스(이하 UI)를 통해 내장된 전자 사전 데이터베이스(이하 전자사전DB)를 검색하여 일치하는 정보를 표시해 주거나(이하 전자사전 어플리케이션) 외국어 번역 프로그램 을 통해 단문(單文)을 번역해 주는(이하 외국어 번역기 어플리케이션) 알고리즘 및 그 방법에 관한 것입니다.
멀티미디어 파일 재생 시 함께 재생되는 텍스트를 미리 읽어 텍스트 내의 문자들의 빈칸(공백=null 문자)과 빈칸 또는 빈칸과 부호 사이를 단어 단위로 구분하여 버퍼에 분류하는 단계를 특징으로 하고, 상기 텍스트가 화면에 출력되면 위치 지적 장치(포인팅 디바이스=마우스 , 터치패드 , 조작 키 등으로 디스플레이 화면의 위치를 지적할 수 있는 입력 장치)를 통해 포인터를 텍스트의 일부분에 위치시켜 문자를 선택하는 단계에 있어서 단어 단위 선택 방법과 개별 문자 연속 선택 방법들을 포함하는 것을 특징으로 하고, 상기 방법들을 통해 선택된 문자가 단어인지 문장인지 판단하는 단계에서 단어 단위 선택 방법에 의해 선택된 문자의 경우 즉시 단어로 판단하고, 개별 문자 연속 선택 방법에 의해 선택된 문자의 경우 빈칸의 유무에 따라 단어와 문장으로 판단하는 것을 특징으로 하고, 상기 판단 결과에 따라 단어일 경우 전자사전 어플리케이션(프로그램)을 수행하여 전자사전DB에 내재되어 있는 단어와 부합(match)하면 단어의 뜻을 출력하고, 부합하지 않거나 상기 단어와 문장으로 판단하는 단계의 판단 결과에 따라 문장일 경우 외국어 번역기 어플리케이션을 수행하여 번역된 문장을 출력하는 단계를 특징으로 합니다. 또한 상기 문자 선택 방법에 사용되는 UI구성 방법을 특징으로 합니다.
따라서 사용자는 음악 또는 영화를 감상할 때 어학의 목적으로 음악 가사 또는 영화 자막을 함께 재생 시키는데, 이때 모르는 단어 또는 문장이 나오면 매번 별도의 전자사전 어플리케이션을 실행시켜 직접 입력한 후 전자사전DB를 검색하거나 외국어 번역기 어플리케이션을 실행하지 않아도 되는 편리함을 제공하며, 상기 알고리즘을 휴대용 임베디드 시스템 형태의 포터블 멀티미디어 플레이어(이하 PMP)에 사용할 경우 시스템 자원을 효율적으로 사용할 수 있는 장점이 있습니다.
엠피쓰리 , 멀티미디어 , 디빅스 , 피엠피 , 휴대용 , 컴퓨터 , 유저 인터페이스 , MP3 , PMP , Divx , Portable , computer , User interface , UI

Description

멀티미디어파일의 가사 또는 자막 재생 시 어학 학습기 알고리즘 구현 및 그 방법{The electronic dictionary algorithm of Multimedia file lyrics or subtitle playing}
본 발명은 멀티미디어파일 재생기에 있어서 음악 또는 영화 파일 재생 시 같이 재생되는 가사 또는 자막(이하 텍스트)에서 사용자가 해당하는 단어 또는 문장의 뜻을 찾고자 요청하는 경우 사용하기 쉬운 유저인터페이스(이하 UI)를 통해 내장된 전자 사전 데이터베이스(이하 전자사전DB)를 검색하여 일치하는 정보를 표시해 주거나(이하 전자사전 어플리케이션) 외국어 번역 프로그램 을 통해 단문(單文)을 번역해 주는(이하 외국어 번역기 어플리케이션) 알고리즘 및 그 방법에 관한 것입니다.
흔히 말하는 멀티미디어 재생기라 함은 보통 컴퓨터에서 사용되는 멀티미디어 파일(음악파일, 영화파일 등)을 전담하여 재생시키는 어플리케이션을 지칭합니다. 상기 멀티미디어 재생기는 소프트웨어(Software)로 제작되어 배포된 후 사용자가 프로그램을 직접 컴퓨터에 설치하는 형태이거나 상기 소프트웨어(Software)가 임베디드 시스템(Embedded System)의 펌웨어(Firmware) 형태로 삽입되어 하드웨어(Hardware)적인 기기(器機)로 배포되는 형태이며, 본 발명에서는 이를 모두 포함하여 지칭하고 있습니다. 또한 전자사전이라 함은 일반 종이 사전에 반대되는 개념으로 문자를 컴퓨터 등을 이용해 전자사전DB를 검색하여 주는 전자화 된 사전을 의미하며, 외국어 번역기라 함은 전자사전에서 발전한 것으로 단어 이외에 외국어 문장을 해당 국가의 어순에 맞게 전자적으로 번역해 주는 것을 의미합니다.
기존의 멀티미디어 재생기에서 텍스트를 표시할 때는 보통 다음과 같은 방식이 사용됩니다. 먼저 음악 파일의 경우 ID3등의 태그에 가사정보가 저장되어 싱크(동기화)된 순서에 따라 순차적으로 표시하거나 별도의 가사 파일을 함께 재생시켜 태그로 싱크 정보를 구분하여 순차적으로 표시하는 방법이 사용됩니다. 그리고 영화 파일의 경우엔 몇 개의 멀티미디어 재생기기에서는 영화파일 자체의 태그에 자막을 삽입하여 재생하기도 하지만 변환 Codec마다 표준화가 되어 있지 않아 재생기간 호환성이 떨어집니다. 따라서 대부분은 별도의 자막 파일을 두고 태그로 싱크 정보를 구분하여 영화와 함께 순차적으로 표시하는 방법을 주로 사용하고 있습니다.
사용자는 이러한 멀티미디어 재생기를 통해 어학 학습을 목적으로 원어로 된 텍스트를 시청하는 경우가 있는데 이때 표시되는 단어 또는 문장의 사전적인 의미를 알고자 하면 별도의 종이사전 이나 전자사전을 통해 해당하는 단어를 직접 찾거 나 입력하여 검색해야 하는 불편함이 따릅니다.
현재에 컴퓨터에서 사용되는 많은 전자사전 프로그램에서는 단어에 커서를 갖다 대면 텍스트를 추출하여 전자사전DB에 저장된 단어 문자와 비슷한 값을 출력해주는 방식의 전자사전이 많이 사용되고 있는데, 이러한 기존의 방식은 한국어 및 일본어 등의 조사(助詞)가 자주 사용되는 복합 단어(단어 와 단어가 합쳐져 하나의 단어처럼 보이는 단어)일 경우 자동으로 단어 추출하는 것이 불가능하고 문자를 직접 입력하는 등의 불편함이 있으므로, 영어권 언어에만 제한적으로 사용되고, 특히 이를 이용하기 위해선 전자사전의 프로그램이 주(主)가되어 컴퓨터상에 항상 동작하는 형태이어야 합니다. 따라서 사용자는 음악 또는 영화 감상 시 별도의 프로그램을 항상 이용하는 불편함이 따르고 특히 멀티미디어 파일 재생 중에 두 가지 이상의 프로그램을 조작하기 불편한 휴대용 임베디드 시스템 형태의 포터블 멀티미디어 플레이어(이하 PMP) 기기 등에서는 사용하기 어렵습니다.
이를 개선하기 위해 등록 제 10-0760975 에서는 멀티미디어 파일이 재생될 때 음원 데이터를 기준으로 동기화된 가사 텍스트 데이터의 단어들을 그 난이도에 따라 분류하고 이를 사전 데이터와 동기화하여 사용자가 요청 또는 자동으로 해당하는 단어의 사전적 의미를 표시하는 것을 특징으로 하고 있습니다. 그러나 상기와 같은 방식은 매 텍스트마다 사전데이터와 동기화해야 하므로 파일을 읽을 때마다 시스템에 부하를 주게 되며, 특히 텍스트 파일에 내재 되어 있는 단어들을 난이도 에 따라 분류한다 해도 개별 학습수준을 정형화하기엔 무리가 있고, 이들 단어들의 사전적인 의미를 동기화하여 태그정보로 멀티미디어 파일에 전부 링크하는 것은 과도한 메모리 사용과 파일 크기의 비대를 초래하므로 적은 리소스(Resource)를 사용해야하는 휴대용 임베디드 시스템에서 구현하기엔 부적절한 방법입니다.
출원번호 10-2001-0080813 는 자막에 표시되는 단어들에 대한 해설데이터를 디코딩하여 출력할 수 있는 디방송 수신장치 및 방법에 관한 것입니다. 방송데이터를 수신할 때 자막 부분을 추출하고 자막에서 사용자가 선택한 단어에 대한 해설데이터를 수신되는 자막데이터로부터 추출하거나 기 저장된 사전데이터 및 인터넷 사이트를 통해 얻어진 해설데이터를 디코딩하여 출력할 수 있는 디지털방송 수신장치 및 방법을 제공하는 것입니다. 상기 방법은 인터넷 또는 방송송출자로 부터 데이터를 매번 얻어야 하며, 사용자가 어떻게 자막의 단어를 선택하는지에 대해선 언급되어 있지 않으며, 학습기 기능보다는 방송 정보(해설)에 치중을 하고 있어 발명과는 기술적 배경이 다릅니다.
출원번호 10-2004-003464 는 네트워크를 통한 검색을 이용하여 자막에서 추출된 외국어 단어에 대한 한국어 의미를 제공하여 주는 네트워크 기반 외국어 학습 방법 및 시스템에 관한 것이며, 시청자가 자막 데이터에서 검색하고자 하는 외국어 단어를 선택하면, 네트워크를 통해 원격으로 조회되어 해당 한국어 의미가 화면 상에 디스플레이 되는 것을 특징으로 하고 있습니다. 그러나 이 역시 단어를 어떻게 추출하는지에 대해선 언급이 없고, 네트워크를 통해 전자사전 어플리케이션을 수행하는 것에 비중을 두고 있어 본 발명과는 기술적 배경이 다릅니다.
본 발명이 상기와 같은 목적을 달성하기 위하여 멀티미디어 파일 재생시 함께 재생시키기 위한 텍스트를 미리 읽을 때 문자들의 빈칸과 빈칸 또는 빈칸과 부호 사이를 기준으로 이를 단어 단위로 구분하여 버퍼에 분류한 후 출력하고, 위치 지적장치(포인팅 디바이스=마우스 , 터치패드 , 조작 키 등으로 디스플레이 화면의 위치를 지적할 수 있는 입력 장치)를 통해 포인터를 텍스트의 일부분에 위치시켜 문자를 선택할 수 있게 합니다. 이때 단어 단위 선택 방법과 개별 문자 연속 선택 방법을 사용한다면, 영어이외의 외국어에서 조사(助詞)등이 함께 쓰인 복합 단어들에서도 문자 추출이 매우 용이 해집니다. 이렇게 텍스트에서 추출한 문자를 단어 또는 문장으로 판단하여, 단어일 경우 전자사전 어플리케이션을 수행하여 전자사전DB를 검색한 후 일치하는 뜻을 표시해주는 거나 문장일 경우 외국어 번역기 어플리케이션을 수행하여 단문(單文)을 번역해 주는 것을 이루고자 합니다.
멀티미디어 파일 재생 시 함께 재생되는 텍스트를 미리 읽어 싱크 순서에 따라 출력해줘야 하는 텍스트 내의 문자들의 빈칸(공백=null 문자)과 빈칸 또는 빈칸과 부호 사이를 단어 단위로 구분하여 버퍼에 분류하는 단계를 특징으로 하고, 상기 텍스트가 화면에 출력되면 위치 지적 장치(포인팅 디바이스=마우스 , 터치패드 , 조작 키 등으로 디스플레이 화면의 위치를 지적할 수 있는 입력 장치)를 통해 포 인터를 텍스트의 일부분에 위치시켜 문자를 선택하는 단계에 있어서 단어 단위 선택 방법과 개별 문자 연속 선택 방법들을 포함하는 것을 특징으로 하고, 상기 방법들을 통해 선택된 문자가 단어인지 문장인지 판단하는 단계에서 단어 단위 선택 방법에 의해 선택된 문자의 경우 즉시 단어로 판단하고, 개별 문자 연속 선택 방법에 의해 선택된 문자의 경우 빈칸의 유무에 따라 단어와 문장으로 판단하는 것을 특징으로 하고, 상기 판단 결과에 따라 단어일 경우 전자사전 어플리케이션(프로그램)을 수행하여 전자사전DB에 내재되어 있는 단어와 부합(match)하면 단어의 뜻을 출력하고, 부합하지 않거나 상기 단어와 문장으로 판단하는 단계의 판단 결과에 따라 문장일 경우 외국어 번역기 어플리케이션을 수행하여 번역된 문장을 출력하는 단계를 특징으로 합니다. 또한 상기 문자 선택 방법에 사용되는 UI구성 방법을 특징으로 합니다.
본 발명은 멀티미디어파일 재생기에 있어서 음악 또는 영화 파일 재생 시 같이 재생되는 가사 또는 자막(이하 텍스트)에서 사용자가 해당하는 단어 또는 문장의 뜻을 찾고자 요청하는 경우 사용하기 쉬운 유저인터페이스(이하 UI)를 통해 내장된 전자 사전 데이터베이스(이하 전자사전DB)를 검색하여 일치하는 정보를 표시해 주거나(이하 전자사전 어플리케이션) 외국어 번역 프로그램 을 통해 단문(單文)을 번역해 주는(이하 외국어 번역기 어플리케이션) 알고리즘 및 그 방법에 관한 것입니다.
따라서 사용자는 음악 또는 영화를 감상할 때 어학의 목적으로 음악 가사 또는 영화 자막을 함께 재생 시키는데, 이때 모르는 단어 또는 문장이 나오면 매번 별도의 전자사전 어플리케이션을 실행시켜 직접 입력한 후 전자사전DB를 검색하거나 외국어 번역기 어플리케이션을 실행하지 않아도 되는 편리함을 제공하며, 상기 알고리즘을 휴대용 임베디드 시스템 형태의 포터블 멀티미디어 플레이어(이하 PMP)에 사용할 경우 시스템 자원을 효율적으로 사용할 수 있는 장점이 있습니다.
본 발명의 상세 설명을 돕기 위해서 휴대용 임베디드 시스템에 멀티미디어 재생기가 펌웨어 형태로 탑재(Install)되어 구현되는 방법을 한 예로 들고 첨부한 도면을 참조하여 바람직한 일실시 예를 다음과 같이 상세히 설명하겠습니다.
도 1은 멀티미디어 재생기에서 영상 자료가 표시되는 디스플레이 화면 구성도이며, (101)은 전체 디스플레이 화면, (102)는 YUV 화면 , (103)은 OSD 화면, (104)는 OSD 화면에 표시된 텍스트, (105)는 YUV 화면에 표시된 영상 입니다. 보통의 휴대용 멀티미디어 재생기기에 있어서 상기와 같이 전체 디스플레이 화면(101)은 영상이 재생되는 YUV 화면(102)과 그 위에 OSD 화면(103)들로 분리된 구조를 이루고 있으며, 보통의 경우 텍스트를 나타내기 위한 폰트 이미지는 (104)와 같이 OSD화면(103)에 표시되므로 (105)와는 구분되는 형태 입니다. 따라서 음악이나 영화를 재생할 때 소프트웨어 적으로 함께 재생하는 텍스트는 대부분 OSD 화면(103) 에 표시하므로 YUV 영상에 함께 포함(오버랩)된 텍스트를 제외하곤 구분되어 표시됩니다.
도 2는 멀티미디어 파일 재생 시 함께 표시되는 텍스트의 파일 구조 예시도이며, (201)은 텍스트가 멀티미디어 파일 내부에 구성되는 경우의 구조 예시이며, ID3 등의 공통된 규약의 태그로 구분되어 싱크 정보에 따라 텍스트 등의 정보가 구분되어 표시되는 구조입니다. (202)는 텍스트 파일이 멀티미디어 파일과 별도로 존재하여 구성되는 경우의 구조 예시이며, 멀티미디어 파일과 함께 재생되는 경우 태그 내의 싱크 정보로 텍스트 등의 정보가 구분되어 표시되는 구조입니다. 이 두 가지처럼 멀티미디어 파일이 재생될 때 텍스트가 구성된 방식이 다르더라도 소프트웨어적으로는 이들 텍스트를 별도로 추출하여 가공하는 게 가능합니다.
도 3은 텍스트에서 문자 추출 시 해당 어플리케이션들을 수행하는 알고리즘 순서도이며, (301)은 시작 단계, (302)는 텍스트를 읽는 단계, (303)은 텍스트를 버퍼(buffer)에 분류 하는 단계, (304)는 텍스트를 출력하는 단계, (305)는 텍스트가 출력되어 있는 동안 전자사전 수행여부를 구분(판단)하는 단계, (306)은 버퍼에 분류된 텍스트의 문자를 위치 지적 장치로 선택하는 단계, (307)은 선택된 문자를 단어와 문장으로 구분하는 단계, (308)은 (307)단계에서 구분된 문자가 단어일 경우 전자사전 어플리케이션을 수행하는 단계, (309)는 (308)단계에서 일치 또는 유사한 단어를 검색했는지 판단하는 단계, (310)은 (309)단계에서 조건 충족할 경우 단어의 뜻을 출력하는 단계, (311)은 (307)단계에서 구분된 문자가 문장일 경우이거나 (309)단계에서 조건 불 충족했을 경우 외국어 번역기 어플리케이션을 수행하는 단계, (312)는 (311)단계에서 처리된 번역된 문장을 출력하는 단계, (313)는 종료 단계 입니다. 멀티미디어 파일이 재생될 때 싱크에 맞춰 순차적으로 표시해야할 텍스트를 읽고(302) 이를 버퍼에 분류(303)한 후 텍스트를 출력(304)합니다. 이때 (303)단계에서는 텍스트 내에서 빈칸(공백=null 문자)과 빈칸 또는 빈칸과 부호(쉼표, 마침표 등)사이에 속해있는 문자(Character)들을 묶어 이를 단어 단위로 구분하여 분류하는 것을 특징으로 합니다. 더욱 자세하게 예를 들면 “Hello, Welcome to KOREA" 라는 문장을 화면에 표시하기 위해 텍스트 파일을 미리 읽어 문자들을 버퍼에 분류할 때 "Hello," 문자들에서 “H”문자는 첫 문자이므로 당연히 시작하는 문자로 구분할 수 있어야 바람직한 동작을 합니다. 그리고 “o" 문자 다음엔 쉼표 부호가 존재하므로 그사이에 있는 문자열들인 "Hello"를 묶어 하나의 단어 단위로 구분할 수 있게 됩니다. 다음에 "W" 앞에는 빈칸이 존재하고 문자열이 끝나는 “e"다음에도 빈칸이 존재하므로 그 사이에 있는 문자열인 ”Welcome"을 묶어 또 하나의 단어 단위로 구분하는 것을 특징으로 합니다. 이런 식으로 하면 상기 문장은 ① 단위의 단어 ”Hello" , ② 단위의 단어 “Welcome" , ③ 단위의 단어 ”to“ 그리고 ④단위의 단어 ”KOREA” 등으로 나뉘어 지게 되는 원리입니다. 이는 사용자가 문자 선택(306)단계에서 단어를 쉽게 선택할 수 있게 하고, (307)단계에서 빠른 처리를 하기 위한 목적입니다. 텍스트가 화면에 출력되어 있을 때 전자사전 기능을 수행하겠는지 여부를 판단하는 단계(305)에서 도 4 또는 도 5의 (402)와 같 은 외부 인터럽트가 수행되면 조건 충족하는 것을 특징으로 하며, 조건이 충족할 경우 문자를 선택하는 단계(306)로 진입하게 됩니다. 이때 멀티미디어 파일 및 텍스트의 재생은 일시 중지 하도록 해야 바람직한 동작을 수행합니다. 상기 문자 선택 단계(306)에서는 단어 단위 선택 방법(도 4참조)과 개별 문자 연속 선택 방법(도 5참조)이 사용되는 것을 특징으로 하며, 여기서 문자를 선택한다는 것은 임의의 버퍼 또는 캐쉬에 등록시키는 것을 의미합니다. 이렇게 선택된 문자가 단어 인지 문장인지 구분하는 단계(307)를 거치고, 상기 단계에서 단어 단위 선택 방법에 의해 선택된 문자의 경우 즉시 단어로 구분하고, 개별 문자 연속 선택 방법에 의해 선택된 문자의 경우 빈칸의 유무에 따라 단어(문자사이 빈칸 없음)와 문장(문자 사이 빈칸 있음)으로 구분하는 것을 특징으로 합니다. 상기 구분된 문자가 단어이면 전자사전 어플리케이션을 수행하는 단계(308)를 거친 후 전자사전DB에 내재되어 있는 단어와 일치 또는 유사한지 판단하는 단계(309)에 이르러 조건 충족이 되면 그 단어의 뜻(310)을 출력하고, 일치 또는 유사하지 않으면 조건 불 충족이 되어 외국어 번역기 어플리케이션을 수행하는 단계(311)로 진행합니다. 이는 특정 외국어에 명사(名詞)와 동사(動詞)가 빈칸 없이 연이어 쓰여 진 단문(單文)이 단어로 인식되는 것을 방지하기 위한 목적입니다. 또한 상기 (307)단계에서 구분된 문자가 문장으로 구분되면 외국어 번역기 어플리케이션을 수행하는 단계(311)를 거쳐 번역된 문장(312)을 출력하고 종료(313)하게 됩니다.
도 4는 문자 선택(306)시 단어 단위 선택 방법으로 추출한 경우의 전자사전 구현 예시도이며, (101)은 전체 디스플레이 화면, (104-1)은 도 1의 텍스트(104)에서 단어단위(①②③④)로 구분되어 버퍼에 분류된 텍스트를 단어 단위로 선택하는 방법을 표시한 것, (501-1)은 전자사전 어플리케이션이 수행되어 단어의 뜻을 디스플레이 화면에 표시한 것, (601)은 문자의 위치를 지적하는 포인터, (602)는 포인터의 이동 방향, (401)은 지적 장치 중 조작 키를 예시로 한 UI 구성 부분, (402)는 상기 UI에서 멀티미디어 파일 재생 중 전자사전 기능을 수행하기 위한 키 입력 부, (403)은 상기 UI에서 문자의 위치를 지적하기 위한 포인터를 이동시키는 키 입력 부, (404)는 상기 UI에서 원하는 단어 근처 위치에 포인터가 머물렀을 때 이를 선택하는 키 입력 부 입니다. 전자사전 수행 키 입력(402)이 이루어지면 도 3의 (305)단계에서 조건 충족을 하게 됩니다. 이때 재생화면은 일시 정지 상태가 되고 문자를 선택하는 단계(306)로 진입하여야 바람직한 동작을 하게 됩니다. 이때 좌표를 이용하여 위치를 인식하게 해주는 위치 지적장치(예, 마우스 또는 터치패널)를 이용하여 “KOREA" 단어를 선택하고자 하는 경우엔 이동 키(403)를 이용하여 단어 단위(①②③④)로 구분되어 버퍼에 분류된 텍스트의 문자 일부인 “R”의 위치에 포인터(601)를 이동시키고 선택하는 키(404)를 입력하면, “R” 문자가 속해 있는 ④ 단위의 단어 “KOREA”를 최종 선택할 수 있게 해야 바람직합니다. 좌표가 아닌 방향을 지시하는 위치 지적장치(예, 조작 키)를 이용하여 "KOREA" 단어를 선택하고자 하는 경우엔 ① 단위의 단어에 자동으로 포인터(601)를 이동시킨 후 (602) 방향으로 이동 키(403)를 통해 순차적으로 포인터(601)를 ② 단위를 거쳐 ④ 단위에 이르게 하면 그에 해당하는 “KOREA" 단어를 최종 선택할 수 있게 해야 바람직합니다. 이렇게 선택된 문자는 도 3의 (307)단계의 특징에서 제시한 것처럼 즉시 단어로 인식되어 전자사전 어플리케이션을 수행(308)하고 그에 해당하는 단어의 뜻을 디스플레이 화면에 표시(501-1)하게 됩니다.
도 5는 문자 선택(306)시 개별 문자 연속 선택 방법을 통하여 단어 또는 문장으로 추출한 경우의 전자사전 및 외국어 번역기 구현 예시도이며, 도 4에 사용된 중첩된 부호들의 설명은 생략하겠습니다. (104-2)는 도 1의 텍스트(104)에서 단어단위(①②③④)로 구분되어 버퍼에 분류된 텍스트를 개별 문자 단위로 연속 선택하는 방법을 표시한 것, (501-2)는 외국어 번역기 어플리케이션이 수행되어 번역된 문장을 디스플레이 화면에 표시한 것, (405)는 (401)의 UI에서 개별 문자를 연속으로 선택하기 위한 기능 키 입력 부 입니다. 도 4의 방법과 마찬가지로 문자를 선택하는 단계(306)에 이르면 포인터 이동 키(403)로 단어단위(①②③④) 로 구분되어 버퍼에 분류된 텍스트의 단어를 포인터로 지적(601)하고, 이때 개별 문자를 연속으로 선택하기 위한 기능 키(405)를 입력하면 한 문자 단위(캐릭터 단위)로 연속하여 선택할 수 있게 되는 것을 특징으로 합니다. 즉, (104-2)에서 이동 키(403)를 이용해 포인터(601)를 ② 단위의 문자 “W” 근처에 위치시키고 상기 기능 키(405)를 입력한 상태에서 동시에 이동 키(403)를 이용하여 포인터(601)를 (602)의 방향으로 이동시키면 개별 문자 단위로 하나씩 연속하여 문자들을 선택할 수 있게 됩니다. 계속해서 포인터(601)를 ④ 단위의 끝 부분인 “A” 까지 위치시킨 후 기능 키(405)를 해체하고 선택 키(404)를 입력 하면 최종적으로 “Welcome to KOREA”라 는 문장을 선택하게 됩니다. 이러한 방법은 상기 문장에서 “Welcome” 같은 복합 단어(Wel+come)가 쓰인 문장에서 한 단어인“come”만 추출하는데도 적합합니다. 따라서 상기 방법으로 추출한 텍스트의 “Welcome” , “to” , “KOREA” 사이엔 빈칸(공백=null문자) 이 존재하므로 도 3의 (307) 단계에서 즉시 문장으로 구분하여 외국어 번역기 어플리케이션을 수행(311)하고 그에 해당하는 번역된 문장을 디스플레이 화면에 표시(501-2)하게 됩니다.
또한 상기 도 4와 도 5에서 제시한 조작 키를 이용한 UI 구성(401)은 휴대용 임베디드 시스템에 멀티미디어 재생기가 탑재(Install)되었을 경우 하나의 예시이며, 조작 키와 비슷한 터치패널이나 마우스 등의 포인팅 디바이스로도 대체 될 수 있는 것을 특징으로 합니다.
이상 본 실시 예에서 제시한 문자 선택 방식은 다양한 입출력 장치로 응용하여 구현될 수 있는 만큼 통상적인 전자회로 및 소프트웨어로 제작할 수 있는 지식을 가진 자는 본 발명의 기술적 사상을 일탈하지 않는 범위에서 누구나 응용 및 수정이 가능합니다. 따라서 , 본 발명의 기술적 범위는 첨부한 도면과 명세서의 상세한 설명에 기재된 내용으로 한정되는 것은 아닙니다.
도 1 은 휴대용 멀티미디어 재생기기에서 영상 자료가 표시되는 디스플레이 화면 구성도
도 2 는 멀티미디어 파일 재생 시 함께 표시되는 텍스트의 파일 구조 예시도
도 3 은 텍스트에서 문자 추출 시 해당 어플리케이션들을 수행하는 알고리즘 순서도
도 4 는 문자 선택(306)시 단어 단위 선택 방법으로 추출한 경우의 전자사전 구현 예시도
도 5 는 문자 선택(306)시 개별 문자 연속 선택 방법을 통하여 단어 또는 문장으로 추출한 경우의 전자사전 및 외국어 번역기 구현 예시도
<도면의 주요부분에 대한 부호의 설명>
(101) : 전체 디스플레이 화면, (102) : YUV 화면 , (103) : OSD 화면, (104) : OSD 화면에 표시된 텍스트, (104-1) : (104)에서 단어단위(①②③④)로 구분되어 버퍼에 분류된 텍스트를 단어 단위로 선택하는 방법을 표시한 것 , (105) : YUV 화면에 표시된 영상
(201) : 텍스트가 멀티미디어 파일 내부에 구성되는 경우의 구조 예시 ,
(202) : 텍스트 파일이 멀티미디어 파일과 별도로 존재하여 구성되는 경우의 구조 예시
(301) : 시작 단계, (302) : 텍스트를 읽는 단계, (303) : 텍스트를 버퍼(buffer)에 분류 하는 단계, (304) : 텍스트를 출력하는 단계, (305) : 텍스트가 출력되어 있는 동안 전자사전 수행여부를 구분(판단)하는 단계, (306) : 버퍼에 분류된 텍스트의 문자를 위치 지적 장치로 선택하는 단계, (307) : 선택된 문자를 단어와 문장으로 구분하는 단계, (308) : (307)단계에서 구분된 문자가 단어일 경우 전자사전 어플리케이션을 수행하는 단계, (309) : (308)단계에서 일치 또는 유사한 단어를 검색했는지 판단하는 단계, (310) : (309)단계에서 조건 충족할 경우 단어의 뜻을 출력하는 단계, (311) : (307)단계에서 구분된 문자가 문장일 경우이거나 (309)단계에서 조건 불 충족했을 경우 외국어 번역기 어플리케이션을 수행하는 단계, (312) : (311)단계에서 처리된 번역된 문장을 출력하는 단계, (313) : 종료 단계
(401) : 지적 장치 중 조작 키를 예시로 한 UI 구성 부분, (402) : 상기 UI에서 멀티미디어 파일 재생 중 전자사전 기능을 수행하기 위한 키 입력 부, (403) : 상기 UI에서 문자의 위치를 지적하기 위한 포인터를 이동시키는 키 입력 부, (404) : 상기 UI에서 원하는 단어 근처 위치에 포인터가 머물렀을 때 이를 선택하는 키 입력 부, (405) : (401)의 UI에서 개별 문자를 연속으로 선택하기 위한 기능 키 입력 부
(501-1) : 전자사전 어플리케이션이 수행되어 단어의 뜻을 디스플레이 화면에 표시 한 것,
(501-2) : 외국어 번역기 어플리케이션이 수행되어 번역된 문장을 디스플레이 화면에 표시한 것,
(601) : 문자의 위치를 지적하는 포인터, (602)는 포인터의 이동 방향

Claims (5)

  1. 멀티미디어 파일 재생기의 가사 또는 자막 재생 시 어학 학습기능을 구현하는 방법에 있어서,
    멀티미디어 파일 재생기가 멀티미디어 파일 재생 시 함께 재생시키는 텍스트 데이터를 버퍼에 저장할 때 텍스트 데이터를 단어 단위로 분류하여 버퍼에 저장하는 단계(303)와,
    상기 (303)단계에서 멀티미디어 파일이 재생될 때 분류된 텍스트들 중의 일부(멀티미디어 파일의 싱크 위치와 동일한 싱크 위치의 문자열)가 멀티미디어 파일과 같은 싱크 순서대로 화면에 출력되는 동안 전자사전을 수행하는 신호(외부 인터럽트) 입력에 의해 전자사전 수행 여부를 구분(판단)하는 단계(305)와,
    상기 (305)단계에서 전자사전을 수행하는 신호(외부 인터럽트)가 입력되면 위치 지적장치의 포인터가 화면에 표시되고, 문자선택 기능이 활성화되는 문자 선택 단계(306)와,
    상기 (306)단계에서 선택된 문자를 단어와 문장으로 구분하는 단계(307)와,
    구분된 문자가 단어일 경우 전자사전 어플리케이션을 수행하는 단계(308)와,
    상기 (308)단계에서 일치 또는 유사한 단어를 검색했는지 판단하는 단계(309)와,
    상기 (309) 단계에서 일치 또는 유사한 단어를 검색하여 조건 충족할 경우 단어의 뜻을 출력하는 단계(310)와,
    상기 (309) 단계에서 일치 또는 유사한 단어를 검색하지 못해 조건 불 충족했을 경우이거나 상기 (307) 단계에서 구분된 문자가 문장일 경우 외국어 번역기 어플리케이션을 수행하는 단계(311)와,
    상기 (311)단계에서 처리된 번역된 문장을 출력하는 단계(312)
    를 포함하는 것을 특징으로 하는 멀티미디어 파일 재생기의 가사 또는 자막 재생 시 어학 학습기능을 구현하는 방법.
  2. 제 1항에 있어서,
    텍스트 데이터를 버퍼에 저장할 때 텍스트 데이터를 단어 단위로 분류하여 버퍼에 저장하는 단계 (303) 에서는
    텍스트 내에서 빈칸(공백=null 문자)과 빈칸 또는 빈칸과 부호(쉼표, 마침표 등) 사이에 속해있는 문자(Character)들을 묶어 이를 단어 단위로 구분하고 분류하여 저장하는 단계;
    를 더 포함하는 것을 특징으로 하는 멀티미디어 파일 재생기의 가사 또는 자막 재생 시 어학 학습기능을 구현하는 방법.
  3. 제 1항에 있어서,
    전자사전 수행여부를 구분(판단)하는 단계(305)에서는
    전자사전을 수행하는 신호(외부 인터럽트)의 입력(키 입력 등)에 의해 조건 충족 여부를 구분하는 단계와;
    상기 조건이 충족할 경우 멀티미디어 및 텍스트 파일 재생을 일시 멈추는 단계;
    를 더 포함하는 것을 특징으로 하는 멀티미디어 파일 재생기의 가사 또는 자막 재생 시 어학 학습기능을 구현하는 방법.
  4. 제 1항에 있어서,
    전자사전을 수행하는 신호(외부 인터럽트)가 입력되면 위치 지적장치의 포인터가 화면에 표시 되고, 문자선택 기능이 활성화되는 문자 선택 단계(306)에서는
    도 4의 (104-1)처럼 단어 단위(①②③④)로 분류되어 화면에 표시된 텍스트에서 이동 키(403)가 입력되면, 화면의 위치 지적 장치가 각 단어 단위로 이동하여 단어가 선택되는 단어 단위 선택 방법 단계와;
    도 5의 (104-2)처럼 기능 키(405)가 이동 키(403)와 함께 입력되면, 화면의 위치 지적 장치가 표시된 텍스트의 한 문자 단위(캐릭터 단위)로 연속하여 문자가 선택되는 개별 문자 연속 선택 방법 단계;
    를 더 포함하는 것을 특징으로 하는 멀티미디어 파일 재생기의 가사 또는 자막 재생 시 어학 학습기능을 구현하는 방법.
  5. 제 1항에 있어서,
    선택된 문자가 단어인지 문장인지 판단하는 단계(307)에서는
    단어 단위 선택 방법 단계에서 추출된 문자열의 경우, 즉시 단어로 구분하는 단계와;
    개별 문자 연속 선택 방법 단계에서 추출된 문자열의 경우, 문자 사이에 빈칸의 유,무에 따라 단어(문자사이 빈칸 없음)와 문장(문자 사이 빈칸 있음)으로 구분하는 단계;
    를 더 포함하는 것을 특징으로 하는 멀티미디어 파일 재생기의 가사 또는 자막 재생 시 어학 학습기능을 구현하는 방법.
KR1020090019653A 2009-03-09 2009-03-09 멀티미디어파일의 가사 또는 자막 재생 시 어학 학습기 알고리즘 구현 및 그 방법 KR100954262B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020090019653A KR100954262B1 (ko) 2009-03-09 2009-03-09 멀티미디어파일의 가사 또는 자막 재생 시 어학 학습기 알고리즘 구현 및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090019653A KR100954262B1 (ko) 2009-03-09 2009-03-09 멀티미디어파일의 가사 또는 자막 재생 시 어학 학습기 알고리즘 구현 및 그 방법

Publications (2)

Publication Number Publication Date
KR20090035669A KR20090035669A (ko) 2009-04-10
KR100954262B1 true KR100954262B1 (ko) 2010-04-23

Family

ID=40760893

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090019653A KR100954262B1 (ko) 2009-03-09 2009-03-09 멀티미디어파일의 가사 또는 자막 재생 시 어학 학습기 알고리즘 구현 및 그 방법

Country Status (1)

Country Link
KR (1) KR100954262B1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101279178B1 (ko) * 2010-02-16 2013-06-27 이두한 멀티미디어파일 재생방법 및 멀티미디어 재생기기
CN113723342B (zh) * 2021-09-08 2023-09-29 北京奇艺世纪科技有限公司 一种字幕显示方法、装置、电子设备及可读存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080051876A (ko) * 2006-12-07 2008-06-11 (주)테일러테크놀로지 전자사전 검색이 가능한 멀티미디어 파일 재생장치 및검색방법
KR20090000138A (ko) * 2007-01-11 2009-01-07 김연수 온라인 및 오프라인상의 모니터스크린에서 효과적인 외국어학습을 위한 구현기법 또는 프로그램구성

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080051876A (ko) * 2006-12-07 2008-06-11 (주)테일러테크놀로지 전자사전 검색이 가능한 멀티미디어 파일 재생장치 및검색방법
KR20090000138A (ko) * 2007-01-11 2009-01-07 김연수 온라인 및 오프라인상의 모니터스크린에서 효과적인 외국어학습을 위한 구현기법 또는 프로그램구성

Also Published As

Publication number Publication date
KR20090035669A (ko) 2009-04-10

Similar Documents

Publication Publication Date Title
CN111968649B (zh) 一种字幕纠正方法、字幕显示方法、装置、设备及介质
US10198506B2 (en) System and method of sentiment data generation
CN107704449B (zh) 数据流的实时自然语言处理
CN109558513B (zh) 一种内容推荐方法、装置、终端及存储介质
Pavel et al. Sceneskim: Searching and browsing movies using synchronized captions, scripts and plot summaries
KR101897492B1 (ko) 디스플레이 장치 및 이의 하이퍼링크 실행 방법 및 음성 인식 방법
JP5178109B2 (ja) 検索装置、方法及びプログラム
US10311113B2 (en) System and method of sentiment data use
CN106156012A (zh) 一种字幕生成方法及装置
KR20140089847A (ko) 전자 장치 및 그 제어 방법
CN111292745B (zh) 一种语音识别结果的处理方法、装置及电子设备
CN111898388A (zh) 视频字幕翻译编辑方法、装置、电子设备及存储介质
KR20180105546A (ko) 클레임 요소 명사의 요소 명사 참조 번호를 획득하기 위한 요소 명사 참조 번호 획득방법
Celikyilmaz et al. Resolving referring expressions in conversational dialogs for natural user interfaces
KR20060095572A (ko) 검색 결과들의 스크린―식 제시
CN104378692A (zh) 一种处理视频字幕的方法及装置
CN103888799A (zh) 控制方法和控制装置
KR100954262B1 (ko) 멀티미디어파일의 가사 또는 자막 재생 시 어학 학습기 알고리즘 구현 및 그 방법
CN111090977A (zh) 一种智能写作系统及智能写作方法
JP2007257134A (ja) 音声検索装置、音声検索方法および音声検索プログラム
JP2007156286A (ja) 情報認識装置及び情報認識プログラム
JP2008225676A (ja) 辞書検索装置及びその制御プログラム
CN111344664B (zh) 电子设备及其控制方法
CN110010131B (zh) 一种语音信息处理的方法和装置
JP2005004100A (ja) 聴取システムおよび音声合成装置

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130415

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20140415

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20160516

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20170512

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20180416

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20190415

Year of fee payment: 10