KR20080016206A - 언어 인식을 이용한 시스템 언어 설정방법 - Google Patents

언어 인식을 이용한 시스템 언어 설정방법 Download PDF

Info

Publication number
KR20080016206A
KR20080016206A KR1020060078009A KR20060078009A KR20080016206A KR 20080016206 A KR20080016206 A KR 20080016206A KR 1020060078009 A KR1020060078009 A KR 1020060078009A KR 20060078009 A KR20060078009 A KR 20060078009A KR 20080016206 A KR20080016206 A KR 20080016206A
Authority
KR
South Korea
Prior art keywords
language
voice data
data
setting
recognition
Prior art date
Application number
KR1020060078009A
Other languages
English (en)
Inventor
박소영
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to KR1020060078009A priority Critical patent/KR20080016206A/ko
Publication of KR20080016206A publication Critical patent/KR20080016206A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/005Language recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/36Accompaniment arrangements
    • G10H1/361Recording/reproducing of accompaniment for use with an external source, e.g. karaoke systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/033Headphones for stereophonic communication
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2220/00Input/output interfacing specifically adapted for electrophonic musical tools or instruments
    • G10H2220/005Non-interactive screen display of musical or status data
    • G10H2220/011Lyrics displays, e.g. for karaoke applications
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/25Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
    • G11B2220/2508Magnetic discs
    • G11B2220/2516Hard disks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

본 발명은, 언어 인식을 이용한 시스템 언어 설정방법에 관한 것으로, 예를 들어 디브이디(DVD)와 같은 다양한 유형의 기록매체에 기록된 데이터를 재생하는 가라오케 시스템 등에서, 시스템 자동 설정 모드시, 마이크를 통해 입력되는 사용자 음성 신호를 음성 데이터로 변환한 후, 상기 변환된 음성 데이터를, 장치 내의 비휘발성 메모리에 기 저장된 다수의 언어별 음성 데이터들과 비교하여, 유사성이 가장 높은 임의의 한 언어 데이터를 선별한 후, 시스템 언어로 자동 설정하고, 그 시스템 언어에 해당하는 메뉴 문자, 재생 오디오, 서브타이틀 데이터를 표시 및 재생함으로써, 예를 들어 여러 국가의 사용자들이 주로 사용하는 고유의 인사말 등을 이용하여, 가라오케 시스템의 시스템 언어를 보다 간편하게 자동으로 설정할 수 있게 되어, 사용자의 편리성을 크게 향상시킬 수 있게 되는 매우 유용한 발명인 것이다.
시스템 언어, 언어별 음성 데이터, 유사성, 데이터베이스, 언어 인식

Description

언어 인식을 이용한 시스템 언어 설정방법 {Method for setting system language using a language recognition}
도 1은 본 발명이 적용되는 가라오케 시스템에 대한 구성을 도시한 것이고,
도 2는 본 발명에 따라 저장 관리되는 언어별 음성 데이터베이스에 대한 실시예를 도시한 것이고,
도 3은 본 발명에 따른 언어 인식을 이용한 시스템 언어 설정방법에 대한 동작 흐름도를 도시한 것이고,
도 4는 본 발명에 적용되는 언어 인식 과정에 대한 실시예를 도시한 것이고,
도 5는 본 발명에 따라 자동 설정된 서브타이틀 언어가 표시되는 실시예를 도시한 것이다.
※ 도면의 주요부분에 대한 부호의 설명
10 : 광디스크 11 : 광픽업
12 : 기록/재생 시스템 13 : A/V 디코더
14 : 서브타이틀 디코더 15 : 믹서
16 : 하드디스크 17 : 마이컴
18 : 오에스디 생성부 19 : 언어 검출부
20 : 메모리
본 발명은, 언어 인식을 이용한 시스템 언어 설정방법에 관한 것으로, 예를 들어 가라오케 시스템 등에서, 사용자의 인사말 등과 같은 고유의 언어(Language)를 인식하여, 시스템 언어를 자동으로 설정할 수 있도록 하기 위한 언어 인식을 이용한 시스템 언어 설정방법에 관한 것이다.
일반적으로 고화질의 비디오와 고음질의 오디오를 기록 또는 재생할 수 있는 디브이디(DVD)와 같은 광디스크에는, 서로 다른 다양한 언어의 오디오 데이터들과 서브타이틀 데이터들이 함께 기록 저장되며, 또한 하드디스크(HDD)와 같은 대용량 기록매체에 기록되는 하나의 콘텐츠에도, 상기와 같이 서로 다른 다양한 언어의 오디오 데이터들과 서브타이틀 데이터들이 함께 기록될 수 있다.
한편, 상기 하드디스크 또는 광디스크에 기록된 데이터를 독출 재생하는 다양한 유형의 디지털 기기, 예를 들어, 가라오케 시스템에서는, 사용자가 설정하거나, 또는 시스템을 제조하는 과정에서 기 설정된 시스템 언어를 기준으로, 오에스디 영상의 메뉴 문자 언어와, 재생 오디오 언어, 그리고 서브타이틀 언어 등을 선별하여 재생 및 표시하게 된다.
예를 들어, 상기 가라오케 시스템에 설정된 시스템 언어가, 영어(English)이면, 오에스디 영상의 메뉴 문자를, 영어로 표시하고, 또한 광디스크 등에 기록된 다수의 오디오 데이터 중 영어에 해당하는 오디오 데이터를 선별 재생하게 되며, 또한, 다수의 서브타이틀 데이터 중 영어에 해당하는 서브타이틀 데이터를 선별 재생하여, 사용자가 영어 문자 및 오디오를 시청하게 된다.
그러나, 상기와 같이 시스템 언어가 영어로 설정된 가라오케 시스템이, 불어(French)를 사용하는 프랑스 등지로 판매 사용되는 경우, 현지 판매자 또는 사용자는, 가라오케 시스템에 기 설정된 시스템 언어를 영어에서 불어로 변경해야만 하기 때문에, 복잡한 다단계의 메뉴 화면을 보면서 수동으로 시스템 언어를 변경시켜야만 하는 문제점이 있다.
또한, 상기 메뉴 화면에는, 기 설정된 시스템 언어인 영어의 메뉴 문자가 표시되기 때문에, 영어에 익숙하지 못한 사용자의 경우, 시스템 언어를 자신이 원하지 언어로 용이하게 변경하지 못하게 되는 문제점이 있다.
따라서, 본 발명은 상기와 같은 문제점을 해결하기 위하여 창작된 것으로서, 예를 들어 가라오케 시스템 등에서, 시스템 자동 설정 모드시, 사용자의 인사말 등과 같은 고유의 언어를 인식하여, 시스템 언어를 자동으로 설정함으로써, 사용자에 적합한 언어의 메뉴 문자, 재생 오디오, 서브타이틀 데이터 등을 표시 및 재생할 수 있도록 하기 위한 언어 인식을 이용한 시스템 언어 설정방법을 제공하는 데, 그 목적이 있는 것이다.
상기와 같은 목적을 달성하기 위한 본 발명에 따른 언어 인식을 이용한 시스템 언어 설정방법은, 외부로부터 입력되는 음성 신호를 음성 데이터로 변환하는 1단계; 상기 변환된 음성 데이터를, 기 저장된 다수의 언어별 음성 데이터들과 비교하는 2단계; 및 상기 비교결과, 유사성이 높은 임의의 한 언어의 음성 데이터를 선별하여, 시스템 언어로 설정하는 3단계를 포함하여 이루어지는 것을 특징으로 하며,
또한, 상기 1단계는, 시스템 자동 설정 모드시, 마이크를 통해 입력되는 사용자 음성 신호를 음성 데이터로 변환하는 것이고, 상기 2단계는, 상기 변환된 음성 데이터를, 장치 내의 비휘발성 메모리에 기 저장된 다수의 언어별 음성 데이터들과 비교하는 것을 특징으로 한다.
또한, 상기 3단계는, 상기 비교결과, 유사성이 높은 임의의 한 언어의 음성 데이터를 선별하여, 시스템 언어로 자동 설정한 후, 그 시스템 언어에 해당하는 메뉴 문자, 재생 오디오, 서브타이틀 데이터를 표시 및 재생하는 것이고, 상기 비휘발성 메모리에는, 다수의 언어별 인사말에 해당하는 음성 데이터들이 데이터베이스로 저장 관리되는 것을 특징으로 한다.
이하, 본 발명에 따른 언어 인식을 이용한 시스템 언어 설정방법에 대한 바람직한 실시예에 대해, 첨부된 도면을 참조하여 상세히 설명한다.
우선, 본 발명에 따른 언어 인식을 이용한 시스템 언어 설정방법은, 다양한 유형의 디지털 기기에 적용될 수 있는 것으로, 예를 들어 도 1에 도시한 바와 같이, 본 발명이 적용되는 가라오케 시스템에는, 광디스크(10), 광픽업(11), 기록/재생 시스템(12), A/V 디코더(13), 서브타이틀 디코더(14), 믹서(15), 하드디스크(16), 마이컴(17), 오에스디 생성부(18), 언어 검출부(19), 그리고 메모리(20) 등이 포함 구성될 수 있다.
한편, 상기 메모리(20)는, 플래시(Flash) 메모리와 같은 비휘발성 메모리로서, 서로 다른 각 국가의 언어 음성 데이터(Language Voice Data)들이 데이터베이스로 저장 관리되는 데, 예를 들어 도 2에 도시한 바와 같이, 상기 언어 음성 데이터베이스에는, 한국어(Korean), 영어(English), 불어(French) 등과 같은 다양한 각 국가별 언어의 음성 데이터들이 구분 저장된다.
또한, 상기 각 국가별 언어에는, 해당 언어를 사용하는 사용자가 주로 쓰는 고유 인사말 등의 음성 데이터가 저장될 수 있는 데, 예를 들어, 상기 한국어(Korean)에는, '안녕하세요', '반갑습니다', '오랜만입니다' 등에 해당하는 인사말의 음성 데이터가 기록되고, 상기 영어(English)에는, 'Hello', 'Hi', 'See you' 등에 해당하는 인사말의 음성 데이터가 기록될 수 있다.
그리고, 상기 언어 검출부(19)에서는, 상기 마이컴(17)의 동작 제어에 따라, 마이크(Mic) 등을 통해 입력되는 사용자의 음성 신호를 수신하여, 디지털 음성 데이터로 변환한 후, 그 변환된 음성 데이터를, 상기 메모리(20)에 저장 관리되는 언어 음성 데이터와 비교하여, 가장 유사성이 높은 임의의 한 언어를 선별하게 된다.
또한, 상기 마이컴(17)에서는, 상기 선별된 언어를 시스템 언어로 자동 설정한 후, 그 시스템 언어에 해당하는 메뉴 문자, 재생 오디오, 서브타이틀 데이터를 표시 및 재생하게 되는 데, 이에 대해 상세히 설명하면 다음과 같다.
도 3은, 본 발명에 따른 언어 인식을 이용한 시스템 언어 설정방법에 대한 동작 흐름도를 도시한 것으로, 예를 들어 시스템 전원이 최초로 인가되어 시스템 부팅 동작을 처음으로 수행하거나, 또는 사용자의 요청에 따라 시스템 설정 모드로 진입하게 되면(S10), 상기 마이컴(17)에서는, 상기 언어 검출부(19)를 동작 제어하여, 마이크 음성 신호를 수신한 후, 그 음성 신호를 디지털 음성 데이터로 변환 처리하게 된다(S11).
그리고, 상기 메모리(20)에 저장된 각 언어별 음성 데이터와 비교하게 되는 데(S12), 예를 들어 상기 각 언어별 음성 데이터는, 사용자가 주로 사용하는 고유의 인사말 등에 해당하는 음성 데이터로서, 예를 들어, 영어를 사용하는 임의의 특정 사용자가, 'Hello' 라고 인사말을 하게 되면, 상기 언어 검출부(19)에서는, 그 음성 신호를 디지털 음성 데이터로 변환한 후, 상기 메모리(20)에 저장된 각 언어별 음성 데이터와 비교하여, 가장 유사성이 높은 음성 데이터(예: Hello)를 검색 인식하게 된다.
참고로, 상기와 같은 언어 인식 과정은, 예를 들어 도 4에 도시한 바와 같이, 각 발음에 해당하는 음성 데이터들을 서로 비교하여, 중첩(Overlap) 정도가 높은 프레임을 코드 북으로 검출한 후, 그 검출된 코드 북에 근거하여 언어를 인식하 는 공지 기술이 사용될 수 있다.
한편, 상기 마이컴(17)에서는, 상기와 같은 과정을 통해 가장 유사성이 높은 언어가 존재하게 되면(S13), 그 언어를 시스템 언어로 선별하게 되는 데(S14), 예를 들어 시스템 언어를 영어로 선별한 경우, 상기 마이컴(17)에서는, 오에스디 메뉴의 언어를 영어로 자동 설정하게 된다(S15).
그리고, 상기 광디스크(10) 또는 하드디스크(16)로부터 재생되는 다양한 언어의 오디오 중, 상기 영어에 해당하는 재생 오디오만이 출력될 수 있도록 재생 오디오를 영어로 설정하게 되며(S16), 또한 상기 광디스크(10) 또는 하드디스크(16)로부터 재생되는 다양한 언어의 서브타이틀 중, 상기 영어에 해당하는 서브타이틀만이 출력될 수 있도록 서브타이틀 언어를 영어로 설정하게 된다(S17).
이후, 상기 마이컴(17)에서는, 시스템 설정 모드를 해제하게 되면(S18), 상기와 같이 설정된 언어를 기준으로 사용자가 요청하는 해당 동작을 수행하게 되는 데(S19), 예를 들어, 도 5에 도시한 바와 같이, 디브이디(DVD)에서 재생되는 다수의 서브타이틀 중 영어에 해당하는 서브타이틀이 메인 비디오 데이터에 중첩 표시된다.
이상, 전술한 본 발명의 바람직한 실시예는, 예시의 목적을 위해 개시된 것으로, 당업자라면, 이하 첨부된 특허청구범위에 개시된 본 발명의 기술적 사상과 그 기술적 범위 내에서, 또다른 다양한 실시예들을 개량, 변경, 대체 또는 부가 등이 가능할 것이다.
상기와 같이 이루어지는 본 발명에 따른 언어 인식을 이용한 시스템 언어 설정방법은, 예를 들어 디브이디(DVD)와 같은 다양한 유형의 기록매체에 기록된 데이터를 재생하는 가라오케 시스템 등에서, 시스템 자동 설정 모드시, 마이크를 통해 입력되는 사용자 음성 신호를 음성 데이터로 변환한 후, 상기 변환된 음성 데이터를, 장치 내의 비휘발성 메모리에 기 저장된 다수의 언어별 음성 데이터들과 비교하여, 유사성이 가장 높은 임의의 한 언어 데이터를 선별한 후, 시스템 언어로 자동 설정하고, 그 시스템 언어에 해당하는 메뉴 문자, 재생 오디오, 서브타이틀 데이터를 표시 및 재생함으로써, 예를 들어 여러 국가의 사용자들이 주로 사용하는 고유의 인사말 등을 이용하여, 가라오케 시스템의 시스템 언어를 보다 간편하게 자동으로 설정할 수 있게 되어, 사용자의 편리성을 크게 향상시킬 수 있게 되는 매우 유용한 발명인 것이다.

Claims (5)

  1. 외부로부터 입력되는 음성 신호를 음성 데이터로 변환하는 1단계;
    상기 변환된 음성 데이터를, 기 저장된 다수의 언어별 음성 데이터들과 비교하는 2단계; 및
    상기 비교결과, 유사성이 높은 임의의 한 언어의 음성 데이터를 선별하여, 시스템 언어로 설정하는 3단계를 포함하여 이루어지는 것을 특징으로 하는 언어 인식을 이용한 시스템 언어 설정방법.
  2. 제 1항에 있어서,
    상기 1단계는, 시스템 자동 설정 모드시, 마이크를 통해 입력되는 사용자 음성 신호를 음성 데이터로 변환하는 것을 특징으로 하는 언어 인식을 이용한 시스템 언어 설정방법.
  3. 제 1항에 있어서,
    상기 2단계는, 상기 변환된 음성 데이터를, 장치 내의 비휘발성 메모리에 기 저장된 다수의 언어별 음성 데이터들과 비교하는 것을 특징으로 하는 언어 인식을 이용한 시스템 언어 설정방법.
  4. 제 1항에 있어서,
    상기 3단계는, 상기 비교결과, 유사성이 높은 임의의 한 언어의 음성 데이터를 선별하여, 시스템 언어로 자동 설정한 후, 그 시스템 언어에 해당하는 메뉴 문자, 재생 오디오, 서브타이틀 데이터를 표시 및 재생하는 것을 특징으로 하는 언어 인식을 이용한 시스템 언어 설정방법.
  5. 제 3항에 있어서,
    상기 비휘발성 메모리에는, 다수의 언어별 인사말에 해당하는 음성 데이터들이 데이터베이스로 저장 관리되는 것을 특징으로 하는 언어 인식을 이용한 시스템 언어 설정방법.
KR1020060078009A 2006-08-18 2006-08-18 언어 인식을 이용한 시스템 언어 설정방법 KR20080016206A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020060078009A KR20080016206A (ko) 2006-08-18 2006-08-18 언어 인식을 이용한 시스템 언어 설정방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020060078009A KR20080016206A (ko) 2006-08-18 2006-08-18 언어 인식을 이용한 시스템 언어 설정방법

Publications (1)

Publication Number Publication Date
KR20080016206A true KR20080016206A (ko) 2008-02-21

Family

ID=39384370

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060078009A KR20080016206A (ko) 2006-08-18 2006-08-18 언어 인식을 이용한 시스템 언어 설정방법

Country Status (1)

Country Link
KR (1) KR20080016206A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021221186A1 (ko) * 2020-04-27 2021-11-04 엘지전자 주식회사 디스플레이 장치 및 그의 동작 방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021221186A1 (ko) * 2020-04-27 2021-11-04 엘지전자 주식회사 디스플레이 장치 및 그의 동작 방법

Similar Documents

Publication Publication Date Title
US7734148B2 (en) Method for reproducing sub-picture data in optical disc device, and method for displaying multi-text in optical disc device
KR960700510A (ko) 다종 언어 대응형 기록매체 및 재생장치
US20080195386A1 (en) Method and a Device For Performing an Automatic Dubbing on a Multimedia Signal
US20030190148A1 (en) Displaying multi-text in playback of an optical disc
US7333722B2 (en) Disc playback apparatus with display of key images
KR20040024113A (ko) 디지털 다기능 디스크 장치에서의 재생 제어방법
US8224152B2 (en) Apparatus and method for reproducing text file in digital video device
KR100584551B1 (ko) 어학 학습용 디브디 시스템 및 오디오 스트림 처리 방법
KR20080016206A (ko) 언어 인식을 이용한 시스템 언어 설정방법
KR20040081992A (ko) 오디오 데이터의 텍스트 변환 및 디스플레이 방법
JP2006134506A (ja) ディジタル映像再生装置
JP2007165981A (ja) 情報処理装置およびその制御プログラム
CA2365010C (en) Data entry via on-screen display
JP4872249B2 (ja) オンスクリーンディスプレイ装置
JP2010081149A (ja) 情報記録再生装置
JP2007243842A (ja) 情報再生装置および情報再生方法
KR20150055921A (ko) 동영상 재생 제어 방법 및 장치
JP2007179592A (ja) 情報再生装置
KR100584172B1 (ko) 광디스크의 서브타이틀 데이터 음성 변환장치 및 방법
JP2001312288A (ja) 音楽データ処理装置
KR20070006166A (ko) 디지털 비디오 기기에서의 텍스트 파일 재생방법
JP3959721B2 (ja) 光ディスク再生装置
JP2768833B2 (ja) 多種言語対応型記録媒体の再生装置
JP2001057027A (ja) 画像ディスク再生装置
JP2007193863A (ja) 光ディスク装置

Legal Events

Date Code Title Description
A201 Request for examination
E601 Decision to refuse application