KR20230020711A - 음성인식성능 향상을 위한 영어 문자 입력 장치 및 이를 이용한 방법 - Google Patents

음성인식성능 향상을 위한 영어 문자 입력 장치 및 이를 이용한 방법 Download PDF

Info

Publication number
KR20230020711A
KR20230020711A KR1020210102437A KR20210102437A KR20230020711A KR 20230020711 A KR20230020711 A KR 20230020711A KR 1020210102437 A KR1020210102437 A KR 1020210102437A KR 20210102437 A KR20210102437 A KR 20210102437A KR 20230020711 A KR20230020711 A KR 20230020711A
Authority
KR
South Korea
Prior art keywords
input
english
characters
frequency
character
Prior art date
Application number
KR1020210102437A
Other languages
English (en)
Inventor
김동현
김상훈
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020210102437A priority Critical patent/KR20230020711A/ko
Priority to US17/517,211 priority patent/US20230044217A1/en
Publication of KR20230020711A publication Critical patent/KR20230020711A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0488Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
    • G06F3/04883Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures for inputting data by handwriting, e.g. gesture or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0236Character input methods using selection techniques to select from displayed items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0488Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
    • G06F3/04886Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures by partitioning the display area of the touch-screen or the surface of the digitising tablet into independently controllable areas, e.g. virtual keyboards or menus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

음성인식성능 향상을 위한 영어 문자 입력 장치 및 이를 이용한 방법이 개시된다. 본 발명의 일실시예에 따른 영어 문자 입력 방법은 영어 문자 별 사용 빈도와 영어 문자들 간의 사용 연관성을 고려하여 복수개의 입력칸들로 구성된 입력 화면에 전체 영어 문자들을 배치하는 단계; 상기 복수개의 입력칸들의 위치와 입력칸 내에 배치된 영어 문자 위치를 고려하여 상기 전체 영어 문자들 각각의 입력 방식을 설정하는 단계; 및 상기 입력 방식에 상응하는 터치 기반 입력으로 영어 문자를 입력하는 단계를 포함한다.

Description

음성인식성능 향상을 위한 영어 문자 입력 장치 및 이를 이용한 방법 {APPARATUS FOR INPUTING ENGLISH TEXT FOR IMPROVING SPEECH RECOGNITION PERFORMANCE AND METHOD USING THE SAME}
본 발명은 음성인식성능 향상을 위한 터치스크린 기반의 영어 문자 입력 기술에 관한 것으로, 특히 스마트폰과 같은 터치스크린 입력 방식을 지원하는 단말에서 음성인식의 오류수정을 위해서 간편하게 영어 문자를 입력하는 기술에 관한 것이다.
일반적인 모바일 문자입력 방법으로 사용되는 쿼티(QWERTY) 방식은, 컴퓨터 영어 자판의 입력 방식을 그대로 따라간 방법이다. 이러한 쿼티 방법은 기본 키보드 입력 방법을 그대로 사용하기 때문에 영어 알파벳 횟수만큼 터치를 해야하고, 입력 구분칸이 많고 크기도 작아서 입력 오류가 발생하기 쉽다.
다른 모바일 문자입력 방법으로, 모바일 단말기의 3x3 입력칸 각각에 영어 알파벳을 3개씩 할당하고 순차적으로 배치한 뒤에 터치, 이중터치, 삼중터치를 통해 해당 알파벳을 입력하는 방법이 있다. 이 방법은, 순차적인 배치로 알파벳 위치를 쉽게 파악할 수 있지만, 이중터치와 삼중터치로 문자 하나당 평균 입력 터치 수가 많아지는 단점이 있다. 또한, 같은 칸에 있는 문자를 연속으로 입력하려면 터치 속도를 조절해야 하므로 입력오류가 발생하기 쉽다.
또 다른 모바일 문자입력 방법으로, 플릭 제스처 입력을 적용한 방법이 있다. 여기서 플릭은 터치 스크린의 한 지점을 손가락으로 누른 후 특정 방향으로 쓸 듯이 이동하면 해당 방향으로 리스트가 스크롤되는 방법이다. 따라서, 모바일 단말기의 3x3 입력칸 각각에 할당된 영어 알파벳을 특정 방향으로 플릭하면 문자가 스크롤되면서 그 다음이나 이전 문자를 선택할 수 있다. 그러나, 해당 입력칸에서 스크롤된 문자가 보여지고 선택하기까지 시간이 지체되기 때문에 빠르게 연속입력을 원하는 사용자에게는 불편함이 발생할 수 있다.
또 다른 모바일 문자 입력 방법으로는, 모바일 단말기의 3x3 입력칸을 대상으로 드래그를 이용하는 방법이 있다. 예를 들어, 3x3 입력칸 각각에 영어 알파벳이 3개씩 할당된 상태에서 드래그를 시작한 칸과 드래그가 끝나는 칸이 같은 입력칸이면 해당 칸의 첫 번째 알파벳이 입력된다. 그리고, 드래그를 통해 수평 또는 수직으로 이동하는 입력칸의 개수만큼 드래그가 끝나는 칸의 N번째 알파벳이 입력된다. 즉, 기본 방법에서 이중 터치, 삼중 터치를 드래그로 대체하는 방법이지만, 같은 입력을 위해 매번 드래그 시작과 끝에 따른 칸 이동수를 고려해야 하는 단점이 있고, 칸의 세 번째 또는 네 번째 문자를 연속 입력을 위해 드래그 해야하는 이동칸이 급격히 많아지는 문제도 있다.
한국 공개 특허 제10-2011-0066414호, 2011년 6월 17일 공개(명칭: 터치스크린을 이용한 영문자 입력방법)
본 발명의 목적은 모바일 단말에서 음성인식기의 성능향상을 위하여 사용자가 인식률을 높여야 하는 주요 단어들을 터치 스크린을 이용하여 효과적으로 빠르게 입력하기 위한 방법을 제공하는 것이다.
또한, 본 발명의 목적은 모바일 단말의 입력칸 크기가 작아져서 발생하는 입력 오류를 줄이기 위해 적은 입력 키 개수를 이용하여 문자를 효율적으로 입력할 수 있는 방안을 제시하는 것이다.
또한, 본 발명의 목적은 문자를 입력하기 위한 동작 횟수나 동작 크기를 줄인 직관적인 입력 방법을 제공함으로써 피로감은 감소시키고 사용성은 향상시킬 수 있는 문자 입력 방법을 제공하는 것이다.
또한, 본 발명의 목적은 한 손을 이용한 터치와 드래그만으로 모든 문자를 입력할 수 있고, 입력이 끝나면 바로 음성녹음이 가능한 모바일 단말에서의 문자 입력 방법을 제공하는 것이다.
상기한 목적을 달성하기 위한 본 발명에 따른 영어 문자 입력 방법은, 영어 문자 별 사용 빈도와 영어 문자들 간의 사용 연관성을 고려하여 복수개의 입력칸들로 구성된 입력 화면에 전체 영어 문자들을 배치하는 단계; 상기 복수개의 입력칸들의 위치와 입력칸 내에 배치된 영어 문자 위치를 고려하여 상기 전체 영어 문자들 각각의 입력 방식을 설정하는 단계; 및 상기 입력 방식에 상응하는 터치 기반 입력으로 영어 문자를 입력하는 단계를 포함한다.
이 때, 복수개의 입력칸들은 3X3 또는 3X4에 상응하고, 상기 입력 화면의 중심에 기능키를 포함할 수 있다.
이 때, 입력 방식은 터치, 이중터치, 드래그 및 홀드 중 어느 하나에 상응하게 설정될 수 있다.
이 때, 기능키는 상기 입력 방식에 따라 띄어쓰기 입력, 마침표 입력 및 음성녹음을 포함하는 복수의 기능들을 제공할 수 있다.
이 때, 전체 영어 문자들은 상기 사용 빈도에 따라 저빈도 문자, 중빈도 문자, 고빈도 문자로 구분되되, 상기 고빈도 문자는 터치를 통해 입력되고, 상기 중빈도 문자는 이중터치 또는 입력칸 외부로의 드래그 중 어느 하나를 통해 입력되고, 상기 저빈도 문자는 상기 복수개의 입력칸들 중 중심칸의 경계로 드래그를 통해 입력될 수 있다.
이 때, 고빈도 문자는 상기 중빈도 문자 및 상기 저빈도 문자보다 상기 입력 화면에 크게 표시될 수 있다.
이 때, 상기 전체 영어 문자들 각각의 입력 방식에 따라 입력 방식을 가이드하기 위한 화살표가 영어 문자와 함께 디스플레이될 수 있다.
이 때, 드래그 시작 위치, 드래그 종료 위치, 드래그 방향이 바뀌는 지점 및 드래그 홀드 지점을 고려하여 연속적으로 선택된 복수개의 영어 문자들을 입력할 수 있는 연속 드래그 모드를 제공할 수 있다.
이 때, 기능키를 통해 음성녹음이 선택된 경우, 입력된 영어 문자로 구성된 단어의 음성녹음을 위한 음성녹음 기능을 제공할 수 있다.
이 때, 상기 입력 화면에서 상기 전체 영어 문자가 배치된 위치를 제외한 나머지 공간에 사용 빈도가 기설정된 수준 이상인 특수 문자를 배치하는 단계를 더 포함할 수 있다.
이 때, 입력된 영어 문자로 구성된 단어와 상기 음성녹음 기능을 통해 녹음된 단어의 음성 데이터를 음성인식 시스템에 제공하는 단계를 더 포함할 수 있다.
또한, 본 발명의 일실시예에 따른 영어 문자 입력 장치는 영어 문자 별 사용 빈도와 영어 문자들 간의 사용 연관성을 고려하여 복수개의 입력칸들로 구성된 입력 화면에 전체 영어 문자들을 배치하고, 상기 복수개의 입력칸들의 위치와 입력칸 내에 배치된 영어 문자 위치를 고려하여 상기 전체 영어 문자들 각각의 입력 방식을 설정하고, 상기 입력 방식에 상응하는 터치 기반 입력으로 영어 문자를 입력하는 프로세서; 및 상기 전체 영어 문자들 각각 설정된 입력 방식을 저장하는 메모리를 포함한다.
이 때, 복수개의 입력칸들은 3X3 또는 3X4에 상응하고, 상기 입력 화면의 중심에 기능키를 포함할 수 있다.
이 때, 입력 방식은 터치, 이중터치, 드래그 및 홀드 중 어느 하나에 상응하게 설정될 수 있다.
이 때, 기능키는 상기 입력 방식에 따라 띄어쓰기 입력, 마침표 입력 및 음성녹음을 포함하는 복수의 기능들을 제공할 수 있다.
이 때, 전체 영어 문자들은 상기 사용 빈도에 따라 저빈도 문자, 중빈도 문자, 고빈도 문자로 구분되되, 상기 고빈도 문자는 터치를 통해 입력되고, 상기 중빈도 문자는 이중터치 또는 입력칸 외부로의 드래그 중 어느 하나를 통해 입력되고, 상기 저빈도 문자는 상기 복수개의 입력칸들 중 중심칸의 경계로 드래그를 통해 입력될 수 있다.
이 때, 고빈도 문자는 상기 중빈도 문자 및 상기 저빈도 문자보다 상기 입력 화면에 크게 표시될 수 있다.
이 때, 상기 전체 영어 문자들 각각의 입력 방식에 따라 입력 방식을 가이드하기 위한 화살표가 영어 문자와 함께 디스플레이될 수 있다.
이 때, 프로세서는 드래그 시작 위치, 드래그 종료 위치, 드래그 방향이 바뀌는 지점 및 드래그 홀드 지점을 고려하여 연속적으로 선택된 복수개의 영어 문자들을 입력할 수 있는 연속 드래그 모드를 제공할 수 있다.
이 때, 기능키를 통해 음성녹음이 선택된 경우, 입력된 영어 문자로 구성된 단어의 음성녹음을 위한 음성녹음 기능을 제공할 수 있다.
이 때, 프로세서는 상기 입력 화면에서 상기 전체 영어 문자가 배치된 위치를 제외한 나머지 공간에 사용 빈도가 기설정된 수준 이상인 특수 문자를 배치할 수 있다.
이 때, 프로세서는 입력된 영어 문자로 구성된 단어와 상기 음성녹음 기능을 통해 녹음된 단어의 음성 데이터를 음성인식 시스템에 제공할 수 있다.
본 발명에 따르면, 모바일 단말에서 음성인식기의 성능향상을 위하여 사용자가 인식률을 높여야 하는 주요 단어들을 터치 스크린을 이용하여 효과적으로 빠르게 입력하기 위한 방법을 제공할 수 있다.
또한, 본 발명은 문자를 입력하기 위한 동작 횟수나 동작 크기를 줄인 직관적인 입력 방법을 제공함으로써 피로감은 감소시키고 사용성은 향상시킬 수 있는 문자 입력 방법을 제공할 수 있다.
또한, 본 발명은 한 손을 이용한 터치와 드래그만으로 모든 문자를 입력할 수 있고, 입력이 끝나면 바로 음성녹음이 가능한 모바일 단말에서의 문자 입력 방법을 제공할 수 있다.
도 1은 본 발명의 일실시예에 따른 음성인식성능 향상을 위한 영어 문자 입력 방법을 나타낸 동작흐름도이다.
도 2는 본 발명에 따른 3X3 입력 화면의 일 예를 나타낸 도면이다.
도 3은 도 2에 도시된 3X3 입력 화면에서 터치로 입력 가능한 문자의 일 예를 나타낸 도면이다.
도 4는 도 2에 도시된 3X3 입력 화면에서 이중터치 또는 드래그로 입력 가능한 문자의 일 예를 나타낸 도면이다.
도 5는 도 2에 도시된 3X3 입력 화면에서 중심 칸에서 외각 칸 방향의 드래그로 입력 가능한 문자의 일 예를 나타낸 도면이다.
도 6은 도 2에 도시된 3X3 입력 화면에서 외각 칸에서 중심 칸 방향의 드래그로 입력 가능한 문자의 일 예를 나타낸 도면이다.
도 7은 본 발명에 따른 3X3 입력 화면에 추가 기능키가 배치된 일 예를 나타낸 도면이다.
도 8은 본 발명에 따른 3X3 입력 화면의 연속 드래그 모드에서 문자 별 드래그 영역의 일 예를 나타낸 도면이다.
도 9 내지 도 10은 본 발명에 따른 3X3 입력 화면의 연속 드래그 모드를 이용하여 단어를 입력하는 일 예를 나타낸 도면이다.
도 11은 본 발명에 따른 3X3 입력 화면의 다른 예를 나타낸 도면이다.
도 12는 본 발명에 따른 3X4 입력 화면의 일 예를 나타낸 도면이다.
도 13은 본 발명에 따른 3X4 입력 화면의 연속 드래그 모드에서 문자 별 드래그 영역의 일 예를 나타낸 도면이다.
도 14 내지 도 15는 본 발명에 따른 3X4 입력 화면의 연속 드래그 모드를 이용하여 단어를 입력하는 일 예를 나타낸 도면이다.
도 16은 본 발명의 일실시예에 따른 영어 문자 입력 과정을 상세하게 나타낸 동작흐름도이다.
도 17는 본 발명의 일실시예에 따른 음성인식성능 향상을 위한 영어 문자 입력 장치를 나타낸 도면이다.
본 발명을 첨부된 도면을 참조하여 상세히 설명하면 다음과 같다. 여기서, 반복되는 설명, 본 발명의 요지를 불필요하게 흐릴 수 있는 공지 기능, 및 구성에 대한 상세한 설명은 생략한다. 본 발명의 실시형태는 당 업계에서 평균적인 지식을 가진 자에게 본 발명을 보다 완전하게 설명하기 위해서 제공되는 것이다. 따라서, 도면에서의 요소들의 형상 및 크기 등은 보다 명확한 설명을 위해 과장될 수 있다.
이하, 본 발명에 따른 바람직한 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.
최근에는 음성인식 성능이 향상되면서 모바일 디바이스의 문자 입력을 대체하기도 하지만, 여전히 문자입력은 모바일 기기에서 중요한 기능에 속한다. 또한, 사용빈도가 드문 고유명사나 오인식되는 단어의 인식률을 높이기 위해 사전 학습과 사후 보정을 위한 방법으로 문자입력 기능을 사용할 수 있다.
즉, 모바일 단말을 통한 음성인식 기술은 사용자가 중요하게 여기는 단어들에 대해 인식 성능의 향상을 필요로 한다. 그러나, 고유명사나 특정 사람의 이름과 같이 일상생활에서 발생하는 빈도가 적은 단어는 인식률이 떨어질 수 밖에 없다. 이를 개선하기 위해서 사용자 별로 인식성능 향상이 필요하다고 판단되는 단어들을 사전에 입력하거나 또는 오류가 나는 인식결과의 단어를 수정하기 위한 용도로 문자 입력을 활용할 수 있다.
이렇듯 모바일 디바이스에서의 문자 입력은 지속적으로 중요한 역할을 담당하고 있고, 문자 입력 시 짧은 문장이나 단어들을 보다 정확하고 빠르게 입력하는 것이 중요시 되고 있다.
그러나, 영어와 같은 문자는 26개의 알파벳을 가지고 있기 때문에 쿼티 방법으로 모바일 기기와 같은 작은 입력화면에 입력하기에는 문자 구분영역이 작아서 빠르고 정확하게 입력하기에 불편한 점이 있다. 영어는 전세계에서 가장 많이 사용하는 문자이고, 모국어가 아니어도 외래어로 영어를 활용하는 경우가 많기 때문에 영어를 빠르고 정확하게 입력하기 위한 방법은 반드시 필요하다.
이를 극복하기 위해 3X3 입력칸에 한 칸당 문자를 3개씩 할당하여 입력하는 방법을 사용하지만, 여러 번의 터치를 통해 입력하기 때문에 문자당 터치 수가 증가하고, 같은 칸에 있는 다른 문자들을 연속 입력할 때 오입력이 발생하기 쉬운 단점이 존재한다.
본 발명에서는 이러한 문제점들을 해결하기 위해, 크기가 제한된 터치 스크린을 구비한 모바일 단말기에서 편리한 입력을 위해 영어 알파벳 26문자를 사용빈도에 따라 분류하고, 분류된 문자 별 입력 방식을 설정함으로써 보다 효율적으로 문자를 입력할 수 있는 새로운 문자입력 방법을 제시하고자 한다.
이러한 방법을 통해 한 손 입력으로 가장 편한 구조인 3X3 입력칸을 통해 문자 입력을 빠르고 용이하게 할 수 있고, 문자 입력에 대한 음성을 녹음기능을 함께 제공함으로써 모바일 음성인식 성공율을 향상시킬 수 있도록 한다.
도 1은 본 발명의 일실시예에 따른 음성인식성능 향상을 위한 영어 문자 입력 방법을 나타낸 동작흐름도이다.
도 1을 참조하면, 본 발명의 일실시예에 따른 음성인식성능 향상을 위한 영어 문자 입력 방법은 영어 문자 별 사용 빈도와 영어 문자들 간의 사용 연관성을 고려하여 복수개의 입력칸들로 구성된 입력 화면에 전체 영어 문자들을 배치한다(S110).
이 때, 복수개의 입력칸들은 3X3 또는 3X4에 상응하고, 입력 화면의 중심에 기능키를 포함할 수 있다.
예를 들어, 3X3 또는 3X4에 상응하는 복수개의 입력칸들은 총 9개 또는 12개의 터치 영역이 존재할 수 있다. 이렇게 복수개의 입력칸들로 구성된 입력 화면은 숫자키 입력과 같이 상중하 그리고 좌중우의 위치가 존재하므로 상대적으로 입력키의 위치를 기억하기 쉽고, 사용자의 한 손으로도 쉽게 입력할 수 있다는 장점이 존재한다.
이 때, 전체 영어 문자들은 사용 빈도에 따라 저빈도 문자, 중빈도 문자, 고빈도 문자로 구분될 수 있다.
예를 들어, 옥스퍼드 사전에서 조사하여 발표한 영어문자 빈도 순위를 활용하여, 사용 빈도가 높은 모음 'E, A, I, O'와 자음 'N, S, T, R'을 고빈도 문자로 분류하고, 그 다음으로 사용 빈도가 높은 모음 'U', 자음 'M, H, C, G, B, P, D'를 중빈도 문자로 분류하고, 나머지 문자들을 저빈도 문자로 분류할 수 있다.
이 때, 고빈도 문자는 중빈도 문자 및 저빈도 문자보다 입력 화면에 크게 표시될 수 있다.
예를 들어, 도 2를 참조하면, 입력 화면(200)은 3X3에 상응하는 복수개의 입력칸들로 구성될 수 있고, 중심에 기능키(210)를 포함할 수 있다. 입력 화면(200)을 보면 고빈도 문자인 모음 'E, A, I, O'와 자음 'N, S, T, R'을 나머지 중빈도 문자 및 저빈도 문자보다 크게 표시함으로써 사용자가 자주 사용하는 문자의 위치를 빠르게 파악할 수 있도록 할 수 있다.
이 때, 전체 문자들은 문자 이미지로 서로 연상되는 문자끼리 배치함으로써 사용자가 기억하기 쉽게 배치될 수 있다.
예를 들어, 도 2에 도시된 것처럼, 8개의 고빈도 문자들은 나머지 문자들 보다 비교적 중앙에 위치하도록 배치시키되, 8개의 고빈도 문자들 중에서도 모음들을 중심축에 할당함으로써 사용자의 편의성을 향상시킬 수 있다.
이 후, 중빈도 문자들을 이미지 연관성 있는 문자와 같은 칸에 할당할 수 있다. 즉, 도 2에 도시된 것처럼 'M'은 'N'과 같은 칸에, 'H'는 'A'와 같은 칸에, 'C'는 'S'와 같은 칸에, 'G'는 'O'와 같은 칸에, 'B'는 'E'와 같은 칸에, 'P'는 'R'과 같은 칸에, 'U'는 'I'와 같은 칸에, 'D'는 'T'와 같은 칸에 배치할 수 있다.
이 후, 나머지 저빈도 문자들을 배치할 수 있는데, 대칭되는 문자 이미지인 'J'와 'L'을 각각 좌중단칸에서 하단칸으로 우중단칸에서 하단칸으로 드래그 하도록 경계선에 배치하여 이미지 대칭으로 기억하기 쉽게 할 수도 있다.
이 때, 입력 화면(200)의 중심부분에는 기능키(210)를 표시할 수 있는데, 기능키(210)는 그 입력 방식에 따라 다양한 기능을 제공하는 키에 상응할 수 있다.
추후에 자세하게 설명하겠지만, 기능키(210)는 입력 방식에 따라 띄어쓰기, 마침표 입력, 음성녹음 등의 기능을 제공할 수 있다.
예를 들어, 도 3에 도시된 기능키 '
Figure pat00001
' 를 길게 홀드 터치하면 팝업 이미지와 함께 음성녹음 기능이 진행되고 있음을 나타낼 수 있고, 홀드 터치를 종료하면 음성녹음 종료와 함께 팝업 이미지로 사라질 수 있다.
다른 예를 들어, 사용빈도가 높은 'space'키에 해당하는 띄어쓰기 기능을 기능키(210)에 할당할 수도 있다.
본 발명에서는 이러한 음성녹음 기능을 제공함으로써 사용자가 입력 화면(200)을 통해 입력한 단어와 음성이 매칭되도록하여 음성인식 기능을 향상시키는데 사용할 수 있다.
이와 같은 문자의 배치는 사용자 편의성 측면에서 매우 중요하다. 따라서, 본 발명에서의 문자의 배치는 도면에 개시된 예시에 한정되지 않고 설정 변경가능할 수 있다.
또한, 본 발명의 일실시예에 따른 음성인식성능 향상을 위한 영어 문자 입력 방법은 복수개의 입력칸들의 위치와 입력간 내에 배치된 영어 문자 위치를 고려하여 전체 영어 문자들 각각의 입력 방식을 설정한다(S120).
이 때, 입력 방식은 터치, 이중터치, 드래그 및 홀드 중 어느 하나에 상응하게 설정될 수 있다.
이 때, 영어는 26개의 알파벳으로 구성된 문자이므로 3X3 또는 3X4에 해당하는 9개 또는 12개의 입력칸으로는 모든 문자들을 표시하기 부족할 수 있다. 따라서, 본 발명에서는 터치, 이중터치, 드래그 및 홀드 등의 입력 방식을 결합하여 26개의 알파벳들을 입력할 수 있는 방법을 제안하고자 한다.
이 때, 터치 방식이 드래그 방식보다 좀 더 빠르기 때문에 고빈도 문자는 터치 방식으로, 중빈도 문자는 비교적 뚜렷하게 구별되는 외부 방향 드래그 방식으로, 저빈도 문자는 내부 드래그 방식으로 입력되도록 설정할 수 있다.
이와 같이, 본 발명에서는 26개의 영어 문자들을 사용빈도에 따라 구별하고, 사용빈도에 따라 각각의 입력칸에 문자들을 배치할 수 있다.
이 때, 3X3 입력 화면에 상응하는 9칸의 터치 영역에서 드래그 입력은 그 동작을 최소화하기 위해서 입력칸 안에서 밖으로 칸의 경계를 넘어서는 드래그 동작으로 문자가 입력되도록 할 수 있다. 이러한 칸의 경계는 칸의 기본 형태가 사각형이므로 상하좌우가 될 수도 있고, 모서리 경계인 대각선이 될 수도 있다.
이러한 드래그 방향에 따라 의미를 부여하는 방식으로 알파벳 26 문자를 모두 입력할 수 있다.
예를 들어, 도 3에 도시된 고빈도 문자들인 'E, A, R, I, O, T, N, S'는 한번의 터치로 입력될 수 있고, 도 4에 도시된 중빈도 문자들인 'C, U, D, P, M, H, G, B'는 드래그 또는 이중터치로 입력될 수 있고, 도 5 내지 도 6에 도시된 저빈도 문자들인 'F, Y, W, K, V, X, Z, Q, J, L'은 상하좌우 또는 대각선 방향으로의 드래그로 입력될 수 있다.
이 때, 드래그를 통해 입력되는 문자들에 대해 상세하게 설명하면, 도 5에 도시된 'F'는 상방향 드래그, 'Y'는 하방향 드래그, 'K'는 좌방향 드래그, 'W'는 우방향 드래그를 통해 입력될 수 있다. 또한, 도 6에 도시된 'Q'는 좌상단에 위치하는 외각칸에서 중심칸 방향으로 드래그, 'Z'는 우상단에 위치하는 외각칸에서 중심칸 방향으로 드래그, 'X'는 좌하단에 위치하는 외각칸에서 중심칸 방향으로 드래그, 'V'는 우하단에 위치하는 외각칸에서 중심칸 방향으로 드래그, 'J'는 좌중단에 위치하는 외각칸에서 하방향으로 드래그, 'L'은 우중단에 위치하는 외각칸에서 하방향으로 드래그를 통해 입력될 수 있다.
이 때, 도 3 내지 도 6에 도시된 것처럼 자주 선택되는 고빈도 문자는 입력칸의 중심축에 문자를 배치하고, 같은 칸에 배치되는 고빈도 문자와 중빈도 문자는 유사점이 있는 문자 이미지 형태로 배치함으로써 위치한 문자들을 쉽게 기억 또는 연상할 수 있도록 할 수 있다.
이 때, 드래그를 통해 입력되는 문자들은 각각의 드래그 방향에 해당하는 직선이 문자 내에 존재하기 때문에 화살표로 덧씌워 이미지화함으로써 사용자가 문자의 위치와 드래그 방향을 쉽게 유추하도록 할 수 있다. 즉, 사용자가 드래그 방향에 대한 연상을 쉽게 하기 위해서 화살표 방향 이미지를 문자와 오버레이하여 노출시킬 수도 있다.
또한, 도 7을 참조하면, 영어 문자 'N'에서 'A'방향 또는 반대방향으로 드래그하여 연속 드래그 모드로 전환하게 위한 특수키(710)를 입력할 수 있고, 영어 문자 'S'에서 'A'방향으로 드래그하여 한 문자 삭제를 위한 특수키(720)를 입력할 수 있고, 영어 문자 'N'에서 'O'방향으로 드래그하여 기호들을 입력하기 위한 특수키(730)를 입력할 수 있고, 영어 문자 'S'에서 'E'방향으로 드래그하여 숫자키를 입력하기 위한 특수키(740)를 입력할 수 있고, 영어 문자 'T'에서 'I'방향 또는 반대방향으로 드래그하여 줄 바꿈을 위한 특수키(750)를 입력할 수 있고, 영어 문자 'R'에서 'I'방향 또는 반대방향으로 드래그하여 대소문자 전환을 위한 특수키(760)를 입력할 수 있다.
또한, 도 11에 도시된 것처럼 입력 화면의 중심에 기능키 대신에 터치로 입력할 수 있는 문자(1110)를 배치하는 방식으로 전체 문자의 배치를 변경할 수도 있다. 즉, 입력화면의 중심칸에 소문자 'i'를 배치하고 터치하면 'I'를 입력하고, 이중 터치하면 'J'를 입력하고, 길게 홀드 터치하면 소문자 'i'로 연상되는 마이크 입력이 되어 음성녹음 기능이 제공되도록 활용할 수도 있다. 또한, 마침표를 입력하기 위한 특수키(1130)와 한칸띄움을 위한 특수키(1140)를 좌우 드랙 영역으로 표시하고, 이미지 연상에 따라 드래그 방법을 함께 알려주도록 구성할 수 있다.
또한, 도 12를 참조하면, 본 발명의 입력화면은 4X3 형태로 확장하여 사용할 수 있다. 이 때, 3X3 형태의 입력화면보다 입력칸이 늘었기 때문에 중빈도 문자인 'U'와 'L'을 한번의 터치만으로 입력할 수 있도록 크게 배치할 수 있다.
즉, 알파벳에 있는 5개의 모음들을 모두 한번의 터치만으로 입력할 수 있는 칸에 배치하여 연상이 쉽도록 할 수 있으며, 문자는 아니지만 자주 사용되는 한칸띄움 기능이나 마침표를 터치칸으로 각각 할당하여 사용할 수도 있다.
이 때, 도 12에 도시된 4X3 형태의 입력화면에서도 사용자가 문자들의 위치를 기억하기 수월하도록 같은 칸을 사용하는 문자들은 이미지 연상이 잘되는 문자들로 배치할 수 있다.
이 때, 도 12에 도시된 입력화면에서는 기본 드래그가 입력칸의 외각으로 벗어나는 드래그일 수 있다.
예를 들어, 'Y'는 'I'에서 하방향으로 입력칸의 경계를 넘는 드래그 입력을 통해 입력될 수 있다. 나머지 저빈도 문자인 'K', 'Z', 'X', 'Q', 'V', 'W'는 두 경계선이 만나는 지점에 배치하고, 화살표 방향으로 드래그하여 경계선을 넘으면 입력이 되도록 할 수 있다.
이 때, 도 12에는 도시하지 아니하였으나, 문자들이 배치되지 않은 빈 공간을 이용하여 추가로 특수키 또는 기능키들을 배치할 수도 있다.
또한, 본 발명의 일실시예에 따른 음성인식성능 향상을 위한 영어 문자 입력 방법은 입력 방식에 상응하는 터치 기반 입력으로 영어문자를 입력한다(S130).
이 때, 기능키는 입력 방식에 따라 띄어쓰기 입력, 마침표 입력 및 음성녹음을 포함하는 복수의 기능들을 제공할 수 있다.
예를 들어, 연속 문자입력을 위해서 기능키를 한번 터치하면 한칸띄움을 입력하고, 기능키를 이중 터치하면 마침표를 입력할 수 있다. 그리고, 기능키를 길게 홀드하여 터치하면 입력된 단어를 빠르게 음성녹음할 수 있도록 음성녹음 기능을 제공할 수 있다. 즉, 본 발명에서는 음성인식 성능향상을 위해 기능키를 활용하여 문자와 음성을 동시에 입력할 수 있다.
이 때, 고빈도 문자는 터치를 통해 입력되고, 중빈도 문자는 이중터치 또는 입력칸 외부로의 드래그 중 어느 하나를 통해 입력되고, 저빈도 문자는 상기 복수개의 입력칸들 중 중심칸의 경계로 드래그를 통해 입력될 수 있다.
이 때, 기능키를 통해 연속 드래그 모드가 선택된 경우, 드래그 시작 위치, 드래그 종료 위치, 드래그 방향이 바뀌는 지점 및 드래그 홀드 지점을 고려하여 연속적으로 선택된 복수개의 영어 문자들을 입력할 수 있다.
일반적으로 문자 입력은 음성인식보다 속도가 느리기 때문에 본 발명에서는 기존 터치 입력보다 빠른 입력을 지원하기 위해 연속 드래그 모드를 제안한다.
예를 들어, 도 7에서 연속 드래그 모드를 설정하기 위해 펑션 기호 f(.)(710)을 복수개의 입력칸들의 경계를 넘어가도록 드래그하여 입력하면, 도 8과 같이 연속 드래그를 수행할 수 있는 입력모드로 전환될 수 있다. 이 때, 도 8은 터치 스크린에서 연속 드래그 모드로의 전환을 통해 보여지는 화면으로써 연속 드래그를 통해 입력할 문자들에 영향을 주는 영역을 나타낸 것이다.
이 때, 보여지는 문자의 영역은 기본적으로 둥근 원으로 할당될 수 있으며, 사용빈도에 따라 원의 크기를 다르게 함으로써 사용 빈도가 높은 문자를 보다 수월하게 드래그 선택할 수 있도록 조정될 수도 있다.
이 때, 연속 드래그 모드를 통해 문자를 선택하는 규칙을 설명하면 다음과 같다. 먼저, 드래그 시작 위치와 드래그 종료 위치에 해당하는 문자는 기본적으로 선택되며, 직선이나 곡선으로 드래그가 지나가는 영역의 문자는 선택되지 않는다. 또한, 드래그 방향이 바뀌는 지점의 문자나 드래그로 오래 머문 지점에 해당하는 드래그 홀드 지점의 문자는 선택된다. 이 때, 드래그가 끝나면 자동으로 한 칸 띄움이 입력될 수 있다.
이 때, 기능키인 '
Figure pat00002
'를 터치하면 마침표가 입력될 수 있고, '
Figure pat00003
'를 이중 터치하면 연속 드래그 모드가 종료될 수 있고, '
Figure pat00004
'을 길게 홀드 입력하면 음성녹음 기능이 선택될 수 있다.
이와 같이 연속 드래그 모드를 이용하면 도 9 내지 도 10에 도시된 것처럼 단어를 빠르게 입력할 수 있다.
예를 들어, 도 9는 연속 드래그 모드를 통해 'TEXT' 단어를 입력하는 예시를 나타낸 것이고, 도 10은 연속 드래그 모드를 통해 'SPEECH' 단어를 입력하는 예시를 나타낸 것이다.
먼저, 도 9를 참조하면, 'TEXT' 단어를 입력하기 위해서 순차적으로 'T', 'E', 'X', 'T'에 해당하는 문자가 선택된 것을 알 수 있다. 도 10을 참조하면, 'SPEECH'단어를 입력하기 위해서 순차적으로 'S', 'P', 'E', 'E', 'C', 'H'에 해당하는 문자가 선택된 것을 알 수 있다. 이 때, 도 10에 도시된 'E'처럼 해당 문자를 원형 드래그로 다시 선택함으로써 같은 문자를 연속으로 입력할 수 있다.
이 때, 도 9 내지 도 10을 참조하면, 연속 드래그 모드를 통해 문자가 선택될 때마다 선택된 문자를 색깔이나 동그라미 등으로 강조하여 표시해줌으로써 사용자에게 입력 명확성을 제공해줄 수 있다.
이 때, 본 발명에 따른 연속 드래그 모드의 영역은 도 8에 도시된 예시에 한정되지 않고, 도 8에 도시되지 않은 여러 기능키 영역이 추가될 수도 있다.
이 때, 연속 드래그 입력 중 중심에 위치하는 기능키 '
Figure pat00005
'를 드래그하면 '한칸띄움'이 입력되므로, 한번의 연속 드래그만으로 단어뿐만 아니라 문장을 입력할 수도 있다.
또한, 도 13 내지 도 15에 도시된 것처럼, 4X3에 상응하는 입력 화면에서도 연속 드래그 모드를 통해 문자들을 연속 입력할 수 있다.
예를 들어, 도 13은 4X3 터치 스크린에서 연속 드래그 모드로의 전환을 통해 보여지는 화면으로써 연속 드래그를 통해 입력할 문자들에 영향을 주는 영역을 나타낸 것이다. 도 14는 4X3 터치 스크린 기반의 연속 드래그 모드를 통해 'HOME'단어를 입력하는 예시를 나타낸 것이고, 도 15는 4X3 터치 스크린 기반의 연속 드래그 모드를 통해 'SCHOOL'단어를 입력하는 예시를 나타낸 것이다.
먼저 도 14를 참조하면, 'HOME'단어를 입력하기 위해서 순차적으로 'H', 'O', 'M', 'E'에 해당하는 문자가 선택된 것을 알 수 있다. 도 15를 참조하면, 'SCHOOL'단어를 입력하기 위해서 순차적으로 'S', 'C', 'H', 'O', 'O', 'L'에 해당하는 문자가 선택된 것을 알 수 있다. 이 때, 도 15에 도시된 'O'처럼 해당 문자를 원형 드래그로 다시 선택함으로써 같은 문자를 연속으로 입력할 수 있다. 이 후, 드래그가 끝나면 자동으로 '한칸띄움'이 입력될 수 있고, '한칸띄움'이후에는 다시 연속 드래그 모드 기능이 작동되어 그 다음 단어를 연속 드래그로 입력할 수 있다. 이 후, 중심에 위치하는 기능키 '
Figure pat00006
'를 터치하거나 '
Figure pat00007
'를 이중 터치하여 연속 드래그 모드가 종료되는 경우에 마침표가 입력될 수 있다.
또한, 도 1에는 도시하지 아니하였으나, 본 발명의 일실시예에 따른 음성인식성능 향상을 위한 영어 문자 입력 방법은, 기능키를 통해 음성녹음이 선택된 경우, 입력된 영어 문자로 구성된 단어의 음성녹음을 위한 음성녹음 기능을 제공한다.
이 때, 입력된 영어 문자로 구성된 단어와 음성녹음 기능을 통해 녹음된 단어의 음성 데이터를 음성인식 시스템에 제공할 수 있다.
또한, 본 발명에서 드래그 입력은 터치스크린에서 동작하지만, 터치스크린으로만 제한을 두지는 않는다. 예를 들어, 입력칸의 경계를 넘는 드래그 입력의 경우, 버튼식 입력 디바이스에서 두 칸을 빠르게 연속으로 누르는 버튼 입력으로 대체될 수 있다. 또한, 입력칸의 외부로 이동하는 드래그의 경우, 버튼식 입력 디바이스에서 버튼을 빠르게 두 번 누르는 것으로도 대체가 가능할 수 있다.
이와 같은 음성인식성능 향상을 위한 영어 문자 입력 방법을 통해 전세계적으로 가장 많이 사용하는 언어인 영어를 스마트폰과 같이 입력공간이 제한적인 모바일 디바이스에서 효과적으로 입력할 수 있다.
또한, 전체 26 글자인 영어 문자를 빈도에 따라 터치와 드래그로 나누어 입력하도록 함으로써 비교적 구별이 잘되는 3X3 입력구역만으로도 입력의 정확성과 활용성을 높일 수 있다.
또한, 문자의 배치를 이미지로 서로 연결되는 문자들 묶음으로 배치하고, 드래그할 문자의 위치와 드래그 방향을 이미지로 함께 표현함으로써 사용자가 쉽게 기억할 수 있도록 할 수 있다.
또한, 한번의 터치 또는 한번의 드래그로 입력을 가능하게 함으로써 문자 입력에 필요한 동작을 최소화할 수 있다.
또한, 연속드래그 입력모드를 제공함으로써 연속 드래그로 단어를 빠르게 입력할 수 있다.
또한, 음성인식기의 고유명사 입력이나 오류 수정을 위해서 문자를 입력한 뒤 중심 기능키의 홀드기능을 이용한 음성 녹음 기능을 제공함으로써 음성인식 성능향상에 기여할 수 있다.
도 16은 본 발명의 일실시예에 따른 영어 문자 입력 과정을 상세하게 나타낸 동작흐름도이다.
도 16을 참조하면, 본 발명의 일실시예에 따른 영어 문자 입력 과정은 먼저 사용자가 선택한 문자가 고빈도 문자인지 여부를 판단하고(S1605), 선택된 문자가 고빈도 문자이면 터치입력으로 입력을 수행할 수 있다(S1610).
단계(S1605)의 판단결과 선택된 문자가 고빈도 문자가 아니면, 선택된 문자가 중빈도 문자인지 여부를 판단하고(S1615), 선택된 문자가 중빈도 문자이면 칸 외부로의 드래그 입력 또는 이중터치로 입력을 수행할 수 있다(S1620).
단계(S1615)의 판단결과 선택된 문자가 중빈도 문자가 아니면, 선택된 문자가 저빈도 문자인지 여부를 판단하고(S1625), 선택된 문자가 저빈도 문자이면 중심칸으로 경계를 넘는 드래그 또는 중심칸에서 외각칸으로 경계를 넘는 드래그로 입력을 수행할 수 있다(S1630).
단계(S1625)의 판단결과 선택된 문자가 저빈도 문자가 아니면, 기능키를 선택하였는지 여부를 판단할 수 있다(S1635).
단계(S1635)의 판단결과 기능키를 선택하였으면, 연속 드래그 모드인지 여부를 판단하고(S1645), 연속 드래그 모드가 선택되었으면 연속 드래그 모드로 화면을 전환하여 연속 드래그 모드로 문자를 입력할 수 있다(S1660).
이 때, 연속 드래그 모드는 중심 기능키 '
Figure pat00008
'를 이중 터치함으로 종료될 수 있다.
또한, 단계(S1645)의 판단결과 연속 드래그 모드가 선택되지 않았으면, 기능키를 입력칸 경계를 넘는 방법으로 입력된 것으로 판단하고, 해당 입력방식에 상응하는 입력을 수행할 수 있다(S1650).
이 후, 중심 기능키 '
Figure pat00009
'가 길게 홀드 입력되었는지 여부를 판단할 수 있다(S1655).
또한, 단계(S1610), (S1620), (S1630) 이후에도 단계(S1655)를 통해 중심 기능키 '
Figure pat00010
'가 길게 홀드 입력되었는지 여부를 판단할 수 있다.
또한, 단계(S1655)의 판단결과 중심 기능키 '
Figure pat00011
'가 길게 홀드 입력되었으면, 입력된 단어 혹은 문장을 음성 녹음할 수 있도록 마이크를 동작시켜서 음성녹음 모드를 제공할 수 있다(S1670).
이 때, 홀드가 풀리면 음성녹음 모드가 종료될 수 있다.
이 후, 추가 입력이 발생하는지 여부를 판단하고(S1665), 추가 입력이 발생하면 다시 단계(S1605)부터 반복적으로 수행할 수 있다.
또한, 단계(S1665)의 판단결과 추가 입력이 발생하지 않으면 문자 입력을 종료할 수 있다.
이 때, 본 발명에서는 언어변환 등 보다 다양한 기능키들을 필요로 할 수 있다. 따라서, 본 발명은 필요에 따라 다양한 기능키들을 다양하게 확장하여 제공할 수도 있다.
이와 같은 방법을 통해 영어 문자를 입력함으로써 입력화면의 공간제약으로 인해 입력 키 자체의 크기가 작아져서 생기는 입력 오류를 감소시킬 수 있으며, 적은 입력 칸에 비해 문자들을 효율적으로 입력할 수 있다.
또한, 입력 단계가 간편하여 문자를 입력하기 위한 입력 동작횟수를 감소시킬 수 있고, 문자를 입력하기 위한 동작 크기가 작아서 사용자가 느끼는 입력의 피로감을 감소시킬 수 있다.
또한, 입력방법이 직관적이므로 사용자가 문자를 입력하기 위해 입력 화면을 학습해야 하는 수고를 줄일 수 있으므로 사용성을 향상시킬 수 있다.
또한, 음성녹음 기능을 제공함으로써 모바일 기기에서 사용자의 음성인식 성능을 향상시킬 수도 있다.
도 17는 본 발명의 일실시예에 따른 음성인식성능 향상을 위한 영어 문자 입력 장치를 나타낸 도면이다.
도 17을 참조하면, 본 발명의 일실시예에 따른 음성인식성능 향상을 위한 영어 문자 입력 장치는 컴퓨터로 읽을 수 있는 기록매체와 같은 컴퓨터 시스템에서 구현될 수 있다. 도 17에 도시된 바와 같이, 컴퓨터 시스템(1700)은 버스(1720)를 통하여 서로 통신하는 하나 이상의 프로세서(1710), 메모리(1730), 사용자 입력 장치(1740), 사용자 출력 장치(1750) 및 스토리지(1760)를 포함할 수 있다. 또한, 컴퓨터 시스템(1700)은 네트워크(1780)에 연결되는 네트워크 인터페이스(1770)를 더 포함할 수 있다. 프로세서(1710)는 중앙 처리 장치 또는 메모리(1730)나 스토리지(1760)에 저장된 프로세싱 인스트럭션들을 실행하는 반도체 장치일 수 있다. 메모리(1730) 및 스토리지(1760)는 다양한 형태의 휘발성 또는 비휘발성 저장 매체일 수 있다. 예를 들어, 메모리는 ROM(1731)이나 RAM(1732)을 포함할 수 있다.
따라서, 본 발명의 실시예는 컴퓨터로 구현된 방법이나 컴퓨터에서 실행 가능한 명령어들이 기록된 비일시적인 컴퓨터에서 읽을 수 있는 매체로 구현될 수 있다. 컴퓨터에서 읽을 수 있는 명령어들이 프로세서에 의해서 수행될 때, 컴퓨터에서 읽을 수 있는 명령어들은 본 발명의 적어도 한 가지 측면에 따른 방법을 수행할 수 있다.
프로세서(1710)는 영어 문자 별 사용 빈도와 영어 문자들 간의 사용 연관성을 고려하여 복수개의 입력칸들로 구성된 입력 화면에 전체 영어 문자들을 배치한다.
이 때, 복수개의 입력칸들은 3X3 또는 3X4에 상응하고, 입력 화면의 중심에 기능키를 포함할 수 있다.
또한, 프로세서(1710)는 복수개의 입력칸들의 위치와 입력칸 내에 배치된 영어 문자 위치를 고려하여 전체 영어 문자들 각각의 입력 방식을 설정한다.
이 때, 입력 방식은 터치, 이중터치, 드래그 및 홀드 중 어느 하나에 상응하게 설정될 수 있다.
이 때, 전체 영어 문자들 각각의 입력 방식에 따라 입력 방식을 가이드하기 위한 화살표가 영어 문자와 함께 디스플레이될 수 있다.
이 때, 기능키는 입력 방식에 따라 띄어 쓰기 입력, 마침표 입력 및 음성녹음을 포함하는 복수의 기능들을 제공할 수 있다.
이 때, 드래그 시작 위치, 드래그 종료 위치, 드래그 방향이 바뀌는 지점 및 드래그 홀드 지점을 고려하여 연속적으로 선택된 복수개의 영어 문자들을 입력할 수 있는 연속 드래그 모드를 제공할 수 있다.
이 때, 기능키를 통해 음성녹음이 선택된 경우, 입력된 영어 문자로 구성된 단어의 음성녹음 기능을 제공할 수 있다.
이 때, 입력된 영어 문자로 구성된 단어와 음성녹음 기능을 통해 녹음된 단어의 음성 데이터를 음성인식 시스템에 제공할 수 있다.
또한, 프로세서(1710)는 입력 방식에 상응하는 터치 기반 입력으로 영어 문자를 입력한다.
이 때, 전체 영어 문자들은 사용 빈도에 따라 저빈도 문자, 중빈도 문자, 고빈도 문자로 구분되되, 고빈도 문자는 터치를 통해 입력되고, 중빈도 문자는 이중터치 또는 입력칸 외부로의 드래그 중 어느 하나를 통해 입력되고, 저빈도 문자는 복수개의 입력칸들 중 중심칸의 경계로 드래그를 통해 입력될 수 있다.
이 때, 고빈도 문자는 중빈도 문자 및 저빈도 문자보다 입력 화면에 크게 표시될 수 있다.
메모리(1730)는 전체 영어 문자들 각각 설정된 입력 방식을 저장한다.
실시예에 따라, 메모리(1730)는 영어 문자 입력 장치와 독립적으로 구성되어 음성인식성능 향상을 위한 터치스크린 기반의 영어 문자 입력을 위한 기능을 지원할 수 있다. 이 때, 메모리(1730)는 별도의 대용량 스토리지로 동작할 수 있고, 동작 수행을 위한 제어 기능을 포함할 수도 있다.
한편, 영어 문자 입력 장치는 메모리가 탑재되어 그 장치 내에서 정보를 저장할 수 있다. 일 구현예의 경우, 메모리는 컴퓨터로 판독 가능한 매체이다. 일 구현 예에서, 메모리는 휘발성 메모리 유닛일 수 있으며, 다른 구현예의 경우, 메모리는 비휘발성 메모리 유닛일 수도 있다. 일 구현예의 경우, 저장장치는 컴퓨터로 판독 가능한 매체이다. 다양한 서로 다른 구현 예에서, 저장장치는 예컨대 하드디스크 장치, 광학디스크 장치, 혹은 어떤 다른 대용량 저장장치를 포함할 수도 있다.
이와 같은 음성인식성능 향상을 위한 영어 문자 입력 장치를 이용함으로써 전세계적으로 가장 많이 사용하는 언어인 영어를 스마트폰과 같이 입력공간이 제한적인 모바일 디바이스에서 효과적으로 입력할 수 있다.
또한, 전체 26 글자인 영어 문자를 빈도에 따라 터치와 드래그로 나누어 입력하도록 함으로써 비교적 구별이 잘되는 3X3 입력구역만으로도 입력의 정확성과 활용성을 높일 수 있다.
또한, 문자의 배치를 이미지로 서로 연결되는 문자들 묶음으로 배치하고, 드래그할 문자의 위치와 드래그 방향을 이미지로 함께 표현함으로써 사용자가 쉽게 기억할 수 있도록 할 수 있다.
또한, 한번의 터치 또는 한번의 드래그로 입력을 가능하게 함으로써 문자 입력에 필요한 동작을 최소화할 수 있다.
또한, 연속드래그 입력모드를 제공함으로써 연속 드래그로 단어를 빠르게 입력할 수 있다.
또한, 음성인식기의 고유명사 입력이나 오류 수정을 위해서 문자를 입력한 뒤 중심 기능키의 홀드기능을 이용한 음성 녹음 기능을 제공함으로써 음성인식 성능향상에 기여할 수 있다.
이상에서와 같이 본 발명에 따른 음성인식성능 향상을 위한 영어 문자 입력 장치 및 이를 이용한 방법은 상기한 바와 같이 설명된 실시예들의 구성과 방법이 한정되게 적용될 수 있는 것이 아니라, 상기 실시예들은 다양한 변형이 이루어질 수 있도록 각 실시예들의 전부 또는 일부가 선택적으로 조합되어 구성될 수도 있다.
200: 입력 화면 210, 1110: 기능키
710~760: 특수키
1700: 컴퓨터 시스템 1710: 프로세서
1720: 버스 1730: 메모리
1731: 롬 1732: 램
1740: 사용자 입력 장치 1750: 사용자 출력 장치
1760: 스토리지 1770: 네트워크 인터페이스
1780: 네트워크

Claims (20)

  1. 영어 문자 별 사용 빈도와 영어 문자들 간의 사용 연관성을 고려하여 복수개의 입력칸들로 구성된 입력 화면에 전체 영어 문자들을 배치하는 단계;
    상기 복수개의 입력칸들의 위치와 입력칸 내에 배치된 영어 문자 위치를 고려하여 상기 전체 영어 문자들 각각의 입력 방식을 설정하는 단계; 및
    상기 입력 방식에 상응하는 터치 기반 입력으로 영어 문자를 입력하는 단계
    를 포함하는 것을 특징으로 하는 영어 문자 입력 방법.
  2. 청구항 1에 있어서,
    상기 복수개의 입력칸들은 3X3 또는 3X4에 상응하고, 상기 입력 화면의 중심에 기능키를 포함하는 것을 특징으로 하는 영어 문자 입력 방법.
  3. 청구항 2에 있어서,
    상기 입력 방식은 터치, 이중터치, 드래그 및 홀드 중 어느 하나에 상응하게 설정되는 것을 특징으로 하는 영어 문자 입력 방법.
  4. 청구항 3에 있어서,
    상기 기능키는
    상기 입력 방식에 따라 띄어쓰기 입력, 마침표 입력 및 음성녹음을 포함하는 복수의 기능들을 제공하는 것을 특징으로 하는 영어 문자 입력 방법.
  5. 청구항 3에 있어서,
    상기 전체 영어 문자들은 상기 사용 빈도에 따라 저빈도 문자, 중빈도 문자, 고빈도 문자로 구분되되, 상기 고빈도 문자는 터치를 통해 입력되고, 상기 중빈도 문자는 이중터치 또는 입력칸 외부로의 드래그 중 어느 하나를 통해 입력되고, 상기 저빈도 문자는 상기 복수개의 입력칸들 중 중심칸의 경계로 드래그를 통해 입력되는 것을 특징으로 하는 영어 문자 입력 방법.
  6. 청구항 5에 있어서,
    상기 고빈도 문자는 상기 중빈도 문자 및 상기 저빈도 문자보다 상기 입력 화면에 크게 표시되는 것을 특징으로 하는 영어 문자 입력 방법.
  7. 청구항 3에 있어서,
    상기 전체 영어 문자들 각각의 입력 방식에 따라 입력 방식을 가이드하기 위한 화살표가 영어 문자와 함께 디스플레이되는 것을 특징으로 하는 영어 문자 입력 방법.
  8. 청구항 4에 있어서,
    상기 영어 문자를 입력하는 단계는
    드래그 시작 위치, 드래그 종료 위치, 드래그 방향이 바뀌는 지점 및 드래그 홀드 지점을 고려하여 연속적으로 선택된 복수개의 영어 문자들을 입력하는 연속 드래그 모드를 제공하는 것을 특징으로 하는 영어 문자 입력 방법
  9. 청구항 4에 있어서,
    상기 기능키를 통해 음성녹음이 선택된 경우, 입력된 영어 문자로 구성된 단어의 음성녹음을 위한 음성녹음 기능을 제공하는 단계를 더 포함하는 것을 특징으로 하는 영어 문자 입력 방법.
  10. 청구항 9에 있어서,
    입력된 영어 문자로 구성된 단어와 상기 음성녹음 기능을 통해 녹음된 단어의 음성 데이터를 음성인식 시스템에 제공하는 단계를 더 포함하는 것을 특징으로 하는 영어 문자 입력 방법.
  11. 영어 문자 별 사용 빈도와 영어 문자들 간의 사용 연관성을 고려하여 복수개의 입력칸들로 구성된 입력 화면에 전체 영어 문자들을 배치하고, 상기 복수개의 입력칸들의 위치와 입력칸 내에 배치된 영어 문자 위치를 고려하여 상기 전체 영어 문자들 각각의 입력 방식을 설정하고, 상기 입력 방식에 상응하는 터치 기반 입력으로 영어 문자를 입력하는 프로세서; 및
    상기 전체 영어 문자들 각각 설정된 입력 방식을 저장하는 메모리
    를 포함하는 것을 특징으로 하는 영어 문자 입력 장치.
  12. 청구항 11에 있어서,
    상기 복수개의 입력칸들은 3X3 또는 3X4에 상응하고, 상기 입력 화면의 중심에 기능키를 포함하는 것을 특징으로 하는 영어 문자 입력 장치.
  13. 청구항 12에 있어서,
    상기 입력 방식은 터치, 이중터치, 드래그 및 홀드 중 어느 하나에 상응하게 설정되는 것을 특징으로 하는 영어 문자 입력 장치.
  14. 청구항 13에 있어서,
    상기 기능키는
    상기 입력 방식에 따라 띄어쓰기 입력, 마침표 입력 및 음성녹음을 포함하는 복수의 기능들을 제공하는 것을 특징으로 하는 영어 문자 입력 장치.
  15. 청구항 13에 있어서,
    상기 전체 영어 문자들은 상기 사용 빈도에 따라 저빈도 문자, 중빈도 문자, 고빈도 문자로 구분되되, 상기 고빈도 문자는 터치를 통해 입력되고, 상기 중빈도 문자는 이중터치 또는 입력칸 외부로의 드래그 중 어느 하나를 통해 입력되고, 상기 저빈도 문자는 상기 복수개의 입력칸들 중 중심칸의 경계로 드래그를 통해 입력되는 것을 특징으로 하는 영어 문자 입력 장치.
  16. 청구항 15에 있어서,
    상기 고빈도 문자는 상기 중빈도 문자 및 상기 저빈도 문자보다 상기 입력 화면에 크게 표시되는 것을 특징으로 하는 영어 문자 입력 장치.
  17. 청구항 13에 있어서,
    상기 전체 영어 문자들 각각의 입력 방식에 따라 입력 방식을 가이드하기 위한 화살표가 영어 문자와 함께 디스플레이되는 것을 특징으로 하는 영어 문자 입력 장치.
  18. 청구항 14에 있어서,
    상기 프로세서는
    드래그 시작 위치, 드래그 종료 위치, 드래그 방향이 바뀌는 지점 및 드래그 홀드 지점을 고려하여 연속적으로 선택된 복수개의 영어 문자들을 입력하는 연속 드래그 모드를 제공하는 것을 특징으로 하는 영어 문자 입력 장치.
  19. 청구항 14에 있어서,
    상기 프로세서는
    상기 기능키를 통해 상기 음성녹음이 선택된 경우, 입력된 영어 문자로 구성된 단어의 음성녹음을 위한 음성녹음 기능을 제공하는 것을 특징으로 하는 영어 문자 입력 장치.
  20. 청구항 19에 있어서,
    상기 프로세서는
    입력된 영어 문자로 구성된 단어와 상기 음성녹음 기능을 통해 녹음된 단어의 음성 데이터를 음성인식 시스템에 제공하는 것을 특징으로 하는 영어 문자 입력 장치.
KR1020210102437A 2021-08-04 2021-08-04 음성인식성능 향상을 위한 영어 문자 입력 장치 및 이를 이용한 방법 KR20230020711A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020210102437A KR20230020711A (ko) 2021-08-04 2021-08-04 음성인식성능 향상을 위한 영어 문자 입력 장치 및 이를 이용한 방법
US17/517,211 US20230044217A1 (en) 2021-08-04 2021-11-02 Text input apparatus for improving speech recognition performance and method using the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210102437A KR20230020711A (ko) 2021-08-04 2021-08-04 음성인식성능 향상을 위한 영어 문자 입력 장치 및 이를 이용한 방법

Publications (1)

Publication Number Publication Date
KR20230020711A true KR20230020711A (ko) 2023-02-13

Family

ID=85152922

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210102437A KR20230020711A (ko) 2021-08-04 2021-08-04 음성인식성능 향상을 위한 영어 문자 입력 장치 및 이를 이용한 방법

Country Status (2)

Country Link
US (1) US20230044217A1 (ko)
KR (1) KR20230020711A (ko)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110066414A (ko) 2009-12-11 2011-06-17 박남규 터치스크린을 이용한 영문자 입력방법

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6847706B2 (en) * 2001-03-20 2005-01-25 Saied Bozorgui-Nesbat Method and apparatus for alphanumeric data entry using a keypad
US11503144B2 (en) * 2003-04-18 2022-11-15 Benjamin Firooz Ghassabian Systems to enhance data entry in mobile and fixed environment
US8462123B1 (en) * 2008-10-21 2013-06-11 Google Inc. Constrained keyboard organization
US20110055697A1 (en) * 2009-08-26 2011-03-03 Wayne Davidson Alphanumeric keypad for touch-screen devices
US20130002562A1 (en) * 2011-06-30 2013-01-03 Nokia Corporation Virtual keyboard layouts
US20170060413A1 (en) * 2014-02-21 2017-03-02 Drnc Holdings, Inc. Methods, apparatus, systems, devices and computer program products for facilitating entry of user input into computing devices
US9940016B2 (en) * 2014-09-13 2018-04-10 Microsoft Technology Licensing, Llc Disambiguation of keyboard input
CN108064372A (zh) * 2016-12-24 2018-05-22 深圳市柔宇科技有限公司 头戴式显示设备及其内容输入方法
KR20200113349A (ko) * 2019-03-25 2020-10-07 삼성전자주식회사 전자 장치 및 멀티 태스킹 지원 방법
WO2022016252A1 (en) * 2020-07-24 2022-01-27 1038819 B.C. Ltd Adaptable touchscreen keypads with dead zone

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110066414A (ko) 2009-12-11 2011-06-17 박남규 터치스크린을 이용한 영문자 입력방법

Also Published As

Publication number Publication date
US20230044217A1 (en) 2023-02-09

Similar Documents

Publication Publication Date Title
US11061561B2 (en) Space optimizing micro keyboard method and apparatus
RU2277719C2 (ru) Способ работы системы скоростного письма и устройство скоростного письма
KR101085655B1 (ko) 단말의 문자 입력 장치 및 방법
JP5199459B2 (ja) ユーザの入力をリアルタイムで予測するマンマシンインターフェース
JP6000385B2 (ja) 多国語キー入力装置及びその方法
US8381119B2 (en) Input device for pictographic languages
US20150082229A1 (en) Multi-gesture text input prediction
KR20120107110A (ko) 데이터입력 시스템 및 그 방법
KR20150123857A (ko) 연속 슬라이딩 방식으로 문본을 입력하는 방법 및 시스템과 장치
JP2003015808A (ja) タッチ式キー入力装置
JP6681518B2 (ja) 文字入力装置
KR20080097114A (ko) 문자 입력 장치 및 방법
KR101030177B1 (ko) 데이터 입력장치 및 데이터 입력방법
TWI475405B (zh) 電子裝置及其文字輸入介面顯示方法
US8922492B2 (en) Device and method of inputting characters
JP5977764B2 (ja) 拡張キーを利用した情報入力システム及び情報入力方法
EP3308248B1 (en) Pan-zoom entry of text
CN105094416B (zh) 手持装置及其输入方法
KR20230020711A (ko) 음성인식성능 향상을 위한 영어 문자 입력 장치 및 이를 이용한 방법
WO2017086396A1 (ja) タッチ操作による文字入力装置・方法・プログラム
JP2007213615A (ja) タッチ式キー入力装置、タッチ式キー入力方法およびプログラム
JP2014140236A (ja) 文字データ入力装置
WO2012116497A1 (en) Inputting chinese characters in pinyin mode
KR102322211B1 (ko) 전자장치에서의 문자입력모드 또는 문자입력방법 자동 변경 방법
Banubakode et al. Survey of eye-free text entry techniques of touch screen mobile devices designed for visually impaired users

Legal Events

Date Code Title Description
E902 Notification of reason for refusal