KR20080073032A - 예측 기반 단어 입력 방법 - Google Patents

예측 기반 단어 입력 방법 Download PDF

Info

Publication number
KR20080073032A
KR20080073032A KR1020070011525A KR20070011525A KR20080073032A KR 20080073032 A KR20080073032 A KR 20080073032A KR 1020070011525 A KR1020070011525 A KR 1020070011525A KR 20070011525 A KR20070011525 A KR 20070011525A KR 20080073032 A KR20080073032 A KR 20080073032A
Authority
KR
South Korea
Prior art keywords
prediction
input
syllable
word
database
Prior art date
Application number
KR1020070011525A
Other languages
English (en)
Inventor
봉래 박
Original Assignee
(주)트루시스템
봉래 박
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)트루시스템, 봉래 박 filed Critical (주)트루시스템
Priority to KR1020070011525A priority Critical patent/KR20080073032A/ko
Priority to PCT/KR2007/002119 priority patent/WO2008096934A1/en
Publication of KR20080073032A publication Critical patent/KR20080073032A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0237Character input methods using prediction or retrieval techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/274Converting codes to words; Guess-ahead of partial word inputs
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B19/00Teaching not covered by other main groups of this subclass
    • G09B19/04Speaking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Technology (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 예측기반의 단어 입력 방법에 관한 것이며, 특히 음절을 기반으로 예측함을 특징으로 한다. 단어 전체를 예측할 경우 예측에 필요한 정보량도 많고 정보량이 어느 정도 충족되어도 적중률이 현저히 낮은 문제가 있다. 본 발명의 방식은 긴 단어를 일부분씩 나누어서 예측해 주기 때문에, 가능한 예측 대상의 수가 줄어들어 예측의 적중률이 증가한다. 또한, 본 발명의 예측정보 데이터베이스는 실시간 학습 데이터의 유지기간에 따라 구분되는 언어 패턴들, 즉 사용자의 일생에 걸친 지속적인 언어패턴(개인성향 예측정보 데이터베이스)(31), 최근 일정 기간에 걸친 언어패턴(최근성 예측정보 데이터베이스)(32) 및 특정 시점에 특정 주제와 관련하여 나타나는 언어패턴(주제별 예측정보 데이터베이스)(33) 등을 포함한다.

Description

예측 기반 단어 입력 방법{METHOD FOR WORD INPUT BASED ON PREDICTION}
도 1은 본 발명의 예측에 따른 기본적인 입출력의 예를 개략적으로 나타내는 도면이다.
도 2는 본 발명의 근거 기반 예측 과정의 예를 개략적으로 나타내는 도면이다.
도 3은 본 발명에 따른 기본적인 예측엔진의 아키텍처의 예를 나타내는 도면이다.
도 4는 본 발명의 실시간 학습 기능이 추가된 예측엔진의 아키텍처의 예를 개략적으로 나타내는 도면이다.
도 5는 본 발명의 세분화된 실시간 학습 기능이 추가된 예측엔진의 아키텍처의 예를 나타내는 도면이다.
도 6은 본 발명의 입력장치의 종류를 나타내는 도면이다.
도 7은 본 발명에 따른 음절 예측 방법의 전체 프로세스의 구성예를 나타내는 도면이다.
※ 첨부된 도면은 본 발명의 기술사상에 대한 이해를 돋구기 위하여 참조로서 예시된 것임을 밝히며, 그것에 의해 본 발명의 권리범위가 제한되는 것은 아님을 첨언한다.
<기술분야>
본 발명은 컴퓨터 또는 모바일 장치 등에 하드웨어로 구비된 키보드, 또는 소프트웨어로 제작되어 모니터에 표시되는 가상 키보드 등을 통해 문자 또는 숫자 등을 입력하는 시스템 및 그 방법에 관한 것이다. 특히, 본 발명은 입력될 문자를 실시간으로 예측할 수 있는 입력 시스템 및 입력 방법에 관한다.
<종래기술의 문제점>
일반적으로 사용자는 컴퓨터 키보드, 마우스, 모바일 장치(모바일 폰, PDA, PMP 등)의 키패드 등의 입력장치를 이용하여 원하는 문자, 숫자 또는 이들의 조합을 입력한다. 사용자가 컴퓨터 또는 모바일 장치를 이용하여 문서를 작성하거나 채팅을 하는 경우 소정의 입력장치를 이용한다. 어떤 경우에는 소프트웨어로 만들어진 가상의 키보드(virtual keyboards) 상에서 원하는 문자를 선택하여 입력하는 장치를 이용한다.
입력장치를 활용하여 특정 단어를 입력하는 통상의 방법은, 그 단어를 구성하는 키보드 상의 개별 키를 일일이 선택하는 방법이다. 그러나 이러한 종래의 보편적인 방법은 사용자가 장애인, 노인 또는 컴퓨터에 익숙하지 않은 사람인 경우에 는 매우 불편하고 단어 입력까지 많은 시간이 소요된다. 만일 1개의 단어가 아닌 1개 이상의 문장을 입력하는 경우에 그 불편함과 소요시간 문제는 더욱 심각해 진다. 즉, 종래의 방법은 사용자가 키보드 키의 배열과 위치를 미리 인지하고 또한 키보드 선택을 빠르고 용이하게 선택할 수 있는 경우에만 유용한 것이었다.
한편, 이러한 종래기술의 문제를 해결하고자 하는 방법의 하나로서, 모니터에 전자 펜으로 직접 글자를 쓰면 그 글자를 인식하여 입력되는 필기 인식 방식이 알려져있다. 그러나 같은 글자라 하더라도 사용자마다 필체가 서로 다르기 때문에 인식 패턴의 표준을 정하기가 어렵고 실제 인식률이 낮은 문제점이 있었다.
또한, 사용자가 마이크를 통하여 음성을 입력하는 음성 인식 방식이 알려져 있다. 이러한 방법은 인식률이 좋을 경우 사용자의 음성 속도와 동시에 변환할 수 있는 장점이 있지만, 환경적 요인(장소, 외부 소음)에 따라 인식률이 저하되고 고가의 장비가 요구되는 문제점이 있다.
한편, 컴퓨터 시스템이 입력하고자 하는 단어를 미리 예측하여 알려 주고, 사용자는 그 예측된 단어를 선택할지 말지만을 결정할 수 있다면, 이는 종래의 보편적인 키보드 입력방식의 문제점을 해결하는데 근본적인 도움이 될 것이다. 그런데 단어를 완벽하게 입력하지 않았으나 완성된 단어를 예측하는 방법은 이미 알려져 있다. 이 방법은 어떤 단어의 처음 입력되는 문자를 컴퓨터가 인식하고, 그 문자를 시작으로 하는 단어 중 사용 빈도수가 높은 복수의 단어들을 데이터베이스에서 추출하여 화면에 표시해 준다. 사용자는 그 표시된 단어들 중에서 입력하고자 하는 단어가 존재하는 경우 그 단어를 마우스로 클릭함으로써 단어의 모든 철자를 입력하지 않아도 되는 방법이다.
예컨대 Google™의 검색 창에 "a"라는 키를 입력하면 검색창 하단으로 "aol", "amazon", "amazon.com", "aim", "american airlines" 등의 단어가 검색어로서 미리 예측되어 표시되는 것이다. 그러나 이러한 방법은 검색하고자 하는 단어가 일반적으로 자주 사용되는 단어라면 적중률이 높겠지만, 그 단어가 자주 사용되는 단어가 아니라면 위 방법의 예측 적중률은 매우 낮아지는 문제점이 있었다.
본 발명은 위와 같은 문제점을 해결하고자 하며 그 기본적인 문제의식은 보다 효율적으로 예측해주는 시스템 및 방법을 제공함에 있다. 물론 이러한 문제의식은 입력 키마다 일일이 키보드를 조작하여야 하는 번거로움 없이 더 쉽고 빠르게 원하는 단어 또는 문장을 입력할 수 있는 방법 및 시스템을 제공하기 위함이다.
본 발명의 목적은 사용자가 입력하고자 하는 단어를 예측 시스템을 통해 보다 빠르게 입력할 수 있도록 하고자 함에 있다. 이를 위하여 본 발명은 음절 예측(Syllable Prediction) 기법을 창안하였다.
본 발명의 다른 목적은 예측 적중률을 향상시키기 위해서 사용자의 언어 습관과 언어 사용의 특성을 시스템으로 모델링 함에 있다. 이러한 모델링 작업은, 분류된 언어 데이터베이스를 가져야 함은 물론, 시스템이 실시간으로 사용자의 사용 언어를 분석하고 학습할 수 있는 수단과, 문맥을 분석하여 예측할 수 있는 수단을 필요로 할 것이다.
본 발명의 이러한 목적들은 사용자가 모든 입력 키들을 일일이 입력하지 않더라도 시스템이 예측해주는 음절 등을 선택하여 입력할 수 있는 시스템과 관련된다. 따라서 본 발명은 키 입력에 어려움을 느끼는 장애인이나 노인에게 매우 유용하게 이용될 수 있음은 물론이거니와, 장애인이나 노인이 아니더라도 보다 쉽고 빠르게 단어나 문장을 입력할 수 있기 때문에 산업상 이용 가능성이 매우 높다. 예컨대 각종 텍스트의 작성, 채팅, 소형 정보 기기를 이용한 문자 메시지(Short Message Service) 전송 등에 매우 유용하게 활용될 것이다.
한편, 본 발명의 명시되지 않은 또 다른 목적들은 하기의 상세한 설명 및 그 효과로부터 용이하게 추론할 수 있는 범위 내에서 추가적으로 고려될 것이다.
위와 같은 목적을 달성하기 위하여, 본 발명의 예측 기반 단어 입력 방법은, 전자 장치에서의 물리적 키 또는 가상키를 이용하여 문자를 입력하는 경우에, 음절 예측 응용 프로그램을 이용하여 입력할 음절을 예측하는 단어 예측 방법으로서:
전자 장치의 문자 입력 장치를 통해 입력된 문자 및 기입력된 텍스트로부터 근거를 추출하는 단계;
추출된 근거를 이용하여 예측정보 데이터베이스로부터 다음에 입력될 것으로 예상되는 음절 후보들을 1개 이상 추출하는 단계;
추출된 1개 이상의 음절 후보들을 사용자 단말의 문자 출력 장치에 표시하는 단계; 및
표시된 음절 후보들 중 하나를 사용자가 선택하여 응용프로그램에 전달하는 단계;를 포함하는 것을 특징으로 한다.
또한, 본 발명의 예측 기반 단어 입력 방법은, 전자 장치에서의 물리적 키 또는 가상키를 이용하여 문자를 입력하는 경우에, 예측 응용 프로그램을 이용하여 단어를 예측 기반으로 입력하는 방법으로서:
학습 데이터의 보존 기간에 따라 구분되는 예측정보 데이터베이스를 1개 이상 구비하고,
전자 장치의 문자 입력 장치를 통해 입력된 문자 및 기입력된 텍스트로부터 근거를 추출하는 단계;
추출된 근거를 이용하여 예측정보 데이터베이스로부터 다음에 입력될 가능성이 높은 문자열 후보들을 추출하는 단계;
추출된 1개 이상의 문자열 후보들을 사용자 단말의 문자 출력 장치에 표시하는 단계; 및
상기 표시된 문자열 후보들이 사용자 단말에 의해 선택되거나 선택되지 아니하고 단어 입력이 행해진 경우에, 상기 문자 입력 장치를 통해 입력된 문자열에 대한 실시간 학습 이벤트를 생성하고 상기 학습 데이터의 보존 기간에 따라 구분되는 예측정보 데이터베이스들을 갱신하는 단계;를 포함하는 것을 특징으로 한다.
또한, 상기 문자열은 음절, 복합음절 또는 단어인 것이 좋다.
또한, 상기 학습 데이터의 보존 기간에 따라 구분되는 예측정보 데이터베이스들 중에 문자 입력 이벤트가 최초로 발생한 시점부터 사용자의 언어패턴이 지속 적으로 학습되어 갱신되는 개인성향 데이터베이스를 더 포함하는 것이 좋다.
또한, 상기 학습 데이터의 보존 기간에 따라 구분되는 예측정보 데이터베이스들 중에 학습된 시점으로부터 일정 기간이 지나면 해당 학습 내용이 제거되어 사용자의 최근 언어패턴만이 저장되는 최근성 데이터베이스를 더 포함하는 것이 좋다.
또한, 상기 학습 데이터의 보존 기간에 따라 구분되는 예측정보 데이터베이스들 중에 상기 전자장치의 전원이 들어온 때부터 해당 시점 사용자의 언어패턴이 학습되어 학습된 내용이 전원이 나가기 전까지 유지되는 주제별 데이터베이스를 더 포함하는 것이 좋다.
또한, 본 발명의 예측정보 데이터베이스는, 유무선 네트워크를 통하여 공유 가능한 다른 사용자 단말의 텍스트를 선택하고 그 텍스트에 대한 정보를 입력하는 경우, 그 텍스트의 언어패턴들로 데이터베이스를 구축하는 인바운딩 데이터베이스를 더 포함하는 것이 좋다. 이 인바운딩 데이터베이스는 상기 주제별 데이터베이스의 다른 형태로서 마찬가지로 필요한 시간 동안에만 존재하는 데이터베이스이다.
또한, 상기 학습 데이터의 보존 기간에 따라 구분되는 예측정보 데이터베이스들과 별도로, 예측정보 데이터베이스로서, 컴퓨터 또는 웹에 저장되어 있는 대량의 텍스트들 내에 존재하는 일반적인 언어 패턴들을 일괄 추출하여 구축하거나 전문가가 직접 구축한 기구축 예측정보 데이터베이스를 더 포함하는 것이 좋다.
또한, 본 발명의 "근거"는 예측 대상의 앞 일부 문자를 포함하는 것이 좋다.
또한, 본 발명의 "근거"는 예측 대상에 앞서 입력된 문법적 요소 및 의미적 요소 등의 언어요소를 의미할 수 있다.
이하 본 발명에 따른 바람직한 실시례를 첨부한 도면을 참조하여 상세히 설명한다. 그리고 본 발명을 설명함에 있어서, 관련된 공지기능 등은 이 분야의 기술자에게 자명한 사항으로서 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략한다.
- Syllable Prediction -
도 1은 본 발명의 예측에 따른 기초적인 입출력의 일 예를 나타낸다. 예컨대 사용자가 자신의 입력장치(예컨대 키보드)를 통해 처음으로 "c"라는 문자를 입력한 경우에 시스템은 "c"를 근거(clue)로 하여 예측정보 데이터베이스를 검색하고 출력장치(예컨대 모니터)로 "char", "ca", "cine", "case", "com", "cube" 등의, 문자 'c'로 시작하는 입력 가능성이 높은 음절들을 제시한다. 만일 사용자가 "charming"을 입력하고자 한 경우라면, 사용자는 음절 "char"를 선택하게 되고 모니터로 "char"를 표시하게 된다. 시스템이 "char"를 예측해 주었기 때문에, 결국 사용자는 "c" + "선택키"만 입력하는 것만으로 나머지 "har"를 입력하지 않아도 된다. 더 나아가 시스템은 선택된 음절 "char"에 근거하여 다시 "ac", "ming" 등의 다음 입력 가능성이 높은 음절들을 예측해 준다. 사용자는 음절 "ming"을 선택함으로써 입력하고자 했던 단어 "charming"를 3회의 키 누름으로 입력할 수 있게 된다. 이후 시스템은 같은 방식으로 음절을 예측해 주는데, 도 1에 예시된 바와 같이 단어 "charming"이 입력된 상태에서 space가 입력되면 다음 입력될 가능성이 높 은 단어들의 시작 음절을 예측해 줌으로써 단어들의 첫 글자를 입력하지 않고 음절들만 선택해서도 단어를 입력할 수도 있게 된다.
예측 방법 및 예측 시스템에서 가장 중요한 요소는 실패율을 낮추고 예측 적중률을 높이는 것이며, 이를 위해서 본 발명은 상기와 같이 음절 예측(Syllable Prediction)을 기반으로 한다.
각 언어는 고유한 음절구조를 가진다. 그리고 그 음절은 일반적으로 1개의 모음 사운드(a single vowel sound)를 포함한다. 언어에 따라 자음(consonant)+모음(vowel), 곧 "CV" 구조를 가지거나, "V", "VC", "CVC", "CCVC" 등의 구조를 가질 수 있다.
"음절"은 인간의 청각이 지각하는 소리의 연쇄 중에서 최소의 단위를 의미하기 때문에 보편적이며, 따라서 이는 영어에 국한되는 것이 아니라, 독일어, 프랑스어, 키릴 문자, 중국어, 일본어, 한국어 등에도 공통으로 적용된다.
Syllable Prediction은 일반적으로 단어 전체를 예측하는 기존 예측 시스템을 혁신한다. 단어 전체를 예측할 경우 예측에 필요한 정보량도 많고 정보량이 어느 정도 충족되어도 적중률이 현저히 낮은 문제가 있다. 본 발명의 시스템은 긴 단어를 일부분씩 나누어서 예측해 주기 때문에, 가능한 예측 대상의 수가 줄어들어 예측의 적중률이 크게 증가한다.
단어를, 예측을 통해 입력할 수 있게 하려는 것은 단어를 입력하는 과정을 보다 빠르게 하기 위함이다. 따라서 글자가 많이 포함된 음절을 예측할수록 예측의 효과는 크다. 하지만 음절들 중에는 1개 또는 2개의 글자만으로 구성된 것들도 상당수 존재한다. 이러한 음절들이 많이 나타날수록 예측의 효과는 반감될 수밖에 없다. 이에 본 발명에서는 전체적으로는 음절 예측을 기반으로 하되, 적중률이 높다고 평가되는 복합음절이나 단어의 경우도 예측할 수 있게 한다. 즉 예측 상황에 따라서는 "inter"와 같은 복합음절이나 "Christmas"와 같은 단어가 곧바로 예측되어 사용자에게 제시될 수도 있다.
복합음절이나 단어의 추가 예측은 본 발명의 예측 시스템이 적용될 정보기기의 컴퓨팅 자원 제약 등에 따라 적용 여부가 전략적으로 결정될 수 있다. 휴대폰과 같이 컴퓨팅 파워가 약한 경우는 음절예측만 적용하는 것이 바람직할 수 있다.
- Prediction Clue -
도 2는 본 발명의 기초적인 예측과정의 일 예를 나타낸다. 어떠한 예측에도 근거가 존재하게 된다. 단어의 첫 몇 글자를 입력해주면 이 글자들로 시작하는 고빈도 단어들을 예측해 주는 경우 먼저 입력된 글자들이 근거인 것이다.
본 발명에서는 이러한 근거를 크게 내부근거와 외부근거로 구분한다. 내부 근거란 상기와 같이 입력하려는 음절의 미리 입력된 1 이상의 글자들을 의미한다. 예를 들어, 문자 'c'가 입력된 경우 시스템은 'c'로 시작하는 음절 "char", "ca", "cine", "case", "com", "cube" 등을 예측 제시하게 되는데, 이때 바로 문자 'c'가 예측 대상의 앞 단에 포함되어 있기 때문에 이를 내부근거라 한다.
그리고 외부근거란 입력 대상에 앞서 입력되고 현재의 입력에 영향을 미치는 언어적 요소들을 의미한다. 예를 들어, 음절 "char"이 입력된 상태에서 음절 "ac", "ming" 등을 예측하거나 단어 "charming"이 공백을 사이에 두고 앞서 입력된 상태에서 음절 "face", "girl", "wo", "boy" 등을 예측할 때 예측 대상에 포함되지 않고 예측에 영향을 미치는 음절 "char"이나 단어 "charming" 및 space가 외부근거가 된다.
특히 외부근거가 단어인 경우는 언어학적으로 의미적 근거와 문법적 근거로 구분될 수 있다. 즉 다음에 예측될 대상은 의미적으로 및 문법적으로 이미 입력된 단어와 상관성이 높은 단어나 단어의 구성 음절일 가능성이 높다는 의미이다. 이와 관련한 언어학적 기술에 대해서는 당업자가 충분히 알 수 있는 내용이므로 여기서는 구체적으로 설명하지는 않는다.
내부근거와 외부근거는 예측시스템이 적용될 정보기기 등에 따라 전략적으로 사용 여부가 결정될 수 있다. 컴퓨팅 자원이 부족한 기기에서는 내부근거만을 이용할 수도 있다는 의미이다.
- Basic Prediction Engine -
도 3은 가장 기초적인 예측엔진 아키텍처의 일례를 나타낸다. 예측 대상이 글자, 음절, 단어 중 어떤 것인지 또는 이들의 혼합인지가 결정되고 근거로서 내부근거와 외부근거의 사용 전략이 결정된 상황에서, 미리 도 3의 예측정보 데이터베이스가 구비된다. 즉 예측정보 데이터베이스에는 가능한 모든 근거별로 함께 나타날 가능성이 높은 음절, 복합음절 또는 단어 등의 예측 대상 후보들이 예측정보로서 저장되어 있다. 이때 바람직하게는 각 근거와 각 예측 대상 사이의 상호 연관 성 정도를 나타내는 근거와 예측 대상 간의 연관성 값이 함께 저장된다. 여기서 연관성 값이란 전략적으로 다양하게 설정할 수 있겠으나, 예를 들면 일종의 확률로서, 하나의 근거에 대해 함께 나타난 모든 예측 대상 후보들 중 특정 예측 대상 후보의 상대적 연관성 정도를 의미하는 값이다.
시스템은 예측 상황에서 사용자의 입력으로부터 하나 이상의 근거들을 추출하고 이를 예측정보 데이터베이스에서 검색하여 각 근거별로 가능한 예측 대상 후보들을 추출하여 연관성 값을 비교평가한 후 최종 예측 대상 후보를 선정한다. 이때 비교평가는 각 근거들에서 추출된 예측 대상 후보들 중 동일한 후보들이 존재하는 경우 연관성 값을 합하여 일치시키고 나서 다른 후보들과 비교하게 된다. 연관성 값을 합산하는 과정을 예를 들어 설명하면, 앞서 입력된 텍스트로부터 'nice'와 'good'이 근거로 추출되고 각각에 대해 데이터베이스를 검색한 결과 양 근거에서 동일하게 'per'(person의 첫 음절)라는 음절이 추출된 경우 'nice'와 'per'간의 연관성 값과 'good'과 'per'의 연관성 값을 합하여 전체 근거에 대한 'per'의 최종 연관성 값을 계산한다. 더 나아가 근거의 유형(단어, 음절, 문자열, 품사 등)이나 근거와 예측대상간의 거리 등에 따라 근거별로 별도의 가중치가 부여될 수 있는데 이 경우는 미리 연관성 값에 가중치를 반영한 후 동일한 예측 대상 후보들끼리 합산하게 된다.
예측 대상이 음절만이 아니라 복합음절 또는 단어도 포함하는 경우, 예측된 복합음절 또는 단어의 연관성값(일종의 평가된 예상 적중률)이 음절보다 낮다고 하여도 포함된 글자의 길이에 따른 가중치를 반영하여 최종 연관성값을 결정한다. 예 를 들어, "nation"이라는 단어는 2음절로서 음절 방식만으로는 예측이 안 되지만 2음절이라는 점 또는 6 문자라는 점을 고려한다. 즉 음절 방식으로 예측할 경우 최소 2회 눌러야 하지만 바로 예측되어 제시될 경우 한번에 입력할 수 있기 때문에 본 발명의 취지에 적합하도록 연관성값을 높여주어 표출될 가능성을 높여 주는 것이다. 물론 이러한 과정은 실시 전략에 따라 적용하지 않을 수도 있다. 참고로 별도의 가중치를 부여하지 않더라도 관용어구와 같은 문맥에서 나타나는 복합음절이나 단어는 자체로 높은 연관성값을 가질 수도 있다.
-Realtime Learning-
도 4는 본 발명에 따른 실시간 학습 모듈이 포함된 예측엔진 아키텍처의 일례를 나타낸다. 단어의 사용은 동일한 상황에서도 사람에 따라 다르게 나타나는 경향이 있다. 따라서 예측의 적중률을 높이기 위해서는 개별 사용자로부터 선택되거나 직접 입력된 텍스트로부터 근거와 예측 대상 후보 쌍들을 추출하여 예측정보 데이터베이스에 반영할 필요가 있다.
이때 학습 대상이 영어의 음절인 경우, 사용자로부터 2음절 이상의 단어가 선택되거나 입력되었을 때, 음절들을 분리해 내는 모듈이 별도로 필요하다. 한국어나 중국어와 달리 영어나 일어는 음절의 경계가 단순하게 구분되지 않기 때문이다. 예를 들어 "cabin"의 경우 "cab"와 "in"으로 구분되지만 "colon"의 경우 "co"와 "lon"으로 구분되어 모호성이 존재한다.
그리고 실시간 학습된 데이터와 기구축된 데이터는 데이터베이스를 구분하여 저장 및 이용하는 것이 바람직하다. 즉 기구축 예측정보 데이터베이스(20)와 실시간 학습 데이터베이스(21)는 각각 별도로 구분되어 구축된다. 통계적 위상이 다르기 때문이다. 따라서 예측시에도 두 데이터베이스를 모두 검색하고 양쪽에서 동일하게 검색된 예측 대상 후보는 그 연관성값을 합하여 일치시킨 후 다른 후보들과 비교하여 최종 선정한다. 만일 데이터베이스별로 가중치가 존재하는 경우 이를 먼저 반영한 후에 합산한다.
- Realtime Multi-Learning -
도 5는 본 발명에 따른 보다 세분화된 실시간 학습에 근거한 예측엔진 아키텍처를 나타낸다. 단어의 사용은 동일한 사람이라 하더라도 시기나 특정 상황에 따라 다른 경향이 있다. 예를 들어 예전에는 "great"이라는 단어를 잘 사용하던 사람이 언제부턴가 어떤 이유(그 시점 본인 또는 사회적 언어유행일 수도 있음)에서든 "great" 대신에 "wonderful"이라는 말을 잘 사용하게 되기도 하는 것이다. 그리고 일반 대화와 달리 특정 주제를 위주로 글을 작성하는 경우에는 해당 시점 그 주제에 관련된 단어들을 많이 사용하게 되는 것이다. 동일한 근거와 함께 나타나는 단어들이 상황에 따라 다를 수 있다는 점이다.
본 발명에서는 이를 단어가 사용되는 시간적 범위에 따라 구분하여 학습하고 저장 및 이용한다. 즉 실시간 학습시 사용자의 일생에 걸친 지속적인 언어패턴(개인성향 예측정보 데이터베이스)(31), 최근 일정 기간에 걸친 언어패턴(최근성 예측정보 데이터베이스)(32) 및 특정 시점에 특정 주제와 관련하여 나타나는 언어패턴 (주제별 예측정보 데이터베이스)(33) 등으로 구분한다. 세 번째의 경우는 자신의 언어패턴만이 아니라 해당 시점에 채팅 등으로 대화중인 상황에서 대화의 주제에 관련된 언어 패턴 즉 단어 발생 패턴도 포함한다. 즉, 유무선 네트워크를 통하여 공유 가능한 다른 사용자 단말의 텍스트를 선택하고 그 텍스트에 대한 정보를 입력하는 경우, 그 텍스트의 언어패턴들로 데이터베이스를 구축한다(인바운딩 데이터베이스)
본 발명의 예측정보 데이터베이스는 미리 구축되는 기구축 예측정보 데이터베이스(20)뿐만 아니라, 학습 데이터의 보전 기간에 따라 구분되는 개별 데이터베이스들이 존재하고, 이들 개별 데이터베이스 중 개인성향 데이터베이스(31)는 문자 입력 이벤트가 최초로 발생한 시점부터 사용자의 언어패턴이 지속적으로 학습되어 갱신되며, 최근성 데이터베이스(32)는 학습된 시점으로부터 일정 기간이 지나면 해당 학습 내용이 제거되어 사용자의 최근 언어패턴만이 저장되며, 주제별 데이터베이스(35)는 전자장치의 전원이 들어온 때부터 해당 시점 사용자의 언어 패턴이 학습되어 학습된 내용이 전원이 오프되기 전까지 유지될 수 있다.
이상의 단어가 사용되는 시간적 범위에 따른 구분은 실시간 학습되는 데이터의 저장 후 유지 기간을 달리하는 방식으로 구현된다. 특정인의 지속적인 언어 패턴은 학습을 통해 해당 데이터가 획득된 시점으로부터 거의 반영구적으로 유지되며(특별히 데이터 량의 조절이 필요하지 않는 한), 최근 선호에 따른 언어패턴은 학습된 데이터가 학습시점으로부터 일정 기간까지만 유지되고(물론 동일한 데이터의 학습이 여러 차례 이뤄진 경우 먼저 학습된 데이터들이 기간이 되면 제거되는 방식이다), 주제에 따른 언어패턴은 해당 글을 쓰기 위해 본 예측 시스템이 탑재된 정보기기를 켜서 끄기 전까지만 유지되는 것이다(물론 사용자가 계속 유지시켜서 나중에 다시 사용할 수도 있다). 세 번째 주제에 따른 학습 데이터의 유지 기간을 정보기기를 켠 시점부터 끄기 전까지로 한 것은 정보기기를 켜서 끌 때까지는 대체적으로 한 주제로 글을 입력할 때가 많고 그렇지 않다하여도 많아야 두세 주제라는 가정에 근거한다.
또한, 다른 실시예에서는, 학습 데이터의 보존 기간에 따라 구분되는 예측정보 데이터베이스들과 별도로 예측정보 데이터베이스를 추가로 구비하고 컴퓨터 또는 웹에 저장되어 있는 텍스트를 음절 예측 응용 프로그램에서 불러와 그 텍스트의 언어패턴들로 예측정보 데이터베이스를 일괄 구축할 수 있다.
본 다중 학습의 경우에도 예측시 모든 구성 데이터베이스들을 검색하게 되면 데이터베이스들에 걸쳐 동일한 예측 대상 후보들이 추출되는 경우 연관성값을 합산한 후 다른 예측 대상 후보들과 비교하고 최종 선정하게 된다.
그리고 전략에 따라서는 본 발명에 따른 예측 시스템에서 예측 정보 데이터베이스로, 실시간 학습되어 구축되는 데이터베이스들만 사용할 수도 있고, 그중에서도 일부만을 사용할 수도 있다. 또한, 연관성값을 배제하고 학습 데이터 저장 기간이 보다 짧은 데이터베이스에서 추출된 예측 대상 후보를 우선 선정하는 방식도 가능하다.
- Hardware -
본 발명에 적합한 하드웨어 구성은 본 발명의 응용 프로그램을 저장할 수 있는 메모리, 예측된 결과를 표출하는 출력 장치, 예측된 결과를 선택하는 입력 장치, 그리고 동작을 제어하는 제어부를 가진 전자장치인데, 본 발명은 그 종류와 유형에 제한되지 아니한다. 예컨대 본 발명은 컴퓨터, PDA, 휴대폰, PMP 등에 이용될 수 있다. 하드웨어가 컴퓨터인 경우에는 입력 장치는 키보드 또는/및 마우스이며, 휴대폰이나 PDA 등의 소형 정보 기기의 경우에는 숫자와 함께 표시되는 키패드의 입력키들 또는 터치패드가 문자 입력 장치가 된다. 또한, 출력 장치는 모니터 화면이 될 것이지만, 키보드 상단에 별도의 화면표시부를 두어 예측된 결과를 표시해주는 경우도 좋다(이 실시례는 키보드 일측에 화면표시부를 두고 화면표시부에 표출된 예측 결과 음절들 중 선택할 수 있는 수단을 함께 구비하여 구성된다).
도 6은 본 발명의 문자 입력 장치(10)의 다양한 구성예를 나타낸다. 마우스(11), 키보드(12), 키패드(13), 센서(14), 터치패드(15), 스위치(17) 등이 본 발명의 문자 입력 장치(10)의 일례가 될 수 있다. 키패드(13)는 휴대폰이나 PDA와 같은 소형 정보 기기에 통상 사용된다. 센서(14)는 신체의 일부분의 동작이나 변화를 감지하여 이를 입력신호로 판단하는 장치로서 손을 움직일 수 없는 중증 장애인의 입력 키 선택에 중요한 수단이 된다. 스위치(17)는 입력 또는 선택에 불편을 겪는 일부 장애인을 위하여 소정의 시간 간격으로 입력의 포커스가 표출된 개별 음절 후보 버튼 상에서 자동 이동하는 도중에 사용자로부터 현재 포커스에 대응하는 특정 버튼의 선택을 입력받는 스캔 방식으로 동작한다. 이들 방식은 사용자가 이용하는 사용자 단말의 종류 및 특성에 따라 선택되며 중복될 수 있다.
- 예측 프로세스 -
도 7은 이상에서 상세히 설명한 본 발명의 음절 예측 방법에 따른 전체 프로세스를 개략적으로 나타낸다. 먼저, 사용자 단말은 텍스트를 작성하는 환경에서 음절 예측 응용 프로그램을 실행한다. 음절 예측 응용 프로그램을 먼저 실행한 다음에 텍스트를 작성하여도 마찬가지다.
예측 시스템은 실시간으로 입력 내용을 수신한다(S10). 사용자는 입력장치를 통해 1개 이상의 문자를 입력한다. 문자 입력 장치에 필요한 입력 키는 하드웨어로 구성된 물리적 키여도 좋고 또는 소프트웨어로 만들어진 가상 키여도 좋다.
1개 이상의 문자가 입력되면 근거 추출 수단은 입력된 문자 및 기입력된 텍스트로부터 근거를 추출한다(S20). 다음으로 추출된 근거를 이용하여 예측정보 데이터베이스로부터 1개 이상의 음절 후보들을 추출한다(S30). 단어가 사용되는 시간적 범위에 따라 구분된 예측 정보 데이터베이스들이 포함되어 있는 경우 이들 모두에서 해당 근거에 연관된 음절 후보들을 추출한다. 그리고 동일한 후보들을 그 연관성값을 합산한 후 다른 후보들과 비교하여 최종 표출 대상 후보들을 선정한다. 선정하는 음절 후보들의 개수는 5개 내지 10개의 범위에서 정해지는 것이 좋지만 그 개수에 의해 본 발명의 보호범위가 제한되지는 아니한다.
그리고 추출된 음절 후보를 사용자의 문자 출력 장치에 표시한다(S40). 추출된 1개 이상의 음절후보 중 입력될 가능성이 높은 순으로 정렬한 후 가장 높은 후보부터 일정 개수까지 사용자 단말의 문자 출력 장치에 표시한다. 문자 출력 장치는 LCD, LED 등으로 이루어지는 디스플레이창이 이용되며, 결국 문자 출력 장치에는 사용자가 입력한 입력 문자들과, 시스템이 예측해주는 음절 후보가 구획을 달리하여 함께 표시된다.
다음으로, 사용자의 선택 키 입력에 의해 다수로 제시된 음절 후보 중 한 개의 데이터가 선택되는지 여부를 판단하고(S50), 선택되는 경우, 즉 예측이 적중하는 경우에는 해당 음절(또는 복합음절이나 단어)을 선택하였다는 것에 대한 실시간 학습 이벤트를 발생한다(S60). 그리고 실시간 학습 예측정보 데이터베이스들을 갱신한다(S70). 데이터베이스의 갱신이란 해당 근거와 음절 후보의 등록을 의미하며 이미 등록되어 있는 경우 그 연관성값의 증가를 의미한다.
한편, 상기 S50 단계에서 음절 후보가 선택되지 않은 경우, S80 단계의 수동 입력(사용자 자신이 입력하는 것) 절차를 통해 입력하고자 하는 단어의 앞 부분 문자가 입력되면 다시 이를 근거에 포함하여 재예측이 이뤄진다. 가능성은 낮지만 하나의 단어 입력시(미등록어 등으로 인해) 예측이 계속 실패한 경우 사용자가 해당 단어의 구성문자를 모두 입력하게 되며 단어가 완성되는 경우(S90) 바로 학습되어 실시간 학습 예측정보 데이터베이스에 저장된다. 이때 음절이 입력되는 즉시 학습이 가능할 수도 있으나 영어의 경우 음절의 구분이 명확하지 않기 때문에 단어가 다 입력된 후 규칙 등에 의해 음절을 분리하고 나서 학습하는 것이 바람직하다.
한편, 본 발명의 보호범위가 이상에서 명시적으로 설명한 실시례에 의해 제한되는 것은 아니다. 또한, 본 발명이 속하는 기술분야에서의 자명한 변경이나 치환으로 말미암아 본 발명의 보호범위가 제한될 수도 없음을 첨언한다.
이상에서 설명한 본 발명에 따르면, 일일이 키보드를 조작하는 번거로움 없이 더 쉽고 더 빠르게 원하는 단어 또는 문장을 입력할 수 있는 장점이 있다.
또한, 본 발명은 사용자가 입력하고자 하는 단어를 예측함에 있어, 단어 자체를 바로 예측하기보다 음절 단위로 예측함으로써 예측의 적중률을 효과적으로 높인다.
또한, 본 발명은 단어가 사용되는 시간적 기간에 따라 예측정보 데이터베이스를 구별한 후 실시간 학습하고 예측에 반영함으로써 인간이 단어를 연상하는 과정과 유사한 예측을 구현함으로써 예측의 적중률을 효과적으로 높인다.
이러한 효과와 장점들은, 키 입력에 어려움을 느끼는 장애인이나 노인에게 매우 유용하게 이용될 수 있을 것이다. 또한, 일반인의 경우에도 각종 텍스트의 작성, 채팅, 소형 정보 기기를 이용한 문자 메시지(Short Message Service) 전송 등에 매우 유용하에 활용될 수 있음을 첨언한다.
본 발명의 명세서에서 구체적으로 언급되지 않은 효과라 하더라도, 본 발명의 기술적 특징에 의해 기대되는 잠정적인 효과는 본 발명의 명세서에 기재된 것과 같이 취급됨을 첨언한다.

Claims (10)

  1. 전자 장치에서의 물리적 키 또는 가상키를 이용하여 문자를 입력하는 경우에, 음절 예측 응용 프로그램을 이용하여 입력할 음절을 예측하는 단어 예측 방법으로서:
    전자 장치의 문자 입력 장치를 통해 입력된 문자 및 기입력된 텍스트로부터 근거를 추출하는 단계;
    추출된 근거를 이용하여 예측정보 데이터베이스로부터 다음에 입력될 것으로 예상되는 음절 후보들을 1개 이상 추출하는 단계;
    추출된 1개 이상의 음절 후보들을 사용자 단말의 문자 출력 장치에 표시하는 단계; 및
    표시된 음절 후보들 중 하나를 사용자가 선택하여 응용프로그램에 전달하는 단계;를 포함하는, 예측 기반 단어 입력 방법.
  2. 전자 장치에서의 물리적 키 또는 가상키를 이용하여 문자를 입력하는 경우에, 예측 응용 프로그램을 이용하여 단어를 예측 기반으로 입력하는 방법으로서:
    학습 데이터의 보존 기간에 따라 구분되는 예측정보 데이터베이스를 1개 이상 구비하고,
    전자 장치의 문자 입력 장치를 통해 입력된 문자 및 기입력된 텍스트로부터 근거를 추출하는 단계;
    추출된 근거를 이용하여 예측정보 데이터베이스로부터 다음에 입력될 가능성이 높은 문자열 후보들을 추출하는 단계;
    추출된 1개 이상의 문자열 후보들을 사용자 단말의 문자 출력 장치에 표시하는 단계; 및
    상기 표시된 문자열 후보들이 사용자 단말에 의해 선택되거나 선택되지 아니하고 단어 입력이 행해진 경우에, 상기 문자 입력 장치를 통해 입력된 문자열에 대한 실시간 학습 이벤트를 생성하고 상기 학습 데이터의 보존 기간에 따라 구분되는 예측정보 데이터베이스들을 갱신하는 단계;를 포함하는, 예측 기반 단어 입력 방법.
  3. 제 2 항에 있어서,
    상기 문자열은 문자, 음절, 복합음절 또는 단어인, 예측 기반 단어 입력 방법.
  4. 제 3 항에 있어서,
    상기 학습 데이터의 보존 기간에 따라 구분되는 예측정보 데이터베이스들 중에 문자 입력 이벤트가 최초로 발생한 시점부터 사용자의 언어패턴이 지속적으로 학습되어 갱신되는 개인성향 데이터베이스를 더 포함하는, 예측 기반 단어 입력 방법.
  5. 제 3항에 있어서,
    상기 학습 데이터의 보존 기간에 따라 구분되는 예측정보 데이터베이스들 중에 학습된 시점으로부터 일정 기간이 지나면 해당 학습 내용이 제거되어 사용자의 최근 언어패턴만이 저장되는 최근성 데이터베이스를 더 포함하는, 예측 기반 단어 입력 방법.
  6. 제 3항에 있어서,
    상기 학습 데이터의 보존 기간에 따라 구분되는 예측정보 데이터베이스들 중에 상기 전자장치의 전원이 들어온 때부터 해당 시점 사용자의 언어패턴이 학습되어 학습된 내용이 전원이 나가기 전까지 유지되는 주제별 데이터베이스를 더 포함하는, 예측 기반 단어 입력 방법.
  7. 제 3 항에 있어서,
    예측정보 데이터베이스는, 유무선 네트워크를 통하여 공유 가능한 다른 사용자 단말의 텍스트를 선택하고 그 텍스트에 대한 정보를 입력하는 경우, 그 텍스트의 언어패턴들로 데이터베이스를 구축하는 인바운딩 데이터베이스를 더 포함하는, 예측 기반의 단어 입력 방법.
  8. 제 3 항에 있어서,
    상기 학습 데이터의 보존 기간에 따라 구분되는 예측정보 데이터베이스들과 별도로, 예측정보 데이터베이스로서, 컴퓨터 또는 웹에 저장되어 있는 대량의 텍스트들 내에 존재하는 일반적인 언어 패턴들을 일괄 추출하여 구축한 예측정보 데이터베이스를 더 포함하는, 예측 기반 단어 입력 방법.
  9. 제 1 항 또는 제 2 항에 있어서,
    상기 근거는 예측 대상의 앞 일부 문자를 포함하는, 예측 기반 단어 입력 방법.
  10. 제 1 항 또는 제 2 항에 있어서,
    상기 근거는 예측 대상에 앞서 입력된 문법적 요소 및 의미적 요소 등의 언어요소인, 예측 기반 단어 입력 방법.
KR1020070011525A 2007-02-05 2007-02-05 예측 기반 단어 입력 방법 KR20080073032A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020070011525A KR20080073032A (ko) 2007-02-05 2007-02-05 예측 기반 단어 입력 방법
PCT/KR2007/002119 WO2008096934A1 (en) 2007-02-05 2007-04-30 Prediction-based word inputting method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070011525A KR20080073032A (ko) 2007-02-05 2007-02-05 예측 기반 단어 입력 방법

Publications (1)

Publication Number Publication Date
KR20080073032A true KR20080073032A (ko) 2008-08-08

Family

ID=39681821

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070011525A KR20080073032A (ko) 2007-02-05 2007-02-05 예측 기반 단어 입력 방법

Country Status (2)

Country Link
KR (1) KR20080073032A (ko)
WO (1) WO2008096934A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109858004A (zh) * 2019-02-12 2019-06-07 四川无声信息技术有限公司 文本改写方法、装置及电子设备

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120226490A1 (en) * 2009-07-09 2012-09-06 Eliyahu Mashiah Content sensitive system and method for automatic input language selection
US9146623B1 (en) 2013-08-22 2015-09-29 Google Inc. Systems and methods for registering key inputs
JP6982017B2 (ja) * 2019-02-08 2021-12-17 ヤフー株式会社 情報処理装置、情報処理方法及び情報処理プログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4369245B2 (ja) * 2002-03-22 2009-11-18 ソニー エリクソン モバイル コミュニケーションズ, エービー 携帯電話装置及びテキストを入力する方法
KR100541638B1 (ko) * 2003-06-03 2006-01-10 삼성전자주식회사 한글 입력 장치 및 방법
KR20050106613A (ko) * 2004-05-06 2005-11-11 부산대학교 산학협력단 단어자동완성시스템
US7886233B2 (en) * 2005-05-23 2011-02-08 Nokia Corporation Electronic text input involving word completion functionality for predicting word candidates for partial word inputs

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109858004A (zh) * 2019-02-12 2019-06-07 四川无声信息技术有限公司 文本改写方法、装置及电子设备
CN109858004B (zh) * 2019-02-12 2023-08-01 四川无声信息技术有限公司 文本改写方法、装置及电子设备

Also Published As

Publication number Publication date
WO2008096934A1 (en) 2008-08-14

Similar Documents

Publication Publication Date Title
Kim et al. Two-stage multi-intent detection for spoken language understanding
CN109196496B (zh) 未知词预测器和内容整合的翻译器
KR100891358B1 (ko) 사용자의 다음 문자열 입력을 예측하는 글자 입력 시스템및 그 글자 입력 방법
CN105814519B (zh) 将图像或标签输入到电子设备的系统和方法
CN105759983B (zh) 电子设备的文本输入系统及文本输入方法
US20110063231A1 (en) Method and Device for Data Input
US20110248914A1 (en) System and Method for Virtual Touch Typing
US10872207B2 (en) Determining translation similarity of reverse translations for a plurality of languages
CN105183761A (zh) 敏感词替换方法和装置
WO2014062525A1 (en) Text/character input system, such as for use with touch screens on mobile phones
JP2020017275A (ja) アプリケーションの内容分析を利用してユーザアクセスを制御する方法およびシステム
JP2022020582A (ja) 自然言語処理モデルの訓練方法、装置、デバイス及び記憶媒体
WO2014015201A1 (en) Speech and gesture recognition enhancement
Krak et al. Text entry system for alternative speech communications
CN110516035A (zh) 一种混合模块的人机交互方法和系统
EP3267301B1 (en) High-efficiency touch screen text input system and method
Sandnes Reflective text entry: a simple low effort predictive input method based on flexible abbreviations
KR20080073032A (ko) 예측 기반 단어 입력 방법
Johansen et al. Language technology in a predictive, restricted on-screen keyboard with dynamic layout for severely disabled people
Cavalieri et al. Combination of language models for word prediction: An exponential approach
Stoop et al. Using idiolects and sociolects to improve word prediction
Jiang et al. Braille to print translations for Chinese
Garay-Vitoria et al. A comparison of prediction techniques to enhance the communication rate
Zhao et al. What is the basic semantic unit of Chinese language? A computational approach based on topic models
Abbas A Stochastic Prediction Interface for Urdu

Legal Events

Date Code Title Description
N231 Notification of change of applicant
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application