KR20020005427A - 개선된 철자법 검사를 위한 시스템 및 방법 - Google Patents

개선된 철자법 검사를 위한 시스템 및 방법 Download PDF

Info

Publication number
KR20020005427A
KR20020005427A KR1020010036530A KR20010036530A KR20020005427A KR 20020005427 A KR20020005427 A KR 20020005427A KR 1020010036530 A KR1020010036530 A KR 1020010036530A KR 20010036530 A KR20010036530 A KR 20010036530A KR 20020005427 A KR20020005427 A KR 20020005427A
Authority
KR
South Korea
Prior art keywords
words
user
word
list
document
Prior art date
Application number
KR1020010036530A
Other languages
English (en)
Other versions
KR100455329B1 (ko
Inventor
피코버글리포드알랜
즐라트신알렉산더
Original Assignee
포만 제프리 엘
인터내셔널 비지네스 머신즈 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 포만 제프리 엘, 인터내셔널 비지네스 머신즈 코포레이션 filed Critical 포만 제프리 엘
Publication of KR20020005427A publication Critical patent/KR20020005427A/ko
Application granted granted Critical
Publication of KR100455329B1 publication Critical patent/KR100455329B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation

Abstract

철자법 검사 방법(spell checking method)은 철자법에 맞지 않는 단어가 정확한 철자법을 찾기 원하는 사용자에 의해 선택되었을 때 철자법에 맞는 선택 가능한 유사한 단어들의 리스트를 제시한다. 한 기능은 문서의 "요지(content)" 또는 "주제(topic)"를 결정한다. 상기 요지를 근거로, 철자법 검사기는 철자법에 어긋난 단어에 대한 적당한 대체 단어들을 제시한다. 다른 기능에서, 단어의 각각의 레터(letter)에 있어, 철자법 검사기(spell checker)는 철자법 검사기의 대체 단어들의 리스트를 개선하기 위해 키보드 키들의 "주변(nearby)" 레터들을 검사한다. 또한 시스템은 주변 또는 대용 키(즉, 레터)(key substitutions)에 대해서 사용자의 사용 히스토리를 모티너하고, 대안 단어들의 리스트들을 제시할 때 상기 정보를 고려한다. 다른 기능은 철자법 검사 정정의 사용자 히스토리를 모니터함으로써 철자를 정정한다. 2명 이상의 사용자를 위한 정정 집합 표들(aggregate tables of corrections)은 철자법 검사기에 의해 보존, 공유 및 제공될 수 있다. 한 방법이 다른 방법 보다 선호되도록 다양한 우선 순위들이 사용될 수 있다. 우선 순위들은 사용자의 수동적인 입력에 의해 결정될 수 있거나 또는 시스템 소프트웨어에 의해 자동으로 제공될 수 있다. 다른 기능은 사용자의 가장 빈번한 단어 또는 가장 최근에 오기된(misspelled) 단어들을 보여주는 보조창(auxiliary window)을 제공하는 것이다. 사용자는 현 문서에 대한 보조창으로부터 관련 단어들을 복사 및 붙이기(paste) 위해 클립보드 기능을 사용할 수 있다.

Description

개선된 철자법 검사를 위한 시스템 및 방법{SYSTEM AND METHOD FOR IMPROVED SPELL CHECKING}
본 발명은 워드 프로세싱에 관한 것으로, 특히, 워드 프로세싱 시스템에서 단어들의 철자를 정정하기 위한 방법 및 시스템에 관한 것이다.
컴퓨터, 특히, 퍼스널 컴퓨터의 주요 사용 용도는 "워드 프로세싱"이다. 워드 프로세서들은 문서 작성의 주요 수단으로서 타자기를 대신했다. 문서 작성시, 전형적으로 각각의 단어가 정확한 철자법으로 이루어지는 것은 매우 중요하다. 워드 프로세서에서, 철자법 검사 프로그램(철자법 검사기)이 문서에서 단어들의 철자법을 검사하기 위해 종종 사용된다. 사용자는 전형적으로 철자법 도구 옵션을 선택함으로써 철자법 검사기를 실행시킨다. 철자법 검사기는 정확한 철자법으로 된 단어들의 리스트를 포함하는 관련 사전 파일을 갖는다. 문서에서 단어의 철자법을 검사하기 위해, 철자법 검사기는 해당 단어에 대한 사전을 탐색한다. 단어가 사전에 있으면, 단어는 정확한 철자법으로 된 것이다. 그렇지 안은 경우, 단어는 오기된 것이다. 철자법 검사기는 전형적으로 오기된 단어들을 사용자에게 알려주고 정확한 철자법을 위해 프롬프트한다. 잠재적으로 오기된 모든 단어들에 대해, 철자법 도구는 사용자에게 상기 단어를 대체하거나 무시하거나 또는 편집하도록 프롬프트할 수 있다. 상기 프롬프팅은 사용자가 선택할 수 있는 유사한 철자법의 단어들의 선택 가능한 리스트를 종종 제시한다. 사용자가 희망 단어를 선택할 때, 철자법 검사기는 정확한 철자법의 단어로 오기된 단어들을 대체한다.
또한 철자법 검사는 다양한 인터넷 웹 페이지들에서 제공되는데, 예를 들면, 사용자가 웹 상의 정보를 탐색하기 위해 단어들을 입력할 때 오기된 단어들의 대체 철자들을 제공하는 www.altavista.com의 인기 있는 알타 비스타 웹(Alta Vista site)이다. 따라서, 개선된 철자법 검사기를 위한 시스템 및 방법이 컴퓨터 또는 웹 탐색 엔진들과 같이 텍스트가 타이프되는 임의의 장소의 워드 프로세싱에 유용하다. 개선된 철자법 검사기의 사용은 키보드를 타이프함으로써 생성되는 문서들에만 제한되지 않고, 음성 입력 또는 육필 입력(handwriting input)에 의해 생성되는 텍스트에도 적용된다.
유사한 철자법의 단어들의 선택 가능한 리스트가 사용자가 쓰고자 했던 단어를 실제로 포함하지 않을 수도 있기 때문에, 현 프로세스에 따른 철자법 검사는 비효율적이다. 리스트가 단어를 포함하지 않으면, 다수의 다른 대체 철자들을 포함하는 리스트에서 정확한 단어를 찾는데 종종 방해가 된다(cumbersome). 따라서, 현 철자 검사는 유용한 기능이기는 하지만, 필수 사용자 인터랙션의 측면에서는 효율적이지 못하다. 유사한 철자 단어들의 데이터베이스를 사용하는 철자법 검사기들의 일례들은 1999년 2월 23일 닐슨(Nielsen)에게 양도된 미국 특허 제5,875,443호에 기술되어 있다. 상기 특허는 인터넷에서 유효한 원격 데이터베이스들의 사용에 대해 기술하고 있고 전체가 참조용으로 본 명세서에 인용되었다. "배경(background)" 철자법 검사의 일례들은 전체가 참조용으로 본 명세서에 인용된 1998년 7월 28일 Mogilevsky에게 양도된 미국 특허 제5,787,451호에 기술되어있다. "배경" 철자법 검사는 워드 프로세서의 유휴 기간 중에 실행되는 철자법 검사에 관한 것이다. 상기 철자법 검사기는 "배경" 철자법 검사를 실행해서 철자법 오류들이 편집 기간 중에 문서에서 편리하게 하이라이트될 수 있다.
현존 철자법 검사기들의 문제점 및 단점들을 해결하기 위해, 본 발명은 오기된 단어가 정확한 철자법을 찾기 원하는 사용자에 의해 선택되었을 때 유사한 철자의 단어들의 선택가능한 리스트를 제공하는 방법을 제시한다. 한 실시예에서, 개선된 철자법 검사기는 문서의 "요지" 또는 "주제"를 결정한다. 요지를 근거로, 철자법 검사기는 오기된 단어들에 대한 가능성 있는 대체 단어들을 제시한다. 다른 실시예에서, 단어의 각각의 레터에 대해, 철자법 검사기는 키보드 키들 상의 "주변" 레터들을 검사해서 대체 단어들의 철자법 검사기의 리스트를 개선한다. 또한 시스템은 주변 또는 키(즉, 레터)에 대한 사용자의 사용 히스토리를 모니터하고 다른 단어들의 리스트들을 제시할 때 상기 정보를 고려한다. 사용자는 수동으로 상기 정보를 제공할 수 있다. 개선된 철자법 검사기는 또한 철자법 검사 정정에 대한 사용자 히스토리를 모니터함으로써 철자를 정정한다. 2명 이상의 사용자를 위한 정정 집합 표들이 철자법 검사기들에 의해 보존, 공유 및 제공될 수 있다. 철자법 검사를 개선시키는 상술된 방법들은 단독으로 사용될 수도 있고 일련의 검사들로서 순차적으로 실행될 수도 있는데, 상이한 방법들의 우선 순위는 다양하게 비중이 주어질 수 있다. 다양한 우선순위들은 하나의 방법이 다른 방법 보다 선호되도록 사용될 수도 있다. 우선 순위들은 사용자의 수동 입력에 의해 결정될 수도있고 시스템 소프트웨어에 의해 자동으로 제공될 수도 있다.
또한 개선된 철자법 검사기는 사용자의 가장 빈번하거나 가장 최근의 오기 단어들을 나타내는 보조 창을 제공할 수 있다. 사용자는 다수의 오퍼레이팅 시스템들이 제공된 "클립보드"를 사용해서 현 문서에 대한 보조 창으로부터 해당 단어들을 복사하거나 붙이기하기 위해 마우스를 사용할 수 있다. 스크린 상에서 정확한 단어들을 찾는 것은 교육적인 가치가 있을 수 있는데, 이는 각각의 단어의 정확한 철자에 대한 사용자의 생각을 강화시킨다.
그 동안 일례들이 키보드 입력과 관련되어 기술되어져 왔지만, 본 명세서에서 제시된 방법들은 음성 입력 및 육필 인식을 갖는 시스템들에도 적용될 수 있음을 주지하자. 따라서, 시스템 및 방법은 또한 육필 및 음성 인식을 개선하기 위해 사용될 수 있다.
도 1은 본 발명을 구현한 일례의 컴퓨터 시스템을 도시한 대표도.
도 2는 철자법 검사기를 갖춘 워드 프로세싱 프로그램의 창을 도시한 대표도.
도 3은 도 1에 도시된 컴퓨터 시스템의 개선된 철자법 검사기에 의해 실행되는 단계들을 도시한 플로우챠트.
도 4는 단계들(310, 330, 340)이 어떻게 공간적으로 우선순위화될 수 있는지를 도시한 플로우챠트.
<도면의 주요 부분에 대한 부호의 설명>
12 : 컴퓨터 시스템
40 : 키보드
46 : 마우스
52 : 디스플레이 스크린
62 : 문서
90 : 워드 프로세싱 프로그램
110 : 네트워크
130 : 서버
이제부터 도면들을 참조하는데, 특히 도 1을 참조하면, 본 발명의 방법 및 시스템에 따른 컴퓨터 시스템(12)이 도시되어 있다. 컴퓨터 시스템(12)은 컴퓨터(36), 컴퓨터 디스플레이(38), 키보드(40) 및 다수의 입력 포인팅 디바이스들(42)을 포함한다. 본 기술에 숙련된 자들은 입력 포인팅 디바이스들(42)이 포인팅 스틱(44), 마우스(46), 트랙볼(48), 펜(50), 디스플레이 스크린(52)(예를 들면, 터치 디스플레이 스크린(52)), 또는 사용자가 오브젝트들, 아이콘들, 및 컴퓨터 디스플레이(38)상의 그래픽 방식의 다른 디스플레이 아이템들을 조작할 수 있게 해 주는 임의의 다른 디바이스를 이용해서 구현될 수도 있음을 알 수 있다. 또한 음성 스피커들(54) 및/또는 음성 입력 디바이스들(51)이 컴퓨터 시스템(12)에 접속될 수 있다(예를 들면, IBM의 보이스 타입 딕테이션 시스템(Voice Type Dictation System)을 참조하라. "보이스타입(VoiceType)"은 IBM 주식회사의 상표이다.).
그래픽 사용자 인터페이스(53)는 스크린(52) 상에 디스플레이 될 수 있고 임의의 입력 포인팅 디바이스(42)를 사용해서 조작될 수 있다. 그래픽 사용자 인터페이스(53)는 문서에서 단어들의 철자법을 검사하는 철자법 검사 기능(93)을 갖는 임의의 공지된 워드 프로세싱 프로그램(90)을 사용해서 문서(62)의 텍스트들을 디스플레이하는 워드 프로세싱 애플리케이션(60)의 디스플레이를 포함할 수 있다. 문서는 디스플레이 스크린(52), 스피커들(54) 또는 다른 출력 디바이스들을 통해 사용자에게 제공된 그래픽, 음성, 또는 텍스트 정보(46)를 포함할 수 있다. 정보 페이지들은 다른 정보 페이지들(62)에 대해서 월드 와이드 웹(World Wide Web)상에서 사용되는 하이퍼텍스트 링크들과 같은 선택 가능한 링크들(66)을 포함할 수도 있는데, 이러한 링크들은 관련 정보 페이지들을 요청하기 위해 입력 디바이스들(42) 중 한 디바이스에 의해 활성활 될 수 있다. 상기 하드웨어는 본 기술 분야에 널리 공지된 것으로 텔레비젼("웹 TV") 및 멀티미디어 엔터테인먼트 센터와 관련되어 사용된다. 컴퓨터 시스템(12)은 본 발명이 캐시(80) 공간을 확보하는 하나 이상의 메모리들(65)을 포함한다. 네트워크(110)를 통해 컴퓨터 시스템(12)과 접속된 서버(130)는 캐시(80)에 멀티미디어 정보 페이지들을 송신할 수 있다. 네트워크(110)는 임의의 공지된 근거리 통신망(LAN) 또는 광역망(WAN)일 수 있는데, 예를 들면, 인터넷이다.
도 1a를 참조하면, 본 발명에 따른 컴퓨터 시스템(12)의 구조의 블록도가 도시되어 있다. 코어 구조는 중앙 처리 장치(165), 메모리 제어기(162), 시스템 메모리(65), 디스크 기억 장치(70) 및 디스크 기억 장치 제어기(75)를 포함한다. 시스템 메모리(65)의 일부분은 정보 페이지 캐시(80)를 위해 남겨 둔다. 또한, 디스크 기억 장치(70)의 파일 공간(85)은 추가의 문서 페이지 캐시로서 남겨질 수 있다. 일반적으로 말하자면, 캐시는 원격 네트워크 부착 컴퓨터 디스크와 같은 슬로우어 디바이스(slower device)로부터 데이터를 판독해야만 하는 것을 방지하기 위해 데이터가 기억될 수 있는 장소이다. 예를 들어, 디스크 캐시는 원격 디스크 기억 장치를 액세스하지 않고 판독될 수 있는 정보를 기억할 수 있다.
도 2를 참조하면, 워드 프로세싱 애플리케이션(60)의 디스플레이를 갖는 디스플레이 스크린(52)이 도시되어 있다. "cimputee(210)"와 같이 오기된 단어들은 워드 프로세싱 프로그램(90)(도 1 참조)의 철자법 검사기(93)에 의해 종종 하이라이트(215)되거나 또는 사용자의 주의를 끌게 된다. 사용자가 단어(210)를 선택할 때, 유사한 대체 철자들의 리스트(220)가 사용자에게 제시되고, 사용자는 상기 리스트에서 문서에 있도록 의도된 단어의 정확한 철자를 선택할 수 있다. 예를 들어, 정확한 철자법의 첫번째 대체 단어(225)는 "compute"이다.
도 3은 워드 프로세싱 프로그램(90) 및 철자법 검사기(93)에 의해 구현된 하나의 양호한 철자법 검사 프로세스(300)의 플로우챠트를 포함한다. 단계(310)에서, 철자법 검사기(93)는 문서의 "요지" 또는 "주제"를 결정한다. 이는 문서의 제목, 주요 표제들 및 텍스트의 단어들을 스캔하고 각각의 단어가 사용된 회수를 계수함으로써 달성될 수 있다. 예를 들어, 철자법 검사기(93)는 문서의 제목에 있는 단어, "divination"을 결정할 수 있다. 단어는 또한 문서에서 20회 나타날 수 있는데, 이는 "divination"이 문서의 "요지"와 관련된 중요한 단어일 가능성이 있음을 나타낸다. 사용자가 때대로 "divination"을 "duvonation"으로 오기한다면, 철자법 검사기(93)는 "deviation"과 같이 선택 가능한 다른 단어들을 제시하기 전에 가능한 정확한 철자법의 단어(225)로서 "divination"이라는 단어를 가장 먼저 제시한다.
또한, 단계(310)에서, 철자법 검사기(93)가 "divination"이 문서의 요지이며 문서에서 중요한 단어라고 결정하면, 철자법 검사기(93)는 잠재적인 의미론적 인덱싱(latent semantic indexing), 유사어 리스트들 및 유의어(92)(도 1에 도시됨), 및/또는 "fortune-telling"과 같은 가능한 관련 단어들이 문서에 나타날 가능성이 있음을 결정하고 그에 따라 대체 단어들의 리스트(220)에서 가능한 관련 단어들을 먼저 제시하는 관련 방법들을 사용한다. 예를 들어, fortune-telling은 문서의 주제이거나 문서의 요지와 관련된 divination과 관련된 단어이기 때문에, 오기된 단어, "fotune-telling"은 아마도 "fortune-telling"일 것이다. 잠재적인 의미론적 인덱싱은 문서의 요지를 결정하기 위한 방법으로 본 기술 분야에 숙련된 자들에게 널리 공지된 방법이다. 정확한 철자법의 단어들의 리스트(220)의 순서는 단어가 문서의 주제와 관련될 가능성(likeliness)에 대응한다. 예를 들어, "rodent"가 문서에서 20회 나타나고 "computers"가 10회 나타나고, 단어 "shrew"(일종의 rodent)가 "shriw"로 오기되면, "shrew"가 computers 보다는 "rodent"와 더 관련된 것이기때문에 대체 단어 "shrew"가 리스트(220)에서 "screw" 전에 나타난다. 단어가 헤더 또는 제목에 나타나거나, 문서에서 또는 사용자에 의한 수동 입력에서 키워드들의 명시된 리스트에 나타나면, 상기 단어들은 문서의 요지와 관련될 가능성이 매우 크다. 잠재적인 의미론적 인덱싱은 공지된 방법들에 의해 관련성을 평가하는데 사용될 수 있고, 따라서 가장 관련있는 단어들이 상부에 오도록 대체 단어들의 리스트(220)를 순서화하는데 사용될 수 있다.
단계(330)에서, 철자법 검사 프로세스(300)는 철자법 검사기를 개선하기 위해 키보드 상의 "주변" 키들을 검사한다. 키들 및 위치들의 리스트는 파일(91)에 기억된다. 예를 들어, 파일은 키 명칭(예를 들어, "Q", "W", "E", 등) 및 키의 위치들을 갖는 레코드들을 포함할 수 있다. 단계(330)에서의 검사는 하나의 키로부터 다른 키까지의 거리들을 근거로 거리 함수 또는 근사치(nearness) 계산을 포함한다. 예를 들어, 전형적인 미국 키보드 상의 V 키는 C 키로부터 하나 떨어져 있는 키이다. C에 대한 V의 거리는 Dv-c로 표기될 수 있다. G 키는 C 키로부터 V 키보다 더 멀리 떨어져 있다. C에 대한 G의 거리는 Dg-c로 표기될 수 있다. Dg-c> Dv-c임을 주지하자. 거리는 기하학으로부터의 공지된 거리 공식들을 사용해서 계산될 수 있다. 상기 거리 정보는 유사한 철자의 단어들의 리스트(220)에 포함될 유사한 후보들을 결정하는데 사용될 수 있다. 예를 들어, "V"가 "C"에 근접한 키이기 때문에 단어 "loce"는 아마도 "love"일 가능성이 있다. 단계(320)는 가능한 대용 레터들(letter substitutions)을 고려하고 가능성 있는 대용 레터들을 갖는 유효 단어들의 리스트를 제시한다. 거리 D를 근거로 가능성이 적은 후보들에 앞서 가능성이 큰 후보들이 리스트에 포함된다. 보다 적은 거리는 보다 큰 거리 보다 더 가능성이 높은 대용 문자와 관련된다. 이러한 방법은 100개가 훨씬 넘는 키들을 갖는 중국어 키보드들을 포함해서 다양한 종류의 키보드들에도 유용함을 주지하자.
단계(340)는 대용 레터들과 관련해서 사용자의 사용 히스토리를 모니터하고 단계(320)의 대체 단어들의 리스트들을 제시할 때 상기 정보를 고려한다. 예를 들어, 사용자가 인접한 정확한 "c" 대신 "v"를 종종 타이프하면, 이는 오기된 단어를 대체하기 위한 정확한 단어들의 가능성 있는 유사한 리스트를 결정할 때 고려된다. 과거의 대용 키들의 리스트들을 포함하는 정보는 데이터베이스(94)(도 1에 도시됨) 또는 서버(130)와 같은 원격 컴퓨터에 기억될 수 있다. 데이터베이스의 각각의 레코드는 레터 및 오기될 가능성이 있는 레터를 포함할 수 있다. 또한, 사용자는 적합한 대용 키들에 대한 정보를 수동으로 제공할 수도 있다. 예를 들어, 사용자가 "c" 대신 "v"를 종종 타이프한다는 것을 인식하고 있으면, 사용자는 오기된 단어를 대체하기 위해 정확한 단어들의 리스트를 제시할 때(320) 상기 정보를 고려하도록 시스템에게 통보할 수 있다. 단계(340)는 또한 레터 "교환(swaps)"과 관련된 사용자의 사용 히스토리를 모니터하고 단계(320)의 대체 단어들의 리스트를 제시할 때 상기 정보를 고려한다. 레터 "교환"이라는 용어는 2개의 레터들이 교환되어 사용되는 것을 의미한다. 예를 들어, 사용자가 종종 "i" 및 "s"를 교환할 수 있는데, 즉, 사용자가 "is"를 의미하고자 할 때 "si"를 타이프하거나, 또는 "si"를 의미하고자 할 때 "is"를 타이프할 수 있다. 시스템이 자동으로 상기 교환들을 추적할 수 있거나 또는 사용자가 시스템에게 상기 교환들이 발생할 가능성이 있음을 수동으로 통보할 수 있다. 단계(320)는 또한 워드 정정에 대한 사용자 히스토리를 모니터하고 사용자의 과거 타이핑 히스토리로부터 자동으로 유도된 가능성 있는 대용 리스트를 보존한다. 예를 들어, "dive"가 "duve"로 오기되면, 프로세스(300)는 u-i 오기 및 "dive-duve" 오기가 모두 발생했음을 주지하고 차후에 단계(320)가 오기된 단어를 대체하도록 정확한 단어들의 리스트를 제시할 때 상기 정보를 사용한다. "dive-duve" 오기 일례에서, 사용자의 철자법 검사 정정 히스토리가 모니터된다. 어느 정도, 시스템은 사용자에 의해 검사된 단어 철자법에 대해 과거에 선택된 정정 회수 및 특성을 모니터함으로써 사용자의 오기 패턴들에 대해 알 수 있다. 상기 정보는 정정표(96; 도 1에 도시됨)에 기억될 수 있다. 다른 일례는 사용자가 "behavior"를 "behavoir"로 종종 오기하는 경우 발생하는데, 과거에 사용된 대로 철자법 검사기를 통해 상기 정정을 실행한다. 단계(320)는 정확한 철자법의 대체 단어들의 리스트(220)를 효율적으로 제시하기 위해 "behavior--behavoir"와 같은 레코드들을 갖는 표(96)를 보존한다.
다양한 정정 표들은 사용자의 개인 선호도(preferences), 히스토리 등을 반영할 수 있거나, 또는 2명 이상의 사용자들을 반영하는 정정 집합 표들일 수 있다. 상기 표들은 보존될 수 있고, 네트워크를 통해 공유될 수 있으며 및 철자법 검사기에 의해 제공될 수 있다.
철자법 검사를 개선하는 상술된 방법들은 단독으로 사용될 수도 있고 일련의검사들로 순차적으로 실행될 수도 있다. 다양한 우선순위들이 한 방법이 다른 방법 보다 선호되도록 사용될 수도 있다. 예를 들어, 상위 우선 순위 방법(higher-priority method)(예를 들면, 단계(310)의 문서 요지 방법)이 3개의 대체 리스트를 제공하고, 하위 우선순위 방법(예를 들면, 단계(330)의 키 거리 방법)이 하나의 대체를 제공하면, 상위 우선순위 대체들이 하위 우선순위 대체들 전에 리스트에 포함된다. 우선순위들은 사용자의 수동 입력에 의해 결정되거나 시스템 소프트웨어에 의해 자동으로 제공될 수 있다.
도 2 및 도 3을 참조하면, 단계(350)는 보조 창(230)을 제공할 수도 있다. 단계(355)는 보조 창(230)에 사용자의 가장 빈번한 오기 단어들을 디스플레이한다. 단계(357)는 보조 창(230)에 사용자의 가장 최근의 오기 단어들을 제공한다. 상기 정보는 워드 프로세싱 프로그램(90)이 실행될 때 보조 창(230)에서 디스플레이되기 위해 데이터베이스에 기억될 수 있다. 사용자는 다수의 오퍼레이팅 시스템들을 갖는 "클립보드"를 사용해서 현 문서(62)에 대한 보조 창(230)으로부터 해당 단어들을 복사 및 붙이기 하기 위해 마우스(46)를 사용할 수 있다. 마이크로소프트 윈도우즈 95(Microsoft Windows 95) 또는 매킨토시 파인더(Macintosh Finder)와 같은 윈도우 환경에서, 메모리("클립보드 메모리")의 일시적인 기억 영역은 자료가 문서로부터 오려지거나 복사될 때 사용된다. 자료는 사용자가 자료를 어느 곳이든 붙이기를 할 때까지 기억된다. 예를 들어, 철자법 검사 프로세스(300)는 사용자가 단어들, behavior 및 dive를 종종 오기한다고 결정한다. 상기 단어들은 보조 창(230)에 리스트된다. 사용자는 필요한 경우 단어들을 복사 및 붙이기 하거나,드래그 및 드롭(drag and drop)할 수 있다. 스크린 상에서 정확한 단어들을 찾는 것은 교육적인 가치가 있을 수 있는데, 이는 각각의 단어의 정확한 철자에 대한 사용자의 생각을 강화시킨다. 가장 빈번하게 오기되는 단어, 예를 들어, 레터들의 문제 영역은 하이라이트(235)될 수 있다. 이도 또한 교육적인 가치가 있을 수 있다. 하이라이팅(235)은 단계(360)에 의해 달성된다. 요구된 경우, 하이라이팅(235)은 또한 단어가 존재하는 메인 창에서 실행될 수도 있다. 예를 들어, 단어의 레터는 상기 레터가 잘못된 것임을 나타내기 위해 컬러(236)를 변경시킬 수 있다.
도 4는 철자법 검사기(93)가 철자법 검사 프로세스(300)의 정보 수집을 우선순위화할 수 있는 우선 순위 프로세스(400)를 도시한 플로우챠트이다. 요지(단계(310)) 및 사용자의 히스토리(단계(330))를 검사할 때, 철자법 검사기(93)는 스크린에서 볼 수 있는 단어들과 관련된 정보에 대한 "공간적인" 우선권을 주고, 그 다음에는 현 문서 부분(예를 들어, 장(chapter))의 단어들에게 우선권을 주며, 그 다음 문서의 단어들에게, 그 다음에는 다른 열린 문서들의 단어들에게, 그 다음에는 사용자가 편집한 모든 문서들의 단어들에게 우선권을 주도록 우선순위화할 수 있다. 이러한 방식으로, 사용자의 필요성과 매우 관련된 정보가 수집될 수 있다. 특히, 단계(410)는 오기된 단어를 포함하는 동일한 문장의 텍스트에 대한 요지 및 대용 레터들을 결정한다. 단계(415)는 오기된 단어를 포함하는 동일한 절(paragraph)의 텍스트에 대한 요지 및 대용 레터들을 결정한다. 단계(420)는 스크린에 보이는 텍스트에 대한 요지 및 대용 레터들을 결정한다. 단계(425)는 오기된 단어를 포함하는 동일한 문서의 텍스트에 대한 요지 및 대용 레터들을 결정한다. 문서 부분은 오기된 단어가 존재하는 장의 텍스트와 같은 주요 표제들 간의 텍스트를 언급할 수 있다. 단계(430)는 문서의 나머지 부분에 대한 요지 및 대용 레터들을 결정한다. 단계(435)는 모든 열린 문서들에 대한 요지 및 대용 레터들을 결정한다. 단계(440)는 사용자에 의해 최근에 액세스된 모든 문서들에 대한 요지 및 대용 레터들을 결정한다. 예를 들어, 최근이라는 용어는 이전 N 시간 동안 열린 문서들을 언급할 수 있다. N의 값은 사용자에 의해 설정될 수 있다. 단계(445)는 사용자에 의해 가장 빈번하게 액세스되는 문서들에 대한 요지 및 대용 레터들을 결정한다. 예를 들어, "가장 빈번하게"라는 용어는 M 회수 보다 많이 액세스된 문서들을 언급할 수 있다. M의 값은 사용자에 의해 설정될 수 있다. 단계(450)는 모든 사용자들에 의해 최근에 액세스된 모든 문서들에 대한 요지 및 대용 레터들을 결정한다. 예를 들어, 철자법 검사기(93)는 인터넷을 통해 다른 사용자들에 의해 생성되거나 문서들의 몇몇 액세스 가능한 리포지터리에 기억된 문서들에 대해 액세스할 수 있다. 단계(455)는 다양한 사용자들에 의해 가장 빈번하게 액세스된 문서들에 대한 요지 및 대용 레터들을 결정한다. 단계(460)는 모든 유효 문서들에 대한 요지 및 대용 레터들을 결정한다. 상기 정보는 데이터베이스에 기억될 수 있다. 이러한 추가 정보는 다수의 방법들로 사용될 수 있다. 예를 들어, 스크린 상에서 가시적인 텍스트에 대한 문서 요지가 "flooods"(단계(420)에서 검사됨)이고 전체 문서 요지가 "Bible"(단계(430)에서 검사됨)이면, 리스트(220)에 제시된 관련 단어들은 floods와 관련된 정확한 철자의 단어들이Bible과 관련된 단어들 전에 나타날 수 있도록 순서가 정해진다.
일례들이 키보드 입력과 관련되어 기술되어져 왔지만, 본 명세서에서 제시된 방법들은 음성 입력 및 육필 인식을 갖는 시스템들에도 적용될 수 있음을 주지하자. 따라서, 시스템 및 방법은 또한 육필 및 음성 인식을 개선하기 위해 사용될 수 있다. 예를 들어, 사용자가 마이크로폰(51)에 "proof"라는 단어를 말하는 경우, 음성 인식 시스템(98)은 사용자가 말한 단어들이 "proof", "prude" 또는 "prune" 과 같은 몇몇 단어들 중 어떤 것인지를 확실히 알지 못할 수 있다. 그러나, 합성된 문서의 요지를 검출하거나(단계(310)) 또는 사용자 히스토리를 모니터함(단계(340))으로써, 사용자에게 보다 관련된 리스트 및 선택한 대체 단어들의 순서가 제시될 수 있다.
상기와 같이 스마트한 철자법 검사기(93)는 로컬 또는 원격 컴퓨터, 퍼스널 디지털 어시스턴트, 키오스크, 세트톱 박스, TV, 카메라 또는 다른 디바이스에 존재할 수 있다. 철자법 검사기는 사용자가 온-라인 형식들을 찾을 때 및 URL들을 타이프할 때 또는 웹 브라우저에서 용어들을 탐색할 때 텍스트를 입력하는 임의의 워드 프로세싱 상황에서 유용하다.
본 발명은 특히 양호한 형식들과 관련되어 기술되었지만, 첨부된 청구 범위에서 정의된 본 발명의 원리 및 범위 내에서 다양한 변경 및 수정이 이루어질 수 있음이 명백해질 것이다.
본 발명은 다음과 같은 효과를 가진다. 본 발명은 오기된 단어가 정확한 철자법을 찾기 원하는 사용자에 의해 선택되었을 때 유사한 철자의 단어들의 선택 가능한 리스트를 제공하는 방법을 제시한다. 본 발명의 한 실시예에서는, 개선된 철자법 검사기는 문서의 "요지" 또는 "주제"를 결정한다. 요지를 근거로, 철자법 검사기는 오기된 단어들에 대한 가능성 있는 대체 단어들을 제시한다. 본 발명의 다른 실시예에서는, 단어의 각각의 레터에 대해, 철자법 검사기는 키보드 키들 상의 "주변" 레터들을 검사해서 대체 단어들의 철자법 검사기의 리스트를 개선한다. 또한 시스템은 주변 또는 키(즉, 레터)에 대한 사용자의 사용 히스토리를 모니터하고 다른 단어들의 리스트들을 제시할 때 상기 정보를 고려한다. 사용자는 수동으로 상기 정보를 제공할 수 있다. 개선된 철자법 검사기는 또한 철자법 검사 정정에 대한 사용자 히스토리를 모니터함으로써 철자를 정정한다. 2명 이상의 사용자를 위한 정정 집합 표들이 철자법 검사기들에 의해 보존, 공유 및 제공될 수 있다. 철자법 검사를 개선시키는 상술된 방법들은 단독으로 사용될 수도 있고 일련의 검사들로서 순차적으로 실행될 수도 있는데, 상이한 방법들의 우선 순위는 다양하게 비중이 주어질 수 있다. 다양한 우선순위들은 하나의 방법이 다른 방법 보다 선호되도록 사용될 수도 있다. 우선 순위들은 사용자의 수동 입력에 의해 결정될 수도 있고 시스템 소프트웨어에 의해 자동으로 제공될 수도 있다.
또한 개선된 철자법 검사기는 사용자의 가장 빈번하거나 가장 최근의 오기 단어들을 나타내는 보조 창을 제공할 수 있다. 사용자는 다수의 오퍼레이팅 시스템들이 제공된 "클립보드"를 사용해서 현 문서에 대한 보조 창으로부터 해당 단어들을 복사하거나 붙이기하기 위해 마우스를 사용할 수 있다. 스크린 상에서 정확한 단어들을 찾는 것은 교육적인 가치가 있을 수 있는데, 이는 각각의 단어의 정확한 철자에 대한 사용자의 생각을 강화시킨다.
본 명세서에서 제시된 방법들은 키보드 입력 뿐만 아니라 음성 입력 및 육필 인식을 갖는 시스템들에도 적용될 수 있다. 따라서, 본 발명에 따른 시스템 및 방법은 또한 육필 및 음성 인식을 개선하기 위해 사용될 수 있다.

Claims (30)

  1. 워드 프로세싱 프로그램에 의해 처리되는 문서에 대한 철자법 검사 방법에 있어서,
    (a) 상기 문서에서 실제로 발생한 단어들을 포함하는 단어들의 그룹을 상기 문서의 요지(content)로부터 결정하는 단계;
    (b) 사용자에게 오기 단어를 보고하는 단계; 및
    (c) 상기 오기 단어와 유사한 철자들을 갖는 대체 단어들의 리스트를 사용자에게 제시하는 단계 -상기 리스트는 상기 단어들의 그룹으로부터 선택된 하나 이상의 단어들을 구비함-
    를 포함하는 것을 특징으로 하는 방법.
  2. 제1항에 있어서,
    상기 요지는 텍스트 및 상기 문서에 포함되는 임의의 제목, 주제, 표제 또는 요지들을 포함하는 것을 특징으로 하는 방법.
  3. 제2항에 있어서,
    단계(a)가 상기 문서 내의 위치 및 발생 회수를 근거로 상기 요지로부터 실제로 발생한 단어들의 상기 그룹을 유추하는 것을 특징으로 하는 방법.
  4. 제3항에 있어서,
    (e) 상기 실제로 발생한 단어들과 관련될 가능성이 있는 단어들을 결정하고 상기 단어들의 그룹에 상기 가능성 있는 관련 단어들을 포함시키는 단계를 더 포함하는 것을 특징으로 하는 방법.
  5. 제4항에 있어서,
    단계(e)가 잠재적인 의미론적 인덱싱(latent semantic indexing), 유사어 선택, 유의어 선택 그룹으로부터 선택된 하나 이상의 프로세스들을 사용하는 것을 특징으로 하는 방법.
  6. 제5항에 있어서,
    상기 선택된 단어들이 상기 대체 리스트에 먼저 나타나는 것을 특징으로 하는 방법.
  7. 제1항에 있어서,
    사용자의 오기 단어들의 다른 리스트를 사용자에게 제시하는 단계를 더 포함하는 것을 특징으로 하는 방법.
  8. 제7항에 있어서,
    상기 다른 리스트가 사용자가 가장 빈번하게 오기하거나 가장 최근에 오기된단어들을 포함하는 것을 특징으로 하는 방법.
  9. 워드 프로세싱 프로그램에 의해 처리되는 문서에 대한 철자법 검사 방법에 있어서,
    (a) 사용자에게 오기 단어를 보고하는 단계;
    (b) 오기 단어에 포함된 레터에 대한 대용 레터를 각각 포함하는 하나 이상의 단어들의 그룹을 결정하는 단계 -대용 레터의 키보드 키는 상기 오기 단어에 포함된 레터의 주변 키보드 키임- ;
    (c) 상기 오기 단어와 유사한 철자들을 갖는 대체 단어들의 리스트를 사용자에게 제시하는 단계 -상기 리스트는 상기 단어들의 그룹으로부터 선택된 하나 이상의 단어들을 구비함-
    를 포함하는 것을 특징으로 하는 방법.
  10. 제9항에 있어서,
    단계(b)가 각각의 대용 레터들의 키보드 키들과 오기 단어에 포함된 레터들의 각각의 키보드 키들 간의 거리를 근거로 상기 단어들의 그룹에 포함될 단어들을 결정하는 것을 특징으로 하는 방법.
  11. 제10항에 있어서,
    상기 대체 리스트의 상기 선택 단어들의 제1 단어 및 제2 단어의 순서는 보다 작은 상기 제1 및 제2 선택 단어들의 거리에 의해 결정되는 것을 특징으로 하는 방법.
  12. 제10항에 있어서,
    상기 선택 단어들은 사용자의 과거 대용 레터들의 히스토리를 근거로 선택되는 것을 특징으로 하는 방법.
  13. 제12항에 있어서,
    상기 히스토리가 사용자의 레터 교환들(swaps)을 포함하고, 대체 리스트가 상기 히스토리의 레터 교환들을 근거로 대체 단어들을 포함하는 것을 특징으로 하는 방법.
  14. 제13항에 있어서,
    (d) 레터 교환들을 포함하는 사용자의 오기들(mistypes)을 모니터하고 상기 히스토리에 상기 오기들을 통합시키는 단계를 더 포함하고, 상기 히스토리는 사용자에 의해 제공된 대용 레터들 및 레터 교환들을 포함하는 단어들을 구비한 것을 특징으로 하는 방법.
  15. 제9항에 있어서,
    사용자의 오기 단어들의 다른 리스트를 사용자에게 제시하는 단계를 더 포함하는 것을 특징으로 하는 방법.
  16. 제15항에 있어서,
    상기 다른 리스트가 사용자가 가장 빈번하게 오기하거나 가장 최근에 오기된 단어들을 포함하는 것을 특징으로 하는 방법.
  17. 워드 프로세싱 프로그램에 의해 처리되는 문서에 대한 철자법 검사 방법에 있어서,
    (a) 사용자에게 오기 단어를 보고하는 단계;
    (b) 오기 단어에 포함된 레터에 대한 대용 레터를 각각 포함하는 하나 이상의 단어들의 제1 그룹을 결정하는 단 -대용 레터의 키보드 키는 상기 오기 단어에 포함된 레터의 주변 키보드 키임-;
    (c) 상기 문서에서 실제로 발생한 단어들을 포함하는 하나 이상의 단어들의 제2 그룹을 상기 문서의 요지로부터 결정하는 단계; 및
    (d) 상기 오기 단어와 유사한 철자들을 갖는 대체 단어들의 리스트를 사용자에게 제시하는 단계 -상기 리스트는 단어들의 상기 제1 그룹 및 제2 그룹 중 하나 또는 모두로부터 선택된 하나 이상의 단어들을 구비함-
    를 포함하는 것을 특징으로 하는 방법.
  18. 제17항에 있어서,
    대체 단어들의 상기 리스트는 제2 그룹의 임의의 선택 단어들 전에 제1 그룹의 상기 선택 단어들이 나타나도록 순서가 정해지는 것을 특징으로 하는 방법.
  19. 제18항에 있어서,
    단계(b) 및 단계(c)가 오기 단어와 유사하며 오기 단어가 발생하는 문서의 동일한 영역에서 발생하는 임의의 단어들에게 공간적인 우선권(spatial preference)을 줌으로써 상기 제1 및 제2 그룹들을 결정하는 것을 특징으로 하는 방법.
  20. 제19항에 있어서,
    우선권 순서의 상기 영역은 문장이고 다음이 절(paragraph)인 것을 특징으로 하는 방법.
  21. 제20항에 있어서,
    우선권 순서의 상기 영역이 디스플레이 스크린 상에서 사용자에게 가시적인 문서 부분을 절 뒤에 더 포함하는 것을 특징으로 하는 방법.
  22. 제21항에 있어서,
    우선권 순서의 상기 영역이 장 또는 섹션을 더 포함하고 그 후에 전체 문서를 더 포함하는 것을 특징으로 하는 방법.
  23. 제19항에 있어서,
    단계(b) 및 단계(c)가 현재 열려 있거나, 상기 문서의 선정된 열린 시간 내에 열렸거나, 사용자에 의해 가장 최근에 열렸거나, 다른 사용자들에 의해 열린 추가 문서들에게도 공간적인 우선권을 더 제공하는 것을 특징으로 하는 방법.
  24. 워드 프로세싱 프로그램에 의해 처리되는 문서에 대한 철자법 검사 방법에 있어서,
    (a) 사용자에게 오기 단어를 보고하는 단계;
    (b) 상기 오기 단어와 유사한 철자들을 갖는 대체 단어들의 리스트를 사용자에게 제시하는 단계; 및
    (c) 사용자가 가장 빈번하게 오기하거나 또는 가장 최근에 오기된 단어들을 포함하는 대체 단어들의 다른 리스트를 사용자에게 제시하는 단계
    를 포함하는 것을 특징으로 하는 방법.
  25. 제24항에 있어서,
    사용자가 과거에 오기한 단어들의 레터들을 정정한 상기 리스트 또는 상기 다른 리스트의 대체 단어의 레터 또는 레터들을 하이라이트하는 단계를 더 포함하는 것을 특징으로 하는 방법.
  26. 제25항에 있어서,
    상기 하이라이팅은 전자 채색(colorization)인 것을 특징으로 하는 방법.
  27. (a) 문서에서 실제로 발생한 단어들을 포함하는 단어들의 그룹을 상기 문서의 요지(content)로부터 결정하는 단계;
    (b) 사용자에게 오기 단어를 보고하는 단계; 및
    (c) 상기 오기 단어와 유사한 철자들을 갖는 대체 단어들의 리스트를 사용자에게 제시하는 단계-상기 리스트는 상기 단어들의 그룹으로부터 선택된 하나 이상의 단어들을 구비함-
    를 포함하는 철자법 검사 방법을 실행하기 위한 컴퓨터 실행 가능한 명령을 구비한 컴퓨터 판독 매체.
  28. (a) 사용자에게 오기 단어를 보고하는 단계;
    (b) 오기 단어에 포함된 레터에 대한 대용 레터를 각각 포함하는 하나 이상의 단어들의 그룹을 결정하는 단계 -대용 레터의 키보드 키는 상기 오기 단어에 포함된 레터의 주변 키보드 키임-;
    (c) 상기 오기 단어와 유사한 철자들을 갖는 대체 단어들의 리스트를 사용자에게 제시하는 단계- 상기 리스트는 상기 단어들의 그룹으로부터 선택된 하나 이상의 단어들을 포함함-
    를 포함하는 철자법 검사 방법을 실행하기 위한 컴퓨터 실행 가능한 명령을구비한 컴퓨터 판독 매체.
  29. (a) 사용자에게 오기 단어를 보고하는 단계;
    (b) 오기 단어에 포함된 레터에 대한 대용 레터를 각각 포함하는 하나 이상의 단어들의 제1 그룹을 결정하는 단계 -대용 레터의 키보드 키는 상기 오기 단어에 포함된 레터의 주변 키보드 키임-;
    (c) 상기 문서에서 실제로 발생한 단어들을 포함하는 하나 이상의 단어들의 제2 그룹을 상기 문서의 요지로부터 결정하는 단계; 및
    (d) 상기 오기 단어와 유사한 철자들을 갖는 대체 단어들의 리스트를 사용자에게 제시하는 단계 -상기 리스트는 단어들의 상기 제1 그룹 및 제2 그룹 중 하나 또는 모두로부터 선택된 하나 이상의 단어들을 포함함-
    를 포함하는 철자법 검사 방법을 실행하기 위한 컴퓨터 실행 가능한 명령을 구비한 컴퓨터 판독 매체.
  30. (a) 사용자에게 오기 단어를 보고하는 단계;
    (b) 상기 오기 단어와 유사한 철자들을 갖는 대체 단어들의 리스트를 사용자에게 제시하는 단계; 및
    (c) 사용자가 가장 빈번하게 오기하거나 또는 가장 최근에 오기된 단어들을 포함하는 대체 단어들의 다른 리스트를 사용자에게 제시하는 단계
    를 포함하는 철자법 검사 방법을 실행하기 위한 컴퓨터 실행 가능한 명령을구비한 컴퓨터 판독 매체.
KR10-2001-0036530A 2000-07-07 2001-06-26 개선된 철자법 검사를 위한 시스템 및 방법 KR100455329B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US61200600A 2000-07-07 2000-07-07
US09/612,006 2000-07-07

Publications (2)

Publication Number Publication Date
KR20020005427A true KR20020005427A (ko) 2002-01-17
KR100455329B1 KR100455329B1 (ko) 2004-11-09

Family

ID=24451327

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2001-0036530A KR100455329B1 (ko) 2000-07-07 2001-06-26 개선된 철자법 검사를 위한 시스템 및 방법

Country Status (3)

Country Link
US (1) US7647554B2 (ko)
KR (1) KR100455329B1 (ko)
DE (1) DE10124429B4 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR200449305Y1 (ko) * 2007-12-17 2010-06-30 한국 고덴시 주식회사 광소자 패키지 및 그 실장구조

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7194684B1 (en) 2002-04-09 2007-03-20 Google Inc. Method of spell-checking search queries
US8667547B2 (en) * 2002-07-31 2014-03-04 Comverse, Ltd. Method and system for editing text messages conveyed via a CATV infrastructure at a TV set-top box
US7315811B2 (en) * 2003-12-31 2008-01-01 Dictaphone Corporation System and method for accented modification of a language model
US7912904B2 (en) 2004-03-31 2011-03-22 Google Inc. Email system with conversation-centric user interface
US7814155B2 (en) 2004-03-31 2010-10-12 Google Inc. Email conversation management system
US9819624B2 (en) * 2004-03-31 2017-11-14 Google Inc. Displaying conversations in a conversation-based email system
US8775931B2 (en) * 2007-03-30 2014-07-08 Blackberry Limited Spell check function that applies a preference to a spell check algorithm based upon extensive user selection of spell check results generated by the algorithm, and associated handheld electronic device
US20080266261A1 (en) * 2007-04-25 2008-10-30 Idzik Jacek S Keystroke Error Correction Method
DE602007003807D1 (de) * 2007-04-25 2010-01-28 Research In Motion Ltd Tippfehlerkorrekturverfahren
WO2009016631A2 (en) 2007-08-01 2009-02-05 Ginger Software, Inc. Automatic context sensitive language correction and enhancement using an internet corpus
US8176419B2 (en) * 2007-12-19 2012-05-08 Microsoft Corporation Self learning contextual spell corrector
US20090254818A1 (en) * 2008-04-03 2009-10-08 International Business Machines Corporation Method, system and user interface for providing inline spelling assistance
US8219905B2 (en) * 2008-11-17 2012-07-10 International Business Machines Corporation Automatically detecting keyboard layout in order to improve the quality of spelling suggestions
JP5077210B2 (ja) * 2008-12-04 2012-11-21 富士通モバイルコミュニケーションズ株式会社 携帯型情報処理装置
US8739055B2 (en) * 2009-05-07 2014-05-27 Microsoft Corporation Correction of typographical errors on touch displays
CA2787390A1 (en) 2010-02-01 2011-08-04 Ginger Software, Inc. Automatic context sensitive language correction using an internet corpus particularly for small keyboard devices
US8266528B1 (en) * 2010-06-24 2012-09-11 Google Inc. Spelling suggestions based on an input sequence including accidental “delete”
US8988365B2 (en) * 2010-09-01 2015-03-24 Telefonaktiebolaget L M Ericsson (Publ) Input precision method for minimizing erroneous entries stemming from instability of a mobile device using an accelerometer and apparatus to detect a shake and apparatus and computer program thereof
US9489372B2 (en) * 2013-03-15 2016-11-08 Apple Inc. Web-based spell checker
EP3062212A1 (en) * 2015-02-25 2016-08-31 Kyocera Document Solutions Inc. Text editing apparatus and print data storage apparatus
US11093709B2 (en) 2017-08-10 2021-08-17 International Business Machine Corporation Confidence models based on error-to-correction mapping

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4847766A (en) 1988-01-05 1989-07-11 Smith Corona Corporation Dictionary typewriter with correction of commonly confused words
DE4323241A1 (de) * 1993-07-12 1995-02-02 Ibm Verfahren und Computersystem zur Suche fehlerhafter Zeichenketten in einem Text
JPH0793328A (ja) 1993-09-24 1995-04-07 Matsushita Electric Ind Co Ltd 綴り不適切訂正装置
US5649222A (en) 1995-05-08 1997-07-15 Microsoft Corporation Method for background spell checking a word processing document
US5875443A (en) 1996-01-30 1999-02-23 Sun Microsystems, Inc. Internet-based spelling checker dictionary system with automatic updating
US5991742A (en) 1996-05-20 1999-11-23 Tran; Bao Q. Time and expense logging system
US6047300A (en) * 1997-05-15 2000-04-04 Microsoft Corporation System and method for automatically correcting a misspelled word
US6018735A (en) 1997-08-22 2000-01-25 Canon Kabushiki Kaisha Non-literal textual search using fuzzy finite-state linear non-deterministic automata
US6424983B1 (en) 1998-05-26 2002-07-23 Global Information Research And Technologies, Llc Spelling and grammar checking system
US6131102A (en) 1998-06-15 2000-10-10 Microsoft Corporation Method and system for cost computation of spelling suggestions and automatic replacement
US6507816B2 (en) 1999-05-04 2003-01-14 International Business Machines Corporation Method and apparatus for evaluating the accuracy of a speech recognition system
US6918086B2 (en) 2000-03-28 2005-07-12 Ariel S. Rogson Method and apparatus for updating database of automatic spelling corrections
AU2001253403A1 (en) 2000-04-14 2001-10-30 Justaddsales. Com, Inc. Computer-based interpretation and location system
US20020103834A1 (en) 2000-06-27 2002-08-01 Thompson James C. Method and apparatus for analyzing documents in electronic form
US6578032B1 (en) 2000-06-28 2003-06-10 Microsoft Corporation Method and system for performing phrase/word clustering and cluster merging

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR200449305Y1 (ko) * 2007-12-17 2010-06-30 한국 고덴시 주식회사 광소자 패키지 및 그 실장구조

Also Published As

Publication number Publication date
DE10124429B4 (de) 2008-11-27
US20060224586A1 (en) 2006-10-05
DE10124429A1 (de) 2002-01-17
US7647554B2 (en) 2010-01-12
KR100455329B1 (ko) 2004-11-09

Similar Documents

Publication Publication Date Title
US7647554B2 (en) System and method for improved spell checking
US7840589B1 (en) Systems and methods for using lexically-related query elements within a dynamic object for semantic search refinement and navigation
US7243305B2 (en) Spelling and grammar checking system
US7043690B1 (en) Method, system, and program for checking contact information
US7574348B2 (en) Processing collocation mistakes in documents
US7689617B2 (en) Dynamic learning for navigation systems
US6785869B1 (en) Method and apparatus for providing a central dictionary and glossary server
US6571240B1 (en) Information processing for searching categorizing information in a document based on a categorization hierarchy and extracted phrases
KR100806936B1 (ko) 자동완성 추천어를 정정하여 노출하는 자동완성 추천어제공 방법 및 시스템
US20060129541A1 (en) Dynamically updated quick searches and strategies
TWI242728B (en) Method and recording medium for indicating an interpreted meaning of a text or image portion of a document, and for disambiguating the multiple interpreted meanings thereof
US20060122997A1 (en) System and method for text searching using weighted keywords
JP2003223437A (ja) 正解語の候補の表示方法、スペルチェック方法、コンピュータ装置、プログラム
EP2102761A1 (en) Web-based collocation error proofing
US20020198859A1 (en) Method and system for providing web links
US8001138B2 (en) Word relationship driven search
JP3548955B2 (ja) 問題解決データベース検索システム及び問題解決データベース検索プログラムを記録したコンピュータ読み取り可能な記憶媒体
JP2003050538A (ja) データ処理装置、データ処理方法およびそのプログラム
Northrop The fate of indexes in an online world
Jazayeri Google as a bookmarking tool
Rettie Exploiting freely available software for social research
Bhide Enhancements for the Search Functionality of an Open Source Email Client
Miller Ryan Jazayeri
Jones Beyond English text: Multilingual and multimedia information retrieval
Shop RESPONSA

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20111012

Year of fee payment: 8

LAPS Lapse due to unpaid annual fee