TWI421708B - 增進打字或按鍵輸入效率的候選字產生方法 - Google Patents
增進打字或按鍵輸入效率的候選字產生方法 Download PDFInfo
- Publication number
- TWI421708B TWI421708B TW096107529A TW96107529A TWI421708B TW I421708 B TWI421708 B TW I421708B TW 096107529 A TW096107529 A TW 096107529A TW 96107529 A TW96107529 A TW 96107529A TW I421708 B TWI421708 B TW I421708B
- Authority
- TW
- Taiwan
- Prior art keywords
- word
- candidate
- typewriter
- input
- words
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/232—Orthographic correction, e.g. spell checking or vowelisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/274—Converting codes to words; Guess-ahead of partial word inputs
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Character Discrimination (AREA)
Description
本發明係相關於候選字產生方法,尤指一種用來增進打字或按鍵輸入效率的候選字產生方法。
當使用電腦或手持電子產品進行打字作業時,對於以使用字元(或字母)為單位的語言來說(簡稱為字元語言),該打字作業並非十分困難,此係因此類語言所使用的字元種類相當有限。此類以字元為單位的語言對於一般所使用的鍵盤而言也相當的容易應用,因為鍵盤上所需要對應的字元按鍵數量也相對的比較少。然而,在正式進行字元語言之打字作業的時候,不正確的拼字、錯誤的字元輸入、打字者不知道單字拼法、加有標記的字元輸入(例如帶有重音的字元)等狀況常會導致打字或按鍵輸入效率的降低,而打字者也必須要再耗費額外的時間或中斷思緒以修正上述之錯誤。打字者不知道單字拼法會使得打字者被迫另外耗費時間去查字典或是猜測單字正確的拼法。當打字者輸入帶有標記的字母或字元時,通常都會需要使用特製的鍵盤、記下特別的按鍵排列、或是學習額外的輸入方式來輸入這些字元,同時也造成了打字者在打字速率上的延遲。
本發明係提供一種增進打字或按鍵輸入效率的候選字產生方法。該方法包含提供一字典、實施一自動選擇候選字方法、及以該至少一候選字替換該已選取的字。該自動選擇候選字方法包含由該字典中產生至少一候選字,以根據事先建立之統計數據,改寫打字者輸入之一句子中之一已選取的字,使該已選取的字符合該句子的統計語義性質。
本發明係提供一種增進打字或按鍵輸入效率的候選字產生方法。該方法包含提供以語音學為基礎之一語音字典;將一輸入字分解為複數個語音音節序列,其中該複數個語音音節序列之每一語音音節序列係包含複數個語音音節;根據該語音字典包含之音節差異度矩陣,產生複數個候選字,其中該複數個候選字係對於該複數個語音音節序列之每一語音音節序列包含至少一個候選字,且該複數個語音音節序列係一一對應於該複數個音節差異度矩陣;及由該複數個候選字中選出一個候選字,並將該輸入字替換為該選出之候選字,其中將該輸入字替換為該選出之候選字所耗費之總額替換成本係為該複數個候選字個別耗費之複數個總額替換成本中的最小總額替換成本,且該最小總額替換成本大於零。
本發明係提供一種增進打字或按鍵輸入效率的候選字產生方法。該方法包含提供一字典;確認是否有至少一個候選字存在,其中該字典之一輸入字為該至少一個候選字之子序列,且該輸入字之特徵可於該至少一個候選字之每一候選字中被發現;及當該至少一個候選字存在時,將該輸入字替換為該至少一個輸入字。
本發明係提供一種用來增進打字或按鍵輸入效率的候選字產生方法。該方法包含儲存一單字序列;及根據一首字母縮略字子序列,由該單字序列中取出一單字子序列,其中該首字母縮略字子序列係包含一第一字的開頭字元以及一第二字的開頭字元,該第二字在該單字序列中的順序係為在該第一字之後,且該第一字的開頭字元與該第二字的開頭字元在該首字母縮略字子序列中的順序係對應於該第一字與該第二字在該單字序列中的順序。該單字子序列包含該第一字、該第二字、以及在該單字序列中位於該第一字與該第二字之間的複數個字,且該第一字、該第二字、以及在該單字序列中位於該第一字與該第二字之間之該複數個字在該單字子序列中的順序係對應於在該單字序列中的順序。
本發明係提供一種用來增進打字或按鍵輸入效率之候選字產生方法。該方法包含提供一字典;根據一輸入字中帶有標記之字元的合理組合,產生至少一個候選字;及由該至少一個候選字中選取一候選字。該字典中係儲存有複數個帶有標記之字元的合理組合,及對應於該複數個合理組合之單字。
為了讓打字者可以減輕上述會延遲打字或按鍵輸入效率的缺點所造成的影響,本發明係提供複數種候選字產生方法,以增進打字或按鍵輸入效率,並克服上述之缺點。
本發明所提供之第一種候選字產生方法係用來幫助打字者免於不正確拼字拖慢打字或按鍵輸入效率的困擾,上述不正確拼字的錯誤包含字元插入錯誤、字元刪除錯誤、字元替換錯誤、以及字元排列錯誤。字元插入錯誤係為打字者在輸入單字時輸入了多餘的字元所造成的錯誤。字元刪除錯誤係為打字者在輸入單字時漏掉不該遺漏的字元所造成的錯誤。字元替換錯誤係為打字者在輸入單字時將部分原始字元輸入為其他的字元所造成的錯誤,或是字元大小寫輸入錯誤的狀況。字元排列錯誤係指打字者輸入單字時將字元的前後順序輸入錯誤的狀況。不管打字者輸入單字時發生上述的哪一種錯誤,只要打字者在輸入單一單字時發生的錯誤次數遠少於該單字的字元個數,被錯誤輸入的單字將會保有足夠的資訊以供還原至正確的單字。舉例來說,當打字者將應該輸入為”phenomenon”的單字錯誤輸入為”phenomanon”時,由於打字者僅將原本應該輸入的第七個字元”e”輸入為”a”,且其他字元皆輸入正確,因此所產生的輸入錯誤係為字元替換錯誤,且錯誤輸入的單字”phenomanon”仍然保有了足夠的資訊(亦即上述唯一發生的字元替換錯誤)以供還原至”phenomenon”。
根據上述之概念,本發明所提供之第一種候選字產生方法係圖示於第1圖。請參閱第1圖,其為本發明所提供之第一種候選字產生方法的流程圖,且該第一種候選字產生方法係用來幫助打字者免於錯誤輸入字元的困擾。第1圖所示之方法係包含如下步驟:步驟102:提供一字典。
步驟104:以大量句子的語料統計字與字之間的相關數據來測試並訓練該字典,其中該大量的句子係包含複數個相關字,以用來建立與該大量的句子之語義性質相關的預先統計數據。
步驟106:實施一種自動選取方法,用來由該字典中產生至少一個候選字,以根據該預先統計數據,將打字者所輸入之句子調整至符合語意性質為止。
步驟108:計算打字者所輸入的一句子中之一選取字與該字典所產生之每一候選字的編輯距離,其中該編輯距離係代表最少需要幾個字元的插入、刪除、對調以便將其中一字轉換成另一字。
步驟110:檢查所有計算出來的編輯距離是否皆大於零。當所有計算出來的編輯距離皆大於零時,執行步驟112;否則,執行步驟114。
步驟112:由該至少一個候選字中選取一個擁有最小編輯距離的候選字,並將打字者所輸入的該句子中之該選取字替換為該擁有最小編輯距離的候選字。
步驟114:將打字者所輸入的該句子中之該選取字替換為一編輯距離為零的候選字。
步驟102與104係代表一個準備並建立一字典的程序,以將該字典供第1圖所示之後續步驟所使用,且第1圖所示之後續步驟需要該字典的存在才能夠執行。該字典可為一系統字典、一領域字典、或一使用者字典,其中該領域字典係指不同學術或生活領域所使用之字典。在某些情況下,該字典係根據打字者目前正在輸入的文章或片段來建立,以符合打字者的打字習慣。在步驟102與104中所建立之該字典必須被事先測試或訓練以辨識足夠大量的句子語料或是獲取與該足夠大量的句子之語義性質相關之統計數據。該統計數據可為特定段落或打字者所輸入之段落中單字出現的頻率,或是不同單字之間所產生之各種不同組合出現的機率。
在步驟106至114中,係實施一種自動選取方法以用來決定一個符合機率最高的候選字,並將打字者所輸入之單字替換為該機率最高的候選字,以符合打字者目前輸入之一句子之語義性質,其中該句子係包含打字者所輸入之該單字,且該單字可能產生了上述之至少一種字元拼字錯誤。每一個與打字者輸入之該單字相關並由該字典產生出來的候選字係根據一編輯距離來決定,其中該編輯距離係代表將打字者輸入之該單字轉換為一候選字所需要耗費的步驟與代價,且所需要耗費的步驟可為插入、刪除、或替換打字者輸入之該單字中之字元。舉例來說,當需要將打字者輸入之單字”phenomanon”轉換為一候選字”phenomenon”時,必須將單字”phenomanon”中的第七個字元”a”替換為字元”e”因此打字者輸入之單字”phenomanon”與候選字”phenomenon”之間的編輯距離可定義為1,因為將打字者輸入之單字”phenomanon”轉換為候選字”phenomenon”僅需要進行一次替換單一字元的步驟。同理,當需要將打字者輸入之單字”phnocmanon”轉換為候選字”phenomenon”時,需要將字元”e”插入至字元”h”與字元”n”之間、刪除字元”o”與字元”m”之間的字元”c”、以及將字元”m”與字元”n”之間的字元”a”替換為字元”e”,因此僅進行了三個針對單一字元的步驟,且打字者輸入之單字”phnocmanon”與候選字”phenomenon”之間的編輯距離可定義為3。請注意,上述對於編輯距離的定義僅為本發明之一較佳實施例,且當將其他種類對於編輯距離的定義應用於本發明所揭露之方法時,仍應屬於本發明之範疇。
當所有候選字與打字者輸入之單字間的編輯距離皆大於零時,代表打字者所輸入之該單字係為一個錯誤拼字的單字,因此可根據步驟106至114中所述之方法,將打字者輸入之該單字自動替換為一個與打字者輸入之該單字之間的編輯距離最小的候選字。然而,也有可能發生打字者輸入之該單字與二個以上的候選字之間的編輯距離相同,且該編輯距離係為最小編輯距離的狀況。為了避免這個狀況,在此時亦可藉由上述針對句子之語義性質所建立之統計數據、以及相關之編輯距離,來輔助判斷打字者目前輸入之段落中出現機率較高的某些候選字。藉由上述以句子之語義性質來輔助判斷較為可能出現的候選字,可以將大部分不符合打字者目前輸入之段落的語義性質之候選字過濾掉,以大幅度的縮小候選字的可能範圍,並藉由這種方式節省判斷可能之候選字的額外時間、以及增進打字者之打字或按鍵輸入效率。總合以上所述,本發明所提供之第一種候選字產生方法係可有效減輕打字者因為錯誤拼字造成的打字或按鍵輸入效率降低之狀況。
再者,在步驟104中,可使用一種稱為N-gram模型(N-gram Model)的方法,並以N個字連續出現的頻率來統計字與字間的相關數據。N-gram模型係為熟習本發明所屬之領域者所週知的方法,且可用於上述本發明所提供之第一種候選字產生方法,以協助打字者免於拼字錯誤降低打字速率的問題。N-gram模型係根據語義規則來運作,並可應用於一種稱為context-free的語義文法、或是應用於以語言學為基礎的模組比對系統,其中context-free語義文法亦為熟習本發明所屬之領域者所週知,故不在此贅述。
一使用者介面亦可用來實施本發明所提供之第一種候選字產生方法,以幫助打字者免於拼字錯誤降低打字或按鍵輸入效率的困擾。在該使用者介面上,與打字者輸入之單一單字相關之複數個可能的候選字會被表列出來,或是在編譯打字者輸入之文章時產生出來,其中編譯打字者輸入之文章係指一相關字典將打字者最近輸入之片段列入參考並解析的步驟。該使用者介面亦可被設計成具有回報並記錄任何打字者發生之拼字錯誤的功能。因此,打字者被記錄下來的拼字錯誤亦可與編輯距離及語義性質一起用來當作判斷候選字之可能範圍的參考,以輔助縮小候選字之可能範圍。上述被記錄下來的拼字錯誤包含了字元插入錯誤、字元刪除錯誤、字元替換錯誤、甚或是字元排列錯誤,且這些被記錄下來的拼字錯誤亦可與打字者發生這些被記錄下來之拼字錯誤的句子或片段一起被記錄下來,以作為之後打字者輸入文章時用來當做參考的統計數據。
除此以外,用來實施該第一種候選字產生方法的使用者介面之一較佳實施例中,亦可加入一錯誤預測(error prediction)機制。由於打字者在打字發生錯誤的時候,需要將游標由正在輸入之字元處以人工方式移動至輸入錯誤的字元處來進行修改,然後再將該游標移動回方才輸入之字元處,因此會對一般之打字者在打字效率上產生相當大的扼殺。在該錯誤預測機制之實施例中,打字者即使在游標仍然位於正在輸入之字元處的狀況下,仍然可以藉由啟動預先設定之熱鍵來啟動該錯誤預測機制。在打字者按下該熱鍵後,該使用者介面係根據本發明所提供之該第一種候選字產生方法,自動的顯示出打字者之前所輸入過的文章中可能出現之至少一個錯誤字,並提供相關之候選字供打字者選擇,以修正該至少一個錯誤字。在本發明相關於該使用者介面之一較佳實施例中,打字者係可設定該熱鍵為方向鍵中的向下鍵,且當啟動一次該熱鍵時,該使用者介面係只顯示一個離目前之游標移動距離最近的錯誤字以供打字者修改;而當再出現第二個以上之錯誤字時,打字者僅需要重複按下該熱鍵以啟動該錯誤預測機制,便可以逐次修改以及個別對應提供候選字的方式,來更正到打字者想要修改的至少一個錯誤字。
本發明另提供一第二種候選字產生方法,使得打字者可藉由輸入應用了語音學簡化拼法之單字來增進打字或按鍵輸入效率。本發明所提供之第二種候選字產生方法的基本概念係詳述如後:對於使用字元的語言來說,當打字者並不記得如何拼某個單字之字母排列或字元排列,而只記得該單字之大略拼音時,打字者可以試圖以猜測該單字之拼音的方式來搜尋該單字。因此,在本發明所提供之第二種候選字產生方法中,必須要事先提供一個以語音學為基礎的語音字字典,其中該語音字字典係儲存了大量的語音音節。舉例來說,當打字者不知道單字”bureaucracy”的英文拼字方式時,可以藉由他所知道單字”bureaucracy”之大略拼音,輸入上述應用了語音學簡化拼法的單字以在該語音字字典中找尋單字”bureaucracy”;其中應用了語音學簡化拼法之該單字,亦可稱為一語音字(phonetic word),係根據打字者對於單字”bureaucracy”的拼音記憶來模擬單字”bureaucracy”的正確拼音,舉例來說,該單字可為”burocrecy”或”burockrecy”。
在收到一個語音字時,會先根據該語音字的所有可能發音方式對該語音字做解碼或猜測的動作,並將該語音字以上述之所有可能發音方式分解為複數個語音音節,因此會產生出複數個對應之語音音節序列。每一個產生出之語音音節序列係包含複數個語音音節,並對應於該語音字之一特定可能發音方式。
請參閱第2圖,其為本發明所提供之第二種候選字產生方法的流程圖,其中該第二種候選字產生方法係用來使打字者藉由輸入應用了語音學簡化拼法之語音字來增進打字或按鍵輸入效率。本發明所提供之第二種候選字產生方法係包含下列步驟:步驟202:提供一語音字字典。
步驟204:儲存複數個語音音節於該語音字字典中。
步驟206:計算該複數個語音音節之任二語音音節之間的差異度。
步驟208:將打字者輸入之一語音字分解為複數個語音音節序列,其中該複數個語音音節序列之每一語音音節序列係包含複數個語音音節。
步驟210:根據該語音字字典中之音節差異度矩陣,產生複數個候選字,其中該複數個語音音節序列之每一語音音節序列係對應於該複數個候選字中至少一個候選字。
步驟212:由該複數個產生之候選字中選出一個候選字,並將打字者輸入之該語音字替換為選出之該候選字,其中將打字者輸入之該語音字替換為選出之該候選字所耗費之總額替換成本係為所有候選字中之最小,且該總額替換成本係大於零。
步驟202至206係與前述之步驟102至104相似,需要事先準備一個語音字字典以輔助第2圖中後續步驟之執行。除了在該語音字字典中事先儲存之複數個語音音節以外,也必須在該語音字字典中事先計算並儲存該複數個語音音節之任二語音音節之間的差異度,其中該音節差異度係以二語音音節之間之一音節差異距離的方式來具體表示。當一第一語音音節與一第二語音音節之間的音節差異距離較小時,代表將該第一語音音節替換為該第二語音音節所耗費之替換成本也會較小,且當該第一語音音節與該第二語音音節之間的音節差異距離較大時,代表將該第一語音音節替換為該第二語音音節所耗費之替換成本也會較大,其中將該第一語音音節替換為該第二語音音節的步驟包含插入、刪除、替換、以及排列該第一語音音節中至少一個字元。在本發明所提供之第二種候選字產生方法中,一第一語音音節序列與一第二語音音節序列的音節差異度係藉由一音節差異度矩陣來加以定義。在該音節差異度矩陣之一實施例中,該音節差異度矩陣之橫列係用來列出該第一語音音節序列所包含之複數個語音音節,同理,該音節差異度矩陣之直行係用來列出該第二語音音節序列所包含之複數個語音音節。
請參閱第3圖,其為使用於第2圖所述之候選字產生方法之一音節差異度矩陣的示意圖。假設一音節差異度矩陣A係用來表示一第一語音音節序列PSr o w
與一第二語音音節序列PSc o l u m n
之間的總額替換成本,其中第一語音音節序列PSr o w
係可表示為PSr o w
=(PSR0
,PSR1
,PSR2
,...,PSRM - 1
),第二語音音節序列PSc o l u m n
係可表示為PSc o l u m n
=(PSC0
,PSC1
,PSC2
,...,PSCN - 1
);且PSRi
(i之值係為0,1,2,...,M-1)係代表第一語音音節序列PSr o w
中之第i個語音音節,PSCj
(j之值係為0,1,2,...,N-1)係代表第二語音音節序列PSc o l u m n
中之第j個語音音節。再者,M係為第一語音音節序列PSr o w
之長度,也就是元素個數;同理,N係為第二語音音節序列PSc o l u m n
之長度。如第3圖所示,音節差異度矩陣A中之一元素Ai , j
係代表一語音音節PSRi
與另一語音音節PSCj
之間的音節差異度,且在本發明之一較佳實施例中,元素Ai , j
之值係介於0至1之間。為了計算第一語音音節序列PSr o w
與第二語音音節序列PSc o l u m n
之間的總額替換成本,可使用複數種方法並配合音節差異度矩陣A來加以計算。在本發明之一較佳實施例中,音節差異度矩陣A之每一列或每一行中值最小的元素Ai , j
會被加總起來,並將加總起來之值當作音節差異度矩陣A所代表之總額替換成本;或是將音節差異度矩陣A之中每一列加總起來之最小元素值與每一行加總起來之最小元素值互相比較,以其中較小之元素加總值來當作音節差異度矩陣A所代表之總額替換成本。最後,比較複數個音節差異度矩陣A各自代表的總額替換成本,以找出其總額替換成本最小的單一音節差異度矩陣A。第一語音音節序列PSr o w
與第二語音音節序列PSc o l u m n
之長度差不可以太大,也就是必須要滿足| |PSr o w
|-|PSc o l u m n
| |<d之條件,其中d係代表一相差值,|PSr o w
|係代表第一語音音節序列PSr o w
之長度,|PSc o l u m n
|係代表第二語音音節序列PSc o l u m n
之長度,| |PSr o w
|-|PSc o l u m n
| |即代表第一語音音節序列PSr o w
與第二語音音節序列PSc o l u m n
之長度差的絕對值,且相差值d之值係為可容忍並經過審慎挑選的。在本發明之另一實施例中,亦可直接計算音節差異度矩陣A之行列式值來代表音節差異度矩陣A之總額替換成本。
因此,在儲存於該語音字字典之所有語音音節的任二語音音節間的音節差異距離,可以被事先計算並同樣的儲存於該語音字字典中。在步驟208至212中,本發明所提供之第二種候選字產生方法係用來決定一出現可能性最高的候選字,並將打字者輸入之語音字替換為出現可能性最高之該候選字,以使得所選出的候選字將會有與該語音字的語音性質符合的最高機率,其中打字者輸入之該語音字係根據語音拼字的特徵所輸入。首先,輸入之語音字會根據其語音拼字方式分解為不同的可能語音音節序列,其中每一語音音節序列係包含複數個語音音節,並各自代表不同的候選字。在一般的狀況下,上述該語音字分解出之一語音音節序列與單一候選字所代表之語音音節序列之間之一相差值d會以適當之演算法限制在可容忍的範圍內,並藉此將相差值d在可容忍範圍以外的語音音節序列所代表的候選字淘汰掉,以縮小可能候選字的搜索範圍。接著,會計算出每一候選字之語音音節序列所代表之音節差異度矩陣A的總額替換成本,並從中找出代表總額替換成本最小之音節差異度矩陣A的候選字,其中單一候選字所代表之音節差異度矩陣A係用來表示該候選字與打字者輸入之語音字之間的音節差異度。最後,該語音字會被轉換為代表總額替換成本最小之音節差異度矩陣A的候選字,其中,將該語音字轉換為該候選字的步驟包含插入、刪除、替換、及排列該語音字所包含之字元。因此,可以達成根據單字之語音性質來實施之本發明所提供之第二種候選字產生方法以增進打字或按鍵輸入效率之目的,其中,打字者只需要輸入語音字便可自動或半自動的將該語音字替換為最符合該語音字之語音性質的候選字,以減少打字者在忘記單字之正確拼法所產生的困擾。
第2圖所示之步驟可以使用適當設計之使用者介面,並以自動選取候選字之方式來加以實施。因此,當打字者根據欲得到單字之語音性質輸入一語音字時,該使用者介面將根據第2圖所示之步驟找出並表列(例如下拉式選單)複數個候選字,以供打字者選出一個最符合打字者之選擇的單字;該使用者介面亦可根據第2圖所示之步驟以及上述的說明,自動選取出一個最符合該語音字之語音性質(亦即出現可能性最高)的候選字來,並將該語音字自動替換為該候選字。
有時候,輸入包含較多之字元或字母的單字對打字者來說是相當麻煩的事情,因此,本發明亦提供一第三種候選字產生方法以減少打字者此類之麻煩。在該第三種候選字產生方法中,打字者僅需要輸入組成欲輸入之單字(亦即一目標字)的字元序列中之一子序列(subsequence),就可以直接得到該目標字。舉例來說,使用者可輸入子序列”pylg”以得到目標字”psychology”,其中子序列”pylg”的字元排列順序係吻合於目標字”psychology”的字元排列順序,也就是說,目標字”psychology”包含子序列”pylg”中的所有字元,並保有子序列”pylg”中的字元排列順序。藉由本發明所提供之第三種候選字產生方法,當打字者輸入子序列”pylg”時,所有保有子序列”pylg”之所有字元及其字元順序的可能候選字都會被產生出來,例如單字”psychological”、”psycholinguistic”、”physiology”等,其中這些被產生出來之單字所擁有的共同特徵是:子序列”pylg”係為這些被產生出來之單字的子序列。當打字者想要輸入URL(Uniform Resource Locator,單一資源定址器)或電子郵件位址時,亦可應用本發明所提供之第三種候選字產生方法。舉例來說,打字者可藉由輸入子序列”shsu”來得到字元序列”http://ias1.iis.sinica.edu.tw/hsu/”,其中字元序列”http://ias1.iis.sinica.edu.tw/hsu/”係為打字者先前已經輸入過並被記錄起來以當作參考之單一資源定址器。
請參閱第4圖,其為本發明藉由輸入目標字之子序列來實施之第三種候選字產生方法的示意圖。第4圖所示之步驟係列舉如下:步驟302:提供一字典。
步驟304:輸入一輸入字後,決定是否至少有一個候選字存在,其中該至少一個候選字係來自於該字典,該輸入字係為該至少一個候選字之子序列,且該輸入字所包含之所有字元以及其字元順序可在該至少一個候選字中找到。當該至少一個候選字存在時,執行步驟306;否則,執行步驟308。
步驟306:由該至少一個候選字中選出一個候選字,並將該輸入字替換為該選出之候選字。
步驟308:顯示一訊息,以表示並沒有任何對應於該輸入字之候選字存在。
與本發明上述所提供之所有候選字產生方法相似,本發明所提供之第三種候選字產生方法亦需要事先提供一字典以執行第4圖所述之步驟。該字典係儲存複數個候選字,並提供辨認出該複數個候選字之子序列的功能。當打字者輸入一輸入字後,在該字典中尋找包含該輸入字為子序列之候選字。當找出至少一個包含該輸入字為子序列的可能候選字時,打字者再由該至少一個可能候選字中選取一個較喜好的候選字出來。藉由針對本發明所提供之第三種候選字產生方法所設計的使用者介面,該至少一個可能候選字可以表列的方式顯示出來,例如將該至少一個可能候選字顯示於下拉式選單以供打字者挑選,或是顯示於其他可方便打字者選取候選字之佈置以供打字者挑選。再者,藉由事先良好建立之統計數據,可預先計算出該字典所儲存之複數個候選字各自的出現機率,因此上述打字者挑選候選字的過程可直接以自動選出出現機率最高之候選字的方式來加以替代實施。然而,當輸入之輸入字在該字典中找不到包含該輸入字為子序列的候選字時,需要顯示一錯誤訊息,以告知打字者可能打錯了字,並告知打字者在該字典中並沒有任何符合該輸入字之條件的候選字存在。
本發明亦提供一第四種候選字產生方法,並用在單字序列上,例如句子或片段所組成的單字序列。假設打字者先前輸入之一句子或一片段已經連帶其本身的單字排列順序一同被記錄起來,則該句子或該片段對應之首字母縮略字序列(acronym sequence)將會一同被儲存起來,其中該首字母縮略字序列係包含該句子或該片段中每一單字的開頭字元,且這些開頭字元在該首字母縮略字序列中的排列順序係與該句子或該片段所包含之所有單字的排列順序相同。如此一來,當打字者想要得到一個完整的句子或片段時,他只需要輸入該句子或該片段之首字母縮略字序列的子序列,亦即一首字母縮略字子序列,就可以達到目的。但是該首字母縮略字子序列的開頭字元必須要是該句子或該片段之開頭單字的開頭字元,同理,該首字母縮略字子序列的結尾字元也必須要是該句子或該片段之結尾單字的開頭字元。舉例來說,當打字者先前輸入過一單字序列”I will visit the University of California at Los Angeles tomorrow.”時,對應之首字母縮略字序列”iwvtuocalat”將會被自動的一起儲存起來。同理,打字者可藉由僅輸入一輸入字”ucla”或”uocla”,得到一片段”University of California at Los Angeles”,其中該片段之首字母縮略字序列係為”uocala”,且輸入字”ucla”與”uocla”皆為首字母縮略字序列”uocala”的子序列。請注意,本發明所提供之第四種候選字產生方法與之前所述之本發明候選字產生方法不同,並不需要事先準備語句字典或片段字典來儲存片段”University of California at Los Angeles”,也不需要事先記憶可用來取得該片段之關鍵輸入字,例如首字母縮略字子序列”ucla”。打字者可藉由任意輸入合乎文法的首字母縮略字子序列來得到他所想要的句子或片段,其中打字者所想要的句子或片段係為打字者之前已輸入過之句子或片段,或是在打字者之前輸入該句子或該片段的同時已由特殊的使用者定義檔(user profile)所儲存起來。
第5圖係為本發明所提供之第四種候選字產生方法的示意圖,其中該第四種候選字產生方法係應用首字母縮略字子序列與單字序列之間的字元順序關係產生出打字者所需要的單字子序列來,且該單字子序列係為該單字序列之子序列。第5圖所示的步驟係列舉如下:步驟402:儲存一單字序列。
步驟404:使用一首字母縮略字子序列,得到該單字序列之一單字子序列,該首字母縮略字子序列係包含一單字之開頭字元、以及該單字之一後續單字之開頭字元,其中該單字子序列係起始於該單字並結束於該後續單字;該單字與該後續單字係來自於該單字序列且不一定相鄰;該單字之開頭字元與該後續單字之開頭字元在該首字母縮略字子序列中的順序係遵守該單字與該後續單字在該單字序列中的順序。
一使用者介面係可設計來實施本發明所提供之第四種候選字產生方法,且當得到二個以上之單字子序列時,該使用者介面會產生一個單字子序列清單,以列出所得到之至少一個單字子序列並供打字者由該至少一個單字子序列中選出打字者想要之一單字子序列;其中該至少一個單字子序列係皆由同一首字母縮略字子序列參考該單字序列所產生出來,且該首字母縮略字子序列係為該單字序列所對應之首字母縮略字序列之子序列。上述在使用者介面中由打字者選擇單字子序列的過程亦可以以自動選擇的方式來執行,亦即根據過去所累積的統計數據或相關機率來自動選取出一個可能性最高的單字子序列,甚或是單字序列。
本發明係提供一第五種候選字產生方法,以節省打字者需要輸入包含加入標記的字元之單字時額外浪費的時間。藉由該第五種候選字產生方法,打字者在輸入單字時,可以很輕易地把未帶有標記的字元與帶有標記的字元互相替換,例如將未帶有標記的字元“O”或“U”與帶有標記的字元”或“”互相替換。
請參閱第6圖,其為本發明所提供之第五種候選字產生方法的示意圖,其中該第五種候選字方法係用來簡化打字者輸入包含加入標記的字元之單字時額外浪費的時間。該第五種候選字產生方法係列舉如下:步驟502:提供一字典。
步驟504:根據輸入字中可能帶有標記的字元,並藉由參考該字典中所記載並相關於複數個帶有標記之字元的合理語義單字組合,產生至少一個候選字。
步驟506:由該至少一個候選字中選出一個候選字。
在步驟502中,一字典係用來儲存與包含帶有標記之字元的合理語義單字組合相關之複數個候選字,因為同樣的一個單字所包含之某些字元在某些狀況下係為帶有標記之字元,但是在其他狀況下又並非是帶有標記的字元。當打字者輸入一輸入字時,與帶有標記之字元和該輸入字相關之合理語義單字組合都會被搜尋,以產生至少一個候選字。最後,該打字者係從經由搜尋所產生之至少一個候選字中,選出一個候選字,或是根據相關之統計數據與機率分布,並經由自動選取的方式選出一個可能性最高的候選字來。一使用者介面亦可經由適當的設計來實施本發明所提供之第五種候選字產生方法,以藉由表列出至少一個候選字的方式,輔助打字者選擇一個適當的候選字。該使用者介面亦可同樣的以自動選取的方式由該至少一個候選字中選出一個可能性最高的候選字來。
本發明係提供複數個候選字產生方法,以減輕打字者在打字時面臨的各種負擔,其中引起這些負擔的原因包含不正確的拼字、輸入錯誤、打字者不知道單字的正確拼法、以及某些包含帶有標記(比如說重音標記)之字元的單字。該複數個候選字產生方法亦可以某些簡略的方法幫助打字者可以更快的找到他所想要的單字。本發明所提供的這些候選字產生方法係應用了某些概念,例如記錄打字者先前輸入的句子或片段並當作之後的參考、或是利用使用者設定檔由打字者先前所輸入之句子或片段自我學習之候選字,以自動選取出有較高機率符合狀況之候選字。再者,藉由其他特定條件的限制,可以大幅度的縮小候選字的搜尋範圍,並使得自動選取出有較高機率符合狀況之候選字的準確性提高。
許多亞洲系統的語言都是採取以字元或字母為單位的鍵盤輸入方式,例如中文的注音輸入法、倉頡輸入法、或是日文的漢字輸入法等。在上述之輸入法中,打字者係輸入一連串的字元以形成特定字碼,並以表列之方式(例如下拉式選單)找出根據該特定字碼所產生出之至少一個亞洲系統語言候選字元。因此,本發明所提出之各種候選字產生方法亦可應用於亞洲系統語言的輸入方式,其中候選字的單位即為亞洲系統語言所使用之字元。
以上所述僅為本發明之較佳實施例,凡依本發明申請專利範圍所做之均等變化與修飾,皆應屬本發明之涵蓋範圍。
步驟...102-114、202-212、302-308、402-404、502-506
第1圖為本發明所提供之第一種候選字產生方法的流程圖,其中該第一種候選字產生方法係用來幫助打字者免於錯誤輸入字元的困擾。
第2圖為本發明所提供之第二種候選字產生方法的流程圖,其中該第二種候選字產生方法係用來使打字者藉由輸入應用了語音學簡化拼法之語音字來增進打字或按鍵輸入效率。
第3圖為使用於第2圖所述之候選字產生方法之一音節差異度矩陣的示意圖。
第4圖為本發明藉由輸入目標字之子序列來實施之第三種候選字產生方法的示意圖。
第5圖係為本發明所提供之第四種候選字產生方法的示意圖,其中該第四種候選字產生方法係應用首字母縮略字子序列與單字序列之間的字元順序關係產生出打字者所需要的單字子序列來,且該單字子序列係為該單字序列之子序列。
第6圖為本發明所提供之第五種候選字產生方法的示意圖,其中該第五種候選字方法係用來簡化打字者輸入包含加入標記的字元之單字時額外浪費的時間。
步驟...102-114
Claims (7)
- 一種增進打字或按鍵輸入效率的候選字產生方法,包含:提供一字典,該字典包含複數個候選字;接受打字者輸入一輸入字;在該字典中尋找包含該輸入字為子序列(subsequence)之候選字;其中,該輸入字的字元排列順序吻合於候選字的字元排列順序;如尋找得到多數候選字,則判斷一較佳候選字;如尋找得到一候選字,則以該候選字為較佳候選字;並以該較佳候選字取代該輸入字;且如尋找結果無候選字,則顯示錯誤訊息。
- 如請求項1所述之方法,其中該判斷較佳候選字之步驟包括依據打字者之選擇,判斷其中一候選字為較佳候選字。
- 如請求項2所述之方法,其中該判斷較佳候選字之步驟另包括:於一使用者介面顯示該多數候選字;及接受打字者選擇其中一候選字。
- 如請求項1所述之方法,其中該判斷較佳候選字之步驟包括依據事先建立之統計數據,計算該多數候選字之出現機率及將出 現機率最高之候選字選為較佳候選字。
- 如請求項1至4中任一項所述之方法,其中該字典儲存之候選字包含至少一單一資源定址器(Uniform resource locator,URL)及/或至少一電子郵件位址。
- 如請求項4所述之方法,其中該事先建立之統計數據包括根據一N-gram模型方法統計所得之統計數據。
- 如請求項1至4中任一項所述之方法,另包含:根據打字者最近輸入之文字中,該多數個候選字出現之次數,以一使用者介面依該次數多寡顯示該多數候選字;及接受打字者選擇其中一候選字。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/535,497 US8364468B2 (en) | 2006-09-27 | 2006-09-27 | Typing candidate generating method for enhancing typing efficiency |
Publications (2)
Publication Number | Publication Date |
---|---|
TW200816007A TW200816007A (en) | 2008-04-01 |
TWI421708B true TWI421708B (zh) | 2014-01-01 |
Family
ID=39226154
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW099134020A TWI435225B (zh) | 2006-09-27 | 2007-03-05 | 增進打字或按鍵輸入效率的候選字產生方法 |
TW096107529A TWI421708B (zh) | 2006-09-27 | 2007-03-05 | 增進打字或按鍵輸入效率的候選字產生方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW099134020A TWI435225B (zh) | 2006-09-27 | 2007-03-05 | 增進打字或按鍵輸入效率的候選字產生方法 |
Country Status (7)
Country | Link |
---|---|
US (2) | US8364468B2 (zh) |
EP (1) | EP2082333A4 (zh) |
JP (2) | JP2010505208A (zh) |
KR (1) | KR101425182B1 (zh) |
CN (1) | CN101523385B (zh) |
TW (2) | TWI435225B (zh) |
WO (1) | WO2008039927A2 (zh) |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8364468B2 (en) * | 2006-09-27 | 2013-01-29 | Academia Sinica | Typing candidate generating method for enhancing typing efficiency |
US7949516B2 (en) | 2007-08-31 | 2011-05-24 | Research In Motion Limited | Handheld electronic device and method employing logical proximity of characters in spell checking |
CN100592249C (zh) * | 2007-09-21 | 2010-02-24 | 上海汉翔信息技术有限公司 | 快速输入相关词的方法 |
US8521516B2 (en) * | 2008-03-26 | 2013-08-27 | Google Inc. | Linguistic key normalization |
US9009591B2 (en) | 2008-12-11 | 2015-04-14 | Microsoft Corporation | User-specified phrase input learning |
JP5476811B2 (ja) * | 2009-06-23 | 2014-04-23 | 富士ゼロックス株式会社 | 文書処理装置及びプログラム |
JP5204803B2 (ja) * | 2010-05-10 | 2013-06-05 | 株式会社エヌ・ティ・ティ・ドコモ | データ処理装置、入力支援方法及びプログラム |
JP5803481B2 (ja) * | 2011-09-20 | 2015-11-04 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
JP5642037B2 (ja) * | 2011-09-22 | 2014-12-17 | 株式会社東芝 | 検索装置、検索方法およびプログラム |
US8725497B2 (en) * | 2011-10-05 | 2014-05-13 | Daniel M. Wang | System and method for detecting and correcting mismatched Chinese character |
US8881005B2 (en) * | 2012-04-20 | 2014-11-04 | King Abdulaziz City For Science And Technology | Methods and systems for large-scale statistical misspelling correction |
WO2014138756A1 (en) * | 2013-03-07 | 2014-09-12 | Dang Thi Mai Huong | System and method for automatic diacritizing vietnamese text |
KR101332757B1 (ko) * | 2013-05-16 | 2013-11-25 | 주식회사 큐키 | 삭제키 입력 없이 단어 또는 문자열을 수정하는 방법 및 이를 구현한 장치 |
US9934217B2 (en) * | 2013-07-26 | 2018-04-03 | Facebook, Inc. | Index for electronic string of symbols |
CN104572611A (zh) * | 2013-10-17 | 2015-04-29 | 阿尔派株式会社 | 文字输入装置以及文字输入方法 |
US20160062979A1 (en) * | 2014-08-27 | 2016-03-03 | Google Inc. | Word classification based on phonetic features |
US10558926B2 (en) * | 2014-11-20 | 2020-02-11 | Academia Sinica | Statistical pattern generation for information extraction |
KR101645951B1 (ko) * | 2015-02-10 | 2016-08-05 | 동국대학교 산학협력단 | 오타 정정 시스템 및 방법 |
JP6583686B2 (ja) | 2015-06-17 | 2019-10-02 | パナソニックIpマネジメント株式会社 | 意味情報生成方法、意味情報生成装置、およびプログラム |
KR101649914B1 (ko) * | 2016-07-20 | 2016-08-22 | 동국대학교 산학협력단 | 오타 정정 시스템 및 방법 |
CN107783965B (zh) * | 2016-08-31 | 2021-07-02 | 深圳市青锋全能教育培训有限公司 | 一种基于句式结构的翻译方法及装置 |
US10372814B2 (en) | 2016-10-18 | 2019-08-06 | International Business Machines Corporation | Methods and system for fast, adaptive correction of misspells |
US10579729B2 (en) | 2016-10-18 | 2020-03-03 | International Business Machines Corporation | Methods and system for fast, adaptive correction of misspells |
US11869494B2 (en) * | 2019-01-10 | 2024-01-09 | International Business Machines Corporation | Vowel based generation of phonetically distinguishable words |
TWI699674B (zh) * | 2019-07-26 | 2020-07-21 | 致伸科技股份有限公司 | 獨立式學習輸入裝置 |
CN112825111A (zh) * | 2019-11-20 | 2021-05-21 | 中央研究院 | 自然语言处理方法与其计算装置 |
CN112748811A (zh) * | 2021-01-21 | 2021-05-04 | 李博林 | 一种英文单词输入方法及装置 |
US12050873B2 (en) * | 2021-10-28 | 2024-07-30 | Sap Se | Semantic duplicate normalization and standardization |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6047300A (en) * | 1997-05-15 | 2000-04-04 | Microsoft Corporation | System and method for automatically correcting a misspelled word |
US6292771B1 (en) * | 1997-09-30 | 2001-09-18 | Ihc Health Services, Inc. | Probabilistic method for natural language processing and for encoding free-text data into a medical database by utilizing a Bayesian network to perform spell checking of words |
US6332158B1 (en) * | 1998-12-03 | 2001-12-18 | Chris Risley | Domain name system lookup allowing intelligent correction of searches and presentation of auxiliary information |
US6616704B1 (en) * | 2000-09-20 | 2003-09-09 | International Business Machines Corporation | Two step method for correcting spelling of a word or phrase in a document |
US20050283726A1 (en) * | 2004-06-17 | 2005-12-22 | Apple Computer, Inc. | Routine and interface for correcting electronic text |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59100941A (ja) * | 1982-11-30 | 1984-06-11 | Sharp Corp | 仮名漢字変換装置 |
JPS6356756A (ja) | 1986-08-28 | 1988-03-11 | Sharp Corp | コレクト機能付欧文作成装置 |
JPH01214964A (ja) | 1988-02-23 | 1989-08-29 | Sharp Corp | コレクト機能付欧文作成装置 |
JPH04130578A (ja) * | 1990-09-20 | 1992-05-01 | Fujitsu Ltd | 未登録語検索方法および装置 |
DE4323241A1 (de) * | 1993-07-12 | 1995-02-02 | Ibm | Verfahren und Computersystem zur Suche fehlerhafter Zeichenketten in einem Text |
JP3003605B2 (ja) | 1996-12-25 | 2000-01-31 | 日本電気株式会社 | 単語修正装置および単語修正方法 |
JP2000123006A (ja) * | 1998-08-10 | 2000-04-28 | Just Syst Corp | 文字列変換装置およびその方法 |
GB2343037B (en) * | 1998-10-22 | 2002-12-31 | Ibm | Phonetic spell checker |
US7679534B2 (en) | 1998-12-04 | 2010-03-16 | Tegic Communications, Inc. | Contextual prediction of user words and user actions |
US6262771B1 (en) * | 1999-03-04 | 2001-07-17 | Victor Company Of Japan, Ltd. | Method and apparatus for converting picture signal, and recording and reproducing apparatus |
US7030863B2 (en) | 2000-05-26 | 2006-04-18 | America Online, Incorporated | Virtual keyboard system with automatic correction |
US7750891B2 (en) * | 2003-04-09 | 2010-07-06 | Tegic Communications, Inc. | Selective input system based on tracking of motion parameters of an input device |
US6539421B1 (en) * | 1999-09-24 | 2003-03-25 | America Online, Inc. | Messaging application user interface |
US6848080B1 (en) | 1999-11-05 | 2005-01-25 | Microsoft Corporation | Language input architecture for converting one text form to another text form with tolerance to spelling, typographical, and conversion errors |
JP2002183128A (ja) * | 2000-12-11 | 2002-06-28 | Sharp Corp | 文字処理装置 |
US7117144B2 (en) * | 2001-03-31 | 2006-10-03 | Microsoft Corporation | Spell checking for text input via reduced keypad keys |
US6820075B2 (en) * | 2001-08-13 | 2004-11-16 | Xerox Corporation | Document-centric system with auto-completion |
JP2003223437A (ja) * | 2002-01-29 | 2003-08-08 | Internatl Business Mach Corp <Ibm> | 正解語の候補の表示方法、スペルチェック方法、コンピュータ装置、プログラム |
JP4312429B2 (ja) * | 2002-07-09 | 2009-08-12 | シャープ株式会社 | 手書き入力装置および方法、手書き入力プログラム、並びに、プログラム記録媒体 |
CA2493443C (en) | 2002-07-23 | 2011-07-19 | Research In Motion Limited | Systems and methods of building and using custom word lists |
US7453439B1 (en) * | 2003-01-16 | 2008-11-18 | Forward Input Inc. | System and method for continuous stroke word-based text input |
US7389233B1 (en) * | 2003-09-02 | 2008-06-17 | Verizon Corporate Services Group Inc. | Self-organizing speech recognition for information extraction |
US7831911B2 (en) * | 2006-03-08 | 2010-11-09 | Microsoft Corporation | Spell checking system including a phonetic speller |
US7797629B2 (en) * | 2006-04-05 | 2010-09-14 | Research In Motion Limited | Handheld electronic device and method for performing optimized spell checking during text entry by providing a sequentially ordered series of spell-check algorithms |
US8364468B2 (en) * | 2006-09-27 | 2013-01-29 | Academia Sinica | Typing candidate generating method for enhancing typing efficiency |
-
2006
- 2006-09-27 US US11/535,497 patent/US8364468B2/en active Active
-
2007
- 2007-03-05 TW TW099134020A patent/TWI435225B/zh active
- 2007-03-05 TW TW096107529A patent/TWI421708B/zh active
- 2007-09-27 EP EP07843366A patent/EP2082333A4/en not_active Withdrawn
- 2007-09-27 WO PCT/US2007/079736 patent/WO2008039927A2/en active Application Filing
- 2007-09-27 KR KR1020097008496A patent/KR101425182B1/ko active IP Right Grant
- 2007-09-27 CN CN2007800362640A patent/CN101523385B/zh active Active
- 2007-09-27 JP JP2009530601A patent/JP2010505208A/ja active Pending
-
2012
- 2012-12-10 US US13/709,495 patent/US8594999B2/en active Active
-
2013
- 2013-01-28 JP JP2013013454A patent/JP2013117978A/ja active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6047300A (en) * | 1997-05-15 | 2000-04-04 | Microsoft Corporation | System and method for automatically correcting a misspelled word |
US6292771B1 (en) * | 1997-09-30 | 2001-09-18 | Ihc Health Services, Inc. | Probabilistic method for natural language processing and for encoding free-text data into a medical database by utilizing a Bayesian network to perform spell checking of words |
US6332158B1 (en) * | 1998-12-03 | 2001-12-18 | Chris Risley | Domain name system lookup allowing intelligent correction of searches and presentation of auxiliary information |
US6616704B1 (en) * | 2000-09-20 | 2003-09-09 | International Business Machines Corporation | Two step method for correcting spelling of a word or phrase in a document |
US20050283726A1 (en) * | 2004-06-17 | 2005-12-22 | Apple Computer, Inc. | Routine and interface for correcting electronic text |
Also Published As
Publication number | Publication date |
---|---|
US8364468B2 (en) | 2013-01-29 |
US20130185053A1 (en) | 2013-07-18 |
WO2008039927A3 (en) | 2008-12-04 |
EP2082333A2 (en) | 2009-07-29 |
US20080077396A1 (en) | 2008-03-27 |
CN101523385A (zh) | 2009-09-02 |
KR20090087435A (ko) | 2009-08-17 |
TWI435225B (zh) | 2014-04-21 |
KR101425182B1 (ko) | 2014-08-01 |
CN101523385B (zh) | 2011-07-27 |
JP2013117978A (ja) | 2013-06-13 |
TW200816007A (en) | 2008-04-01 |
TW201122850A (en) | 2011-07-01 |
US8594999B2 (en) | 2013-11-26 |
WO2008039927A2 (en) | 2008-04-03 |
JP2010505208A (ja) | 2010-02-18 |
EP2082333A4 (en) | 2012-03-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI421708B (zh) | 增進打字或按鍵輸入效率的候選字產生方法 | |
KR101435265B1 (ko) | 언어 변환에 있어서 다중 리딩 모호성 해결을 위한 방법 | |
JP4833476B2 (ja) | モードレス入力で一方のテキスト形式を他方のテキスト形式に変換する言語入力アーキテクチャ | |
US9471566B1 (en) | Method and apparatus for converting phonetic language input to written language output | |
JP5535417B2 (ja) | スペルミス、タイプミス、および変換誤りに耐性のある、あるテキスト形式から別のテキスト形式に変換する言語入力アーキテクチャ | |
CN101133411B (zh) | 非罗马字符的容错罗马化输入方法 | |
US20120166942A1 (en) | Using parts-of-speech tagging and named entity recognition for spelling correction | |
JP2003514304A5 (zh) | ||
JP2006031295A (ja) | 単語境界確率推定装置及び方法、確率的言語モデル構築装置及び方法、仮名漢字変換装置及び方法、並びに、未知語モデルの構築方法、 | |
WO2010105428A1 (en) | Input method editor | |
JPH07325828A (ja) | 文法チェックシステム | |
JPH07325824A (ja) | 文法チェックシステム | |
WO2005116863A1 (en) | A character display system | |
Tufiş et al. | DIAC+: A professional diacritics recovering system | |
US8847962B2 (en) | Exception processing of character entry sequences | |
L’haire | FipsOrtho: A spell checker for learners of French | |
JPH09153034A (ja) | 文書作成装置及び文書作成方法 | |
JP2019159118A (ja) | 出力プログラム、情報処理装置及び出力制御方法 | |
CN102156693A (zh) | 一种盲文输入方法和系统 | |
JP4953431B2 (ja) | 品詞バリエーション生成装置 | |
CN116484838A (zh) | 文本段分割装置、方法以及存储介质 |