TWI464678B - 用於手寫輸入亞洲語言的方法及系統 - Google Patents

用於手寫輸入亞洲語言的方法及系統 Download PDF

Info

Publication number
TWI464678B
TWI464678B TW094117891A TW94117891A TWI464678B TW I464678 B TWI464678 B TW I464678B TW 094117891 A TW094117891 A TW 094117891A TW 94117891 A TW94117891 A TW 94117891A TW I464678 B TWI464678 B TW I464678B
Authority
TW
Taiwan
Prior art keywords
user
identification result
input
chinese
converted
Prior art date
Application number
TW094117891A
Other languages
English (en)
Other versions
TW200602976A (en
Inventor
Dong Li
Donghui Zhang
Yong Zhang
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of TW200602976A publication Critical patent/TW200602976A/zh
Application granted granted Critical
Publication of TWI464678B publication Critical patent/TWI464678B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/018Input/output arrangements for oriental characters

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)
  • Character Discrimination (AREA)

Description

用於手寫輸入亞洲語言的方法及系統
本發明之各態樣係有關於軟體與硬體的產品。更特定而言,本發明之態樣係有關於提供使用者一種改進的處理過程,用以在亞洲語言中輸入資訊。
電腦系統存在著多種的語言。這些語言包含以字元式與符號式的文字表示方式。當該西式104鍵-鍵盤在世界上被廣泛地使用時,以符號式之語言的使用者需要一種方式,其能在鍵盤所提供的有限輸入下輸入符號。輸入符號語言的其中一種方式是使用一特定於一語言的輸入法編輯器(input method editor,IME)。
亞洲文字輸入是現存最具挑戰性的電腦問題之一。它曾是亞洲語言計算的瓶頸。該亞洲語言字元集合隨著每次對統一碼(Unicode)標準的修改而持續地成長。舉例而言,該定義在統一碼2.0中的CJK(中文,日文,韓文)字元有20902個字元。統一碼3.0則包含27484個字元。延伸B更增加多達40771個字元。
IME提供一轉換引擎以轉換英文字母成為亞洲字元。廣泛說來,該亞洲字元的編碼是基於該亞洲字元的語音學。此可包含字母或是字母與數字的結合。有時,需要將英文標點符號轉換成亞洲語言的標點符號。此外,英文文字可與亞洲文字結合(並/或將符號、語音字母/字元與亞洲表意文字(中文字元)混合),因此亟需要快速且容易地在編碼方法間切換的能力。
以下描述出許多種與前述之方法相關的議題:a.當手寫輸入相較於鍵盤輸入而言更為自然時,鍵盤輸入為用於亞洲語言之主要輸入機制。
b.當對於中文字元而言手寫輸入在一般情況下較快時,拼音字母的鍵盤打字則顯緩慢。
c.傳統手寫辨識輸入需要使用者書寫中文字元(東亞表意文字,East Asian ideography)。因為中文字元為許多筆劃所組成,書寫中文字元是很複雜的。同樣,現在中文手寫辨識輸入法需要使用者書寫分隔式筆劃(而非草書),以得到更高的辨識率(準確度)。相加之下,前述複雜度、非草寫式的書寫以及更低的準確度(基於錯誤更正率)使得手寫辨識輸入速度更為緩慢。
因此亟需一種改良式系統以允許使用者能更快速與簡單地在亞洲語言中輸入文字。
本發明的態樣,定位於一或多個如上所提及的議題,藉以提供一在亞洲語言中輸入文字的解決方案。該發明的態樣包含該使用一指示筆以輸入資訊之能力。
此些與其它態樣則被定位於如下該等圖式以及其相關的描述。
本現行發明之態樣係關於提供一種在亞洲語言中輸入文字的能力。
以下所述區分為不同的章節以輔助讀者。這些開頭包括:墨水的特性、項目、通用電腦環境、硬體輸入、使用者介面與手寫使用者輸入介面。
墨水的特性
為使用墨水筆之使用者所知悉,物理性墨水(該種類藉由使用一支筆與一墨水儲存器,以舖印在紙面上)相較於一連串由線段連接成的座標,可傳遞出更多的資訊。舉例而言,物理性墨水可反映出筆壓(透過該墨水的厚度)、筆劃角度(透過該線的形狀或曲線段與在該墨水周圍慎重點的行為)以及該筆尖端之速度(透過該尖銳度、線寬與線寬會變更一直線或曲線的方向)。因為這些額外特性、情緒、個人特質、重要性等等,相較於點與點之間的平均線寬而言,可以更加即時地傳達。
電子墨水(或墨水)係關於擷取方式,以及當一使用者使用一指示筆式的輸入裝置時,擷取電子資訊的顯示。電子墨水為一連串的筆劃,其中各個筆劃為由一連串的點所組成。該點可使用一多樣的已知技術,包括笛卡兒(Cartesian)座標(X,Y),極性(polar)座標(r,Θ),與其他在該領域中之已知技術。電子墨水可包括真實墨水特性的表述,包括壓力、角度、速度、顏色、指示筆尺寸以及墨水暗度。電子墨水可更包含其他特性,包括墨水如何放置於一紙面上(一由左至右然後往下的光柵圖樣,其用於多數的西方語言)的方式、一時間戳記(當該墨水被放置完成後進行指示)、該墨水操作者的指示以及在其他資訊中的發源端裝置(至少一機器的識別,基於該識別或一用來放置該墨水之該筆的識別汲取該墨水)。
語詞
【墨水】一具特性之一連串的筆劃或其集合。一連串之筆劃可包括在一有次序之形式中的各筆劃。該序串可藉由時間的擷取或是該筆劃出現在紙上之位置,或是在合作狀態中透過著墨者,來進行排序。而其它次序也是可能的。筆劃的集合可包括一連串的筆劃或是無秩序的筆劃,或是任何更相關之組合。某些特性對在筆劃中之每一筆劃或是點而言,可說是獨一無二的。(例如:壓力,速度,角度等等)。此些特性可被儲存在筆劃或點之層級,而非在墨水之層級。【墨水元件】一儲存具有特性(或不具特性)墨水之資料結構。
【筆劃】為一連串的擷取點或其集合。例如,當描繪時,該一連串的點可用線來連接。另外,該筆劃可用一點或一在下個點方向中之向量來表示。簡單而言,無關於位於下面各點的表現方式和/或何連接該等點,一筆劃被預期來包含任何與墨水相關之各點或區段的表示方式,。
【點】定義在空間中之一位置的資訊。例如,該點可被定義為與一擷取空間(例如:一數位板上之各點)、一虛擬墨水空間(可進入其中放置該所擷取墨水之一空間中的各座標,且/或顯示空間(一顯示裝置之各點或像素)相關聯。
【文件】任何電子檔案,其中該檔案具有一可視之表示方式與內容。一文件可包含一網站頁面、一文字處理文件、一附註頁面或標籤、一試算表、一視覺表示方式、一資料庫記錄、影像檔案以及相關之組合。
通用電腦環境
第1圖與第2圖係描繪出合適本發明實施於其上之操作環境100與201的範例。該操作環境100與201僅為此合適操作環境的少數範例,且並非試圖建議任何限制來侷限本發明之功能性或使用的範疇。其他可適合用在本發明上之已知的電腦系統、環境,與/或組態可包含(但非僅限於)個人電腦、伺服器電腦、手提式或桌上型裝置、多處理器系統、微處理器式系統、可程式消費性電子產品、網路PC、迷你電腦、大型電腦、與包含以上系統或裝置的分散式電腦環境等等。
本發明的態樣可描述成在該電腦可執行指令的一般背景中,諸如由一或多個電腦或其他裝置執行的程式模組。一般而言,程式模組包含常式(routine)、演算法、程式、物件、組合元件與資料結構等等,上述該等模組係用來執行特定作業或實行特定抽象資料型別。典型地來說,該程式模組的功能性可合併或分散成為如各式具體實施例所期望的形式。
電腦裝置系統100與201一般包含至少數種電腦可讀性媒介的格式。電腦可讀性媒介可以是任何可由伺服器103或系統201所存取的媒介。舉例而言,在無任何限制的情況下,電腦可讀性媒介可包含電腦儲存媒介與通訊媒介。電腦儲存媒介包括揮發性與非揮發性、可抽取式與不可抽取式媒介,其係以任何方式或技術來實現用以儲存資訊,該資訊可像是電腦可讀性指令、資料結構、程式模組或其他資料。電腦儲存媒介包括(但非僅限於)隨機存取記憶體、唯讀記憶體、電子抹除式唯讀記憶體、快閃記憶體或其他記憶體技術,唯讀式光碟,數位式影音光碟(DVD)或其他光學式儲存體,磁性卡匣、磁帶、磁性儲存碟片或其他磁性儲存裝置,或其他可用以儲存該所需求資訊,且可被伺服器103或系統201存取的媒介。通訊媒介一般將電腦可讀性指令、資料結構、程式模組或其他資料具體實施化在一調變資料訊號中,該訊號可像是一載波或其他傳送機制,並包括任何資訊傳遞媒介。該項「調變資料訊號」意為一具有一或多個它本身的特性集合或是按此一方式下而改變以將資訊編碼於其該訊號中的訊號。舉例而言,但不引為限制,通訊媒介包括有線媒介,例如一有線網路或直接佈線連接以及無線媒介,諸如聲響、無線電頻(RF)、紅外線、與其他無線媒介。所有以上的組合應該也包括在電腦可讀性媒體之範疇中。
參考第2圖,其係顯示一用以實現本發明之態樣的系統,其中包括一電腦裝置,諸如裝置201。在其最基本設置中,裝置201一般包括一處理器單元204與記憶體203。根據該確切設定與電腦裝置的形式,記憶體203可為揮發性(諸如RAM)、非揮發性(諸如ROM、快閃記憶體等)或是該兩者的組合。另外,裝置201也可有大量儲存裝置(可抽取式與/或不可抽取式),諸如磁性或光學碟片或磁帶205-206。同樣地,裝置201也可擁有輸入裝置諸如208(包括一滑鼠、唱針、鍵盤、軌跡球等等)與/或輸出裝置207諸如一顯示器等等。其他裝置201之態樣可包括網路連接209,以使用無線或有線媒介210來連接至其他裝置、電腦、網路、伺服器等等。所有該等裝置皆為在該領域中眾所週知的,並且也因此將不在此為其加以描述。
硬體輸入
為了將手寫資訊輸入於一與該本發明之態樣所相關的系統中,其存在著多種形式的輸入方式。
第3圖所示為一數位板301,其中該數位板接收手寫輸入與轉接該輸入至一輸入辨識器303,接著該辨識器將該已辨識之輸入轉接至一作業系統與/或應用程式304。該系統也可包含一鍵盤302,其係用來接收被轉接至該輸入辨識器之使用者輸入。在此,該輸入辨識器303可為一單獨之IME或/與一有額外能力之IME。舉例而言,該輸入辨識器303可包括一手寫辨識引擎,用以辨識手寫筆跡。如果所需辨識的該字元之數量被限制,該辨識準確度會提升。在此,舉例而言,如果使用拼音模式,則只有408個字元/組合需要辨識。此方式或許僅適用於英文、英文與使用中文字元之簡體中文,或使用中文字元之簡體中文。
第4圖所示為第3圖之修正。在第4圖中,使用多種形式之數位板(包括一主動數位板301A與一被動數位板301B)。同時,本發明之態樣可使用任何數量按鍵之鍵盤302A。該手寫輸入可藉由一手寫輸入辨識器401來辨識。該手寫辨識器之輸出則接著可由IME辨識器402來辨識。從該鍵盤302A之輸出可由該IME辨識器402來辨識。
該系統可在無論有無一硬體鍵盤之狀況下使用。舉例而言,拼音手寫輸入可在無論有無一鍵盤之狀況下使用。例如,可使用一指示筆或是其他指示裝置以繪製字元或是寫字,其係可經由一手寫辨識器來辨識。舉例而言,可使用有多樣筆劃之電子墨水以輸入至該辨識器。該手寫辨識器則接著可被耦合至一IME辨識器,以辨識從該手寫辨識器之輸入。
該手寫辨識器401可從某些該IME辨識器402之態樣中獨立出來,或是與此態樣相聯繫。舉例而言,手寫辨識器401可辨識筆劃或其他基於預先定義之辨識資訊的輸入。另外,該手寫辨識器401可使用該IME辨識器402之轉換引擎核心的部份功能。
使用者介面
多樣的使用者介面可被用於特殊按鍵與該IME的組合。第5-9圖則顯示各種該拼音IME所使用之使用者介面。此可用於各式的鍵盤上。
第5圖顯示各式的區域,該等區域係展示資訊以幫助使用者組成字元。一組成視窗如區域1101所示。組成視窗1101包括已經被組成之各字元1102,與正在被組成之各字元1103。第5圖也包括一個預選視窗1104,其係顯示符合在1103中該字元之語音的預選字。一使用者接著可選擇該適當預選字並以其取替1103,且將其增加至1102以組成字元。最終,第5圖顯示一狀態列1105。
第6圖顯示一已決定之字串1201與狀態列1202。第6圖顯示在重新轉換前之該使用者介面。在此,在1201中之該等字元已經被決定完成。
第7圖顯示一組成視窗1301、預選清單1302,與狀態列1303。在重新轉換之後,該來自一頁面之文字字串被載回至一組成視窗1301以及所顯示的該預選清單1302。在第6圖中,該使用者可輸入文字並使用該系統選擇適當的字元。在第7圖中,該使用者要求該系統給予一額外之機會,以修改使用者所期望的該文字。
第8圖顯示一終端用戶定義之片語工具。在此具體實施例中,一使用者可輸入較喜好的語音輸入之字元。其中,可將該等字元稱為終端使用者所定義之片語。舉例而言,如果某人正打一份技術性文件,而某一片語被重複使用的次數多於其他片語,該使用者可被賦予一指示字元應該對應至何者語音文字的能力。其將允許更快速的輸入該字元。
手寫使用者輸入介面
上述章節所描述為經過轉換之鍵盤輸入的資訊。包括手寫輸入與語音輸入等額外的輸入方式也可被使用。下列各項描述一語音輸入,其用以構成使用電子墨水之亞洲語言。
在東亞語言中,該語言是由CJK(Chinese,Japanese,與Korean)字元所組成,而該語言之發音是由各式的語音基組(phonetic scheme)所表示。該語音基組由有限的語音字母所組成。舉例而言,在中文中,該語音基組即被稱為拼音。如上所述,該語音字母與在英文中所發現的字母相同。該未使用音調之有效拼音為408個音節。當該CJK字元在統一代碼(unicode2.0)中有20902個,而在東亞語言中有超過80000個字元可使用。
傳統途徑已開始使用手寫輸入之筆劃辨識。然而,當用草體字書寫,特別是在口述方式筆記撰寫時,此途徑會因該字元的複雜性與良好的辨識準確率所限制。
該中文鍵盤IME轉換該拼音至中文字元,其係使用一在該領域中所熟知之統計語言模型。該在此所述之手寫辨識轉換該CJK之手寫墨水(字元)至文字CJK字元中(同時參考字元手寫辨識)。本發明之某些態樣將手寫辨識與中文鍵盤IME組合。此等態樣結合了該手寫輸入之天然性質以及一鍵盤式IME轉換引擎之已驗證效能的辨識。相較於書寫複雜中文字元,因為所需完成一字或語音之筆劃的數量減少,以拼音書寫(使用英文字或相同字元)是更快速的方式。在其他態樣中,當基於欲一致組成(或拼音部份)之該所期望字元以及該受限之有效拼音字彙(408)以提供更佳的辨識準確度時,該書寫方式在該拼音輸入中可為草體字。簡言之,直接字元手寫辨識並不如鍵盤式IME般受歡迎,歸因於準確度問題、使用方便度與效率。
如在該領域中之所熟知,東亞鍵盤IME靠著其語言模型以及用以轉換語音(在此,是指中文之拼音)至CJK字元並有著良好準確率的演算法,因而大大地成功。該拼音之語音輸入包括一受限之輸入:26個英文字母,其中有408種組合。基於該受限字彙,一手寫辨識系統可用以辨識該輸入語音以及製造可用結果。
藉由結合拼音的手寫輸入、該手寫輸入之辨識,以及該拼音至中文字元的下游轉換,將可體會以下一或多個事項:●拼音的手寫輸入對於使用較小型的使用者介面的使用者而言是較容易的。(例如手持式電腦裝置與行動電話)
●人們忘記如何直接書寫完整的、複雜的中文表意文字。
●在某些示例中,書寫拼音(英文字母)相較於書寫中文字元來說是簡單的多的。
●給予系統受限字彙,系統在拼音字串上,相較於複雜中文字元,會有更高的辨識率。
●草體字手寫辨識技術在用於拉丁字母上已獲得普遍的成功,然而在EA字元手寫技術上卻無法如此成功;而且●拼音至中文字元轉換在鍵盤式IME上已成功。
該拼音手寫辨識引擎可包括一或多個辨識組件。首先,它可包括一標準英文手寫辨識引擎,用以辨識草體自英文輸入。此辨識引擎可或不可受限於有效拼音之字彙集合(例如408拼音)。此可作為與英文字之較大字彙的對比。其次,它可包括一「拼音至中文」字元轉換引擎,其係相關於一中文鍵盤IME引擎(例如由微軟公司製作之該MSPY IME)。另外,其他語音至字元辨識引擎可被用來取代該拼音IME(例如該引擎其係藉由其他的輸入,轉換至所有日文,韓文,與中文)。
此外,該手寫辨識輸入(能辨識由筆畫所組成之中文表意文字的能力)與傳統手寫途徑相關聯,以構成手寫字元。在此,拼音(語音)手寫輸入提供一輸入技術,用以快速地輸入文字(例如在口述方式筆記時),其係結合手寫辨識技術與該「語音至中文」字元轉換技術。
第9圖所示為一使用者介面,其用於手寫輸入上。區域1601顯示已從拼音轉換完成之中文字元。區域1602顯示一新的候選字,其係基於輸入手寫墨水。在此,在區域1602中之候選字為手寫辨識引擎之成果,其成果顯示在區域1603中(使用英文語音拼音字串-在此如「hua」)且在區域1604中使用中文字元候選清單。在此,則從區域1604中選出該第一候選字以駐存於區域1602。區域1605為使用者可輸入新手寫資訊之處。在此,一使用者已輸入一個「mao」的英文草體字版本。隨後,mao之候選字可出現在區域1603中,同時在區域1604中附上其中文的相等字。
使用本系統,當一使用者從一接觸區域將一指示筆提起時,在一使用者導航至其他區域,輕敲一傳送按鈕,改變焦點,或是已在區域1605中輸入墨水且在發生一延遲之後時,在區域1605中的輸入辨識即可開始。其他事件也可觸發啟動在區域1605中的墨水辨識。。
該在區域1605中之輸入可採用一定數量的形式。舉例而言,它可包含英文字母(如第10圖中之該墨水文字「MAO」所示)或在第11圖中之中文字元「中」,其係有四個筆劃(其意義意指「zhongl」,該英文意義為/within/among/in/middle/center/while(doing sth)/during/China/Chinese/)關於第12圖,其顯示一用以辨識語音手寫的例示性之處理過程。首先,一使用者靠筆來開始輸入語音(拼音)。該輸入在步驟1801中被收集至墨水筆劃之中。一使用者也可顯示該墨水之軌跡,以顯現在或靠近該指示筆(或手指或其他尖端工具)所接觸一螢幕之處或是該游標之位置。
在步驟1802中,該收集的筆劃或各筆劃可由例如,一西方語言手寫辨識引擎辨識成一原始拼音格(raw Pinyin lattice)1803,。當開始辨識時,其可為如上所述之定義。
在步驟1804中,該原始拼音格被傳遞至一拼音語法分析程序1804,以企圖產生有效拼音字串1805。如果一或多個音節被找尋到,或是該結果相等或超過一有效拼音長度限制,則該IME引擎之處理過程如在步驟1806中所表示。如果沒有任何有效音節被找尋到,則回至步驟1801。
第13圖所示為一使用語言模型解碼器之示例,而其他步驟則使用第12圖的處理過程。從步驟1806延續下去,該處理過程接著使用有效拼音字串,以在步驟1901中建構一基於詞彙上之字格,並造成字格1902。該字格1902接著傳遞至一語言模型解碼器。從步驟1903得出之該最佳結果則接後轉換至中文字元1904。
下列步驟係關於候選字的顯示和選擇。其中該等步驟可具選擇性的結合實行本發明而全部使用、部分使用,或者無任何使用。其在不連續的框(broken box)中被顯示以強調其的另外的本性。在步驟1905,一個中字字元被展示給一使用者。這可或可不包括修改一組成視窗的尺寸,以對一個用戶顯示它的內容。在步驟1906,拼音替換前次轉換之字/字元之動作,也可被顯示出來。此外,步驟1906可或可不包括欲顯示之該字元替換前次轉換之字/字元。在步驟1907,當被指示傳遞該字元時,或當一使用者導航遠離時等等,一組成字串可在經過選擇後被傳遞至應用程式。
關於第10和11圖,該系統可以在該兩種輸入類型之間進行辨別。如果如第10圖中所示使用草寫的輸入,則在畫下一筆劃,或者寫下一字母之前,用戶可不需拿起筆來。相反地,在第11圖中,在開始並且辨識一下一次筆劃之前,使用亞洲表意文字書寫的使用者則需要舉起筆。
以下則描述了各式除了其他以上曾提及用於自動開始將輸入手寫轉換為中文字元外的處理過程:●如果一計時事件發生或●如果未在一墨水輸入狀態。
如果如此,該原始拼音格可藉由拼音語法分析器,接著被轉換至有效拼音字串。
以下則描述了在該處理過程意圖將拼音字串轉換至中文字元之時:●如果多重有效音節可被找尋到或●如果相等或超過一最大可能有效拼音長度。
如果如此,則該已轉換中文字元可插入至組字背景(composition context),然後可調整串聯組字視窗(in-line composition window)與串聯墨水輸入視窗(in-line Ink input window)兩者以合適於一新的背景。
以下則描述了當一處理過程將中文字元轉呈至一應用程式中時:●使用者按下一特定控制按鈕/鍵,諸如「Send」按鈕等等。
●該組字視窗已滿,使用者無法輸入額外墨水。
●一語句末端符號(標點符號)輸入,諸如遇到「!」。
該各式視窗(一組字視窗,一墨水輸入視窗,一候選字視窗)可在上下文改變後,進行重新整理或不進行重新整理。
識別過程的結果可在單色裡展示,或可使用顏色以標示各式的錯誤更正行為。如果使用各顏色,各顏色可用來顯示在一拼音候選字視窗中針對一現行選擇字或字元的拼音轉換(例如用藍色顯示一現行字或字元-1602-,而剩下之字/字元被顯示為黑色-1601)。該使用者則可以瞭解在區域1602中之何字是被更正過的,或何字元所替換之選擇已在區域1603與1604中被提供。一旦一使用者已選擇一候選字或更正一建議候選字成其他的候選字,該整體上下文除了已修正字元外(見下面段落)可再次轉換或可不再次轉換。此方式係將試圖基於該等字之上下文來更正各種字。
使用者也可選擇一更正替換,以取代一現行選擇字/字元(可或可不被標示出)。在至少一態樣中,一另外的使用者選擇可被標記為「已修正」或已經選擇或已指定。在未來轉換中,當其他字/字元被修正來合適該新的上下文時,該已修正或之前選擇或指定文字可維持未改變的狀態。
該現行發明之態樣也可被套用至日文、韓文與繁體中文上等等。舉例而言,除了使用一拼音IME,一研發者可包括日文、韓文,與繁體中文IME等等並加入各功能到如上所述之各按鍵。
當以該微軟企業之IME來具體實施本發明之態樣時,應可瞭解也可使用其他IME。例如,該來自於IBM企業之統一碼IME與來自於Sorceforge.net之VietIME(跨平台越南語輸入方式編輯器),僅列舉少數範例於此。
已在各種例示性具體實施例中描述出本發明之各態樣。在不悖離隨附之申請專利範圍的精神以及範疇下,此技術領域中具有通常知識者將可做出許多的其他具體實施例、修正與變動。
301...數位板
302...鍵盤
303...拼音輸入辨識器
304...作業系統與/或應用程式
301A...主動式數位板
301B...被動式數位板
302A...N鍵式鍵盤
303...拼音輸入辨識器
1801...拼音墨水輸入
1802...西方語言手寫辨識引擎
1803...原始拼音格
1804...拼音語法分析器
1805...有效拼音字串
1806...輸入法編輯器
1901...語言模型辭彙模型
1902...字格
1903...語言模型編碼器
1904...中文字元
1905...展示字元
1906...展示轉換
1907...傳遞結果至應用程式
第1圖與第2圖顯示支援一或多個該發明之態樣的通用電腦環境。
第3圖與第4圖顯示各式硬體使用者介面裝置,其係可與該現行發明之態樣一同使用。
第5-8圖顯示多種使用者介面,其係根據該發明之態樣。
第9圖顯示一使用者介面,其用以按照該現行發明之實施例,來輸入手寫資訊。
第10與11圖顯示手寫資訊之示例。
第12-13圖顯示按照該現行發明之態樣的流程圖。

Claims (12)

  1. 一種用以透過一使用者介面來輸入手寫亞洲語言字元之處理流程,該處理流程至少包含以下步驟:接收輸入之步驟,其係自一使用者接收輸入,該輸入包含手寫輸入,其中該手寫輸入產生一電子墨水(ink),該電子墨水包含一系列以拉丁字母字元寫成的一或多個相關音素(phonemes);辨識電子墨水之步驟,其係將該電子墨水辨識為一辨識結果,該辨識結果包含一系列用於一標準中文拼音系統的一或多個相關音素,並決定用於該電子墨水之辨識的複數個替代方案,該等替代方案之每一者係包含另一系列的一或多個相關音素;顯示辨識結果之步驟,其係在一使用者介面之一狀態列(status har)中將在拉丁字母字元中的該辨識結果顯示給該使用者,並在一第一可選選單中將拉丁字母字元中的該等替代方案提供給該使用者;轉換辨識結果及替代方案之步驟,其係將該辨識結果及該等替代方案轉換為分別符合該辨識結果及該等替代方案的語音之相對應中文字元,其中該轉換辨識結果及替代方案之步驟包含以下步驟:轉換辨識結果之步驟,當該辨識結果對應於由該使用者所指定的一語音輸入以作為進入一使用者定義的片語之一捷徑時,將該辨識結果轉 換為包含至少一較喜好的中文字元之該使用者定義的片語;顯示中文字元之步驟,其係在一分隔式狀態列上顯示一從該辨識結果所轉換來的中文字元,並在一第二可選擇選單中提供從該等替代方案所轉換來的中文字元,及允許用該第二可選擇選單中的該等中文字元之一使用者所選擇者,來取代從該辨識結果所轉換來的該中文字元;以及辨識中文字元之步驟,其係辨識從該辨識結果所轉換來的該中文字元以作為一結果文字字串,並呈現給該使用者一個機會來修改在一組成視窗內、且由該拼音辭彙(Pinyin lexicon)所支援的該結果文字字串。
  2. 如申請專利範圍第1項所述之處理流程,該處理流程更包含下列步驟:顯示至少一中文字元之步驟,在該第二可選擇選單內,將從該等替代方案所辨識的該等中文字元之至少一者顯示予該使用者。
  3. 如申請專利範圍第2項所述之處理流程,其中該顯示步驟以一不同於自該等替代方案所轉換來的該等中文字元之顏色,來顯示自該辨識結果所轉換來之該中文字元。
  4. 如申請專利範圍第1項所述之處理流程,其中該辨識步驟包括一西方語言手寫辨識引擎(Western Language handwriting recognition engine)的使用。
  5. 如申請專利範圍第1項所述之處理流程,其中該辨識步驟包括決定已辨識之墨水是否包括至少一有效字串的步驟。
  6. 如申請專利範圍第1項所述之處理流程,該處理流程更包含下列步驟:在決定及轉換前顯示之步驟,在決定該辨識結果係對應於由該使用者所指定之一語音輸入以作為進入一使用者定義的片語之一捷徑、及將該辨識結果轉換為該使用者定義的片語之前,將自該辨識結果所轉換來之一中文字元顯示予該使用者。
  7. 一種用以透過一使用者介面來輸入手寫亞洲語言字元(Asian language characters)之系統,該系統至少包含以下裝置:一接收裝置,該接收裝置係用於自一使用者接收輸入,該輸入包含手寫輸入,其中該手寫輸入係包含一電子墨水,該電子墨水係具有一系列相關音素;及一或多個處理器,該一或多個處理器係程式化以進 行以下操作:將該電子墨水辨識為包含用於一標準中文拼音系統之一系列的一或多個相關音素之一辨識結果,並決定用於辨識該電子墨水的複數個替代方案,其中該等替代方案之每一者包含另一系列的一或多個相關音素;在一使用者介面的一狀態列中,將拉丁字母字元中的該辨識結果顯示予該使用者;並在一第一可選選單中,將拉丁字母字元中的該等替代方案提供予該使用者;將該辨識結果及該等替代方案轉換為對應的中文字元,該等對應的中文字元係分別符合該辨識結果及該等其他替代方案的語音,其中該轉換操作包含以下操作:當該辨識結果對應於由該使用者所指定之一語音輸入以作為進入一使用者定義之片語的一捷徑時,將該辨識結果轉換為該使用者定義之片語,該使用者定義之片語係包含至少一較喜好之中文字元;在一分隔式狀態列上之一可選擇選單中顯示該等已轉換之中文字元,並在一第二可選擇選單中提供轉換自該等替代方案的中文字元,並允許使用在該第二可選擇選單中的該等中文字元之 一使用者選擇者,來取代轉換自該辨識結果的該中文字元;及辨識轉換自該辨識結果的該中文字元以作為一結果文字字串,並呈現予該使用者一機會來修改在一組成視窗內、且由該拼音辭彙所支援的該結果文字字串。
  8. 如申請專利範圍第7項所述之系統,其中該第二可選擇選單將轉換自該等替代方案之該等中文字元的至少一者顯示予該使用者。
  9. 如申請專利範圍第8項所述之系統,其中該第二可選擇選單用一異於轉換自該等替代方案之該等中文字元的顏色,來顯示轉換自該辨識結果的一中文字元。
  10. 如申請專利範圍第7項所述之系統,其中一西方語言手寫識別引擎係用於將該電子墨水辨識為該辨識結果。
  11. 如申請專利範圍第7項所述之系統,其中一或多個處理器係經程式化以決定已辨識之墨水是否包含至少一有效字串,以作為將該電子墨水辨識為該辨識結果之部分。
  12. 一種經由一使用者介面來輸入手寫亞洲語言字元之處 理流程,該處理流程包含以下步驟:接收輸入之步驟,其係接收來自一使用者之輸入,該輸入係包含手寫輸入,其中該手寫輸入產生含有一系列以拉丁字母字元所寫成的一或多個相關音素之一電子墨水;辨識電子墨水之步驟,其係將該電子墨水辨識為含有一系列用於一標準中文拼音系統之一或多個相關音素之一辨識結果,及決定複數個用於該電子墨水之辨識的替代方案,該等替代方案之每一者係包含另一系列的一或多個相關音素;顯示辨識結果之步驟,其係在一使用者介面之一狀態列中,將在拉丁字母字元中的該辨識結果及該等替代方案顯示給該使用者,以作為一第一可選選單之部分;轉換辨識結果及替代方案之步驟,其西將該辨識結果及該等替代方案轉換為對應的中文字元,該等對應的中文字元係分別符合該辨識結果及該等替代方案之語音,其中該轉換辨識結果及替代方案之步驟包含以下步驟:轉換辨識結果之步驟,當該辨識結果對應於由該使用者所指定的一語音輸入以作為進入該使用者定義的片語之一捷徑時,將該辨識結果轉換為該使用者定義的片語,該使用者定義的片語係包含至少一較喜好的中文字元; 顯示中文字元之步驟,其係在一分隔式狀態列上之一第二可選擇選單中顯示該等已轉換之中文字元,並允許以一使用者所選擇、轉換自該等替代方案之該等已顯示之中文字元之選取者,來替代轉換自該辨識結果的該中文字元。
TW094117891A 2004-06-18 2005-05-31 用於手寫輸入亞洲語言的方法及系統 TWI464678B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/870,535 US20050276480A1 (en) 2004-06-10 2004-06-18 Handwritten input for Asian languages

Publications (2)

Publication Number Publication Date
TW200602976A TW200602976A (en) 2006-01-16
TWI464678B true TWI464678B (zh) 2014-12-11

Family

ID=35460582

Family Applications (1)

Application Number Title Priority Date Filing Date
TW094117891A TWI464678B (zh) 2004-06-18 2005-05-31 用於手寫輸入亞洲語言的方法及系統

Country Status (2)

Country Link
US (1) US20050276480A1 (zh)
TW (1) TWI464678B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1735733A1 (en) * 2004-04-02 2006-12-27 Nokia Corporation Apparatus and method for handwriting recognition
TWI282527B (en) * 2005-11-03 2007-06-11 Univ Tamkang A calligraphy practicing system
WO2007090293A1 (en) * 2006-02-10 2007-08-16 Zi Corporation Of Canada, Inc. Method and system of identifying an ideographic character
CN101286093A (zh) * 2007-04-09 2008-10-15 谷歌股份有限公司 客户端输入方法
US9355090B2 (en) 2008-05-30 2016-05-31 Apple Inc. Identification of candidate characters for text input
WO2010099224A1 (en) * 2009-02-24 2010-09-02 Adapx Inc. Systems and methods for reviewing digital pen data
US8345978B2 (en) 2010-03-30 2013-01-01 Microsoft Corporation Detecting position of word breaks in a textual line image
US8385652B2 (en) 2010-03-31 2013-02-26 Microsoft Corporation Segmentation of textual lines in an image that include western characters and hieroglyphic characters
US9104306B2 (en) * 2010-10-29 2015-08-11 Avago Technologies General Ip (Singapore) Pte. Ltd. Translation of directional input to gesture
US9529486B2 (en) * 2012-03-29 2016-12-27 FiftyThree, Inc. Methods and apparatus for providing a digital illustration system
WO2015059930A1 (en) * 2013-10-25 2015-04-30 Wacom Co., Ltd. Dynamic handwriting verification, handwriting-baseduser authentication, handwriting data generation, and handwriting data preservation
CN106845431B (zh) * 2017-02-07 2020-07-31 广东小天才科技有限公司 一种书写识别方法、装置及练字板

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW494318B (en) * 1999-04-15 2002-07-11 Matsushita Electric Ind Co Ltd Chinese character conversion apparatus using syntax information
CN1156741C (zh) * 1998-04-16 2004-07-07 国际商业机器公司 手写汉字识别方法及装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1400422A (en) * 1971-09-16 1975-07-16 Redifon Ltd Data visual display apparatus
US4829583A (en) * 1985-06-03 1989-05-09 Sino Business Machines, Inc. Method and apparatus for processing ideographic characters
US5390296A (en) * 1989-08-30 1995-02-14 Comshare Incorporated Method and apparatus for calculation with display data
US6154758A (en) * 1994-05-13 2000-11-28 Apple Computer, Inc. Text conversion method for computer systems
TW338815B (en) * 1995-06-05 1998-08-21 Motorola Inc Method and apparatus for character recognition of handwritten input
US6438523B1 (en) * 1998-05-20 2002-08-20 John A. Oberteuffer Processing handwritten and hand-drawn input and speech input
US6970599B2 (en) * 2002-07-25 2005-11-29 America Online, Inc. Chinese character handwriting recognition system
AU2003214096A1 (en) * 2002-03-22 2003-10-08 Sony Ericsson Mobile Communications Ab Entering text into an electronic communications device

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1156741C (zh) * 1998-04-16 2004-07-07 国际商业机器公司 手写汉字识别方法及装置
TW494318B (en) * 1999-04-15 2002-07-11 Matsushita Electric Ind Co Ltd Chinese character conversion apparatus using syntax information

Also Published As

Publication number Publication date
TW200602976A (en) 2006-01-16
US20050276480A1 (en) 2005-12-15

Similar Documents

Publication Publication Date Title
TWI464678B (zh) 用於手寫輸入亞洲語言的方法及系統
US7263657B2 (en) Correction widget
KR101014075B1 (ko) 박스 및 라인 입력 패널
US7848573B2 (en) Scaled text replacement of ink
US6567549B1 (en) Method and apparatus for immediate response handwriting recognition system that handles multiple character sets
US8760389B2 (en) Handwriting recognition in electronic devices
CA2477637C (en) Component-based, adaptive stroke-order system
US7707515B2 (en) Digital user interface for inputting Indic scripts
US20050060448A1 (en) Efficient Method and Apparatus For Text Entry Based On Trigger Sequences
US20080180283A1 (en) System and method of cross media input for chinese character input in electronic equipment
JP2005196759A (ja) パーソナルコンピューティング装置のユーザ入力を改善するシステム及び方法
JPH02289100A (ja) 漢字符号化及び復号化装置
US20050105799A1 (en) Dynamic typography system
WO2021013002A1 (zh) 一种输入方法、设备及程序产品
US7406662B2 (en) Data input panel character conversion
WO2000043861A1 (en) Method and apparatus for chinese character text input
KR101159323B1 (ko) 아시아 언어들을 위한 수기 입력
JP2003005902A (ja) 文字入力装置、情報処理装置、文字入力装置の制御方法、及び記憶媒体
JPS6254364A (ja) 表意文字処理方法および装置
CN100565553C (zh) 用于亚洲语言的手写输入的方法和系统
US20060221056A1 (en) Method and system for inputting single-stroke code
JPH08235317A (ja) ペン・コンピュータ用の拡張型自己区切りデータ入力方法
KR100356038B1 (ko) 온라인 수기 입력 방식에서 다문자를 인식시 한글을자소로 표현하는 장치 및 방법
JPH06208660A (ja) オンライン文字認識装置
JPH06309490A (ja) 文字入力装置及び方式

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees